KR20150015492A - 생성 셀라인 인핸서 - Google Patents
생성 셀라인 인핸서 Download PDFInfo
- Publication number
- KR20150015492A KR20150015492A KR1020147033930A KR20147033930A KR20150015492A KR 20150015492 A KR20150015492 A KR 20150015492A KR 1020147033930 A KR1020147033930 A KR 1020147033930A KR 20147033930 A KR20147033930 A KR 20147033930A KR 20150015492 A KR20150015492 A KR 20150015492A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- polynucleotide
- leu
- ser
- acid sequence
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/22—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against growth factors ; against growth regulators
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
- C07K14/4705—Regulators; Modulating activity stimulating, promoting or activating activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2477—Hemicellulases not provided in a preceding group
- C12N9/2488—Mannanases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/10—Immunoglobulins specific features characterized by their source of isolation or production
- C07K2317/14—Specific host cells or culture conditions, e.g. components, pH or temperature
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/50—Immunoglobulins specific features characterized by immunoglobulin fragments
- C07K2317/51—Complete heavy chain or Fd fragment, i.e. VH + CH1
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/50—Immunoglobulins specific features characterized by immunoglobulin fragments
- C07K2317/515—Complete light chain, i.e. VL + CL
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
- C12N2015/8518—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic expressing industrially exogenous proteins, e.g. for pharmaceutical use, human insulin, blood factors, immunoglobulins, pseudoparticles
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Cell Biology (AREA)
Abstract
본 발명은 유용한 다중-하위유닛 단백질의 수율을 향상시키기 위한 생성 세포에서의 EDEM2의 이소성 발현의 발견에 관한 것이다. 그러므로, 본 발명은 생성 셀라인, 예컨대 EDEM2를 코드화하는 재조합 폴리뉴클레오티드를 함유하고 있는, 기본적인 포유류 생물약제학적 생성 세포-CHO 세포를 제공한다. 또한 본 발명에는 EDEM2-코드화 폴리뉴클레오티드뿐 아니라 XBP1-코드화 폴리뉴클레오티드를 모두 함유하는 생성 세포도 개시된다. 이들 셀라인에 의해 생성된 항체의 향상된 역가가 개시되며, 이들 세포에 의해 배양 중에 획득된 향상된 세포 밀도 또한 개시된다.
Description
관련 출원과의 교차-참조
본 출원은 2012년 5월 29일에 출원된 미국 임시 특허 출원 번호 61/652,549의 35 U.S.C. §119(e)의 규정 하의 유익을 주장하며, 상기 출원은 본원에 그것의 전체 내용이 참조로 구체적으로 포함된다.
기술분야
본 발명은 다중-하위유닛 단백질의 향상된 생성을 위한 재조합 스트레스-반응 렉틴을 발현하는 세포 또는 세포들에 관한 것이다. 구체적으로, 본 발명은 EDEM2를 코드화하는 유전자를 함유하고 고역가로 항체를 생산하는 포유류 세포 및 그것으로부터 유도된 셀라인을 제공한다.
치료적으로 활성인 단백질의 제조는 분비 전에 적절한 접힘 및 프로세싱을 필요로 한다. 적절한 접힘은 특히 분비 전에 적절하게 조립되어야 하는 다수의 하위유닛으로 구성되는 단백질, 예컨대 항체와 관련된다. 진핵 세포는 단백질의 적절한 접힘과 분비 경로로부터 잘못 접혀진 단백질의 제거를 보장하는 시스템에 적응되어 왔다. 이 시스템은 풀린 단백질 반응(UPR) 경로로 불리며, 소포체(endoplasmic reticulum, ER)에서 잘못 접혀진 단백질의 축적에 의해 촉발된다.
UPR의 초기 사건은 전사 인자 Xbp1의 활성화인데, 그것은 계속해서 소포체 관련된 분해(ERAD) 경로의 한 구성원인 소포체 분해-증강 알파-만노시다제-유사 단백질 2(EDEM2)의 전사를 활성화시킨다. EDEM2는 잘못 접혀진 단백질의 제거를 촉진한다. ERAD 경로는 다음의 5 단계를 포함한다: (1) 기형 단백질의 샤프롱-중재된 인지; (2) EDEM2를 포함하는 역전위 기계 또는 E3-리가제로의 기형 단백질의 표적화; (3) 역전위의 개시; (4) 유비퀴틴화 및 추가의 역전위; 및 (5) 프로테오솜 표적화 및 분해.
항체는 두 개의 중쇄와 두 개의 경쇄를 포함하는 다중-하위유닛 단백질로, 그것은 적절하게 접혀지고 결합되어 기능적 이종사량체를 형성해야 한다. 기능성 항체 이종사량체의 수율 또는 역가를 향상시키기 위하여 중쇄 및 경쇄의 효과적이고 정확한 프로세싱이 어떻게든 향상되는 것이 요구된다.
본 출원인은 놀랍게도 단백질-제조 셀라인에서 EDEM2의 이소성(ectopic) 발현이 세포당 단백질의 평균 산출량을 증가시키고, 배지로 분비된 단백질의 역가를 증가시키며, 제조 셀라인의 통합된 세포 밀도를 증가시킨다는 것을 발견하였다.
그러므로 한 측면으로, 본 발명은 (a) 스트레스-유도된 만노스-결합 렉틴을 코드화하는 재조합 폴리뉴클레오티드 및 (b) 다중-하위유닛 단백질을 코드화하는 폴리뉴클레오티드를 함유하는 세포를 제공한다. 어떤 구체예에서, 스트레스-유도된 만노스-결합 렉틴은 EDEM2 단백질이고, 그것의 비-제한적인 실례는 아래의 표 1에 제시되며, 다중-하위유닛 단배질은 항체이다. 다른 구체예에서, 세포는 또한 XBP1의 활성 스플라이싱 형태를 코드화하는 폴리뉴클레오티드를 함유하고, 그것의 비-제한적인 실례는 아래의 표 2에 제시된다. 한 구체예에서, 세포는 포유류 세포, 예를 들면 생명제약의 제조에 사용된 CHO 세포이다.
다른 측면으로, 본 발명은 전술한 측면에서 기술된 세포로부터 유도된 셀라인을 제공한다. "...로부터 유도된"은 개별적인 세포로부터 클론적으로 유래되고 어떤 선택 품질, 예컨대 주어진 역가에서 활성 단백질을 생성하는 능력 또는 특정 밀도로 증식시키는 능력을 가지는 집단을 의미한다. 어떤 구체예에서, 스트레스-유도된 만노스-결합 렉틴을 코드화하는 재조합 폴리뉴클레오티드 및 다중-하위유닛 단백질을 코드화하는 폴리뉴클레오티드를 은닉하는 세포로부터 유도된 셀라인은 배지의 리터당 적어도 3그람(g/L), 적어도 5g/L 또는 적어도 8g/L의 역가로 다중-하위유닛 단백질을 생성할 수 있다. 어떤 구체예에서, 셀라인은 본질적으로는 동일한 세포지만 스트레스-유도된 만노스-결합 렉틴을 코드화하는 재조합 폴리뉴클레오티드가 없는 세포로부터 유도된 셀라인에 의해 얻어질 수 있는 통합된 세포 밀도보다 적어도 30% 더 큰, 적어도 50% 더 큰, 적어도 60% 더 큰 또는 적어도 90% 더 큰 통합된 세포 밀도(ICD)를 얻을 수 있다.
또 다른 측면으로, 본 발명은 구성성이고 어디에서나 발현되는 포유류 프로모터, 예컨대 유비퀴틴 C 프로모터에 작동가능하게 연결된(시스) EDEM2 단백질을 코드화하는 핵산 서열을 포함하는 분리된 또는 재조합 폴리뉴클레오티드를 제공한다. 어떤 구체예에서, EDEM2 단백질은 SEQ ID NO:8의 아미노산 또는 SEQ ID NO:1 내지 7 중 어느 하나에 적어도 92% 동일한 아미노산 서열을 가진다. 어떤 구체예에서, 폴리뉴클레오티드는 SEQ ID NO:16의 핵산 서열을 포함한다. 한 특정 구체예에서, 폴리뉴클레오티드는 SEQ ID NO:14의 핵산 서열로 구성되며; 다른 특정 구체예에서는 SEQ ID NP:15의 핵산 서열로 구성된다.
또 다른 측면으로, 본 발명은 구성성이고 어디에서나 발현되는 포유류 프로모터, 예컨대 유비퀴틴 C 프로모터에 작동가능하게 연결된(시스로) XBP1 단백질을 코드화하는 핵산 서열을 포함하는 분리된 또는 재조합 폴리뉴클레오티드를 제공한다. 어떤 구체예에서, XBP1 단백질은 SEQ ID NO:13의 아미노산 또는 SEQ ID NO:9 내지 12 중 어느 하나에 적어도 86% 동일한 아미노산 서열을 가진다. 어떤 구체예에서, 폴리뉴클레오티드는 SEQ ID NO:18의 핵산 서열을 포함한다. 한 특정 구체예에서, 폴리뉴클레오티드는 SEQ ID NO:17의 핵산 서열로 구성된다.
또 다른 측면으로, 본 발명은 앞의 측면에서 기술된 것과 같은 EDEM2-코드화 폴리뉴클레오티드와, 다중-하위유닛 단백질, 예컨대 항체를 코드화하는 폴리뉴클레오티드를 함유하는 세포를 제공한다. 어떤 구체예에서, 세포는 또한 전술한 측면에서 기술된 것과 같은, XBP1-코드화 폴리뉴클레오티드를 함유한다. 한 구체예에서, 다중-하위유닛 단백질은 항체이고, 그 항체의 중쇄는 SEQ ID NO:43 및 SEQ ID NO:44의 아미노산 서열을 포함하며, 항체의 경쇄는 SEQ ID NO:45 및 SEQ ID NO:46의 아미노산 서열을 포함한다. 이 구체예 및 여러 구체예에서, 다중-하위유닛 단백질의 각각의 폴리펩티드 하위유닛은 별도의 폴리뉴클레오티드에 의해 코드화된다. 그러므로, 예를 들어 항체를 코드화하는 폴리뉴클레오티드는 중쇄를 코드화하는 폴리뉴클레오티드와 경쇄를 코드화하는 폴리뉴클레오티드, 따라서 두 개의 하위유닛을 포함할 수 있다. 어떤 구체예에서, 세포는 차이니즈 햄스터 난소(CHO) 세포이다.
한 구체예에서, 코드화된 다중-하위유닛 단백질은 SEQ ID NO:20의 중쇄 가변 영역 아미노산 서열 및 SEQ ID NO:22의 경쇄 가변 영역 아미노산 서열을 가지는 항-GDF8 항체이다. 한 구체예에서, 항-GDF8 항체는 SEQ ID NO:19의 아미노산 서열을 가지는 중쇄 및 SEQ ID NO:21의 아미노산 서열을 가지는 경쇄를 포함한다. 한 구체예에서, 항-GDF8 항체의 중쇄를 코드화하는 폴리뉴클레오티드는 SEQ ID NO:23의 핵산 서열을 포함하고; 항-GDF8 항체의 경쇄를 코드화하는 폴리뉴클레오티드는 SEQ ID NO:25의 핵산 서열을 포함한다. 한 구체예에서, 항-GDF8 항체의 중쇄를 코드화하는 폴리뉴클레오티드는 SEQ ID NO:24의 핵산 서열로 구성되고; 항-GDF8 항체의 경쇄를 코드화하는 폴리뉴클레오티드는 SEQ ID NO:26의 핵산 서열로 구성된다.
다른 구체예에서, 코드화된 다중-하위유닛 단백질은 SEQ ID NO:28의 중쇄 가변 영역 아미노산 서열 및 SEQ ID NO:30의 경쇄 가변 영역 아미노산 서열을 가지는 항-ANG2 항체이다. 한 구체예에서, 항-ANG2 항체는 SEQ ID NO:27의 아미노산 서열을 가지는 중쇄 및 SEQ ID NO:29의 아미노산 서열을 가지는 경쇄를 포함한다. 한 구체예에서, 항-ANG2 항체의 중쇄를 코드화하는 폴리뉴클레오티드는 SEQ ID NO:31의 핵산 서열을 포함하고; 항-ANG2 항체의 경쇄를 코드화하는 폴리뉴클레오티드는 SEQ ID NO:33의 핵산 서열을 포함한다. 한 구체예에서, 항-ANG2 항체의 중쇄를 코드화하는 폴리뉴클레오티드는 SEQ ID NO:32의 핵산 서열로 구성되고; 항-ANG2 항체의 경쇄를 코드화하는 폴리뉴클레오티드는 SEQ ID NO:34의 핵산 서열로 구성된다.
또 다른 구체예에서, 코드화된 다중-하위유닛 단백질은 SEQ ID NO:36의 중쇄 가변 영역 아미노산 서열 및 SEQ ID NO:38의 경쇄 가변 영역 아미노산 서열을 가지는 항-ANGPTL4 항체이다. 한 구체예에서, 항-ANGPTL4 항체는 SEQ ID NO:35의 아미노산 서열을 가지는 중쇄 및 SEQ ID NO:37의 아미노산 서열을 가지는 경쇄를 포함한다. 한 구체예에서, 항-ANGPTL4 항체의 중쇄를 코드화하는 폴리뉴클레오티드는 SEQ ID NO:39의 핵산 서열을 포함하고; 항-ANGPTL4 항체의 경쇄를 코드화하는 폴리뉴클레오티드는 SEQ ID NO:41의 핵산 서열을 포함한다. 한 구체예에서, 항-ANGPTL4 항체의 중쇄를 코드화하는 폴리뉴클레오티드는 SEQ ID NO:40의 핵산 서열로 구성되고; 항-ANGPTL4 항체의 경쇄를 코드화하는 폴리뉴클레오티드는 SEQ ID NO:42의 핵산 서열로 구성된다.
또 다른 측면으로, 본 발명은 배지에서 앞의 측면의 세포를 배양함으로써 다중-하위유닛 단백질을 제조하는 방법을 제공하는데, 이때 다중-하위유닛 단백질은 세포에서 합성되고 계속해서 배지로 분비된다. 어떤 구체예에서, 다중-하위유닛 단백질은 항체, 예컨대 항-GDF8, 항-ANG2, 항-ANGPTL4 또는 SEQ ID NO:43 및 44의 중쇄 서열과 SEQ ID NO:45 및 46의 경쇄 서열을 가지는 항체이다. 어떤 구체예에서, 다중-하위유닛 단백질은 적어도 3g/L, 적어도 5g/L, 적어도 6g/L 또는 적어도 8g/L의 역가를 얻는다. 어떤 구체예에서, 세포는 배지에서 증식하고, 약 ≥5×107 세포-일/mL, 약 ≥1×108 세포-일/mL 또는 약 ≥1.5×108 세포-일/mL의 통합된 세포 밀도를 수립한다.
또 다른 측면으로, 본 발명은 전술한 측면에서 기술된 방법에 따라 제조된 다중-하위유닛 단백질을 제공한다. 한 구체예에서, 제조된 단백질은 항체이다. 어떤 구체예에서, 항체는 SEQ ID NO:43 및 SEQ ID NO:44의 아미노산 서열을 포함하는 중쇄 및 SEQ ID NO:45 및 SEQ ID NO:46의 아미노산 서열을 포함하는 경쇄로 구성된다. 한 특정 구체예에서, 제조된 다중-하위유닛 단백질은 SEQ ID NO:20의 중쇄 가변 영역 아미노산 서열과 SEQ ID NO:22의 경쇄 가변 영역 아미노산 서열을 가지는 항-GDF8 항체이다. 다른 특정 구체예에서, 제조된 다중-하위유닛 단백질은 SEQ ID NO:28의 중쇄 가변 영역 아미노산 서열과 SEQ ID NO:30의 경쇄 가변 영역 아미노산 서열을 가지는 항-ANG2 항체이다. 또 다른 특정 구체예에서, 제조된 다중-하위유닛 단백질은 SEQ ID NO:36의 중쇄 가변 영역 아미노산 서열과 SEQ ID NO:38의 경쇄 가변 영역 아미노산 서열을 가지는 항-ANGPTL4 항체이다.
본 발명을 설명하기 전에, 본 발명은 기술되는 특정 방법 및 실험 조건에 제한되지 않으며, 그런 방법과 조건들은 달라질 수 있음이 인정되어야 한다. 또한 본원에서 사용된 용어는 단지 특별한 구체예를 설명할 목적에 대한 것이고, 본 발명의 범주는 첨부되는 청구범위에 의해서만 제한될 것이기 때문에 제한적인 것으로 의도되지 않아야 한다는 것이 인정되어야 한다.
다르게 규정되지 않는 한, 본원에서 사용되는 모든 기술적이고 과학적인 용어들은 본 발명이 속하는 해당 기술분야의 숙련자가 통상적으로 이해하는 것과 같은 의미를 가진다. 본원에서 사용되는 것과 같은 용어 "약"은 특별히 인용된 수치 또는 값의 범위와 관련하여 사용될 때, 그 값이 인용된 값으로부터 단지 1% 정도 달라질 수 있음을 의미한다. 예를 들어 본원에서 사용되는 것과 같은 표현 "약 100"은 99와 101 및 그 사이의 모든 값(예컨대 99.1, 99.2, 99.3, 99.4 등)을 포함한다.
비록 본원에 기술된 것과 유사하거나 동등한 어떠한 방법 및 재료든지 본 발명의 실시 또는 시험에 사용될 수 있지만, 바람직한 방법 및 재료를 이제 기술하기로 한다. 본원에서 언급되는 모든 공개물은 그것의 전체 내용이 참조로 본원에 포함된다.
본원에서 사용되는 것과 같은 용어 "재조합 폴리뉴클레오티드"는 "분리된 폴리뉴클레오티드"와 상호교환적으로 사용되고, 유전자 공학 조작에 의해 유래된, 단일 가닥이거나 이중 가닥의 리보핵산 또는 데옥시리보핵산과 같은 핵산 중합체를 의미한다. 재조합 폴리뉴클레오티드는 원형 플라스미드이거나 시험관 내에서 또는 세포 내에서 에피솜으로서 존재하는 선형 구성물일 수 있다. 재조합 폴리뉴클레오티드는 더 큰 폴리뉴클레오티드 분자 또는 슈퍼분자 구조, 예컨대 선형 또는 원형 염색체 안에 통합된 구성물일 수 있다. 더 큰 폴리뉴클레오티드 분자 또는 슈퍼분자 구조는 세포 내에 있거나 세포의 핵 내에 있을 수 있다. 그러므로 재조합 폴리뉴클레오티드는 세포의 염색체 내에 통합될 수 있다.
본원에서 사용되는 것과 같은 용어 "스트레스-유도된 만노스-결합 렉틴"은 만노스, 만노스의 유도체, 예컨대 만노스-6-포스페이트 또는 만노스 또는 만노스 유도체를 그것의 당질층에 발현하는 당단백질에 결합하거나 결합할 수 있고, 그것의 활성이 스트레스 동안 상향조절되는 단백질을 의미한다. 세포의 스트레스는 그 중에서도 굶주림, DNA 손상, 저산소증, 중독, 전단 스트레스 및 다른 기계적 스트레스, 종양 스트레스 및 소포체에서 잘못 접혀진 단백질의 축적을 포함한다. 스트레스-유도된 만노스-결합 렉틴의 예를 들면 EDEM 단백질 EDEM1, EDEM2 및 EDEM3, Yos 9, OS9 및 XTP3-B를 들 수 있다(Vembar and Brodsky, Nat. Rev. Mol. Cell. Biol. 9(12): 944-957, 2008, 및 거기에 인용된 참고문헌들 참조).
본원에서 사용되는 것과 같은 용어 "EDEM2"는 소포체 분해-증강 알파-만노시다제-유사 단백질의 어떠한 이종상동체, 상동체 또는 보존적으로 치환된 변이체를 의미한다. EDEM2 단백질은 일반적으로 해당 기술분야에서 소포체-관련 분해(ERAD)에 관련되고, Xbp-1에 의해 상향-조절되며 제거를 위해 칼넥신 주기로부터 잘못 접혀진 당단백질의 추출을 촉진하는 것으로 알려져 있다(Mast et al., Glycobiology 15(4):421-436, 2004; Olivari and Molinari, FEBS Lett. 581:3658-3664, 2007; Olivari et al., J. Biol. Chem. 280(4):2424-2428, 2005; 및 Vembar and Brodsky 2008 참조). 예시적인 EDEM2 서열을 아래의 표 1에 서열 목록과 교차 참조하여 나타낸다.
동물 | SEQ ID NO: | %동일성 사람 | %동일성 마우스 | %동일성 햄스터 |
마우스 | 1 | 93 | 100 | 96 |
쥐 | 2 | 94 | 98 | 96 |
햄스터 | 3 | 93 | 96 | 100 |
사람 | 4 | 100 | 93 | 93 |
침팬지 | 5 | 99 | 94 | 93 |
오랑우탄 | 6 | 97 | 92 | 92 |
제브라피시 | 7 | 69 | 70 | 69 |
공통 | 8 | 100 | 100 | 100 |
본원에서 사용되는 것과 같이, XBP1 또는 X-박스 결합 단백질 1로도 알려져 있는 용어 "Xbp1"은 Xbp1의 어떠한 이종상동체, 상동체 또는 보존적으로 치환된 변이체를 의미한다. Xbp1은 UPR의 전사 인자 및 기능적 요소이다. ER 스트레스는 (1) 계속해서 Xbp1 mRNA의 전사를 상향조절하는 전사 인자 ATF6과 (2) 전구체 Xbp1 mRNA의 스플라이싱을 중재하여 활성 Xbp1을 생성하는 ER 막 단백질 IRE1을 둘 다 활성화시킨다. 상기에서 언급된 것과 같이, 활성화된 Xbp1은 계속해서 EDEM2의 활성을 상향조절한다(Yoshida et al., Cell Structure and Function 31(2): 117-125, 2006; 및 Olivari, 2005 참조). 예시적인 Xbp1 아미노산 서열은 서열 목록과 교차-참조하여 표 2에 나타낸다.
동물 | SEQ ID NO | %동일성 사람 | %동일성 마우스 | %동일성 햄스터 |
마우스 | 9 | 86 | 100 | 92 |
햄스터 | 10 | 86 | 92 | 100 |
사람 | 11 | 100 | 86 | 86 |
제브라피시 | 12 | 47 | 47 | 48 |
공통 | 13 | 100 | 100 | 100 |
본원에서 사용되는 것과 같이, 용어 "항체"는 일반적으로, 4개의 폴리펩티드 사슬, 즉 이황화 결합에 의해 상호연결된 2개의 중쇄(H) 및 2개의 경쇄(L)를 포함하는 면역글로불린 분자뿐 아니라 그것의 다량체(예컨대 IgM)를 언급하는 것으로 의도되지만; 단지 중쇄만으로 구성된 면역글로불린 분자(즉 경쇄가 없음)도 또한 용어 "항체"의 정의 내에 포함된다. 각각의 중쇄는 중쇄 가변 영역(본원에서는 HCVR 또는 VH로 약칭됨)과 중쇄 불변 영역을 포함한다. 중쇄 불변 영역은 세 개의 도메인, CH1, CH2 및 CH3를 포함한다. 각각의 경쇄는 경쇄 가변 영역(본원에서는 LCVR 및 VL로 약칭됨)과 경쇄 불변 영역을 포함한다. 경쇄 불변 영역은 하나의 도메인(CL1)을 포함한다. VH와 VL 영역은 나아가 프레임워크 영역(FR)으로 명명된 보다 보존된 영역이 사이에 끼어 있는 초가변성 영역, 이름하여 상보성 결정 영역(CDR)으로 세분될 수 있다. 각각의 VH 및 VL은 세 개의 CDR과 네 개의 FR로 구성되며, 아미노-말단으로부터 카복시-말단쪽으로 다음 순서로 배열된다:FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4. "분리된 항체" 또는 "정제된 항체"는 실질적으로 다른 세포 물질 또는 화학물질이 없을 것이다.
용어 "특이적으로 결합하는" 등은 항체 또는 그것의 항원-결합 단편이 생리적 조건 하에서 상대적으로 안정한 항원과 복합체를 형성하는 것을 의미한다. 특이적 결합은 적어도 약 1×10-6M 또는 그 이상의 해리 상수를 특징으로 한다. 두 개의 분자가 특이적으로 결합하는 지를 측정하기 위한 방법은 해당 기술분야에 잘 알려져 있고, 예를 들면 평형 투석, 표면 플라스몬 공명 등을 포함한다. 그러나 (예를 들어) 사람 GDF8에 특이적으로 결합하는 분리된 항체는 다른 항원, 예컨대 다른 종으로부터의 F8 분자(이종상동체)에 대해 교차-반응성을 가질 수 있다.
다양한 항체가 스트레스-유도된 만노스-결합 렉틴을 코드화하는 폴리뉴클레오티드를 은닉하는 세포에 의해 분비된 다중-하위유닛 단백질의 실례로서 사용된다. 그런 실례로는 항-GDF8, 항-ANG2 및 항-ANGPTL4 항체를 포함한다. 이들 및 유사한 항체는 각각 미국 특허 출원 번호 20110293630, 20110027286 및 20110159015에 기술되어 있다.
본원에서 사용되는 것과 같은 용어 "세포"는 DNA를 복제하고, RNA를 전사하며, 폴리펩티드를 번역하고 단백질을 분비할 수 있는 원핵 또는 진핵 세포를 말한다. 세포는 생물학적 제품의 상업적 제조에 사용된 동물 세포, 예컨대 곤충 세포(예컨대 Schneider 세포, Sf9 세포, Sf21 세포, Tn-368 세포, BTI-TN-5B1-4 세포; Jarvis, Methods Enzymol. 463:191-222, 2009; 및 Potter et al., Int. Rev. Immunol. 10(2-3):103-112, 1993) 및 포유류 세포(예컨대 CHO 또는 CHO-K1 세포, COS 또는 COS-7세포, HEK293 세포, PC12 세포, HeLa 세포, 하이브리도마 세포; Trill et al., Curr. Opin. Biotechnol. 6(5):553-560, 1995; Kipriyanov and Little, Mo. Biotechnol. 12(2):173-201, 1999)를 포함한다. 한 구체예에서, 세포는 기술된 UPR 경로 폴리뉴클레오티드를 함유하는 CHO-K1 세포이다. CHO-K1 세포의 설명에 대해서는 Kao et al., Proc. Nat'l. Acad. Sci. USA 60:1275-1281, 1968을 참조한다.
본원에서 사용된 것과 같이, 용어 "프로모터"는 일반적으로 시스로(in cis) 단백질 코딩 서열의 위쪽에 위치하고, 단백질 코딩 서열의 전사를 촉진하는 유전자 서열을 의미한다. 프로모터는 조절되거나(발생 단계에서, 조직 특이적으로 또는 유도성(화학적, 온도)임) 또는 구성적으로 활성일 수 있다. 특정 구체예에서, 단백질을 코드화하는 폴리뉴클레오티드는 구성성 프로모터에 작동가능하게 연결된다. "작동가능하게 연결된"이란 단백질-코드화 폴리뉴클레오티드가 프로모터의 3-프라임(하향) 및 cis로 위치하고, 프로모터의 제어 하에 있는 것을 의미한다. 특정 구체예에서, 프로모터는 구성성 포유류 프로모터, 예컨대 유비퀴틴 C 프로모터(Schorpp et al., Nucl. Acids Res. 24(9):1787-1788, 1996); Byun et al., Biochem. Biophys. Res. Comm. 332(2):518-523, 2005 참조), CMV-IE 프로모터(Addison et al., J. Gen. Virol. 78(7):1653-1661, 1997; Hunninghake et al., J. Virol. 63(7):3026-3033, 1989 참조) 또는 hCMV-IE 프로모터(사람 사이토메갈로바이러스 즉시 초기 유전자 프로모터)(Stinski & Roehr, J. Virol. 55(2):431-441, 1985; Hunninghake et al., J. Virol. 63(7):3026-3033, 1989 참조)이다.
본원에서 사용되는 것과 같이, 구절 "통합된 세포 밀도" 또는 "ICD"는 일정 시간에 걸쳐서 적분(integral)으로서 얻어지고 mL당 세포-일로 표시되는 배양 배지 중의 세포의 밀도를 의미한다. 어떤 구체예에서, ICD는 세포가 배양된지 12일째 정도에 측정된다.
본원에서 사용되는 것과 같이, 용어 "배양"은 세포가 활발하게 분할되거나 그렇지 못하거나에 관계없이, (1) 세포, 배지 및 분비된 다중-하위유닛 단백질을 포함하는 조성물 및 (2) 세포를 배지에서 배양하는 작업 둘 다를 의미한다. 세포는 25mL 또는 그것보다 작은 플라스크 정도의 작은 용기에서, 및 10,000리터 또는 그 이상의 상업적 생물반응기처럼 크게 배양될 수 있다. "배지"는 배양 배지를 말하는 것으로, 그 중에서도 세포의 성장, 증식 또는 유지, 및 세포에 의한 다중-하위유닛 단백질의 생성을 가능하게 하는 영양분, 지질, 아미노산, 핵산, 완충제 및 미량 요소를 포함한다. 세포 배양 배지는 혈청(예컨대 소 태아 혈청(FBS)) 또는 단백질 가수분해물이 첨가된 배지뿐 아니라 혈청-유리 및 가수분해물-유리 규정 배지를 포함한다. 상업적으로 얻을 수 있는 배지의 비-제한적인 실례로는 RPMI 배지 1640, 둘베코 변형 이글 배지(DMEM), DMEM/F12 혼합물, F10 영양 혼합물, Ham F12 영양 혼합물 및 최소 필수 배지(MEM)가 있다.
본원에서 사용된 것과 같이, 폴리펩티드에 적용되는 것으로서 구절 "보존적으로 치환된 변이체"는 보다 더 보존성인 아미노산 치환 중 하나를 포함한 아미노산 서열을 가지는 폴리펩티드를 의미한다. "보존성 아미노산 치환"은 아미노산 잔기가 유사한 화학적 특성(예컨대 전하 또는 소수성)을 가지는 측쇄(R 기)를 가지는 다른 아미노산 잔기에 의해 치환되는 것이다. 일반적으로, 보존성 아미노산 치환은 실질적으로 단백질의 기능적 특성을 바꾸지 않을 것이다. 둘 또는 그 이상의 아미노산 서열이 상호간에 보존성 치환에 의해 상이한 경우에, 유사성의 % 또는 정도는 치환의 보존적 성질에 대해 수정하기 위해 상향 조정될 수 있다. 이런 조정을 만들기 위한 수단은 해당 기술분야의 숙련자들에게 잘 알려져 있다(예컨대 Pearson (1994) Methods Mol. Biol. 24:307-331 참조). 유사한 화학적 특성을 가지는 측쇄를 가지는 아미노산의 그룹의 실례는 다음을 포함한다: 1) 지방족 측쇄: 글리신, 알라닌, 발린, 로이신 및 아이소로이신; 2) 지방족-하이드록실 측쇄: 세린 및 쓰레오닌; 3) 아마이드-함유 측쇄: 아스파라긴 및 글루타민; 4) 방향족 측쇄: 페닐알라닌, 타이로신 및 트립토판; 5) 염기성 측쇄: 라이신, 아르기닌 및 히스티딘; 6) 산성 측쇄: 아스파테이트 및 글루타메이트, 및 7) 황-함유 측쇄: 시스테인 및 메티오닌. 바람직한 보존성 아미노산 치환 기는 다음과 같다: 발린-로이신-아이소로이신, 페닐알라닌-타이로신, 라이신-아르기닌, 알라닌-발린, 글루타메이트-아스파테이트 및 아스파라긴-글루타민. 또는 다르게는, 보존성 대체는 문헌에서 개시된 PAM250 로그-가능성 매트릭스에서 양의 값을 가지는 어떠한 변화이다(Gonnet et al. (1992) Science 256: 1443-45). "적당한 보존성" 대체는 PAM250 로그-가능성 매트릭스에서 음이 아닌 값을 가지는 어떠한 변화이다.
구체예 - 세포
한 측면으로, 본 발명은 치료적 또는 연구 활용성을 가지는 단백질의 제조에 유용한 세포를 제공한다. 어떤 구체예에서, 단백질은 다중 하위유닛으로 구성되고, 그것은 적절하게 접혀지고 조립되어 충분한 양의 활성 단백질이 생성되어야 한다. 항체는 치료적 또는 연구 유용성을 가지는 다중-하위유닛 단백질의 실례이다. 어떤 구체예에서, 세포는 다중-하위유닛 단백질의 하나 또는 그 이상의 개별적인 하위유닛을 코드화하는 재조합 유전자 구성물(즉 폴리뉴클레오티드)을 은닉한다. 다른 구체예에서, 개별적인 폴리펩티드 하위유닛을 코드화하는 유전자 구성물은 자연 발생적인 것으로, 예를 들면 B 세포에서 항체의 하위유닛을 코드화하는 핵산 서열이다.
다중-하위유닛 단백질의 적절한 조립 및 분비를 촉진하기 위하여, 세포는 어떤 구체예에서, 스트레스-유도된 만노스-결합 렉틴은 ERAD의 성분인 스트레스-유도된 만노스-결합 렉틴을 코드화하는 재조합 폴리뉴클레오티드를 함유한다. 어떤 구체예에서, 스트레스-유도된 만노스-결합 렉틴은 소포체 분해-증강 알파-만노시다제-유사 단백질 2(EDEM2)이다. 어떠한 코드화된 EDEM2 또는 보존적으로 치환된 변이체든지 본 발명에 성공적으로 사용될 수 있는 것으로 예상된다. 표 1은 척추동물 EDEM2 단백질의 일부 실례를 열거한다. Thompson 등의 Clustal W 프로그램(Thompson et al., Nucl. Acids Rev. 22(22):4673-80, 1994, 또한 Yuan et al., Bioinformatics 15(10):862-3, 1999 참조)을 사용하여 수행된 그 단백질 서열들의 다수의 쌍 비교 결과, 개시된 EDEM2 폴리뉴클레오티드 서열은 각각 상호간에 다른 EDEM2 서열에 대해 적어도 69% 동일한 것으로 나타났다. 개시된 포유류 EDEM2 서열의 Clustal W 비교는 각 서열이 다른 것에 대해 적어도 92% 동일한 것을 나타냈다. 그러므로 어떤 구체예에서, 세포는 포유류 EDEM2의 어느 하나에 적어도 92% 동일한 서열을 가지는 EDEM2 폴리펩티드를 코드화하는 폴리뉴클레오티드를 함유한다. 공통 EDEM2 아미노산 서열은 마우스, 쥐, 햄스터, 침팬지 및 사람 EDEM2 폴리펩티드 아미노산 서열을 일렬 배열함으로써 구성되었다. 그 공통 서열은 SEQ ID NO:8로서 표시된다. 그러므로 어떤 구체예에서, 세포는 SEQ ID NO:8의 아미노산 서열을 가지는 EDEM2 폴리펩티드를 코드화하는 폴리뉴클레오티드를 함유한다.
다양한 구체예에서, 세포는 마우스 EDEM2(mEDEM2) 아미노산 서열에 적어도 92% 동일한 아미노산 서열을 가지는 EDEM2 폴리펩티드를 코드화하는 재조합 폴리뉴클레오티드를 함유하고; 특별한 구체예에서, 폴리펩티드는 mEDEM2 또는 그것의 보존적으로 치환된 변이체이다.
어떤 구체예에서, 다중-하위유닛 단백질은 항체이고, 세포는 SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45 및 SEQ ID NO:46의 아미노산 서열을 포함하는 어떠한 하나 또는 그 이상의 폴리펩티드를 코드화하는 폴리뉴클레오티드를 함유한다. SEQ ID NO:43 및 44는 각각 특정 항체 중쇄의 대략 N-말단 및 C-말단 부분의 공통 서열을 나타낸다. 그러므로, 한 구체예에서 단백질 하위유닛을 코드화하는 폴리뉴클레오티드는 SEQ ID NO:43과 SEQ ID NO:44 둘 다를 포함하는 폴리펩티드를 코드화한다. SEQ ID NO:45 및 46은 각각 특정 항체 경쇄의 대략 N-말단 및 C-말단 부분의 공통 서열을 나타낸다. 그러므로, 한 구체예에서 단백질 하위유닛을 코드화하는 폴리뉴클레오티드는 SEQ ID NO:45와 SEQ ID NO:46 둘 다를 포함하는 폴리펩티드를 코드화한다. 어떤 구체예에서, EDEM2 단백질을 코드화하는 재조합 폴리뉴클레오티드 외에 세포는 적어도 두 개의 폴리뉴클레오티드를 함유하는데, 그것들은 각각 다중-하위유닛 단백질의 특정 하위유닛을 코드화한다. 예를 들어, 그리고 하기에서 예시되는 것과 같이, 세포는 SEQ ID NO:43 및 SEQ ID NO:44의 아미노산 서열을 포함하는 항체 중쇄를 코드화하는 폴리뉴클레오티드와, SEQ ID NO:45 및 SEQ ID NO:46의 아미노산 서열을 포함하는 항체 경쇄를 코드화하는 다른 폴리뉴클레오티드를 함유한다.
어떤 구체예에서, 세포는 상기에서 기술된 것과 같이 스트레스-반응 폴리뉴클레오티드 및 폴리펩티드 하위유닛을 코드화하는 하나 또는 그 이상의 폴리뉴클레오티드를 함유하는 것 외에, 또한 EDEM2의 상류에서 작동하는 접혀지지 않은 단백질 반응 전사 인자를 코드화하는 폴리뉴클레오티드를 함유한다. 상류 전사 인자는 어떤 경우에는 XBP1의 스플라이싱 형태이다. 어떠한 코드화된 XBP1이든지 본 발명에서 성공적으로 사용될 수 있다고 예상된다. 표 2는 척추동물 XBP1 스플라이싱 형태 폴리펩티드의 서열의 일부 실례를 열거한다. Clustal W(Thompson 1994; Yuan 1999)를 사용하여 수행된 그런 폴리펩티드 서열들의 다수의 쌍 비교 결과, 개시된 스플라이싱된 XBP1 폴리뉴클레오티드 서열들은 각각 상호간에 다른 XBP1 서열에 대해 적어도 48% 동일한 것으로 나타났다. 개시된 포유류 XBP1 서열의 Clustal W 비교는 각 서열이 다른 것에 대해 적어도 86% 동일한 것을 나타냈다. 그러므로 어떤 구체예에서, 세포는 포유류의 스플라이싱된 XBP1의 어느 하나에 적어도 86% 동일한 서열을 가지는 XBP1 폴리펩티드의 스플라이싱된 형태를 코드화하는 폴리뉴클레오티드를 함유한다. 공통 XBP1 아미노산 서열은 마우스, 햄스터 및 사람 XBP1 아미노산 서열을 일렬 배열함으로써 구성되었다. 그 공통 서열은 SEQ ID NO:13으로서 표시된다. 그러므로 어떤 구체예에서, 세포는 SEQ ID NO:13의 아미노산 서열을 가지는 XBP1 폴리펩티드를 코드화하는 폴리뉴클레오티드를 함유한다.
다양한 구체예에서, 세포는 마우스 XBP1(mXBP1) 아미노산 서열(SEQ ID NO:9)에 적어도 86% 동일한 아미노산 서열을 가지는 XBP1 폴리펩티드를 코드화하는 폴리뉴클레오티드를 함유하고; 특별한 구체예에서, 폴리펩티드는 mXBP1 또는 그것의 보존적으로 치환된 변이체이다.
본 발명은 어떠한 세포든지 적절하게 접혀지고 활성인 다중-하위유닛 단백질의 제조를 위한 렉틴-코드화 폴리펩티드를 은닉하기 위해 사용될 수 있다고 예상한다. 그러한 세포로는 잘 알려져 있는 단백질 생성 세포, 예컨대 박테리아 대장균 및 유사한 원핵 세포, 효모 피치아 파스토리스 및 다른 피치아 및 비-피치아 효모, 식물 세포 절편, 예컨대 니코티아나의 절편, 곤충 세포, 예컨대 쉬나이더 2 세포, Sf9 및 Sf21, 및 트라이코플러시아 니-유도된 하이파이브 세포 및 생물생성에 전형적으로 사용된 포유류 세포, 예를 들면 CHO, CHO-K1 COS, HeLa, HEK93, Jurkat 및 PC12 세포를 포함한다. 어떤 구체예에서, 세포는 CHO-K1 또는 변형된 CHO-K1 세포, 예컨대 미국 특허 번호 7,435,553, 7,514,545 및 7,771,997 및 미국 공개 특허 출원 번호 US 2010-0304436 A1에서 교시된 것과 같은 세포이다.
어떤 특정 구체예에서, 본 발명은 (1) SEQ ID NO:16의 뉴클레오티드 서열을 포함하는 mEDEM2-코드화 폴리뉴클레오티드, (2) SEQ ID NO:18의 뉴클레오티드 서열을 포함하는 XBP1-코드화 폴리뉴클레오티드, (3) SEQ ID NO:43 및 44의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 뉴클레오티드 서열을 포함하는 항체 중쇄-코드화 폴리뉴클레오티드 및 (4) SEQ ID NO:45 및 46의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 뉴클레오티드 서열을 포함하는 항체 경쇄-코드화 폴리뉴클레오티드를 함유하는 생체 외 CHO-K1 세포를 제공한다.
한 특정 구체예에서, 본 발명은 (1) SEQ ID NO:16의 뉴클레오티드 서열을 포함하는 mEDEM2-코드화 폴리뉴클레오티드, (2) SEQ ID NO:18의 뉴클레오티드 서열을 포함하는 XBP1-코드화 폴리뉴클레오티드, (3) SEQ ID NO:23의 뉴클레오티드 서열을 포함하는 항체 중쇄-코드화 폴리뉴클레오티드 및 (4) SEQ ID NO:25의 뉴클레오티드 서열을 포함하는 항체 경쇄-코드화 폴리뉴클레오티드를 함유하는 생체 외 CHO-K1 세포를 제공한다.
다른 특정 구체예에서, 본 발명은 (1) SEQ ID NO:16의 뉴클레오티드 서열을 포함하는 mEDEM2-코드화 폴리뉴클레오티드, (2) SEQ ID NO:18의 뉴클레오티드 서열을 포함하는 XBP1-코드화 폴리뉴클레오티드, (3) SEQ ID NO:31의 뉴클레오티드 서열을 포함하는 항체 중쇄-코드화 폴리뉴클레오티드 및 (4) SEQ ID NO:33의 뉴클레오티드 서열을 포함하는 항체 경쇄-코드화 폴리뉴클레오티드를 함유하는 생체 외 CHO-K1 세포를 제공한다.
또 다른 특정 구체예에서, 본 발명은 (1) SEQ ID NO:16의 뉴클레오티드 서열을 포함하는 mEDEM2-코드화 폴리뉴클레오티드, (2) SEQ ID NO:18의 뉴클레오티드 서열을 포함하는 XBP1-코드화 폴리뉴클레오티드, (3) SEQ ID NO:39의 뉴클레오티드 서열을 포함하는 항체 중쇄-코드화 폴리뉴클레오티드 및 (4) SEQ ID NO:41의 뉴클레오티드 서열을 포함하는 항체 경쇄-코드화 폴리뉴클레오티드를 함유하는 생체 외 CHO-K1 세포를 제공한다.
셀라인
다른 측면으로, 본 발명은 상기에서 설명된 세포로부터 클론 팽창에 의해 유래된 다수의 세포를 포함하는 셀라인을 제공한다. 셀라인을 구성하는 세포의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 약 100%는 어떤 구체예에서는 ERAD의 성분인 스트레스-유도된 만노스-결합 렉틴을 코드화하는 재조합 폴리뉴클레오티드를 함유한다. 어떤 구체예에서, 스트레스-유도된 만노스-결합 렉틴은 소포체 분해-증강 알파-만노시다제-유사 단백질 2(EDEM2)이다. 어떠한 코드화된 EDEM2 또는 그것의 보존적으로 치환된 변이체든지 본 발명에서 성공적으로 사용될 수 있는 것으로 예상된다. 이전 단원에서 논의된 것과 같이 표 1은 척추동물 EDEM2 단백질의 일부 실례를 열거한다. 어떤 구체예에서, 구성 세포는 어떠한 포유류 EDEM2에 적어도 92% 동일한 서열을 가지는 EDEM2 폴리펩티드를 코드화하는 폴리뉴클레오티드를 함유한다. 어떤 구체예에서, 구성 세포는 SEQ ID NO:8의 포유류 공통 아미노산 서열을 가지는 EDEM2 폴리펩티드를 코드화하는 폴리뉴클레오티드를 함유한다. 어떤 구체예에서, 구성 세포는 SEQ ID NO:1의 재조합 폴리뉴클레오티드 또는 그것의 보존적으로 치환된 변이체를 함유한다.
어떤 구체예에서, 셀라인에 의해 생성된 다중-하위유닛 단백질은 항체이고, 셀라인의 구성 세포는 SEQ ID NO:43 및 SEQ ID NO:44(각각 특정 항체 중쇄의 N-말단 및 C-말단 부분의 공통 서열을 나타낸다), 및 SEQ ID NO:45 및 SEQ ID NO:46(각각 특정 항체 경쇄의 N-말단 및 C-말단 부분의 공통 서열을 나타낸다)의 아미노산 서열을 포함하는 어떠한 하나 또는 그 이상의 폴리펩티드를 코드화하는 폴리뉴클레오티드를 함유한다. 어떤 구체예에서, EDEM2 단백질을 코드화하는 재조합 폴리뉴클레오티드 외에, 셀라인의 구성 세포는 적어도 두 개의 폴리뉴클레오티드를 함유하고, 그것들은 각각 다중-하위유닛 단백질의 특정 하위유닛을 코드화한다. 예를 들어 구성 세포는 SEQ ID NO:43 및 SEQ ID NO:44의 아미노산 서열을 포함하는 항체 중쇄를 코드화하는 폴리뉴클레오티드와, SEQ ID NO:45 및 SEQ ID NO:46의 아미노산 서열을 포함하는 항체 경쇄를 코드화하는 다른 폴리뉴클레오티드를 함유한다.
어떤 구체예에서, 구성 세포는 상기에서 기술된 것과 같이 스트레스-반응 폴리뉴클레오티드 및 폴리펩티드 하위유닛을 코드화하는 하나 또는 그 이상의 폴리뉴클레오티드 외에, 또한 EDEM2의 상류에서 작동하는 접혀지지 않은 단백질 반응 전사 인자, 예컨대 XBP1의 스플라이싱 형태를 코드화하는 폴리뉴클레오티드를 함유한다. 어떠한 코드화된 XBP1이든지 본 발명에서 성공적으로 사용될 수 있는 것으로 예상된다. 전술한 단원에서 논의된 것과 같이, 표 2는 척추동물 XBP1 스플라이싱 형태 폴리펩티드의 서열의 일부 실례를 열거한다. 그 서열들의 Clustal W 분석은 개시된 스플라이싱된 XBP1 폴리뉴클레오티드 서열이 각각 상호간에 XBP1 서열에 대해 적어도 48% 동일하고; 포유류 XBP1 서열들의 비교 결과 각 서열은 상호간에 적어도 86% 동일한 것으로 나타났다. 그러므로 어떤 구체예에서, 셀라인의 구성 세포는 포유류의 어떠한 하나의 스플라이싱된 XBP1에 대해 적어도 86% 동일한 서열을 가지는 XBP1 폴리펩티드의 스플라이싱 형태를 코드화하는 폴리뉴클레오티드를 함유한다. 어떤 구체예에서, 구성 세포는 SEQ ID NO:13의 공통 아미노산 서열을 가지는 XBP1 폴리펩티드를 코드화하는 폴리뉴클레오티드를 함유한다.
다양한 구체예에서, 세포는 마우스 XBP1(mXBP1) 아미노산 서열(SEQ ID NO:9)에 대해 적어도 86% 동일한 아미노산 서열을 가지는 XBP1 폴리펩티드를 코드화하는 폴리뉴클레오티드를 함유하고; 특정 구체예에서, 폴리펩티드는 SEQ ID NO:9의 mXBP1 또는 그것의 보존적으로 치환된 변이체이다.
본 발명은 셀라인이 그것의 원래 세포가 잘 알려져 있는 단백질 생성 세포, 예를 들면 박테리아 대장균 및 유사한 원핵 세포, 효모 피치아 파스토리스 및 다른 피치아 및 비-피치아 효모, 식물 세포 절편, 예컨대 니코티아나의 절편, 곤충 세포, 예컨대 쉬나이더 2 세포, Sf9 및 Sf21, 및 트라이코플러시아 니-유도된 하이파이브 세포 및 생물생성에 전형적으로 사용된 포유류 세포, 예를 들면 CHO, CHO-K1 COS, HeLa, HEK93, Jurkat 및 PC12 세포의 목록으로부터 선택된 구성 세포를 포함한다. 어떤 구체예에서, 세포는 CHO-K1 또는 변형된 CHO-K1 세포, 예컨대 미국 특허 번호 7,435,553, 7,514,545 및 7,771,997 및 미국 공개 특허 출원 번호 US 2010-0304436 A1에서 교시된 것과 같은 세포이다.
어떤 구체예에서, 배지에서 배양된 셀라인은 다중-하위유닛 단백질을 생성하고, 적절하게 조립된 다중-하위유닛 단백질을 배지로 적어도 3g/L, 적어도 5g/L 또는 적어도 8g/L의 역가로 분비할 수 있다.
나아가, 셀라인의 구성 세포는 배양 중에 스트레스-유도된 만노스-결합 렉틴을 코드화하는 재조합 폴리뉴클레오티드를 함유하지 않는 셀라인의 통합된 세포 밀도보다 약 30% 더 큰 통합된 세포 밀도를 획득할 수 있을 정도로 증식할 수 있다. 어떤 경우에, 셀라인은 스트레스-유도된 만노스-결합 렉틴을 코드화하는 재조합 폴리뉴클레오티드를 함유하지 않는 셀라인의 통합된 세포 밀도보다 적어도 약 50% 더 큰, 적어도 60% 더 큰, 또는 적어도 90% 더 큰 통합된 세포 밀도를 획득할 수 있다. 어떤 구체예에서, 셀라인의 통합된 세포 밀도는 배양후 약 12일 후에 평가된다.
어떤 특정 구체예에서, 본 발명은 클론-유도된 구성 세포를 포함하는 셀라인을 제공하는데, 이때 구성 세포는 (1) SEQ ID NO:16의 뉴클레오티드 서열을 포함하는 mEDEM2-코드화 폴리뉴클레오티드, (2) SEQ ID NO:18의 뉴클레오티드 서열을 포함하는 XBP1-코드화 폴리뉴클레오티드, (3) SEQ ID NO:43 및 44의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 뉴클레오티드 서열을 포함하는 항체 중쇄-코드화 폴리뉴클레오티드 및 (4) SEQ ID NO:45 및 46의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 뉴클레오티드 서열을 포함하는 항체 경쇄-코드화 폴리뉴클레오티드를 함유하는 CHO-K1 세포이다.
한 특정 구체예에서, 본 발명은 클론-유도된 구성 세포를 포함하는 셀라인을 제공하는데, 이때 구성 세포는 (1) SEQ ID NO:16의 뉴클레오티드 서열을 포함하는 mEDEM2-코드화 폴리뉴클레오티드, (2) SEQ ID NO:18의 뉴클레오티드 서열을 포함하는 XBP1-코드화 폴리뉴클레오티드, (3) SEQ ID NO:23의 뉴클레오티드 서열을 포함하는 항체 중쇄-코드화 폴리뉴클레오티드 및 (4) SEQ ID NO:25의 뉴클레오티드 서열을 포함하는 항체 경쇄-코드화 폴리뉴클레오티드를 함유하는 CHO-K1 세포이다.
다른 특정 구체예에서, 본 발명은 클론-유도된 구성 세포를 포함하는 셀라인을 제공하는데, 이때 구성 세포는 (1) SEQ ID NO:16의 뉴클레오티드 서열을 포함하는 mEDEM2-코드화 폴리뉴클레오티드, (2) SEQ ID NO:18의 뉴클레오티드 서열을 포함하는 XBP1-코드화 폴리뉴클레오티드, (3) SEQ ID NO:31의 뉴클레오티드 서열을 포함하는 항체 중쇄-코드화 폴리뉴클레오티드 및 (4) SEQ ID NO:33의 뉴클레오티드 서열을 포함하는 항체 경쇄-코드화 폴리뉴클레오티드를 함유하는 CHO-K1 세포이다.
또 다른 특정 구체예에서, 본 발명은 클론-유도된 구성 세포를 포함하는 셀라인을 제공하는데, 이때 구성 세포는 (1) SEQ ID NO:16의 뉴클레오티드 서열을 포함하는 mEDEM2-코드화 폴리뉴클레오티드, (2) SEQ ID NO:18의 뉴클레오티드 서열을 포함하는 XBP1-코드화 폴리뉴클레오티드, (3) SEQ ID NO:39의 뉴클레오티드 서열을 포함하는 항체 중쇄-코드화 폴리뉴클레오티드 및 (4) SEQ ID NO:41의 뉴클레오티드 서열을 포함하는 항체 경쇄-코드화 폴리뉴클레오티드를 함유하는 CHO-K1 세포이다.
EDEM2 폴리뉴클레오티드
또 다른 측면으로, 본 발명은 EDEM2 단백질을 코드화하는 폴리뉴클레오티드를 제공한다. EDEM2-코드화 폴리뉴클레오티드는 재조합체이고, 시험관에서, 또는 시험관 내 번역 시스템에서와 같이, 시험관 내 제조, 보관, 사용 또는 발현될 수 있고, 또는 생체 내에서, 예컨대 세포 배양에서와 같이 생체 외에 있을 수 있는 세포에서, 또는 유기체에서와 같은 생체 내에서 제조, 보관, 사용 또는 발현될 수 있다. 어떤 구체예에서, EDEM2-코드화 폴리뉴클레오티드는 유전자 내에 있는데, 이것은 그것이 프로모터의 제어하에 있으면서 그 아래 쪽에 있고, 폴리아데닐화 부위의 위쪽에 있음을 의미한다. EDEM2-코드화 폴리뉴클레오티드 또는 유전자는 플라스미드 또는 다른 원형 또는 선형 벡터 내에 있을 수 있다. EDEM2-코드화 폴리뉴클레오티드 또는 유전자는 세포 내에 에피솜으로서 존재하거나 세포 게놈 안으로 통합되는 원형 또는 선형 DNA 구성물 내에 있을 수 있다.
상기에서 기술된 것과 같이, EDEM2-코드화 폴리뉴클레오티드는 표 1의 어떠한 이종상동체, 상동체 또는 보존적으로 치환된 EDEM2 폴리펩티드, 또는 SEQ ID NO:8의 포유류 공통 서열을 포함하여 SEQ ID NO:1 내지 5 및 8 중 어느 하나에 적어도 92% 동일한 아미노산 서열을 가지는 EDEM2 폴리펩티드를 코드화한다.
어떤 경우에, 재조합 또는 분리된 EDEM2-코드화 폴리뉴클레오티드는 포유류 프로모터에 작동가능하게 연결된다. 프로모터는 어떠한 프로모터든지 가능하지만, 어떤 경우에는 예를 들면 유비퀴틴 C 프로모터와 같은 포유류 프로모터이다.
특정 구체예에서, EDEM2-코드화 폴리뉴클레오티드는 본질적으로 5'으로부터 3'쪽으로 프로모터, 예컨대 유비퀴틴 C 프로모터, 이어서 임의의 인트론, 예컨대 베타 글로빈 인트론, 이어서 EDEM2 코딩 서열, 이어서 폴리아데닐화 서열, 예컨대 SV40pA 서열로 구성된다. 그런 EDEM2-코드화 폴리뉴클레오티드의 특정 구체예이기도 한 구체적인 실례는 SEQ ID NO:16에 의해 표시된다. 그 서열의 보존된 변이체는 또한 본 발명의 구체예일 것으로 예상된다.
어떤 경우에, 재조합 EDEM2-코드화 폴리뉴클레오티드는 선형, 원형, 에피솜성, 통합된, 고정된 DNA 구성물, 또는 EDEM2 유전자를 전달하거나 EDEM2 단백질을 발현하기 위한 벡터일 수 있는 플라스미드의 부분이다. 한 특정 구체예에서, 플라스미드는 (1) 유비퀴틴 C 프로모터의 제어하에 있고 SV40 폴리아데닐화 신호로 종결되는 EDEM2 유전자 및 (2) 선택가능한 마커, 예컨대 폴리아데닐화 서열, 예컨대 PGK pA 서열로 종결되고, SV40 프로모터와 같은 프로모터의 제어 하에 제오신에 대한 내성을 부여하는 폴리펩티드를 코드화하는 폴리뉴클레오티드 또는 네오마이신에 대한 내성을 부여하는 폴리펩티드를 코드화하는 폴리뉴클레오티드를 함유한다. 한 특정 구체예에서, 플라스미드는 5'에서 3' 방향으로 계속되는 원형 형식으로, 유비퀴틴 C 프로모터, 베타 글로빈 인트론, EDEM2 코딩 서열, SV40 pA 서열, SV40 프로모터, 네오마이신-내성 코딩 서열 및 PGK pA 서열을 포함한다. 이 구체예의 특정 실례는 SEQ ID NO:14의 서열을 가지는 플라스미드에 의해 예시된다. 또 다른 특정 구체예에서, 플라스미드는 5'에서 3' 방향으로 계속되는 원형 형식으로, 유비퀴틴 C 프로모터, 베타 글로빈 인트론, EDEM2 코딩 서열, SV40 pA 서열, SV40 프로모터, 제오신-내성 코딩 서열 및 PGK pA 서열을 포함한다. 이 구체예의 특정 실례는 SEQ ID NO:15의 서열을 가지는 플라스미드에 의해 예시된다.
XBP1 폴리뉴클레오티드
또 다른 측면으로, 본 발명은 XBP1 단백질을 코드화하는 폴리뉴클레오티드를 제공한다. XBP1-코드화 폴리뉴클레오티드는 재조합체이고, 시험관에서, 또는 시험관 내 번역 시스템에서와 같이, 시험관 내 제조, 보관, 사용 또는 발현될 수 있고, 또는 생체 내에서, 예컨대 세포 배양에서와 같이 생체 외에 있을 수 있는 세포에서, 또는 유기체에서와 같은 생체 내에서 제조, 보관, 사용 또는 발현될 수 있다. 어떤 구체예에서, XBP1-코드화 폴리뉴클레오티드는 유전자 내에 있는데, 이것은 그것이 프로모터의 제어하에 있으면서 그 아래 쪽에 있고, 폴리아데닐화 부위의 위쪽에 있음을 의미한다. XBP1-코드화 폴리뉴클레오티드는 플라스미드 또는 다른 원형 또는 선형 벡터 내에 있을 수 있다. XBP1-코드화 폴리뉴클레오티드 또는 유전자는 세포 내에 에피솜으로서 존재하거나 세포 게놈 안으로 통합되는 원형 또는 선형 DNA 구성물 내에 있을 수 있다.
상기에서 기술된 것과 같이, XBP1-코드화 폴리뉴클레오티드는 표 2의 어떠한 이종상동체, 상동체 또는 보존적으로 치환된 XBP1 폴리펩티드, 또는 SEQ ID NO:13의 포유류 공통 서열을 포함하여 SEQ ID NO:9, 10 및 11 중 어느 하나에 적어도 86% 동일한 아미노산 서열을 가지는 XBP1 폴리펩티드를 코드화한다.
어떤 경우에, 재조합 또는 분리된 XBP1-코드화 폴리뉴클레오티드는 포유류 프로모터에 작동가능하게 연결된다. 프로모터는 어떠한 프로모터든지 가능하지만, 어떤 경우에는 예를 들면 유비퀴틴 C 프로모터와 같은 포유류 프로모터이다.
특정 구체예에서, XBP1-코드화 폴리뉴클레오티드는 본질적으로 5'으로부터 3'쪽으로 프로모터, 예컨대 유비퀴틴 C 프로모터, 이어서 임의의 인트론, 예컨대 베타 글로빈 인트론, 이어서 XBP1 코딩 서열, 이어서 폴리아데닐화 서열, 예컨대 SV40pA 서열로 구성된다. SEQ ID NO:18은 XBP1-코드화 폴리뉴클레오티드의 실례를 나타낸다. 그 서열의 보존된 변이체는 또한 본 발명의 구체예일 것으로 예상된다.
어떤 경우에, 재조합 XBP1-코드화 폴리뉴클레오티드는 선형, 원형, 에피솜성, 통합된, 고정된 DNA 구성물, 또는 XBP1 유전자를 전달하거나 스플라이싱되고 활성인 XBP1 단백질을 발현하기 위한 벡터일 수 있는 플라스미드의 부분이다. 한 특정 구체예에서, 플라스미드는 (1) 유비퀴틴 C 프로모터의 제어하에 있고 SV40 폴리아데닐화 신호로 종결되는 XBP1 유전자 및 (2) 선택가능한 마커, 예컨대 폴리아데닐화 서열, 예컨대 PGK pA 서열로 종결되고, SV40 프로모터와 같은 프로모터의 제어 하에 제오신에 대한 내성을 부여하는 폴리펩티드를 코드화하는 폴리뉴클레오티드 또는 네오마이신에 대한 내성을 부여하는 폴리펩티드를 코드화하는 폴리뉴클레오티드를 함유한다. 한 특정 구체예에서, 플라스미드는 5'에서 3' 방향으로 계속되는 원형 형식으로, 유비퀴틴 C 프로모터, 베타 글로빈 인트론, XBP1 코딩 서열, SV40 pA 서열, SV40 프로모터, 제오신-내성 코딩 서열 및 PGK pA 서열을 포함한다. 이 구체예의 특정 실례는 SEQ ID NO:17의 서열을 가지는 원형 플라스미드로 예시된다.
항체 중쇄 및 경쇄-코드화 폴리뉴클레오티드
또 다른 측면으로, 본 발명은 항체 중쇄 폴리펩티드(HC)를 코드화하는 폴리뉴클레오티드를 제공한다. HC-코드화 폴리뉴클레오티드는 재조합체이고, 시험관에서, 또는 시험관 내 번역 시스템에서와 같이, 시험관 내 제조, 보관, 사용 또는 발현될 수 있고, 또는 생체 내에서, 예컨대 세포 배양에서와 같이 생체 외에 있을 수 있는 세포에서, 또는 유기체에서와 같은 생체 내에서 제조, 보관, 사용 또는 발현될 수 있다. 어떤 구체예에서, HC-코드화 폴리뉴클레오티드는 유전자 내에 있는데, 이것은 그것이 프로모터의 제어하에 있으면서 그 아래 쪽에 있고, 폴리아데닐화 부위의 위쪽에 있음을 의미한다. HC-코드화 폴리뉴클레오티드는 플라스미드 또는 다른 원형 또는 선형 벡터 내에 있을 수 있다. HC-코드화 폴리뉴클레오티드 또는 유전자는 세포 내에 에피솜으로서 존재하거나 세포 게놈 안으로 통합되는 원형 또는 선형 DNA 구성물 내에 있을 수 있다.
어떤 경우에, 재조합 또는 분리된 HC-코드화 폴리뉴클레오티드는 포유류 프로모터에 작동가능하게 연결된다. 프로모터는 어떠한 프로모터든지 가능하지만, 어떤 경우에는 예를 들면 유비퀴틴 C 프로모터 또는 hCMV-IE 프로모터와 같은 포유류 프로모터이다.
특정 구체예에서, HC-코드화 폴리뉴클레오티드는 본질적으로 5'으로부터 3'쪽으로 프로모터, 예컨대 hCMV-IE 프로모터, 이어서 임의의 인트론, 예컨대 베타 글로빈 인트론, 이어서 중쇄 코딩 서열, 예컨대 SEQ ID NO:43 및 44, SEQ ID NO:19, SEQ ID NO:27 또는 SEQ ID NO:35의 아미노산 서열을 코드화하는 서열, 이어서 폴리아데닐화 서열, 예컨대 SV40pA 서열을 포함하는 HC 유전자이다. HC 유전자의 특정 실례는 SEQ ID NO:23, SEQ ID NO:31 또는 SEQ ID NO:39로 표시된다. 이들 서열 중 어느 하나의 보존된 변이체는 또한 본 발명의 구체예일 것으로 예상된다.
어떤 경우에, 재조합 HC-코드화 폴리뉴클레오티드는 선형, 원형, 에피솜성, 통합된, 고정된 DNA 구성물, 또는 중쇄 유전자를 전달하거나 중쇄 하위유닛을 발현하기 위한 벡터일 수 있는 플라스미드의 부분이다. 한 특정 구체예에서, 플라스미드는 (1) hCMV-IE 프로모터의 제어하에 있고 SV40 폴리아데닐화 신호로 종결되는 HC 유전자 및 (2) 선택가능한 마커, 예컨대 SV40 프로모터와 같은 프로모터의 제어 하에 하이그로마이신에 대한 내성을 부여하고, 폴리아데닐화 서열, 예컨대 PGK pA 서열로 종결되는 폴리펩티드를 코드화하는 폴리뉴클레오티드를 함유한다. 한 특정 구체예에서, 플라스미드는 5'에서 3' 방향으로 계속되는 원형 형식으로, hCMV-IE 프로모터, 베타 글로빈 인트론, 항체 중쇄 코딩 서열(SEQ ID NO:43 및 44, SEQ ID NO:19, SEQ ID NO:27 또는 SEQ ID NO:35의 아미노산을 가지는 HC를 코드화한다), SV40 pA 서열, SV40 프로모터, 하이그로마이신-내성 코딩 서열 및 PGK pA 서열을 포함한다. HC 유전자를 함유하는 그런 플라스미드의 특정 실례 및 특별한 구체예는 SEQ ID NO:24, SEQ ID NO:32 또는 SEQ ID NO:40에 의해 예시된다. 이들 서열 중 어느 하나의 보존된 변이체는 본 발명의 구체예일 것으로 예상된다.
또 다른 측면으로, 본 발명은 항체 경쇄 폴리펩티드(LC)를 코드화하는 폴리뉴클레오티드를 제공한다. LC-코드화 폴리뉴클레오티드는 재조합체이고, 시험관에서, 또는 시험관 내 번역 시스템에서와 같이, 시험관 내 제조, 보관, 사용 또는 발현될 수 있고, 또는 생체 내에서, 예컨대 세포 배양에서와 같이 생체 외에 있을 수 있는 세포에서, 또는 유기체에서와 같은 생체 내에서 제조, 보관, 사용 또는 발현될 수 있다. 어떤 구체예에서, LC-코드화 폴리뉴클레오티드는 유전자 내에 있는데, 이것은 그것이 프로모터의 제어하에 있으면서 그 아래 쪽에 있고, 폴리아데닐화 부위의 위쪽에 있음을 의미한다. LC-코드화 폴리뉴클레오티드 또는 유전자는 플라스미드 또는 다른 원형 또는 선형 벡터 내에 있을 수 있다. LC-코드화 폴리뉴클레오티드 또는 유전자는 세포 내에 에피솜으로서 존재하거나 세포 게놈 안으로 통합되는 원형 또는 선형 DNA 구성물 내에 있을 수 있다.
어떤 경우에, 재조합 또는 분리된 LC-코드화 폴리뉴클레오티드는 포유류 프로모터에 작동가능하게 연결된다. 프로모터는 어떠한 프로모터든지 가능하지만, 어떤 경우에는 예를 들면 유비퀴틴 C 프로모터 또는 hCMV-IE 프로모터와 같은 포유류 프로모터이다.
특정 구체예에서, LC-코드화 폴리뉴클레오티드는 본질적으로 5'으로부터 3'쪽으로 프로모터, 예컨대 hCMV-IE 프로모터, 이어서 임의의 인트론, 예컨대 베타 글로빈 인트론, 이어서 경쇄 코딩 서열, 예컨대 SEQ ID NO:45 및 46, SEQ ID NO:21, SEQ ID NO:29 또는 SEQ ID NO:37의 아미노산 서열을 코드화하는 서열, 이어서 폴리아데닐화 서열, 예컨대 SV40pA 서열을 포함하는 LC 유전자이다. 그런 LC 유전자의 구체적인 실례 및 특정 구체예는 SEQ ID NO:25, SEQ ID NO:33 또는 SEQ ID NO:41로 표시된다. 이들 서열 중 어느 하나의 보존된 변이체는 또한 본 발명의 구체예일 것으로 예상된다.
어떤 경우에, 재조합 LC-코드화 폴리뉴클레오티드는 선형, 원형, 에피솜성, 통합된, 고정된 DNA 구성물, 또는 경쇄 유전자를 전달하거나 경쇄 하위유닛을 발현하기 위한 벡터일 수 있는 플라스미드의 부분이다. 한 특정 구체예에서, 플라스미드는 (1) hCMV-IE 프로모터의 제어하에 있고 SV40 폴리아데닐화 신호로 종결되는 LC 유전자 및 (2) 선택가능한 마커, 예컨대 SV40 프로모터와 같은 프로모터의 제어 하에 하이그로마이신에 대한 내성을 부여하고, 폴리아데닐화 서열, 예컨대 PGK pA 서열로 종결되는 폴리펩티드를 코드화하는 폴리뉴클레오티드를 함유한다. 한 특정 구체예에서, 플라스미드는 5'에서 3' 방향으로 계속되는 원형 형식으로, hCMV-IE 프로모터, 베타 글로빈 인트론, 항체 경쇄 코딩 서열(SEQ ID NO:45 및 46, SEQ ID NO:21, SEQ ID NO:29 또는 SEQ ID NO:37의 아미노산을 가지는 LC를 코드화한다), SV40 pA 서열, SV40 프로모터, 하이그로마이신-내성 코딩 서열 및 PGK pA 서열을 포함한다. LC 유전자를 함유하는 그런 플라스미드의 구체적인 실례 및 특별한 구체예는 SEQ ID NO:26, SEQ ID NO:34 또는 SEQ ID NO:42에 의해 예시된다. 이들 서열 중 어느 하나의 보존된 변이체는 본 발명의 구체예일 것으로 예상된다.
다중-하위유닛 단백질의 제조 방법
또 다른 측면으로, 본 발명은 상대적으로 다량의 적절하게 조립된 다중-하위유닛 단백질을 생성하고 분비할 수 있는 세포, 또는 셀라인의 구성 세포를 배지에서 배양함으로써 다중-하위유닛 단백질을 제조하는 방법을 제공하는데, 이때 다중-하위유닛 성분은 상대적으로 높은 역가로 배지로 분비된다. 이 제조 과정에서 활용된 세포는 전술한 측면에서 기술된 세포이고, 그것은 본원에 기술된 ERAD 렉틴-코드화 폴리뉴클레오티드를 함유한다.
유용한 재조합 단백질을 제조할 목적을 위해, 세포 및 특히 포유류 세포를 배양하는 방법은 해당 기술분야에 잘 알려져 있다(예컨대 De Jesus & Wurm, Eur. J. Pharm. Biopharm. 78:184-188, 2011 참조). 간단히 설명하면, 기술된 폴리뉴클레오티드를 함유하는 세포는 혈청 또는 가수분해물을 함유할 수 있거나, 또는 화학적으로 규정되고 단백질 생성을 위해 최적화될 수 있는 배지에서 배양된다. 배양은 물질 환경 조절 장치에서처럼 공급-배치식 배양이거나 연속식 배양일 수 있다. 세포는 실험실 벤치 크기 플라스크(~ 25mL), 제조 스케일-업 생물반응기(1 내지 5L) 또는 산업 규모 생물반응기(5,000 내지 25,000L)에서 배양될 수 있다. 제조 작동은 여러 주에서 1개월까지 지속될 수 있고, 그 시간 동안 다중-하위유닛 단백질이 배지 안으로 분비된다.
대상 세포는 적절하게 조립된 다중-하위유닛 단백질을 생성하고 분비하는 증강된 능력을 가진다. 어떤 구체예에서, 다중-하위유닛 단백질, 예컨대 항체는 적어도 94pg/세포/일, 적어도 37pg/세포/일 또는 적어도 39pg/세포/일의 속도로 배지 안으로 분비된다. 어떤 구체예에서, 다중-하위유닛 단백질은 배양 후 약 12일 후에 적어도 3g/L, 적어도 5g/L, 적어도 6g/L 또는 적어도 8g/L의 역가를 획득한다.
나아가, 대상 세포는 증식하고 상대적으로 높은 세포 밀도, 나아가 최적의 생산성을 획득할 수 있는 증강된 능력을 가진다. 어떤 구체예에서, 세포 또는 셀라인 시드 트레인은 배양중에 적어도 5×107 세포-일/mL, 적어도 1×108 세포-일/mL 또는 적어도 1.5×108 세포-일/mL의 통합된 세포 밀도를 획득한다.
임의로, 분비된 다중-하위유닛 단백질은 계속해서 그것이 분비된 배지로부터 정제된다. 단백질 정제 방법은 해당 기술분야에 잘 알려져 있다(예컨대 Kelley, mAbs 1(5):443-452 참조). 어떤 구체예에서, 단백질은 액체 배지 상층액으로부터 세포를 제거하기 위한 원심분리와, 이어서 다양한 크로마토그래피 단계 및 그 중에서도 바이러스 및 다른 오염물 또는 불순물을 제거하기 위한 여과 단계에 의해 수득된다. 어떤 구체예에서, 크로마토그래피 단계는 이온 교환 단계, 예컨대 양이온-교환 또는 음이온-교환을 포함한다. 다양한 친화성 크로마토그래피 배지, 예컨대 항체의 정제를 위한 단백질 A 크로마토그래피가 또한 사용될 수 있다.
임의로, 제조 방법은 세포를 생성하는 선행 단계들을 포함한다. 그러므로 어떤 구체예에서, 다중-하위유닛 단백질의 제조 방법은 세포를 상술된 것과 같은 스트레스-유도된 만노스-결합 렉틴을 코드화하는 벡터로 형질전환하는 단계와, 이어서 그것의 안정한 통합체를 선택하는 단계를 포함한다. 벡터의 비-제한적인 실례는 SEQ ID NO:1 내지 8 중 어느 하나의 아미노산 서열, SEQ ID NO:1 내지 8 중 어느 하나에 적어도 92% 동일한 아미노산 서열 또는 SEQ ID NO:1 내지 8의 어느 하나의 보존적으로 치환된 변이체를 가지는 EDEM2를 코드화하는 폴리뉴클레오티드를 함유하는 그런 유전자 구성물들을 포함한다. 유용한 벡터로는, 예를 들면 SEQ ID NO:16의 유전자를 은닉하는 플라스미드, SEQ ID NO:15의 플라스미드 및 SEQ ID NO:14의 플라스미드를 포함한다. 당업자는 플라스미드 서열(예컨대 SEQ ID NO:14, 15, 17, 24, 26, 32, 34, 40 및 42)이 서열 목록에서 선형 방식으로 기술된 원형 서열임을 유념해야 한다. 그러므로 그런 경우에, 기록된 서열의 3-프라임의 대부분의 뉴클레오티드는 기록된 것과 같은 서열의 5-프라임의 대부분의 뉴클레오티드의 5-프라임쪽 바로 옆에 있을 것으로 간주될 것이다. SEQ ID NO:14의 플라스미드의 실례에서, 형질전환체는 네오마이신에 대한 내성을 통해 선택되고; SEQ ID NO:15의 경우, 선택은 ZEOCIN 내성을 통해서 이루어진다.
폴리뉴클레오티드 및 그것을 포함하는 벡터를 구성하기 위한 상세한 방법은 미국 특허 번호 7,435,553 및 7,771,997, 및 예컨대 Zwarthoff et al., J. Gen. Virol. 66(4):685-91, 1985; Mory et al., DNA. 5(3):181-93, 1986; 및 Pichler et al., Biotechnol. Bioeng. 108(2):386-94, 2011에 설명되어 있다.
그 안에 스트레스-유도된 만노스-결합 렉틴을 코드화하는 벡터가 놓이게 되는 출발 세포는 이미 다중-하위유닛 단백질, 또는 XBP1을 활용하는 그런 구체예의 경우에는 XBP1을 코드화하거나 또는 발현을 조절하는 구성물 또는 유전자 요소를 함유할 수 있다. 또는 다르게는, 스트레스-유도된 만노스-결합 렉틴을 코드화하는 벡터는 먼저 세포 내부에, 그 다음에 다른 구성물 내부에 놓일 수 있다.
방법에 의해 제조된 다중-하위유닛 단백질
또 다른 측면으로, 본 발명은 본원에 개시된 방법에 따라 만들어진 다중-하위유닛 단백질을 제공한다. 다중-하위유닛 단백질, 예컨대 항체의 적절한 접힘, 조립 및 번역-후 변형을 촉진하는 하나 또는 그 이상의 요소가 포함된다면, 해당 기술분야의 숙련자라면 그런 단백질이 뚜렷한 구조적 및 기능적 품질을 가지는 것으로 타당하게 예상할 수 있을 것이다. 예를 들어 개시된 방법에 의해 제조된 항체는 특별한 글리코실화 패턴 및 비-응집된 이종사량체의 정량적으로 더 큰 부분을 가지는 것으로 타당하게 여겨진다.
실시예
다음의 실시예는 해당 기술분야의 숙련된 사람들에게 본 발명의 방법 및 조성물을 제조하고 사용하는 방법을 완전하게 개시하고 설명하기 위해 제공되는 것으로, 본 발명자들이 자신들의 발명으로 간주하는 범주를 제한하려는 의도는 아니다. 사용된 숫자(예컨대 양, 온도 등)와 관련하여 정확성을 보장하기 위한 노력이 기울여졌지만, 약간의 실험적 오류나 편차는 설명되어야 한다. 다르게 표시되지 않는 한, 부는 몰에 의한 부이고, 분자량은 평균 분자량이며, 퍼센트 농도(%)는 밀리리터의 용액의 부피로 나눈 그램의 용매의 질량 곱하기 100%를 의미하고(예컨대 10% 물질 X는 용액 밀리리터당 물질 X의 0.1그램을 의미한다), 온도는 섭씨 온도이며, 압력은 대기압이거나 대기압 근처이다.
실시예 1: 셀라인
CHO-K1 유도된 숙주 셀라인을 사람 항체의 중쇄 및 경쇄를 코드화하는 두 개의 플라스미드로 형질전환하였다. 두 개의 플라스미드는 모두 하이그로마이신 B에 대한 내성을 부여하는 hph 유전자를 함유한다(Asselbergs and Pronk, 1992, Mol. Biol. Rep., 17(1):61-70). 세포를 LIPOPECTAMIN 시약(Invitrogen cat.#18324020)을 사용하여 형질전환하였다. 간단하게 설명하면, 형질전환 하루 전에 3.5×106 세포를 10cm 플레이트 상에서 10%의 소태아 혈청(FBS)(Invitrogen cat.#10100)을 함유하고 있는 완전 F12(Invitrogen cat.#11765)에 플레이팅하였다. 형질전환 후 1일에 세포를 1회 세척하고, 배지를 OPTIMEM으로 교체하였다(Invitrogen cat.#31985로부터). DNA/리포펙타민 복합체를 OPTIMEM 배지에서 제조한 후 세포에 첨가하였다. 배지를 다시 한 번 6시간 후에 10%의 FBS를 포함하고 있는 완전 F12로 교환하였다. 플라스미드의 안정한 통합을 하이그로마이신 B 선택을 사용하여 400㎍/ml에서 선택하였다. 클론성 항체를 발현하는 셀라인을 FASTR 기술(미국 특허 번호 6,919,183에 설명되어 있음)을 사용하여 분리하였다.
그런 다음 항체를 발현하는 라인을 EDEM2 코드화 플라스미드로 재-형질전환시켰다. EDEM2 플라스미드는 네오마이신 포스포트란스페라제("p3"로 표시된 플라스미드 구성물) 또는 sh ble(플라스미드 "p7") 유전자 중 하나를 함유하여 G418 또는 제오신에 대한 내성을 부여하였다. 동일한 형질전환 방법을 사용하였다. 선택가능한 마커에 따라 세포를 각각 G418 또는 제오신을 사용하여 400㎍/ml 또는 250㎍/ml에서 선택하였다. 그런 다음 클론성 셀라인을 FASTR 기술을 사용하여 분리하였다.
명칭 | 인핸서 | 구성물 | 단백질 |
C1 | EDEM2 + XBP1 | HC/LC = p1/p2 EDEM2 = p3 XBP1 = p4 |
aAng2 |
C2 | XBP1 | ||
C3 | EDEM2 + XBP1 | HC/LC = p5/p6 EDEM2 = p7 XBP1 = p4 |
aGDF8 |
C4 | XBP1 | ||
C5 | EDEM2 | ||
C6 | EDEM2 + XBP1 | HC/LC = p8/p9 EDEM2 = p3 XBP1 = p4 |
aAngPtl4 |
C7 | XBP1 |
실시예 2:
항체 생성을 진동 플라스크를 사용하여 스케일-다운된 12일 공급 배치 공정으로 평가하였다. 이 방법으로 세포를 진동 플라스크에 생성 배지(고아미노산을 포함한 규정 배지)의 mL당 0.8×106 세포의 밀도로 시딩하였다. 배양을 약 12일 동안 유지하고, 글루코스뿐 아니라 3회의 공급물을 보충하였다. 생존 세포 밀도 및 항체 역가를 배치를 통털어 모니터하였다.
증강된 단백질 생성에 미치는 mEDEM2의 효과를 측정하기 위하여, mEDEM2 및 mXBP1을 함유하고 있는 CHO 셀라인에 의한 단백질의 생성을 mEDEM2가 아닌 mXBP1을 함유한 대조 세포에 의한 생성과 비교하였다. 단백질 역가는 mEDEM2를 발현하지 않은 셀라인에 비해 mEDEM2를 발현하는 그런 셀라인에서 더 높았다.
셀라인 | 인핸서 | 생성률(pg/세포/일) | 역가 g/L (% 증가) |
C1 | EDEM2 + XBP1 | 39 | 8.1 (93) |
C2 | XBP1 | 39 | 4.2 |
C3 | EDEM2 + XBP1 | 37 | 5.9 (55) |
C8 | XBP1 | 32 | 3.8 |
C6 | EDEM2 + XBP1 | 94 | 5.3 (152) |
C7 | XBP1 | 52 | 2.1 |
C5 | EDEM2 | 29 | 3.1 (343) |
C9 | --- | 9 | 0.7 |
실시예 3: 통합된 세포 일
통합된 세포 일("ICD")은 공급 배치 과정을 통털어 배양의 성장을 설명하기 위해 사용된 구절이다. 12-일 생성 분석의 과정에서, 본 발명자들은 0, 3, 5, 7, 10 및 12일에 생존 세포 밀도를 모니터하였다. 그런 다음 이 데이터를 시간에 대해 도표화하였다. ICD는 세포 밀도 곡선 아래의 면적으로서 계산된 생존 세포 밀도의 적분이다. EDEM2 형질전환된 라인은 12-일 공급 배치 과정에서 더 높은 ICD를 나타낸다(표 5 참조).
셀라인 | 인핸서 | ICD 106 세포-일/mL (% 증가) |
C1 | EDEM2 + XBP1 | 205 (93) |
C2 | XBP1 | 106 |
C3 | EDEM2 + XBP1 | 157 (34) |
C4 | XBP1 | 117 |
C6 | EDEM2 + XBP1 | 56 (51) |
C7 | XBP1 | 37 |
C5 | EDEM2 | 116 (59) |
C9 | --- | 73 |
실시예 4: 항-GDF8 항체 생성
EDEM2, XBP1 또는 두 가지 모두의 이소성 발현이 SEQ ID NO:19의 중쇄 서열 및 SEQ ID NO:21의 경쇄 서열을 가지는 항-GDF8 항체의 생성에 미치는 효과를 조사하였다. 개별적인 셀라인을 역가 및 통합된 세포 밀도에 대하여 조사하고, "bins" 또는 값의 범위에 놓았다. EDEM2의 이소성 발현은 5 내지 6g/L의 역가 범위로 항체를 발현하는 셀라인의 수를 상당히 증가시켰다. XBP1과 EDEM2의 조합은 고역가 셀라인의 증가를 향한 첨가 효과 이상을 나타냈다. 항체를 분비하는 세포에서 EDEM2의 발현은 또한 높은 ICD를 획득하는 셀라인의 수를 상당히 증가시켰다(표 6 참조).
역가 Bins (g/L) | ICD Bins (106 세포-일/mL) | ||||||
구성물 | <1 | 1-3 | 3-5 | 5-6 | 30-50 | 50-100 | 100-200 |
E+X | 0% | 33.3% | 44.4% | 22.2% | 11.1% | 50% | 38.9% |
X | 0% | 37.5% | 54% | 8.3% | 14.3% | 85.7% | 0% |
E | 0% | 33% | 60% | 7% | 0% | 27% | 73% |
- | 82% | 18% | 0% | 0% | 13% | 67% | 21% |
SEQUENCE LISTING
<110> Regeneron Pharmaceuticals, Inc.
<120> Production Cell Line Enhancers
<130> 8150A
<150> US 61/652,549
<151> 2012-05-29
<160> 46
<170> PatentIn version 3.5
<210> 1
<211> 577
<212> PRT
<213> Mus musculus
<400> 1
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Val Cys Val Leu Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Asp Gly Thr Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Tyr Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Thr Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg
275 280 285
Asn Tyr Thr His Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe His Pro Asn Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Ser Val Met Thr Pro His Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Arg Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Ile Lys Glu Phe Tyr Ser Leu Lys Gln Ser Arg
500 505 510
Pro Lys Arg Ala Gln Arg Lys Thr Val Arg Ser Gly Pro Trp Glu Pro
515 520 525
Gln Ser Gly Pro Ala Thr Leu Ser Ser Pro Ala Asn Gln Pro Arg Glu
530 535 540
Lys Gln Pro Ala Gln Gln Arg Thr Pro Leu Leu Ser Cys Pro Ser Gln
545 550 555 560
Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser
565 570 575
Ser
<210> 2
<211> 576
<212> PRT
<213> Rattus norvegicus
<400> 2
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Val Cys Val Leu Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Glu Gly Thr Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Tyr Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Thr Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg
275 280 285
Asn Tyr Thr His Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe His Pro Asn Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Ser Val Met Thr Pro His Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Arg Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Ile Lys Glu Phe Tyr Ser Leu Arg Gln Ser Arg
500 505 510
Ser Arg Ala Gln Arg Lys Thr Val Ser Ser Gly Pro Trp Glu Pro Pro
515 520 525
Ala Gly Pro Gly Thr Leu Ser Ser Pro Glu Asn Gln Pro Arg Glu Lys
530 535 540
Gln Pro Ala Arg Gln Arg Ala Pro Leu Leu Ser Cys Pro Ser Gln Pro
545 550 555 560
Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser Ser
565 570 575
<210> 3
<211> 578
<212> PRT
<213> Cricetulus griseus
<400> 3
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Val Cys Val Phe Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Asp Gly Thr Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Tyr Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Thr Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Leu Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Arg Ala Ile Arg
275 280 285
Asn Tyr Thr His Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Ala Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe His Pro Asn Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Ser Val Met Thr Pro His Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Arg Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Met Arg Glu Leu His Ser Leu Lys Gln Ser Arg
500 505 510
Ser Arg Ala Gln Arg Lys Thr Thr Ser Ser Gly Pro Trp Glu Pro Pro
515 520 525
Ala Gly Pro Gly Ser Pro Ser Ala Pro Gly Lys Gln Asp Gln Pro Arg
530 535 540
Glu Lys Gln Pro Ala Lys Gln Arg Thr Pro Leu Leu Ser Cys Pro Ser
545 550 555 560
Gln Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp
565 570 575
Ser Ser
<210> 4
<211> 578
<212> PRT
<213> Homo sapiens
<400> 4
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Leu Cys Ala Leu Leu
1 5 10 15
Pro Gln His His Gly Ala Pro Gly Pro Asp Gly Ser Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Phe Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Val Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Ser Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg
275 280 285
Asn Tyr Thr Arg Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe Asp Pro Thr Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Thr Val Ile Thr Pro Tyr Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Gln Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Met Arg Glu Phe Tyr Ser Leu Lys Arg Ser Arg
500 505 510
Ser Lys Phe Gln Lys Asn Thr Val Ser Ser Gly Pro Trp Glu Pro Pro
515 520 525
Ala Arg Pro Gly Thr Leu Phe Ser Pro Glu Asn His Asp Gln Ala Arg
530 535 540
Glu Arg Lys Pro Ala Lys Gln Lys Val Pro Leu Leu Ser Cys Pro Ser
545 550 555 560
Gln Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp
565 570 575
Ser Ser
<210> 5
<211> 578
<212> PRT
<213> Pan troglodytes
<400> 5
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Leu Cys Ala Leu Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Asp Gly Ser Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Phe Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Val Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Ser Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg
275 280 285
Asn Tyr Thr Arg Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe Asp Pro Thr Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Ala Val Ile Thr Pro Tyr Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Gln Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Met Arg Glu Phe Tyr Ser Leu Lys Arg Ser Arg
500 505 510
Ser Lys Phe Gln Lys Lys Thr Val Ser Ser Gly Pro Trp Glu Pro Pro
515 520 525
Ala Arg Pro Gly Thr Leu Phe Ser Pro Glu Asn His Asp Gln Ala Arg
530 535 540
Glu Arg Lys Pro Ala Lys Gln Lys Val Pro Leu Leu Ser Cys Pro Ser
545 550 555 560
Gln Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp
565 570 575
Ser Ser
<210> 6
<211> 513
<212> PRT
<213> Pongo pygmaeus
<400> 6
Met Asn Thr Leu Ser Cys Ser Leu Phe Ser Leu Thr Leu Ile Asp Ala
1 5 10 15
Leu Asp Thr Leu Leu Ile Leu Gly Asn Val Ser Glu Phe Gln Arg Val
20 25 30
Val Glu Val Leu Gln Asp Asn Val Asp Phe Asp Ile Asp Val Asn Ala
35 40 45
Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser Ala
50 55 60
His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp Pro
65 70 75 80
Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys Leu
85 90 95
Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val Asn
100 105 110
Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr Ala
115 120 125
Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu Thr
130 135 140
Gly Asp Pro Val Phe Glu Asp Val Ala Arg Val Ala Leu Met Arg Leu
145 150 155 160
Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp Val
165 170 175
Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly Val
180 185 190
Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln Asp
195 200 205
Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Lys Ala Ile Arg Asn
210 215 220
Tyr Thr Arg Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys Gly
225 230 235 240
Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro Gly
245 250 255
Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe Leu
260 265 270
Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe Tyr
275 280 285
Asn Ile Pro Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro Leu
290 295 300
Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr Gly
305 310 315 320
Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile Glu
325 330 335
Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu Arg
340 345 350
Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu Thr
355 360 365
Val Lys Tyr Leu Tyr Leu Leu Phe Asp Pro Thr Asn Phe Ile His Asn
370 375 380
Asn Gly Ser Thr Phe Asp Ala Val Ile Thr Pro Tyr Gly Glu Cys Ile
385 390 395 400
Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile Asp
405 410 415
Pro Ala Ala Leu His Cys Cys Gln Arg Leu Lys Glu Glu Gln Trp Glu
420 425 430
Val Glu Asp Leu Met Arg Glu Phe Tyr Ser Leu Lys Arg Asn Arg Ser
435 440 445
Lys Phe Gln Lys Lys Thr Val Ser Ser Gly Pro Trp Glu Pro Pro Ala
450 455 460
Arg Pro Gly Thr Leu Phe Ser Pro Glu Asn His Asp Gln Ala Arg Gly
465 470 475 480
Arg Lys Pro Ala Lys Gln Lys Val Pro Leu Leu Ser Cys Pro Ser Gln
485 490 495
Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser
500 505 510
Ser
<210> 7
<211> 572
<212> PRT
<213> Danio rerio
<400> 7
Leu Tyr Tyr Leu Pro Leu Phe Thr Ser Arg Tyr Phe Met Leu Thr Phe
1 5 10 15
Leu Phe Ser Ala Ile Phe Cys Ala Ala Tyr Leu Ser Pro Ile Ile Ser
20 25 30
His Val Lys Gly Arg Asp Phe Thr Glu Gln Glu Met Ser His Tyr Arg
35 40 45
Asp Arg Val Lys Ser Met Phe Tyr His Ala Tyr Asn Ser Tyr Leu Asp
50 55 60
Asn Ala Tyr Pro Tyr Asp Glu Leu Arg Pro Leu Thr Cys Asp Gly Gln
65 70 75 80
Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp Ala Leu Asp Thr
85 90 95
Leu Leu Ile Leu Gly Asn His Thr Glu Phe Gln Arg Val Ala Thr Leu
100 105 110
Leu Gln Asp Thr Val Asp Phe Asp Ile Asp Val Asn Ala Ser Val Phe
115 120 125
Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser Ala His Leu Leu
130 135 140
Ser Lys Arg Ala Gly Met Lys Val Glu Glu Gly Trp Pro Cys Ser Gly
145 150 155 160
Pro Leu Leu Arg Met Ala Glu Asp Ala Ala Arg Lys Leu Leu Pro Ala
165 170 175
Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val Asn Leu Leu Arg
180 185 190
Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr Ala Gly Val Gly
195 200 205
Thr Phe Ile Leu Glu Phe Ser Thr Leu Ser Arg Leu Thr Gly Asp Pro
210 215 220
Val Phe Glu Asn Val Ala Arg Lys Ala Leu Arg Ala Leu Trp Arg Thr
225 230 235 240
Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp Val Ile Thr Ser
245 250 255
Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly Val Asp Ser Tyr
260 265 270
Phe Glu Tyr Leu Val Arg Gly Ala Ile Met Leu Gln Asp Glu Glu Leu
275 280 285
Leu Thr Met Phe Tyr Glu Phe Asp Lys Ser Ile Lys Asn Tyr Thr Lys
290 295 300
Phe Asp Asp Trp Tyr Leu Trp Val Gln Met His Lys Gly Thr Val Ser
305 310 315 320
Met Pro Val Phe Gln Ser Leu Glu Ala Phe Trp Pro Gly Met Gln Ser
325 330 335
Leu Ile Gly Asp Ile Ser Ser Ala Thr Lys Ser Phe His Asn Tyr Tyr
340 345 350
Ser Val Trp Arg Gln Phe Gly Gly Leu Pro Glu Phe Tyr Ser Ile Pro
355 360 365
Gln Gly Tyr Thr Val Asp Lys Arg Glu Gly Tyr Pro Leu Arg Pro Glu
370 375 380
Leu Ile Glu Ser Ala Met Tyr Leu Tyr Lys Ala Thr Gly Asp Pro Ser
385 390 395 400
Phe Ile Gln Leu Gly Arg Asp Ala Val Glu Ser Ile Asp Arg Ile Ser
405 410 415
Arg Val Asn Cys Gly Phe Ala Thr Val Lys Asp Val Arg Asp His Lys
420 425 430
Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu Thr Ile Lys Tyr
435 440 445
Leu Tyr Leu Leu Phe Asp Pro Asp Asn Phe Leu His Asn Thr Gly Thr
450 455 460
Glu Phe Glu Leu Gly Gly Leu Arg Gly Asp Cys Ile Leu Ser Ala Gly
465 470 475 480
Gly Tyr Val Phe Asn Thr Glu Ala His Pro Leu Asp Pro Ala Ala Leu
485 490 495
His Cys Cys Ser Arg Glu Gln Gln Asp Arg Arg Glu Ile Gln Asp Ile
500 505 510
Leu Leu Ser Phe Ser Gln Pro His Thr Glu Glu Pro Ser Arg Asp Gln
515 520 525
Ser Ala Gly Gly Ser Pro Glu Ser Ile Ala Leu Lys Pro Gly Glu Gln
530 535 540
Arg Lys Ala Pro Val Leu Ser Cys Pro Thr Gln Pro Phe Ser Ala Lys
545 550 555 560
Leu Ala Val Met Gly Gln Val Phe Ser Asp Asn Ser
565 570
<210> 8
<211> 577
<212> PRT
<213> Artificial
<220>
<223> Consensus sequence
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> V or L
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> V or A
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> L or F
<220>
<221> MISC_FEATURE
<222> (26)..(26)
<223> D or E
<220>
<221> MISC_FEATURE
<222> (28)..(28)
<223> T or S
<220>
<221> MISC_FEATURE
<222> (57)..(57)
<223> Y or F
<220>
<221> MISC_FEATURE
<222> (91)..(91)
<223> T or V
<220>
<221> MISC_FEATURE
<222> (104)..(104)
<223> N or S
<220>
<221> MISC_FEATURE
<222> (220)..(220)
<223> V or L
<220>
<221> MISC_FEATURE
<222> (285)..(285)
<223> K or R
<220>
<221> MISC_FEATURE
<222> (292)..(292)
<223> H or R
<220>
<221> MISC_FEATURE
<222> (356)..(356)
<223> P or A
<220>
<221> MISC_FEATURE
<222> (442)..(442)
<223> H or D
<220>
<221> MISC_FEATURE
<222> (444)..(444)
<223> N or T
<220>
<221> MISC_FEATURE
<222> (456)..(456)
<223> S, T, or A
<220>
<221> MISC_FEATURE
<222> (458)..(458)
<223> M or I
<220>
<221> MISC_FEATURE
<222> (461)..(461)
<223> H or Y
<220>
<221> MISC_FEATURE
<222> (489)..(489)
<223> R or Q
<220>
<221> MISC_FEATURE
<222> (502)..(502)
<223> I or M
<220>
<221> MISC_FEATURE
<222> (503)..(503)
<223> K or R
<220>
<221> MISC_FEATURE
<222> (505)..(505)
<223> F or L
<220>
<221> MISC_FEATURE
<222> (506)..(506)
<223> Y or H
<220>
<221> MISC_FEATURE
<222> (509)..(509)
<223> K or R
<220>
<221> MISC_FEATURE
<222> (510)..(510)
<223> Q or R
<220>
<221> MISC_FEATURE
<222> (513)..(513)
<223> P or S
<220>
<221> MISC_FEATURE
<222> (514)..(516)
<223> KRA, RA, or KF
<220>
<221> MISC_FEATURE
<222> (518)..(518)
<223> R or K
<220>
<221> MISC_FEATURE
<222> (519)..(519)
<223> K or N
<220>
<221> MISC_FEATURE
<222> (522)..(522)
<223> R or S
<220>
<221> MISC_FEATURE
<222> (529)..(529)
<223> Q or P
<220>
<221> MISC_FEATURE
<222> (530)..(530)
<223> S or A
<220>
<221> MISC_FEATURE
<222> (531)..(531)
<223> G or R
<220>
<221> MISC_FEATURE
<222> (533)..(533)
<223> A or G
<220>
<221> MISC_FEATURE
<222> (534)..(534)
<223> T or S
<220>
<221> MISC_FEATURE
<222> (535)..(535)
<223> L or P
<220>
<221> MISC_FEATURE
<222> (536)..(536)
<223> S or F
<220>
<221> MISC_FEATURE
<222> (537)..(537)
<223> S or A
<220>
<221> MISC_FEATURE
<222> (539)..(540)
<223> AN, EN, GKQD, or ENHD
<220>
<221> MISC_FEATURE
<222> (542)..(542)
<223> P or A
<220>
<221> MISC_FEATURE
<222> (545)..(545)
<223> K or R
<220>
<221> MISC_FEATURE
<222> (546)..(546)
<223> Q or K
<220>
<221> MISC_FEATURE
<222> (549)..(549)
<223> Q, R, or K
<220>
<221> MISC_FEATURE
<222> (551)..(551)
<223> R or K
<220>
<221> MISC_FEATURE
<222> (552)..(552)
<223> T, A, or V
<400> 8
Met Pro Phe Arg Leu Leu Ile Pro Leu Gly Leu Xaa Cys Xaa Xaa Leu
1 5 10 15
Pro Leu His His Gly Ala Pro Gly Pro Xaa Gly Xaa Ala Pro Asp Pro
20 25 30
Ala His Tyr Arg Glu Arg Val Lys Ala Met Phe Tyr His Ala Tyr Asp
35 40 45
Ser Tyr Leu Glu Asn Ala Phe Pro Xaa Asp Glu Leu Arg Pro Leu Thr
50 55 60
Cys Asp Gly His Asp Thr Trp Gly Ser Phe Ser Leu Thr Leu Ile Asp
65 70 75 80
Ala Leu Asp Thr Leu Leu Ile Leu Gly Asn Xaa Ser Glu Phe Gln Arg
85 90 95
Val Val Glu Val Leu Gln Asp Xaa Val Asp Phe Asp Ile Asp Val Asn
100 105 110
Ala Ser Val Phe Glu Thr Asn Ile Arg Val Val Gly Gly Leu Leu Ser
115 120 125
Ala His Leu Leu Ser Lys Lys Ala Gly Val Glu Val Glu Ala Gly Trp
130 135 140
Pro Cys Ser Gly Pro Leu Leu Arg Met Ala Glu Glu Ala Ala Arg Lys
145 150 155 160
Leu Leu Pro Ala Phe Gln Thr Pro Thr Gly Met Pro Tyr Gly Thr Val
165 170 175
Asn Leu Leu His Gly Val Asn Pro Gly Glu Thr Pro Val Thr Cys Thr
180 185 190
Ala Gly Ile Gly Thr Phe Ile Val Glu Phe Ala Thr Leu Ser Ser Leu
195 200 205
Thr Gly Asp Pro Val Phe Glu Asp Val Ala Arg Xaa Ala Leu Met Arg
210 215 220
Leu Trp Glu Ser Arg Ser Asp Ile Gly Leu Val Gly Asn His Ile Asp
225 230 235 240
Val Leu Thr Gly Lys Trp Val Ala Gln Asp Ala Gly Ile Gly Ala Gly
245 250 255
Val Asp Ser Tyr Phe Glu Tyr Leu Val Lys Gly Ala Ile Leu Leu Gln
260 265 270
Asp Lys Lys Leu Met Ala Met Phe Leu Glu Tyr Asn Xaa Ala Ile Arg
275 280 285
Asn Tyr Thr Xaa Phe Asp Asp Trp Tyr Leu Trp Val Gln Met Tyr Lys
290 295 300
Gly Thr Val Ser Met Pro Val Phe Gln Ser Leu Glu Ala Tyr Trp Pro
305 310 315 320
Gly Leu Gln Ser Leu Ile Gly Asp Ile Asp Asn Ala Met Arg Thr Phe
325 330 335
Leu Asn Tyr Tyr Thr Val Trp Lys Gln Phe Gly Gly Leu Pro Glu Phe
340 345 350
Tyr Asn Ile Xaa Gln Gly Tyr Thr Val Glu Lys Arg Glu Gly Tyr Pro
355 360 365
Leu Arg Pro Glu Leu Ile Glu Ser Ala Met Tyr Leu Tyr Arg Ala Thr
370 375 380
Gly Asp Pro Thr Leu Leu Glu Leu Gly Arg Asp Ala Val Glu Ser Ile
385 390 395 400
Glu Lys Ile Ser Lys Val Glu Cys Gly Phe Ala Thr Ile Lys Asp Leu
405 410 415
Arg Asp His Lys Leu Asp Asn Arg Met Glu Ser Phe Phe Leu Ala Glu
420 425 430
Thr Val Lys Tyr Leu Tyr Leu Leu Phe Xaa Pro Xaa Asn Phe Ile His
435 440 445
Asn Asn Gly Ser Thr Phe Asp Xaa Val Xaa Thr Pro Xaa Gly Glu Cys
450 455 460
Ile Leu Gly Ala Gly Gly Tyr Ile Phe Asn Thr Glu Ala His Pro Ile
465 470 475 480
Asp Pro Ala Ala Leu His Cys Cys Xaa Arg Leu Lys Glu Glu Gln Trp
485 490 495
Glu Val Glu Asp Leu Xaa Xaa Glu Xaa Xaa Ser Leu Xaa Xaa Ser Arg
500 505 510
Xaa Xaa Xaa Xaa Gln Xaa Xaa Thr Val Xaa Ser Gly Pro Trp Glu Pro
515 520 525
Xaa Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Pro Xaa Xaa Gln Xaa Arg Glu
530 535 540
Xaa Xaa Pro Ala Xaa Gln Xaa Xaa Pro Leu Leu Ser Cys Pro Ser Gln
545 550 555 560
Pro Phe Thr Ser Lys Leu Ala Leu Leu Gly Gln Val Phe Leu Asp Ser
565 570 575
Ser
<210> 9
<211> 371
<212> PRT
<213> Mus musculus
<400> 9
Met Val Val Val Ala Ala Ala Pro Ser Ala Ala Thr Ala Ala Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ser Gly Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Gly Pro Arg Ala Ala Gly Ser Glu Ala Ser Gly Thr
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn His Lys Leu Gln Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Val Glu Asn Gln Glu Leu Arg Thr
115 120 125
Arg Leu Gly Met Asp Thr Leu Asp Pro Asp Glu Val Pro Glu Val Glu
130 135 140
Ala Lys Gly Ser Gly Val Arg Leu Val Ala Gly Ser Ala Glu Ser Ala
145 150 155 160
Ala Gly Ala Gly Pro Val Val Thr Ser Pro Glu His Leu Pro Met Asp
165 170 175
Ser Asp Thr Val Ala Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly
180 185 190
Ile Leu Asp Lys Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro
195 200 205
Glu Ser Ala Ser Leu Glu Glu Leu Pro Glu Val Tyr Pro Glu Gly Pro
210 215 220
Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala
225 230 235 240
Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Val Tyr Thr
245 250 255
Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Thr Asn
260 265 270
Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser Ser Ser Glu Glu Asp
275 280 285
His Pro Glu Phe Ile Val Ser Val Lys Lys Glu Pro Leu Glu Asp Asp
290 295 300
Phe Ile Pro Glu Leu Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys
305 310 315 320
Leu Arg Pro Pro Ser Cys Leu Leu Asp Ala His Ser Asp Cys Gly Tyr
325 330 335
Glu Gly Ser Pro Ser Pro Phe Ser Asp Met Ser Ser Pro Leu Gly Thr
340 345 350
Asp His Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu
355 360 365
Ile Ser Val
370
<210> 10
<211> 369
<212> PRT
<213> Cricetulus griseus
<400> 10
Met Val Val Val Ala Ala Ser Pro Ser Ala Ala Thr Ala Ala Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ala Asp Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Gly Ser Arg Ala Ala Gly Ser Glu Ala Asn Gly Ala
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn Gln Lys Leu Leu Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Ile Glu Asn Gln Glu Leu Arg Thr
115 120 125
Arg Leu Gly Met Asp Val Leu Thr Thr Glu Glu Ala Pro Glu Thr Glu
130 135 140
Ser Lys Gly Asn Gly Val Arg Pro Val Ala Gly Ser Ala Glu Ser Ala
145 150 155 160
Ala Gly Ala Gly Pro Val Val Thr Ser Pro Glu His Leu Pro Met Asp
165 170 175
Ser Asp Thr Val Asp Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly
180 185 190
Ile Leu Asp Lys Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro
195 200 205
Glu Ser Ala Asn Leu Glu Glu Leu Pro Glu Val Tyr Pro Gly Pro Ser
210 215 220
Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala Lys
225 230 235 240
Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Val Tyr Thr Lys
245 250 255
Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Thr Asn Val
260 265 270
Val Val Lys Ile Glu Glu Ala Pro Leu Ser Ser Ser Glu Glu Asp His
275 280 285
Pro Glu Phe Ile Val Ser Val Lys Lys Glu Pro Glu Glu Asp Phe Ile
290 295 300
Pro Glu Pro Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys Leu Lys
305 310 315 320
Pro Ser Ser Cys Leu Leu Asp Ala Tyr Ser Asp Cys Gly Tyr Glu Gly
325 330 335
Ser Pro Ser Pro Phe Ser Asp Met Ser Ser Pro Leu Gly Ile Asp His
340 345 350
Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu Ile Ser
355 360 365
Val
<210> 11
<211> 376
<212> PRT
<213> Homo sapiens
<400> 11
Met Val Val Val Ala Ala Ala Pro Asn Pro Ala Asp Gly Thr Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Ser Ala Ala Gly Ala Pro Ala
20 25 30
Gly Gln Ala Leu Pro Leu Met Val Pro Ala Gln Arg Gly Ala Ser Pro
35 40 45
Glu Ala Ala Ser Gly Gly Leu Pro Gln Ala Arg Lys Arg Gln Arg Leu
50 55 60
Thr His Leu Ser Pro Glu Glu Lys Ala Leu Arg Arg Lys Leu Lys Asn
65 70 75 80
Arg Val Ala Ala Gln Thr Ala Arg Asp Arg Lys Lys Ala Arg Met Ser
85 90 95
Glu Leu Glu Gln Gln Val Val Asp Leu Glu Glu Glu Asn Gln Lys Leu
100 105 110
Leu Leu Glu Asn Gln Leu Leu Arg Glu Lys Thr His Gly Leu Val Val
115 120 125
Glu Asn Gln Glu Leu Arg Gln Arg Leu Gly Met Asp Ala Leu Val Ala
130 135 140
Glu Glu Glu Ala Glu Ala Lys Gly Asn Glu Val Arg Pro Val Ala Gly
145 150 155 160
Ser Ala Glu Ser Ala Ala Gly Ala Gly Pro Val Val Thr Pro Pro Glu
165 170 175
His Leu Pro Met Asp Ser Gly Gly Ile Asp Ser Ser Asp Ser Glu Ser
180 185 190
Asp Ile Leu Leu Gly Ile Leu Asp Asn Leu Asp Pro Val Met Phe Phe
195 200 205
Lys Cys Pro Ser Pro Glu Pro Ala Ser Leu Glu Glu Leu Pro Glu Val
210 215 220
Tyr Pro Glu Gly Pro Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val
225 230 235 240
Gly Thr Ser Ser Ala Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe
245 250 255
Asp His Ile Tyr Thr Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr
260 265 270
Glu Ser Gln Ala Asn Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser
275 280 285
Pro Ser Glu Asn Asp His Pro Glu Phe Ile Val Ser Val Lys Glu Glu
290 295 300
Pro Val Glu Asp Asp Leu Val Pro Glu Leu Gly Ile Ser Asn Leu Leu
305 310 315 320
Ser Ser Ser His Cys Pro Lys Pro Ser Ser Cys Leu Leu Asp Ala Tyr
325 330 335
Ser Asp Cys Gly Tyr Gly Gly Ser Leu Ser Pro Phe Ser Asp Met Ser
340 345 350
Ser Leu Leu Gly Val Asn His Ser Trp Glu Asp Thr Phe Ala Asn Glu
355 360 365
Leu Phe Pro Gln Leu Ile Ser Val
370 375
<210> 12
<211> 383
<212> PRT
<213> Danio rerio
<400> 12
Met Val Val Val Thr Ala Gly Thr Gly Gly Ala His Lys Val Leu Leu
1 5 10 15
Ile Ser Gly Lys Gln Ser Ala Ser Thr Gly Ala Thr Gln Gly Gly Tyr
20 25 30
Ser Arg Ser Ile Ser Val Met Ile Pro Asn Gln Ala Ser Ser Asp Ser
35 40 45
Asp Ser Thr Thr Ser Gly Pro Pro Leu Arg Lys Arg Gln Arg Leu Thr
50 55 60
His Leu Ser Pro Glu Glu Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg
65 70 75 80
Val Ala Ala Gln Thr Ala Arg Asp Arg Lys Lys Ala Lys Met Gly Glu
85 90 95
Leu Glu Gln Gln Val Leu Glu Leu Glu Leu Glu Asn Gln Lys Leu His
100 105 110
Val Glu Asn Arg Leu Leu Arg Asp Lys Thr Ser Asp Leu Leu Ser Glu
115 120 125
Asn Glu Glu Leu Arg Gln Arg Leu Gly Leu Asp Thr Leu Glu Thr Lys
130 135 140
Glu Gln Val Gln Val Leu Glu Ser Ala Val Ser Asp Leu Gly Leu Val
145 150 155 160
Thr Gly Ser Ser Glu Ser Ala Ala Gly Ala Gly Pro Ala Val Pro Lys
165 170 175
Ser Glu Asp Phe Thr Met Asp Thr His Ser Pro Gly Pro Ala Asp Ser
180 185 190
Glu Ser Asp Leu Leu Leu Gly Ile Leu Asp Ile Leu Asp Pro Glu Leu
195 200 205
Phe Leu Lys Thr Asp Leu Pro Glu Ala Gln Glu Pro Gln Gln Glu Leu
210 215 220
Val Leu Val Gly Gly Ala Gly Glu Gln Val Pro Ser Ser Ala Pro Ala
225 230 235 240
Ala Leu Gly Pro Ala Pro Val Lys Leu Glu Ala Leu Asn Glu Leu Ile
245 250 255
His Phe Asp His Ile Tyr Thr Lys Pro Ala Glu Val Leu Val Ser Glu
260 265 270
Glu Ser Ile Cys Glu Val Lys Ala Glu Asp Ser Val Ala Phe Ser Glu
275 280 285
Thr Glu Glu Glu Ile Gln Val Glu Asp Gln Thr Val Ser Val Lys Asp
290 295 300
Glu Pro Glu Glu Val Val Ile Pro Ala Glu Asn Gln Asn Pro Asp Ala
305 310 315 320
Ala Asp Asp Phe Leu Ser Asp Thr Ser Phe Gly Gly Tyr Glu Lys Ala
325 330 335
Ser Tyr Leu Thr Asp Ala Tyr Ser Asp Ser Gly Tyr Glu Arg Ser Pro
340 345 350
Ser Pro Phe Ser Asn Ile Ser Ser Pro Leu Cys Ser Glu Gly Ser Trp
355 360 365
Asp Asp Met Phe Ala Ser Glu Leu Phe Pro Gln Leu Ile Ser Val
370 375 380
<210> 13
<211> 371
<212> PRT
<213> Artificial
<220>
<223> consensus sequence
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> A or S
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> S or N
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> A or P
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> T or D
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> A or G
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> A or T
<220>
<221> MISC_FEATURE
<222> (26)..(26)
<223> S or A
<220>
<221> misc_feature
<222> (27)..(27)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (29)..(29)
<223> R or Q
<220>
<221> MISC_FEATURE
<222> (37)..(37)
<223> G or A
<220>
<221> misc_feature
<222> (38)..(38)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (40)..(40)
<223> A or G
<220>
<221> MISC_FEATURE
<222> (46)..(46)
<223> S or N, or ASG
<220>
<221> MISC_FEATURE
<222> (48)..(48)
<223> T, A, or L
<220>
<221> MISC_FEATURE
<222> (103)..(103)
<223> H or Q
<220>
<221> MISC_FEATURE
<222> (106)..(106)
<223> Q or L
<220>
<221> MISC_FEATURE
<222> (121)..(121)
<223> V or I
<220>
<221> MISC_FEATURE
<222> (128)..(128)
<223> T or Q
<220>
<221> MISC_FEATURE
<222> (134)..(134)
<223> T, V, or A
<220>
<221> MISC_FEATURE
<222> (136)..(136)
<223> D, T, or V
<220>
<221> MISC_FEATURE
<222> (137)..(137)
<223> P, T, or A
<220>
<221> MISC_FEATURE
<222> (138)..(138)
<223> D or E
<220>
<221> MISC_FEATURE
<222> (140)..(140)
<223> V, A, or none
<220>
<221> MISC_FEATURE
<222> (141)..(141)
<223> P or none
<220>
<221> MISC_FEATURE
<222> (143)..(143)
<223> V, T, or A
<220>
<221> MISC_FEATURE
<222> (145)..(145)
<223> A or S
<220>
<221> MISC_FEATURE
<222> (148)..(148)
<223> S or N
<220>
<221> MISC_FEATURE
<222> (149)..(149)
<223> G or E
<220>
<221> MISC_FEATURE
<222> (152)..(152)
<223> L or P
<220>
<221> MISC_FEATURE
<222> (169)..(169)
<223> S or P
<220>
<221> MISC_FEATURE
<222> (178)..(178)
<223> D or G
<220>
<221> MISC_FEATURE
<222> (179)..(179)
<223> T or G
<220>
<221> MISC_FEATURE
<222> (180)..(180)
<223> V or I
<220>
<221> MISC_FEATURE
<222> (181)..(181)
<223> A or D
<220>
<221> MISC_FEATURE
<222> (196)..(196)
<223> K or N
<220>
<221> MISC_FEATURE
<222> (210)..(210)
<223> S or P
<220>
<221> MISC_FEATURE
<222> (212)..(212)
<223> S or N
<220>
<221> MISC_FEATURE
<222> (222)..(222)
<223> E or none
<220>
<221> MISC_FEATURE
<222> (254)..(254)
<223> V or I
<220>
<221> MISC_FEATURE
<222> (271)..(271)
<223> T or A
<220>
<221> MISC_FEATURE
<222> (284)..(284)
<223> S or P
<220>
<221> MISC_FEATURE
<222> (287)..(287)
<223> E or N
<220>
<221> MISC_FEATURE
<222> (298)..(298)
<223> K or E
<220>
<221> MISC_FEATURE
<222> (301)..(301)
<223> L, V, or none
<220>
<221> MISC_FEATURE
<222> (303)..(303)
<223> D or E
<220>
<221> MISC_FEATURE
<222> (305)..(305)
<223> F or L
<220>
<221> MISC_FEATURE
<222> (306)..(306)
<223> I or V
<220>
<221> MISC_FEATURE
<222> (309)..(309)
<223> L or P
<220>
<221> MISC_FEATURE
<222> (321)..(321)
<223> L or P
<220>
<221> MISC_FEATURE
<222> (322)..(322)
<223> R or K
<220>
<221> MISC_FEATURE
<222> (324)..(324)
<223> P or S
<220>
<221> MISC_FEATURE
<222> (331)..(331)
<223> H or Y
<220>
<221> MISC_FEATURE
<222> (337)..(337)
<223> E or G
<220>
<221> MISC_FEATURE
<222> (340)..(340)
<223> P or L
<220>
<221> MISC_FEATURE
<222> (349)..(349)
<223> P or L
<220>
<221> MISC_FEATURE
<222> (352)..(352)
<223> T, I, or V
<220>
<221> MISC_FEATURE
<222> (353)..(353)
<223> D or N
<400> 13
Met Val Val Val Ala Ala Xaa Pro Xaa Xaa Ala Xaa Xaa Xaa Pro Lys
1 5 10 15
Val Leu Leu Leu Ser Gly Gln Pro Ala Xaa Xaa Gly Arg Ala Leu Pro
20 25 30
Leu Met Val Pro Xaa Xaa Arg Xaa Ala Gly Ser Glu Ala Xaa Gly Xaa
35 40 45
Pro Gln Ala Arg Lys Arg Gln Arg Leu Thr His Leu Ser Pro Glu Glu
50 55 60
Lys Ala Leu Arg Arg Lys Leu Lys Asn Arg Val Ala Ala Gln Thr Ala
65 70 75 80
Arg Asp Arg Lys Lys Ala Arg Met Ser Glu Leu Glu Gln Gln Val Val
85 90 95
Asp Leu Glu Glu Glu Asn Xaa Lys Leu Xaa Leu Glu Asn Gln Leu Leu
100 105 110
Arg Glu Lys Thr His Gly Leu Val Xaa Glu Asn Gln Glu Leu Arg Xaa
115 120 125
Arg Leu Gly Met Asp Xaa Leu Asp Xaa Xaa Glu Xaa Xaa Glu Xaa Glu
130 135 140
Xaa Lys Gly Xaa Xaa Val Arg Xaa Val Ala Gly Ser Ala Glu Ser Ala
145 150 155 160
Ala Gly Ala Gly Pro Val Val Thr Xaa Pro Glu His Leu Pro Met Asp
165 170 175
Ser Xaa Xaa Xaa Xaa Ser Ser Asp Ser Glu Ser Asp Ile Leu Leu Gly
180 185 190
Ile Leu Asp Xaa Leu Asp Pro Val Met Phe Phe Lys Cys Pro Ser Pro
195 200 205
Glu Xaa Ala Xaa Leu Glu Glu Leu Pro Glu Val Tyr Pro Xaa Gly Pro
210 215 220
Ser Ser Leu Pro Ala Ser Leu Ser Leu Ser Val Gly Thr Ser Ser Ala
225 230 235 240
Lys Leu Glu Ala Ile Asn Glu Leu Ile Arg Phe Asp His Xaa Tyr Thr
245 250 255
Lys Pro Leu Val Leu Glu Ile Pro Ser Glu Thr Glu Ser Gln Xaa Asn
260 265 270
Val Val Val Lys Ile Glu Glu Ala Pro Leu Ser Xaa Ser Glu Xaa Asp
275 280 285
His Pro Glu Phe Ile Val Ser Val Lys Xaa Glu Pro Xaa Glu Xaa Asp
290 295 300
Xaa Xaa Pro Glu Xaa Gly Ile Ser Asn Leu Leu Ser Ser Ser His Cys
305 310 315 320
Xaa Xaa Pro Xaa Ser Cys Leu Leu Asp Ala Xaa Ser Asp Cys Gly Tyr
325 330 335
Xaa Gly Ser Xaa Ser Pro Phe Ser Asp Met Ser Ser Xaa Leu Gly Xaa
340 345 350
Xaa His Ser Trp Glu Asp Thr Phe Ala Asn Glu Leu Phe Pro Gln Leu
355 360 365
Ile Ser Val
370
<210> 14
<211> 7686
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 14
aagcttatac tcgagctcta gattgggaac ccgggtctct cgaattcgat gccttttaga 60
ctcctgatac cattgggtct tgtttgcgtt ctcctccctc tccatcacgg cgccccaggt 120
ccagacggta ccgcacctga tcctgcccat taccgcgaac gcgttaaagc catgttctac 180
cacgcctatg actcctatct ggaaaatgca ttcccctatg atgagctccg accccttacc 240
tgcgatggtc atgatacttg gggctctttt tcccttaccc ttattgacgc tctggacaca 300
ctccttatcc tcggaaacac cagcgaattt caaagagtag ttgaagtact tcaggacaat 360
gtcgactttg acatcgatgt gaacgcatca gttttcgaaa caaatataag agtcgttgga 420
ggtctgctct ccgcccacct tctctctaaa aaagccggag tagaagttga agctggctgg 480
ccctgctccg gacccctcct tcgtatggct gaagaagctg cccgcaaact ccttcccgct 540
tttcagaccc caaccggtat gccctatggt actgttaacc tcctgcacgg agtaaatccc 600
ggcgaaaccc ccgtcacatg tacagccgga attggaacct ttattgtgga atttgcaacc 660
cttagcagcc tgaccggaga tcctgtattc gaagacgtgg ctcgggttgc cctgatgcga 720
ctgtgggaat ccaggtctga tatcggtctg gtcggtaacc atatagacgt actcactggt 780
aaatgggttg cacaagacgc tggaattggg gcaggcgtgg attcttattt tgaatatctc 840
gtaaaagggg ccatactctt gcaggacaaa aaacttatgg ctatgttcct ggaatataac 900
aaagctatta ggaactacac acacttcgat gattggtatt tgtgggtcca aatgtataaa 960
ggaaccgttt ctatgcctgt ctttcagtca ctggaggctt attggcctgg tctgcaatcc 1020
ctgatcggag acattgacaa tgcaatgagg acattcctta attattacac tgtttggaag 1080
cagttcggcg gattgcccga attttacaac attcctcaag gctatacagt tgaaaaaaga 1140
gaaggatatc ccctgcgccc cgagcttatt gaaagcgcta tgtatctgta tcgtgcaaca 1200
ggtgatccaa ccctgcttga actgggacga gacgccgtcg aatcaatcga gaaaatttca 1260
aaagtggaat gcggctttgc aacaattaaa gatcttagag accacaaact ggataatcgc 1320
atggagtcat tctttttggc tgagaccgtc aagtatctgt atctgctttt tcatcccaac 1380
aacttcatcc ataataacgg gtccaccttc gattcagtca tgacccctca cggtgaatgc 1440
atactcggag ctggaggcta tatttttaac actgaagctc acccaattga cccagctgcc 1500
cttcattgtt gtcgacgtct gaaagaagaa caatgggagg ttgaagattt gatcaaagaa 1560
ttttactcac ttaaacaaag tcgacctaaa cgcgcacaga gaaaaactgt aagatctggt 1620
ccttgggaac ctcagtccgg cccagcaact ctttcatccc ccgccaacca accacgagaa 1680
aaacaaccag cccaacagag aacccccctg ctcagctgcc cctctcagcc cttcacttca 1740
aaactcgccc tgcttggaca ggtgtttctg gactcctctt gatttaaaca cgcggccgct 1800
aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc cacacctccc 1860
cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta ttgcagctta 1920
taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact 1980
gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct accggtaggg 2040
cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 2100
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 2160
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 2220
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 2280
cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt tcggtgtagg 2340
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 2400
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 2460
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 2520
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 2580
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 2640
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 2700
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 2760
ggattttggt catgggcgcg cctcatactc ctgcaggcat gagattatca aaaaggatct 2820
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 2880
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 2940
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 3000
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 3060
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 3120
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 3180
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 3240
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 3300
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 3360
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 3420
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 3480
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 3540
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 3600
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 3660
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 3720
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 3780
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 3840
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtcaggtacc 3900
aagcctaggc ctccaaaaaa gcctcctcac tacttctgga atagctcaga ggcagaggcg 3960
gcctcggcct ctgcataaat aaaaaaaatt agtcagccat ggggcggaga atgggcggaa 4020
ctgggcggag ttaggggcgg gatgggcgga gttaggggcg ggactatggt tgctgactaa 4080
ttgagatgca tgctttgcat acttctgcct gctggggagc ctggggactt tccacacctg 4140
gttgctgact aattgagatg catgctttgc atacttctgc ctgctgggga gcctggggac 4200
tttccacacc ggatccacca tgggatcggc cattgaacaa gatggattgc acgcaggttc 4260
tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 4320
ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 4380
cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 4440
cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 4500
gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 4560
gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 4620
cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 4680
tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 4740
cgccaggctc aaggcgcgca tgcccgacgg cgatgatctc gtcgtgaccc atggcgatgc 4800
ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 4860
gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 4920
gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 4980
gcagcgcatc gccttctatc gccttcttga cgagttcttc tgaacgcgtg ctgtaagtct 5040
gcagaaattg atgatctatt aaacaataaa gatgtccact aaaatggaag tttttcctgt 5100
catactttgt taagaagggt gagaacagag tacctacatt ttgaatggaa ggattggagc 5160
tacgggggtg ggggtggggt gggattagat aaatgcctgc tctttactga aggctcttta 5220
ctattgcttt atgataatgt ttcatagttg gatatcataa tttaaacaag caaaaccaaa 5280
ttaagggcca gctcattcct cccactcatg atctatggat ctatagatct ctcgtgcagc 5340
tggggctcta gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg 5400
gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct 5460
ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg 5520
ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 5580
ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg 5640
gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc 5700
tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat 5760
gagctgattt aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt cagttagtcg 5820
cgaggcctcc gcgccgggtt ttggcgcctc ccgcgggcgc ccccctcctc acggcgagcg 5880
ctgccacgtc agacgaaggg cgcagcgagc gtcctgatcc ttccgcccgg acgctcagga 5940
cagcggcccg ctgctcataa gactcggcct tagaacccca gtatcagcag aaggacattt 6000
taggacggga cttgggtgac tctagggcac tggttttctt tccagagagc ggaacaggcg 6060
aggaaaagta gtcccttctc ggcgattctg cggagggatc tccgtggggc ggtgaacgcc 6120
gatgattata taaggacgcg ccgggtgtgg cacagctagt tccgtcgcag ccgggatttg 6180
ggtcgcggtt cttgtttgtg gatcgctgtg atcgtcactt ggtgagtagc gggctgctgg 6240
gctggccggg gctttcgtgg ccgccgggcc gctcggtggg acggaagcgt gtggagagac 6300
cgccaagggc tgtagtctgg gtccgcgagc aaggttgccc tgaactgggg gttgggggga 6360
gcgcagcaaa atggcggctg ttcccgagtc ttgaatggaa gacgcttgtg aggcgggctg 6420
tgaggtcgtt gaaacaaggt ggggggcatg gtgggcggca agaacccaag gtcttgaggc 6480
cttcgctaat gcgggaaagc tcttattcgg gtgagatggg ctggggcacc atctggggac 6540
cctgacgtga agtttgtcac tgactggaga actcggtttg tcgtctgttg cgggggcggc 6600
agttatggcg gtgccgttgg gcagtgcacc cgtacctttg ggagcgcgcg ccctcgtcgt 6660
gtcgtgacgt cacccgttct gttggcttat aatgcagggt ggggccacct gccggtaggt 6720
gtgcggtagg cttttctccg tcgcaggacg cagggttcgg gcctagggta ggctctcctg 6780
aatcgacagg cgccggacct ctggtgaggg gagggataag tgaggcgtca gtttctttgg 6840
tcggttttat gtacctatct tcttaagtag ctgaagctcc ggttttgaac tatgcgctcg 6900
gggttggcga gtgtgttttg tgaagttttt taggcacctt ttgaaatgta atcatttggg 6960
tcaatatgta attttcagtg ttagactagt aaattgtccg ctaaattctg gccgtttttg 7020
gcttttttgt tagacgtcga ccgatcctga gaacttcagg gtgagtttgg ggacccttga 7080
ttgttctttc tttttcgcta ttgtaaaatt catgttatat ggagggggca aagttttcag 7140
ggtgttgttt agaatgggaa gatgtccctt gtatcaccat ggaccctcat gataattttg 7200
tttctttcac tttctactct gttgacaacc attgtctcct cttattttct tttcattttc 7260
tgtaactttt tcgttaaact ttagcttgca tttgtaacga atttttaaat tcacttttgt 7320
ttatttgtca gattgtaagt actttctcta atcacttttt tttcaaggca atcagggtat 7380
attatattgt acttcagcac agttttagag aacaattgtt ataattaaat gataaggtag 7440
aatatttctg catataaatt ctggctggcg tggaaatatt cttattggta gaaacaacta 7500
caccctggtc atcatcctgc ctttctcttt atggttacaa tgatatacac tgtttgagat 7560
gaggataaaa tactctgagt ccaaaccggg cccctctgct aaccatgttc atgccttctt 7620
ctctttccta cagctcctgg gcaacgtgct ggttgttgtg ctgtctcatc attttggcaa 7680
agaatt 7686
<210> 15
<211> 7257
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 15
aagcttatac tcgagctcta gattgggaac ccgggtctct cgaattcgat gccttttaga 60
ctcctgatac cattgggtct tgtttgcgtt ctcctccctc tccatcacgg cgccccaggt 120
ccagacggta ccgcacctga tcctgcccat taccgcgaac gcgttaaagc catgttctac 180
cacgcctatg actcctatct ggaaaatgca ttcccctatg atgagctccg accccttacc 240
tgcgatggtc atgatacttg gggctctttt tcccttaccc ttattgacgc tctggacaca 300
ctccttatcc tcggaaacac cagcgaattt caaagagtag ttgaagtact tcaggacaat 360
gtcgactttg acatcgatgt gaacgcatca gttttcgaaa caaatataag agtcgttgga 420
ggtctgctct ccgcccacct tctctctaaa aaagccggag tagaagttga agctggctgg 480
ccctgctccg gacccctcct tcgtatggct gaagaagctg cccgcaaact ccttcccgct 540
tttcagaccc caaccggtat gccctatggt actgttaacc tcctgcacgg agtaaatccc 600
ggcgaaaccc ccgtcacatg tacagccgga attggaacct ttattgtgga atttgcaacc 660
cttagcagcc tgaccggaga tcctgtattc gaagacgtgg ctcgggttgc cctgatgcga 720
ctgtgggaat ccaggtctga tatcggtctg gtcggtaacc atatagacgt actcactggt 780
aaatgggttg cacaagacgc tggaattggg gcaggcgtgg attcttattt tgaatatctc 840
gtaaaagggg ccatactctt gcaggacaaa aaacttatgg ctatgttcct ggaatataac 900
aaagctatta ggaactacac acacttcgat gattggtatt tgtgggtcca aatgtataaa 960
ggaaccgttt ctatgcctgt ctttcagtca ctggaggctt attggcctgg tctgcaatcc 1020
ctgatcggag acattgacaa tgcaatgagg acattcctta attattacac tgtttggaag 1080
cagttcggcg gattgcccga attttacaac attcctcaag gctatacagt tgaaaaaaga 1140
gaaggatatc ccctgcgccc cgagcttatt gaaagcgcta tgtatctgta tcgtgcaaca 1200
ggtgatccaa ccctgcttga actgggacga gacgccgtcg aatcaatcga gaaaatttca 1260
aaagtggaat gcggctttgc aacaattaaa gatcttagag accacaaact ggataatcgc 1320
atggagtcat tctttttggc tgagaccgtc aagtatctgt atctgctttt tcatcccaac 1380
aacttcatcc ataataacgg gtccaccttc gattcagtca tgacccctca cggtgaatgc 1440
atactcggag ctggaggcta tatttttaac actgaagctc acccaattga cccagctgcc 1500
cttcattgtt gtcgacgtct gaaagaagaa caatgggagg ttgaagattt gatcaaagaa 1560
ttttactcac ttaaacaaag tcgacctaaa cgcgcacaga gaaaaactgt aagatctggt 1620
ccttgggaac ctcagtccgg cccagcaact ctttcatccc ccgccaacca accacgagaa 1680
aaacaaccag cccaacagag aacccccctg ctcagctgcc cctctcagcc cttcacttca 1740
aaactcgccc tgcttggaca ggtgtttctg gactcctctt gatttaaaca cgcggccgct 1800
aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc cacacctccc 1860
cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta ttgcagctta 1920
taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact 1980
gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct accggtaggg 2040
cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 2100
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 2160
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 2220
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 2280
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 2340
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 2400
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 2460
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 2520
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 2580
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 2640
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 2700
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 2760
ggattttggt catgggcgcg cctcatactc ctgcaggcat gagattatca aaaaggatct 2820
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 2880
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 2940
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 3000
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 3060
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 3120
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 3180
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 3240
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 3300
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 3360
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 3420
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 3480
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 3540
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 3600
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 3660
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 3720
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 3780
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 3840
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtcaggtacc 3900
aagcctaggc ctccaaaaaa gcctcctcac tacttctgga atagctcaga ggcagaggcg 3960
gcctcggcct ctgcataaat aaaaaaaatt agtcagccat ggggcggaga atgggcggaa 4020
ctgggcggag ttaggggcgg gatgggcgga gttaggggcg ggactatggt tgctgactaa 4080
ttgagatgca tgctttgcat acttctgcct gctggggagc ctggggactt tccacacctg 4140
gttgctgact aattgagatg catgctttgc atacttctgc ctgctgggga gcctggggac 4200
tttccacacc ggatccacca tggccaagtt gaccagtgcc gttccggtgc tcaccgcgcg 4260
cgacgtcgcc ggagcggtcg agttctggac cgaccggctc gggttctccc gggacttcgt 4320
ggaggacgac ttcgccggtg tggtccggga cgacgtgacc ctgttcatca gcgcggtcca 4380
ggaccaggtg gtgccggaca acaccctggc ctgggtgtgg gtgcgcggcc tggacgagct 4440
gtacgccgag tggtcggagg tcgtgtccac gaacttccgg gacgcctccg ggccggccat 4500
gaccgagatc ggcgagcagc cgtgggggcg ggagttcgcc ctgcgcgacc cggccggcaa 4560
ctgcgtgcac ttcgtggccg aggagcagga ctgaacgcgt gctgtaagtc tgcagaaatt 4620
gatgatctat taaacaataa agatgtccac taaaatggaa gtttttcctg tcatactttg 4680
ttaagaaggg tgagaacaga gtacctacat tttgaatgga aggattggag ctacgggggt 4740
gggggtgggg tgggattaga taaatgcctg ctctttactg aaggctcttt actattgctt 4800
tatgataatg tttcatagtt ggatatcata atttaaacaa gcaaaaccaa attaagggcc 4860
agctcattcc tcccactcat gatctatgga tctatagatc tctcgtgcag ctggggctct 4920
agggggtatc cccacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 4980
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5040
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5100
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5160
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5220
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5280
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5340
taacaaaaat ttaacgcgaa ttaattctgt ggaatgtgtg tcagttagtc gcgaggcctc 5400
cgcgccgggt tttggcgcct cccgcgggcg cccccctcct cacggcgagc gctgccacgt 5460
cagacgaagg gcgcagcgag cgtcctgatc cttccgcccg gacgctcagg acagcggccc 5520
gctgctcata agactcggcc ttagaacccc agtatcagca gaaggacatt ttaggacggg 5580
acttgggtga ctctagggca ctggttttct ttccagagag cggaacaggc gaggaaaagt 5640
agtcccttct cggcgattct gcggagggat ctccgtgggg cggtgaacgc cgatgattat 5700
ataaggacgc gccgggtgtg gcacagctag ttccgtcgca gccgggattt gggtcgcggt 5760
tcttgtttgt ggatcgctgt gatcgtcact tggtgagtag cgggctgctg ggctggccgg 5820
ggctttcgtg gccgccgggc cgctcggtgg gacggaagcg tgtggagaga ccgccaaggg 5880
ctgtagtctg ggtccgcgag caaggttgcc ctgaactggg ggttgggggg agcgcagcaa 5940
aatggcggct gttcccgagt cttgaatgga agacgcttgt gaggcgggct gtgaggtcgt 6000
tgaaacaagg tggggggcat ggtgggcggc aagaacccaa ggtcttgagg ccttcgctaa 6060
tgcgggaaag ctcttattcg ggtgagatgg gctggggcac catctgggga ccctgacgtg 6120
aagtttgtca ctgactggag aactcggttt gtcgtctgtt gcgggggcgg cagttatggc 6180
ggtgccgttg ggcagtgcac ccgtaccttt gggagcgcgc gccctcgtcg tgtcgtgacg 6240
tcacccgttc tgttggctta taatgcaggg tggggccacc tgccggtagg tgtgcggtag 6300
gcttttctcc gtcgcaggac gcagggttcg ggcctagggt aggctctcct gaatcgacag 6360
gcgccggacc tctggtgagg ggagggataa gtgaggcgtc agtttctttg gtcggtttta 6420
tgtacctatc ttcttaagta gctgaagctc cggttttgaa ctatgcgctc ggggttggcg 6480
agtgtgtttt gtgaagtttt ttaggcacct tttgaaatgt aatcatttgg gtcaatatgt 6540
aattttcagt gttagactag taaattgtcc gctaaattct ggccgttttt ggcttttttg 6600
ttagacgtcg accgatcctg agaacttcag ggtgagtttg gggacccttg attgttcttt 6660
ctttttcgct attgtaaaat tcatgttata tggagggggc aaagttttca gggtgttgtt 6720
tagaatggga agatgtccct tgtatcacca tggaccctca tgataatttt gtttctttca 6780
ctttctactc tgttgacaac cattgtctcc tcttattttc ttttcatttt ctgtaacttt 6840
ttcgttaaac tttagcttgc atttgtaacg aatttttaaa ttcacttttg tttatttgtc 6900
agattgtaag tactttctct aatcactttt ttttcaaggc aatcagggta tattatattg 6960
tacttcagca cagttttaga gaacaattgt tataattaaa tgataaggta gaatatttct 7020
gcatataaat tctggctggc gtggaaatat tcttattggt agaaacaact acaccctggt 7080
catcatcctg cctttctctt tatggttaca atgatataca ctgtttgaga tgaggataaa 7140
atactctgag tccaaaccgg gcccctctgc taaccatgtt catgccttct tctctttcct 7200
acagctcctg ggcaacgtgc tggttgttgt gctgtctcat cattttggca aagaatt 7257
<210> 16
<211> 3892
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 16
aggcctccgc gccgggtttt ggcgcctccc gcgggcgccc ccctcctcac ggcgagcgct 60
gccacgtcag acgaagggcg cagcgagcgt cctgatcctt ccgcccggac gctcaggaca 120
gcggcccgct gctcataaga ctcggcctta gaaccccagt atcagcagaa ggacatttta 180
ggacgggact tgggtgactc tagggcactg gttttctttc cagagagcgg aacaggcgag 240
gaaaagtagt cccttctcgg cgattctgcg gagggatctc cgtggggcgg tgaacgccga 300
tgattatata aggacgcgcc gggtgtggca cagctagttc cgtcgcagcc gggatttggg 360
tcgcggttct tgtttgtgga tcgctgtgat cgtcacttgg tgagtagcgg gctgctgggc 420
tggccggggc tttcgtggcc gccgggccgc tcggtgggac ggaagcgtgt ggagagaccg 480
ccaagggctg tagtctgggt ccgcgagcaa ggttgccctg aactgggggt tggggggagc 540
gcagcaaaat ggcggctgtt cccgagtctt gaatggaaga cgcttgtgag gcgggctgtg 600
aggtcgttga aacaaggtgg ggggcatggt gggcggcaag aacccaaggt cttgaggcct 660
tcgctaatgc gggaaagctc ttattcgggt gagatgggct ggggcaccat ctggggaccc 720
tgacgtgaag tttgtcactg actggagaac tcggtttgtc gtctgttgcg ggggcggcag 780
ttatggcggt gccgttgggc agtgcacccg tacctttggg agcgcgcgcc ctcgtcgtgt 840
cgtgacgtca cccgttctgt tggcttataa tgcagggtgg ggccacctgc cggtaggtgt 900
gcggtaggct tttctccgtc gcaggacgca gggttcgggc ctagggtagg ctctcctgaa 960
tcgacaggcg ccggacctct ggtgagggga gggataagtg aggcgtcagt ttctttggtc 1020
ggttttatgt acctatcttc ttaagtagct gaagctccgg ttttgaacta tgcgctcggg 1080
gttggcgagt gtgttttgtg aagtttttta ggcacctttt gaaatgtaat catttgggtc 1140
aatatgtaat tttcagtgtt agactagtaa attgtccgct aaattctggc cgtttttggc 1200
ttttttgtta gacgtcgacc gatcctgaga acttcagggt gagtttgggg acccttgatt 1260
gttctttctt tttcgctatt gtaaaattca tgttatatgg agggggcaaa gttttcaggg 1320
tgttgtttag aatgggaaga tgtcccttgt atcaccatgg accctcatga taattttgtt 1380
tctttcactt tctactctgt tgacaaccat tgtctcctct tattttcttt tcattttctg 1440
taactttttc gttaaacttt agcttgcatt tgtaacgaat ttttaaattc acttttgttt 1500
atttgtcaga ttgtaagtac tttctctaat cacttttttt tcaaggcaat cagggtatat 1560
tatattgtac ttcagcacag ttttagagaa caattgttat aattaaatga taaggtagaa 1620
tatttctgca tataaattct ggctggcgtg gaaatattct tattggtaga aacaactaca 1680
ccctggtcat catcctgcct ttctctttat ggttacaatg atatacactg tttgagatga 1740
ggataaaata ctctgagtcc aaaccgggcc cctctgctaa ccatgttcat gccttcttct 1800
ctttcctaca gctcctgggc aacgtgctgg ttgttgtgct gtctcatcat tttggcaaag 1860
aattaagctt atactcgagc tctagattgg gaacccgggt ctctcgaatt cgatgccttt 1920
tagactcctg ataccattgg gtcttgtttg cgttctcctc cctctccatc acggcgcccc 1980
aggtccagac ggtaccgcac ctgatcctgc ccattaccgc gaacgcgtta aagccatgtt 2040
ctaccacgcc tatgactcct atctggaaaa tgcattcccc tatgatgagc tccgacccct 2100
tacctgcgat ggtcatgata cttggggctc tttttccctt acccttattg acgctctgga 2160
cacactcctt atcctcggaa acaccagcga atttcaaaga gtagttgaag tacttcagga 2220
caatgtcgac tttgacatcg atgtgaacgc atcagttttc gaaacaaata taagagtcgt 2280
tggaggtctg ctctccgccc accttctctc taaaaaagcc ggagtagaag ttgaagctgg 2340
ctggccctgc tccggacccc tccttcgtat ggctgaagaa gctgcccgca aactccttcc 2400
cgcttttcag accccaaccg gtatgcccta tggtactgtt aacctcctgc acggagtaaa 2460
tcccggcgaa acccccgtca catgtacagc cggaattgga acctttattg tggaatttgc 2520
aacccttagc agcctgaccg gagatcctgt attcgaagac gtggctcggg ttgccctgat 2580
gcgactgtgg gaatccaggt ctgatatcgg tctggtcggt aaccatatag acgtactcac 2640
tggtaaatgg gttgcacaag acgctggaat tggggcaggc gtggattctt attttgaata 2700
tctcgtaaaa ggggccatac tcttgcagga caaaaaactt atggctatgt tcctggaata 2760
taacaaagct attaggaact acacacactt cgatgattgg tatttgtggg tccaaatgta 2820
taaaggaacc gtttctatgc ctgtctttca gtcactggag gcttattggc ctggtctgca 2880
atccctgatc ggagacattg acaatgcaat gaggacattc cttaattatt acactgtttg 2940
gaagcagttc ggcggattgc ccgaatttta caacattcct caaggctata cagttgaaaa 3000
aagagaagga tatcccctgc gccccgagct tattgaaagc gctatgtatc tgtatcgtgc 3060
aacaggtgat ccaaccctgc ttgaactggg acgagacgcc gtcgaatcaa tcgagaaaat 3120
ttcaaaagtg gaatgcggct ttgcaacaat taaagatctt agagaccaca aactggataa 3180
tcgcatggag tcattctttt tggctgagac cgtcaagtat ctgtatctgc tttttcatcc 3240
caacaacttc atccataata acgggtccac cttcgattca gtcatgaccc ctcacggtga 3300
atgcatactc ggagctggag gctatatttt taacactgaa gctcacccaa ttgacccagc 3360
tgcccttcat tgttgtcgac gtctgaaaga agaacaatgg gaggttgaag atttgatcaa 3420
agaattttac tcacttaaac aaagtcgacc taaacgcgca cagagaaaaa ctgtaagatc 3480
tggtccttgg gaacctcagt ccggcccagc aactctttca tcccccgcca accaaccacg 3540
agaaaaacaa ccagcccaac agagaacccc cctgctcagc tgcccctctc agcccttcac 3600
ttcaaaactc gccctgcttg gacaggtgtt tctggactcc tcttgattta aacacgcggc 3660
cgctaatcag ccataccaca tttgtagagg ttttacttgc tttaaaaaac ctcccacacc 3720
tccccctgaa cctgaaacat aaaatgaatg caattgttgt tgttaacttg tttattgcag 3780
cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 3840
cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gt 3892
<210> 17
<211> 6629
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 17
aagcttatac tcgagctcta gattgggaac ccgggtctct cgaattcatg gtggtggtgg 60
ctgctgctcc ttctgctgct acagctgctc ctaaggtgct gctgctgtct ggacagcctg 120
cttctggagg aagagctctg cctctgatgg tgcctggacc tagagctgct ggatctgagg 180
cttctggaac acctcaggct agaaagagac agagactgac acatctgtct cctgaagaaa 240
aggctctgag aagaaagctg aagaatagag tggctgctca gacagctaga gatagaaaga 300
aggctagaat gtctgaactg gaacagcagg tggtggatct ggaagaagaa aatcataagc 360
tgcagctgga aaatcagctg ctgagagaaa agacacatgg actggtggtg gaaaatcagg 420
aactgagaac aagactggga atggatacac tggatcctga tgaagtgcct gaagtggaag 480
ctaagggatc tggagtgaga ctggtggctg gatctgctga atctgctgct ggagctggac 540
ctgtggtgac atctcctgaa catctgccta tggattctga tacagtggct tcttctgatt 600
ctgaatctga tatcctgctg ggaatcctgg ataagctgga tcctgtgatg ttttttaagt 660
gtccttctcc tgaatctgct tctctggaag aactgcctga agtgtatcct gaaggacctt 720
cttctctgcc tgcttctctg tctctgtctg tgggaacatc ttctgctaag ctggaagcta 780
tcaatgaact gatcagattt gatcatgtgt atacaaagcc tctggtgctg gaaatccctt 840
ctgaaacaga atctcagaca aatgtggtgg tgaagatcga agaagctcct ctgtcttctt 900
ctgaagaaga tcatcctgaa tttatcgtgt ctgtgaagaa ggaacctctg gaagatgatt 960
ttatccctga actgggaatc tctaatctgc tgtcttcttc tcattgtctg agacctcctt 1020
cttgtctgct ggatgctcat tctgattgtg gatatgaagg atctccttct cctttttctg 1080
atatgtcttc tcctctggga acagatcatt cttgggaaga tacatttgct aatgaactgt 1140
ttcctcagct gatctctgtg tgagcggccg ctaatcagcc ataccacatt tgtagaggtt 1200
ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa aatgaatgca 1260
attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc 1320
acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc 1380
atcaatgtat cttatcatgt ctaccggtag ggcccctctc ttcatgtgag caaaaggcca 1440
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 1500
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 1560
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 1620
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 1680
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 1740
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 1800
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 1860
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 1920
aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 1980
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 2040
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 2100
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgggcg cgcctcatac 2160
tcctgcaggc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 2220
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 2280
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 2340
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 2400
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 2460
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 2520
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 2580
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 2640
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 2700
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 2760
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 2820
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 2880
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 2940
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 3000
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 3060
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 3120
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 3180
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 3240
tccccgaaaa gtgccacctg acgtcaggta ccaagcctag gcctccaaaa aagcctcctc 3300
actacttctg gaatagctca gaggcagagg cggcctcggc ctctgcataa ataaaaaaaa 3360
ttagtcagcc atggggcgga gaatgggcgg aactgggcgg agttaggggc gggatgggcg 3420
gagttagggg cgggactatg gttgctgact aattgagatg catgctttgc atacttctgc 3480
ctgctgggga gcctggggac tttccacacc tggttgctga ctaattgaga tgcatgcttt 3540
gcatacttct gcctgctggg gagcctgggg actttccaca ccggatccac catggccaag 3600
ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg 3660
accgaccggc tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg 3720
gacgacgtga ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg 3780
gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc 3840
acgaacttcc gggacgcctc cgggccggcc atgaccgaga tcggcgagca gccgtggggg 3900
cgggagttcg ccctgcgcga cccggccggc aactgcgtgc acttcgtggc cgaggagcag 3960
gactgaacgc gtgctgtaag tctgcagaaa ttgatgatct attaaacaat aaagatgtcc 4020
actaaaatgg aagtttttcc tgtcatactt tgttaagaag ggtgagaaca gagtacctac 4080
attttgaatg gaaggattgg agctacgggg gtgggggtgg ggtgggatta gataaatgcc 4140
tgctctttac tgaaggctct ttactattgc tttatgataa tgtttcatag ttggatatca 4200
taatttaaac aagcaaaacc aaattaaggg ccagctcatt cctcccactc atgatctatg 4260
gatctataga tctctcgtgc agctggggct ctagggggta tccccacgcg ccctgtagcg 4320
gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg 4380
ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc 4440
cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc 4500
tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga 4560
cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa 4620
ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga 4680
tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattaattct 4740
gtggaatgtg tgtcagttag tcgcgaggcc tccgcgccgg gttttggcgc ctcccgcggg 4800
cgcccccctc ctcacggcga gcgctgccac gtcagacgaa gggcgcagcg agcgtcctga 4860
tccttccgcc cggacgctca ggacagcggc ccgctgctca taagactcgg ccttagaacc 4920
ccagtatcag cagaaggaca ttttaggacg ggacttgggt gactctaggg cactggtttt 4980
ctttccagag agcggaacag gcgaggaaaa gtagtccctt ctcggcgatt ctgcggaggg 5040
atctccgtgg ggcggtgaac gccgatgatt atataaggac gcgccgggtg tggcacagct 5100
agttccgtcg cagccgggat ttgggtcgcg gttcttgttt gtggatcgct gtgatcgtca 5160
cttggtgagt agcgggctgc tgggctggcc ggggctttcg tggccgccgg gccgctcggt 5220
gggacggaag cgtgtggaga gaccgccaag ggctgtagtc tgggtccgcg agcaaggttg 5280
ccctgaactg ggggttgggg ggagcgcagc aaaatggcgg ctgttcccga gtcttgaatg 5340
gaagacgctt gtgaggcggg ctgtgaggtc gttgaaacaa ggtggggggc atggtgggcg 5400
gcaagaaccc aaggtcttga ggccttcgct aatgcgggaa agctcttatt cgggtgagat 5460
gggctggggc accatctggg gaccctgacg tgaagtttgt cactgactgg agaactcggt 5520
ttgtcgtctg ttgcgggggc ggcagttatg gcggtgccgt tgggcagtgc acccgtacct 5580
ttgggagcgc gcgccctcgt cgtgtcgtga cgtcacccgt tctgttggct tataatgcag 5640
ggtggggcca cctgccggta ggtgtgcggt aggcttttct ccgtcgcagg acgcagggtt 5700
cgggcctagg gtaggctctc ctgaatcgac aggcgccgga cctctggtga ggggagggat 5760
aagtgaggcg tcagtttctt tggtcggttt tatgtaccta tcttcttaag tagctgaagc 5820
tccggttttg aactatgcgc tcggggttgg cgagtgtgtt ttgtgaagtt ttttaggcac 5880
cttttgaaat gtaatcattt gggtcaatat gtaattttca gtgttagact agtaaattgt 5940
ccgctaaatt ctggccgttt ttggcttttt tgttagacgt cgaccgatcc tgagaacttc 6000
agggtgagtt tggggaccct tgattgttct ttctttttcg ctattgtaaa attcatgtta 6060
tatggagggg gcaaagtttt cagggtgttg tttagaatgg gaagatgtcc cttgtatcac 6120
catggaccct catgataatt ttgtttcttt cactttctac tctgttgaca accattgtct 6180
cctcttattt tcttttcatt ttctgtaact ttttcgttaa actttagctt gcatttgtaa 6240
cgaattttta aattcacttt tgtttatttg tcagattgta agtactttct ctaatcactt 6300
ttttttcaag gcaatcaggg tatattatat tgtacttcag cacagtttta gagaacaatt 6360
gttataatta aatgataagg tagaatattt ctgcatataa attctggctg gcgtggaaat 6420
attcttattg gtagaaacaa ctacaccctg gtcatcatcc tgcctttctc tttatggtta 6480
caatgatata cactgtttga gatgaggata aaatactctg agtccaaacc gggcccctct 6540
gctaaccatg ttcatgcctt cttctctttc ctacagctcc tgggcaacgt gctggttgtt 6600
gtgctgtctc atcattttgg caaagaatt 6629
<210> 18
<211> 3264
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 18
ggcctccgcg ccgggttttg gcgcctcccg cgggcgcccc cctcctcacg gcgagcgctg 60
ccacgtcaga cgaagggcgc agcgagcgtc ctgatccttc cgcccggacg ctcaggacag 120
cggcccgctg ctcataagac tcggccttag aaccccagta tcagcagaag gacattttag 180
gacgggactt gggtgactct agggcactgg ttttctttcc agagagcgga acaggcgagg 240
aaaagtagtc ccttctcggc gattctgcgg agggatctcc gtggggcggt gaacgccgat 300
gattatataa ggacgcgccg ggtgtggcac agctagttcc gtcgcagccg ggatttgggt 360
cgcggttctt gtttgtggat cgctgtgatc gtcacttggt gagtagcggg ctgctgggct 420
ggccggggct ttcgtggccg ccgggccgct cggtgggacg gaagcgtgtg gagagaccgc 480
caagggctgt agtctgggtc cgcgagcaag gttgccctga actgggggtt ggggggagcg 540
cagcaaaatg gcggctgttc ccgagtcttg aatggaagac gcttgtgagg cgggctgtga 600
ggtcgttgaa acaaggtggg gggcatggtg ggcggcaaga acccaaggtc ttgaggcctt 660
cgctaatgcg ggaaagctct tattcgggtg agatgggctg gggcaccatc tggggaccct 720
gacgtgaagt ttgtcactga ctggagaact cggtttgtcg tctgttgcgg gggcggcagt 780
tatggcggtg ccgttgggca gtgcacccgt acctttggga gcgcgcgccc tcgtcgtgtc 840
gtgacgtcac ccgttctgtt ggcttataat gcagggtggg gccacctgcc ggtaggtgtg 900
cggtaggctt ttctccgtcg caggacgcag ggttcgggcc tagggtaggc tctcctgaat 960
cgacaggcgc cggacctctg gtgaggggag ggataagtga ggcgtcagtt tctttggtcg 1020
gttttatgta cctatcttct taagtagctg aagctccggt tttgaactat gcgctcgggg 1080
ttggcgagtg tgttttgtga agttttttag gcaccttttg aaatgtaatc atttgggtca 1140
atatgtaatt ttcagtgtta gactagtaaa ttgtccgcta aattctggcc gtttttggct 1200
tttttgttag acgtcgaccg atcctgagaa cttcagggtg agtttgggga cccttgattg 1260
ttctttcttt ttcgctattg taaaattcat gttatatgga gggggcaaag ttttcagggt 1320
gttgtttaga atgggaagat gtcccttgta tcaccatgga ccctcatgat aattttgttt 1380
ctttcacttt ctactctgtt gacaaccatt gtctcctctt attttctttt cattttctgt 1440
aactttttcg ttaaacttta gcttgcattt gtaacgaatt tttaaattca cttttgttta 1500
tttgtcagat tgtaagtact ttctctaatc actttttttt caaggcaatc agggtatatt 1560
atattgtact tcagcacagt tttagagaac aattgttata attaaatgat aaggtagaat 1620
atttctgcat ataaattctg gctggcgtgg aaatattctt attggtagaa acaactacac 1680
cctggtcatc atcctgcctt tctctttatg gttacaatga tatacactgt ttgagatgag 1740
gataaaatac tctgagtcca aaccgggccc ctctgctaac catgttcatg ccttcttctc 1800
tttcctacag ctcctgggca acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga 1860
attaagctta tactcgagct ctagattggg aacccgggtc tctcgaattc atggtggtgg 1920
tggctgctgc tccttctgct gctacagctg ctcctaaggt gctgctgctg tctggacagc 1980
ctgcttctgg aggaagagct ctgcctctga tggtgcctgg acctagagct gctggatctg 2040
aggcttctgg aacacctcag gctagaaaga gacagagact gacacatctg tctcctgaag 2100
aaaaggctct gagaagaaag ctgaagaata gagtggctgc tcagacagct agagatagaa 2160
agaaggctag aatgtctgaa ctggaacagc aggtggtgga tctggaagaa gaaaatcata 2220
agctgcagct ggaaaatcag ctgctgagag aaaagacaca tggactggtg gtggaaaatc 2280
aggaactgag aacaagactg ggaatggata cactggatcc tgatgaagtg cctgaagtgg 2340
aagctaaggg atctggagtg agactggtgg ctggatctgc tgaatctgct gctggagctg 2400
gacctgtggt gacatctcct gaacatctgc ctatggattc tgatacagtg gcttcttctg 2460
attctgaatc tgatatcctg ctgggaatcc tggataagct ggatcctgtg atgtttttta 2520
agtgtccttc tcctgaatct gcttctctgg aagaactgcc tgaagtgtat cctgaaggac 2580
cttcttctct gcctgcttct ctgtctctgt ctgtgggaac atcttctgct aagctggaag 2640
ctatcaatga actgatcaga tttgatcatg tgtatacaaa gcctctggtg ctggaaatcc 2700
cttctgaaac agaatctcag acaaatgtgg tggtgaagat cgaagaagct cctctgtctt 2760
cttctgaaga agatcatcct gaatttatcg tgtctgtgaa gaaggaacct ctggaagatg 2820
attttatccc tgaactggga atctctaatc tgctgtcttc ttctcattgt ctgagacctc 2880
cttcttgtct gctggatgct cattctgatt gtggatatga aggatctcct tctccttttt 2940
ctgatatgtc ttctcctctg ggaacagatc attcttggga agatacattt gctaatgaac 3000
tgtttcctca gctgatctct gtgtgagcgg ccgctaatca gccataccac atttgtagag 3060
gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat 3120
gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc 3180
atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 3240
ctcatcaatg tatcttatca tgtc 3264
<210> 19
<211> 447
<212> PRT
<213> Homo sapiens
<400> 19
Glu Val Gln Val Leu Glu Ser Gly Gly Asp Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ala Tyr
20 25 30
Ala Met Thr Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ser Ala Ile Ser Gly Ser Gly Gly Ser Ala Tyr Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Val Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Lys Asp Gly Ala Trp Lys Met Ser Gly Leu Asp Val Trp Gly Gln
100 105 110
Gly Thr Thr Val Ile Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val
115 120 125
Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala
130 135 140
Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser
145 150 155 160
Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val
165 170 175
Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro
180 185 190
Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr Cys Asn Val Asp His Lys
195 200 205
Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Ser Lys Tyr Gly Pro
210 215 220
Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe Leu Gly Gly Pro Ser Val
225 230 235 240
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
245 250 255
Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu
260 265 270
Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
275 280 285
Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser
290 295 300
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
305 310 315 320
Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile
325 330 335
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
340 345 350
Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
355 360 365
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
370 375 380
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
385 390 395 400
Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg
405 410 415
Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
420 425 430
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly Lys
435 440 445
<210> 20
<211> 110
<212> PRT
<213> Homo sapiens
<400> 20
Glu Ser Gly Gly Asp Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser
1 5 10 15
Cys Ala Ala Ser Gly Phe Thr Phe Ser Ala Tyr Ala Met Thr Trp Val
20 25 30
Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Ala Ile Ser Gly
35 40 45
Ser Gly Gly Ser Ala Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr
50 55 60
Ile Ser Arg Asp Asn Ser Lys Asn Thr Val Tyr Leu Gln Met Asn Ser
65 70 75 80
Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Lys Asp Gly Ala
85 90 95
Trp Lys Met Ser Gly Leu Asp Val Trp Gly Gln Gly Thr Thr
100 105 110
<210> 21
<211> 214
<212> PRT
<213> Homo sapiens
<400> 21
Asp Ile Gln Met Thr Gln Ser Pro Ala Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Ile Ser Asp Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ile Pro Arg Leu Leu Ile
35 40 45
Tyr Thr Thr Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe Arg Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Val Ala Thr Tyr Tyr Cys Gln Lys Tyr Asp Ser Ala Pro Leu
85 90 95
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205
Phe Asn Arg Gly Glu Cys
210
<210> 22
<211> 100
<212> PRT
<213> Homo sapiens
<400> 22
Gln Ser Pro Ala Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile
1 5 10 15
Thr Cys Arg Ala Ser Gln Asp Ile Ser Asp Tyr Leu Ala Trp Tyr Gln
20 25 30
Gln Lys Pro Gly Lys Ile Pro Arg Leu Leu Ile Tyr Thr Thr Ser Thr
35 40 45
Leu Gln Ser Gly Val Pro Ser Arg Phe Arg Gly Ser Gly Ser Gly Thr
50 55 60
Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Thr
65 70 75 80
Tyr Tyr Cys Gln Lys Tyr Asp Ser Ala Pro Leu Thr Phe Gly Gly Gly
85 90 95
Thr Lys Val Glu
100
<210> 23
<211> 2971
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 23
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag aggtgcaggt gttggagtct gggggagact tggtacagcc tggggggtcc 1440
ctgagactct cctgtgcagc ctctggattc acctttagtg cctatgccat gacctgggtc 1500
cgccaggctc cagggaaggg gctggagtgg gtctcagcta ttagtggtag tggtggtagc 1560
gcatactacg cagactccgt gaagggccgg ttcaccatct ccagagacaa ttccaagaac 1620
acggtatatc tgcagatgaa cagcctgaga gccgaggaca cggccgtata ttactgtgcg 1680
aaagatgggg cctggaaaat gtccggtttg gacgtctggg gccaagggac cacggtcatc 1740
gtctcctcag cctccaccaa gggcccatcg gtcttccccc tggcgccctg ctccaggagc 1800
acctccgaga gcacagccgc cctgggctgc ctggtcaagg actacttccc cgaaccggtg 1860
acggtgtcgt ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta 1920
cagtcctcag gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc 1980
acgaagacct acacctgcaa cgtagatcac aagcccagca acaccaaggt ggacaagaga 2040
gttgagtcca aatatggtcc cccatgccca ccctgcccag cacctgagtt cctgggggga 2100
ccatcagtct tcctgttccc cccaaaaccc aaggacactc tcatgatctc ccggacccct 2160
gaggtcacgt gcgtggtggt ggacgtgagc caggaagacc ccgaggtcca gttcaactgg 2220
tacgtggatg gcgtggaggt gcataatgcc aagacaaagc cgcgggagga gcagttcaac 2280
agcacgtacc gtgtggtcag cgtcctcacc gtcctgcacc aggactggct gaacggcaag 2340
gagtacaagt gcaaggtctc caacaaaggc ctcccgtcct ccatcgagaa aaccatctcc 2400
aaagccaaag ggcagccccg agagccacag gtgtacaccc tgcccccatc ccaggaggag 2460
atgaccaaga accaggtcag cctgacctgc ctggtcaaag gcttctaccc cagcgacatc 2520
gccgtggagt gggagagcaa tgggcagccg gagaacaact acaagaccac gcctcccgtg 2580
ctggactccg acggctcctt cttcctctac agcaggctca ccgtggacaa gagcaggtgg 2640
caggagggga atgtcttctc atgctccgtg atgcatgagg ctctgcacaa ccactacaca 2700
cagaagtccc tctccctgtc tctgggtaaa tgagcggccg ctaatcagcc ataccacatt 2760
tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa 2820
aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag 2880
caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 2940
gtccaaactc atcaatgtat cttatcatgt c 2971
<210> 24
<211> 7013
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 24
tcgcgatgtg tgactagtta gttattaata gtaatcaatt acggggtcat tagttcatag 60
cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 120
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 180
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 240
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 300
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 360
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 420
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 480
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 540
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcatg atagaagcac 600
tctactattc gtcgaccgat cctgagaact tcagggtgag tttggggacc cttgattgtt 660
ctttcttttt cgctattgta aaattcatgt tatatggagg gggcaaagtt ttcagggtgt 720
tgtttagaat gggaagatgt cccttgtatc accatggacc ctcatgataa ttttgtttct 780
ttcactttct actctgttga caaccattgt ctcctcttat tttcttttca ttttctgtaa 840
ctttttcgtt aaactttagc ttgcatttgt aacgaatttt taaattcact tttgtttatt 900
tgtcagattg taagtacttt ctctaatcac ttttttttca aggcaatcag ggtatattat 960
attgtacttc agcacagttt tagagaacaa ttgttataat taaatgataa ggtagaatat 1020
ttctgcatat aaattctggc tggcgtggaa atattcttat tggtagaaac aactacaccc 1080
tggtcatcat cctgcctttc tctttatggt tacaatgata tacactgttt gagatgagga 1140
taaaatactc tgagtccaaa ccgggcccct ctgctaacca tgttcatgcc ttcttctctt 1200
tcctacagct cctgggcaac gtgctggttg ttgtgctgtc tcatcatttt ggcaaagaat 1260
taagcttata ctcgagctct agattgggaa cccgggtctc tcgaattcga gatctccacc 1320
atgcacagac ctagacgtcg tggaactcgt ccacctccac tggcactgct cgctgctctc 1380
ctcctggctg cacgtggtgc tgatgcagag gtgcaggtgt tggagtctgg gggagacttg 1440
gtacagcctg gggggtccct gagactctcc tgtgcagcct ctggattcac ctttagtgcc 1500
tatgccatga cctgggtccg ccaggctcca gggaaggggc tggagtgggt ctcagctatt 1560
agtggtagtg gtggtagcgc atactacgca gactccgtga agggccggtt caccatctcc 1620
agagacaatt ccaagaacac ggtatatctg cagatgaaca gcctgagagc cgaggacacg 1680
gccgtatatt actgtgcgaa agatggggcc tggaaaatgt ccggtttgga cgtctggggc 1740
caagggacca cggtcatcgt ctcctcagcc tccaccaagg gcccatcggt cttccccctg 1800
gcgccctgct ccaggagcac ctccgagagc acagccgccc tgggctgcct ggtcaaggac 1860
tacttccccg aaccggtgac ggtgtcgtgg aactcaggcg ccctgaccag cggcgtgcac 1920
accttcccgg ctgtcctaca gtcctcagga ctctactccc tcagcagcgt ggtgaccgtg 1980
ccctccagca gcttgggcac gaagacctac acctgcaacg tagatcacaa gcccagcaac 2040
accaaggtgg acaagagagt tgagtccaaa tatggtcccc catgcccacc ctgcccagca 2100
cctgagttcc tggggggacc atcagtcttc ctgttccccc caaaacccaa ggacactctc 2160
atgatctccc ggacccctga ggtcacgtgc gtggtggtgg acgtgagcca ggaagacccc 2220
gaggtccagt tcaactggta cgtggatggc gtggaggtgc ataatgccaa gacaaagccg 2280
cgggaggagc agttcaacag cacgtaccgt gtggtcagcg tcctcaccgt cctgcaccag 2340
gactggctga acggcaagga gtacaagtgc aaggtctcca acaaaggcct cccgtcctcc 2400
atcgagaaaa ccatctccaa agccaaaggg cagccccgag agccacaggt gtacaccctg 2460
cccccatccc aggaggagat gaccaagaac caggtcagcc tgacctgcct ggtcaaaggc 2520
ttctacccca gcgacatcgc cgtggagtgg gagagcaatg ggcagccgga gaacaactac 2580
aagaccacgc ctcccgtgct ggactccgac ggctccttct tcctctacag caggctcacc 2640
gtggacaaga gcaggtggca ggaggggaat gtcttctcat gctccgtgat gcatgaggct 2700
ctgcacaacc actacacaca gaagtccctc tccctgtctc tgggtaaatg agcggccgct 2760
aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc cacacctccc 2820
cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta ttgcagctta 2880
taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact 2940
gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct accggtcctg 3000
cagggcccct ctcttcatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 3060
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 3120
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 3180
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 3240
tctcccttcg ggaagcgtgg cgctttctca atgctcacgc tgtaggtatc tcagttcggt 3300
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 3360
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 3420
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 3480
cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct 3540
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 3600
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 3660
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 3720
ttaagggatt ttggtcatgg gcgcgcctca tactcctgca ggcatgagat tatcaaaaag 3780
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 3840
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 3900
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 3960
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 4020
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 4080
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 4140
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 4200
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 4260
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 4320
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 4380
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 4440
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 4500
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 4560
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 4620
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 4680
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 4740
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 4800
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag 4860
gtaccaagcc taggcctcca aaaaagcctc ctcactactt ctggaatagc tcagaggcag 4920
aggcggcctc ggcctctgca taaataaaaa aaattagtca gccatggggc ggagaatggg 4980
cggaactggg cggagttagg ggcgggatgg gcggagttag gggcgggact atggttgctg 5040
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 5100
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 5160
gggactttcc acaccggatc caccatggat agatccggaa agcctgaact caccgcgacg 5220
tctgtcgaga agtttctgat cgaaaagttc gacagcgtct ccgacctgat gcagctctcg 5280
gagggcgaag aatctcgtgc tttcagcttc gatgtaggag ggcgtggata tgtcctgcgg 5340
gtaaatagct gcgccgatgg tttctacaaa gatcgttatg tttatcggca ctttgcatcg 5400
gccgcgctcc cgattccgga agtgcttgac attggggagt tcagcgagag cctgacctat 5460
tgcatctccc gccgtgcaca gggtgtcacg ttgcaagacc tgcctgaaac cgaactgccc 5520
gctgttctgc agccggtcgc ggaggccatg gatgcgatcg ctgcggccga tcttagccag 5580
acgagcgggt tcggcccatt cggaccgcaa ggaatcggtc aatacactac atggcgtgat 5640
ttcatatgcg cgattgctga tccccatgtg tatcactggc aaactgtgat ggacgacacc 5700
gtcagtgcgt ccgtcgcgca ggctctcgat gagctgatgc tttgggccga ggactgcccc 5760
gaagtccggc acctcgtgca cgcggatttc ggctccaaca atgtcctgac ggacaatggc 5820
cgcataacag cggtcattga ctggagcgag gcgatgttcg gggattccca atacgaggtc 5880
gccaacatct tcttctggag gccgtggttg gcttgtatgg agcagcagac gcgctacttc 5940
gagcggaggc atccggagct tgcaggatcg ccgcggctcc gggcgtatat gctccgcatt 6000
ggtcttgacc aactctatca gagcttggtt gacggcaatt tcgatgatgc agcttgggcg 6060
cagggtcgat gcgacgcaat cgtccgatcc ggagccggga ctgtcgggcg tacacaaatc 6120
gcccgcagaa gcgcggccgt ctggaccgat ggctgtgtag aagtactcgc cgatagtgga 6180
aaccgacgcc ccagcactcg tccgagggca aaggaataga cgcgtgctgt aagtctgcag 6240
aaattgatga tctattaaac aataaagatg tccactaaaa tggaagtttt tcctgtcata 6300
ctttgttaag aagggtgaga acagagtacc tacattttga atggaaggat tggagctacg 6360
ggggtggggg tggggtggga ttagataaat gcctgctctt tactgaaggc tctttactat 6420
tgctttatga taatgtttca tagttggata tcataattta aacaagcaaa accaaattaa 6480
gggccagctc attcctccca ctcatgatct atggatctat agatctctcg tgcagctggg 6540
gctctagggg gtatccccac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 6600
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 6660
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 6720
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 6780
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 6840
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 6900
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 6960
tgatttaaca aaaatttaac gcgaattaat tctgtggaat gtgtgtcagt tag 7013
<210> 25
<211> 2272
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 25
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag acatccagat gacccagtct ccagcctccc tgtctgcatc tgttggagac 1440
agagtcacca tcacttgtcg ggcgagtcag gacattagcg attatttagc ctggtatcag 1500
cagaaaccag ggaaaattcc taggctcctg atctatacta catccacttt gcaatcaggg 1560
gtcccatctc ggttccgtgg cagtgggtct gggacagatt tcactctcac catcagcagc 1620
ctgcagcctg aagatgttgc aacttattac tgtcagaagt atgacagtgc cccgctcact 1680
ttcggcggag ggaccaaggt ggagatcaaa cgaactgtgg ctgcaccatc tgtcttcatc 1740
ttcccgccat ctgatgagca gttgaaatct ggaactgcct ctgttgtgtg cctgctgaat 1800
aacttctatc ccagagaggc caaagtacag tggaaggtgg ataacgccct ccaatcgggt 1860
aactcccagg agagtgtcac agagcaggac agcaaggaca gcacctacag cctcagcagc 1920
accctgacgc tgagcaaagc agactacgag aaacacaaag tctacgcctg cgaagtcacc 1980
catcagggcc tgagctcgcc cgtcacaaag agcttcaaca ggggagagtg ttaggcggcc 2040
gctaatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct 2100
ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 2160
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 2220
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tc 2272
<210> 26
<211> 6335
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 26
tcgagctcta gattgggaac ccgggtctct cgaattcgag atctccacca tgcacagacc 60
tagacgtcgt ggaactcgtc cacctccact ggcactgctc gctgctctcc tcctggctgc 120
acgtggtgct gatgcagaca tccagatgac ccagtctcca gcctccctgt ctgcatctgt 180
tggagacaga gtcaccatca cttgtcgggc gagtcaggac attagcgatt atttagcctg 240
gtatcagcag aaaccaggga aaattcctag gctcctgatc tatactacat ccactttgca 300
atcaggggtc ccatctcggt tccgtggcag tgggtctggg acagatttca ctctcaccat 360
cagcagcctg cagcctgaag atgttgcaac ttattactgt cagaagtatg acagtgcccc 420
gctcactttc ggcggaggga ccaaggtgga gatcaaacga actgtggctg caccatctgt 480
cttcatcttc ccgccatctg atgagcagtt gaaatctgga actgcctctg ttgtgtgcct 540
gctgaataac ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca 600
atcgggtaac tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct 660
cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga 720
agtcacccat cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta 780
ggcggccgct aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 840
cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 900
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 960
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1020
accggtaggg cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 1080
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 1140
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 1200
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 1260
gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 1320
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 1380
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 1440
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 1500
gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 1560
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 1620
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 1680
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 1740
tcacgttaag ggattttggt catgggcgcg ggcatgagat tatcaaaaag gatcttcacc 1800
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1860
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1920
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1980
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 2040
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 2100
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 2160
agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 2220
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 2280
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 2340
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 2400
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 2460
cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 2520
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 2580
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 2640
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 2700
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 2760
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 2820
caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag gtacacttag 2880
gcgcgccatt agagttcctg caggctacat ggtaccaagc ctaggcctcc aaaaaagcct 2940
cctcactact tctggaatag ctcagaggca gaggcggcct cggcctctgc ataaataaaa 3000
aaaattagtc agccatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg 3060
ggcggagtta ggggcgggac tatggttgct gactaattga gatgcatgct ttgcatactt 3120
ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt gagatgcatg 3180
ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccggat ccaccatgga 3240
tagatccgga aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt 3300
cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt 3360
cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa 3420
agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga 3480
cattggggag ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac 3540
gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat 3600
ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca 3660
aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt 3720
gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga 3780
tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt 3840
cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga 3900
ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt 3960
ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc 4020
gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt 4080
tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc 4140
cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga 4200
tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc 4260
aaaggaatag acgcgtgctg taagtctgca gaaattgatg atctattaaa caataaagat 4320
gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 4380
ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 4440
tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 4500
atcataattt aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc 4560
tatggatcta tagatctctc gtgcagctgg ggctctaggg ggtatcccca cgcgccctgt 4620
agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 4680
agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 4740
tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 4800
cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 4860
tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 4920
caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 4980
ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaattaa 5040
ttctgtggaa tgtgtgtcag ttagtcgcga tgtgtgacta gttagttatt aatagtaatc 5100
aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 5160
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 5220
tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 5280
gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 5340
cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 5400
tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 5460
gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 5520
cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 5580
taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 5640
aagcagagct catgatagaa gcactctact attcgtcgac cgatcctgag aacttcaggg 5700
tgagtttggg gacccttgat tgttctttct ttttcgctat tgtaaaattc atgttatatg 5760
gagggggcaa agttttcagg gtgttgttta gaatgggaag atgtcccttg tatcaccatg 5820
gaccctcatg ataattttgt ttctttcact ttctactctg ttgacaacca ttgtctcctc 5880
ttattttctt ttcattttct gtaacttttt cgttaaactt tagcttgcat ttgtaacgaa 5940
tttttaaatt cacttttgtt tatttgtcag attgtaagta ctttctctaa tcactttttt 6000
ttcaaggcaa tcagggtata ttatattgta cttcagcaca gttttagaga acaattgtta 6060
taattaaatg ataaggtaga atatttctgc atataaattc tggctggcgt ggaaatattc 6120
ttattggtag aaacaactac accctggtca tcatcctgcc tttctcttta tggttacaat 6180
gatatacact gtttgagatg aggataaaat actctgagtc caaaccgggc ccctctgcta 6240
accatgttca tgccttcttc tctttcctac agctcctggg caacgtgctg gttgttgtgc 6300
tgtctcatca ttttggcaaa gaattaagct tatac 6335
<210> 27
<211> 452
<212> PRT
<213> Homo sapiens
<400> 27
Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr
20 25 30
Asp Ile His Trp Val Arg Gln Ala Thr Gly Lys Gly Leu Glu Trp Val
35 40 45
Ser Ala Ile Gly Pro Ala Gly Asp Thr Tyr Tyr Pro Gly Ser Val Lys
50 55 60
Gly Arg Phe Thr Ile Ser Arg Glu Asn Ala Lys Asn Ser Leu Tyr Leu
65 70 75 80
Gln Met Asn Ser Leu Arg Ala Gly Asp Thr Ala Val Tyr Tyr Cys Ala
85 90 95
Arg Gly Leu Ile Thr Phe Gly Gly Leu Ile Ala Pro Phe Asp Tyr Trp
100 105 110
Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro
115 120 125
Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr
130 135 140
Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr
145 150 155 160
Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro
165 170 175
Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr
180 185 190
Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn
195 200 205
His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser
210 215 220
Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu
225 230 235 240
Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
245 250 255
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
260 265 270
His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu
275 280 285
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr
290 295 300
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
305 310 315 320
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro
325 330 335
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
340 345 350
Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val
355 360 365
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
370 375 380
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro
385 390 395 400
Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr
405 410 415
Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val
420 425 430
Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu
435 440 445
Ser Pro Gly Lys
450
<210> 28
<211> 112
<212> PRT
<213> Homo sapiens
<400> 28
Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser
1 5 10 15
Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr Asp Ile His Trp Val
20 25 30
Arg Gln Ala Thr Gly Lys Gly Leu Glu Trp Val Ser Ala Ile Gly Pro
35 40 45
Ala Gly Asp Thr Tyr Tyr Pro Gly Ser Val Lys Gly Arg Phe Thr Ile
50 55 60
Ser Arg Glu Asn Ala Lys Asn Ser Leu Tyr Leu Gln Met Asn Ser Leu
65 70 75 80
Arg Ala Gly Asp Thr Ala Val Tyr Tyr Cys Ala Arg Gly Leu Ile Thr
85 90 95
Phe Gly Gly Leu Ile Ala Pro Phe Asp Tyr Trp Gly Gln Gly Thr Leu
100 105 110
<210> 29
<211> 214
<212> PRT
<213> Homo sapiens
<400> 29
Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly
1 5 10 15
Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Thr
20 25 30
Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu
35 40 45
Ile Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser
50 55 60
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu
65 70 75 80
Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln His Tyr Asp Asn Ser Gln
85 90 95
Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205
Phe Asn Arg Gly Glu Cys
210
<210> 30
<211> 107
<212> PRT
<213> Homo sapiens
<400> 30
Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu
1 5 10 15
Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Thr Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile
35 40 45
Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro
65 70 75 80
Glu Asp Phe Ala Val Tyr Tyr Cys Gln His Tyr Asp Asn Ser Gln Thr
85 90 95
Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg
100 105
<210> 31
<211> 2986
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 31
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag aggtgcagct ggtggagtct gggggaggct tggtacagcc gggggggtcc 1440
ctgagactct cctgtgcagc ctctggattc accttcagta gctacgacat acactgggtc 1500
cgtcaagcta caggaaaagg tctggagtgg gtctcagcta ttggtcctgc tggtgacaca 1560
tactatccag gctccgtgaa gggccgattc accatctcca gagaaaatgc caagaactcc 1620
ttgtatcttc aaatgaacag cctgagagcc ggggacacgg ctgtgtatta ctgtgcaaga 1680
ggtttgatta cgtttggggg gcttatcgcc ccgtttgact actggggcca gggaaccctg 1740
gtcaccgtct cctcagcctc caccaagggc ccatcggtct tccccctggc accctcctcc 1800
aagagcacct ctgggggcac agcggccctg ggctgcctgg tcaaggacta cttccccgaa 1860
ccggtgacgg tgtcgtggaa ctcaggcgcc ctgaccagcg gcgtgcacac cttcccggct 1920
gtcctacagt cctcaggact ctactccctc agcagcgtgg tgaccgtgcc ctccagcagc 1980
ttgggcaccc agacctacat ctgcaacgtg aatcacaagc ccagcaacac caaggtggac 2040
aagaaagttg agcccaaatc ttgtgacaaa actcacacat gcccaccgtg cccagcacct 2100
gaactcctgg ggggaccgtc agtcttcctc ttccccccaa aacccaagga caccctcatg 2160
atctcccgga cccctgaggt cacatgcgtg gtggtggacg tgagccacga agaccctgag 2220
gtcaagttca actggtacgt ggacggcgtg gaggtgcata atgccaagac aaagccgcgg 2280
gaggagcagt acaacagcac gtaccgtgtg gtcagcgtcc tcaccgtcct gcaccaggac 2340
tggctgaatg gcaaggagta caagtgcaag gtctccaaca aagccctccc agcccccatc 2400
gagaaaacca tctccaaagc caaagggcag ccccgagaac cacaggtgta caccctgccc 2460
ccatcccggg atgagctgac caagaaccag gtcagcctga cctgcctggt caaaggcttc 2520
tatcccagcg acatcgccgt ggagtgggag agcaatgggc agccggagaa caactacaag 2580
accacgcctc ccgtgctgga ctccgacggc tccttcttcc tctacagcaa gctcaccgtg 2640
gacaagagca ggtggcagca ggggaacgtc ttctcatgct ccgtgatgca tgaggctctg 2700
cacaaccact acacgcagaa gtccctctcc ctgtctccgg gtaaatgagc ggccgctaat 2760
cagccatacc acatttgtag aggttttact tgctttaaaa aacctcccac acctccccct 2820
gaacctgaaa cataaaatga atgcaattgt tgttgttaac ttgtttattg cagcttataa 2880
tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 2940
ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtc 2986
<210> 32
<211> 7028
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 32
tcgcgatgtg tgactagtta gttattaata gtaatcaatt acggggtcat tagttcatag 60
cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 120
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 180
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 240
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 300
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 360
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 420
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 480
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 540
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcatg atagaagcac 600
tctactattc gtcgaccgat cctgagaact tcagggtgag tttggggacc cttgattgtt 660
ctttcttttt cgctattgta aaattcatgt tatatggagg gggcaaagtt ttcagggtgt 720
tgtttagaat gggaagatgt cccttgtatc accatggacc ctcatgataa ttttgtttct 780
ttcactttct actctgttga caaccattgt ctcctcttat tttcttttca ttttctgtaa 840
ctttttcgtt aaactttagc ttgcatttgt aacgaatttt taaattcact tttgtttatt 900
tgtcagattg taagtacttt ctctaatcac ttttttttca aggcaatcag ggtatattat 960
attgtacttc agcacagttt tagagaacaa ttgttataat taaatgataa ggtagaatat 1020
ttctgcatat aaattctggc tggcgtggaa atattcttat tggtagaaac aactacaccc 1080
tggtcatcat cctgcctttc tctttatggt tacaatgata tacactgttt gagatgagga 1140
taaaatactc tgagtccaaa ccgggcccct ctgctaacca tgttcatgcc ttcttctctt 1200
tcctacagct cctgggcaac gtgctggttg ttgtgctgtc tcatcatttt ggcaaagaat 1260
taagcttata ctcgagctct agattgggaa cccgggtctc tcgaattcga gatctccacc 1320
atgcacagac ctagacgtcg tggaactcgt ccacctccac tggcactgct cgctgctctc 1380
ctcctggctg cacgtggtgc tgatgcagag gtgcagctgg tggagtctgg gggaggcttg 1440
gtacagccgg gggggtccct gagactctcc tgtgcagcct ctggattcac cttcagtagc 1500
tacgacatac actgggtccg tcaagctaca ggaaaaggtc tggagtgggt ctcagctatt 1560
ggtcctgctg gtgacacata ctatccaggc tccgtgaagg gccgattcac catctccaga 1620
gaaaatgcca agaactcctt gtatcttcaa atgaacagcc tgagagccgg ggacacggct 1680
gtgtattact gtgcaagagg tttgattacg tttggggggc ttatcgcccc gtttgactac 1740
tggggccagg gaaccctggt caccgtctcc tcagcctcca ccaagggccc atcggtcttc 1800
cccctggcac cctcctccaa gagcacctct gggggcacag cggccctggg ctgcctggtc 1860
aaggactact tccccgaacc ggtgacggtg tcgtggaact caggcgccct gaccagcggc 1920
gtgcacacct tcccggctgt cctacagtcc tcaggactct actccctcag cagcgtggtg 1980
accgtgccct ccagcagctt gggcacccag acctacatct gcaacgtgaa tcacaagccc 2040
agcaacacca aggtggacaa gaaagttgag cccaaatctt gtgacaaaac tcacacatgc 2100
ccaccgtgcc cagcacctga actcctgggg ggaccgtcag tcttcctctt ccccccaaaa 2160
cccaaggaca ccctcatgat ctcccggacc cctgaggtca catgcgtggt ggtggacgtg 2220
agccacgaag accctgaggt caagttcaac tggtacgtgg acggcgtgga ggtgcataat 2280
gccaagacaa agccgcggga ggagcagtac aacagcacgt accgtgtggt cagcgtcctc 2340
accgtcctgc accaggactg gctgaatggc aaggagtaca agtgcaaggt ctccaacaaa 2400
gccctcccag cccccatcga gaaaaccatc tccaaagcca aagggcagcc ccgagaacca 2460
caggtgtaca ccctgccccc atcccgggat gagctgacca agaaccaggt cagcctgacc 2520
tgcctggtca aaggcttcta tcccagcgac atcgccgtgg agtgggagag caatgggcag 2580
ccggagaaca actacaagac cacgcctccc gtgctggact ccgacggctc cttcttcctc 2640
tacagcaagc tcaccgtgga caagagcagg tggcagcagg ggaacgtctt ctcatgctcc 2700
gtgatgcatg aggctctgca caaccactac acgcagaagt ccctctccct gtctccgggt 2760
aaatgagcgg ccgctaatca gccataccac atttgtagag gttttacttg ctttaaaaaa 2820
cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt 2880
gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa 2940
agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca 3000
tgtctaccgg tcctgcaggg cccctctctt catgtgagca aaaggccagc aaaaggccag 3060
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 3120
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 3180
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 3240
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag 3300
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 3360
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 3420
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 3480
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 3540
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 3600
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 3660
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 3720
gaacgaaaac tcacgttaag ggattttggt catgggcgcg cctcatactc ctgcaggcat 3780
gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 3840
aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 3900
acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 3960
gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 4020
cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 4080
cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 4140
tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 4200
cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 4260
gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 4320
cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 4380
ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 4440
gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 4500
taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 4560
gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 4620
acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 4680
aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 4740
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 4800
atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 4860
gccacctgac gtcaggtacc aagcctaggc ctccaaaaaa gcctcctcac tacttctgga 4920
atagctcaga ggcagaggcg gcctcggcct ctgcataaat aaaaaaaatt agtcagccat 4980
ggggcggaga atgggcggaa ctgggcggag ttaggggcgg gatgggcgga gttaggggcg 5040
ggactatggt tgctgactaa ttgagatgca tgctttgcat acttctgcct gctggggagc 5100
ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc atacttctgc 5160
ctgctgggga gcctggggac tttccacacc ggatccacca tggatagatc cggaaagcct 5220
gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa agttcgacag cgtctccgac 5280
ctgatgcagc tctcggaggg cgaagaatct cgtgctttca gcttcgatgt aggagggcgt 5340
ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct acaaagatcg ttatgtttat 5400
cggcactttg catcggccgc gctcccgatt ccggaagtgc ttgacattgg ggagttcagc 5460
gagagcctga cctattgcat ctcccgccgt gcacagggtg tcacgttgca agacctgcct 5520
gaaaccgaac tgcccgctgt tctgcagccg gtcgcggagg ccatggatgc gatcgctgcg 5580
gccgatctta gccagacgag cgggttcggc ccattcggac cgcaaggaat cggtcaatac 5640
actacatggc gtgatttcat atgcgcgatt gctgatcccc atgtgtatca ctggcaaact 5700
gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc tcgatgagct gatgctttgg 5760
gccgaggact gccccgaagt ccggcacctc gtgcacgcgg atttcggctc caacaatgtc 5820
ctgacggaca atggccgcat aacagcggtc attgactgga gcgaggcgat gttcggggat 5880
tcccaatacg aggtcgccaa catcttcttc tggaggccgt ggttggcttg tatggagcag 5940
cagacgcgct acttcgagcg gaggcatccg gagcttgcag gatcgccgcg gctccgggcg 6000
tatatgctcc gcattggtct tgaccaactc tatcagagct tggttgacgg caatttcgat 6060
gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc cgggactgtc 6120
gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg tgtagaagta 6180
ctcgccgata gtggaaaccg acgccccagc actcgtccga gggcaaagga atagacgcgt 6240
gctgtaagtc tgcagaaatt gatgatctat taaacaataa agatgtccac taaaatggaa 6300
gtttttcctg tcatactttg ttaagaaggg tgagaacaga gtacctacat tttgaatgga 6360
aggattggag ctacgggggt gggggtgggg tgggattaga taaatgcctg ctctttactg 6420
aaggctcttt actattgctt tatgataatg tttcatagtt ggatatcata atttaaacaa 6480
gcaaaaccaa attaagggcc agctcattcc tcccactcat gatctatgga tctatagatc 6540
tctcgtgcag ctggggctct agggggtatc cccacgcgcc ctgtagcggc gcattaagcg 6600
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 6660
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 6720
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 6780
aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 6840
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 6900
tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt 6960
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttaattctgt ggaatgtgtg 7020
tcagttag 7028
<210> 33
<211> 2272
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 33
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag aaattgtgtt gacgcagtct ccaggcaccc tgtctttgtc tccaggggaa 1440
agagccaccc tctcctgcag ggccagtcag agtgttagca gcacctactt agcctggtac 1500
cagcagaaac ctggccaggc tcccaggctc ctcatctatg gtgcatccag cagggccact 1560
ggcatcccag acaggttcag tggcagtggg tctgggacag acttcactct caccatcagc 1620
agactggagc ctgaagattt tgcagtgtat tactgtcagc attatgataa ctcacaaacg 1680
ttcggccaag ggaccaaggt ggagatcaaa cgaactgtgg ctgcaccatc tgtcttcatc 1740
ttcccgccat ctgatgagca gttgaaatct ggaactgcct ctgttgtgtg cctgctgaat 1800
aacttctatc ccagagaggc caaagtacag tggaaggtgg ataacgccct ccaatcgggt 1860
aactcccagg agagtgtcac agagcaggac agcaaggaca gcacctacag cctcagcagc 1920
accctgacgc tgagcaaagc agactacgag aaacacaaag tctacgcctg cgaagtcacc 1980
catcagggcc tgagctcgcc cgtcacaaag agcttcaaca ggggagagtg ttaggcggcc 2040
gctaatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct 2100
ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 2160
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 2220
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tc 2272
<210> 34
<211> 6335
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 34
tcgagctcta gattgggaac ccgggtctct cgaattcgag atctccacca tgcacagacc 60
tagacgtcgt ggaactcgtc cacctccact ggcactgctc gctgctctcc tcctggctgc 120
acgtggtgct gatgcagaaa ttgtgttgac gcagtctcca ggcaccctgt ctttgtctcc 180
aggggaaaga gccaccctct cctgcagggc cagtcagagt gttagcagca cctacttagc 240
ctggtaccag cagaaacctg gccaggctcc caggctcctc atctatggtg catccagcag 300
ggccactggc atcccagaca ggttcagtgg cagtgggtct gggacagact tcactctcac 360
catcagcaga ctggagcctg aagattttgc agtgtattac tgtcagcatt atgataactc 420
acaaacgttc ggccaaggga ccaaggtgga gatcaaacga actgtggctg caccatctgt 480
cttcatcttc ccgccatctg atgagcagtt gaaatctgga actgcctctg ttgtgtgcct 540
gctgaataac ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca 600
atcgggtaac tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct 660
cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga 720
agtcacccat cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta 780
ggcggccgct aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 840
cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 900
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 960
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1020
accggtaggg cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 1080
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 1140
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 1200
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 1260
gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 1320
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 1380
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 1440
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 1500
gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 1560
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 1620
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 1680
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 1740
tcacgttaag ggattttggt catgggcgcg ggcatgagat tatcaaaaag gatcttcacc 1800
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1860
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1920
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1980
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 2040
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 2100
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 2160
agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 2220
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 2280
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 2340
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 2400
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 2460
cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 2520
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 2580
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 2640
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 2700
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 2760
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 2820
caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag gtacacttag 2880
gcgcgccatt agagttcctg caggctacat ggtaccaagc ctaggcctcc aaaaaagcct 2940
cctcactact tctggaatag ctcagaggca gaggcggcct cggcctctgc ataaataaaa 3000
aaaattagtc agccatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg 3060
ggcggagtta ggggcgggac tatggttgct gactaattga gatgcatgct ttgcatactt 3120
ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt gagatgcatg 3180
ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccggat ccaccatgga 3240
tagatccgga aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt 3300
cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt 3360
cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa 3420
agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga 3480
cattggggag ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac 3540
gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat 3600
ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca 3660
aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt 3720
gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga 3780
tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt 3840
cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga 3900
ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt 3960
ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc 4020
gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt 4080
tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc 4140
cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga 4200
tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc 4260
aaaggaatag acgcgtgctg taagtctgca gaaattgatg atctattaaa caataaagat 4320
gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 4380
ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 4440
tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 4500
atcataattt aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc 4560
tatggatcta tagatctctc gtgcagctgg ggctctaggg ggtatcccca cgcgccctgt 4620
agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 4680
agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 4740
tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 4800
cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 4860
tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 4920
caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 4980
ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaattaa 5040
ttctgtggaa tgtgtgtcag ttagtcgcga tgtgtgacta gttagttatt aatagtaatc 5100
aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 5160
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 5220
tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 5280
gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 5340
cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 5400
tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 5460
gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 5520
cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 5580
taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 5640
aagcagagct catgatagaa gcactctact attcgtcgac cgatcctgag aacttcaggg 5700
tgagtttggg gacccttgat tgttctttct ttttcgctat tgtaaaattc atgttatatg 5760
gagggggcaa agttttcagg gtgttgttta gaatgggaag atgtcccttg tatcaccatg 5820
gaccctcatg ataattttgt ttctttcact ttctactctg ttgacaacca ttgtctcctc 5880
ttattttctt ttcattttct gtaacttttt cgttaaactt tagcttgcat ttgtaacgaa 5940
tttttaaatt cacttttgtt tatttgtcag attgtaagta ctttctctaa tcactttttt 6000
ttcaaggcaa tcagggtata ttatattgta cttcagcaca gttttagaga acaattgtta 6060
taattaaatg ataaggtaga atatttctgc atataaattc tggctggcgt ggaaatattc 6120
ttattggtag aaacaactac accctggtca tcatcctgcc tttctcttta tggttacaat 6180
gatatacact gtttgagatg aggataaaat actctgagtc caaaccgggc ccctctgcta 6240
accatgttca tgccttcttc tctttcctac agctcctggg caacgtgctg gttgttgtgc 6300
tgtctcatca ttttggcaaa gaattaagct tatac 6335
<210> 35
<211> 449
<212> PRT
<213> Homo sapiens
<400> 35
Gln Val Gln Leu Gln Gln Ser Gly Ala Gly Leu Leu Lys Pro Ser Glu
1 5 10 15
Thr Leu Ser Leu Thr Cys Thr Val Tyr Gly Gly Ser Phe Ser Ile His
20 25 30
His Trp Thr Trp Ile Arg His Pro Pro Gly Lys Gly Leu Glu Trp Ile
35 40 45
Gly Glu Ile Asn His Arg Gly Ser Thr Asn Tyr Asn Pro Ser Leu Lys
50 55 60
Ser Arg Val Thr Ile Ser Ile Asp Thr Ser Lys Asn Gln Phe Ser Leu
65 70 75 80
Lys Leu Ser Ala Val Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala
85 90 95
Arg Gly Leu Arg Phe Leu Asp Trp Leu Ser Ser Tyr Phe Asp Tyr Trp
100 105 110
Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro
115 120 125
Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr
130 135 140
Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr
145 150 155 160
Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro
165 170 175
Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr
180 185 190
Val Pro Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr Cys Asn Val Asp
195 200 205
His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Ser Lys Tyr
210 215 220
Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe Leu Gly Gly Pro
225 230 235 240
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
245 250 255
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp
260 265 270
Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
275 280 285
Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val
290 295 300
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
305 310 315 320
Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys
325 330 335
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
340 345 350
Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr
355 360 365
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
370 375 380
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
385 390 395 400
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys
405 410 415
Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu
420 425 430
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly
435 440 445
Lys
<210> 36
<211> 103
<212> PRT
<213> Homo sapiens
<400> 36
Gln Ser Gly Ala Gly Leu Leu Lys Pro Ser Glu Thr Leu Ser Leu Thr
1 5 10 15
Cys Thr Val Tyr Gly Gly Ser Phe Ser Ile His His Trp Thr Trp Ile
20 25 30
Arg His Pro Pro Gly Lys Gly Leu Glu Trp Ile Gly Glu Ile Asn His
35 40 45
Arg Gly Ser Thr Asn Tyr Asn Pro Ser Leu Lys Ser Arg Val Thr Ile
50 55 60
Ser Ile Asp Thr Ser Lys Asn Gln Phe Ser Leu Lys Leu Ser Ala Val
65 70 75 80
Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala Arg Gly Leu Arg Phe
85 90 95
Leu Asp Trp Leu Ser Ser Tyr
100
<210> 37
<211> 214
<212> PRT
<213> Homo sapiens
<400> 37
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Asp Tyr
20 25 30
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Val Pro Asn Leu Leu Ile
35 40 45
Tyr Ala Ala Ser Ala Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Val Ala Thr Tyr Tyr Cys Gln Asn Tyr Asn Thr Ala Pro Leu
85 90 95
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205
Phe Asn Arg Gly Glu Cys
210
<210> 38
<211> 107
<212> PRT
<213> Homo sapiens
<400> 38
Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp
1 5 10 15
Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Ser Asp Tyr Leu
20 25 30
Ala Trp Tyr Gln Gln Lys Pro Gly Lys Val Pro Asn Leu Leu Ile Tyr
35 40 45
Ala Ala Ser Ala Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly Ser
50 55 60
Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu
65 70 75 80
Asp Val Ala Thr Tyr Tyr Cys Gln Asn Tyr Asn Thr Ala Pro Leu Thr
85 90 95
Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg
100 105
<210> 39
<211> 2977
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 39
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcac aggtacagct gcagcagtcg ggcgcaggac tgttgaagcc ttcggagacc 1440
ctgtccctca cctgcactgt ctatggtgga tccttcagta ttcatcactg gacctggatc 1500
cgccatcccc cagggaaggg gctggagtgg attggggaga tcaatcatcg tggaagcacc 1560
aactacaacc cgtccctcaa gagtcgagtc accatatcaa tagacacgtc caagaaccag 1620
ttctccctga agctgagcgc tgtgaccgcc gcggacacgg ctgtatatta ctgtgcgaga 1680
ggcttacgat ttttggactg gttatcgtcc tactttgact actggggcca gggaaccctg 1740
gtcaccgtct cctcagcctc caccaagggc ccatcggtct tccccctggc gccctgctcc 1800
aggagcacct ccgagagcac agccgccctg ggctgcctgg tcaaggacta cttccccgaa 1860
ccggtgacgg tgtcgtggaa ctcaggcgcc ctgaccagcg gcgtgcacac cttcccggct 1920
gtcctacagt cctcaggact ctactccctc agcagcgtgg tgaccgtgcc ctccagcagc 1980
ttgggcacga agacctacac ctgcaacgta gatcacaagc ccagcaacac caaggtggac 2040
aagagagttg agtccaaata tggtccccca tgcccaccct gcccagcacc tgagttcctg 2100
gggggaccat cagtcttcct gttcccccca aaacccaagg acactctcat gatctcccgg 2160
acccctgagg tcacgtgcgt ggtggtggac gtgagccagg aagaccccga ggtccagttc 2220
aactggtacg tggatggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 2280
ttcaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaac 2340
ggcaaggagt acaagtgcaa ggtctccaac aaaggcctcc cgtcctccat cgagaaaacc 2400
atctccaaag ccaaagggca gccccgagag ccacaggtgt acaccctgcc cccatcccag 2460
gaggagatga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctaccccagc 2520
gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct 2580
cccgtgctgg actccgacgg ctccttcttc ctctacagca ggctcaccgt ggacaagagc 2640
aggtggcagg aggggaatgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 2700
tacacacaga agtccctctc cctgtctctg ggtaaatgag cggccgctaa tcagccatac 2760
cacatttgta gaggttttac ttgctttaaa aaacctccca cacctccccc tgaacctgaa 2820
acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata atggttacaa 2880
ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 2940
tggtttgtcc aaactcatca atgtatctta tcatgtc 2977
<210> 40
<211> 7019
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 40
tcgcgatgtg tgactagtta gttattaata gtaatcaatt acggggtcat tagttcatag 60
cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 120
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 180
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 240
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 300
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 360
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 420
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 480
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 540
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcatg atagaagcac 600
tctactattc gtcgaccgat cctgagaact tcagggtgag tttggggacc cttgattgtt 660
ctttcttttt cgctattgta aaattcatgt tatatggagg gggcaaagtt ttcagggtgt 720
tgtttagaat gggaagatgt cccttgtatc accatggacc ctcatgataa ttttgtttct 780
ttcactttct actctgttga caaccattgt ctcctcttat tttcttttca ttttctgtaa 840
ctttttcgtt aaactttagc ttgcatttgt aacgaatttt taaattcact tttgtttatt 900
tgtcagattg taagtacttt ctctaatcac ttttttttca aggcaatcag ggtatattat 960
attgtacttc agcacagttt tagagaacaa ttgttataat taaatgataa ggtagaatat 1020
ttctgcatat aaattctggc tggcgtggaa atattcttat tggtagaaac aactacaccc 1080
tggtcatcat cctgcctttc tctttatggt tacaatgata tacactgttt gagatgagga 1140
taaaatactc tgagtccaaa ccgggcccct ctgctaacca tgttcatgcc ttcttctctt 1200
tcctacagct cctgggcaac gtgctggttg ttgtgctgtc tcatcatttt ggcaaagaat 1260
taagcttata ctcgagctct agattgggaa cccgggtctc tcgaattcga gatctccacc 1320
atgcacagac ctagacgtcg tggaactcgt ccacctccac tggcactgct cgctgctctc 1380
ctcctggctg cacgtggtgc tgatgcacag gtacagctgc agcagtcggg cgcaggactg 1440
ttgaagcctt cggagaccct gtccctcacc tgcactgtct atggtggatc cttcagtatt 1500
catcactgga cctggatccg ccatccccca gggaaggggc tggagtggat tggggagatc 1560
aatcatcgtg gaagcaccaa ctacaacccg tccctcaaga gtcgagtcac catatcaata 1620
gacacgtcca agaaccagtt ctccctgaag ctgagcgctg tgaccgccgc ggacacggct 1680
gtatattact gtgcgagagg cttacgattt ttggactggt tatcgtccta ctttgactac 1740
tggggccagg gaaccctggt caccgtctcc tcagcctcca ccaagggccc atcggtcttc 1800
cccctggcgc cctgctccag gagcacctcc gagagcacag ccgccctggg ctgcctggtc 1860
aaggactact tccccgaacc ggtgacggtg tcgtggaact caggcgccct gaccagcggc 1920
gtgcacacct tcccggctgt cctacagtcc tcaggactct actccctcag cagcgtggtg 1980
accgtgccct ccagcagctt gggcacgaag acctacacct gcaacgtaga tcacaagccc 2040
agcaacacca aggtggacaa gagagttgag tccaaatatg gtcccccatg cccaccctgc 2100
ccagcacctg agttcctggg gggaccatca gtcttcctgt tccccccaaa acccaaggac 2160
actctcatga tctcccggac ccctgaggtc acgtgcgtgg tggtggacgt gagccaggaa 2220
gaccccgagg tccagttcaa ctggtacgtg gatggcgtgg aggtgcataa tgccaagaca 2280
aagccgcggg aggagcagtt caacagcacg taccgtgtgg tcagcgtcct caccgtcctg 2340
caccaggact ggctgaacgg caaggagtac aagtgcaagg tctccaacaa aggcctcccg 2400
tcctccatcg agaaaaccat ctccaaagcc aaagggcagc cccgagagcc acaggtgtac 2460
accctgcccc catcccagga ggagatgacc aagaaccagg tcagcctgac ctgcctggtc 2520
aaaggcttct accccagcga catcgccgtg gagtgggaga gcaatgggca gccggagaac 2580
aactacaaga ccacgcctcc cgtgctggac tccgacggct ccttcttcct ctacagcagg 2640
ctcaccgtgg acaagagcag gtggcaggag gggaatgtct tctcatgctc cgtgatgcat 2700
gaggctctgc acaaccacta cacacagaag tccctctccc tgtctctggg taaatgagcg 2760
gccgctaatc agccatacca catttgtaga ggttttactt gctttaaaaa acctcccaca 2820
cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc 2880
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 2940
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctaccg 3000
gtcctgcagg gcccctctct tcatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 3060
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 3120
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 3180
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 3240
cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag 3300
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 3360
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 3420
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 3480
agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 3540
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 3600
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 3660
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 3720
ctcacgttaa gggattttgg tcatgggcgc gcctcatact cctgcaggca tgagattatc 3780
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 3840
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 3900
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 3960
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 4020
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 4080
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 4140
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 4200
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 4260
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 4320
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 4380
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 4440
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 4500
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 4560
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 4620
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 4680
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 4740
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 4800
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 4860
cgtcaggtac caagcctagg cctccaaaaa agcctcctca ctacttctgg aatagctcag 4920
aggcagaggc ggcctcggcc tctgcataaa taaaaaaaat tagtcagcca tggggcggag 4980
aatgggcgga actgggcgga gttaggggcg ggatgggcgg agttaggggc gggactatgg 5040
ttgctgacta attgagatgc atgctttgca tacttctgcc tgctggggag cctggggact 5100
ttccacacct ggttgctgac taattgagat gcatgctttg catacttctg cctgctgggg 5160
agcctgggga ctttccacac cggatccacc atggatagat ccggaaagcc tgaactcacc 5220
gcgacgtctg tcgagaagtt tctgatcgaa aagttcgaca gcgtctccga cctgatgcag 5280
ctctcggagg gcgaagaatc tcgtgctttc agcttcgatg taggagggcg tggatatgtc 5340
ctgcgggtaa atagctgcgc cgatggtttc tacaaagatc gttatgttta tcggcacttt 5400
gcatcggccg cgctcccgat tccggaagtg cttgacattg gggagttcag cgagagcctg 5460
acctattgca tctcccgccg tgcacagggt gtcacgttgc aagacctgcc tgaaaccgaa 5520
ctgcccgctg ttctgcagcc ggtcgcggag gccatggatg cgatcgctgc ggccgatctt 5580
agccagacga gcgggttcgg cccattcgga ccgcaaggaa tcggtcaata cactacatgg 5640
cgtgatttca tatgcgcgat tgctgatccc catgtgtatc actggcaaac tgtgatggac 5700
gacaccgtca gtgcgtccgt cgcgcaggct ctcgatgagc tgatgctttg ggccgaggac 5760
tgccccgaag tccggcacct cgtgcacgcg gatttcggct ccaacaatgt cctgacggac 5820
aatggccgca taacagcggt cattgactgg agcgaggcga tgttcgggga ttcccaatac 5880
gaggtcgcca acatcttctt ctggaggccg tggttggctt gtatggagca gcagacgcgc 5940
tacttcgagc ggaggcatcc ggagcttgca ggatcgccgc ggctccgggc gtatatgctc 6000
cgcattggtc ttgaccaact ctatcagagc ttggttgacg gcaatttcga tgatgcagct 6060
tgggcgcagg gtcgatgcga cgcaatcgtc cgatccggag ccgggactgt cgggcgtaca 6120
caaatcgccc gcagaagcgc ggccgtctgg accgatggct gtgtagaagt actcgccgat 6180
agtggaaacc gacgccccag cactcgtccg agggcaaagg aatagacgcg tgctgtaagt 6240
ctgcagaaat tgatgatcta ttaaacaata aagatgtcca ctaaaatgga agtttttcct 6300
gtcatacttt gttaagaagg gtgagaacag agtacctaca ttttgaatgg aaggattgga 6360
gctacggggg tgggggtggg gtgggattag ataaatgcct gctctttact gaaggctctt 6420
tactattgct ttatgataat gtttcatagt tggatatcat aatttaaaca agcaaaacca 6480
aattaagggc cagctcattc ctcccactca tgatctatgg atctatagat ctctcgtgca 6540
gctggggctc tagggggtat ccccacgcgc cctgtagcgg cgcattaagc gcggcgggtg 6600
tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg 6660
ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg 6720
ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt 6780
agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt 6840
tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta 6900
tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa 6960
atgagctgat ttaacaaaaa tttaacgcga attaattctg tggaatgtgt gtcagttag 7019
<210> 41
<211> 2272
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 41
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctca tgatagaagc actctactat tcgtcgaccg 600
atcctgagaa cttcagggtg agtttgggga cccttgattg ttctttcttt ttcgctattg 660
taaaattcat gttatatgga gggggcaaag ttttcagggt gttgtttaga atgggaagat 720
gtcccttgta tcaccatgga ccctcatgat aattttgttt ctttcacttt ctactctgtt 780
gacaaccatt gtctcctctt attttctttt cattttctgt aactttttcg ttaaacttta 840
gcttgcattt gtaacgaatt tttaaattca cttttgttta tttgtcagat tgtaagtact 900
ttctctaatc actttttttt caaggcaatc agggtatatt atattgtact tcagcacagt 960
tttagagaac aattgttata attaaatgat aaggtagaat atttctgcat ataaattctg 1020
gctggcgtgg aaatattctt attggtagaa acaactacac cctggtcatc atcctgcctt 1080
tctctttatg gttacaatga tatacactgt ttgagatgag gataaaatac tctgagtcca 1140
aaccgggccc ctctgctaac catgttcatg ccttcttctc tttcctacag ctcctgggca 1200
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attaagctta tactcgagct 1260
ctagattggg aacccgggtc tctcgaattc gagatctcca ccatgcacag acctagacgt 1320
cgtggaactc gtccacctcc actggcactg ctcgctgctc tcctcctggc tgcacgtggt 1380
gctgatgcag acatccagat gacccagtct ccatcctccc tgtctgcatc tgtaggagac 1440
agagtcacca tcacttgccg ggcgagtcag ggcattagcg attatttagc ctggtatcag 1500
cagaaaccag ggaaagttcc taacctcctg atctatgctg cgtccgcttt acaatcaggg 1560
gtcccatctc gtttcagtgg cagtggatct gggacagatt tcactctcac catcagcagc 1620
ctgcagcctg aggatgttgc aacttattac tgtcaaaatt ataacactgc cccgctcact 1680
ttcggcgggg ggaccaaggt ggaaatcaaa cgaactgtgg ctgcaccatc tgtcttcatc 1740
ttcccgccat ctgatgagca gttgaaatct ggaactgcct ctgttgtgtg cctgctgaat 1800
aacttctatc ccagagaggc caaagtacag tggaaggtgg ataacgccct ccaatcgggt 1860
aactcccagg agagtgtcac agagcaggac agcaaggaca gcacctacag cctcagcagc 1920
accctgacgc tgagcaaagc agactacgag aaacacaaag tctacgcctg cgaagtcacc 1980
catcagggcc tgagctcgcc cgtcacaaag agcttcaaca ggggagagtg ttaggcggcc 2040
gctaatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct 2100
ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 2160
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 2220
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tc 2272
<210> 42
<211> 6335
<212> DNA
<213> Artificial
<220>
<223> Synthetic plasmid
<400> 42
tcgagctcta gattgggaac ccgggtctct cgaattcgag atctccacca tgcacagacc 60
tagacgtcgt ggaactcgtc cacctccact ggcactgctc gctgctctcc tcctggctgc 120
acgtggtgct gatgcagaca tccagatgac ccagtctcca tcctccctgt ctgcatctgt 180
aggagacaga gtcaccatca cttgccgggc gagtcagggc attagcgatt atttagcctg 240
gtatcagcag aaaccaggga aagttcctaa cctcctgatc tatgctgcgt ccgctttaca 300
atcaggggtc ccatctcgtt tcagtggcag tggatctggg acagatttca ctctcaccat 360
cagcagcctg cagcctgagg atgttgcaac ttattactgt caaaattata acactgcccc 420
gctcactttc ggcgggggga ccaaggtgga aatcaaacga actgtggctg caccatctgt 480
cttcatcttc ccgccatctg atgagcagtt gaaatctgga actgcctctg ttgtgtgcct 540
gctgaataac ttctatccca gagaggccaa agtacagtgg aaggtggata acgccctcca 600
atcgggtaac tcccaggaga gtgtcacaga gcaggacagc aaggacagca cctacagcct 660
cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa cacaaagtct acgcctgcga 720
agtcacccat cagggcctga gctcgcccgt cacaaagagc ttcaacaggg gagagtgtta 780
ggcggccgct aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 840
cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 900
ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 960
ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 1020
accggtaggg cccctctctt catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 1080
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 1140
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 1200
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 1260
gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 1320
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 1380
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 1440
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 1500
gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 1560
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 1620
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 1680
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 1740
tcacgttaag ggattttggt catgggcgcg ggcatgagat tatcaaaaag gatcttcacc 1800
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1860
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1920
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1980
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 2040
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 2100
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 2160
agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 2220
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 2280
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 2340
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 2400
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 2460
cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 2520
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 2580
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 2640
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 2700
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 2760
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 2820
caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcag gtacacttag 2880
gcgcgccatt agagttcctg caggctacat ggtaccaagc ctaggcctcc aaaaaagcct 2940
cctcactact tctggaatag ctcagaggca gaggcggcct cggcctctgc ataaataaaa 3000
aaaattagtc agccatgggg cggagaatgg gcggaactgg gcggagttag gggcgggatg 3060
ggcggagtta ggggcgggac tatggttgct gactaattga gatgcatgct ttgcatactt 3120
ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt gagatgcatg 3180
ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccggat ccaccatgga 3240
tagatccgga aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt 3300
cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt 3360
cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa 3420
agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga 3480
cattggggag ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac 3540
gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat 3600
ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca 3660
aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt 3720
gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga 3780
tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt 3840
cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga 3900
ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt 3960
ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc 4020
gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt 4080
tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc 4140
cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga 4200
tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc 4260
aaaggaatag acgcgtgctg taagtctgca gaaattgatg atctattaaa caataaagat 4320
gtccactaaa atggaagttt ttcctgtcat actttgttaa gaagggtgag aacagagtac 4380
ctacattttg aatggaagga ttggagctac gggggtgggg gtggggtggg attagataaa 4440
tgcctgctct ttactgaagg ctctttacta ttgctttatg ataatgtttc atagttggat 4500
atcataattt aaacaagcaa aaccaaatta agggccagct cattcctccc actcatgatc 4560
tatggatcta tagatctctc gtgcagctgg ggctctaggg ggtatcccca cgcgccctgt 4620
agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 4680
agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 4740
tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 4800
cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 4860
tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 4920
caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 4980
ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaattaa 5040
ttctgtggaa tgtgtgtcag ttagtcgcga tgtgtgacta gttagttatt aatagtaatc 5100
aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 5160
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 5220
tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 5280
gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 5340
cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 5400
tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 5460
gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 5520
cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 5580
taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 5640
aagcagagct catgatagaa gcactctact attcgtcgac cgatcctgag aacttcaggg 5700
tgagtttggg gacccttgat tgttctttct ttttcgctat tgtaaaattc atgttatatg 5760
gagggggcaa agttttcagg gtgttgttta gaatgggaag atgtcccttg tatcaccatg 5820
gaccctcatg ataattttgt ttctttcact ttctactctg ttgacaacca ttgtctcctc 5880
ttattttctt ttcattttct gtaacttttt cgttaaactt tagcttgcat ttgtaacgaa 5940
tttttaaatt cacttttgtt tatttgtcag attgtaagta ctttctctaa tcactttttt 6000
ttcaaggcaa tcagggtata ttatattgta cttcagcaca gttttagaga acaattgtta 6060
taattaaatg ataaggtaga atatttctgc atataaattc tggctggcgt ggaaatattc 6120
ttattggtag aaacaactac accctggtca tcatcctgcc tttctcttta tggttacaat 6180
gatatacact gtttgagatg aggataaaat actctgagtc caaaccgggc ccctctgcta 6240
accatgttca tgccttcttc tctttcctac agctcctggg caacgtgctg gttgttgtgc 6300
tgtctcatca ttttggcaaa gaattaagct tatac 6335
<210> 43
<211> 115
<212> PRT
<213> Artificial
<220>
<223> consensus sequence
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (28)..(28)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (30)..(30)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (34)..(35)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (93)..(93)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (93)..(93)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (96)..(96)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (100)..(100)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (111)..(111)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (114)..(114)
<223> Xaa can be any naturally occurring amino acid
<400> 43
Xaa Asp Val Trp Gly Gln Gly Thr Thr Val Xaa Val Ser Ser Ala Ser
1 5 10 15
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Xaa Ser Xaa Ser Thr
20 25 30
Ser Xaa Xaa Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
35 40 45
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
50 55 60
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
65 70 75 80
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Xaa Thr Tyr Xaa
85 90 95
Cys Asn Val Xaa His Lys Pro Ser Asn Thr Lys Val Asp Lys Xaa Val
100 105 110
Glu Xaa Lys
115
<210> 44
<211> 225
<212> PRT
<213> Artificial
<220>
<223> consensus sequence
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (47)..(47)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (53)..(53)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (75)..(75)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (106)..(106)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (109)..(110)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (134)..(135)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (137)..(137)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (188)..(188)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (198)..(198)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (224)..(224)
<223> Xaa can be any naturally occurring amino acid
<400> 44
Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Xaa Leu Gly Gly
1 5 10 15
Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile
20 25 30
Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Xaa Glu
35 40 45
Asp Pro Glu Val Xaa Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
50 55 60
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Xaa Asn Ser Thr Tyr Arg
65 70 75 80
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
85 90 95
Glu Tyr Lys Cys Lys Val Ser Asn Lys Xaa Leu Pro Xaa Xaa Ile Glu
100 105 110
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
115 120 125
Thr Leu Pro Pro Ser Xaa Xaa Glu Xaa Thr Lys Asn Gln Val Ser Leu
130 135 140
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
145 150 155 160
Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
165 170 175
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Xaa Leu Thr Val Asp
180 185 190
Lys Ser Arg Trp Gln Xaa Gly Asn Val Phe Ser Cys Ser Val Met His
195 200 205
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Xaa
210 215 220
Gly
225
<210> 45
<211> 60
<212> PRT
<213> Artificial
<220>
<223> consensus sequence
<220>
<221> MISC_FEATURE
<222> (13)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (21)..(22)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (24)..(27)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (31)..(31)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (34)..(34)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (48)..(48)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (50)..(50)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (54)..(54)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (56)..(56)
<223> Xaa can be any naturally occurring amino acid
<400> 45
Ser Asp Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Xaa Xaa Pro Xaa
1 5 10 15
Leu Leu Ile Tyr Xaa Xaa Ser Xaa Xaa Xaa Xaa Gly Val Pro Xaa Arg
20 25 30
Phe Xaa Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Xaa
35 40 45
Leu Xaa Pro Glu Asp Xaa Ala Xaa Tyr Tyr Cys Gln
50 55 60
<210> 46
<211> 118
<212> PRT
<213> Artificial
<220>
<223> consensus sequence
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 46
Thr Phe Gly Xaa Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
1 5 10 15
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
20 25 30
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
35 40 45
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
50 55 60
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
65 70 75 80
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
85 90 95
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
100 105 110
Phe Asn Arg Gly Glu Cys
115
Claims (135)
- 스트레스-유도된 만노스-결합 렉틴을 코드화하는 재조합 폴리뉴클레오티드와 다중-하위유닛 단백질을 코드화하는 폴리뉴클레오티드를 포함하는 세포.
- 제 1항에 있어서, 스트레스-유도된 만노스-결합 렉틴은 소포체 분해-증강 알파-만노시다제-유사 단백질 2(EDEM2)인 것을 특징으로 하는 세포.
- 제 2항에 있어서, EDEM2는 SEQ ID NO:8의 아미노산 서열을 포함하는 것을 특징으로 하는 세포.
- 제 2항에 있어서, EDEM2는 SEQ ID NO:1에 적어도 92% 동일한 아미노산 서열을 포함하는 것을 특징으로 하는 세포.
- 제 1항 내지 제 4항 중 어느 한 항에 있어서, 다중-하위유닛 단백질은 항체인 것을 특징으로 하는 세포.
- 제 5항에 있어서, 항체는 SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45 및 SEQ ID NO:46의 아미노산 서열을 포함하는 것을 특징으로 하는 세포.
- 제 1항 내지 제 6항 중 어느 한 항에 있어서, EDEM2의 상류에서 작동하는 잘못 접혀진 단백질 반응 전사 인자를 코드화하는 폴리뉴클레오티드를 포함하는 것을 특징으로 하는 세포.
- 제 7항에 있어서, 전사 인자는 XBP-1의 스플라이싱된 형태인 것을 특징으로 하는 세포.
- 제 8항에 있어서, XBP-1은 SEQ ID NO:13의 아미노산 서열을 포함하는 것을 특징으로 하는 세포.
- 제 8항에 있어서, XBP-1은 SEQ ID NO:9에 적어도 86% 동일한 아미노산 서열을 포함하는 것을 특징으로 하는 세포.
- 제 1항 내지 제 10항 중 어느 한 항에 있어서, 세포는 포유류 세포인 것을 특징으로 하는 세포.
- 제 1항 내지 제 11항 중 어느 한 항에 있어서, 세포는 CHO 세포인 것을 특징으로 하는 세포.
- 제 1항 내지 제 12항 중 어느 한 항의 세포로부터 유도된 셀라인.
- 제 13항에 있어서, 적어도 3g/L의 역가로 단백질을 생성하는 것을 특징으로 하는 셀라인.
- 제 13항 또는 제 14항에 있어서, 적어도 5g/L의 역가로 단백질을 생성하는 것을 특징으로 하는 셀라인.
- 제 13항 내지 제 15항 중 어느 한 항에 있어서, 적어도 8g/L의 역가로 단백질을 생성하는 것을 특징으로 하는 셀라인.
- 제 13항 내지 제 16항 중 어느 한 항에 있어서, 셀라인은 스트레스-유도된 만노스-결합 렉틴을 코드화하는 재조합 폴리뉴클레오티드를 포함하지 않는 셀라인의 통합된 세포 밀도보다 적어도 약 30% 더 큰 통합된 세포 밀도를 가지는 것을 특징으로 하는 셀라인.
- 제 13항 내지 제 17항 중 어느 한 항에 있어서, 셀라인은 스트레스-유도된 만노스-결합 렉틴을 코드화하는 재조합 폴리뉴클레오티드를 포함하지 않는 셀라인의 통합된 세포 밀도보다 적어도 약 50% 더 큰 통합된 세포 밀도를 가지는 것을 특징으로 하는 셀라인.
- 제 13항 내지 제 18항 중 어느 한 항에 있어서, 셀라인은 스트레스-유도된 만노스-결합 렉틴을 코드화하는 재조합 폴리뉴클레오티드를 포함하지 않는 셀라인의 통합된 세포 밀도보다 적어도 약 60% 더 큰 통합된 세포 밀도를 가지는 것을 특징으로 하는 셀라인.
- 제 13항 내지 제 19항 중 어느 한 항에 있어서, 셀라인은 스트레스-유도된 만노스-결합 렉틴을 코드화하는 재조합 폴리뉴클레오티드를 포함하지 않는 셀라인의 통합된 세포 밀도보다 적어도 약 90% 더 큰 통합된 세포 밀도를 가지는 것을 특징으로 하는 셀라인.
- 포유류의 유비퀴틴 C 프로모터에 작동가능하게 연결되고, EDEM2를 코드화하는 뉴클레오티드 서열을 포함하는 분리된 폴리뉴클레오티드.
- 제 21항에 있어서, EDEM2는 SEQ ID NO:8의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 21항 또는 제 22항에 있어서, EDEM2는 SEQ ID NO:8의 아미노산 서열로 구성되는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 21항 내지 제 23항 중 어느 한 항에 있어서, DEM2는 SEQ ID NO:1에 적어도 92% 동일한 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 21항 내지 제 24항 중 어느 한 항에 있어서, DEM2는 SEQ ID NO:1에 적어도 92% 동일한 아미노산 서열로 구성되는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 21항 내지 제 25항 중 어느 한 항에 있어서, EDEM2는 SEQ ID NO:1의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 21항 내지 제 26항 중 어느 한 항에 있어서, EDEM2는 SEQ ID NO:1의 아미노산 서열로 구성되는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 21항 내지 제 27항 중 어느 한 항에 있어서, SEQ ID NO:16의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 21항 내지 제 28항 중 어느 한 항에 있어서, SEQ ID NO:14 또는 SEQ ID NO:15의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 21항 내지 제 29항 중 어느 한 항에 있어서, 본질적으로 SEQ ID NO:14 또는 SEQ ID NO:15의 뉴클레오티드 서열로 구성되는 것을 특징으로 하는 폴리뉴클레오티드.
- 포유류 유비퀴틴 C 프로모터에 작동가능하게 연결되고, Xbp-1 단백질을 코드화하는 뉴클레오티드 서열을 포함하는 분리된 폴리뉴클레오티드.
- 제 31항에 있어서, Xbp-1 단백질은 SEQ ID NO:13의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 31항 또는 제 32항에 있어서, Xbp-1 단백질은 SEQ ID NO:13의 아미노산 서열로 구성되는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 31항 내지 제 33항 중 어느 한 항에 있어서, Xbp-1 단백질은 SEQ ID NO:9에 적어도 86% 동일한 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 31항 내지 제 34항 중 어느 한 항에 있어서, Xbp-1 단백질은 SEQ ID NO:9에 적어도 86% 동일한 아미노산 서열로 구성되는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 31항 내지 제 35항 중 어느 한 항에 있어서, Xbp-1 단백질은 SEQ ID NO:9의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 31항 내지 제 36항 중 어느 한 항에 있어서, Xbp-1 단백질은 SEQ ID NO:9의 아미노산 서열로 구성되는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 31항 내지 제 37항 중 어느 한 항에 있어서, SEQ ID NO:18의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 31항 내지 제 38항 중 어느 한 항에 있어서, SEQ ID NO:17의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 31항 내지 제 39항 중 어느 한 항에 있어서, 본질적으로 SEQ ID NO:17의 뉴클레오티드 서열로 구성되는 것을 특징으로 하는 폴리뉴클레오티드.
- 포유류 유비퀴틴 C 프로모터 또는 사람 CMV-IE 프로모터에 작동가능하게 연결되고, 항-GDF8 항체 중쇄를 코드화하는 뉴클레오티드 서열을 포함하는 분리된 폴리뉴클레오티드.
- 제 41항에 있어서, 항-GDF8 항체 중쇄는 SEQ ID NO:20의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 41항 또는 제 42항에 있어서, 항-GDF8 항체 중쇄는 SEQ ID NO:19의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 41항 내지 제 43항 중 어느 한 항에 있어서, 항-GDF8 항체 중쇄는 SEQ ID NO:19의 아미노산 서열로 구성되는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 41항 내지 제 44항 중 어느 한 항에 있어서, SEQ ID NO:23의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 41항 내지 제 45항 중 어느 한 항에 있어서, SEQ ID NO:24의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 41항 내지 제 46항 중 어느 한 항에 있어서, 본질적으로 SEQ ID NO:24의 뉴클레오티드 서열로 구성되는 것을 특징으로 하는 폴리뉴클레오티드.
- 포유류 유비퀴틴 C 프로모터 또는 사람 CMV-IE 프로모터에 작동가능하게 연결되고, 항-GDF8 항체 경쇄를 코드화하는 뉴클레오티드 서열을 포함하는 분리된 폴리뉴클레오티드.
- 제 48항에 있어서, 항-GDF8 항체 경쇄는 SEQ ID NO:22의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 48항 또는 제 49항에 있어서, 항-GDF8 항체 경쇄는 SEQ ID NO:21의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 48항 내지 제 50항 중 어느 한 항에 있어서, 항-GDF8 항체 경쇄는 SEQ ID NO:21의 아미노산 서열로 구성되는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 48항 내지 제 51항 중 어느 한 항에 있어서, SEQ ID NO:25의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 48항 내지 제 52항 중 어느 한 항에 있어서, SEQ ID NO:26의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 48항 내지 제 53항 중 어느 한 항에 있어서, 본질적으로 SEQ ID NO:26의 뉴클레오티드 서열로 구성되는 것을 특징으로 하는 폴리뉴클레오티드.
- 포유류 유비퀴틴 C 프로모터 또는 사람 CMV-IE 프로모터에 작동가능하게 연결되고, 항-ANG2 항체 중쇄를 코드화하는 뉴클레오티드 서열을 포함하는 분리된 폴리뉴클레오티드.
- 제 55항에 있어서, 항-ANG2 항체 중쇄는 SEQ ID NO:28의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 55항 또는 제 56항에 있어서, 항-ANG2 항체 중쇄는 SEQ ID NO:27의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 55항 내지 제 57항 중 어느 한 항에 있어서, 항-ANG2 항체 중쇄는 SEQ ID NO:27의 아미노산 서열로 구성되는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 55항 내지 제 58항 중 어느 한 항에 있어서, SEQ ID NO:31의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 55항 내지 제 59항 중 어느 한 항에 있어서, SEQ ID NO:32의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 55항 내지 제 60항 중 어느 한 항에 있어서, 본질적으로 SEQ ID NO:32의 뉴클레오티드 서열로 구성되는 것을 특징으로 하는 폴리뉴클레오티드.
- 포유류 유비퀴틴 C 프로모터 또는 사람 CMV-IE 프로모터에 작동가능하게 연결되고, 항-ANG2 항체 경쇄를 코드화하는 뉴클레오티드 서열을 포함하는 분리된 폴리뉴클레오티드.
- 제 62항에 있어서, 항-ANG2 항체 경쇄는 SEQ ID NO:30의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 62항 또는 제 63항에 있어서, 항-ANG2 항체 경쇄는 SEQ ID NO:29의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 62항 내지 제 64항 중 어느 한 항에 있어서, 항-ANG2 항체 경쇄는 SEQ ID NO:29의 아미노산 서열로 구성되는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 62항 내지 제 65항 중 어느 한 항에 있어서, SEQ ID NO:33의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 62항 내지 제 66항 중 어느 한 항에 있어서, SEQ ID NO:34의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 62항 내지 제 67항 중 어느 한 항에 있어서, 본질적으로 SEQ ID NO:34의 뉴클레오티드 서열로 구성되는 것을 특징으로 하는 폴리뉴클레오티드.
- 포유류 유비퀴틴 C 프로모터 또는 사람 CMV-IE 프로모터에 작동가능하게 연결되고, 항-AngPtl4 항체 중쇄를 코드화하는 뉴클레오티드 서열을 포함하는 분리된 폴리뉴클레오티드.
- 제 69항에 있어서, 항-AngPtl4 항체 중쇄는 SEQ ID NO:36의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 69항 또는 제 70항에 있어서, 항-AngPtl4 항체 중쇄는 SEQ ID NO:35의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 69항 내지 제 71항 중 어느 한 항에 있어서, 항-AngPtl4 항체 중쇄는 SEQ ID NO:35의 아미노산 서열로 구성되는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 69항 내지 제 72항 중 어느 한 항에 있어서, SEQ ID NO:39의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 69항 내지 제 73항 중 어느 한 항에 있어서, SEQ ID NO:40의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 69항 내지 제 74항 중 어느 한 항에 있어서, 본질적으로 SEQ ID NO:40의 뉴클레오티드 서열로 구성되는 것을 특징으로 하는 폴리뉴클레오티드.
- 포유류 유비퀴틴 C 프로모터 또는 사람 CMV-IE 프로모터에 작동가능하게 연결되고, 항-AngPtl4 항체 경쇄를 코드화하는 뉴클레오티드 서열을 포함하는 분리된 폴리뉴클레오티드.
- 제 76항에 있어서, 항-AngPtl4 항체 경쇄는 SEQ ID NO:38의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 76항 또는 제 77항에 있어서, 항-AngPtl4 항체 경쇄는 SEQ ID NO:37의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 76항 내지 제 78항 중 어느 한 항에 있어서, 항-AngPtl4 항체 경쇄는 SEQ ID NO:37의 아미노산 서열로 구성되는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
- 제 76항 내지 제 79항 중 어느 한 항에 있어서, SEQ ID NO:41의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 76항 내지 제 80항 중 어느 한 항에 있어서, SEQ ID NO:42의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드.
- 제 76항 내지 제 81항 중 어느 한 항에 있어서, 본질적으로 SEQ ID NO:42의 뉴클레오티드 서열로 구성되는 것을 특징으로 하는 폴리뉴클레오티드.
- SEQ ID NO:43의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 분리된 폴리뉴클레오티드.
- SEQ ID NO:44의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 분리된 폴리뉴클레오티드.
- SEQ ID NO:43 및 SEQ ID NO:44의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 분리된 폴리뉴클레오티드.
- SEQ ID NO:45의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 분리된 폴리뉴클레오티드.
- SEQ ID NO:46의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 분리된 폴리뉴클레오티드.
- SEQ ID NO:45 및 SEQ ID NO:46의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 분리된 폴리뉴클레오티드.
- 제 21항 내지 제 30항 중 어느 한 항의 분리된 폴리뉴클레오티드와 (b) 다중-하위유닛 단백질을 코드화하는 폴리뉴클레오티드를 포함하는 세포.
- 제 89항에 있어서, 다중-하위유닛 단백질은 항체인 것을 특징으로 하는 세포.
- 제 90항에 있어서, 항체는 제 83항 내지 제 88항 중 어느 한 항의 아미노산 서열을 포함하는 것을 특징으로 하는 세포.
- 제 91항에 있어서, 항체는 제 85항 및 제 88항의 아미노산 서열을 포함하는 것을 특징으로 하는 세포.
- 제 89항 내지 제 92항 중 어느 한 항에 있어서, 추가로 제 31항 내지 제 40항 중 어느 한 항의 폴리뉴클레오티드를 포함하는 것을 특징으로 하는 세포.
- 제 89항 내지 제 93항 중 어느 한 항에 있어서, 제 41항 내지 제 47항 중 어느 한 항의 폴리뉴클레오티드와 제 48항 내지 제 54항 중 어느 한 항의 폴리뉴클레오티드를 포함하는 것을 특징으로 하는 세포.
- 제 89항 내지 제 93항 중 어느 한 항에 있어서, 제 55항 내지 제 61항 중 어느 한 항의 폴리뉴클레오티드와 제 62항 내지 제 68항 중 어느 한 항의 폴리뉴클레오티드를 포함하는 것을 특징으로 하는 세포.
- 제 89항 내지 제 93항 중 어느 한 항에 있어서, 제 69항 내지 제 75항 중 어느 한 항의 폴리뉴클레오티드와 제 76항 내지 제 82항 중 어느 한 항의 폴리뉴클레오티드를 포함하는 것을 특징으로 하는 세포.
- 제 89항 내지 제 96항 중 어느 한 항에 있어서, 세포는 차이니즈 햄스터 난소(CHO) 세포인 것을 특징으로 하는 세포.
- 제 89항 내지 제 97항 중 어느 한 항의 세포를 배지에서 배양하는 단계로 이루어지는 다중-하위유닛 단백질의 제조 방법으로서, 이때 다중-하위유닛 단백질은 세포에 의해 배지 안으로 분비되는 것을 특징으로 하는 방법.
- 제 98항에 있어서, 분비된 다중-하위유닛 단백질은 적어도 약 3g/L의 배지 중의 역가를 획득하는 것을 특징으로 하는 방법.
- 제 98항 또는 제 99항에 있어서, 분비된 다중-하위유닛 단백질은 적어도 약 5g/L의 배지 중의 역가를 획득하는 것을 특징으로 하는 방법.
- 제 89항 내지 제 91항 중 어느 한 항에 있어서, 분비된 다중-하위유닛 단백질은 적어도 약 6g/L의 배지 중의 역가를 획득하는 것을 특징으로 하는 방법.
- 제 89항 내지 제 92항 중 어느 한 항에 있어서, 분비된 다중-하위유닛 단백질은 적어도 약 8g/L의 배지 중의 역가를 획득하는 것을 특징으로 하는 방법.
- 제 89항 내지 제 93항 중 어느 한 항에 있어서, 세포는 적어도 약 5×107 세포-일/mL의 통합된 세포 밀도로 배지중에서 분할되는 것을 특징으로 하는 방법.
- 제 89항 내지 제 94항 중 어느 한 항에 있어서, 세포는 적어도 약 1×108 세포-일/mL의 통합된 세포 밀도를 이루기 위해 배지중에서 분할되는 것을 특징으로 하는 방법.
- 제 89항 내지 제 95항 중 어느 한 항에 있어서, 세포는 적어도 약 1.5×108 세포-일/mL의 통합된 세포 밀도를 이루기 위해 배지중에서 분할되는 것을 특징으로 하는 방법.
- 제 89항 내지 제 96항 중 어느 한 항에 있어서, 추가로 분비된 다중-하위유닛 단백질을 배지로부터 정제하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제 98항 내지 제 106항 중 어느 한 항의 방법에 따라 제조된 다중-하위유닛 단백질.
- 제 107항에 있어서, 다중-하위유닛 단백질은 항체인 것을 특징으로 하는 다중-하위유닛 단백질.
- 제 108항에 있어서, 항체는 SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45 및 SEQ ID NO:46의 아미노산 서열을 포함하는 것을 특징으로 하는 다중-하위유닛 단백질.
- 제 109항에 있어서, 항체는 항-GDF8 항체인 것을 특징으로 하는 다중-하위유닛 단백질.
- 제 110항에 있어서, 항체는 SEQ ID NO:20 및 SEQ ID NO:22의 아미노산 서열을 포함하는 것을 특징으로 하는 다중-하위유닛 단백질.
- 제 109항에 있어서, 항체는 항-ANG2 항체인 것을 특징으로 하는 다중-하위유닛 단백질.
- 제 112항에 있어서, 항체는 SEQ ID NO:28 및 SEQ ID NO:30의 아미노산 서열을 포함하는 것을 특징으로 하는 다중-하위유닛 단백질.
- 제 109항에 있어서, 항체는 항-AngPtl4 항체인 것을 특징으로 하는 다중-하위유닛 단백질.
- 제 114항에 있어서, 항체는 SEQ ID NO:36 및 SEQ ID NO:38의 아미노산 서열을 포함하는 것을 특징으로 하는 다중-하위유닛 단백질.
- SEQ ID NO:16의 핵산 서열을 포함하는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:16의 핵산 서열을 포함하는 폴리뉴클레오티드와 (b) SEQ ID NO:18의 핵산 서열을 포함하는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:16의 핵산 서열을 포함하는 폴리뉴클레오티드, (b) SEQ ID NO:43 및 SEQ ID NO:44의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 폴리뉴클레오티드 및 (c) SEQ ID NO:45 및 SEQ ID NO:46의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:16의 핵산 서열을 포함하는 폴리뉴클레오티드, (b) SEQ ID NO:23의 핵산 서열을 포함하는 폴리뉴클레오티드 및 (c) SEQ ID NO:25의 핵산 서열을 포함하는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:16의 핵산 서열을 포함하는 폴리뉴클레오티드, (b) SEQ ID NO:31의 핵산 서열을 포함하는 폴리뉴클레오티드 및 (c) SEQ ID NO:33의 핵산 서열을 포함하는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:16의 핵산 서열을 포함하는 폴리뉴클레오티드, (b) SEQ ID NO:39의 핵산 서열을 포함하는 폴리뉴클레오티드 및 (c) SEQ ID NO:41의 핵산 서열을 포함하는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:16의 핵산 서열을 포함하는 폴리뉴클레오티드, (b) SEQ ID NO:18의 핵산 서열을 포함하는 폴리뉴클레오티드, (c) SEQ ID NO:43 및 SEQ ID NO:44의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 폴리뉴클레오티드 및 (d) SEQ ID NO:45 및 SEQ ID NO:46의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:16의 핵산 서열을 포함하는 폴리뉴클레오티드, (b) SEQ ID NO:18의 핵산 서열을 포함하는 폴리뉴클레오티드, (c) SEQ ID NO:23의 핵산 서열을 포함하는 폴리뉴클레오티드 및 (d) SEQ ID NO:25의 핵산 서열을 포함하는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:16의 핵산 서열을 포함하는 폴리뉴클레오티드, (b) SEQ ID NO:18의 핵산 서열을 포함하는 폴리뉴클레오티드, (c) SEQ ID NO:31의 핵산 서열을 포함하는 폴리뉴클레오티드 및 (d) SEQ ID NO:33의 핵산 서열을 포함하는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:16의 핵산 서열을 포함하는 폴리뉴클레오티드, (b) SEQ ID NO:18의 핵산 서열을 포함하는 폴리뉴클레오티드, (c) SEQ ID NO:39 핵산 서열을 포함하는 폴리뉴클레오티드 및 (d) SEQ ID NO:41의 핵산 서열을 포함하는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- SEQ ID NO:14 또는 15의 핵산 서열로 구성되는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:14 또는 15의 핵산 서열로 구성되는 폴리뉴클레오티드 및 (b) SEQ ID NO:17의 핵산 서열로 구성되는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:14 또는 15의 핵산 서열로 구성되는 폴리뉴클레오티드, (b) SEQ ID NO:43 및 SEQ ID NO:44의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 폴리뉴클레오티드 및 (c) SEQ ID NO:45 및 SEQ ID NO:46의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:14 또는 15의 핵산 서열로 구성되는 폴리뉴클레오티드, (b) SEQ ID NO:24의 핵산 서열로 구성되는 폴리뉴클레오티드 및 (c) SEQ ID NO:26의 핵산 서열로 구성되는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:14 또는 15의 핵산 서열로 구성되는 폴리뉴클레오티드, (b) SEQ ID NO:32의 핵산 서열로 구성되는 폴리뉴클레오티드 및 (c) SEQ ID NO:34의 핵산 서열로 구성되는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:14 또는 15의 핵산 서열로 구성되는 폴리뉴클레오티드, (b) SEQ ID NO:40의 핵산 서열로 구성되는 폴리뉴클레오티드 및 (c) SEQ ID NO:42의 핵산 서열로 구성되는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:14 또는 15의 핵산 서열로 구성되는 폴리뉴클레오티드, (b) SEQ ID NO:17의 핵산 서열로 구성되는 폴리뉴클레오티드, (c) SEQ ID NO:43 및 SEQ ID NO:44의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 폴리뉴클레오티드 및 (d) SEQ ID NO:45 및 SEQ ID NO:46의 아미노산 서열을 포함하는 폴리펩티드를 코드화하는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:14 또는 15의 핵산 서열로 구성되는 폴리뉴클레오티드, (b) SEQ ID NO:17의 핵산 서열로 구성되는 폴리뉴클레오티드, (c) SEQ ID NO:24의 핵산 서열로 구성되는 폴리뉴클레오티드 및 (d) SEQ ID NO:26의 핵산 서열로 구성되는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:14 또는 15의 핵산 서열로 구성되는 폴리뉴클레오티드, (b) SEQ ID NO:17의 핵산 서열로 구성되는 폴리뉴클레오티드, (c) SEQ ID NO:32의 핵산 서열로 구성되는 폴리뉴클레오티드 및 (d) SEQ ID NO:34의 핵산 서열로 구성되는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
- (a) SEQ ID NO:14 또는 15의 핵산 서열로 구성되는 폴리뉴클레오티드, (b) SEQ ID NO:17의 핵산 서열로 구성되는 폴리뉴클레오티드, (c) SEQ ID NO:40의 핵산 서열로 구성되는 폴리뉴클레오티드 및 (d) SEQ ID NO:42의 핵산 서열로 구성되는 폴리뉴클레오티드를 포함하는 생체 외 포유류 세포.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020207017417A KR102346867B1 (ko) | 2012-05-29 | 2013-05-29 | 생성 셀라인 인핸서 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261652549P | 2012-05-29 | 2012-05-29 | |
US61/652,549 | 2012-05-29 | ||
US13/904,587 US9079954B2 (en) | 2012-05-29 | 2013-05-29 | Production cell line enhancers |
PCT/US2013/043116 WO2013181253A1 (en) | 2012-05-29 | 2013-05-29 | Production cell line enhancers |
US13/904,587 | 2013-05-29 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207017417A Division KR102346867B1 (ko) | 2012-05-29 | 2013-05-29 | 생성 셀라인 인핸서 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150015492A true KR20150015492A (ko) | 2015-02-10 |
KR102126210B1 KR102126210B1 (ko) | 2020-06-25 |
Family
ID=49670701
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237014681A KR102663134B1 (ko) | 2012-05-29 | 2013-05-29 | 생성 셀라인 인핸서 |
KR1020147033930A KR102126210B1 (ko) | 2012-05-29 | 2013-05-29 | 생성 셀라인 인핸서 |
KR1020217043208A KR102528950B1 (ko) | 2012-05-29 | 2013-05-29 | 생성 셀라인 인핸서 |
KR1020207017417A KR102346867B1 (ko) | 2012-05-29 | 2013-05-29 | 생성 셀라인 인핸서 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237014681A KR102663134B1 (ko) | 2012-05-29 | 2013-05-29 | 생성 셀라인 인핸서 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217043208A KR102528950B1 (ko) | 2012-05-29 | 2013-05-29 | 생성 셀라인 인핸서 |
KR1020207017417A KR102346867B1 (ko) | 2012-05-29 | 2013-05-29 | 생성 셀라인 인핸서 |
Country Status (21)
Country | Link |
---|---|
US (9) | US9079954B2 (ko) |
EP (3) | EP3564262A1 (ko) |
JP (5) | JP6298455B2 (ko) |
KR (4) | KR102663134B1 (ko) |
CN (2) | CN110835624A (ko) |
AU (4) | AU2013267525B2 (ko) |
BR (1) | BR112014029095A2 (ko) |
CA (1) | CA2873131A1 (ko) |
DK (1) | DK2875047T5 (ko) |
EA (2) | EA201792213A1 (ko) |
ES (1) | ES2940900T3 (ko) |
FI (1) | FI2875047T3 (ko) |
HK (1) | HK1205137A1 (ko) |
HU (1) | HUE061479T2 (ko) |
IL (3) | IL235573B (ko) |
MX (1) | MX360359B (ko) |
PL (1) | PL2875047T3 (ko) |
SG (2) | SG10201606654XA (ko) |
TW (2) | TWI641687B (ko) |
WO (1) | WO2013181253A1 (ko) |
ZA (1) | ZA201408289B (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI641687B (zh) | 2012-05-29 | 2018-11-21 | 美商再生元醫藥公司 | 生產細胞株增強子 |
CN109071633B (zh) | 2016-04-20 | 2022-11-18 | 瑞泽恩制药公司 | 基于使用表达增强性基因座来制备抗体的组合物和方法 |
KR102547738B1 (ko) | 2016-04-20 | 2023-06-26 | 리제너론 파마슈티칼스 인코포레이티드 | 발현 강화 유전자좌의 사용에 기초하여 항체를 만들기 위한 조성물 및 방법 |
US10995152B2 (en) | 2016-10-26 | 2021-05-04 | The Board Of Trustees Of The Leland Stanford Junior University | Modified immunoglobulin hinge regions to reduce hemagglutination |
US11135266B2 (en) | 2016-11-21 | 2021-10-05 | Just-Evotec Biologics, Inc. | Aflibercept formulations and uses thereof |
CA3067735A1 (en) | 2017-08-17 | 2019-02-21 | Just Biotherapeutics, Inc. | Method of purifying glycosylated protein from host cell galectins and other contaminants |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070061524A (ko) * | 2004-07-20 | 2007-06-13 | 제넨테크, 인크. | 안지오포이에틴-유사 4 단백질을 사용하는 조성물 및 방법 |
KR20100074321A (ko) * | 2007-11-01 | 2010-07-01 | 와이어쓰 엘엘씨 | 성장 및 분화 인자-8에 대한 항체의 용도 |
KR20110055726A (ko) * | 2008-10-08 | 2011-05-25 | 에프. 호프만-라 로슈 아게 | 이중특이성 항-vegf/항-ang-2 항체 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60211329T2 (de) | 2001-01-16 | 2007-05-24 | Regeneron Pharmaceuticals, Inc. | Isolierung von sezernierte proteine exprimierenden zellen |
US7455988B2 (en) | 2002-05-29 | 2008-11-25 | Regeneron Pharmaceuticals, Inc. | Inducible eukaryotic expression system |
CA2496897C (en) | 2002-08-30 | 2012-01-31 | President And Fellows Of Harvard College | Methods and compositions for modulating xbp-1 activity |
NZ544335A (en) * | 2003-06-11 | 2009-01-31 | Biogen Idec Inc | Method to increase protein production in culture |
US20050106667A1 (en) * | 2003-08-01 | 2005-05-19 | Genentech, Inc | Binding polypeptides with restricted diversity sequences |
JP2007537728A (ja) * | 2004-03-31 | 2007-12-27 | セントカー・インコーポレーテツド | タンパク質生産速度の変更方法 |
ES2653843T3 (es) | 2004-09-02 | 2018-02-09 | Wyeth Llc | Sistemas y procedimientos de producción de proteínas |
JP2008513465A (ja) * | 2004-09-15 | 2008-05-01 | ザ プレジデント アンド フェロウズ オブ ハーバード カレッジ | 肥満及び糖尿病の治療におけるerストレス低減 |
EP1964922A1 (en) * | 2007-03-02 | 2008-09-03 | Boehringer Ingelheim Pharma GmbH & Co. KG | Improvement of protein production |
EP2129685B1 (en) | 2007-03-21 | 2013-11-20 | Danisco US Inc. | Over expression of foldases and chaperones improves protein production |
ES2522615T3 (es) | 2007-06-04 | 2014-11-17 | Regeneron Pharmaceuticals, Inc. | Regiones de expresión y estabilidad potenciadas |
EP3260129A1 (en) * | 2007-08-03 | 2017-12-27 | Eli Lilly and Company | An fgf-21 compound and a glp-1 compound for use in the treatment of obesity |
WO2009062789A1 (en) | 2007-11-13 | 2009-05-22 | Boehringer Ingelheim Pharma Gmbh & Co Kg | Improving the secretory capacity in host cells |
US20090247609A1 (en) * | 2007-12-20 | 2009-10-01 | Hitto Kaufmann | Sm-protein based secretion engineering |
EP2297331B1 (en) * | 2008-05-28 | 2015-03-25 | Bayer HealthCare, LLC | Methods and compositions for production of recombinant protein in hbx-expressing mammalian cells |
WO2010008860A1 (en) | 2008-06-23 | 2010-01-21 | President And Fellows Of Harvard College | Modulation of neurodegenerative disease by modulating xbp-1 activity |
GB0902180D0 (en) | 2009-02-10 | 2009-03-25 | Ucb Pharma Sa | Method for producing protein |
US8722046B2 (en) * | 2009-04-08 | 2014-05-13 | The United States Of America As Represented By The Secretary Of The Army | Human monoclonal antibodies protective against bubonic plague |
DK2438171T3 (en) | 2009-06-02 | 2015-01-26 | Regeneron Pharma | Fucosylerings-deficient cells |
JO3182B1 (ar) | 2009-07-29 | 2018-03-08 | Regeneron Pharma | مضادات حيوية بشرية عالية الالفة مع تولد الاوعية البشرية - 2 |
JO3274B1 (ar) * | 2009-12-24 | 2018-09-16 | Regeneron Pharma | أجسام مضادة بشرية للبروتين 4 المشابه لأجيوبيوتين البشري |
JO3340B1 (ar) | 2010-05-26 | 2019-03-13 | Regeneron Pharma | مضادات حيوية لـعامل تمايز النمو 8 البشري |
TWI641687B (zh) | 2012-05-29 | 2018-11-21 | 美商再生元醫藥公司 | 生產細胞株增強子 |
EP3919069A1 (en) | 2012-11-05 | 2021-12-08 | Dana-Farber Cancer Institute, Inc. | Xbp1, cd138, and cs1 peptides, pharmaceutical compositions that include the peptides, and methods of using such peptides and compositions |
-
2013
- 2013-05-28 TW TW102118721A patent/TWI641687B/zh active
- 2013-05-28 TW TW107107833A patent/TW201823460A/zh unknown
- 2013-05-29 EP EP19177521.2A patent/EP3564262A1/en not_active Withdrawn
- 2013-05-29 HU HUE13729169A patent/HUE061479T2/hu unknown
- 2013-05-29 CN CN201911104558.3A patent/CN110835624A/zh active Pending
- 2013-05-29 EA EA201792213A patent/EA201792213A1/ru unknown
- 2013-05-29 KR KR1020237014681A patent/KR102663134B1/ko active IP Right Grant
- 2013-05-29 ES ES13729169T patent/ES2940900T3/es active Active
- 2013-05-29 CN CN201380028164.9A patent/CN104350068B/zh active Active
- 2013-05-29 DK DK13729169.6T patent/DK2875047T5/da active
- 2013-05-29 US US13/904,587 patent/US9079954B2/en active Active
- 2013-05-29 WO PCT/US2013/043116 patent/WO2013181253A1/en active Application Filing
- 2013-05-29 FI FIEP13729169.6T patent/FI2875047T3/fi active
- 2013-05-29 CA CA2873131A patent/CA2873131A1/en active Pending
- 2013-05-29 EA EA201492242A patent/EA028790B1/ru not_active IP Right Cessation
- 2013-05-29 SG SG10201606654XA patent/SG10201606654XA/en unknown
- 2013-05-29 PL PL13729169.6T patent/PL2875047T3/pl unknown
- 2013-05-29 AU AU2013267525A patent/AU2013267525B2/en active Active
- 2013-05-29 MX MX2014014630A patent/MX360359B/es active IP Right Grant
- 2013-05-29 KR KR1020147033930A patent/KR102126210B1/ko active IP Right Grant
- 2013-05-29 KR KR1020217043208A patent/KR102528950B1/ko active IP Right Grant
- 2013-05-29 JP JP2015515154A patent/JP6298455B2/ja active Active
- 2013-05-29 KR KR1020207017417A patent/KR102346867B1/ko active IP Right Grant
- 2013-05-29 EP EP22214230.9A patent/EP4219546A3/en active Pending
- 2013-05-29 BR BR112014029095A patent/BR112014029095A2/pt not_active Application Discontinuation
- 2013-05-29 EP EP13729169.6A patent/EP2875047B1/en active Active
- 2013-05-29 SG SG11201407652RA patent/SG11201407652RA/en unknown
-
2014
- 2014-11-09 IL IL235573A patent/IL235573B/en active IP Right Grant
- 2014-11-12 ZA ZA2014/08289A patent/ZA201408289B/en unknown
- 2014-11-26 US US14/555,220 patent/US9382315B2/en active Active
-
2015
- 2015-06-11 US US14/737,090 patent/US10227401B2/en active Active
- 2015-06-12 HK HK15105590.6A patent/HK1205137A1/xx unknown
- 2015-06-29 US US14/754,112 patent/US9193786B2/en active Active
- 2015-06-29 US US14/754,146 patent/US9228012B2/en active Active
-
2016
- 2016-07-01 US US15/201,104 patent/US9688751B2/en not_active Ceased
-
2017
- 2017-06-16 US US15/624,982 patent/US10351622B2/en active Active
-
2018
- 2018-02-14 AU AU2018201094A patent/AU2018201094B2/en active Active
- 2018-02-23 JP JP2018030324A patent/JP6622334B2/ja active Active
-
2019
- 2019-04-07 IL IL265867A patent/IL265867A/en unknown
- 2019-04-17 US US16/387,134 patent/USRE48651E1/en active Active
- 2019-05-21 US US16/417,792 patent/US10611831B2/en active Active
- 2019-05-30 AU AU2019203780A patent/AU2019203780B2/en active Active
- 2019-11-21 JP JP2019210124A patent/JP7037535B2/ja active Active
-
2021
- 2021-01-03 IL IL279922A patent/IL279922A/en unknown
- 2021-10-01 AU AU2021240303A patent/AU2021240303A1/en active Pending
- 2021-12-27 JP JP2021212131A patent/JP7382383B2/ja active Active
-
2023
- 2023-08-22 JP JP2023134346A patent/JP2023153268A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070061524A (ko) * | 2004-07-20 | 2007-06-13 | 제넨테크, 인크. | 안지오포이에틴-유사 4 단백질을 사용하는 조성물 및 방법 |
KR20100074321A (ko) * | 2007-11-01 | 2010-07-01 | 와이어쓰 엘엘씨 | 성장 및 분화 인자-8에 대한 항체의 용도 |
KR20110055726A (ko) * | 2008-10-08 | 2011-05-25 | 에프. 호프만-라 로슈 아게 | 이중특이성 항-vegf/항-ang-2 항체 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019203780B2 (en) | Production cell line enhancers | |
CN101553506B (zh) | Lingo结合分子及其制药用途 | |
CN110023500B (zh) | 作为选择标记的减毒谷氨酰胺合成酶 | |
KR101761709B1 (ko) | 부위 특이적 통합 | |
KR102636351B1 (ko) | 고활성 조절 요소 | |
CN109260478A (zh) | 通过序列特异性转肽酶制备免疫配体/效应分子结合物的方法 | |
CN101595228A (zh) | 包括sorf构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法 | |
CN101208425A (zh) | 产生复制缺陷型腺病毒的细胞系 | |
KR20070002052A (ko) | IL-15/Fc 융합 단백질의 제조를 위한 발현 시스템 및이의 용도 | |
CN101287498A (zh) | Psma抗体-药物缀合物 | |
KR20210144861A (ko) | 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위 | |
KR102584628B1 (ko) | T-세포 수용체, t-세포 항원 및 이들의 기능성 상호작용의 식별 및 특징규명을 위한 조작된 다성분 시스템 | |
KR20230056630A (ko) | 신규의 omni-59, 61, 67, 76, 79, 80, 81 및 82 crispr 뉴클레아제 | |
CN107207603A (zh) | 趋化因子‑免疫球蛋白融合多肽,其组合物、制备方法以及用途 | |
CN101180082A (zh) | 利用siv-pedf载体治疗伴随眼组织细胞凋亡变性的疾患的药物 | |
CN101160139A (zh) | 含有pedf以及fgf2的伴随眼组织细胞凋亡变性的疾患的治疗药物 | |
KR20240021906A (ko) | 발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법 | |
CN117881788A (zh) | 表达载体、无细菌序列载体及其制备和使用方法 | |
KR20230117327A (ko) | 가용성 알칼리성 포스파타제 작제물 및 가용성 알칼리성 포스파타제 작제물을 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터 | |
CN110777147A (zh) | 一种ikzf3基因沉默的t细胞及其应用 | |
KR20070018054A (ko) | 정제된 인터루킨-15/Fc융합 단백질 및 이의 제조방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
A107 | Divisional application of patent | ||
GRNT | Written decision to grant |