KR20070033956A - 신규 펩타이드 계열의 조성물, 방법 및 용도 - Google Patents
신규 펩타이드 계열의 조성물, 방법 및 용도 Download PDFInfo
- Publication number
- KR20070033956A KR20070033956A KR1020067017586A KR20067017586A KR20070033956A KR 20070033956 A KR20070033956 A KR 20070033956A KR 1020067017586 A KR1020067017586 A KR 1020067017586A KR 20067017586 A KR20067017586 A KR 20067017586A KR 20070033956 A KR20070033956 A KR 20070033956A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- glu
- val
- ile
- thr
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/345—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Brevibacterium (G)
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23K—FODDER
- A23K20/00—Accessory food factors for animal feeding-stuffs
- A23K20/10—Organic substances
- A23K20/142—Amino acids; Derivatives thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/04—Peptides having up to 20 amino acids in a fully defined sequence; Derivatives thereof
- A61K38/10—Peptides having 12 to 20 amino acids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/164—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/10—Antimycotics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P33/00—Antiparasitic agents
- A61P33/02—Antiprotozoals, e.g. for leishmaniasis, trichomoniasis, toxoplasmosis
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/08—Linear peptides containing only normal peptide links having 12 to 20 amino acids
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Gastroenterology & Hepatology (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Epidemiology (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- Polymers & Plastics (AREA)
- Molecular Biology (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Immunology (AREA)
- Animal Husbandry (AREA)
- Wood Science & Technology (AREA)
- Oncology (AREA)
- Communicable Diseases (AREA)
- Food Science & Technology (AREA)
- Biotechnology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Virology (AREA)
- General Engineering & Computer Science (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Feed For Specific Animals (AREA)
- Fodder In General (AREA)
Abstract
본 발명은 예를 들면, 항미생물제 또는 심지어 사료 첨가물로서 사용되는, 2종 이상의 D-아미노산을 갖는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 포함하는, 브레비바실러스 종으로부터의 신규한 펩타이드 및 이에 관련된 펩타이드의 조성물 및 특성화 방법 및 용도를 포함한다.
사료 첨가물, 항미생물제, 펩타이드, 브레비바실러스 종, 브레비바실러스 텍사스포러스, D-아미노산, BT, 오페론
Description
본 발명은 일반적으로 분리 및 정제된 신규한 펩타이드의 분야, 및 보다 특히, 새로이 발견된 생물체인 브레비바실러스 텍사스포러스(Brevibacillus texasporus)로부터의 신규 펩타이드 그룹의 동정, 특성화 및 용도에 관한 것이다.
본 출원은 본원에 참조로 인용된 관련 부분인, 2004년 1월 30일자로 출원된, 미국 가특허출원번호 제60/540,569호에 대한 우선권을 주장한다. 본 발명의 영역을 제한하지 않으면서, 이의 배경은 항생제 및 사료 첨가제와 관련되어 기술된다.
항생제 남용은 광범위한 세균 약물 내성을 초래하였다. 통상적인 항생제에 대한 세균 내성에 의해 유발된 감염과 맞서기 위해 신규한 항생제가 필요하다. 미생물이 경쟁 미생물에 대항하여 화학적 전투를 치르기 위해 매우 다양한 항생제를 생산함이 널리 공지되어 있다.
미생물 기원의 많은 펩타이드 항생제는 비(非)-리보솜성 펩타이드 신타제(NRPS)에 의해 합성되며 이들은 통상적이지 않은 아미노산을 포함한다. NRPS 효 소는 일반적으로 동선상(co-linear) 모듈 구조를 갖는다(문헌[참조: Mootz, et al., 2002]). 개별 모듈의 N-말단에서 C-말단으로의 순서 및 특이성은 당해 펩타이드 생성물의 아미노산 잔기의 순차적 순서 및 실체에 상응한다. 각각의 NRPS 모듈은 특이적 아미노산을 인식하고 단계별 축합을 촉진시켜 성장하는 펩타이드 쇄를 형성한다. 특정 모듈에 의해 인식된 아미노산의 실체는 공지된 특이성의 다른 모듈에 비교하여 예측할 수 있다(문헌[참조: Challis, et al., 2000]). 이러한 엄격한 상관관계 덕택에, 미코박테리움 튜버쿨로시스(Mycobacterium tuberculosis)의 게놈 내의 미코박틴 생합성 오페론의 동정에 의해 입증된 바와 같이, 공지된 구조를 갖는 다수의 미생물 비-리보솜성 펩타이드에 대한 NRPS 요소를 암호화하는 유전자를 동정할 수 있게 되었다(문헌[참조: Quadri, et al., 1998]). 그럼에도 불구하고, 당해 분야는 신규한 항미생물제의 분리, 동정 및 특성화에 대한 지속적인 필요를 인식하고 있다.
사료 첨가제의 예는 당해 분야에 널리 공지되어 있다. 예를 들면, Register에게 허여된 미국 특허 제6,682,762호는 이러한 가금류 및 가축 사료 첨가제를 개시한다. 간략히, 당해 특허는 음식물 전해질 균형을 증가시키기 위해 36중량% 전해질, 조질 식료(roughage) 및 광유를 함유시킨 가금류 및 가축 사료 첨가제 조성물을 교시한다. 전해질 첨가 조성물의 첨가는 계란 생산, 체중, 및 열 스트레스로 인한 폐사 감소와 같은 암탉 사육 성능을 개선한다. 이러한 식단으로 사육한 브로일러(Broiler) 닭은 가공률, 사료 전환 및 체중의 증가를 제공한다. 가금류 및 가축에 대한 이러한 음식물 전해질 사료의 제조 방법 또한 기술되어 있다.
사료 첨가물의 다른 예는 미국 특허 제6,503,544호에서 저자 Nagai 등에 의한 교시인데, 다음의 3가지 성분 (a, (b) 및 (c)로 이루어진 그룹 중에서 선택된 2종 이상의 성분을 포함하는 동물 사료 첨가물을 교시한다: (a) 파인니들(Pine Needle), 산사나무 열매(Hawthorn Fruit), 대두창출(Bighead Atractylodes Rhizome), 자운영 뿌리(Milkvetch Root), 골무꽃 뿌리(Skullcap Root), 탄제린 열매(Tangerine Fruit) 및 민트 시프팅(Mint Sifting); (b) 효모 세포벽 및 락토바실러스 애시도필러스(Lactobacillus acidophilus) 및/또는 엔테로코쿠스 패시움(Enterococcus faecium)을 함유하는 살아있는 세균 제제로 구성된 살아있는 세균 혼합물; 및 (c) 유기산.
사료 첨가물은 또한 진균 및/또는 세균성 발효 부산물을 함유하는 반추동물을 위한 사료 첨가물에 대해 Julien에게 허여된 미국 특허 제5,863,574호에서 교시한 바와 같이 발효 및 기타 공정의 부산물을 포함할 수 있다. 반추동물의 사료 첨가물은 글루탐산 발효 가용물을 제공하는 무수 진균 및/또는 세균성 발효 부산물, 무수 옥수수 발효 가용물 또는 무수 글루탐산 발효 가용물 및 무수 옥수수 발효 가용물의 혼합물을 포함하며, 여기서, 무수 가용물은 약 80°F 이상 및 약 900°F 이하의 온도에서 30중량% 미만의 총 수분 함량으로 건조되어 있다.
발명의 요약
한 양태에서, 본 발명은 브레비바실러스 종(Brevibacillus sp .)으로부터 분리한 2종 이상의 D-아미노산을 포함하는 분리 및 정제된, 열 안정성의, 아미노 말 단-메틸화되고 카복시-말단 환원된 펩타이드를 포함하는 사료 첨가물이다. 당해 펩타이드의 C-말단 발린의 카복시 말단 -COOH 그룹은 -CH2OH로 환원될 수 있으며, 펩타이드에 프로테아제 내성을 부여할 수 있다. 펩타이드 사료 첨가물은 pH 1.0, pH 13.0에서 안정할 수 있으며, 프로테아제 또는 이의 배합물에 내성을 가질 수 있다. 당해 펩타이드의 예는 서열 번호 1 내지 20 중 하나 이상에서 선택될 수 있다(BT 펩타이드로 총칭함). 상기 펩타이드는 그람 양성 세균, 그람 음성 세균, 진균, 원생생물 또는 이의 배합물을 사멸시키는 것으로 밝혀졌다. 당해 펩타이드는 브레비바실러스 텍사스포러스(ATCC PTA-5854)로부터 분리될 수 있으며 약 0.5 내지 약 100ppm으로 사료에 첨가할 수 있다. 한 가지 용법에서, 당해 펩타이드를 약 6 내지 약 12ppm으로 첨가하였고 통계적으로 유의한 성장 자극을 입증하였다.
첨가 펩타이드를 가금류, 가축, 양식 어류, 게, 새우 및 민물 거북이 중 하나 이상에 사용하기 위해 개질시킨 사료에 첨가할 수 있다. 예를 들면, 당해 펩타이드는 곡물류 동물 사료, 예를 들면, 보리, 콩, 밀, 라이밀(triticale), 호밀 및 옥수수 중에서 선택된 하나 이상의 곡물; 및 브레비바실러스 종으로부터 분리된 2종 이상의 D-아미노산을 포함하는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드 중에 포함될 수 있다. 당해 펩타이드류 사료 첨가물은 약 1 내지 1000ppm의, 브레비바실러스 종으로부터 분리된 2종 이상의 D-아미노산을 갖는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 포함할 수 있다. 사실, 본 발명은 임의의 매우 다양한 사료와 함께 사용할 수 있다.
본 발명은 또한 2종 이상의 D-아미노산을 가지며 카복시 말단이 환원된 pH 및 열 안정성의, 브레비바실러스 종으로부터 분리된 항미생물성 펩타이드를 포함한다. 예를 들면, 본 발명은 카복시-말단이 환원된, 열 안정성의, 아미노 말단이 메틸화된 펩타이드이며 2종 이상의 D-아미노산을 포함할 수 있는 항미생물성 펩타이드를 생성하는 미생물 브레비바실러스 텍사스포러스 수탁번호 제ATCC PTA-5854호의 생물학적 순수 배양물을 포함한다. 더욱이, 당해 사료 첨가물은 ATCC PTA-5854의 분리 및 정제된 미생물일 수 있다. 당해 첨가물을 대용유(milk replacer), 육성용 사료(grower feed), 비육용 사료(finish feed), 예비-포유용 사료(pre-starter feed) 및 포유용 사료(pre-starter feed)로 이루어진 그룹 중에서 선택된 가축용 사료와 혼합할 수 있다.
본 발명은 또한 동물 사료에 하나 이상의 BT 펩타이드를 성장 증가에 충분한 유효량으로 제공함으로써, 동물에서 체중 증가 효율 및 사료 효율을 증가시키는 방법을 포함한다. 동물 사료는 예를 들면, 소, 돼지, 닭, 말, 칠면조, 양, 염소, 양식 어류, 게, 새우 및 거북이로 이루어진 그룹 중에서 선택된 가축의 사료로 제공하기에 적합하게 개질되어 있다. 사료의 예로는 또한 예를 들면, 닭, 칠면조, 오리, 메추라기, 콘월 암탉(Cornish hen) 및 비둘기로 이루어진 그룹 중에서 선택된 조류의 사육용 사료가 포함된다. 이와 같이, 사료는 예를 들면, 곡물, 대두분, 분리대두단백, 분리대두유, 분리대두유지, 탈지유, 어분, 육분, 골분, 혈분, 혈장 단백질, 유장, 쌀겨, 밀겨, 감미료, 미네랄, 비타민, 염 및 목초로 이루어진 그룹 중에서 선택될 수 있다. 당해 펩타이드의 일일 용량은 동물의 체중 kg당 약 0.01 내 지 약 10그람의 범위이다.
다른 양태에서, 본 발명은 브레비밥실러스 종으로부터 분리된, 2종 이상의 D-아미노산을 가지며 카복시-말단 환원된, pH 및 열 안정성인 펩타이드를 포함하는 국소 사용을 위한 광범위(broad spectrum)의 항미생물 화합물이다. 예를 들면, 당해 펩타이드는 서열 Me2Bmt-L-dO-I-V-V-dK-V-dL-K-dY-L-V-CH2OH(서열 번호 1) 또는 서열 번호 1 내지 20 중 어느 하나를 가질 수 있다.
다른 양태는 2종 이상의 D-아미노산을 포함하는, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 생성하는 BT 오페론(서열 번호 21)의 서열을 갖는 분리 및 정제된 핵산이다. 하나 이상의 효소를 포함하는 BT 오페론 단백질에 대한 하나 이상의 폴리펩타이드 서열(서열 번호 22 내지 28)을 암호화하는 분리 및 정제된 핵산을 사용하여 2종 이상의 D-아미노산을 포함하는, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 제조한다. 본 발명은 또한 서열 번호 21에 대해 75% 이상의 상동성을 갖는 이들의 분리된 핵산을 포함한다. 보다 특이적으로, 핵산은 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 제조하는데 사용된 효소인, 펩타이드 합성 오페론 단백질에 대한 하나 이상의 폴리펩타이드 서열(서열 번호 22 내지 28)을 암호화할 수 있다. 하나 이상의 BT 오페론 폴리펩타이드는 서열 번호 21로부터 발현되며, 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 제조하는데 사용된 하나 이상의 효소를 포함한다.
본 발명에 사용하기 위한 분리된 세균 샘플은 브레비바실러스 텍사스포러스 E58의 분리된 세균 균주를 포함할 수 있다. 다른 양태는 스타필로코쿠스(Staphylococcus), 엔테로코쿠스(Enterococcus), 뉴모코쿠스(Pneumococcus), 바실리(Bacilli), 메타노코쿠스(Methanococcus), 해모필러스(Haemophilus), 아캐오글로버스(Archaeoglobus), 보렐리아(Borrelia), 시네드로십티스(Synedrocyptis), 미코박테리아(Mycobacteria), 슈도모나스(Pseudomonas) 및 이. 콜라이(E. coli)로 이루어진 그룹 중에서 선택된 하나 이상의 세균의 성장을 억제하는, 브레비바실러스 종으로부터 분리된, 2종 이상의 D-아미노산을 갖는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드이다. 세균을 2종 이상의 D-아미노산을 포함하는, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 생성하는 BT 오페론의 서열(서열 번호 21)을 갖는 분리 및 정제된 핵산으로 형질전환시킬 수 있다. 당해 핵산으로부터 발현된 단백질은 하나 이상의 BT 오페론 단백질 또는 이와 관련된 것들을 포함할 수 있다. 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 생성하는 BT 오페론의 서열(서열 번호 21)을 갖는 분리 및 정제된 핵산을 포함하는 벡터를 변형 또는 분리할 수 있다. 하나 이상의 BT 오페론 단백질을 암호화하는 핵산으로부터 하나 이상의 단백질이 발현될 수 있다. 사료 첨가물은 또한 서열 번호 1 내지 20과 75% 초과의 서열 상동성을 갖는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 포함할 수 있다.
본 발명은 또한 통상적이지 않은 아미노산 및 기타 유형의 변형을 함유하는 펩타이드 및 이들 펩타이드를 합성하는 비-리보솜성 펩타이드 신타제에 관한 것이다. 본 발명은 또한 이들 펩타이드를 제조하는 방법, 및 각종 세균성 감염 및 원생생물성 감염 및 이러한 감염에 관련된 장애; 종양 세포 증식, 성장 및 확산의 치료 및 예방에; 또는 면역 조절제로서 당해 펩타이드를 단독으로 또는 통상의 항생제와 함께 상승작용적으로 사용하는 방법을 포함한다.
본 발명의 특징 및 이점을 보다 완전히 이해하기 위해, 이제부터 본 발명의 상세한 기술과 첨부한 도면을 함께 참조하며, 도면은 다음과 같다:
도 1A는 펩타이드 BT의 정제를 나타내는 겔이다. BT의 트리신 겔 분리 및 관련 항생제 활성. 클로로포름 추출 펩타이드를 미리 성형한 16.5% 트리신 겔(제조사[BioRad]로부터 구입) 상에서 분리시켰다. 한 겔을 쿠마시 블루(coomassie blue)(왼쪽)으로 염색하여 펩타이드 밴드를 나타냈다. 다른 겔(오른쪽)은 바실러스 세레우스(Bacillus cereus)와 함께 매봉한 아가 위에 놓았다. 세균 로온(lawn)에서 투명한 영역은 ~1500의 분자량을 갖는 단일 밴드로 붕괴된 종에 상응한다. 분자량 마커는 다음과 같다: 트리오세포스페이트 아이소머레이즈 26.6kD, 미오글로빈 17.0kD, 알파-락트알부민 14.4kD, 아프로티닌 6.5kD, 인슐린 b 쇄, 산화된 3.5kD 및 바시트라신 1.4kD.
도 1B는 클로로포름-추출 BT의 질량분광분석의 그래프이다. 클로로포름-추출 BT를 염화나트륨을 첨가하여 이온화시킨 후 질량분광 분석에 적용하였다. 5개 의 이온화된 BT 이성체 그룹(BT1555, BT1571, BT1583, BT1599 및 BT1613)을 검출 및 표지하였다.
도 1C는 정제된 BT1583의 질량분광분석의 그래프이다. C18 역상 HPLC의 분획 33을 질량분광 분석에 적용하였다. 오직 수소화된, 나트륨 및 칼륨 이온화된 BT1583만이 검출되었다.
도 2A는 BT1583 직렬 질량분광계 데이타의 그래프이다. 도 2B는 아미노산 조성물 및 MS/MS 실험으로부터 추론된 부분적 BT 1583 서열 구조이다(표 1 및 2)(완전한 모티프 및 서열은 각각 표 5 및 6을 참조한다).
도 3A 내지 3D는 BT NRPS 오페론의 지도이다. 도 3A는 짝쌍에 의해 연결된 2개의 콘티그(contig)로부터의 슈퍼콘티그(supercontig)의 구조도이다. 콘티그 1 및 콘티그 2는 클론으로부터 짝쌍을 공유한다. 콘티그를 순서화하고 정렬하여, 서열분석되지 않은 간극 영역에 의해 분리된 콘티그 1 및 콘티그 2의 서열을 포함하는 슈퍼콘티그를 형성하였다.
도 3B는 본 작업에서 서열분석된 영역 및 당해 영역에서 발견된 9개의 ORF의 지도이다. btA에서 btF까지의 6개의 ORF는 BT NRPS 아단위(BtA, BtB, BtC, BtD, BtE 및 BtF)를 암호화한다.
도 3C는 BT NRPS 아단위의 도메인 조직도이다. 각각의 모듈의 예측된 아미노산 기질 특이성이 각각의 A-도메인에 표시되어 있다.
도 3D는 표 3에 기술된 바와 같은 13개의 결합 포켓(pocket) 구성요소 모두의 다중 서열 정렬의 계통발생 나무이다. 추정의 특이성을 부분적 BT1583 서열을 사용하여 할당하였다. 이는 A-도메인의 이들 결합 포켓이 추정상 동일한 또는 유사한 기질 클러스터(cluster)를 함께 활성화시킴을 나타낸다.
도 3E는 BT 오페론의 핵산 서열이다(서열 번호 21).
도 3F는 BtA의 아미노산 서열이다(서열 번호 22).
도 3G는 BtB의 아미노산 서열이다(서열 번호 23).
도 3H는 BtC의 아미노산 서열이다(서열 번호 24).
도 3I는 BtD의 아미노산 서열이다(서열 번호 25).
도 3J는 BtE의 아미노산 서열이다(서열 번호 26).
도 3K는 BtF의 아미노산 서열이다(서열 번호 27).
도 3L는 BtG의 아미노산 서열이다(서열 번호 28).
도 4A 내지 4E는 각각 보존 모티프의 서열 정렬 및 BT NRPS 모듈로부터의 아데닐화, 축합, 티올화, 에피머화 및 리덕타제 도메인의 정렬이다. 보존 모티프는 문헌[참조: Marahiel, 1997])에 따라 확인하였다. 컨센서스(consensus)를 각각의 정렬 밑에 두었다. 컨센서스와 부합되는 잔기에 검은색 음영을 주었다. 12개 C-도메인 모두를 덜 보존되는 것으로 공지된 출발 C 도메인을 지시하는 * 기호와 함께 배열하였다.
도 5A 내지 5E는 각각 A) 내지 D)로 나열된 ATP-PPi 교환 검정으로부터 수득한 모듈 8, 5, 7, 4 및 2의 정제된 A-도메인 각각의 관련 기질 특이성에 대한 ATP-PPi 교환 검정이다. 최고 활성은 100%로 정의되었다. 20개 모두의 단백원성 아미노산 및 L-Orn을 각각의 검정에서 시험하였고, 배경수준은 통상 1% 이하였다. 특 이적 아미노산에 대한 A-도메인의 겉보기 Km을 아래에 나열하였다.
도 6A는 합성 BT 변이체의 요약이며, 도 6B는 BT 변이체와 상기한 바와 같은 항생제 활성 및 프로나제(Pronase) 내성에 대한 이들의 특성 사이의 상관관계이다.
본 발명의 각종 양태의 제조 및 사용이 아래에 상세히 논의되어 있지만, 본 발명은 매우 다양한 구체적 상황에서 구현될 수 있는 많은 적용가능한 발명적 개념을 제공함을 이해해야 한다. 본원에 논의된 특이적 양태는 단지 본 발명을 제조 및 사용하는 특이적 방법의 예시이며 본 발명의 영역을 제한하지 않는다.
본 발명의 이해를 돕기 위해, 다수의 용어를 아래에 정의하였다. 본원에서 정의된 용어는 본 발명에 관련된 영역의 통상적인 숙련가에 의해 통상적으로 이해되는 의미를 갖는다. 관사와 같은 용어는 단지 단수 자체만을 지칭하고자 하는 것은 아니며, 예시를 위해 사용할 수 있는 구체적 예의 일반적 부류를 포함한다. 본원의 술어는 본 발명의 특이적 양태를 기술하기 위해 사용되었지만, 이들의 사용은 청구항에 약술된 것을 제외하고는 본 발명을 제한하지 않는다.
본원에 사용된 바와 같은 용어 "가축 동물"은 예를 들면, 돼지, 소, 말, 염소, 양, 사슴, 개, 고양이 및 다수의 유용한 설치류 중 임의의 동물을 기술한다. 본원에 사용된 바와 같은 용어 "가금류"는 예를 들면, 닭, 암탉, 메추라기, 칠면조, 뿔닭 등을 포함한다. 본원에 사용된 용어 "양식 어류"는 예를 들면, 잉어, 메기, 석조송어(rainbow trout), 아유(ayu)(은어), 장어, 틸라피아, 붕장어, 연어, 숭어, 붉은 돔, 방어(yellow tail), 가자미, 복어 등을 포함한다. 다수의 기타 동물(예를 들면, 새우 및 참새우) 또한 유용할 것으로 사료된다.
본원에 사용된 바와 같이, 용어 "첨가물" 및 "사료 첨가물"은 가축, 가금류 및 어류의 건강 개선 및 현존하는 건강한 동물의 감소된 또는 낮은 체중 및/또는 증가된 성장률(예를 들면, 체중)로 인한 경제적 손실 감소를 초래하는 사료 첨가물로서 동물 사료와 함께 사용할 수 있다. 예를 들면, 본 발명의 사료 첨가물은 세균 분리물, 부분적 또는 전체적으로 분해된 세균으로부터 사용될 수 있으며, 세균으로부터 분리 및 정제되고/거나 전체 또는 부분적으로 합성적으로 합성될 수 있다. 가축 동물, 가금류 및 어류용 첨가물 또는 사료 첨가물은 분말, 낟알 또는 액상일 수 있으며 사육 조건 및 농장의 설치 및 사육 동물에 따라 사용될 것이다.
적합한 동물 사료에는 예를 들면, 녹색 사료, 사일리지(silage), 건조시킨 녹색 사료, 뿌리, 덩이줄기, 신선한 과일, 낟알 및 씨앗, 양조 낟알(brewer's grain), 즙을 짜낸 찌꺼기(promace), 양조 효모, 증류 폐기 낟알(distiller's spent grain), 제분 부산물, 당, 전분 및 오일 회수물의 생산의 부산물 및 각종 음식물 쓰레기가 포함된다. 본 발명의 사료 첨가물은 단독으로 또는 항산화제 또는 이러한 증강용 사료에 첨가할 수 있는 각종 물질의 혼합물(미네랄 혼합물, 비타민 혼합물)과 같은 기타 널리 공지된 사료 첨가물과 함께 사용할 수 있다. 특이적 사료는 또한 연령 및 발육 단계에 따라 특정한 동물 종에 맞게 개질시킬 수 있다.
본 발명의 펩타이드와 함께 사용하기에 적합한 기본 사료를 사료 제조 분야의 숙련가에게 널리 공지된 바와 같이 제조할 수 있다, 예를 들면, 본원에 참조로 인용된 관련 부분인 문헌[참조: Kirk-Othmer, Encyclopedia of Chemical Technology, 4th Ed. , vol. 10, pp. 288-300, Wiley, N. Y., 1993]에 기술된 바와 같은 것을 사용할 수 있다. 예를 들면, 기본 사료는 다음의 성분 중 하나 이상을 포함할 수 있다: 옥수수, 수수, 보리, 밀, 콩, 땅콩, 캐놀라, 어분, 유제품, 유지, 비타민 및 미네랄.
본 발명자는 NRPS 오페론이 펩타이드 생성물의 특정한 구조 세부 사항을 습득케 하는 정보원일 수 있음을 인지하였다. BT NRPS 오페론의 동정은 BT1583 펩타이드 구조의 결정적 세분을 초래한다. 토양 미생물을 신규한 항생제를 생산하는 균주에 대하여 선별하였다. 바실러스 종 E58(ATCC PTA-5854)을 면역이 위태로운 환자에게서 생명을 위협하는 병원성 감염을 초래하는 스타필로코칼 아우레우스에 대항하는 항생제 BT를 생산하는 이의 능력에 대해 분리하였다. 당해 균주는 브레비바실러스 라테로스포러스(Brevibacillus laterosporus)에 대한 이의 관련성을 기초로 하여 브레비바실러스 텍사스포러스로 명명하였다.
NRPS의 모듈은 펩타이드 생성물을 형성하기 위한 아미노산 전구체의 인식, 활성화, 변형 또는 결합에서 각각 특이적 역할을 수행하는 소단위 또는 "도메인"으로 구성되어 있다. 한 유형의 도메인, 아데닐화(A-) 도메인은 NRPS의 특정 모듈에 의해 통합되는 아미노산의 선택적 인식 및 활성화를 담당한다. 기타 A-도메인의 서열 비교와 함께, 그라미디신(Gramicidin) S NRPS의 PheA 아단위의 A-도메인의 기질-결합 포켓의 분석을 통해 A-도메인에 대한 기질 특이성의 주요 결정인자인 10개의 잔기를 결정할 수 있었다(문헌[참조: Conti, et al., 1997; Stachelhaus, et al., 1999]). 10개의 잔기를 NRPS '코돈'으로 간주하였다. NRPS 코돈 수집은 계속 발견되는 신규한 NRPS 코돈으로 여전히 성장하고 있다. 본 발명은 분리 및 정제된 핵산 및 발린, 라이신, 오르니틴 및 타이로신에 대한 신규한 NRPS 코돈의 그룹에 대해 이에 의해 암호화된 단백질을 포함한다.
아미노산 활성화 단계는 ATP-의존성이며 아미노-아실 아데닐화의 일시적 형성을 포함한다. 활성화된 아미노산은 일반적으로 A-도메인에 인접하여 위치한 다른 유형의 도메인, 티올화(T-) 도메인을 통해 펩타이드 신타제에 공유 결합한다. T-도메인은 보존적 세린 잔기에 포스포판테테이닐 인공 팔의 공유 결합에 의해 해독 후 변형된다. 활성화된 아미노산 기질은 각각의 T-도메인의 포스포판테테이닐 인공 팔에 대한 티오에스테르 결합을 통해 NRPS 상에 고정된다. NRPS의 연속하는 단위에 결합한 아미노산은 다른 유형의 도메인, 축합(C-) 도메인에 의해 촉매화된 아미드 결합의 형성에 의해 연속적으로 서로 공유 결합된다. NRPS 모듈은 또한 때때로 보조 반응, 가장 통상적인 것은 L-형태로부터 D-형태로의 아미노산 기질의 에피머화를 수행하는 부가의 기능적 도메인을 포함할 수 있다. 당해 반응은 일반적으로 주어진 NRPS 모듈의 T-도메인에 인접하여 위치한 에피머화(E-) 도메인으로 지칭되는 도메인에 의해 촉매화된다. 따라서, 통상적인 NRPS 모듈은 다음의 도메인 조직: C-A-T-(E)을 갖는다.
NRPS에 의해 조립된 생성물은 3가지의 다른 상, 즉, 쇄 개시, 쇄 연장 및 쇄 종결을 포함한다(문헌[참조: Keating & Walsh, 1999]). 펩타이드 쇄 개시는 A-도메인 및 T-도메인을 포함하는 "출발자 모듈"로 지칭되는 특수화된 모듈에 의해 수행된다. 연장 모듈은 추가로, A-도메인의 상류에 위치해 있는 C-도메인을 갖는다. 이러한 연장 도메인은 C-도메인에 의한 간섭 때문에 펩타이드 결합 형성을 개시할 수 없음이 실험적으로 증명되었다(문헌[참조: Linne & Marahie, 2000]). 모든 성장 중인 펩타이드 중간체는 연장중인 일련의 아실-S-효소 중간체로서 전좌 중 NRPS에 공유 결합되어 있다. NRPS로부터 성숙한 펩타이드 생성물을 방출시키기 위해, 말단의 아실-S-효소 결합이 깨어져야만 한다. 이러한 과정은 쇄 종결 단계이며 일반적으로 C-말단 티오에스테라제(TE) 도메인에 의해 촉매화된다. NRPS로부터의 성숙한 펩타이드의 티오에스테라제-매개 방출은, 아실-O-TE 중간체의 일시적 형성을 수반하며, 상기 아실-O-TE 중간체는 후에 가수분해되거나 가수분해되고 동시에 환형화되어 성숙한 펩타이드를 방출한다(문헌[참조: Keating, et al., 2001]). 대안적인 종결안은 알콜성 C-말단 잔기를 갖는 펩타이드의 방출을 초래하는, 마지막 NRPS 모듈에 존재하는 리덕타제(R-) 도메인에 의한 결합된 C-말단 잔기의 환원을 포함한다(문헌[참조: Gaitatzis, et al., 2001; Kessler, et al., 2004]). 이러한 리덕타제-매개 종결/C-말단 변형은 BT 생합성 중에 발생하며 BT 펩타이드의 슈퍼 프로테아제 내성에 기여한다.
NRPS 오페론의 동정 및 분리는 펩타이드 항생제의 연구에 유용하였지만, 특이적 NRPS 오페론의 동정은 도전해야 할 과제로 남아 있다. NRPS 오페론의 동정은 전통적으로 공지된 NRPS 유전자로부터의 DNA 프로브를 사용하는 하이브리드화 또는 변성된 프라이머를 사용하는 게놈 DNA의 PCR에 의해 증폭된 유전자 단편에 의해 게놈 BAC 또는 코스미드 라이브러리에서 클론을 동정하면서 시작한다. NRPS의 아미노산 서열이 일반적으로 매우 작기 때문에, 이러한 방법은 성공적일 수 있지만, 프로브 또는 프라이머가 종종 불완전하기 때문에, 일부 NRPS 오페론을 잃을 수 있다. 게다가, 미생물은 흔히 다중 NRPS 오페론을 포함하기 때문에, 프로브 또는 프라이머는 일부 NRPS 오페론을 나타낼 수 있지만, 추구되는 것은 아니다. 이는 종종 부정확한 유전자에 대해 투여된 불행을 초래하는 결과를 초래한다(문헌[참조: Hopwood, 1997]). 신규한 실리카 내 방법에서 본원에 기술한 바와 같이 사용하여 빠르고 정확한 NRPS 오페론의 동정을 가능케 하였다.
물질 및 방법. BT의 부분적 정제, E58B. 텍사스포러스 세포를 3일 동안 37℃ 공기 교반기에서 LB 1 리터 중에서 배양하였다. 배양물을 15분 동안 3000rpm에서 임상용 원심분리기에서 회전시켰다. 상층액을 수집하고 황산암모늄 500그람을 첨가 및 용해시켰다. 샘플을 15분 동안 3000rpm에서 임상용 원심분리기에서 회전시켰다. 펠릿을 증류수 200ml에 용해시켰다. 이어서 용액을 50분 동안 끓인 후 얼음 위에서 냉각시켰다. 샘플을 0.2 마이크론 필터(제조사[Nalgen])로 여과하였다. 여액을 교반 막대를 사용하여 20분 동안 실온에서 클로로포름 0.2 리터와 혼합하였다. 혼합물을 15분 동안 3000rpm에서 임상용 원심분리기에서 원심분리하여 2개의 상으로 분리하였다. 유기상을 수집하고 진공 증발기에서 건조시켰다.
C18 역상 HPLC. 건조된 클로로포름 추출물을 멸균 증류수 2ml에 용해시켰다. 용액을 30% B 내지 55% 용제 B(용제 B는 아세토니트릴 중 0.075% TFA이며, 용제 A는 수중 0.1% TFA이다)의 구배로 C18 역상 HPLC 칼럼 상에서 분획시켰다. 수득된 분획을 건조시키고 멸균 증류수에 용해시키고 플레이트 투명 영역 검정으로 항-에스. 아우레우스 활성에 대해 분석하였다. 피크 분획(분획 33)을 아미노산 조성물, 질량 분광 분석, 직렬 질량 분광 분석 및 키랄성 분석에 적용하였다.
아미노산 조성. 텍사스주의 컬리지 스테이션에 소재하는 텍사스 A&M 대학의 단백질 화학 연구실에서 아미노산 분석을 수행하였다. 샘플을 내부 표준물과 혼합하고, 진공 응축기 내의 유리관에서 건조시키고 페놀의 존재 하에 아르곤 대기하에서 24시간 동안 110℃에서 6N HCl에 의한 증기 상 가수분해에 적용시켰다. 이어서 샘플을 붕산염에 용해시키고 자동 유도화 및 탑재를 위해 휴렛 팩카드 아미노퀀트 II(Hewlett Packard AminoQuant II) 시스템으로 옮겼다. 아미노퀀트는 o-프탈알데하이드(OPA) 및 9-플루오로메틸-클로로포르메이트(FMOC)를 사용하여 가수분해된 샘플의 전(前)-칼럼 유도화에 의해 펩타이드 및 단백질을 분석한다. 유도된 아미노산을 역상 HPLC로 분리하고 다이오드 정렬 검출기를 사용한 UV 흡광도 또는 일렬 형광 검출기를 사용하여 형광에 의해 검출하였다.
질량 분광분석 및 직렬 질량 분광분석. D-형 아미노산 잔기의 검출. BT 내의 아미노산 잔기의 키랄 분석은 버지니아주 리치몬드 소재의 Commonwealth Biotechnologies, Inc.에서 수행하였다. BT를 110℃에서 18시간 동안 진공 중에서 6N HCl에서 가수분해시켰다. 아미노산을 FMOC 아미노산으로 유도하였으며 HPLC 크로마토그래피로 분리하였다. 이어서 각각의 아미노산의 용출 특성을 키랄 칼럼 상에서 결정하였다. 크로마토그래피 칼럼의 유형 둘 다에 대해, 피크는 적합한 표준과 비교하여 확인하였다.
게놈 DNA 제조. 대수기의 E58 세포를 LB 배양액으로부터 수거하고 용해 완충액[10mM 트리스(pH8.0), 100mM EDTA, 0.5% SDS]로 용해시켰다. RNase A를 첨가하여 오염된 RNA를 분해하였다. 게놈 DNA는 페놀/클로로포름을 사용하여 추출한 후 에탄올로 침전시켰다. 건조된 DNA를 TE에 재현탁시키고 분취액을 정성 대조를 위해 0.5% 아가로스 겔에서 전개시켰다.
라이브러리 구축 및 게놈 서열화. E58 게놈 라이브러리 구축, 솟건(shot-gun) 서열화 및 조립은 기관[Agencourt Biosciences Corporation(메사츠세츠주 비벌리 소재)]에서 수행하였다. 간략히, 전체 게놈 라이브러리를 약 5kb의 평균 삽입 길이로 구축하였다. 이러한 클론 10,000개를 삽입물의 말단 둘 다로부터의 자동화 DNA 서열화에 적용시켰다. 16.901개의 연속적으로 서열화된 판독물을 수집하고 조립하였다.
뉴클레오타이드 서열 및 데이타 분석. E58 게놈에 대한 모든 BLAST 분석을 지역 컴퓨터에 설치된 WU BLAST 소프트웨어 팩키지(2.0판)를 사용하여 수행하였다(Gish, W. 1996-2003. http://blast.wustl.edu). 아미노산 서열 상동성 탐색은 기관[National Center for Biotechnology Information(메릴랜드주 베데스다 소재)]의 BLSAT 서버 및 디폴트 매개변수 수치를 갖는 비-중복성(nonredundant)의 단백질 서열 데이타베이스를 사용하여 수행하였다(문헌[참조: Altschul, et al., 1990]). 아미노산 서열 정렬은 기관[Institute of Biology and Chemistry of Proteins(프랑스 리옹 소재)]의 NPS@ 웹 서버에서 운용하는 CLUSTALW 프로그램을 사용하여 수행하였다(문헌[참조: Thompson, et al., 1994]).
BT NRPS 오페론. BT NRPS 오페론(슈퍼콘티그 3)은 46kb 이상의 영역에 고정되어 있는 11개의 콘티그를 포함하였다. 비서열화 영역, 단지 한번 서열화되었던 영역 및 불량한 서열화 질을 갖는 영역이 있었다. 또한, 13개 모듈의 카복실 영역은 슈퍼콘티그 3에 의해 포괄되지 않았다. 3회의 프라이머 연장 서열화 및 1회의 게놈 워킹(walking)을 수행하여 NRPS 오페론을 마무리하였다. 슈퍼콘티그 3 내의 모든 원형 서열화 판독물을 SeqMan(Lasergene, DNASTAR Inc.)을 사용하여 추출 및 재조립하였다. 디폴트 매개변수를 재조립을 위해 사용하였다. SeqMan이 채용한 고 엄격도는 재조립된 슈퍼콘티그 3이 16개의 비서열화 간극을 갖는 17개의 콘티그로 분해되게 하였다. 모든 콘티그는 추가로 단일 범위 및 저질 영역에 대해 수동으로 조사하였다. 프라이머는 간극 내로 서열화되고 단일 범위 및 저질 영역에서 추가의 판독물을 수득하도록 설계하였다. 새로운 서열화 판독물을 원형 판독물과 합하여 새로운 슈퍼콘티그를 형성하였다. 새로운 슈퍼콘티그를 간극, 단일 범위 및 저질 영역에 대해 다시 점검하였다. 3회의 이러한 프라이머 연장 및 조립 후, 추정의 BT NRPS 오페론을 48,997bp 길이의 단일 콘티그 내로 조립하였다. 조립된 서열을 입증하기 위해, EcoRI과 HindIII를 사용한 이중 분해를 전체 영역에 총체적으로 고정되어 있는 20개의 클론을 사용하여 수행하였다. 수득된 분해 패턴은 콘티그에 의해 예측된 제한 지도와 완벽히 일치하였다(데이타는 나타내지 않았음). 콘티그의 하류 영역을 서열화하기 위해, 게놈 워킹을 제조사[Clontech]의 GenomeWalker 킷트를 사용하는 E58 게놈 DNA로 성공적으로 수행하였다. 이러한 노력은 추정의 BT NRPS 오페론(Genbank 수탁번호 #________)을 포괄하는 50,674 bp의 DNA 서열을 도출하였다.
His10-태그된(tagged) BT A-도메인 단백질의 클로닝, 과발현 및 정제. BT NRPS 모듈 8, 5, 7, 4 및 2(Bt8A, Bt5A, Bt7A, Bt4A 및 Bt2A)의 A-도메인을 암호화하는 DNA 단편을 PCR-증폭시키고, PCR 생성물을 His10-태그 재조합 단백질 발현 벡터 pET16b(Novagen) 내로 삽입시켰다. A-도메인 경계를 문헌[참조: Konz, et al., 1999])에 정의된 바와 같이 결정하였다. 발현 구축물을 이.콜라이 BL21-AI 균주(Invitrogen) 내로 형질전환시켰다. 형질전환체를 37℃에서의 L-브로쓰에서 A600 0.6으로 배양한 후, 1mM IPTG(이소프로필-β-D-티오갈락토피라노시드)와 0.2% L-아라비노스를 사용하여 유도하였다. 세포를 수거하기 전 30℃에서 추가로 2시간 동안 배양하였다. His10-태그 재조합 단백질의 정제는 변형과 함께 편람에 권해진 조건 하에 TALON 금속 친화 수지(BD Bioscience)를 사용하여 달성하였다. 간략히, 이. 콜라이 세포를 초음파로 파쇄하였다. 세포 용해물을 25,000x g에서 1시간 동안 원심분리하여 정화하였다. 이어서 His-태그 재조합 단백질을 TALON 수지와 함께 항온처리하고, 세척하고, 500mM 이미다졸로 용출시켰다. 용출된 단백질을 완충액(50mM HEPES, pH 8.0, 100mM 염화나트륨, 10mM 염화마그네슘 및 1mM EDTA)에 대하여 투석한 후 SDS PAGE와 쿠마시 블루 염색으로 분석하였다. 재조합 단백질은 계산된 것과 양립할 수 있는 겉보기 분자량을 나타내었고, 이들은 균일하게 정제되는 것으로 보였다. 정제된 단백질의 농도는 A280에 대한 계산된 몰흡광 계수를 사용하여 결정하였다.
ATP-PPi 교환 검정. ATP-PPI 교환 검정을 수행하여 A-도메인의 기질 특이성을 결정하였다. ATP-PPi 교환을 근소한 변형과 함께 상기한 바와 같이 검정하였다(문헌[참조: Stachelhaus, et al., 1998]). 검정 혼합물은 50mM HEPES(pH 8.0), 100mM NaCl, 10mM MgCl2, 2mM ATP, 0.5mM 아미노산, 0.05mM PPi, 0.15μCi [32P]파이로인산사나트륨을 함유하였다. 교환은 정제된 재조합 A-도메인 단백질을 0.1ml의 총 용적으로 첨가하여 개시시켰다. 단백질 농도는 모듈 4 및 모듈 5 A- 도메인에 대해 0.2μM이었던 반면, 모듈 7 및 모듈 8 A-도메인에 대해서는 2μM이었다. 37℃에서 15분 동안 항온처리 한 후, 종결 혼합물(100mM 파이로인산사나트륨, 3.5% HClO4 및 1.6% [w/v] 활성화 목탄) 0.5ml을 첨가하여 종결시켰다. 목탄은 원심분리하여 펠릿화하고, 40mM 파이로인산과 1.4% 과염소산으로 1차 세적한 후, 물로 세척하고 물 0.5ml에 재현탁시켰다. 목탄/물 현탁액을 섬광 유체 5.0ml을 함유하는 섬광 바이알에 첨가하고, 한계 방사능을 액체섬광계수법으로 결정하였다. 겉보기 Km 수치를 0.1 내지 10mM 범위의 기질 농도로 결정하였다.
MIC 측정 검정. 스타필로코칼 아우레우스를 LB에서 37℃에서 중간 대수기까지 배양하였고, 신선한 LB로 500배 희석하고 96-웰 미세 역가 플레이트에 분배하였다. 상이한 농도의 펩타이드를 첨가하고, 미세 역가 플레이트를 37℃에서 교반하면서 항온처리하였다. 최소 억제 농도(MIC)를 생육억제 웰을 생산한 최저 펩타이드 농도로 결정하였다. 모든 실험은 3회 수행하였고, 고도로 일치하는 MIC를 수득하였다.
BT 펩타이드의 동정. 스타필로코쿠스 아우레우스에 대한 신규한 항생제를 생산하는 토양 미생물을 찾고자 하는 노력으로 세균 균주 E58을 토양에서 분리하였다. E58이 16S rDNA 서열 상동성(98.5% 동일성)을 토대로 하여 브레비바실러스 라테로스포러스와 밀접하게 관련되어 있음이 밝혀졌다. E58을 브레비바실러스 텍사스포러스로 명명하였고 ATCC에 기탁하였다(카탈로그 번호 제PTA-5854호). E58에 의해 생산된 항생제를 BT라 명명하였고 이의 활성을 액체 E58 LB 배양액의 상층액에서 관측할 수 있었다. 따라서 무세포 배양 상층액은 BT 정제를 위한 출발 물질이었다. 항생제 활성물은 황산암모늄에 의해 침전되었는데, 이는 항생제가 단백질 또는 펩타이드임을 제안하는 것이었다(데이타는 나타내지 않았음). 추가로 활성물을 클로로포름으로 추출하였고, 이는 BT가 소분자로 이루어져 있음을 제시한다. 항생제 클로로포름 추출물을 진공 증발기에서 증발시켰고, 물에 용해시킨 후 SDS 트라이신 겔에서 전개시켰다. 각각의 반쪽에서 동일한 레인을 갖는 겔의 반쪽 2개를 단백질/펩타이드에 대해 염색하거나 BT-민감성 세균 바실러스 세레우스와 함께 매봉한 아가를 도포하여 항생제 활성에 대해 시험하였다(도 1A). 3개의 종이 염색 후에 가시화되었다:겔 적재 완충액으로부터 기원한 브로모페놀 블루 염료, 1.4kD 미만의 질량을 갖는 비공지 펩타이드 및 항생제 활성을 갖는 제3의 종. 이러한 제3의 종은 저 농도에서 ~1.5kD 밴드로서 전개하였고(원형 겔에서 분명히 가시화됨), 후에 관련 펩타이드 그룹으로 이루어진 것으로 나타났다(아래를 참조). 이들의 명확한 질량은 펩타이드가 고농도에서 응집됨을 제시하는 농도로 증가하였다. 항생제 활성은 고농도에서 펩타이드와 관련되는 것으로 보였으며, 따라서 당해 펩타이드가 BT 항생제 활성을 부여할 법하다고 결론지었다. 당해 펩타이드를 BT 펩타이드로 지칭하였다. BT 펩타이드는 분명히 당해 검정에서 저농도에서는 B. 세레우스에 대하여 유독하지 않았다. 최소의 검측가능한 BT 밴드가 ~1.5 kD에서 전개하였기 때문에, BT 펩타이드는 대략 13개의 잔기를 포함한다.
클로로포름-추출 BT를 질량분광분석 검정에 적용하였다. 펩타이드 그룹이 1550 내지 1650 달톤의 범위에서 관측되었다(도 1B). 주종은 1583의 분자량을 나타내었으며, 이를 BT1583으로 명명하였다. 다른 펩타이드는 후에 BT1583의 이성체인 것으로 밝혀졌다(표 5 및 6).
부분적 BT 서열 결정. 클로로포름-추출 BT를 추가로 C18 역상 HPLC로 정제하였다(보다 자세히는 물질 및 방법을 참조한다). BT1583은 C18 HPLC의 분획 33에서 균일하게 정제되었다(도 1C). BT1583(분획 33)의 아미노산 조성물 분석은 BT1583이 Tyr, Lys, Leu, Ile, Val 및 Orn의 잔기를 포함함을 나타냈다. BT1583은 N-말단 서열화를 어렵게 하였으며 아미노펩티다아제 M에 의한 분해에 저항성이 있는데, 이는 비-표준 N-말단 잔기를 제시하는 것이다. BT1583은 또한 카복시펩티다아제 Y에 의한 절단에 대한 저항력을 가졌는데, 이는 비-표준 C-말단 아미노산을 제시하는 것이다. 따라서 카복시-말단 서열화는 시도하지 않았다.
이어서 직렬 질량분광계(MS/MS)를 BT1583 펩타이드를 서열화하기 위해 선택하였다. MS/MS 데이타를 BT1583에 대해 수득하였고, 이들을 도 2A 및 표 2에 나타내었다. MS/MS 데이타는 BT1583이 아미노산 조성물과 상당히 관련되어 있는 13개의 아미노산 잔기를 포함함을 제시하였다. 기대한 바와 같이, 잔기 1 및 13의 질량은 임의의 표준 아미노산과 상응하지 않았다. 마지막 잔기는 103 달톤의 질량을 나타내었는데, 이는 카복실산에서 알콜로 환원된 이의 C-말단을 갖는 발린과 양립하는 것으로 보인다. C-말단 알콜성 발린의 존재는 추가로 BT NRPS의 13번째 발린-특이적 모듈 내의 리덕타제 도메인의 존재에 의해 확증되었다(아래를 참조). N-말단 잔기의 실체는 결정하기 더 어려웠다. 그럼에도 불구하고, 198의 질량을 갖는 N-말단 잔기는 Bmt {4-메틸-4-[(E)-2-부테닐]-4,N-메틸-트레오닌}의 N,N-메틸화된 형태와 양립할 수 있는 것으로 보였다(문헌[참조: Offenzeller, et al., 1996; Offenzeller, et al., 1993]).
BT1583 내의 오르니틴의 존재는 BT1583이 리보솜에 의해 합성될 수 없음을 나타낸다. D-아미노산의 존재는 이러한 생각을 뒷받침한다. 본 발명자는 BT1583 내의 가장 풍부한 잔기 중 2종의 키랄 특성을 측정하기 위해, Val 및 Leu를 선택하였다. 키랄 분석은 균일한 L-Val 잔기를 나타내었지만, L- 및 D-Leu 잔기 둘 다는 2:1의 비율임을 나타내었다.
상기한 생화학적 및 구조적 분석은 본 발명자에게 부분적 BT1583 펩타이드 서열을 제공할 수 있었다(표 2 및 도 2B 참조). N- 및 C-말단 잔기의 구조는 충분히 결정되지 않았다. 이소루이신 및 루이신은 구별할 수 없었다. D-형 Leu의 위치는 구체적으로 밝혀지지 않았다. 펩타이드의 기타 잔기의 키랄 특성은 결정되지 않았다.
E58 게놈의 솟건(shot-gun) 서열화. BT1583 펩타이드의 구조 및 생합성을 보다 잘 이해하기 위해, 본 발명자는 BT 생합성을 담당하는 유전자 또는 오페론을 동정하기로 결정하였다. 펩타이드 내의 비-단백원성 오르니틴 및 D-형 아미노산의 존재는 본 발명자가 BT1583이 생체 내에서 NRPS에 의해 합성되었다고 믿게 하였다)(문헌[참조: Marahiel, 1997]). 대부분의 NRPS 유전자는 NRPS 모듈과 펩타이드 생성물 내의 아미노산 잔기 사이의 엄격한 상관 관계를 반영하는 동선상이다. BT NRPS 오페론이 동선상인 경우, 이는 BT1583 펩타이드 내의 13개의 아미노산 잔기에 상응하는 13개의 모듈을 암호화할 것이다. 평균으로 가정하여, 각각의 모듈은 평균 3.5kb의 DNA 단편에 의해 암호화되며, 46kb 길이의 DNA 단편이 BT NRPS 오페론을 충당하기 위해 필요할 것이다. 상기한 바와 같이, NRPS 오페론을 동정하기 위한 통상의 방법은 일반적 프로브를 사용하여 코스미드 라이브러리를 프로빙하는 것을 포함한다. 불완전한 일반적 프로브는 표전 유전자를 놓칠 수 있고, 일반적으로 세균성 게놈에는 다중 NRPS 오페론이 있기 때문에, 이러한 방법은 빈번하게 조사자가 잘못된 NRPS 오페론을 추적하게 한다. 이러한 함정을 피하기 위해, 본 발명자는 게놈 내의 모든 NRPS 오페론의 편견 없는 실리카 내 개관을 제공하여 NRPS 오페론의 직접적인 비교를 가능케 하고 이에 따라 합리적인 후보 오페론을 선택할 수 있게 하는 게놈 방법을 개발하였다. 이러한 신규한 방법으로 BT NRPS 오페론을 빠르고 정확하게 동정하였다.
E58 게놈은 5 Mb인 것으로 판단되었다. E58 게놈 라이브러리는 평균 5kb의 삽입 크기로 구축하였다. 전체 게놈을 2배 범위에 대하여 서열화하였다. 서열 조립 후, E58 게놈은 700bp 내지 22.6kb 범위의 크기를 갖는 1919개의 콘티그 및 932의 단일체(singlet)로 대표되었다. 이러한 범위는 99.995%의 게놈이 클론에 의해 대표될 수 있게 할 것이다. 또한, 2개의 이웃하는 콘티그 사이의 간극의 평균 길이는 205bp 정도로 작아서 슈퍼콘티그가 구축될 수 있게 할 것이다(아래를 참조). 추가로, 이러한 분석의 슈퍼콘티그는 충분한 정보를 포함하여 정확한 실리카 내 NRPS 오페론 동정을 가능케 할 것이다.
BT NRPS 오페론의 실리카 내 동정. 후보 BT NRPS 오페론을 선택하기 위해 3단계의 과정을 사용하였다. 제1 단계, 모든 콘티그 및 단일체를 NRPS 모듈을 암호화하는 서열에 대하여 조사하였다. E58이 비. 서브틸리스와 관련되어 있기 때문에, 비. 서브틸리스로부터의 추정의 펩타이드 합성효소 PPS1을 집합된 E58 콘티그 모두를 포함하는 데이타베이스에 대한 BLAST 분석용 조회(query) 서열로 선택하였다. 128개의 콘티그는 0 내지 1로 정렬되는 P-수치를 갖는, PPS1에 대한 해독된 아미노산 서열 유사성을 나타내었다.
제2 단계, 슈퍼콘티그를 128개의 콘티그로부터 구축하였다. 동일한 삽입물의 말단으로부터의 2개의 서열화 판독물이 짝쌍을 형성한다. 슈퍼콘티그는 상이한 콘티그 내에 존재하는 짝쌍을 연결하는 콘티그의 집합이다. 짝쌍의 동정은 이웃하는 콘티그가 슈퍼콘티그를 형성하도록 배열 및 배향되게 하였다(도 3A). 31개의 슈퍼콘티그를 성공적으로 구축하여 전체 E58 NRPS 오페론 포트폴리오를 나타내었다.
후보 BT NRPS 오페론을 E58 NRPS 오페론 포트폴리오 중에서 선택하였다. 31개의 슈퍼콘티그를 BT NRPS 오페론의 내포 가능성에 대해 조사하였고, 슈퍼콘티그 3(마감된 서열을 토대로 한 이의 유전자 특성은 도 3B 및 3C에 나타내어져 있다)을 다음의 분석을 기초로 후보로서 선택하였다.
슈퍼콘티그 3은 잠정적으로 13개의 NRPS 모듈을 암호화하는 DNA 서열을 포함하였다. 슈퍼콘티그 3의 A-도메인 기질 특이성에 관한 사용가능한 정보는 부분적 BT1583 서열과의 호환성을 나타내었다. 기질 특이성-부여 아미노산 잔기의 완전한 세트를 11개의 모듈에 대해 확인할 수 있었다(모듈 2 및 13은 불완전한 DNA 서열로 인해 제외함). 모든 특이성을 예측할 수는 없었지만, 예측된 NRPS 아미노산 기질과 부분적 BT1583 서열 사이에 양호한 상관 관계가 성립되었다. 특이적으로, 모듈 4는 Ile를 포함하고 있는 것으로 예측되었으며, 모듈 9 및 12는 Leu를 포함하고 있는 것으로 예측되었다(표 3, 자세한 것은 아래를 참조). 부분적 BT1583 서열은 위치 4, 9 및 12에 Leu 또는 Ile를 가졌다. 11개 모듈의 기질 부여 아미노산의 계통발생학적 분석은 함께 그룹화된 동일하거나 매우 유사한 아미노산을 포함하고 있는 것으로 예상됨을 나타내었다(도 3D). 예를 들면, 모두 Val을 포함하고 있는 것으로 예측된 모듈 5, 6 및 8이 클러스터를 형성하였다. 모듈 7, 10 및 3은 다른 클러스터를 형성하는 유사한 양이온성 아미노산(각각, Lys 및 Orn)을 포함하고 있는 것으로 예측되었다.
슈퍼콘티그 3에 의해 암호화되는 NRPS 내의 E-도메인 위치는 부분적 BT1583 펩타이드 구조와의 호환성을 나타내었다. 4개의 E-도메인이 모듈 3, 7, 9 및 11에서 발견되었다(도 3C). 이들의 위치는 모든 L-형 Val 잔기 및 2:1 L- 대 D-형 Leu 잔기 비율의 상기한 BT1583 키랄 특성과 일치하였다.
따라서 슈퍼 콘티그 3은 BT NRPS 오페론에 대한 후보 유전자좌로서 확인되었다. 프라이머 연장 및 게놈 워킹을 수행하여 당해 유전자좌의 고질의 서열을 수득하였다. 이러한 노력은 추정의 BT NRPS 오페론을 포괄하는 51,821 bp의 콘티그를 도출하였다(Genbank 수탁번호#), 도 3F를 참조.
추정의 BT NRPS 아단위. 10개의 개방형 판독틀(ORF)을 해독 분석 및 blast 탐색을 통해 서열화된 영역에서 확인하였다(문헌[참조: Altschul, et al., 1997])(도 3B). 중간의 6개의 ORF(btA에서 btF로 명명)가 BT NRPS의 6개의 아단위(BtA에서 BtF)를 암호화하는 것으로 예측되었고, 이들의 좌표는 표 4에 나열되어 있다. 추정의 아단위의 서열 분석은 통상적인 동선상 NRPS의 모듈 구조를 확증하였다(도 3C). 각각 A-도메인 및 T-도메인을 포함하는 모듈은 C-도메인에 의해 연결되어 있다. 탑재 모듈 BtA는 T-도메인이 뒤를 따르는 A-도메인을 가졌다. 추정의 BT NRPS 아단위에 대한 2종의 주목할 만한 전반적인 특징이 있다. 첫째, 6개의 아단위 중 4개는 이중-모듈 구조를 나타낸다. 둘째, 모든 보조의 E-도메인은 추정의 NRPS 아단위의 중간에서 다소 말단 쪽에 존재한다. 보존 도메인의 서열 정렬은 도 4에 나타내어져 있다.
모듈 13 내의 리덕타제 도메인. 약 500개 아미노산의 도메인이 BtF 또는 모듈 13의 C-말단에서 확인되었다. BLAST 분석은 이것이 다른 NRPS 및 폴리케티드 합성효소로부터의 수개의 NADPH-의존성 리덕타제와의 높은 유사성을 가짐을 나타내었다. 에스. 아우란티아카의(S. aurantiaca) MxcG 및 에스. 세레비키애(S. cereviciae)의 Lys2로부터의 리덕타제 도메인과의 이의 정렬은 도 4E에 나타내어져 있다. 유사한 리덕타제 도메인 또한 그라미시딘 A NRPS 내에서 확인되었다(문헌[참조: Kessler, et al., 2004]). 모든 3가지의 리덕타제가 NADPH-의존성 반응에서 이들의 기질을 상응하는 알데하이드로 환원시킴이 실험적으로 입증되었다(문헌[참조: Gaitatzis, et al, 2001; Kessler, et al., 2004; Sagisaka & Shimura, 1959]). 믹소첼린(myxochelin) A 및 그라미디신 A에 대하여, 알데하이드는 추가로 알콜로 환원된다. 두번째 환원 단계에 대한 정확한 메커니즘은 확인되지 않았다. 이들 리덕타제 그 자체 또는 기타 단백질이 두번째 환원 단계를 수행하거나, 두번째 환원 단계는 자발적인 것이다. MS/MS 실험은 BT1583의 C-말단 잔기가 발린의 알콜성 형태일 수 있음을 제안하였다(도 2B). 마지막 추정의 BT NRPS 모듈의 A-도메인 특이성 예측 및 모듈 내의 리덕타제 도메인의 존재는 이러한 제안을 확증하였다.
btG는 ABC 운반자를 암호화한다. btG는 btF의 바로 하류에 있는 ORF이며, 다른 bt ORF와 동일한 방향으로 전사된다. 개시 코돈 ATG는 btF 종결 코돈의 61bp 하류에 위치해 있다. 해독된 아미노산 서열은 ATP-결합 카세트(ABC) 운반자 상위 계열의 일원에 대한 높은 유사성을 나타내었다(데이타는 나타내지 않았음). ABC 운반자 ORF는 통상적인 NRPS 오페론에서 발견된다. 이들의 역할은 세포 밖으로 펩타이드를 배출해 냄으로써 펩타이드 항생제 생성물에 대한 내성을 갖는 숙주를 제공하는 것으로 제안되어 왔다. 추정의 BtG ABC 운반자의 정확한 역할이 정립될 필요가 있다.
BT1583 펩타이드 서열 세분. 기질 특이성-부여 잔기(문헌[참조: Stachelhaus, et al., 1999])를 13개 A-도메인 모두로부터 추출하였고 공중 NRPS 코돈 데이타베이스 내에서 아미노산 결합 포켓 구성성분의 집합과 비교하였다(raynam.chm.jhu.edu/~nrps/index.html)(문헌[참조: Challis, et al., 2000]). 기질 특이성 예측은 서열 정렬을 토대로 하였고 이들은 표 3에 나열되어 있다. 제1 모듈의 아미노산-결합 포켓 구성성분은 트레오닌/디하이드로트레오닌에 대한 NRPS 코돈과의 완벽한 부합을 나타내었으며, 이는 모듈 1이 트레오닌 유도체를 포함하는 것으로 예측되었다. N,N-메틸화된 Bmt는 MS/MS 데이타에 따라 N-말단 아미노산 잔기인 것으로 제안되었다(도 2B 및 표2). 2개의 제안이 서로 100% 일치하지는 않지만, 둘 다 N-말단 아미노산 잔기로서 트레오닌 유도체를 필요로 한다.
상기한 바와 같이, NRPS 코돈 데이타베이스에 따라 모듈 4(Ile), 모듈 9(Leu) 및 모듈 12(Leu)에 대하여 3개의 명확한 특이성을 할당할 수 있었다. 이들 할당은 부분적 BT1583 서열과 호환가능하였으며, 따라서 BT1583 펩타이드의 위치 4, 9 및 12는 각각 Ile, Leu 및 Leu로 정의되었다. 오직 BT1583 펩타이드의 Ile만이 위치 4에 할당되었기 때문에, 잔여 Leu는 BT1583 펩타이드의 위치 2에 할당되었다. 따라서 모듈 2의 A-도메인 특이성은 Leu인 것으로 추론되었다. E-도메인 위치 정보와 함께 이들 할당은 본 발명자가 BT1583 펩타이드 서열을 (CH3)2-Bmt-Leu-dOrn-Ile-Val-Val-dLys-Val-dLeu-Lys-dTyr-Leu-Val-CH2OH로 정의하게 하였다.
BT 생합성 중 신규한 NRPS 코돈. 모듈 5, 6 및 8의 아미노산-결합 포켓 구성성분은 동일하다. 이들은 모듈 13의 아미노산-결합 포켓 구성성분과 단 하나의 잔기만 다르다. NRPS 코돈 데이타베이스에서 아미노산-결합 포켓 구성성분의 이들 세트에 대하여 어떠한 양호한 부합성도 발견되지 않았다. 그러나, 이들은 당해 데이타베이스에서 특정한 Ile, Leu 또는 Val NRPS 코돈에 대한 유사성을 나타내었다. 부분적인 BT1583 펩타이드 서열이 위치 5, 6, 8 및 13에서 Val 잔기를 갖기 때문에, 모듈 5, 6, 8 및 13이 Val을 포함하는 것으로 추론되었다. 모듈 5, 6, 8 및 13의 아미노산-결합 포켓 구성성분은 Val에 대한 잠재적으로 신규한 NRPS 코돈을 나타낸다.
모듈 7 및 10의 아미노산-결합 포켓 구성성분은 동일하며 이들은 모듈 3의 아미노산-결합 포켓 구성성분과 단 하나의 잔기만 다르다. NRPS 코돈 데이타베이스에서 아미노산-결합 포켓 구성성분의 이들 세트에 대하여 어떠한 부합성도 발견되지 않았다. 부분적 BT1583 펩타이드 서열이 위치 7 및 10에 Lys 잔기를 갖기 때문에, 이들 모듈의 특이성은 Lys인 것으로 추론되었다. 마찬가지로 부분적 BT1583 펩타이드 서열은 위치 3에 Orn 잔기(구조상 Lys와 매우 유사한)를 가졌으며, 따라서 모듈 3의 특이성은 Orn인 것으로 추론되었다. 모듈 7 및 10의 아미노산-결합 포켓 구성성분은 잠재적으로 Lys에 대한 최초의 NRPS 코돈을 나타내며, 모듈 3의 아미노산-결합 포켓 구성성분은 Orn에 대한 잠재적으로 신규한 NRPS 코돈을 나타낸다.
NRPS 코돈 데이타베이스에 따른 모듈 11에 대한 특이성 예측은 매우 모호하였다. NRPS 코돈 데이타베이스에서 당해 세트의 아미노산-결합 포켓 구성성분에 대한 어떠한 양호한 부합성도 발견되지 않았다. 그러나, 당해 데이타베이스에서 특정한 Phe, Trp 또는 Tyr NRPS 코돈에 대한 유사성이 나타났다(데이타는 나타내지 않았음). 부분적 BT1583 펩타이드 서열이 위치 11에서 Tyr 잔기를 가졌기 때문에, 모듈 11의 A-도메인 특이성은 Tyr인 것으로 추론되었다. 모듈 11의 아미노산-결합 포켓 구성성분은 Tyr에 대한 잠재적으로 신규한 NRPS 코돈을 나타낸다.
BT NRPS 오페론의 실체 확인. BT 생합성이 신규한 NRPS 코돈을 포함하기 때문에, 신규한 코돈의 실험적 정립(특히, 신규한 발린 및 라이신 코돈)이 BT NRPS 오페론의 실체를 확인하는 데 결정적이다. 게다가, BT1583 내의 위치 4에서의 Ile의 배치가 3개의 Leu 잔기의 배치에 영향을 주기 때문에, 모듈 4 코돈 또한 검사할 필요가 있었다.
NRPS 모듈의 정제된 재조합 A-도메인이 ATP-PPi 교환 검정에서 NRPS 모듈의 동계 아미노산 기질을 선택적으로 그리고 효율적으로 활성화하기 때문에(문헌[참조: Konz, et al., 1999; Mootz & Marahiel, 1997]), ATP-PPi 교환 검정이 NRPS 모듈 특이성 및 신규한 NRPS 코돈을 실험적으로 정립하는 데 사용되어 왔다. BT NRPS의 모듈 8, 5, 7, 4 및 2의 재조합 A-도메인을 물질 및 방법에 기술된 바와 같이 정제하였다. 거의 완전한 가용성의 재조합 A-도메인 단백질을 수득하였다. A-도메인 특이성은 ATP-PPi 교환 및 Km 검정으로 결정하였고(물질 및 방법 참조), 결과는 도 5에 나타내어져 있다. 모든 20개의 단백원성 아미노산 및 L-Orn을 각각의 A-도메인 단백질에 대하여 시험하였고, 실험 중 배경 소음은 일반적으로 1% 이하였다.
모듈 8 A-도메인 단백질은 L-Lys(10%) 및 L-Ile(4%)를 최소 활성화하면서, L-Val(100%)를 활성화하는 것으로 보였다. 겉보기 Km은 L-Val에 대하여 2.75mM인 것으로 결정되었다. 이들 결과는 신규한 발린 NRPS 코돈을 확증하였다. 유사하게, 모듈 5 A-도메인 단백질이 L-Val(100%), L-Ile(23%) 및 L-Leu(17%)를 활성화하는 것으로 밝혀졌다. 겉보기 Km은 L-Val에 대하여 1.11mM 및 L-Ile에 대하여 2.78mM인 것으로 결정되었으며, 이는 L-Val이 모듈 5에 대한 바람직한 기질임을 분명하게 나타낸다.
L-Lys는 모듈 7 A-도메인 단백질에 의해 활성화된 유일한 아미노산이었다. 겉보기 Km 수치는 1.12mM인 것으로 결정되었다. 이들 결과는 최초 Lys NRPS 코돈을 정립하였다.
모듈 4 A-도메인 단백질은 L-Val(9%) 및 L-Leu(7%)를 최소 활성화하면서, L-Ile(100%)를 선택적으로 활성화하는 것으로 보였다. L-Ile에 대한 겉보기 Km 수치는 0.5mM로 측정되었다.
모듈 2 A-도메인 단백질은 매우 모호한 것으로 밝혀졌다. 이는 L-Val(67%)의 현저한 활성화 및 L-Ile(19%) 및 L-Phe(3.5%)의 약한 활성화와 함께, 거의 동일한 효율로 L-Leu(98%) 및 L-Met(100%)를 활성화하였다.
일반적으로, 모든 정제된 A-도메인 단백질은 ATP-PPi 교환 검정에서 예측된 아미노산 기질을 선택적으로 활성화하는 것으로 밝혀졌다. 이들 결과는 BT NRPS 오페론의 실체를 실험적으로 확증하였다.
합성 펩타이드. BT 펩타이드와 BT NRPS 오페론의 실체를 추가로 확인하기 위해, 합성 펩타이드 P81(도 6)을 제조하였고(제조사[Biomer Technology], 캘리포니아주 콩코드 소재), 이의 특성에 대해 검사하였다. Bmt가 시판되지 않기 때문에, 본 발명자는 정의된 BT1583 서열에 따라 펩타이드를 합성할 수 없었으며 지질펩타이드 P81을 합성하기 위해 옥탄산-변형 트레오닌을 사용하여 BT1583을 모방하였다. P81은 BT1583과 같은 총체적인 항생제 활성 및 프로나아제 내성을 나타내었다. 이들 결과는 정의된 BT1583 펩타이드 서열 및 BT NRPS 오페론의 실체에 대한 지지를 더하였다.
C-말단 알콜성 변형의 유의성을 조사하기 위해, P81(P59)의 아미드 형태를 합성하였다. P59는 항생제 활성을 나타내었지만, 프로나아제 내성은 나타내지 않았다. 이들 결과는 C-말단 알콜성 변형이 P81 및 아마도 BT1583에 대한 프로테아제 내성을 부여하는 핵심 역할을 수행함을 나타낸다.
최초 BT NRPS 모듈에 대한 코돈이 공지된 Thr NRPS 코돈과 완벽히 부합하기 때문에, 위치 1에 비변형 Thr을 갖는 활성 BT 이성체의 가능성을 조사할 필요가 있었다. 따라서 P81(P58)의 아미드 형태를 합성하였고, P58은 불량한 항생제 활성을 나타내었다. 이들 결과는 Thr 유도체(변형되지 않기 보다는)를 확증하였다. Thr은 항생제 활성을 부여하기 위해 위치 1에 있어야 할 필요가 있다.
L- 및 D-형 잔기는 위치 5(Val)를 제외하고 BT1583의 중간에서 교환된다. 교환 키랄성이 펩타이드 항생제 그라미디신 A에 대한 핵심 구조 특성이기 때문에, 본 발명자는 모듈 5에 대한 E-도메인의 암호화 서열을 잃었는지의 여부를 조사하기로 결정하였다. P59(P80)의 D/L 교환 버전을 합성하였다. P80은 항생제 활성을 나타내지 않았다. 상기한 결과는 단지 BT1583 펩타이드 구조(N-말단 잔기를 제외한) 뿐만 아니라, BT NRPS 오페론의 실체를 확증하였다.
BT1583 펩타이드 구조, BT NRPS 오페론 및 BT NRPS는 본 발명자가 BT1583의 이성체에 대한 축퇴성 변형을 제안하게 한다(표 5). 각각의 모듈의 상대적 기질 선택성을 기초로 하여, 유의미한 양으로 E58에 의해 생산되는 경향이 있는 BT 이성체를 예측하였으며 표 6에 나열하였다. 대부분의 예측된 BT 이성체는 MS/MS에 의해 실험적으로 확인되었다(데이타는 나타내지 않았음).
BT 펩타이드의 구조 및 생합성을 생화학, 생물리학 및 게놈학의 통합된 방법을 사용하여 결정하였다. 정제된 BT1583(주요 BT 이성체)을 사용한 아미노산 조성물 및 직렬 질량분광분석 실험은 부분적 펩타이드 구조를 산출하였다. 부분적 구조 내의 오르니틴 및 D-형 잔기의 존재는 펩타이드가 생체 내에서 비-리보솜성 펩타이드 합성효소에 의해 합성되었음을 나타내었다. BT NRPS 오페론을 신규한 실리카 내 유전자 수색안을 통해 신속하고 정확하게 동정하였다. BT NRPS 오페론의 서열 분석은 이것이 동선상 모듈 NRPS를 암호화함을 나타내었다. BT NRPS의 동선상 특성은 본 발명자가 BT 오페론 게놈 정보를 사용하고 BT1583 서열을 (CH3)2-Bmt-L-dO-I-V-V-dK-V-dL-K-dY-L-V-OH로 정의할 수 있게 하였다. 추가로, 발린, 라이신, 오르니틴 및 타이로신에 대한 신규한 NRPS 코돈이 발견되었고 본원에 기록되어 있다.
실리카 내 NRPS 오페론 동정. 통상적인 NRPS 유전자 동정은 일반적 프로브를 사용하여 게놈 코스미드 라이브러리를 프로빙하는 것을 포함한다. 이러한 방법은 연구자가 다중 NRPS 오페론을 갖는 게놈 내에서 잘못된 유전자를 추적하게끔 하는 유전된 결점을 갖는다. 본원에 나타낸 바와 같이, NRPS 유전자 동정은 최적의 적합성을 찾기 위해 동일한 시기에 비교한 경우, 게놈 내의 모든 NRPS 오페론에 대하여 개선된다. 다행히도, 서열화 비용이 현저히 감소하여 미생물 게놈의 통상적인 서열화를 가능케 하였다. 2배 범위는 정확한 NRPS 오페론 동정에 충분하였다. 실제 BT NRPS 오페론 선택에서, 다음의 두 세트의 정보를 산출하여 최적의 후보를 찾기 위해 비교하였다: 기질-결합 포켓 구성성분의 유사성에 따른 NRPS 모듈 군집(clustering) 패턴; 및 D-형 잔기의 위치와 같은 위치 정보. 신규한 NRPS 코돈을 포함하는 오페론(즉, BT NRPS 오페론의 모듈 5, 6 및 8의 경우에)의 후보자격 정립에는 모듈 군집 기법이 특히 강력하다. 실리카 내 전략은 게놈 내에 다수의 NRPS 오페론을 갖는 균주(E58과 같은) 내에서의 NRPS 오페론 동정에 특히 유용하다.
* 정보는 BT1583 펩타이드 서열 세분을 위해 사용하였다.
** 당해 위치의 Leu는 오직 Ile만이 위치 4에 할당되었다는 사실로부터 추론하였다.
번호는 아미노산 잔기 위치를 나타낸다.
사료 첨가물로서의 BT.(닭 성장 증진 실험에 BT1583보다는 반-정제된 BT 펩타이드를 사용하였다.)
BT 펩타이드의 구조 및 이의 생물학적 및 생화학적 특성을 토대로 하여, 본 연구자는 사료 첨가물로서의 이의 용도를 시험하기에 충분한 물질을 제조하였다. 요약하면, 사용된 펩타이드의 특성은 다음의, 수많은 잠재적 자연 변이체 또는 이성체(>8) 및 유도체(>30)를 갖는 13개의 아미노산 잔기와 같았다. 생물학적으로, BT 펩타이드가 그람(+) 세균에 의해 생산된 천연 생성물이었음이 밝혀졌다. BT 펩타이드 계열은 비-리보솜성 펩타이드 신타제(NRPS)에 의해 합성되며, 클로닝 및 특성화가 본원에 개시되어 있다. 이러한 펩타이드 중 하나, BT1583: Me2Bmt-L-dO-I-V-V-dK-V-dL-K-dY-L-V-CH2OH(서열 번호 1)를 추가의 연구를 위해 선택하였는데, 이것이 양이온성 및 아마도 양쪽성이기 때문이다. 이는 예외적인 아미노산 잔기를 포함하고/거나 다중 변형을 포함한다.
BT1583은 이의 높은 수준의 안정성 때문에 선택하였다. 당해 펩타이드에 대하여 관찰된 높은 안정성은 다음의 특성 중 하나 이상을 포함하였다: (1) 어떠한 공지된 효소도 이를 분해할 수 없다; (2) 이것은 마우스 또는 닭 GI 관에서 분해되지 않는다; (3) 이는 오토클레이빙될 수 있다; (4) 이는 사료 펠릿화 과정에서 생존할 수 있다; (5) 이는 극한 pH(pH1.0 및 pH13.0)를 견딜 수 있다; 및 (6) 이를 불활성화시키는 유일하게 공지된 시험관 내 방법은 pH 1.0과 100℃에 밤새 두는 것이다.
BT1583의 뚜렷한 안정성 외에, 그람 양성 세균에 대한 시험관 내 항세균 활성이 입증되었다, 예를 들면, 대부분의 그람(+):MIC = 1 마이크로그람/ml. 그람(-)에 대하여, 다음은 관측된 항미생물 활성이었다: 이. 콜라이: MIC > 20 마이크로그람/ml; 슈도모나스 및 살모넬라: MIC > 100 마이크로그람/ml. BT1583은 또한 항진균 활성을 나타낸다, 예를 들면, 에스. 세레비지애: MIC = 50 마이크로그람/ml. 항 원생생물 활성 또한 BT1583에서 관측되었다, 테트라하이메나: MIC = 25 마이크로그람/ml.
BT1583 생산을 위해 E58 균주를 선택하였는데, E58 균주가 빠른 성장 및 높은 펩타이드 생산자 균주이기 때문이었다. 추가로, 빠른 펩타이드 생합성 외에, 당해 균주는 또한 염가의 배지에서, 예를 들면, 0.4센트/L의 낮은 배지 가격 및 예를 들면, 0.5g/L의 수율로 성장한다. 성장은 일반적으로 공기 교반기에서 수행하였지만, 발효될 수도 있다. 추가로, 펩타이드 및 균주를 용이한, 일 단계 정제 공정을 위해 널리 공지된 과정의 광범위한 적용 없이 사용할 수 있다.
다음의 표 및 예는 브로일러 닭에서의, 예를 들면, 21일째 배터리(battery) 시험에서, BT1583 펩타이드의 성장 촉진 능력 및 특성을 나타낸다.
간략히, 펩타이드를 배터리(시험 2-1 및 2-2)에서 직접 사육한 20일생 브로일러의 성장 및 사료 전환을 연구하기 위해 펩타이드를 반 정제 형태로 사용하였다. 사료 대조군, 6ppm의 펩타이드 및 12ppm의 펩타이드에 대하여 2개의 양을 검사하였고, 우리 당 4마리의 조류를 사용하여 치료 당 12회를 반복하였다. 당해 연구에 사용된 식단은 다음과 같았다.
BT1583를 옥수수 분말 담체 200그람에 첨가하였다.
직접 사육한 3주생 브로일러의 성장 및 사료 전환에 대한 TAMUS BT1583을 평가하기 위해, 산업용 펠릿화된 포유용 사료를 제공하였다(배터리 중, 시험 3-1 및 3-2). 간략히, 다음의 6가지 처리 처방계획을 시험하였다: 대조군, 모넨신 90ppm, BMD 50 50ppm, BT1583 12ppm, 모넨신 + BMD 50, 모넨신 + BT1583 12ppm. 다시 우리 당 4마리의 조류로 처리당 8회의 연구 반복을 사용하였다.
BT1583을 옥수수 분말 200그람을 통해 첨가하였다.
바닥 우리(floor pen)에서 직접 사육한 42일생 브로일러의 성장 및 사료 전환에 대한 TAMUS BT1583을 평가하기 위한 보다 완전한 연구는 다음과 같을 수 있다: 여섯(6)개 그룹의 처리, 대조군, 모넨신 90ppm, BT1583 12ppm, 모넨신 + BMD 50ppm, 모넨신 + BT1583 12ppm 및 BMD 50ppm. 이번에는 우리 당 40마리의 조류로, 처리 당 10회의 연구 반복을 사용하여 사료 첨가물로서 BT1583 펩타이드의 사용 효과를 평가하였다.
식품-생산 동물에서 성장을 촉진하는 경우, BT1583 펩타이드는 사료 전환과 부가적인 체중 증가에서 약 10포인트를 제공한 것으로 밝혀졌다. 본 발명의 한가지 확실한 이점은 닭 GI관에서 전혀 또는 거의 흡수되지 않으며, 따라서 이를 광범위한 사용에 유용하게 한다는 것이다. 추가로, 통상적인 항생제와 달리, 본 발명은 세균막을 표적으로 할 수 있으며, 현재는 한두 가지의 돌연변이로 변형될 수 있는 약물 표적이 아니어서 약물 내성의 개발을 가능케 한다. 추가로, 가능한 숙주 면역 조절을 통한 성장 증진이 닭에 내재되어 있으며 약물 내성과 관계없음을 밝혔다. 대안적으로, 본 발명을 제한하지 않으면서, 본 발명은 세균 감염에 대한 동물용의 유일한 항생제로서 사용될 수 있다. 또한, 현재까지, 당해 펩타이드의 성장 촉진 활성의 감소는 관찰되지 않았다.
BT1583 단독으로 및 이를 널리 사용된 코키디오스태트 모넨신(MON)과 함께 사용하는 것으로서 당해 프로젝트를 위해 고안된 신규한 항-미생물제의 성능을 MON만을 단독으로 제공하는 것, 또한 널리 사용된 항미생물제 박티트라신 MD(BMD)과 함께 MON을 제공하는 것 및 BMD만 단독으로 제공하는 것과 비교하기 위한 브로일러 바닥 우리 시험.
다음 농도의 각각의 처리를 평가하였다:
1: 무첨가
2: 모넨신(MON) 99 ppm
3: BT1583 12 ppm
4: BT1583 12ppm + MON 99ppm
5: MON 99ppm + BMD 55ppm
6: BMD 55ppm
당해 연구는 처리 당 10개의 우리를 포함하였으며, 우리 당 40마리의 조류를 부화일에 수용하였다. 감소된 단백질(대략 23 내지 20%) 및 증가된 대사성 에너지(대략 1400 내지 1455kcal/lb)의 2종의 기본 옥수수-콩류 식단을 각각 0일 내지 21일째까지(포유용 사료) 및 22일째 내지 42일째까지(육성용 사료) 사용하였다. 처리 전혼합물을 측정하고 필요한 수준으로 식단에 혼합하였다. 0일 및 21일째 사이의 폐사율은 최적으로 성장하는 모든 조류에서 1% 미만이었으며 모든 그룹에서 우수한 건강 상태를 유지하였다.
연구 22일째에 시작하여, 당해 연구 감독자는 사육장 온도 및 기류를 조절하여 실험을 받은 적이 없는 무리 내의 대장균증 발발을 촉구하는 산업 조건을 모방하였다. 이는 당해 연구를 위한 자연 챌린지(challenge)를 자극하기 위해 수행하였다. 폐사율은 42일째에 대략 10%의 사육장 평균까지 상승하였다. 이들 주요 폐사는 BT1583 또는 MON을 받지 않은 그룹에서 발생하였다. 손상은 대장균증의 손상과 일치하였다(공기낭, 폐렴, 간주위염, 심주위염 및 극심한 이환률). 모든 폐사율을 문서화하였다(사망시 체중 및 부검 관측). 모든 조류 및 사료는 42일째에 칭량하였다. 모든 잔여 조류를 42일째에 질식시켜 안락사시켰으며, 동물 시체는 렌더링(rendering)용으로 제출되었다.
모든 데이타를 하기한 바와 같이 분석하였고 표 26에서 30에 걸쳐 나타내었다. 다음의 변수를 시험하였다: 반응 변수: 조류 당 증가, 증가 당 사료, 폐사율(%), 증가 당 조정 사료. 42일째에 0.05 수준의 유의도를 사용한, 하나의 차단 인자 = 위치를 사용하는 일원 분산분석(One Way ANOVA)로부터의 F 검정.
모든 반응 변수: ANOVA F 비율이 유의미한 경우, 0.05의 총 유의도 수준을 사용한, 유형 1 평균 오차와의 이원 비교를 위한 LSD T-검정 과정. 밑선 평균(아래의 표 30 참조)은 평균에서 유의미하지 않은 차이를 갖는 그룹을 지시한다.
처리 | 42일째 증가/조류 |
무첨가 | 3.900d |
모넨신(MON) 99ppm | 4.111bed |
BT1583 12ppm | 4.333ab |
MON 99ppm + BT1583 12ppm | 4.385a |
MON 99ppm + BMD 55ppm | 4.127c |
BMD 55ppm | 3.971cd |
체중 증가는 MON + BMD 및 MON 그룹에 의해 제공된 것보다 MON + BT1583을 받은 그룹이 유의미하게 무거웠으며(p<0.05), 42일째에 측정한, BT1583을 부여받은 브로일러 2개 그룹이 가장 무거웠다.
사료/증가: 표 27은 MON + BT1583을 제공받은 브로일러가 BT1583만을 제공받은 그룹을 제외한 다른 모든 그룹보다 더 낮은(p<0.05) 사료/증가 수치를 가졌음을 나타낸다.
처리 | 42일째 사료/증가 |
무첨가 | 2.189d |
모넨신(MON) 99ppm | 1.854a |
BT1583 12ppm | 1.722ab |
MON 99ppm + BT1583 12ppm | 1.689a |
MON 99ppm + BMD 55ppm | 1.885bc |
BMD 55ppm | 2.147c |
조정된 사료/증가: 각각의 우리에서의 폐사 동물의 총 체중을 최종적으로 살아 남은 동물의 체중에 더하여, 이 수치를 초기 체중을 감하여 감소시킨 후 총 사료 소비량으로 나누어 조정된 사료/증가를 계산하였다.
표 28은 사료/증가 수차에 대한 자연 챌린지의 효과를 입증한다. 심지어 폐사율에 대한 조정과 함께, MON + BT1583를 제공받은 브로일러는 다시 BT1583만을 제공받은 그룹을 제외한 다른 모든 그룹보다 유의미하게 낮은(p<0.05) 조정된 사료/증가 수치를 가졌다.
처리 | 42일째 조정된 사료/증가 |
무첨가 | 1.928c |
모넨신(MON) 99ppm | 1.761b |
1583 12ppm | 1.704ab |
MON 99ppm + BT1583 12ppm | 1.654a |
MON 99ppm + BMD 55ppm | 1.725b |
BMD 55ppm | 1.838bc |
폐사율: 주요 폐사는 급성 및 만성 대장균증에 의해 유발되었다. BT1583 또는 모넨신만 제공받거나 이를 배합하여 제공받은 브로일러는 무첨가 대조군보다 낮은 폐사율을 가졌다.
처리 | 42일째 폐사율(%) |
무첨가 | 17.50c |
모넨신(MON) 99ppm | 8.00a |
1583 12ppm | 2.75a |
MON 99ppm + BT1583 12ppm | 3.50a |
MON 99ppm + BMD 55ppm | 7.75abc |
BMD 55ppm | 18.25bc |
모넨신은 승인된 폴리에테르 항생제이며 가금류 산업에서 항-원생생물제로 사용된다. 모넨신 및 그람 음성 세균에 대한 기타 폴리에테르 항생제에 의한 미미한 효능이 많은 조사자 및 가금류 산업자들에 의해 문서화되어 있다. BT1583 또한 그람 음성 세균에 대한 효능을 갖는다. 대장균은 보건학적으로나 경제학적으로나 식품 산업에서 주요한 문제가 되어 왔다. 당해 병원체에 대해 매우 효과적인 대부분의 생성물은 21일생 이상의 브로일러에 사용하기에는 너무 비싸거나 대중적인 건강 관심을 불러일으키는 사람 건강 상품과의 유사성 때문에 시장에서 밀려났다. 당해 연구는 BT1583이 모의 상업적 브로일러 조건 하에 사육된 3주 내지 4주생의 실험받은 적이 없는 닭에서 대장균증에 대하여 매우 효과적임을 입증하였다. 당해 시험에서 관찰된, 모넨신 및 BMD만을 그리고 이들을 배합하여 제공한 것 이상의 BT1583에 의해 획득된 20+ 포인트 체중 증가 이득 및 10+ 포인트 사료/증가 이득은 당해 생성물이 가금류 산업의 미래를 위한 매우 귀중한 도구일 수 있음을 강력히 제시한다.
본원에 기술한 특정 양태는 예시로서 나타내었으며 본 발명을 제한하지 않음을 이해할 것이다. 본 발명의 주요 특성은 본 발명의 영역을 벗어나지 않으면서 다양한 양태로 사용될 수 있다. 당해 분야의 숙련가는 본원에 기술된 특이적 과정에 대한 무수한 동등한 방법일 뿐인 통상적인 실험을 사용하여 인지 또는 확인할 수 있을 것이다. 이러한 동등한 방법은 본 발명의 영역 내에 있는 것으로 간주되며 본 청구항에 의해 포괄된다.
본 명세서에 언급한 모든 문헌 및 특허 출원은 본 발명이 관계된 분야의 숙련가의 기술 수준을 나타낸다. 모든 문헌 및 특허 출원은 각각의 개별 문헌 또는 특허 출원이 참조 인용되어 있음이 특별히 그리고 개별적으로 제시된 바와 같이, 동일한 정도로 본원에 참조 인용되어 있다.
본원에 개시 및 청구된 모든 조성물 및/또는 방법은 본원에 비추어 불필요한 실험 없이 제조 및 실행될 수 있다. 본 발명의 조성물 및 방법이 바람직한 양태의 관점에서 기술된 반면, 당해 분야의 숙련가는 본 발명의 개념, 정신 및 영역을 벗어나지 않으면서 본원에 기술된 조성물 및/또는 방법 및 방법의 단계 또는 단계 순서에 변형을 가할 수 있음을 명확히 이해할 것이다. 보다 특히, 화학적 및 생리학적으로 관련된 특정 제제로 본원에 기술된 제제를 대체할 수 있으며, 동일하거나 유사한 결과가 달성될 것임이 명확해질 것이다. 당해 분야의 숙련가에게 명확한 이러한 유사한 치환 및 변형 모두 첨부된 청구항에 의해 정의된 바와 같이 본 발명의 정신, 영역 및 개념 내에 있는 것으로 사료된다.
참조 문헌
<110> The Texas A&M University System
<120> COMPOSITIONS, METHODS AND USES FOR A NOVEL FAMILY OF PEPTIDES
<130> TAMU 1007
<150> US 60/540,569
<151> 2004-01-30
<160> 28
<170> KopatentIn 1.71
<210> 1
<211> 13
<212> PRT
<213> Artificial
<220>
<223> synthetic oligonucleotide
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Orn
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-Form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-Form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 1
Xaa Leu Xaa Ile Val Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 2
<211> 13
<212> PRT
<213> Artificial
<220>
<223> artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-Form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-Form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 2
Xaa Met Xaa Ile Val Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 3
<211> 13
<212> PRT
<213> Artificial
<220>
<223> artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 3
Xaa Val Xaa Ile Val Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 4
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 4
Xaa Ile Xaa Ile Val Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 5
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 5
Xaa Phe Xaa Ile Val Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 6
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 6
Xaa Leu Xaa Ile Ile Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 7
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 7
Xaa Leu Xaa Ile Leu Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 8
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 8
Xaa Met Xaa Ile Ile Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 9
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of Ornithine lysine leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 9
Xaa Met Xaa Ile Leu Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 10
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 10
Xaa Val Xaa Ile Ile Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 11
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 11
Xaa Val Xaa Ile Leu Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 12
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 12
Xaa Ile Xaa Ile Ile Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 13
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 13
Xaa Ile Xaa Ile Leu Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 14
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 14
Xaa Phe Xaa Ile Ile Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 15
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 15
Xaa Phe Xaa Ile Leu Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 16
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form ofleucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 16
Xaa Leu Xaa Val Val Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 17
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of Ornithine lysine leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 17
Xaa Met Xaa Val Val Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 18
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 18
Xaa Val Xaa Val Val Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 19
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 19
Xaa Ile Xaa Val Val Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 20
<211> 13
<212> PRT
<213> Artificial
<220>
<223> Artificial sequence
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine
<220>
<221> MOD_RES
<222> (3)..(3)
<223> D-form of Ornithine
<220>
<221> MOD_RES
<222> (7)..(7)
<223> D-form of lysine
<220>
<221> MOD_RES
<222> (9)..(9)
<223> D-form of leucine
<220>
<221> MOD_RES
<222> (11)..(11)
<223> D-form of tyrosine
<220>
<221> MOD_RES
<222> (13)..(13)
<223> C-terminal Alcoholic Valine
<400> 20
Xaa Phe Xaa Val Val Val Xaa Val Xaa Lys Xaa Leu Xaa
1 5 10
<210> 21
<211> 50674
<212> DNA
<213> Artificial
<220>
<223> artificial sequence
<400> 21
attcgttgga tccagtgtgg tggaattcaa accctcagtg ggtaaagata ttgccagagt 60
cttgaaatgt accaaacagg gaaatgggta ccttgaaggc gacaaatatg tagtaacctg 120
ggcatttggc catctggtta cgctggctga tcctgaagcc tatggagaga catataaagc 180
ttggaagctg gaggatttac cactgttgcc gtctcgcctg caattaactg tcatcagaca 240
gagctccaag caatatcaga ttgtaaaaaa attattagcg cgtcaggata tttcagaagt 300
gattattgct actgatgctg gtcgtgaagg tgagctggtg gcgcgatgga ttttagaaaa 360
ggcacatgtg aaaaagccta ttaaacgact atggatttcc tctgtgactg ataaagcaat 420
cagtgatggc ttcagaaagc tgcgagatgg caaggaatac gagaatctct atgcttctgc 480
tgtagctcgc gctgaagctg actggtttgt cgggatcaat gccactcgtg ctcttacaac 540
gaagcataat gcccagctct cctgcgggcg tgtacaaact cctacagtgg caatgattgc 600
caaacgtgag gaggagattc aaaggttcgt tcctcgcccc tattatggtg ttcaagcgat 660
cacaggtaat ggattaaagc ttacgtggca ggatcagcaa accaaagata tgaagacgtt 720
taccaaggag aaggctgaga aaattgtcga aagcagtaaa aacaagcaag ctgaaattat 780
tgacatcaag aaggctgaca agaaaagctt cgccccagct ttatatgatc taactgagct 840
acaacgtgat gcgaataagc gttttggttt ttcggcaaag gaaaccctct ccattatgca 900
agggctatac gaaacacata aggtactcac atacccgcgg acagattctc gctatttgac 960
atcagatatt gtcgaaacat tacctgatcg attgagagcg atatctgtta agccatacac 1020
tccgtttgca gctaagctgt taaagcaacc gattcgagct ggtaaacatg tagtggataa 1080
tagcaaggta tctgatcacc atgcgattat tccaactgag caatctgtgc tgttaaataa 1140
gcttagcgat aaggaacgta aaatttatga ccttgtggtt aaacgctttc tggctgtgct 1200
atatccgcct tttgaatatg aacaaattag tattcgtgcc cgaattggca acgaggaatt 1260
tctagcaaaa gggaagacga taacgcatca gggctggaag gaaatttatg ataatcactt 1320
tgatgaagag gatcaaggag atggattaaa agaacagctt ttaccaacgc ttgtacaagg 1380
tgagcaacta tctgtacaaa ccgtttcttt tacaaaaggg gaaacaaaac ctccagagcc 1440
atttacggag gctacactcc tttcagctat ggagaatcct gtccgttata tgggacaggt 1500
tgataagcag ctagccaaaa cattaggtga gacaggtgga ttaggaactg ttgctactcg 1560
cgccgatatt attgaaaaat tgtttaatag cttcctcatt gaaaagcgca gcaagcatat 1620
tcatattact tctaaaggaa agcaattact tgagcttgta ccagaaggac ttcgctcacc 1680
ggctcttact gctgaatggg aagtgaagct tggagcgatc tcgaaaggaa gcctggctaa 1740
aaacagcttc atacaggaaa tgaagaagta tgcagagcaa atcgttcaac agatcaaatt 1800
tagtgagcaa aagtttcgtc atgacaatct gactcgctcc aaatgcccgg attgtggaaa 1860
gctgatgctt gaggtaaatg ggaaaaaagg aaaaatgtta gtttgtcagg atcgtgagtg 1920
tggtcaccgt aaggccgtat ccaaggttac aaatgccaga tgcccacaat gtcgaaagaa 1980
gatggagatg cgtggggaag gagaaggaaa gatattcgta tgcaaatgcg gacatcgtga 2040
aaaactgtcg acgtttaacg acagacgtag caaggagaaa cagacaaatg tttcgaaacg 2100
agatgtagcc cagtatatga aaaatcagca acgagatcaa gaaagcttag gtaatccagc 2160
cttgatggag gcattaaaga attttaagct agatcagtaa gtcattttat atagaaaaga 2220
taggctcgaa aataaggcgc ccgctctctt tattagctaa gagaaagggc gtctatttta 2280
gcttctcttt tctatatgga aaaaaggaat taacaaaatc tgaagaaaat ttcagaattt 2340
attattttta tgttaagaga ttttgaaaga agtgcatcta tttactttat ccataaatga 2400
aagcaaaaat gagattgtta tattccataa aatgtaaatg tttttatatc ttggaaaaca 2460
tagagtcgag aacgctgttc actatacaag aagactatag atacgagctt ttacggctat 2520
ttttacgatt tgataacgcc ttcttttttt agtctaataa aaaacagtaa cgaatcgaaa 2580
aaataacaat aatttgattg gtaaataaca ttgttactaa ttcacagaaa acaaaatcat 2640
tatttttaca taataaaaac ataataataa aatgtgatag aaaaatattg aagaaaatgt 2700
ccattattgg tagtattgaa aaataaacct gtaattttat gtattataat gcaattattt 2760
gtcgcatatt tactagcata aatgttagcg atgatgtgag caaatcgtta cctgttagaa 2820
ggaagatcag ctacatatga ttcaaaattt ttcgtttttt tattttaaaa gacaaagagg 2880
tggtcctgat ggatttatct acattaaatt ttttgggtga aacagaaaag cataagttat 2940
tgaatcaatt caatgatacg gacgctaatt ttcctcagga gatgaccatt catgggctgt 3000
ttgaaaagca agtccaagaa agaccgaatc aaactgcggt aatttttaat gaacaaagta 3060
tgacgtataa agaaatgaat gaacgagcca atcaagtagc acatagctta cggaagcatg 3120
gagctgctcc agatgagatc gttggaattc tagcagatcg caacatggac atgcttattt 3180
ccattctcgg cgtattaaag gctggagctg cttatatgcc tattgatcct acatacccta 3240
cagaacgtat tctttatatg atccatgata gccagaccaa aattgtctta gctgaacata 3300
gagagatggt tccggaaggc tgtaatgcag agctgatcct cttgcacgat agctcccttt 3360
taaacgaaga gacatctgat ctagagcatg taaataagcc tgaagatttg gcctatatta 3420
tctatacatc aggttctact ggtaaaccaa aaggggttat gattgaacat cgaaatgtca 3480
ttcgcttgct atttaatgac agaaacctat ttgattttac tagtgatgat gtctggaccg 3540
ttttccattc gttctgtttt gacttctctg tttgggagat gtatggggct ttactgtatg 3600
gaggaaaaat cgttctcgtc tcttttgaga tagctagaga tcctcaggcc ttccgagatt 3660
tacttcagga gcaaaaggtt acgattttaa atcaaacccc tacagctttt tatcagctct 3720
cgtctcaaga gatgcagcac tcagacagca atctatcgat tcgtaaaatc atttttggtg 3780
gagaagcgtt gacgccatca cagttgaaag catggaaaca aaaatatcca aatacagcct 3840
tgattaatat gtacggtatt acagaaacaa ctgttcatgt gacttataag gagtttcaat 3900
tacatgatat ggacagcaca gttagcaata tcggaaagcc tatcccaacg cttagaacct 3960
atgttttaga ttccaagaga aacctagctc caattggagt gaaaggtgaa ctgtatgtga 4020
gcggcaaggg agtagcccgc ggttatttaa acaaacctga attgacggaa gaacggttta 4080
tggataaccc gtttgttgct ggagaaagaa tgtatcgcac aggagaccta gctagatggc 4140
tacctgaagg agagctagaa tatctaggca ggattgacca tcaggtaaaa atcagaggct 4200
atcgcattga actcggagaa atagaagccg agctattgaa gcaaaaaggg attaaagaag 4260
cagtagtttt agttacaaat gataaagatg cacaaccaca attacatgcc tatttaacat 4320
ctaaggaaga tttggcagca gcagatcttc gtaatcaact tactacaaca ttaccctctt 4380
acatgattcc ggctcatttc atttttgtgt cgcaaatgcc tgttacgcca aatggaaaaa 4440
ttgataaaga atcacttcgt aaaatagaac catcacttca agaaagccct acagaagctt 4500
atgtagctcc acaaacacct acagaaaagc aattagtcca catatgggaa gaaaatattg 4560
gaatgcaacc gatcagcata gacgataatt attttgctct aggtggtgat tccatcaaag 4620
cgattaagct attgcatgct ataaataaag agtttcagat tagtttccaa attggagatt 4680
tgtataagca tggaaccatt agagaaatgg gacagcaaat cggtgaaaag ggcaagcaat 4740
ctagcaatca aaaactgttg aaacttcagg aattggaccg tttaaaagag aaaattttgg 4800
gaagtgagaa atagtcatgt cggataagct aagcaacgct aaagacctat ttccaatgag 4860
cgatatacag ctagggatgg tctaccattc gttaaaacat gtacacgaag ctgtatacca 4920
tgatcaattt gtttatcaag tagatgatga ttcatttgat gttcatgtgc tagagcaagc 4980
gatgagaatg atggttgata agcacgacat cttaaaaacc agctttcata ttgaggaatt 5040
ttccactcca gttcaagtag tgcaccagga ggtttctgtt cgaattgatg agacagacat 5100
tacgcatctg ggagaaaaac aaaaagagta tatccatcag tatttggcac aggatcgtca 5160
atcccctttt gatgtaacaa ccgctcctct atggagaatg agcgttttta aactgaatgc 5220
aagccaagtt gctttagtct ggatctttca tcatgctatt ttggatggat ggagtgttgc 5280
atcttttatt acggaattaa ttgatgttta tttcaaatta aagcacaaaa cttgcacttt 5340
ggagcatttg aacacgacct ataaggatta tgtgattgat cagatgctat tatctgagca 5400
aaatgagctg cgtgaatatt ggaaagaaga attaaaagat tacaaacggc tacagctccc 5460
agtaaaagtg gatgaaaatg gcggtgttca cgttaccgtt gttgagaagc tagaccctga 5520
cattataaat aaatgcagag aaattgcaca agctcatcac attccattaa agaccgtatg 5580
cctaacagcc tttctttcta tgatgcatat gatttcttat gagagagacc tgactgtggg 5640
attgattgag aacaaccgac caattataga agatgctgaa aaggtgttgg gatgttttct 5700
taactcagtt ccattccgcg ccattataaa gaaagatatg agctacagag agctattaga 5760
gcagacacag caaaagcttg ttgagattaa aacatatgga agactttcct ttgctaagat 5820
tattgaagta attggcgata cgggaagcga gcgtaatcca gtttttgact gtctttttaa 5880
ctttgtcgac ttccatgtat ttaaagggat aaaggatcat aaagtaaagt tttggttaga 5940
tggatatgaa aaaacaaaca ccatgtttga cttttctgtt tcgaccacaa tggatgacta 6000
ttttgttcgg gttgtatctg cactgccaga agaagatacg ataaaactaa ttaactatta 6060
tcaacgaatt ttagaaaaga ttgctcttca catagatgaa aaaatagata aacaagccaa 6120
tcttgatgaa aaggaaagcc acttgctgct agaggaatgg aatcaaacgt cagttgatta 6180
tccagacaag caaacattgc ataaacggtt tgaggagcaa gtagccaaaa atgaagatca 6240
ggtagcgctg gaatatgagg ataagcagct tacctatagg gaattgaacg ctaaagccaa 6300
tcaattggca cgtgttttac agaagcataa tacgctgcca actcaggtag ttggtctaat 6360
ggcagagcgt tcactagaga tgataatagg cattcttggg atattaaaag ccggcggagc 6420
ttatatgcct attgacccta cgtatcctgc ggagcgtatc caatatatgc tcgaagatag 6480
tcgatcctat ctcttacttg tacaaaaagc agaaatgatt ccagccaatt atcaggggga 6540
agtacttatc ctcacagagg aactttgggc agatgagaat acagagaacc tggaactagt 6600
caatcagccg caggatgttg ccaatatcat gtatacatct gggactacag gaaagccaaa 6660
aggtatcctg atcactcatc gaaacattat gactaccata atcaacaatg gctatctcga 6720
tattttttca acagatcgaa tattgcaaat atctaactat gcttttgatg gttctacctt 6780
tgatatatac agtgctttgc taaacggagc tactctcgtg ctagttccca agcaaacact 6840
catgaatacg accgatctgt tagcaatcat caaagatagc aatatcacgg tagctttaat 6900
gacaacctct ctattcaata cgttggttga tcttgatgta accagcttcc aacatacacg 6960
taaggtttta tttggcgggg aaaaggcttc atgtaagcat gtagaaaaag cattggatta 7020
tttgggtgaa gggcgcctag taaatggata tggtccgaca gaaacaacgg tgttcgctac 7080
tacctataca gtcgataaca cgattaaaaa gctgggaagt atcccgatcg gacgtccttt 7140
gagcaacact tcggtatata tttttggatt agatgatcaa ttacaaccac ttggagtacc 7200
aggggagtta tgtgtagcag gagaatgcat ttcgcctgga tatctgaatc gtcccgactt 7260
aacggcagac aaatttattg ataatccact taaaccaggt gagagaatgt accgtacagg 7320
tgacctagtt cgttggctgc ctgaaggtgt catggaatac atggggcgga ttgatgaaca 7380
agtcaagatt cgtggacatc gtatcgagct aggggagatt gaggcaaagc tgcttgagca 7440
tccttcgatt cgagaaacag tgctggtggc taaacaggat gcaaatggcc attctttttt 7500
aggtgcgtat cttgttacag acaacttctg ccctgtaacg gaattacgga attatctgat 7560
ggaaaccttg ccagaatata tggttccttc ttattttatc gagctggata gcctaccgct 7620
tacttcaaat ggaaaagtag ataagcgagc attgcccgaa ccggaatctc aggctttaca 7680
cgcatatacc atgccggaga atgagacgga agaaaaattg gttcagctat tccaggaagt 7740
gatggatgta gagcgtgttg gtactcaaga tagcttttat gaattaggcg gtcattcctt 7800
aaaagcaatg cttttggttt cacgaattca taaggatttt ggaataaaga taccgttgaa 7860
ggaagtattc agtcgtccga ccgtgaagga attggctgcc tatctgactg ggtcagaaga 7920
agcaaactat attgaaattg aagcagcaga agagaaacca tactatccag ttactgccgc 7980
ccaaaaacgg atgtatatcg cccagcaatg ggaggatggg gaagccacta gcagttatca 8040
catgccgttt atgatggaaa tcacagggcc tcttcaagta gaaaagctac aacaaacagt 8100
aaagagtctt gtcgcaaggc acgagtcgtt gcggacatca tttcacatga tcaatgaagt 8160
attgatgcaa aagatacatg cagatgtatt gtgggattta gacattgatc tagagtcagt 8220
tgtcgcttca gagcaagaaa ttgatgaaaa aatgttccaa ttcctccgca aatttgattt 8280
gagtcaagct cctctcttta gagctaagct gattcgtgtc aatgctagtc ggcatgtatt 8340
gttattagat atgcaccata ttatttcgga tggattttca taccagatat tttttgatga 8400
gcttaccaag ctgtatcagg gcgatgaact gccatctctc aaaatacaat ataaggatta 8460
tgccgtttgg cagcattcgg aagaacaaca gaagcgtttg caacagcaag aggattattg 8520
gttaggtcaa ttccaagggg aaattcctgt tctggaattg cctacggatt accagcgccc 8580
ggttgataaa cagtttgctg gagcattatt cacacacggg ttatctgctg gtctaacaga 8640
gaagctgaga aaattagcga ttaaggaaaa aacgacgtta tacaccgtac tgctgacggt 8700
ctataacatt ctattgagca aatatacaag tcaagaggac ctcattgtag gtacaccgat 8760
tgctggacgt ccacatgctg atttagacag agtatttggg atgtttgtaa acacgctggc 8820
catcagaaca gctccaaaag tagagcattc cttcttaacg tatctatctg aggtcaaaga 8880
aacagtgcta ggtgcttatc aaaatccaga ctatccattt gaggagctgg ttgaaaaaac 8940
gctagttcag cgcgatgtaa gccgtaatcc tttattcgat gtaatgttct ccgtagagaa 9000
attaccatct gctgtacagt tcgatgattt acgtttctgc ccacgcttat ttgattggaa 9060
gaaggcaaaa tttgacttgg attggacagt ggtggaaggt gaatcattgg aggttttggt 9120
tgaatatagc acgagcttgt tcgatcgggc gaccattgag cgcatggcta agcattttga 9180
gcatattttg gagcaaatcc ttgatcagcc agacctgtct atttctgaga ttgaactgct 9240
gaccgaggca gaaaaacaac aaattttgat tgagtttaat caatcggata aatcctttga 9300
cagcgaaaaa acaattcagg agcaatttga agaatgggca gaaaaagccc cgcacagcat 9360
tgccttagtc tttaaagaca agcaaatgac ctatcaggaa ttaaatcaac gtgctaacca 9420
agttgcgcat ttattacgtg gcaatgggat ttccgcaaat gattttatcg gtttaatggt 9480
ggatcgatcg tttgagatga tcattagtat gctaggtatt ttgaaggcgg gtggagccta 9540
cctacctatt gatcctgatt atcctgagga ccgtatcgat tatatgttat ctgacagcaa 9600
agcgaagatt ctcttaaagc aaagtgacca aactgcacca gcttcctttg aaggtaaagt 9660
catcgctatt gatactccag aattgctaga gatggatata gaaaatattc ctaaggtgaa 9720
taactcatcc gacttggctt atatcattta tacatctgga tcaaccggaa aaccaaaagg 9780
agtattgatt aatcatcgat gcgtgatcaa tatgcagctt acagctgaaa cctttggtat 9840
ctatccttcg agtcgtattc tacagtttgc atcctttagt tttgattcat ctgtgggcga 9900
gattttttat acattattaa acggagcatg cctgtatttg gtagaaaagg atttgctttt 9960
atccggtaat gaattcgtgg catggctaaa gaaaaatcgg attagctcga ttccatttat 10020
ttcaccgtcg gctctgcgga tgcttcctta tgaggattta cctgatctcg catatataag 10080
tacgggtggg gagacattgc cggctgacct tgttaaagcg tggggagaaa atcgtgtctt 10140
cctaaatgca tatggcccga cggaaacaac tgtagatgcc actgtcggtg tatgtacacc 10200
agaagggaaa ccgcatatcg gtagacccgt tacgaataaa aaggtgtacg tagtaaatag 10260
taacaatcaa ttacagccga ttggtgttcc tggcgagctt tgcattggcg gggaaggggt 10320
tgcacttggc tatctaaaca gacctgatct aacccaagaa aaattcgttt ccaatccgtt 10380
tgccccgggt gaaagaatgt accgctccgg agacttagtc agatggctac ctgatggaac 10440
aattgagtac ttcggaagat tagacgatca agtaaaaatt agaggtcacc gtattgaact 10500
aggagagatt gaaacaaggc tactagagca tccatccatt aaagaagcca ttgtcattcc 10560
acgttctgat gagtcagagg ctacatattt atgcagctat ttgattgcag aaggatcatg 10620
gaatgcggct gacttacgta agtatttgaa ggcttcttta ccggaatata tgataccttc 10680
gtattttgtg gagctgcacg agctaccgct aacacctaat ggaaaagtta ataaaaaagc 10740
attaccaaaa ccagaaaagc aaatgcagag agggaaggat tatgtagccc ctactaaccc 10800
tatccaatcc attttatctc agatttggac tgatgtgctt ggtgttgaaa atataggaat 10860
tcacgacaat ttctttgaat taggtggaga ttcaattaaa gccatccaaa tttcagctcg 10920
acttaataag cataatctca aggttaaaat gcgggaattg tttaagaacc caacgattgc 10980
tgagctaagt ctgcttgtac aacagatcgt tcaggagatc gatcaaggag tagtagaagg 11040
aaatattccg cttacaccga tccagcattg gttctttacc caatcattcc cgcaggtcaa 11100
ccattacaat caatcggttc ttctttttaa tgcggagggc tgggatgagc agaaagtaga 11160
caaagctttt gagatgctaa cccagcacca tgatgcactg cgaatcgtat atagcctcga 11220
cgagcaaggg gttgtacagc gtaaccgggg attggaaggc tcgaactatc atttcgaaat 11280
cattgatgca agacaagatg gagaagatca gtcgaactgg aaagcagcgg cgaatcggat 11340
gcaggcaagt atggatatcg tagaaggacc tttagtgcag atcggattgt tccgtgctaa 11400
tgaaggagct tatttgttaa ttgccattca tcacttagtg gtagatgggg tgtcttggcg 11460
tatcctacta gaagacttct atcatttata taacggaaac gactctttgc cattaaaaac 11520
gacctcgttc caagcatggt ctcaaaagct ccaagagtac gcccaaagca aggagctaga 11580
acatgagctt tcctattggc gccatttaga tgaagctatc acggactata ccttacacaa 11640
agatatagaa gccgcaacct caaataagac aacctatgag gaatttttaa ctgtatcgat 11700
gtctttatca actgaggaaa cccaacagct agtaacagag gctcataaag cgtaccaaac 11760
ggaaataaat gatctgctac tcacggcact ggctttagct ttgaaggaat ggacgaataa 11820
agagcagttg ctagttagta tggaggggca tggacgtgaa gaaattctag ataacgtaga 11880
tatctcccgt acagttgggt ggtttacatc agagtatccg gttgctattc atctgacgaa 11940
aacagacatt tcgtttgcca ttaaacaagt aaaggaaacg ttgcgtcgtg tacctaacaa 12000
agggtttggc tatgggattc ttaaatattt ggcaaaagag acgttcaagc ttaagccaga 12060
aatcagtttt aactatctag gccaatttac agataaggaa gaggggaact cctctttaat 12120
gggtgatctg attagcccgg caaataccag tgagctgtcc ctagatatca atggaagtat 12180
agaagctgac agactgcaaa tgcactttag ttataactct cgtgcgtact atccagagac 12240
aatcgcaacc cttgttcaaa acttcaaatc ctacttgctt gagattatca atcattgccg 12300
ggcgaaagaa ggagtagagc atacaccaag cgactttgat atcaatgatc tcaccatgga 12360
agaactagat gatatttttg atgacctgga agaagaggta tacaaataac taggcaaaaa 12420
tatggagtga tttagatatg tttagcagaa gtaatgtgca aaatttgtat cgcttatctc 12480
ctatgcaaaa agggatctta tttcattcct taaaagataa agaaaatcat gcctattttg 12540
atcaactgat cttcactttg gaaggtaagg tagagcttga atatttggaa gaagccttta 12600
cccaattaat caaaaagcat gatattttac gaactgtttt tcgttacaaa aaagtaaaag 12660
aacctgtaca aatggtatta aaggaaagaa gctccactat ttattttgaa gatatttctc 12720
atctggagcc agaagaaaaa gtgaattaca ttaagcagtt taaaatgagg gatcgggaga 12780
aggggtttga cctctcccgg gacctcctca tccgaatgtc attatttaag cttgatcagg 12840
agcagtatca gttaataatg agtaatcacc atatcattat ggatggttgg tgccttggca 12900
ttatccttac tgatttctta cgtatgtata aaggaatcgt gaatcatacc cctgttccat 12960
acgagcatgt gacaccttac agtaagcata ttcaatggct agaaaaacag gatcatcagg 13020
aagcaaagga tttttatcaa cagctattag agggatacga caaagtaaca ggtgttccac 13080
agcaattagt acgggcgaat cacgaagaat atactcacgg acaatgcatc gtgaaattaa 13140
atcaagaaac tgccgaccga ttgattgcca tagccaaagc ctaccaggtt acagtcaata 13200
ccgtcttcca aacgatttgg gggatattat tacaaaaata taataatacg gatgacatag 13260
tatttggatc agttgtctcg gggagaccgg cagagattcc tgatgttgaa aaaatggttg 13320
ggctatttat caatacaatt cctgtgcgaa tcaaagctga tcaacaagag cgatttgaca 13380
cgctagtagc caaagtacag gaaatggcct tggcttcaga atcatatgat tatctttcgt 13440
tggcagatat tcatccagaa gctggcgatt ttatcaatca tattattgcg tttgaaaatt 13500
tttatatcga tatggacagc tttaatcagc tagcagataa aaaagagctt ggattctcgc 13560
tcgcattcgc cacagatcat cacgagcaaa ccaattatga tctaagtgtg caggcgcaga 13620
ttggtgatga atcttccatt aaaattttat ataattccaa gctttataca tcggaataca 13680
tagcaaatgt aattgatcat tttgttactg tggctgacat agtggctgct aatcctagca 13740
tccctgtaaa ggaaatcgat attttaacaa aagataaaaa agatcagatt ctctatggtt 13800
ttaacaatac ctatgcagat tatccaagag agaagaccat ccatcagcta tttgaagaac 13860
aagtagataa aaatccgaat cagatcgcac ttgtgtttaa agaagagaag ctgacttacg 13920
gtgaggtaaa tgcgaaagca aatcagttgg catacgtgtt aagaaagcaa ggtgtacagc 13980
ctaatgatgt aatcggcatc atcaccgaac gctccccaga aatgatcata ggcattttgg 14040
cgatttttaa agcaggcgga gcttatatgc caattgatcc ttcttatccg gctgaacgca 14100
ttcaatatat gctacaggat aatcaaacga agctattatt agtgcaaaaa caagaaatga 14160
taccagccaa ttatcaggga gaggtattgt tcttaaccca agagagttgg atgcatgagg 14220
aaacatctaa tccggctcat attactcaag cacaggcttt agcatatgtg atgtatacct 14280
ctggttctac aggagagcct aagggcattt tgacaacaca tcaaaatatt atgaagaccg 14340
tcattcataa cggttatgtt gagattacgc caggagattg cttgtcgcag ctctccaatt 14400
atgcctttga cggctctacc tttgaaatct atggggcatt attgcatgga gctacattac 14460
ttttagtaac aaaagaggct gtactcaata tgaatgagct ggcacgtctt attaagaagg 14520
agcaagtgac ggtttccttc atgacgactg ctctgtttaa tacactggtg gatttggata 14580
taacgtgctt tcaatcgata cgaaaggtgt tgttcggagg agagcttgct tcggttaagc 14640
atgtcctgaa agcccttgat tatttaggcg agcaccgggt tatcaatgtg tatggaccaa 14700
cggaaactac cgtgtatgct acctattact ctgtagatca ctccatgctg acgagggcat 14760
ctgttcctat cggaagaccg attaataaca cgaaagctta cattgtaaat acagatggac 14820
agcctcagcc aataggagta gtcggtgagc tatgcattgg cggtgagggg gtagcatgtg 14880
gttatcttaa ccgtccagag ctgacaaaga aacatttcgt ggataatccg tttgtcttgg 14940
gtgaacgaat gtattgtacc ggagatttag cccgcttttt accagacggc aacatcgaat 15000
acatcgggcg gatggatgaa caggtaaaga ttcgtggtca ccggattgag ctgggcgaaa 15060
tcgaaaaggt tcttttacag cacccagcta tcagcgagac agtgctttta gcaaaacgag 15120
atgagcaagg ccattcctat ctgtgtgcgt atatagtagg tcaggtattt tggactgtta 15180
cagagctgcg tcaacacttg atggaatcct tgccagaata catggtgcct tcctacttta 15240
tcgagattga gaaactaccg cttacggcaa acgggaaggt agataagcga gcgttgcctg 15300
aaccagacag aaaaatgggc agtgcttacg ttgctccaga gaacgaaaca gaggagaagc 15360
tggttcaatt tttccaagag attttgggtg ttgagcgagt tggcacgcag gatacatttt 15420
tcgagcttgg tggtcactcc cttaaggcaa tgatgctcgt tttacagatt cataaagaaa 15480
tgggcattga agtcccgtta aaggagatat ttacacgtcc taccatcaaa gaattagcgg 15540
cgtatattca taagatggat cgctctgcct acagcatgat tgagccaact gccaaacaag 15600
agtattatcc agtctccttt gcccaaagac gaatgtttgt agtgcagcaa attagagata 15660
cgaatacaac cagctacaat atgccgattt tgctagaaat agaaggggct cttgataggg 15720
aaaatgtgag acaaactctg aagaaattga tagagcgtca tgaatcaatg agaacgtcat 15780
tccatatgat tgacgagacc ttgctacaaa aggtgcatga tgatgtgaca tgggaaatgg 15840
aggagatgga agcgtctgag gaagaagttt atgctttgac aaaatccttc attcgtcctt 15900
ttgatctcgg tcaagctcca ttgtttagag caggattaat tcgtgttaat tctgagcgtc 15960
atttgctgct gctagatacg catcacatta tctcagatgg cgtatctact aacatactct 16020
ttcaagattt tacgcaatta tatcgtggac gagagctgcc tgccctgcga attcaataca 16080
aggatttcgc cgtctggcaa caaggagagg ctcagcttgc tcgtttgcaa gaacaagaag 16140
aatactggct gaaacaattt tcagagagtg tgcctgtact agagcttcct actgattttc 16200
cacgtccagc gatgcagcag tttgatggtg acgtattgga ctttgcatta aatcagcaag 16260
tatggcagga attacaacag ctcattgtta aagagggctg tacggcttac atgatattgc 16320
tggcggctta tcatgtcttg ctttccaagt attcgtcgca aaacgatatt gtgataggtt 16380
ccccgatagc aggccgaaca aatgctgatt tgcaatcgat tgtcgggatg tttgttaaca 16440
cgctggctat ccgcaccaaa tcagagggaa ctcagacatt ccgcgagttt ctctctacga 16500
ttaaacaact ggttcttcaa gctcaatcca atgcagagta tccatttgaa gagctggttg 16560
ataaggtaaa tccaagtcgc gatctaagtc gccagccttt atttgacaca atctttgtca 16620
tgcaaaacat ggatattacc gaggttgcga tacaaggtct ttcaatcgta acgaaggaca 16680
tggaatggaa gcattcaaaa tttgatctta catgggcggc tgtagagaaa gaatccttgc 16740
atttttcagt tgaatatagt acccgcttat ttaagaaaga aacaatcgag cggatggcga 16800
agcattttgc ccatttgcta aatcaagtgg cggaaaatcc tgacttgagc ctttcagata 16860
tggaattggc aacggatgaa gaagtgtacc agcttttgga ggagtttaat aatacagaag 16920
ctgattatcc gagtgataaa acgattcacc agcagtttga gcagaaggta gaggaaaacc 16980
ctgatcagat agcgttgtta tttaaagata aggaaattac ttacggacag ttgaatgcaa 17040
aagcaaatca atttgctcgc gtattaagaa agcatggggt acagccggat caagtggttg 17100
gattaatcac tgatcgttcc attgaaatga tgataggaat tttggcaatc ttaaaagctg 17160
gcggagccta tttgccaatt gatccttctt atccattaga acggattacc tacatgctag 17220
aggatagtca ggcacagctt ttgattgtgc aggaagctgc tatgattcca gaggggtatc 17280
agggcaaagt attgcttcta gcagaagagt gttggatgca ggaggaagcg tccaacttag 17340
agttgattaa tgatgcccag gatttggcgt atgtgatgta tacctcaggg tctactggta 17400
agccaaaggg caatctgacg actcaccaaa acattttgag aaccatcatc aacaatggat 17460
ttatcgagat tgtaccagca gaccgtctat tacagctatc gaactacgcc tttgatggct 17520
ctaccttcga tatctacagc gcgctattaa atggagccac tcttgtactg gtgccaaaag 17580
aggtcatgct aaatccaatg gagctggcga ggatcgtccg cgagcaggat attacggttt 17640
cgtttatgac cacgtccctg ttccatacgc tagtggagct tgacgtgact agtatgaaat 17700
ccatacgcaa ggttgtattt ggtggggaaa aggcttcata caagcatgta gaaaaggctc 17760
tggattatct cggagaaggc cgtttagtaa atggatacgg ccctacagaa acaaccgttt 17820
ttgctaccac atacacggtg gattctagta tcaaggaaac gggaattgta ccgattggcc 17880
gtccgttaaa caatacgagt gtctatattt tgaatgagaa taatcaacca cagccgattg 17940
gagtaccagg ggaattgtgc gttggcggag caggaattgc acgtggatat ttaaaccgtc 18000
cagagctgac agcagagcgc tttgtggata atccgtttct tgtaggagat agaatgtatc 18060
ggacgggaga tatggctaga ttcttaccag atggcaacat tgagtacatc ggacgaatgg 18120
atgaacaagt gaagattcgc ggacatcgaa ttgaactggg cgaaattgaa aaaagtctcc 18180
tggagtaccc tgctatcagt gaagcagtac ttgtcgcaaa acgtgatgaa caaggtcatt 18240
cctatctgtg cgcttatgtt gtaagcacgg atcaatggac ggtggctaag gtacgtcaac 18300
acatactgga ggctctgcca gagtacatgg taccatccta tttcgttgag cttgaaaagc 18360
tacctcttac ttctaatggc aaggtagaca agcgtgcatt gcctgaacca gatcgagtga 18420
ttaccaatga gtatgtggcg gcagtcaatg agacagagga gaagctagtt cagtttttcc 18480
aagagatctt agctgtagac cgagtcggaa cgcaggatac attctttgaa ttgggtggtc 18540
attccctaaa agcaatgatg ctggtttcaa gaatacacaa ggaattagaa atagaggttc 18600
cgttaaaaga agtattcgcc agacaaaccg ttaaagaatt agcagcctat atcagacagg 18660
ctgaacagtc ggattacagc gaaatccaac cggccatgga gcaagaatac tacccggtat 18720
ctaatgcaca gcgacggatg tatgtggttc agcaaatgag agatgtagaa acaacaggct 18780
acaatatgcc gttctattta gaaatggagg gtgctcttga ggtagaaaag ctatctctag 18840
ctttgaaaca actaattgag cgtcatgagt cattgcgaac ctccttccat atggttgaag 18900
atgaactgat gcaaaaggta catgcagaag tcgcatggga gatggaaatg attcatgccg 18960
tagaggaaga agttcaacag ctgaccgatt cctttatgcg tcctttcgat cttgctaagg 19020
cgccattatt ccgagcgaga ctcattcaaa tcaatccgaa gcgacattta ttgatgctgg 19080
atatgcatca tatcatctca gatggggtat cgatgaatgt attgttccag gatataacgc 19140
agttgtatca agggatagag ctgagtcctc tcaagattca atacaaggat tttgcggtgt 19200
ggcaacaagg catcgctcag gttgtccgtt ttcaggagca ggaaaggtat tggttaaacc 19260
aattctctgg tgacctacca attttggaaa tggtaactga ttatccacga ccagccatac 19320
agcagttcga cggagattcc tggtcatttg aaattgatgc caaagtattg gacagcataa 19380
agcaattgtc agctaagcaa ggcactacgt tgtatatgac tctattggcg atttatcaaa 19440
tcctgttagc caagtatacc cgtcaagatg acatcattgt cggaactccg atcgcaggaa 19500
gacctcatgc agacacagag agcattgtgg ggatgtttgt caatacacta gccctacgtg 19560
gtcaaccaaa agaagagcaa tctttcatct cttacttatc agaagtgaaa gaaaacgtac 19620
tacaagccta tgccaacgct gattatccat ttgaagagtt ggtagagaag ctgcatttgc 19680
aaagagatat gagtcgtcat ccattgtttg atacgatgtt tgttttacaa aacatggata 19740
tgtccgatat aaatatttct ggtctaaagc ttcattcgcg tgatttaaac tggaaaaatg 19800
caaaatttga tatgacctgg atgatagccg aacaaaataa tctattgatt tcggttgagt 19860
acagtaccaa cctgtttaaa catgaaacca ttcaaaggct agaaaagcat ttcacttatt 19920
tagtagaaca agtggctaag catccggatt gcttactcag agatttagaa ctcacaacag 19980
acgaagaaaa acagcaaata ctgacggtat ttaacgatac tgctactgat gatttacagg 20040
atttatccat ttgccatcta ttcgaacaac aagtgcagcg tttttcagat cggccggcac 20100
ttgtgtttaa agaaaagcag ctcacataca gtgagttcca tgcaaaagta aatcaattag 20160
cccgggtact cagaaagaaa ggtgtgcagc cggatcaagc ggttggatta atcaccgatc 20220
gttccattga gatgatgata gggattttcg ccatcctaaa agcaggcgga gcttatatgc 20280
caattgatcc ttcctatcca atcgatcgga tcgagcacat gctagaggac agccggacta 20340
agttgttatt cgtgcaaaaa acagaaatga tccctgctag ctatcagggg gaggtattac 20400
tcctagcgga agagtgctgg atgcatgaag attcatcgaa tttggagctg atcaataaaa 20460
cacaggattt ggcatatgtc atgtatacct caggttctac tggtaaacca aagggcaacc 20520
tgacaacgca ccaaaacatt ttgaccacca tcatcaacaa tggctatatc gagatcgcgc 20580
caacagaccg tctattacag ctatctaact atgcttttga tggctctacc ttcgatatct 20640
acagtgcgct attaaatgga gccactcttg tactggtgcc aaaagaggtc atgttaaatc 20700
caatggagct ggcgaagatc gtccgcgagc aggatattac ggtttcgttt atgaccacgt 20760
ccctgttcca tacgctagtg gagcttgacg tgactagtat gaaatccatg cgcaaggttg 20820
tatttggcgg ggaaaaggct tcatacaagc atgtagaaaa ggctctggat tatctcggag 20880
aaggccgttt agtaaatgga tacggcccta cagaaacaac cgttttcgct accacataca 20940
ccgtggattc tagcatcaag gaaacgggaa tcgtaccgat tggacgtccg ttaaacaata 21000
cgagtgtcta tgtcttaaat gagaataatc agcttcagcc gattggagta ccaggggaat 21060
tgtgcgttgg cggagcagga attgcacggg gctatttaaa tcgtccagag ctaacagcag 21120
agcgctttgt ggaaaatcct ttcgtgtcag gagatagaat gtatcgtacc ggtgatttag 21180
cacgttggtt gccggatgga agcatggagt atttaggacg gatggatgag caggttaagg 21240
tacgcggtta ccgaattgag ctgggagaaa tagagacaag attattggag catccttcta 21300
taagcgcagc ggttttacta gcaaagcaag atgagcaagg gcattcgtac ctatgtgctt 21360
acatcgttgc aaatggggta tggacggttg cggaactacg taagcatcta agcgaggctt 21420
tgccagaata catggtgcct acttattttg ttgaactaga gcagatacca ttcacttcta 21480
atggaaaggt gaacaaacgc gctttaccag agccagaagg acaaatgacc agtgtatatg 21540
tggccccaga aacggagaca gaagcaaaag tagcagcgtt attccaagag attttgggtg 21600
tcgagagagt tggtacacag gacatgttct ttgagctggg tggtcattcg ctaaaagcga 21660
tgatgctcgt tttacgaatg aataaagaac tgggcatcga ggtgcctttg aaagaggtat 21720
tcgcccatcc tactgtcaag gaattggcag caacgatcga ccttcttgat cgatcaggcc 21780
actcagagat tgagcctgcc ccaaggcagg aattctatcc ggtatcttcc gcgcagagac 21840
ggatgtacgt ggtgcagcat ttaggaaatg tccaaacaac cagctacaat atgccgcttt 21900
tccttgaagt ggagggagct ttagaaattg ataagcttca tctagcactt gagaaattgg 21960
tcgaaagaca cgagtcgcta cgaacctcct ttcatatggt tgacgaagag ctgatgcagc 22020
aggtgcatga agaggtggcc tgggatttag agatcatgga tggaacggaa ggagaccttg 22080
caagcatcac agcaggattt atacgtccgt ttgatctcag ccaagctcca ttgttccgtg 22140
caggcatcgt gcggattagc cctgagagat tccttttcat gctagatatg caccatatca 22200
tctcagacgg agtttctacc aatgtattgt tcaaggatat aacgcagctc tatcaaggaa 22260
aggacctgcc ccctcttccg atacagtaca aggactacgc tgtgtggcaa caagctgatg 22320
ctcaagtgac tcgcttacaa gatcaggaaa gctattggtt acatcaattt gctggagaag 22380
cttctgtctt ggaaatgccg acagatttcc cgcgtcctgc agtccagcag ttcgaaggag 22440
atgtatggac ctttgagatt gatgctgaca ttctcagcca gttgaaaaaa ttatcagtga 22500
gtcagggttc tactctatat atgactttat tggcggttta tcaggtgttg ctggctaagt 22560
ataccggtca agatgatatt attgtcggtt caccaattgc cggacgccct catgcggatg 22620
tagagagcat cgtcggtatg ttcgtcaaca cgctagcttt acgtggacag cctgtaggag 22680
agcagacgtt tattacctat ctggcacaag ttaaggaaca ggttttacaa gcttatgcca 22740
atgcagagta tccatttgag aaattggtag agaagctcga tttacaacga gatatgagtc 22800
gccatccact cttcgatacg atgtttactt tgcaaaacat ggagatgact gatattgatt 22860
tggcaggctt gaccttcaag ccatttgatt ttgaatggaa aaatgccaag tttgacatgg 22920
attggacaat gcttgaggaa gaaacactca aggtagctat tgaatacagt acaagcctgt 22980
atacaaaaga aaccattagc agaatggctc aacatttcac ctatgtttta caacaaatta 23040
ttgagcatcc agccattcgt ttggctgaaa tcaaaattgc tactctacca gaaattgaac 23100
agattttaac gcaatttaat gatactaggg ccaattaccc tgataaccaa accattcata 23160
gtctattcga gcaacaagtg gagcgtacac cagaacagat agctgttgtc tatcaggatc 23220
aatccatcac gtatcgtgag cttaatgaac gtgcaaatag attggcacgt tgcttgatcg 23280
acaaagggat acagagaaat caatttgttg caatcatggc ggatcgttcc atagaaaccg 23340
ttattggaat gatgggaatt ctcaaagcag gaggagctta tgttccaatt gatcctgatt 23400
accctctaga tcgaaagctg tatattcttg aagacagcca tgcatcacta ttattgttcc 23460
agcaaaagca tgaggtcccc tcagaattca caggtgatcg gatattaatt gagcagatgc 23520
agtggtacca agcggctgat acgaatgtgg ggatcgtcaa tacagctcaa gatttggcgt 23580
atatgatcta tacctcaggt tctacaggtc aaccaaaagg ggtaatgatt gatcatcaag 23640
cagtatgtaa cctatgctta atggcccaaa cctatggaat ctttgcgaat agtcgcgttc 23700
tacagtttgc ctcctttagc tttgacgctt ccgtaggaga ggttttccat acccttacaa 23760
atggagccac tctctatctg atggatcgca atttgctcat ggctggcgtt gagtttgttg 23820
aatggttacg agtaaatgaa ataacttcta ttccgtttat ctcgccttct gcattgcgtg 23880
cattgccgta tgaggattta ccagcattga aatatatcag tacaggtggg gaagcattac 23940
ctgtagattt agtcagacta tggggaactg agcgaatctt cttaaatgca tatggcccga 24000
ctgaaacaac agtagatgca acgattggct tatgtacgcc agaggataag ccacatattg 24060
gtaagcctgt gttgaataaa aaagcctaca ttattaatcc aaattatcaa cttcagccaa 24120
ttggggtacc gggtgagtta tgcatcggtg gagtagggat tgctcctgga tattggaacc 24180
gccctgaact aactagagag aaatttgtgg ataatccatt tgcccaaggc gaaagaatgt 24240
ataagacggg ggacttagta cgttggcttc cagatggaaa tattgagttt ttaggacgta 24300
ttgatgatca ggtgaaaatt cgtggacacc gaattgaatt gggtgaaatt gagacgcggc 24360
ttcttgagca tgagcaggta atagaggcgg ttgtgctggc gcgtgaagat gaacaaggtc 24420
aagcttatct gtgtgcttat ctggtagcag cagatgaatg gacggtagca gaactgcgca 24480
aacatctagg aaaaacactg cccgattata tgattcctgc ttattttatc gagcttgagg 24540
agtttccttt gacaccaagc gggaaggtga ataaaaaagc tttaccagag cctgatggac 24600
aaatacaaac gggagtggag tacgtagagg ctactaccga aagccaaaaa atccttgttg 24660
agctttggca agaggtgtta cgtgtcgagc ggatcggtat ttacgataac ttctttgagc 24720
tgggcggtga ctccatcaaa gcaattcaaa tcacagcaag attgcgtcgc caccaccgca 24780
agctggaaat cagccatctg tttaagcacc caacgattgc agagcttgct ccatggatgc 24840
aaaccagtca ggcattactt gaacaaggaa ctgttgaagg cgaagttatg ctcacgccaa 24900
ttcaaaaagc attctttgaa gaaaatcagg aacagccgca gcattttaat caggattcgt 24960
tactgtacag ctcgaatggc tggaaccaag atgcgatcga gcaggtattt gaaaaaataa 25020
cggagcatca cgatgccctg cgaatggtgt atccgcatac cgagggcaag gtgactcaga 25080
tcaacagggg acttgaggac aaggcgttca cattgcaggt gttcgatttt acccaagaac 25140
caactgatac gcaggcaacg aaaattgagc aaatcgctac tcaattgcaa gcgagctttg 25200
atttaaaaaa gggacctctg gtacgacttg gcttatttac caccaaggct ggggattatt 25260
tactgatcgt gatccatcac ctagtgattg acggcgtctc ttggcgtata ttgcttgagg 25320
attttcataa tgcttatcag caagtcattc aaggtcaagc aattgtactt cctgaaaaaa 25380
cgacctcctt taaaacatgg agtgagcgct tgaatgaata tgcaaatagt catgctcttt 25440
tacacgagat tccatattgg aagcagatgg aagaaatatc gatcgcccct cttcctaaaa 25500
aaggaaacaa tgacggtaga tattatgtga aggacagcga atatgccacg atgagtctaa 25560
cagaagaaga aacccaaaat cttcttactc gtgtacatcg agcttatcga acggagatta 25620
atgatctgtt gcttgctgca ttaggattag caagtaagga atggacaaaa gagaatcgag 25680
tggctatcca cttagagggt catggtcgtg aggaaatagg tgaaggggta gatgtcaacc 25740
gcactgttgg atggtttacc tccctgttcc cattcgtgat tgatttagaa aatgacgaat 25800
tgcctctcat cattaaatcg gtaaaagaaa ccttgcgccg agttcctaat aaaggcatgg 25860
gctacggcat actcaagcat ctgacaagcg atgcgaacaa acaggagata accttctcgc 25920
ttcgcccaga gatcagcttt aactatctgg gggtatttga tcaacaagag gaggaaagcg 25980
aatctgctgg gattcctact ggtcagccga tcagcccgca atattatgac acgcacctgc 26040
tggagtttaa tggagcggtc tcgaataacc agttgcatgt aaattgccga tttgctcctg 26100
cagccgttga tcgagcgatt gttgaaattt tgatggagcg cttcaagcac catttacttc 26160
taattagtaa gcattgcttg gaaaaggata ccgtagaatt tacacctact gattttacag 26220
aaaaggaatt aagccaagaa cagcttgacg atctattaga tgatttgttt gaagacatag 26280
atgatctgta atcgcaatga gataggtggt gccacacatc gtgcaaaaaa aagacaagat 26340
caaagatatc tattcacttt ctccgttgca aaagggtatg ctatttcatt ccatgaaaga 26400
cccgcagagc gatgcctatt tcgagcaggt tacccttttg ctggaggggg ttgtaaaccc 26460
aacctatttg gctgaaagta ttcagggact cgtacaaaaa tacgacatgt tccgaagtgt 26520
gttccgctat aaaaaagtag accctgttca ggttgtgctt agtgaacgaa aaatagattt 26580
acagattgag gaccttactc aaatcaatga agaagagcaa cggaaattca ttgaggaata 26640
tagaaaaaag gaccgggaaa gaggcttcga cctttcccgg gatatcctgc tacgttttac 26700
attgtttcaa acagccgcca atcggtatga attactgtgg agtcatcatc atatcctgat 26760
ggatggctgg tgtacgggta tcgtttttca ggatttattt caaatgtacc aacgtcgctt 26820
gtcaggacag gccttacttc cagaggtggc ccctcaatat agcgaatata tacgctggtt 26880
aaagaaacaa gatgaccaac aagcattggc attttggaag gagtatctac aggggtttga 26940
aaaccttacg ggaatcccgc gtctaaggtc aggcaatcat ccctacaagc aagaggaatt 27000
cattttctcc ttgggagagg aagctacaca aaaactaacg caaacggctc aaaagtatca 27060
ggtgacctta aatactgttg tgcaaacaat ttggggagcg ttattgcaaa aatacaataa 27120
cacgaatgac gcggcctacg gtgtggttgt ctccggacga cccgccgagg tgccaaatgt 27180
tgaacaaatg gtggggttat ttagtaatac cattcctatt cgtattaaaa aagaagcagg 27240
aaaaacgttt ggggaagtgc tgaaaaacgt acagcaaaca gcgctggagg cagaaaaata 27300
cggatatctt tctttagccg atattcaggc gagcgcagct tatacgcatc aattgcttga 27360
tcatatttta gcgtttgaaa atttcccgat ggatcaagaa acatttaatc aagaaaacgt 27420
tctcggattt gccgtgaagg atgcccacac gtttgagcag acgcactatg atctgaccgt 27480
gctagtcatt cctggcaagg aattaatctt taagtttatg tataacgaaa gtgttcattc 27540
aaaagagtac ctcaatcttt tagagctgaa tatgaaaaag ctggtctctt tggttattga 27600
gcagcaggat atctttgacc cagctaccga gtttgtatct gatttggaaa aggataagct 27660
tttaaccatt tttaatcgta cggatgcaaa gtacccaaga gaaaaaacga ttcatgagct 27720
gtttcaagag caggttgaca agaaccctga tcaagtggca ctcgtatttg gcgaggctca 27780
actaacatac cgcgagctga acgaaaaggc gaatcaaatg gcccgcggtt tgcgcaaaca 27840
aggggtttta cctgatcagg tgatagggtt acttacggat cgttccttag agatgatcat 27900
agccattcta gcgatcttta aagctggtgg cgcttatatg cctatcgacc catcttatcc 27960
gagtgaacgc attcaataca tgctagcaga tagtcgtacc catttgctat tggtgcaaaa 28020
agctgaaatg atcccagcta attatcaggg tgaggtacta ctgttaacag aagatagctg 28080
gatggacgag aatacagata atttagattt ggtcaaccaa gcacaagacc ttgcttatgt 28140
catgtatacc tcaggttcaa caggtaaacc aaagggaaat ctgacaaccc atcaaaatat 28200
cgtcaagacc atcatgaaca atggttacat ggagattacg ccaaatgatc gtcttctcca 28260
gttgtccaat tacgcgtttg atggatcaac ctttgatata tacagcgcat tgttaaacgg 28320
agcttctctt attttagtac caacgcatgt actgatgaat ccgactgatt tggcatcggt 28380
cattcaagac cagcatatta ccgtgtcctt tatgacaaca tctctattta acactctggt 28440
tgagctggat gtgactagtc tcaaacacat gcgtaaggtg gtgtttggag gagaaaaggc 28500
ttcgatcaag cacgtagaaa aagcgctgga ttatttggga gctggacgtt tggtcaatgg 28560
gtatggacca acagaaacta ctgtttttgc cactacctat acggtggacc atacgatcaa 28620
ggagacgggg attatgccga taggtcgccc gttgaacaat acgaaggtgt ttattttagg 28680
agcagacaat caactacagc cgataggtgc attaggcgag ctatgtgtga gcggggaagg 28740
gcttgcccgc gggtatctca atcttccaga gctgactgct gatcgtttcg ttgaaaatcc 28800
ttttatgcgg ggagagagaa tgtatcgcac aggggattta gcgcgttggt taccggatgg 28860
aagcattgag tacgtaggta gaatagatga acaagttaag attcggggac atcggatcga 28920
attaggtgaa attgaagcta gattactaga gcatcctgct attagcgaga ccgttttgct 28980
ggcgaagcag gatgagcagg ggcattcctt cctatgtgcc tatctagtga caaatggtgc 29040
ctggtcagtc gcagagcttc gcaagcatat caaggaaaca ttgccggatt ctatggtgcc 29100
atcttatttt atcgagatag ataaaatgcc gctcacttca aatggcaagg cagacaagcg 29160
tgcattgcca gagccagatg ttcaacaagt aagctcttat attgctcctg agaccgaaac 29220
agaggaaaag ctggttcaat tatttcaaga aatcctaagt gttgaacaag tcggtacgca 29280
ggataatttc ttcgagctgg gcggacattc gttaaaagcg atgatgctgg tttcaagaat 29340
gcacaaggaa ttagatatag aagtaccgct caaggacgtg tttgctcgac cttcagtaaa 29400
agaattggcc gcatttctta caaacacaga agtgtcggat tatatagcga ttgaaccggc 29460
ggcaaaacag gaattttatc cggtttcttc tgcacagcgc cgaatgtatg tagtagagca 29520
aatcggtagc agtaatacaa ccagctacaa tatgcctttt ttgcttgaaa taggaggagc 29580
cctcgatgta gtagggttac aaaaagcatt aaagaaactg gtcataagac atgaatcgtt 29640
gagaacgtcc tttcacatgg ttgatgaggt attaatgcag aagatccatc ctgacgtgga 29700
atgggattta atggtcatgg aagcaaaaga cgaggacctt ccgcaaatca ttgatggttt 29760
tatccagccg tttgatttaa gtgacgcttc tttatttaga gcgggactcg tacgaatgga 29820
agctgatcga catctactga tgcttgatat gcaccatatt atttcagatg gggtatcaac 29880
caatgtatta ttccaagacc tgatgcaaat ctatcagggc aaggagctcc cttctcttag 29940
aattcaatac aaggattatg ctgtttggca gcaggcagaa gcccaggtta atcgtttacg 30000
agaacaggag cagtattggc ttaaccaatt ttcgggagag ttacctgtac tggaaatgcc 30060
taccgattac actcgtccat ctattcagca gtcagaaggg gatatatggt catttgaaat 30120
tagtgccgag atcataaaca aagtaaagaa actgtcctcc tcgcagggta caaccttgta 30180
tatgacattg ctggccgcct accaagtatt attgtcaaaa tatacggggc aagaggacgt 30240
tattgtgggt tctcctattg ctggccgacc tcatgcggat gtagaaaaga ttgttggtat 30300
gttcgtgaac acgttagcct tcagagggca gccaaaatca actcaaacct ttagtacata 30360
tctgtccgag gttaaggagc aggtattgca cgcctatgac aatgcagaat atccgtttga 30420
ggaattactt gaaaagcttg atttagaaag agatctaagt cgtcatccac tgtttgatac 30480
catgtttgct ttgcagaata tggaaatggc tgaaatcaat atcatggatc tctcctttca 30540
gccgcgggat ttaacatgga aaaatgcaaa attcgacctg acatggatga tggcggaagc 30600
ggaaaatttg tatgtcacca ttgagtatag tacctcgctc tttaagccag aaacaattga 30660
gcgattaggt aaacgattca cccatttact aaaacagatc ggggatgctc ctgaacgttt 30720
gattgctgac ttagaagtag cgacggagga tgaaaaacat cagattttat cggtatttaa 30780
tttgactcaa tcggattatc cagtaaataa aaccgttcat cagctctttg aggagcaagt 30840
gcaaaatatg cctgatcaaa aggcgatagt atttggtgaa gagcaagtaa catacaaaga 30900
attaaacgcc aaagccaacc atctggctac cctcttaaaa caaaaaggca taacaaacga 30960
gcaacttgtg gctgttatga ttgagccttc catcgagttt tttgtaggca ttctagctgt 31020
tctaaaagca ggaggggctt atctaccaat tgacccaact tatccgacgg aacgaattgc 31080
ctatattttg gaggatagtc aatcaaaggt tctgttagtg agaggtcatg aacaggtaca 31140
gacacaattt gctggggaaa tcttggaaat tgatagcaag aagttgtcta ccgaagagct 31200
gaaagacgta cctatgaata acaaagtaac cgatctagcc tatgtcattt atacatcggg 31260
ttccactggg caaccaaaag gtgtcatggt ggagcataga tcgttgatga atctttcagc 31320
ttggcacgtt cagtattttg gcatcacaaa ggatgatcga agcaccaaat acgcaggggt 31380
tggatttgat gcatctgtat gggaggtctt cccttactta atagctggtg caacgattta 31440
cgtcatcgat caagagacaa gatacgatgt agaaaaactg aatcagtacg taacagatca 31500
agggattacg atcagctttt tacctacgca atttgctgaa cagtttatgc tgacagatca 31560
tacggatcat actgccctac gctggttgct tatcggcggt gataaagccc agcaagccgt 31620
tcagcagaag cagtatcaga ttgtaaataa ctatgggcct actgagaaca cggttgtaac 31680
aaccagctat atagtgagtc ctgaggataa aaaaatcccg atagggcgtc caattgctaa 31740
taatcaggta tttatcctga ataaagagaa tcaattacag ccagtaggga ttccaggtga 31800
actatgcgtt agcggcgaca gcctagcacg cggctatctg catcgtccag agttaacgag 31860
tgagcgtttt gtagctaatc cgtttgtccc tggcgaacgc atgtataaaa ccggagatat 31920
tgcccgctgg ttaccagatg gaaatattga gtatctaggt agattggatg atcaaattaa 31980
gatcagagga taccgggttg aattaggtga gatagaatcc gctattttgg agcatgaagc 32040
aattcatgag acagtagtgc tcgcaagaca agacgatcag aatcagacat atctatgtgc 32100
ttatgttgta ccgaaaaaat cttttgatgt agccgagctt cgtcaatatc taggcagaaa 32160
gctacctcac tttatgattc cggccttttt tacggaaatg acagagttcc caattacatc 32220
gaatgggaaa gtagataaaa aagcactccc actaccggat ttgtccaagc aatcagagat 32280
cgattacgtt gccccaacca ccacgttaga agaaacgctg gcggaactat ggacagaagt 32340
gctaggagtt tcccaagtgg gaatccatga taacttcttt aaactgggtg gggattcgat 32400
caaggctatt cagattgcag caagattaaa tacgaagcaa ttaaaattgg aagttaagga 32460
tttattccag gcacaaacga ttgctcaggt tattccatac atcaaaacca aggaaagtaa 32520
agctgagcaa ggaattgttc aaggaaaggt agagctaacc cctatacagg aatggttttt 32580
ccagcaatcc ttcgatattc cacatcattg gaatcagtcc atgatgtttt atcgaaagga 32640
agggtgggat cagcacgttg tacaaagggt gttccaaaaa attgcagaac accatgatgc 32700
cttgcgaatg gcttatcagc aggaaaatgg caaaacgatt cagatcaatc gcggagtgga 32760
aggcaagttg tttgagctaa gcatttttga ctttaaacaa caggcgaatg tgccagagct 32820
gatcgagcaa gcagctaatc gtctacaatc cgcaatgaac ttgcaggacg gtccattggt 32880
tcaactggga ctctttcaga catctgaggg ggatcatctt ttgatagcaa ttcatcactt 32940
agtggtcgat gccgtttcat ggcgaatcat tacggaggat ttcatgaatg gctatcaaca 33000
agatttgcag ggagagccga ttgcatttac gagcaaaaca gactcctacc aaaaatgggc 33060
caagagcctg ctagagtacg ctactagtga agaaattcaa tcagagctga aatactggca 33120
aagcatgatt gcaaaagggt tacctgcatt gccaagagat tcaaaagtag gtgccccgta 33180
tctactcaag gatatacaag aggtcgctat ccaattgaca aaagagcaaa cgaataaact 33240
attaacggat gcccataacg cctacaacac acagattaac gatcttttgt tgacagcatt 33300
agctctaact attcaggaat gggcacaaac caattcaatc gcaattacac tagaaggaca 33360
tggacgcgag gatattgggg tggacattga cattaaccgt acagttggtt ggtttacgtc 33420
catgtatcca gtggtatttg atttgcagaa gcaagggatt gcaaatacgg ttaagcaagt 33480
aaaagaagag ctgcgacaaa taccgaataa agggattggc tatggggttg ttagatacct 33540
atcgaatcaa ggaagtacag agctggatct aagctcccat gcgataaatc cagagattag 33600
cttcaattac cttgggcaaa tggatcaatc tggacaggaa gaggagtatc aattgtcccc 33660
attgtcttcc ggtcaacaga ttagtcagat gaatcaaggc ttgttcccga taaatgtgag 33720
tggaattgta gtggaaaatc agttgtccat tcaaatatct tatgatagcc aagcttatca 33780
tgattctact atggaaaagc tgattcaacg ttatcaatat cacttgttgg agattattaa 33840
tcattgtgtt cagcagacag aaacagaatt aaccccgagt gatttttcca ccaaagagct 33900
ttcgatggag gatttagaat cagtatttga gttactagat gaataaactt tggttatgtc 33960
attaggaggc tttatatgtt aagtaaagca aatattaaag acatctatac attatctccg 34020
ctacaaaaag gcatgttatt tcagcattta aaagaagaaa gcacggctta ttttgagcaa 34080
ttacacttta cgattaaggg acaactatat gtagatagct ttgaagcaag ctttcagcat 34140
ctcataaaca aatatgatgt gctacgaacc gtttttctgt ataaaaatat gacccagccc 34200
atgcaaatgg ttttaaaaga aagaaaaaca agtgtgcatt ttgaagatat ctcccaccta 34260
gattctaaag ccgtgagtga atatgttgaa gagtttaaaa atcaggatcg ggagaaggga 34320
tttgaactct cgaaggacat tctcatgcgt tttgctattt tgaaggctgg tgctgagtcc 34380
tatcatttaa tttggagctt ccatcatatt ttaatggacg gctggtgcat gggcattgtg 34440
ttacaggatt tgttcagaat gtatcagcag catcgtcaaa atataccgat taccgttgag 34500
agcgttcctg cctatagcga gtatatccgt tggcttgaga agcagaatgt aacaaaggcg 34560
agggattact ggaaaaatta cttagagggc tatgaggaat taacaggtat cattcgtctc 34620
gatacgaagc atacgagtca caacaacgag gtacaggaat gcgcctttac actggataag 34680
gacataacgg aaggacttac tcagcttgct cgtcattatt cagtgacagt aaatacgctt 34740
tttcaaacaa tttggggcat gctgttgcaa aagtataaca ataaggatga tgttgtgttt 34800
ggtgcggtcg tatctggccg cccctctgaa atccatggcg tagaaaacat ggttggcttg 34860
tttatcaaca ctgtccctat tcgtattcaa aaacaaatga atgatacctt tagccattta 34920
ttaaaaagag ttcacgaatc tacgctattg tctaaacagt atgagtttgt atccttggca 34980
gatattcaaa ccgatgcagg attttctggt caattgctag atcacatctt agtttttgaa 35040
aactatccga taagtgaagg ttcttttgag gaagaagaat ttacgatgga tagtataaaa 35100
acctatgaga aaacaagcta tgacctaaac gtgatgattc ggcctaatga ggatcagctt 35160
gatattgcct tccaattcaa cgatgacgtg tactcaagcg aaaatgtaaa aagactgttc 35220
cagcatatga agcaactggc tctagctgta atcaagaatc cggatgtgcg cttggaagaa 35280
atagcaatga tcacagaaga ggaacgctat caaatcttgc acgatttcca aggggagata 35340
gttgattttg taacagaaaa aacgcttcct gaactgtttg aagaccaggt gaaacgaact 35400
ccagaagcaa ttgcacttcg atttgaagat caacaattga cctatcagga gctaaatcag 35460
cgagtaaatc aattagcttg gacactaaga atgaagggct tgcagcaaga agaactcgtt 35520
ggaattatgg tgcagcgctc attagaaatg atcgttggtg tgctagccgt tataaaagca 35580
ggcggcgcat acgtaccaat tgatccggaa tatccgcttg accgaatcca atatatgctg 35640
gaagacagtg gaaccaattg gctgttaacc acgaaacaga gcgaaattcc ttccatctat 35700
ctagggcatg tcctgtatct tgaggaagat acggtgtatc acgagcggtc ttcagatgta 35760
gagattgtaa atcaatccag cgacttagct tatattatct acacgtccgg ttctactggt 35820
cagcctaagg gtgtcatgat tgatcatcgt gctgttcata atttgcattt gtcagcagga 35880
atctatggaa tcgcacaggg aagccaggtt ttgcagtttg cctctttaag ctttgatgct 35940
tcggtgggtg atatcttcca cagcctatta acgggagcta ccttgcatct tgtaaaaaaa 36000
gagcaattgc tatccggaca cgcctttatg gagtggttag acgaagctgg cattacgact 36060
attccgttta ttccaccaag cgtcctaaaa gaattaccat atgcaaaact gcctaagctc 36120
aaaacaatca gtactggcgg ggaagaatta ccggctgatt tagtaaggat ttggggagca 36180
aaccgcacat ttttaaatgc atatggtccg acagaaacga cggttgatgc ttcgattggt 36240
aattgtgtag agatgacgga taagccttcg attggtacgc caaccgttaa taagcgagcg 36300
tatattttgg atcaatacgg tcatattcag ccaatcggtg ttcccgggga attatgcgta 36360
ggtggagaag gcgtagctcg tggatattta catagacctg agcttacaga tgaaaagttc 36420
gtgaacgatc cttatgtacc aaacgggaga atgtataaaa cgggagactt agctagatgg 36480
ttgccggatg gaacaatcga atttttaggc cgtatggatg gccaagtaaa aattcgtgga 36540
tttaggattg agcttggaga aattgaagct cggctaaacc aagccccatc tgtaaagcaa 36600
gctgtggttc tagctcgttc aggagaacaa aagcaggtat acctatgcgc atatttggtg 36660
acggacaacg atttaaaggt ttctgcccta cgtaaggaat taagtcaaac gttaccagac 36720
tatatgattc catcgttttt tataaaagtc gaaaagattc cagtcacagt aaacggcaag 36780
atagacaaga aagccttgcc agaaccagaa aaagaagtag agctgcaaac cgaatatgta 36840
gctccaacga acccaacaga ggagattctt gtacagattt ggcaaaaggt gctgggaatg 36900
gagcgagtag ggatagagga taacttcttt gagctaggtg gtcactctat caaggcaatg 36960
atgcttgctt ccaatattta taaggaatta aagattgatc tgcctttgcg tgagattttt 37020
aagcatacga cagtaaaaga aatggcgcgt tttatcgacg gtcgggatga ggaagaatac 37080
gtcggaattc aacccgcagc caaacaagaa tactaccctg tctcttctgc acaaaaaagg 37140
atgtatgtca ttcaatcatt ggaagataag gctcaaggca cgagctataa tatgccgtct 37200
ttctataaaa tgaagggctc ggtagatgca gagaaattag agaaggtatt ccaaacatta 37260
ttggatcggc acgaatcatt acgaacctcc tttcatatga tcgaggagca gctagttcaa 37320
aaggttcacg aacaggtttc atggaaaatg gacatgaaaa ccgtcagcgc caatgatgtt 37380
tcaagattaa aggattcgtt tgtccaaccg tttgacatca gtacagctcc tttgttccga 37440
gccagtcttc ttacgattca taaagatgag cacattctta tgatggatgt acaccatatt 37500
gtaggagacg gtgtttcgac cacgatcttg ttccaggagc ttatccagtt gtatcaaggg 37560
caagcgctac ctgaagtgaa ggtacactat aaagattacg ctgtgtggca attgtcccag 37620
caggatcgtt tgaaagaaag tgaaaatttc tggttgcagc aattttctgg agagttgccg 37680
gtgttggagc tacctactga ttattctcgt cccccaattc gccgattgga aggagaatat 37740
gtaagccaaa gcctacgtgg tgatctccat gaaagcgtaa aagccttcat gaaaaatcac 37800
gaagtaacgc tatatatggt actgcttgcg acatataacg ttcttctgca caaatacacg 37860
aatcagcacg acattattgt tggtacgcct gtttcggacc gaccgcatcc agatgtcatg 37920
tccactgtcg gtatgtttgt aaatacgctg gcagtccgaa atcagttgga gtctgagcaa 37980
accttcgaaa agtttttagc aaatgtgaaa aataaaatgc tagaggtcta tggtcatcag 38040
gagtatccgt ttgaagatgt aattgaaaaa gtaaaggttc aaagggatac aagcagacat 38100
ccgctatttg acacaatgtt tggtgtacaa aatctggaga tatcccacgt ggagctaccc 38160
gattggggta tagaagcatt ggatattgac tggactaact ccaagtttga tatgagctgg 38220
atggtatttg aagcagacgg tctagaaatt ggcgtggagt atagcacaag cctatttgag 38280
cgcaatacga ttcagcgaat gatcggacac tttgaacata tcatcgagca gattatggaa 38340
aatcctcaaa ttcgtttagc tgatattcag ttgacgacag aagatgagag aatccaaatc 38400
ttagaggaat tcaatcatca accaacaaaa ataacctacg atcaggcaat ccaaaacaga 38460
tttgaagaac aggctatgaa gacacctgat gcagtggcac ttgtatataa aggtcaggag 38520
ttaacctatc gtgagcttaa ccaaagatca aatcagatgg ctcgtacatt aagagagcat 38580
ggggtcgggc gtgatcaaat aattgcggtc atgattaatc gttcacatga gctgatcatt 38640
agtatcctag ccgtattaaa ggcaggagga gcatacctgc caattgatcc aacgtacccg 38700
cttgatcgga ttgaacacat gctagaggat agccagactg caatgctgtt aactcaaaaa 38760
gaaatccaaa tacctacagg atattcaggg gaagttctct tcgttgatca agctgatatt 38820
tatcatgagg atgctacgga tttatctagt atgaatcagc ctgcggattt ggcctatatt 38880
atttacacat caggctctac tggaaagtcc aagggagtaa tgatcgagca tcgttcatta 38940
cataatctga ttcatatttc tcacccctat aaaatgggag caggaagcag agtccttcaa 39000
tttgcctcta gcagctttga tgcctcggta gcagagatct ttccagctct tttaactgga 39060
tcaactttat atatagaaga gaaagaggag ctattaacca atttagttcc ctacttactt 39120
gagaatcaaa taacaacagt agcattgccg ccatctttat taagatccgt tccttatagg 39180
gaactgccag ctttagagtg catagttagt gtcggagaag cttgcacatt tgacattgta 39240
caaacttggg ggcaaaaccg cacctttata aacggatacg gccctacaga atcaactgtt 39300
tgcagtgcct ttggtgtggt tacagcagag gacaagcgta tcacgattgg taaaccgttc 39360
cctaatcaaa aggtctatat catcaatgaa aatcaacagc tacaaccaat cggggttcca 39420
ggtgagcttt gcatagcagg ggctggatta agccgtgggt acttgaatcg tccagagctg 39480
acacaggaaa aatttgtaaa caaccccttt gcacctggtg agcgtatgta taaaacagga 39540
gacgtagctc gctggttgcc tgatggcaat atcgaatatg ccggtcgtat ggatgatcag 39600
gttaaagtac gcggaaatcg ggtcgagctt ggggaggtta ccagccaatt acttacgcat 39660
ccttcgatta cagaagctgt tgttgtacca atagtcgata cacatggagc aacgacacta 39720
tgcgcctatt tcatcgagga taaagaagtg aaggtcaacg atttgcgcca tcatttggct 39780
aaagctctac ctgagtttat gattcctact tactttatta aagtagatca tattccattg 39840
acaggaaacg gaaaggtaaa taaacaagca ttacctgacc cttccgaatt catttcagca 39900
caaacaggcc atgaaatcgt tgccccttct tctcaggacg aggaaatact ggttcaggta 39960
tgggaagaag tcctgcagtt caaaccgatt ggggtagagg acaacttctt tgaacgaggc 40020
ggagactcca ttaaggcatt gcaaatcgta gctagactta gtaaatataa tcggaaattg 40080
gatagtagac atatttttaa aaatccaacg atttccatgc tggctcctta ccttgaacaa 40140
agaggtgctt tgattgaaca agattcaatt gaaggcgaag tgccgcttac accgattcaa 40200
tcctggttct ttgaacaacc ctttgtgtat ccacaccact ttaatcaatc tatgcttcta 40260
ccaaatgaac aaggctggga tcgtcaacga atagaacaag catttacaac cattgttaga 40320
caccatgatg ccttaagaat gaagtaccag tttagagaga agatcattca agaaaatcag 40380
ggtatcgagg gagagttttt taccctgcat gaggtggatg taaccaagga aagagactgg 40440
caaatgcgca tcgaacaaga agcgaatcaa ctccaagcaa gctttgattt gacaacaggc 40500
cctcttgtaa agcttggctt ataccatacg gcatatggcg attatcttct gattgttgta 40560
catcatctct taattgatgg tgtctcatgg cgcatcctgc tggaggattt ccagacgctt 40620
tatgagcaaa agggtgagtt gccagcgaaa accacttcct ttaaggcgtg ggctgtacaa 40680
ctggaggggt atgctcgcag caaaaagcta caagacgagg caagctactg gaaagggttg 40740
ttgaataaat cgataagaga gctgcctgcg gataaggaat caagcgatac attcctcttt 40800
ggagatacaa aagaagtaca gcttaccttt gatataaatg aaacccaaga cctgcttacg 40860
gatgcccacc atgcttataa gacaaaagcg gatgatttat tgctggcagc gttggttctt 40920
agcataaatg agtggacgaa gcaaagcgat atcatagtga atttggaagg tcatggccgt 40980
gagacgatcg gcgaaggcat tgatttgagc cgtacaattg gctggtttac tacaatttat 41040
ccagttctgt ttgaagtaga gaaccatcaa ctttccagcg tgattaaaca tgtaaaagaa 41100
acgctgcgca atgtaccgaa taatggtatt ggttttggga tcttacaaca catgtctcat 41160
tctgatgtaa gccagagcca attaagttct catcacataa gcttcaacta cctaggtcag 41220
atgggagaag attccgctag tcagtctgag acggataatg gagtccttat caatacagga 41280
gaccagataa gcccaatgaa cgcaaatccg ggctcgctta atatgacttg ccttgtaatg 41340
aataatacgt tgcttgttac ttttgattat aatccgcaac gttacgaaca ggagacaatt 41400
caacgtctgg cagatcgtta taagagcaat ttaaaagcag tcctcgatca ttgtgttcaa 41460
cgagagcaga cagagcgaac acctagtgat tttagtacga agaagctttc tttagaggac 41520
ttagacgacg tgtttgcaac acttaaaaat ctataaaggt atcctgagga ggagaagatt 41580
aacttgatta atacctcaga cgtcaaagac atttatagtt tatccccgat gcaacgagga 41640
atgttatttc atacattaaa agacaaagaa aaccttgcct attttgatca gacaactttt 41700
caaatagaag gtgacatatg tgtcgaatcc cttgagaaaa gttttaacga gctgattcgc 41760
aagtatgatg ttctgcgtac gatcttttta tatcagaaat taaaagagcc gatgcaggtt 41820
gtgttaaagg agagaacagc aaacattcat tatgaggatt tctctatgaa gagcgagtcg 41880
gataaagcaa aggctcttcg tgtagcaaaa cagagggacc gggacgaggg ctttgacctc 41940
tcccgggaca tcctcatgcg gttatcttta ttaaaagtcg cccctaacca atacgaatta 42000
gtgatcagta gccaccatat tatcattgat ggatggtgta caggaatttt gtatcaggag 42060
ctgttttatt tttatcaatg cttcgtagca aatcaaccta tccctgctga gaaatcgatt 42120
ccgtatagca gatatattcg ttggcttgaa gaacaggatg aagaggaagg aaaagcctat 42180
tggggtgaat atctacaaga tttcgagggg gcatctgtta tccctaagca aaacgctaag 42240
ggagagaagg aagtatgctc cattgataag gtaaccttcc actttgataa aaagctgacg 42300
gaggaactgg tgcaggtagc aaaaacttgc caagtaacaa taagtacctt gtttcaaaca 42360
atgtggggca tcctgctcca aaagtataat aactcgcagg aagctatatt tggatcggtt 42420
atttcaggaa gatcaccaga gattcctgat gtggaaaaaa tagttggaat ttttattaat 42480
accattcctg ttcgcattcg tacattggac aagcaaacct tcaaggaatt gctgatccag 42540
gttcaggagg catctgtcaa ctctgaaaaa tataattatc taacattggc tgatattcaa 42600
gcggttaccg gatcgaatca tgcacttatc catcatattg tggcatttga aaatttcccg 42660
attgcctcgg acagcttcgt agattcgagc gattccgatt cagaagaatt gaaagttgtg 42720
aacgtcatag acgatcatga aaagaccaac tttgatttta gtgtgcaagt tcagcttgat 42780
acagagttac tagtaaaaat ctcttataat caacatcttt atcatagaag ctttattgaa 42840
aatatctttc atcacctgca acagattgcc gggtctatca ctcataaccc agatattcaa 42900
ataaatgaga tagctattgt ttctaaggaa gagaagaagc aactattacg ctattccact 42960
ccagccaagt cagattttcc aatggataaa accattcatc agctatttga ggagcaggta 43020
tcacggacac cagagcagat cgcggtcgtt tttaaagggg agtccttcac ctatcgcgag 43080
ttaaatgaaa aggcaaatca attggcatgg gtgctaagaa aacgggaggt aagacctaac 43140
gagatcgttg cgatcatggc agagcactct ctagagatgc tggttggggt gattgggact 43200
ttaaaggcag gtgcggccta tcttcctatt gacccatcct acccagaaaa aagaatcgct 43260
catatgctac aagatagcaa agcggagcaa ctacttatcc agcctcattt gaatatgcca 43320
caggacttta agggaagtgt cttatggtta acagaagaga gctgggcgaa ggagagtacg 43380
accgatctgc cgcttgcaac gagtgcaaat gatctagcat acatgattta tacctcaggc 43440
tcaacaggac tgccgaaggg agttatggtt gagcatcaag ccttggttaa tttagttatg 43500
tggcataacg aggcatttgg cgtaaccatg actgatcaat gcacgaaatt ggcgggattt 43560
ggattcgatg cgtcggtgtg ggagaccttc cctccgctta tacagggagc gacgcttcat 43620
gtgttagagg aatcgagacg tggagatatt tatgctctgc atgaatactt tgaaaagaat 43680
gcgatcacca ttagcttctt gcctactcaa ttagccgaac aatttatgga gcttacaagc 43740
agtacattac gtgtgttact cattggcggt gaccgagccc aaaaggttaa agagacatcg 43800
tatcaaatca taaacaacta cggtccaacc gaaaatacag tagtcacgac gagcggtcaa 43860
ctgcatcctg agcaggatgt cttccctatt ggaaagccga tcaccaatca cagcgtttat 43920
attttagatc agaacagaca tctacagccg atcggaatac ctggcgagct gtgcgtcagt 43980
ggtgcagggc ttgctagagg ctaccttaat cagcctgaac tcaccgtaga acgctttgtt 44040
gataatccct ttgtacctgg agagagaatg tatcgcacag gggacttagt tcgttggaga 44100
atcgatggta gcatcgaata tctgggaagg attgacgagc aagtcaagat tcgaggatac 44160
agaattgagt taggtgagat cgaaacaaag cttcttgagc atccttccat tagtgaggcg 44220
ctcgtcgtgg ctcgaaatga cgagcaaggt tatacctatc tatgcgctta tgtggtagca 44280
actggggcct ggagcgtatc ttcattacgt gagcatttaa tcgaaacatt gcccgaatat 44340
atgattccag cttacatgat ggaagtggaa aaaatgccgc ttactgcaaa cggaaagata 44400
gataagcgag cgttaccagt gcctgatagg caaagaatga acgaatatgt ggcacctgca 44460
acagagacag aggaaaagct agttctactg ttccaagaga ttttaggact tgagcgtatt 44520
ggtactaaag atcacttctt tgaattaggg ggacattcgc tgaaggcgat gatgcttgtg 44580
tctcgtatgc acaaggagct aggtgtggat gtgcagttaa atgagatgtt tgctcgtcca 44640
acggttaaag atctatctgc ttacatagat cagatgaacg gctctgctta cacagcaatt 44700
caaccagtgg aggaacagcc ttattatcct gtttcttttg cccaaagaag aatgtatgtt 44760
gtacagcaaa tgagagatag tgaaacgacg agctataaca tgccgtttac gtttgagcta 44820
aaaggaaagc tacatctgga caagctgcga gaagcgttac agattctggt tctacgacat 44880
gaaagtctgc gtacatcctt tcatatgatt gatgaaaatc ttgttcaaaa agtgaataaa 44940
gatatttcat gggatttaga agtaatagaa gctcaggagt cagagataga agtaaaactg 45000
gaggaattta tcagaccgtt ccatttaagt gaggctccgc ttttcagagc tcgtttaatt 45060
tgcttgaatc cacagcatca tcttttgagc ttagacatgc atcatattat ttcagatgga 45120
gtatctatga acctgttcct acaggaattc atgacactct atcagggaga agcattgcca 45180
gcgctctcta ttcaatacaa ggattacgcc gtatggcaac aatcagacaa gcagcgagct 45240
agattaaaag agcaggaaaa atattggtta catcattttt ctggagagct gcctacctta 45300
gaattgccaa cagattttcc acgccctgca atacagcaat ttgatggaga tgaatgggcg 45360
tttgaaatga atgctgatct tttagcgaag gtcaaacaga tctgctctag ccaaggcacg 45420
acgttatata tgacgcttct cgctgcttat caggtgttct tagccagata taccgggcag 45480
gaggatatca ttgtaggttc tccaattgct ggacgttctc atgctgattt ggaaaacatg 45540
ataggtatgt ttgtcaatac attagctttg cgcggtaagc caaaggcaga tcaatccttc 45600
ctctcctatt taaaacaggt aaaagagacc gtattccaag catacgcgaa cgcagaatat 45660
ccatttgaag agttgattga gaaactcgat ttagaacgag atatgagccg tcatccgcta 45720
tttgatacct tgttctcttt gcaaaatatg gaaatatctg agttccaaat gaataatcta 45780
gagatttttc cttatgaaac gggacaaaag aatgcaaaat tcgctcttag ctggttaata 45840
gcagaaggag agtcccttta tgtaacaatc gaatacagca ccaaatgctt taagcgagaa 45900
accattaaac gcatggcaag tcattttgaa caactgctag cccaaattgt tgagcaaccg 45960
gaagcgcgca ttggccaact ggagttagta gcagatgccg aaagaaaaat gttactggaa 46020
gactttaatc tgacaaaagt cgactatcca cgggaaaaaa caattcaaga attatttgaa 46080
gagcaggtgg acaaaaaccc tgatcaaatc gcgcttatat gtggagagca acagtttacc 46140
tacgaacaat taaatgtgaa atttaaccaa ttagctcacg tattaagaag agaaggcgtt 46200
caacccaatc aggtaatagg gctaattacg gatcgatcgc tgtcgatgat tgtaggtatt 46260
tttggaatta taaaagcagg tgggggctat ctgccaatcg atccgaccta tcctaccgaa 46320
agaattgaat acatgcttga agatagtcaa actcacctat tgttggtaca acacagagac 46380
atggttccag caggttatca gggagaggtt ttgataatag aggatgagat aagtcgagat 46440
gaacaagtag ctaacataga attgatcaat cagccgcaag acttggctta tgtcatgtac 46500
acatctggct ctacaggtaa accaaagggg aacctgacta ctcatcgaaa cattatcaaa 46560
acggtatgca ataacggata tattgagata acgactgagg atcgtctttt gcagttatct 46620
aattatgctt ttgacggctc tacctttgat atattcagct cgttattaca cggagcaacg 46680
ctggtactgg taccaaaaga agtgatcttg aatccaacag acttgattac attgatacgc 46740
gaacagcaga tcactgtatc gtttatgact acctcattgt ttaatgcatt agtggaactg 46800
gatgtaagca gtttccaaaa catgcgcaag atcgcatttg gaggagaaaa ggcttccttt 46860
aagcatgtgg aaaaggcatt ggatttcctc ggaaatggac gattggtgaa tggatatggt 46920
cccacagaaa caaccgtttt tgctacaacc tacactgtgg atgagcgcat aaaggaatgg 46980
gggattatac cgattggtcg accgctacat aatactacgg tccacatttt aagcgctgat 47040
gacaagctac agccaattgg agtcattgga gaactgtgcg taagcggtga aggattggca 47100
cgcggttacc ttaatctacc agagttgacg atggagcgat ttgttgaaaa tccatttaga 47160
cctggtgaaa gaatgtaccg cacaggggac ttggctcgtt ggttaccgga tggggttctt 47220
gaatatgtag gacgcaagga tgaacaagtg aaaattcgcg gacatcgcat tgagcttagt 47280
gaaattgaaa caaggatatt ggagcatcct gcgatcagtg aaacggttct gctagccaag 47340
cgaaatgagc aaggcagctc atacctgtgc gcttatattg ttgcccatgg ccaatggaat 47400
atccaagaat tgcgcaaaca tgtaagagat gttttgccag aacacatggt gccttcttat 47460
tttattggct tagacaaact tccacttacc tccaatggta aagtcgacaa acgagcattg 47520
ccagaaccag agggcagcct gcaactgact agagaaattg ttgctccacg caatgaatct 47580
gaaaaacagt tagttgaaat tgttgctgag gttctgggac tagaagctag tgaaataagt 47640
attaccgata atctttttga gctaggtgga cattccctaa cgattctgag aatccttgct 47700
aaggttcata catgtaactg gaagcttgaa atgaaagact tctataattg caagaacctt 47760
gaggaaatag caagcaaggc aactgatatg caggaaaatc aaaatctgtc tggcagtggc 47820
tcagtcttta aaaagggtgg gaagaaatca atcccggtag tacccgtcca cgatagacaa 47880
aaagaaatgg agcatgtttt attgctcggc tccactggtt tcttaggtat tcatttgcta 47940
catgagctgc tacagaaaac agaagcgaca attctttgcg tcattcgtgc agaaaatgat 48000
gaggctgcta tgcaacgact acgcaaaaaa attgattttt actttacctc acagtacagt 48060
agctctcaaa ttgatgagtg gtttacccgc atccaaatca ttcacggtga tattacgcaa 48120
gccaactttg gattagaggc aaaacattac gagtcgctag gagctatcgt tgacactgtc 48180
attcatacgg ctgcattggt gaagcactac gggcactatg aagagtttga aagagcaaat 48240
gtacatggaa ctcagcaagt agttaccttt tgcttgaaca ataaattacc aatgcactat 48300
gtttcaaccc tgagcgtttc gggaaccacc gttgaagaag caacagagct tgtagaattt 48360
accgagaagg acttttatgt tggtcaaaac tatgagtcaa atgtatatct gagaagtaaa 48420
tttgaagccg aagccgtact tgttggcgga atggaaaacg gactcgatgc acgtatctac 48480
cgggttggca atttaacagg acgctttcag gatggatggt tccaggaaaa tatcaatgaa 48540
aatatgtttt atctcctatc gaaagccttc cttgagcttg gaggttttga tcaggaaatt 48600
atgcagggta tggttgattt aacccctatt gatatatgtg cacaagctat tatacacatc 48660
atcaacagca aaggaattga ggaaagagtc ttccatttac agaatccgca cttggtaaca 48720
tacgatgata tgtatcgtgt atttgaaggg cttggctttt ctagacgggt acaaagtcga 48780
gaagatgtta cacgtgaact agatgtaatg atgtctcagg gtaatgaaaa gctatttttg 48840
gctgggattc tgaccacgat gttggatgat gtagagcgtg ctgaacaatt taatgttgca 48900
gtcgattcaa gtaggacaat gcagctatta gaggatacct cgtttaccta tcctgttcct 48960
gatgatgagt atttgcgcaa gctggctatg catatgatca aagttgggtt tgttactcct 49020
aatcatactg ttgctgaaaa gataggaact agtcgttagc gctatgctag cgactggttc 49080
ccaacctaaa tgaatagcta aaggaaggag agggaaccca tggcagtcat tgaactaaaa 49140
aaccttacga aaaagtataa tgaggtctat gctgttgatc atctaaatat agaagtacct 49200
caaggacata tttatgcgtt tttaggtagc aatggggcgg gaaagacaac cacaattaaa 49260
atgatgacgg gccaattgaa cccttcagag ggagaggttc tatttctagg gcgcaatatt 49320
tggcaggatc gtgaggcaag aagaattgcg ggctatgctc cagacgttcc acttcttcat 49380
gaaggattga cagtcagaga aatggtacgc tttgtggggg ctctttatgg tagtgacgaa 49440
gatctgaata aacgtgttga cacgttgtta gaacattttg agctggcaga taaagcagac 49500
cagcttatta aagaatactc attaggaatg aaacgaaagg tttcgattgc ttgcgcattg 49560
attcatcgcc ccaaaatctt gctattagac gaagttacga atgggttgga cccaaaggcg 49620
acccgtgaag tgaaaaatta tattcgacat tttgccaaag aagagggtgg tactgttttt 49680
attacgaccc atattttgga cattgttgaa gaattagccg ataccatttc catcctgcat 49740
aaaggaaaaa tcaaagtgac gggaagcatg gaagaattgc gtcatgtggc aggcaatgaa 49800
gaaggtcgat tggaagatat ctttttatcc gctatcgagt agtaggaggt gacagaattg 49860
tatgtgggca caaacgaaat ggattagttt cttttacaca agacccttct ttaatcgctt 49920
ttttatccat agtccttcta aatggatcat ttatgtgggc ttgggaacca ttgctattgc 49980
catgtacttt tcggagaatt ttgggcagct tctcttacat gccagtctca gtgctagatt 50040
gatgcttctc ataggggaat gtatttttgt cggtttgctt cgtggcatga atacgttgac 50100
acaacaaatg tacgctgatc gattactgac attgttttat gtatcgggag tttctccgtt 50160
tcggatgatc cttgggcaat ctacttcaag tctacctctg tacacgtggt catccattat 50220
gattgctatt ccattaacga ttggctattc cgccatggaa agagttctgt atgttttgtt 50280
attcctagtc gtttctctat tgatgatttg gttaacagac atcttaagcc gatttttaat 50340
ggttctgacc atgcggtttt tccctattat tgtcaaaaca ttcgtaggta tctcctcgct 50400
tgcctatgtt gctttaattg gcctattggt ttgggcattg attgaggttg aaacaatttc 50460
tccagaagct tggcagagct tagagcgttt tatggtatat gttttgtgca ttttcgcggt 50520
cggtcttgga gcgttgtttc tattctctga acaaattgga gggttttatt acgaaagctg 50580
gctgaaccat gcggagtcgc aagataggac cagaccagaa acacaggaaa atctatcgaa 50640
tttggtcaaa aacgctcatg atgccatcgt tttt 50674
<210> 22
<211> 641
<212> PRT
<213> Artificial
<220>
<223> artificial sequence
<400> 22
Met Asp Leu Ser Thr Leu Asn Phe Leu Gly Glu Thr Glu Lys His Lys
1 5 10 15
Leu Leu Asn Gln Phe Asn Asp Thr Asp Ala Asn Phe Pro Gln Glu Met
20 25 30
Thr Ile His Gly Leu Phe Glu Lys Gln Val Gln Glu Arg Pro Asn Gln
35 40 45
Thr Ala Val Ile Phe Asn Glu Gln Ser Met Thr Tyr Lys Glu Met Asn
50 55 60
Glu Arg Ala Asn Gln Val Ala His Ser Leu Arg Lys His Gly Ala Ala
65 70 75 80
Pro Asp Glu Ile Val Gly Ile Leu Ala Asp Arg Asn Met Asp Met Leu
85 90 95
Ile Ser Ile Leu Gly Val Leu Lys Ala Gly Ala Ala Tyr Met Pro Ile
100 105 110
Asp Pro Thr Tyr Pro Thr Glu Arg Ile Leu Tyr Met Ile His Asp Ser
115 120 125
Gln Thr Lys Ile Val Leu Ala Glu His Arg Glu Met Val Pro Glu Gly
130 135 140
Cys Asn Ala Glu Leu Ile Leu Leu His Asp Ser Ser Leu Leu Asn Glu
145 150 155 160
Glu Thr Ser Asp Leu Glu His Val Asn Lys Pro Glu Asp Leu Ala Tyr
165 170 175
Ile Ile Tyr Thr Ser Gly Ser Thr Gly Lys Pro Lys Gly Val Met Ile
180 185 190
Glu His Arg Asn Val Ile Arg Leu Leu Phe Asn Asp Arg Asn Leu Phe
195 200 205
Asp Phe Thr Ser Asp Asp Val Trp Thr Val Phe His Ser Phe Cys Phe
210 215 220
Asp Phe Ser Val Trp Glu Met Tyr Gly Ala Leu Leu Tyr Gly Gly Lys
225 230 235 240
Ile Val Leu Val Ser Phe Glu Ile Ala Arg Asp Pro Gln Ala Phe Arg
245 250 255
Asp Leu Leu Gln Glu Gln Lys Val Thr Ile Leu Asn Gln Thr Pro Thr
260 265 270
Ala Phe Tyr Gln Leu Ser Ser Gln Glu Met Gln His Ser Asp Ser Asn
275 280 285
Leu Ser Ile Arg Lys Ile Ile Phe Gly Gly Glu Ala Leu Thr Pro Ser
290 295 300
Gln Leu Lys Ala Trp Lys Gln Lys Tyr Pro Asn Thr Ala Leu Ile Asn
305 310 315 320
Met Tyr Gly Ile Thr Glu Thr Thr Val His Val Thr Tyr Lys Glu Phe
325 330 335
Gln Leu His Asp Met Asp Ser Thr Val Ser Asn Ile Gly Lys Pro Ile
340 345 350
Pro Thr Leu Arg Thr Tyr Val Leu Asp Ser Lys Arg Asn Leu Ala Pro
355 360 365
Ile Gly Val Lys Gly Glu Leu Tyr Val Ser Gly Lys Gly Val Ala Arg
370 375 380
Gly Tyr Leu Asn Lys Pro Glu Leu Thr Glu Glu Arg Phe Met Asp Asn
385 390 395 400
Pro Phe Val Ala Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Ala Arg
405 410 415
Trp Leu Pro Glu Gly Glu Leu Glu Tyr Leu Gly Arg Ile Asp His Gln
420 425 430
Val Lys Ile Arg Gly Tyr Arg Ile Glu Leu Gly Glu Ile Glu Ala Glu
435 440 445
Leu Leu Lys Gln Lys Gly Ile Lys Glu Ala Val Val Leu Val Thr Asn
450 455 460
Asp Lys Asp Ala Gln Pro Gln Leu His Ala Tyr Leu Thr Ser Lys Glu
465 470 475 480
Asp Leu Ala Ala Ala Asp Leu Arg Asn Gln Leu Thr Thr Thr Leu Pro
485 490 495
Ser Tyr Met Ile Pro Ala His Phe Ile Phe Val Ser Gln Met Pro Val
500 505 510
Thr Pro Asn Gly Lys Ile Asp Lys Glu Ser Leu Arg Lys Ile Glu Pro
515 520 525
Ser Leu Gln Glu Ser Pro Thr Glu Ala Tyr Val Ala Pro Gln Thr Pro
530 535 540
Thr Glu Lys Gln Leu Val His Ile Trp Glu Glu Asn Ile Gly Met Gln
545 550 555 560
Pro Ile Ser Ile Asp Asp Asn Tyr Phe Ala Leu Gly Gly Asp Ser Ile
565 570 575
Lys Ala Ile Lys Leu Leu His Ala Ile Asn Lys Glu Phe Gln Ile Ser
580 585 590
Phe Gln Ile Gly Asp Leu Tyr Lys His Gly Thr Ile Arg Glu Met Gly
595 600 605
Gln Gln Ile Gly Glu Lys Gly Lys Gln Ser Ser Asn Gln Lys Leu Leu
610 615 620
Lys Leu Gln Glu Leu Asp Arg Leu Lys Glu Lys Ile Leu Gly Ser Glu
625 630 635 640
Lys
<210> 23
<211> 2530
<212> PRT
<213> Artificial
<220>
<223> artificial sequence
<400> 23
Met Ser Asp Lys Leu Ser Asn Ala Lys Asp Leu Phe Pro Met Ser Asp
1 5 10 15
Ile Gln Leu Gly Met Val Tyr His Ser Leu Lys His Val His Glu Ala
20 25 30
Val Tyr His Asp Gln Phe Val Tyr Gln Val Asp Asp Asp Ser Phe Asp
35 40 45
Val His Val Leu Glu Gln Ala Met Arg Met Met Val Asp Lys His Asp
50 55 60
Ile Leu Lys Thr Ser Phe His Ile Glu Glu Phe Ser Thr Pro Val Gln
65 70 75 80
Val Val His Gln Glu Val Ser Val Arg Ile Asp Glu Thr Asp Ile Thr
85 90 95
His Leu Gly Glu Lys Gln Lys Glu Tyr Ile His Gln Tyr Leu Ala Gln
100 105 110
Asp Arg Gln Ser Pro Phe Asp Val Thr Thr Ala Pro Leu Trp Arg Met
115 120 125
Ser Val Phe Lys Leu Asn Ala Ser Gln Val Ala Leu Val Trp Ile Phe
130 135 140
His His Ala Ile Leu Asp Gly Trp Ser Val Ala Ser Phe Ile Thr Glu
145 150 155 160
Leu Ile Asp Val Tyr Phe Lys Leu Lys His Lys Thr Cys Thr Leu Glu
165 170 175
His Leu Asn Thr Thr Tyr Lys Asp Tyr Val Ile Asp Gln Met Leu Leu
180 185 190
Ser Glu Gln Asn Glu Leu Arg Glu Tyr Trp Lys Glu Glu Leu Lys Asp
195 200 205
Tyr Lys Arg Leu Gln Leu Pro Val Lys Val Asp Glu Asn Gly Gly Val
210 215 220
His Val Thr Val Val Glu Lys Leu Asp Pro Asp Ile Ile Asn Lys Cys
225 230 235 240
Arg Glu Ile Ala Gln Ala His His Ile Pro Leu Lys Thr Val Cys Leu
245 250 255
Thr Ala Phe Leu Ser Met Met His Met Ile Ser Tyr Glu Arg Asp Leu
260 265 270
Thr Val Gly Leu Ile Glu Asn Asn Arg Pro Ile Ile Glu Asp Ala Glu
275 280 285
Lys Val Leu Gly Cys Phe Leu Asn Ser Val Pro Phe Arg Ala Ile Ile
290 295 300
Lys Lys Asp Met Ser Tyr Arg Glu Leu Leu Glu Gln Thr Gln Gln Lys
305 310 315 320
Leu Val Glu Ile Lys Thr Tyr Gly Arg Leu Ser Phe Ala Lys Ile Ile
325 330 335
Glu Val Ile Gly Asp Thr Gly Ser Glu Arg Asn Pro Val Phe Asp Cys
340 345 350
Leu Phe Asn Phe Val Asp Phe His Val Phe Lys Gly Ile Lys Asp His
355 360 365
Lys Val Lys Phe Trp Leu Asp Gly Tyr Glu Lys Thr Asn Thr Met Phe
370 375 380
Asp Phe Ser Val Ser Thr Thr Met Asp Asp Tyr Phe Val Arg Val Val
385 390 395 400
Ser Ala Leu Pro Glu Glu Asp Thr Ile Lys Leu Ile Asn Tyr Tyr Gln
405 410 415
Arg Ile Leu Glu Lys Ile Ala Leu His Ile Asp Glu Lys Ile Asp Lys
420 425 430
Gln Ala Asn Leu Asp Glu Lys Glu Ser His Leu Leu Leu Glu Glu Trp
435 440 445
Asn Gln Thr Ser Val Asp Tyr Pro Asp Lys Gln Thr Leu His Lys Arg
450 455 460
Phe Glu Glu Gln Val Ala Lys Asn Glu Asp Gln Val Ala Leu Glu Tyr
465 470 475 480
Glu Asp Lys Gln Leu Thr Tyr Arg Glu Leu Asn Ala Lys Ala Asn Gln
485 490 495
Leu Ala Arg Val Leu Gln Lys His Asn Thr Leu Pro Thr Gln Val Val
500 505 510
Gly Leu Met Ala Glu Arg Ser Leu Glu Met Ile Ile Gly Ile Leu Gly
515 520 525
Ile Leu Lys Ala Gly Gly Ala Tyr Met Pro Ile Asp Pro Thr Tyr Pro
530 535 540
Ala Glu Arg Ile Gln Tyr Met Leu Glu Asp Ser Arg Ser Tyr Leu Leu
545 550 555 560
Leu Val Gln Lys Ala Glu Met Ile Pro Ala Asn Tyr Gln Gly Glu Val
565 570 575
Leu Ile Leu Thr Glu Glu Leu Trp Ala Asp Glu Asn Thr Glu Asn Leu
580 585 590
Glu Leu Val Asn Gln Pro Gln Asp Val Ala Asn Ile Met Tyr Thr Ser
595 600 605
Gly Thr Thr Gly Lys Pro Lys Gly Ile Leu Ile Thr His Arg Asn Ile
610 615 620
Met Thr Thr Ile Ile Asn Asn Gly Tyr Leu Asp Ile Phe Ser Thr Asp
625 630 635 640
Arg Ile Leu Gln Ile Ser Asn Tyr Ala Phe Asp Gly Ser Thr Phe Asp
645 650 655
Ile Tyr Ser Ala Leu Leu Asn Gly Ala Thr Leu Val Leu Val Pro Lys
660 665 670
Gln Thr Leu Met Asn Thr Thr Asp Leu Leu Ala Ile Ile Lys Asp Ser
675 680 685
Asn Ile Thr Val Ala Leu Met Thr Thr Ser Leu Phe Asn Thr Leu Val
690 695 700
Asp Leu Asp Val Thr Ser Phe Gln His Thr Arg Lys Val Leu Phe Gly
705 710 715 720
Gly Glu Lys Ala Ser Cys Lys His Val Glu Lys Ala Leu Asp Tyr Leu
725 730 735
Gly Glu Gly Arg Leu Val Asn Gly Tyr Gly Pro Thr Glu Thr Thr Val
740 745 750
Phe Ala Thr Thr Tyr Thr Val Asp Asn Thr Ile Lys Lys Leu Gly Ser
755 760 765
Ile Pro Ile Gly Arg Pro Leu Ser Asn Thr Ser Val Tyr Ile Phe Gly
770 775 780
Leu Asp Asp Gln Leu Gln Pro Leu Gly Val Pro Gly Glu Leu Cys Val
785 790 795 800
Ala Gly Glu Cys Ile Ser Pro Gly Tyr Leu Asn Arg Pro Asp Leu Thr
805 810 815
Ala Asp Lys Phe Ile Asp Asn Pro Leu Lys Pro Gly Glu Arg Met Tyr
820 825 830
Arg Thr Gly Asp Leu Val Arg Trp Leu Pro Glu Gly Val Met Glu Tyr
835 840 845
Met Gly Arg Ile Asp Glu Gln Val Lys Ile Arg Gly His Arg Ile Glu
850 855 860
Leu Gly Glu Ile Glu Ala Lys Leu Leu Glu His Pro Ser Ile Arg Glu
865 870 875 880
Thr Val Leu Val Ala Lys Gln Asp Ala Asn Gly His Ser Phe Leu Gly
885 890 895
Ala Tyr Leu Val Thr Asp Asn Phe Cys Pro Val Thr Glu Leu Arg Asn
900 905 910
Tyr Leu Met Glu Thr Leu Pro Glu Tyr Met Val Pro Ser Tyr Phe Ile
915 920 925
Glu Leu Asp Ser Leu Pro Leu Thr Ser Asn Gly Lys Val Asp Lys Arg
930 935 940
Ala Leu Pro Glu Pro Glu Ser Gln Ala Leu His Ala Tyr Thr Met Pro
945 950 955 960
Glu Asn Glu Thr Glu Glu Lys Leu Val Gln Leu Phe Gln Glu Val Met
965 970 975
Asp Val Glu Arg Val Gly Thr Gln Asp Ser Phe Tyr Glu Leu Gly Gly
980 985 990
His Ser Leu Lys Ala Met Leu Leu Val Ser Arg Ile His Lys Asp Phe
995 1000 1005
Gly Ile Lys Ile Pro Leu Lys Glu Val Phe Ser Arg Pro Thr Val
1010 1015 1020
Lys Glu Leu Ala Ala Tyr Leu Thr Gly Ser Glu Glu Ala Asn Tyr
1025 1030 1035
Ile Glu Ile Glu Ala Ala Glu Glu Lys Pro Tyr Tyr Pro Val Thr
1040 1045 1050
Ala Ala Gln Lys Arg Met Tyr Ile Ala Gln Gln Trp Glu Asp Gly
1055 1060 1065
Glu Ala Thr Ser Ser Tyr His Met Pro Phe Met Met Glu Ile Thr
1070 1075 1080
Gly Pro Leu Gln Val Glu Lys Leu Gln Gln Thr Val Lys Ser Leu
1085 1090 1095
Val Ala Arg His Glu Ser Leu Arg Thr Ser Phe His Met Ile Asn
1100 1105 1110
Glu Val Leu Met Gln Lys Ile His Ala Asp Val Leu Trp Asp Leu
1115 1120 1125
Asp Ile Asp Leu Glu Ser Val Val Ala Ser Glu Gln Glu Ile Asp
1130 1135 1140
Glu Lys Met Phe Gln Phe Leu Arg Lys Phe Asp Leu Ser Gln Ala
1145 1150 1155
Pro Leu Phe Arg Ala Lys Leu Ile Arg Val Asn Ala Ser Arg His
1160 1165 1170
Val Leu Leu Leu Asp Met His His Ile Ile Ser Asp Gly Phe Ser
1175 1180 1185
Tyr Gln Ile Phe Phe Asp Glu Leu Thr Lys Leu Tyr Gln Gly Asp
1190 1195 1200
Glu Leu Pro Ser Leu Lys Ile Gln Tyr Lys Asp Tyr Ala Val Trp
1205 1210 1215
Gln His Ser Glu Glu Gln Gln Lys Arg Leu Gln Gln Gln Glu Asp
1220 1225 1230
Tyr Trp Leu Gly Gln Phe Gln Gly Glu Ile Pro Val Leu Glu Leu
1235 1240 1245
Pro Thr Asp Tyr Gln Arg Pro Val Asp Lys Gln Phe Ala Gly Ala
1250 1255 1260
Leu Phe Thr His Gly Leu Ser Ala Gly Leu Thr Glu Lys Leu Arg
1265 1270 1275
Lys Leu Ala Ile Lys Glu Lys Thr Thr Leu Tyr Thr Val Leu Leu
1280 1285 1290
Thr Val Tyr Asn Ile Leu Leu Ser Lys Tyr Thr Ser Gln Glu Asp
1295 1300 1305
Leu Ile Val Gly Thr Pro Ile Ala Gly Arg Pro His Ala Asp Leu
1310 1315 1320
Asp Arg Val Phe Gly Met Phe Val Asn Thr Leu Ala Ile Arg Thr
1325 1330 1335
Ala Pro Lys Val Glu His Ser Phe Leu Thr Tyr Leu Ser Glu Val
1340 1345 1350
Lys Glu Thr Val Leu Gly Ala Tyr Gln Asn Pro Asp Tyr Pro Phe
1355 1360 1365
Glu Glu Leu Val Glu Lys Thr Leu Val Gln Arg Asp Val Ser Arg
1370 1375 1380
Asn Pro Leu Phe Asp Val Met Phe Ser Val Glu Lys Leu Pro Ser
1385 1390 1395
Ala Val Gln Phe Asp Asp Leu Arg Phe Cys Pro Arg Leu Phe Asp
1400 1405 1410
Trp Lys Lys Ala Lys Phe Asp Leu Asp Trp Thr Val Val Glu Gly
1415 1420 1425
Glu Ser Leu Glu Val Leu Val Glu Tyr Ser Thr Ser Leu Phe Asp
1430 1435 1440
Arg Ala Thr Ile Glu Arg Met Ala Lys His Phe Glu His Ile Leu
1445 1450 1455
Glu Gln Ile Leu Asp Gln Pro Asp Leu Ser Ile Ser Glu Ile Glu
1460 1465 1470
Leu Leu Thr Glu Ala Glu Lys Gln Gln Ile Leu Ile Glu Phe Asn
1475 1480 1485
Gln Ser Asp Lys Ser Phe Asp Ser Glu Lys Thr Ile Gln Glu Gln
1490 1495 1500
Phe Glu Glu Trp Ala Glu Lys Ala Pro His Ser Ile Ala Leu Val
1505 1510 1515
Phe Lys Asp Lys Gln Met Thr Tyr Gln Glu Leu Asn Gln Arg Ala
1520 1525 1530
Asn Gln Val Ala His Leu Leu Arg Gly Asn Gly Ile Ser Ala Asn
1535 1540 1545
Asp Phe Ile Gly Leu Met Val Asp Arg Ser Phe Glu Met Ile Ile
1550 1555 1560
Ser Met Leu Gly Ile Leu Lys Ala Gly Gly Ala Tyr Leu Pro Ile
1565 1570 1575
Asp Pro Asp Tyr Pro Glu Asp Arg Ile Asp Tyr Met Leu Ser Asp
1580 1585 1590
Ser Lys Ala Lys Ile Leu Leu Lys Gln Ser Asp Gln Thr Ala Pro
1595 1600 1605
Ala Ser Phe Glu Gly Lys Val Ile Ala Ile Asp Thr Pro Glu Leu
1610 1615 1620
Leu Glu Met Asp Ile Glu Asn Ile Pro Lys Val Asn Asn Ser Ser
1625 1630 1635
Asp Leu Ala Tyr Ile Ile Tyr Thr Ser Gly Ser Thr Gly Lys Pro
1640 1645 1650
Lys Gly Val Leu Ile Asn His Arg Cys Val Ile Asn Met Gln Leu
1655 1660 1665
Thr Ala Glu Thr Phe Gly Ile Tyr Pro Ser Ser Arg Ile Leu Gln
1670 1675 1680
Phe Ala Ser Phe Ser Phe Asp Ser Ser Val Gly Glu Ile Phe Tyr
1685 1690 1695
Thr Leu Leu Asn Gly Ala Cys Leu Tyr Leu Val Glu Lys Asp Leu
1700 1705 1710
Leu Leu Ser Gly Asn Glu Phe Val Ala Trp Leu Lys Lys Asn Arg
1715 1720 1725
Ile Ser Ser Ile Pro Phe Ile Ser Pro Ser Ala Leu Arg Met Leu
1730 1735 1740
Pro Tyr Glu Asp Leu Pro Asp Leu Ala Tyr Ile Ser Thr Gly Gly
1745 1750 1755
Glu Thr Leu Pro Ala Asp Leu Val Lys Ala Trp Gly Glu Asn Arg
1760 1765 1770
Val Phe Leu Asn Ala Tyr Gly Pro Thr Glu Thr Thr Val Asp Ala
1775 1780 1785
Thr Val Gly Val Cys Thr Pro Glu Gly Lys Pro His Ile Gly Arg
1790 1795 1800
Pro Val Thr Asn Lys Lys Val Tyr Val Val Asn Ser Asn Asn Gln
1805 1810 1815
Leu Gln Pro Ile Gly Val Pro Gly Glu Leu Cys Ile Gly Gly Glu
1820 1825 1830
Gly Val Ala Leu Gly Tyr Leu Asn Arg Pro Asp Leu Thr Gln Glu
1835 1840 1845
Lys Phe Val Ser Asn Pro Phe Ala Pro Gly Glu Arg Met Tyr Arg
1850 1855 1860
Ser Gly Asp Leu Val Arg Trp Leu Pro Asp Gly Thr Ile Glu Tyr
1865 1870 1875
Phe Gly Arg Leu Asp Asp Gln Val Lys Ile Arg Gly His Arg Ile
1880 1885 1890
Glu Leu Gly Glu Ile Glu Thr Arg Leu Leu Glu His Pro Ser Ile
1895 1900 1905
Lys Glu Ala Ile Val Ile Pro Arg Ser Asp Glu Ser Glu Ala Thr
1910 1915 1920
Tyr Leu Cys Ser Tyr Leu Ile Ala Glu Gly Ser Trp Asn Ala Ala
1925 1930 1935
Asp Leu Arg Lys Tyr Leu Lys Ala Ser Leu Pro Glu Tyr Met Ile
1940 1945 1950
Pro Ser Tyr Phe Val Glu Leu His Glu Leu Pro Leu Thr Pro Asn
1955 1960 1965
Gly Lys Val Asn Lys Lys Ala Leu Pro Lys Pro Glu Lys Gln Met
1970 1975 1980
Gln Arg Gly Lys Asp Tyr Val Ala Pro Thr Asn Pro Ile Gln Ser
1985 1990 1995
Ile Leu Ser Gln Ile Trp Thr Asp Val Leu Gly Val Glu Asn Ile
2000 2005 2010
Gly Ile His Asp Asn Phe Phe Glu Leu Gly Gly Asp Ser Ile Lys
2015 2020 2025
Ala Ile Gln Ile Ser Ala Arg Leu Asn Lys His Asn Leu Lys Val
2030 2035 2040
Lys Met Arg Glu Leu Phe Lys Asn Pro Thr Ile Ala Glu Leu Ser
2045 2050 2055
Leu Leu Val Gln Gln Ile Val Gln Glu Ile Asp Gln Gly Val Val
2060 2065 2070
Glu Gly Asn Ile Pro Leu Thr Pro Ile Gln His Trp Phe Phe Thr
2075 2080 2085
Gln Ser Phe Pro Gln Val Asn His Tyr Asn Gln Ser Val Leu Leu
2090 2095 2100
Phe Asn Ala Glu Gly Trp Asp Glu Gln Lys Val Asp Lys Ala Phe
2105 2110 2115
Glu Met Leu Thr Gln His His Asp Ala Leu Arg Ile Val Tyr Ser
2120 2125 2130
Leu Asp Glu Gln Gly Val Val Gln Arg Asn Arg Gly Leu Glu Gly
2135 2140 2145
Ser Asn Tyr His Phe Glu Ile Ile Asp Ala Arg Gln Asp Gly Glu
2150 2155 2160
Asp Gln Ser Asn Trp Lys Ala Ala Ala Asn Arg Met Gln Ala Ser
2165 2170 2175
Met Asp Ile Val Glu Gly Pro Leu Val Gln Ile Gly Leu Phe Arg
2180 2185 2190
Ala Asn Glu Gly Ala Tyr Leu Leu Ile Ala Ile His His Leu Val
2195 2200 2205
Val Asp Gly Val Ser Trp Arg Ile Leu Leu Glu Asp Phe Tyr His
2210 2215 2220
Leu Tyr Asn Gly Asn Asp Ser Leu Pro Leu Lys Thr Thr Ser Phe
2225 2230 2235
Gln Ala Trp Ser Gln Lys Leu Gln Glu Tyr Ala Gln Ser Lys Glu
2240 2245 2250
Leu Glu His Glu Leu Ser Tyr Trp Arg His Leu Asp Glu Ala Ile
2255 2260 2265
Thr Asp Tyr Thr Leu His Lys Asp Ile Glu Ala Ala Thr Ser Asn
2270 2275 2280
Lys Thr Thr Tyr Glu Glu Phe Leu Thr Val Ser Met Ser Leu Ser
2285 2290 2295
Thr Glu Glu Thr Gln Gln Leu Val Thr Glu Ala His Lys Ala Tyr
2300 2305 2310
Gln Thr Glu Ile Asn Asp Leu Leu Leu Thr Ala Leu Ala Leu Ala
2315 2320 2325
Leu Lys Glu Trp Thr Asn Lys Glu Gln Leu Leu Val Ser Met Glu
2330 2335 2340
Gly His Gly Arg Glu Glu Ile Leu Asp Asn Val Asp Ile Ser Arg
2345 2350 2355
Thr Val Gly Trp Phe Thr Ser Glu Tyr Pro Val Ala Ile His Leu
2360 2365 2370
Thr Lys Thr Asp Ile Ser Phe Ala Ile Lys Gln Val Lys Glu Thr
2375 2380 2385
Leu Arg Arg Val Pro Asn Lys Gly Phe Gly Tyr Gly Ile Leu Lys
2390 2395 2400
Tyr Leu Ala Lys Glu Thr Phe Lys Leu Lys Pro Glu Ile Ser Phe
2405 2410 2415
Asn Tyr Leu Gly Gln Phe Thr Asp Lys Glu Glu Gly Asn Ser Ser
2420 2425 2430
Leu Met Gly Asp Leu Ile Ser Pro Ala Asn Thr Ser Glu Leu Ser
2435 2440 2445
Leu Asp Ile Asn Gly Ser Ile Glu Ala Asp Arg Leu Gln Met His
2450 2455 2460
Phe Ser Tyr Asn Ser Arg Ala Tyr Tyr Pro Glu Thr Ile Ala Thr
2465 2470 2475
Leu Val Gln Asn Phe Lys Ser Tyr Leu Leu Glu Ile Ile Asn His
2480 2485 2490
Cys Arg Ala Lys Glu Gly Val Glu His Thr Pro Ser Asp Phe Asp
2495 2500 2505
Ile Asn Asp Leu Thr Met Glu Glu Leu Asp Asp Ile Phe Asp Asp
2510 2515 2520
Leu Glu Glu Glu Val Tyr Lys
2525 2530
<210> 24
<211> 4617
<212> PRT
<213> Artificial
<220>
<223> artificial sequence
<400> 24
Met Phe Ser Arg Ser Asn Val Gln Asn Leu Tyr Arg Leu Ser Pro Met
1 5 10 15
Gln Lys Gly Ile Leu Phe His Ser Leu Lys Asp Lys Glu Asn His Ala
20 25 30
Tyr Phe Asp Gln Leu Ile Phe Thr Leu Glu Gly Lys Val Glu Leu Glu
35 40 45
Tyr Leu Glu Glu Ala Phe Thr Gln Leu Ile Lys Lys His Asp Ile Leu
50 55 60
Arg Thr Val Phe Arg Tyr Lys Lys Val Lys Glu Pro Val Gln Met Val
65 70 75 80
Leu Lys Glu Arg Ser Ser Thr Ile Tyr Phe Glu Asp Ile Ser His Leu
85 90 95
Glu Pro Glu Glu Lys Val Asn Tyr Ile Lys Gln Phe Lys Met Arg Asp
100 105 110
Arg Glu Lys Gly Phe Asp Leu Ser Arg Asp Leu Leu Ile Arg Met Ser
115 120 125
Leu Phe Lys Leu Asp Gln Glu Gln Tyr Gln Leu Ile Met Ser Asn His
130 135 140
His Ile Ile Met Asp Gly Trp Cys Leu Gly Ile Ile Leu Thr Asp Phe
145 150 155 160
Leu Arg Met Tyr Lys Gly Ile Val Asn His Thr Pro Val Pro Tyr Glu
165 170 175
His Val Thr Pro Tyr Ser Lys His Ile Gln Trp Leu Glu Lys Gln Asp
180 185 190
His Gln Glu Ala Lys Asp Phe Tyr Gln Gln Leu Leu Glu Gly Tyr Asp
195 200 205
Lys Val Thr Gly Val Pro Gln Gln Leu Val Arg Ala Asn His Glu Glu
210 215 220
Tyr Thr His Gly Gln Cys Ile Val Lys Leu Asn Gln Glu Thr Ala Asp
225 230 235 240
Arg Leu Ile Ala Ile Ala Lys Ala Tyr Gln Val Thr Val Asn Thr Val
245 250 255
Phe Gln Thr Ile Trp Gly Ile Leu Leu Gln Lys Tyr Asn Asn Thr Asp
260 265 270
Asp Ile Val Phe Gly Ser Val Val Ser Gly Arg Pro Ala Glu Ile Pro
275 280 285
Asp Val Glu Lys Met Val Gly Leu Phe Ile Asn Thr Ile Pro Val Arg
290 295 300
Ile Lys Ala Asp Gln Gln Glu Arg Phe Asp Thr Leu Val Ala Lys Val
305 310 315 320
Gln Glu Met Ala Leu Ala Ser Glu Ser Tyr Asp Tyr Leu Ser Leu Ala
325 330 335
Asp Ile His Pro Glu Ala Gly Asp Phe Ile Asn His Ile Ile Ala Phe
340 345 350
Glu Asn Phe Tyr Ile Asp Met Asp Ser Phe Asn Gln Leu Ala Asp Lys
355 360 365
Lys Glu Leu Gly Phe Ser Leu Ala Phe Ala Thr Asp His His Glu Gln
370 375 380
Thr Asn Tyr Asp Leu Ser Val Gln Ala Gln Ile Gly Asp Glu Ser Ser
385 390 395 400
Ile Lys Ile Leu Tyr Asn Ser Lys Leu Tyr Thr Ser Glu Tyr Ile Ala
405 410 415
Asn Val Ile Asp His Phe Val Thr Val Ala Asp Ile Val Ala Ala Asn
420 425 430
Pro Ser Ile Pro Val Lys Glu Ile Asp Ile Leu Thr Lys Asp Lys Lys
435 440 445
Asp Gln Ile Leu Tyr Gly Phe Asn Asn Thr Tyr Ala Asp Tyr Pro Arg
450 455 460
Glu Lys Thr Ile His Gln Leu Phe Glu Glu Gln Val Asp Lys Asn Pro
465 470 475 480
Asn Gln Ile Ala Leu Val Phe Lys Glu Glu Lys Leu Thr Tyr Gly Glu
485 490 495
Val Asn Ala Lys Ala Asn Gln Leu Ala Tyr Val Leu Arg Lys Gln Gly
500 505 510
Val Gln Pro Asn Asp Val Ile Gly Ile Ile Thr Glu Arg Ser Pro Glu
515 520 525
Met Ile Ile Gly Ile Leu Ala Ile Phe Lys Ala Gly Gly Ala Tyr Met
530 535 540
Pro Ile Asp Pro Ser Tyr Pro Ala Glu Arg Ile Gln Tyr Met Leu Gln
545 550 555 560
Asp Asn Gln Thr Lys Leu Leu Leu Val Gln Lys Gln Glu Met Ile Pro
565 570 575
Ala Asn Tyr Gln Gly Glu Val Leu Phe Leu Thr Gln Glu Ser Trp Met
580 585 590
His Glu Glu Thr Ser Asn Pro Ala His Ile Thr Gln Ala Gln Ala Leu
595 600 605
Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr Gly Glu Pro Lys Gly Ile
610 615 620
Leu Thr Thr His Gln Asn Ile Met Lys Thr Val Ile His Asn Gly Tyr
625 630 635 640
Val Glu Ile Thr Pro Gly Asp Cys Leu Ser Gln Leu Ser Asn Tyr Ala
645 650 655
Phe Asp Gly Ser Thr Phe Glu Ile Tyr Gly Ala Leu Leu His Gly Ala
660 665 670
Thr Leu Leu Leu Val Thr Lys Glu Ala Val Leu Asn Met Asn Glu Leu
675 680 685
Ala Arg Leu Ile Lys Lys Glu Gln Val Thr Val Ser Phe Met Thr Thr
690 695 700
Ala Leu Phe Asn Thr Leu Val Asp Leu Asp Ile Thr Cys Phe Gln Ser
705 710 715 720
Ile Arg Lys Val Leu Phe Gly Gly Glu Leu Ala Ser Val Lys His Val
725 730 735
Leu Lys Ala Leu Asp Tyr Leu Gly Glu His Arg Val Ile Asn Val Tyr
740 745 750
Gly Pro Thr Glu Thr Thr Val Tyr Ala Thr Tyr Tyr Ser Val Asp His
755 760 765
Ser Met Leu Thr Arg Ala Ser Val Pro Ile Gly Arg Pro Ile Asn Asn
770 775 780
Thr Lys Ala Tyr Ile Val Asn Thr Asp Gly Gln Pro Gln Pro Ile Gly
785 790 795 800
Val Val Gly Glu Leu Cys Ile Gly Gly Glu Gly Val Ala Cys Gly Tyr
805 810 815
Leu Asn Arg Pro Glu Leu Thr Lys Lys His Phe Val Asp Asn Pro Phe
820 825 830
Val Leu Gly Glu Arg Met Tyr Cys Thr Gly Asp Leu Ala Arg Phe Leu
835 840 845
Pro Asp Gly Asn Ile Glu Tyr Ile Gly Arg Met Asp Glu Gln Val Lys
850 855 860
Ile Arg Gly His Arg Ile Glu Leu Gly Glu Ile Glu Lys Val Leu Leu
865 870 875 880
Gln His Pro Ala Ile Ser Glu Thr Val Leu Leu Ala Lys Arg Asp Glu
885 890 895
Gln Gly His Ser Tyr Leu Cys Ala Tyr Ile Val Gly Gln Val Phe Trp
900 905 910
Thr Val Thr Glu Leu Arg Gln His Leu Met Glu Ser Leu Pro Glu Tyr
915 920 925
Met Val Pro Ser Tyr Phe Ile Glu Ile Glu Lys Leu Pro Leu Thr Ala
930 935 940
Asn Gly Lys Val Asp Lys Arg Ala Leu Pro Glu Pro Asp Arg Lys Met
945 950 955 960
Gly Ser Ala Tyr Val Ala Pro Glu Asn Glu Thr Glu Glu Lys Leu Val
965 970 975
Gln Phe Phe Gln Glu Ile Leu Gly Val Glu Arg Val Gly Thr Gln Asp
980 985 990
Thr Phe Phe Glu Leu Gly Gly His Ser Leu Lys Ala Met Met Leu Val
995 1000 1005
Leu Gln Ile His Lys Glu Met Gly Ile Glu Val Pro Leu Lys Glu
1010 1015 1020
Ile Phe Thr Arg Pro Thr Ile Lys Glu Leu Ala Ala Tyr Ile His
1025 1030 1035
Lys Met Asp Arg Ser Ala Tyr Ser Met Ile Glu Pro Thr Ala Lys
1040 1045 1050
Gln Glu Tyr Tyr Pro Val Ser Phe Ala Gln Arg Arg Met Phe Val
1055 1060 1065
Val Gln Gln Ile Arg Asp Thr Asn Thr Thr Ser Tyr Asn Met Pro
1070 1075 1080
Ile Leu Leu Glu Ile Glu Gly Ala Leu Asp Arg Glu Asn Val Arg
1085 1090 1095
Gln Thr Leu Lys Lys Leu Ile Glu Arg His Glu Ser Met Arg Thr
1100 1105 1110
Ser Phe His Met Ile Asp Glu Thr Leu Leu Gln Lys Val His Asp
1115 1120 1125
Asp Val Thr Trp Glu Met Glu Glu Met Glu Ala Ser Glu Glu Glu
1130 1135 1140
Val Tyr Ala Leu Thr Lys Ser Phe Ile Arg Pro Phe Asp Leu Gly
1145 1150 1155
Gln Ala Pro Leu Phe Arg Ala Gly Leu Ile Arg Val Asn Ser Glu
1160 1165 1170
Arg His Leu Leu Leu Leu Asp Thr His His Ile Ile Ser Asp Gly
1175 1180 1185
Val Ser Thr Asn Ile Leu Phe Gln Asp Phe Thr Gln Leu Tyr Arg
1190 1195 1200
Gly Arg Glu Leu Pro Ala Leu Arg Ile Gln Tyr Lys Asp Phe Ala
1205 1210 1215
Val Trp Gln Gln Gly Glu Ala Gln Leu Ala Arg Leu Gln Glu Gln
1220 1225 1230
Glu Glu Tyr Trp Leu Lys Gln Phe Ser Glu Ser Val Pro Val Leu
1235 1240 1245
Glu Leu Pro Thr Asp Phe Pro Arg Pro Ala Met Gln Gln Phe Asp
1250 1255 1260
Gly Asp Val Leu Asp Phe Ala Leu Asn Gln Gln Val Trp Gln Glu
1265 1270 1275
Leu Gln Gln Leu Ile Val Lys Glu Gly Cys Thr Ala Tyr Met Ile
1280 1285 1290
Leu Leu Ala Ala Tyr His Val Leu Leu Ser Lys Tyr Ser Ser Gln
1295 1300 1305
Asn Asp Ile Val Ile Gly Ser Pro Ile Ala Gly Arg Thr Asn Ala
1310 1315 1320
Asp Leu Gln Ser Ile Val Gly Met Phe Val Asn Thr Leu Ala Ile
1325 1330 1335
Arg Thr Lys Ser Glu Gly Thr Gln Thr Phe Arg Glu Phe Leu Ser
1340 1345 1350
Thr Ile Lys Gln Leu Val Leu Gln Ala Gln Ser Asn Ala Glu Tyr
1355 1360 1365
Pro Phe Glu Glu Leu Val Asp Lys Val Asn Pro Ser Arg Asp Leu
1370 1375 1380
Ser Arg Gln Pro Leu Phe Asp Thr Ile Phe Val Met Gln Asn Met
1385 1390 1395
Asp Ile Thr Glu Val Ala Ile Gln Gly Leu Ser Ile Val Thr Lys
1400 1405 1410
Asp Met Glu Trp Lys His Ser Lys Phe Asp Leu Thr Trp Ala Ala
1415 1420 1425
Val Glu Lys Glu Ser Leu His Phe Ser Val Glu Tyr Ser Thr Arg
1430 1435 1440
Leu Phe Lys Lys Glu Thr Ile Glu Arg Met Ala Lys His Phe Ala
1445 1450 1455
His Leu Leu Asn Gln Val Ala Glu Asn Pro Asp Leu Ser Leu Ser
1460 1465 1470
Asp Met Glu Leu Ala Thr Asp Glu Glu Val Tyr Gln Leu Leu Glu
1475 1480 1485
Glu Phe Asn Asn Thr Glu Ala Asp Tyr Pro Ser Asp Lys Thr Ile
1490 1495 1500
His Gln Gln Phe Glu Gln Lys Val Glu Glu Asn Pro Asp Gln Ile
1505 1510 1515
Ala Leu Leu Phe Lys Asp Lys Glu Ile Thr Tyr Gly Gln Leu Asn
1520 1525 1530
Ala Lys Ala Asn Gln Phe Ala Arg Val Leu Arg Lys His Gly Val
1535 1540 1545
Gln Pro Asp Gln Val Val Gly Leu Ile Thr Asp Arg Ser Ile Glu
1550 1555 1560
Met Met Ile Gly Ile Leu Ala Ile Leu Lys Ala Gly Gly Ala Tyr
1565 1570 1575
Leu Pro Ile Asp Pro Ser Tyr Pro Leu Glu Arg Ile Thr Tyr Met
1580 1585 1590
Leu Glu Asp Ser Gln Ala Gln Leu Leu Ile Val Gln Glu Ala Ala
1595 1600 1605
Met Ile Pro Glu Gly Tyr Gln Gly Lys Val Leu Leu Leu Ala Glu
1610 1615 1620
Glu Cys Trp Met Gln Glu Glu Ala Ser Asn Leu Glu Leu Ile Asn
1625 1630 1635
Asp Ala Gln Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr
1640 1645 1650
Gly Lys Pro Lys Gly Asn Leu Thr Thr His Gln Asn Ile Leu Arg
1655 1660 1665
Thr Ile Ile Asn Asn Gly Phe Ile Glu Ile Val Pro Ala Asp Arg
1670 1675 1680
Leu Leu Gln Leu Ser Asn Tyr Ala Phe Asp Gly Ser Thr Phe Asp
1685 1690 1695
Ile Tyr Ser Ala Leu Leu Asn Gly Ala Thr Leu Val Leu Val Pro
1700 1705 1710
Lys Glu Val Met Leu Asn Pro Met Glu Leu Ala Arg Ile Val Arg
1715 1720 1725
Glu Gln Asp Ile Thr Val Ser Phe Met Thr Thr Ser Leu Phe His
1730 1735 1740
Thr Leu Val Glu Leu Asp Val Thr Ser Met Lys Ser Ile Arg Lys
1745 1750 1755
Val Val Phe Gly Gly Glu Lys Ala Ser Tyr Lys His Val Glu Lys
1760 1765 1770
Ala Leu Asp Tyr Leu Gly Glu Gly Arg Leu Val Asn Gly Tyr Gly
1775 1780 1785
Pro Thr Glu Thr Thr Val Phe Ala Thr Thr Tyr Thr Val Asp Ser
1790 1795 1800
Ser Ile Lys Glu Thr Gly Ile Val Pro Ile Gly Arg Pro Leu Asn
1805 1810 1815
Asn Thr Ser Val Tyr Ile Leu Asn Glu Asn Asn Gln Pro Gln Pro
1820 1825 1830
Ile Gly Val Pro Gly Glu Leu Cys Val Gly Gly Ala Gly Ile Ala
1835 1840 1845
Arg Gly Tyr Leu Asn Arg Pro Glu Leu Thr Ala Glu Arg Phe Val
1850 1855 1860
Asp Asn Pro Phe Leu Val Gly Asp Arg Met Tyr Arg Thr Gly Asp
1865 1870 1875
Met Ala Arg Phe Leu Pro Asp Gly Asn Ile Glu Tyr Ile Gly Arg
1880 1885 1890
Met Asp Glu Gln Val Lys Ile Arg Gly His Arg Ile Glu Leu Gly
1895 1900 1905
Glu Ile Glu Lys Ser Leu Leu Glu Tyr Pro Ala Ile Ser Glu Ala
1910 1915 1920
Val Leu Val Ala Lys Arg Asp Glu Gln Gly His Ser Tyr Leu Cys
1925 1930 1935
Ala Tyr Val Val Ser Thr Asp Gln Trp Thr Val Ala Lys Val Arg
1940 1945 1950
Gln His Ile Leu Glu Ala Leu Pro Glu Tyr Met Val Pro Ser Tyr
1955 1960 1965
Phe Val Glu Leu Glu Lys Leu Pro Leu Thr Ser Asn Gly Lys Val
1970 1975 1980
Asp Lys Arg Ala Leu Pro Glu Pro Asp Arg Val Ile Thr Asn Glu
1985 1990 1995
Tyr Val Ala Ala Val Asn Glu Thr Glu Glu Lys Leu Val Gln Phe
2000 2005 2010
Phe Gln Glu Ile Leu Ala Val Asp Arg Val Gly Thr Gln Asp Thr
2015 2020 2025
Phe Phe Glu Leu Gly Gly His Ser Leu Lys Ala Met Met Leu Val
2030 2035 2040
Ser Arg Ile His Lys Glu Leu Glu Ile Glu Val Pro Leu Lys Glu
2045 2050 2055
Val Phe Ala Arg Gln Thr Val Lys Glu Leu Ala Ala Tyr Ile Arg
2060 2065 2070
Gln Ala Glu Gln Ser Asp Tyr Ser Glu Ile Gln Pro Ala Met Glu
2075 2080 2085
Gln Glu Tyr Tyr Pro Val Ser Asn Ala Gln Arg Arg Met Tyr Val
2090 2095 2100
Val Gln Gln Met Arg Asp Val Glu Thr Thr Gly Tyr Asn Met Pro
2105 2110 2115
Phe Tyr Leu Glu Met Glu Gly Ala Leu Glu Val Glu Lys Leu Ser
2120 2125 2130
Leu Ala Leu Lys Gln Leu Ile Glu Arg His Glu Ser Leu Arg Thr
2135 2140 2145
Ser Phe His Met Val Glu Asp Glu Leu Met Gln Lys Val His Ala
2150 2155 2160
Glu Val Ala Trp Glu Met Glu Met Ile His Ala Val Glu Glu Glu
2165 2170 2175
Val Gln Gln Leu Thr Asp Ser Phe Met Arg Pro Phe Asp Leu Ala
2180 2185 2190
Lys Ala Pro Leu Phe Arg Ala Arg Leu Ile Gln Ile Asn Pro Lys
2195 2200 2205
Arg His Leu Leu Met Leu Asp Met His His Ile Ile Ser Asp Gly
2210 2215 2220
Val Ser Met Asn Val Leu Phe Gln Asp Ile Thr Gln Leu Tyr Gln
2225 2230 2235
Gly Ile Glu Leu Ser Pro Leu Lys Ile Gln Tyr Lys Asp Phe Ala
2240 2245 2250
Val Trp Gln Gln Gly Ile Ala Gln Val Val Arg Phe Gln Glu Gln
2255 2260 2265
Glu Arg Tyr Trp Leu Asn Gln Phe Ser Gly Asp Leu Pro Ile Leu
2270 2275 2280
Glu Met Val Thr Asp Tyr Pro Arg Pro Ala Ile Gln Gln Phe Asp
2285 2290 2295
Gly Asp Ser Trp Ser Phe Glu Ile Asp Ala Lys Val Leu Asp Ser
2300 2305 2310
Ile Lys Gln Leu Ser Ala Lys Gln Gly Thr Thr Leu Tyr Met Thr
2315 2320 2325
Leu Leu Ala Ile Tyr Gln Ile Leu Leu Ala Lys Tyr Thr Arg Gln
2330 2335 2340
Asp Asp Ile Ile Val Gly Thr Pro Ile Ala Gly Arg Pro His Ala
2345 2350 2355
Asp Thr Glu Ser Ile Val Gly Met Phe Val Asn Thr Leu Ala Leu
2360 2365 2370
Arg Gly Gln Pro Lys Glu Glu Gln Ser Phe Ile Ser Tyr Leu Ser
2375 2380 2385
Glu Val Lys Glu Asn Val Leu Gln Ala Tyr Ala Asn Ala Asp Tyr
2390 2395 2400
Pro Phe Glu Glu Leu Val Glu Lys Leu His Leu Gln Arg Asp Met
2405 2410 2415
Ser Arg His Pro Leu Phe Asp Thr Met Phe Val Leu Gln Asn Met
2420 2425 2430
Asp Met Ser Asp Ile Asn Ile Ser Gly Leu Lys Leu His Ser Arg
2435 2440 2445
Asp Leu Asn Trp Lys Asn Ala Lys Phe Asp Met Thr Trp Met Ile
2450 2455 2460
Ala Glu Gln Asn Asn Leu Leu Ile Ser Val Glu Tyr Ser Thr Asn
2465 2470 2475
Leu Phe Lys His Glu Thr Ile Gln Arg Leu Glu Lys His Phe Thr
2480 2485 2490
Tyr Leu Val Glu Gln Val Ala Lys His Pro Asp Cys Leu Leu Arg
2495 2500 2505
Asp Leu Glu Leu Thr Thr Asp Glu Glu Lys Gln Gln Ile Leu Thr
2510 2515 2520
Val Phe Asn Asp Thr Ala Thr Asp Asp Leu Gln Asp Leu Ser Ile
2525 2530 2535
Cys His Leu Phe Glu Gln Gln Val Gln Arg Phe Ser Asp Arg Pro
2540 2545 2550
Ala Leu Val Phe Lys Glu Lys Gln Leu Thr Tyr Ser Glu Phe His
2555 2560 2565
Ala Lys Val Asn Gln Leu Ala Arg Val Leu Arg Lys Lys Gly Val
2570 2575 2580
Gln Pro Asp Gln Ala Val Gly Leu Ile Thr Asp Arg Ser Ile Glu
2585 2590 2595
Met Met Ile Gly Ile Phe Ala Ile Leu Lys Ala Gly Gly Ala Tyr
2600 2605 2610
Met Pro Ile Asp Pro Ser Tyr Pro Ile Asp Arg Ile Glu His Met
2615 2620 2625
Leu Glu Asp Ser Arg Thr Lys Leu Leu Phe Val Gln Lys Thr Glu
2630 2635 2640
Met Ile Pro Ala Ser Tyr Gln Gly Glu Val Leu Leu Leu Ala Glu
2645 2650 2655
Glu Cys Trp Met His Glu Asp Ser Ser Asn Leu Glu Leu Ile Asn
2660 2665 2670
Lys Thr Gln Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr
2675 2680 2685
Gly Lys Pro Lys Gly Asn Leu Thr Thr His Gln Asn Ile Leu Thr
2690 2695 2700
Thr Ile Ile Asn Asn Gly Tyr Ile Glu Ile Ala Pro Thr Asp Arg
2705 2710 2715
Leu Leu Gln Leu Ser Asn Tyr Ala Phe Asp Gly Ser Thr Phe Asp
2720 2725 2730
Ile Tyr Ser Ala Leu Leu Asn Gly Ala Thr Leu Val Leu Val Pro
2735 2740 2745
Lys Glu Val Met Leu Asn Pro Met Glu Leu Ala Lys Ile Val Arg
2750 2755 2760
Glu Gln Asp Ile Thr Val Ser Phe Met Thr Thr Ser Leu Phe His
2765 2770 2775
Thr Leu Val Glu Leu Asp Val Thr Ser Met Lys Ser Met Arg Lys
2780 2785 2790
Val Val Phe Gly Gly Glu Lys Ala Ser Tyr Lys His Val Glu Lys
2795 2800 2805
Ala Leu Asp Tyr Leu Gly Glu Gly Arg Leu Val Asn Gly Tyr Gly
2810 2815 2820
Pro Thr Glu Thr Thr Val Phe Ala Thr Thr Tyr Thr Val Asp Ser
2825 2830 2835
Ser Ile Lys Glu Thr Gly Ile Val Pro Ile Gly Arg Pro Leu Asn
2840 2845 2850
Asn Thr Ser Val Tyr Val Leu Asn Glu Asn Asn Gln Leu Gln Pro
2855 2860 2865
Ile Gly Val Pro Gly Glu Leu Cys Val Gly Gly Ala Gly Ile Ala
2870 2875 2880
Arg Gly Tyr Leu Asn Arg Pro Glu Leu Thr Ala Glu Arg Phe Val
2885 2890 2895
Glu Asn Pro Phe Val Ser Gly Asp Arg Met Tyr Arg Thr Gly Asp
2900 2905 2910
Leu Ala Arg Trp Leu Pro Asp Gly Ser Met Glu Tyr Leu Gly Arg
2915 2920 2925
Met Asp Glu Gln Val Lys Val Arg Gly Tyr Arg Ile Glu Leu Gly
2930 2935 2940
Glu Ile Glu Thr Arg Leu Leu Glu His Pro Ser Ile Ser Ala Ala
2945 2950 2955
Val Leu Leu Ala Lys Gln Asp Glu Gln Gly His Ser Tyr Leu Cys
2960 2965 2970
Ala Tyr Ile Val Ala Asn Gly Val Trp Thr Val Ala Glu Leu Arg
2975 2980 2985
Lys His Leu Ser Glu Ala Leu Pro Glu Tyr Met Val Pro Thr Tyr
2990 2995 3000
Phe Val Glu Leu Glu Gln Ile Pro Phe Thr Ser Asn Gly Lys Val
3005 3010 3015
Asn Lys Arg Ala Leu Pro Glu Pro Glu Gly Gln Met Thr Ser Val
3020 3025 3030
Tyr Val Ala Pro Glu Thr Glu Thr Glu Ala Lys Val Ala Ala Leu
3035 3040 3045
Phe Gln Glu Ile Leu Gly Val Glu Arg Val Gly Thr Gln Asp Met
3050 3055 3060
Phe Phe Glu Leu Gly Gly His Ser Leu Lys Ala Met Met Leu Val
3065 3070 3075
Leu Arg Met Asn Lys Glu Leu Gly Ile Glu Val Pro Leu Lys Glu
3080 3085 3090
Val Phe Ala His Pro Thr Val Lys Glu Leu Ala Ala Thr Ile Asp
3095 3100 3105
Leu Leu Asp Arg Ser Gly His Ser Glu Ile Glu Pro Ala Pro Arg
3110 3115 3120
Gln Glu Phe Tyr Pro Val Ser Ser Ala Gln Arg Arg Met Tyr Val
3125 3130 3135
Val Gln His Leu Gly Asn Val Gln Thr Thr Ser Tyr Asn Met Pro
3140 3145 3150
Leu Phe Leu Glu Val Glu Gly Ala Leu Glu Ile Asp Lys Leu His
3155 3160 3165
Leu Ala Leu Glu Lys Leu Val Glu Arg His Glu Ser Leu Arg Thr
3170 3175 3180
Ser Phe His Met Val Asp Glu Glu Leu Met Gln Gln Val His Glu
3185 3190 3195
Glu Val Ala Trp Asp Leu Glu Ile Met Asp Gly Thr Glu Gly Asp
3200 3205 3210
Leu Ala Ser Ile Thr Ala Gly Phe Ile Arg Pro Phe Asp Leu Ser
3215 3220 3225
Gln Ala Pro Leu Phe Arg Ala Gly Ile Val Arg Ile Ser Pro Glu
3230 3235 3240
Arg Phe Leu Phe Met Leu Asp Met His His Ile Ile Ser Asp Gly
3245 3250 3255
Val Ser Thr Asn Val Leu Phe Lys Asp Ile Thr Gln Leu Tyr Gln
3260 3265 3270
Gly Lys Asp Leu Pro Pro Leu Pro Ile Gln Tyr Lys Asp Tyr Ala
3275 3280 3285
Val Trp Gln Gln Ala Asp Ala Gln Val Thr Arg Leu Gln Asp Gln
3290 3295 3300
Glu Ser Tyr Trp Leu His Gln Phe Ala Gly Glu Ala Ser Val Leu
3305 3310 3315
Glu Met Pro Thr Asp Phe Pro Arg Pro Ala Val Gln Gln Phe Glu
3320 3325 3330
Gly Asp Val Trp Thr Phe Glu Ile Asp Ala Asp Ile Leu Ser Gln
3335 3340 3345
Leu Lys Lys Leu Ser Val Ser Gln Gly Ser Thr Leu Tyr Met Thr
3350 3355 3360
Leu Leu Ala Val Tyr Gln Val Leu Leu Ala Lys Tyr Thr Gly Gln
3365 3370 3375
Asp Asp Ile Ile Val Gly Ser Pro Ile Ala Gly Arg Pro His Ala
3380 3385 3390
Asp Val Glu Ser Ile Val Gly Met Phe Val Asn Thr Leu Ala Leu
3395 3400 3405
Arg Gly Gln Pro Val Gly Glu Gln Thr Phe Ile Thr Tyr Leu Ala
3410 3415 3420
Gln Val Lys Glu Gln Val Leu Gln Ala Tyr Ala Asn Ala Glu Tyr
3425 3430 3435
Pro Phe Glu Lys Leu Val Glu Lys Leu Asp Leu Gln Arg Asp Met
3440 3445 3450
Ser Arg His Pro Leu Phe Asp Thr Met Phe Thr Leu Gln Asn Met
3455 3460 3465
Glu Met Thr Asp Ile Asp Leu Ala Gly Leu Thr Phe Lys Pro Phe
3470 3475 3480
Asp Phe Glu Trp Lys Asn Ala Lys Phe Asp Met Asp Trp Thr Met
3485 3490 3495
Leu Glu Glu Glu Thr Leu Lys Val Ala Ile Glu Tyr Ser Thr Ser
3500 3505 3510
Leu Tyr Thr Lys Glu Thr Ile Ser Arg Met Ala Gln His Phe Thr
3515 3520 3525
Tyr Val Leu Gln Gln Ile Ile Glu His Pro Ala Ile Arg Leu Ala
3530 3535 3540
Glu Ile Lys Ile Ala Thr Leu Pro Glu Ile Glu Gln Ile Leu Thr
3545 3550 3555
Gln Phe Asn Asp Thr Arg Ala Asn Tyr Pro Asp Asn Gln Thr Ile
3560 3565 3570
His Ser Leu Phe Glu Gln Gln Val Glu Arg Thr Pro Glu Gln Ile
3575 3580 3585
Ala Val Val Tyr Gln Asp Gln Ser Ile Thr Tyr Arg Glu Leu Asn
3590 3595 3600
Glu Arg Ala Asn Arg Leu Ala Arg Cys Leu Ile Asp Lys Gly Ile
3605 3610 3615
Gln Arg Asn Gln Phe Val Ala Ile Met Ala Asp Arg Ser Ile Glu
3620 3625 3630
Thr Val Ile Gly Met Met Gly Ile Leu Lys Ala Gly Gly Ala Tyr
3635 3640 3645
Val Pro Ile Asp Pro Asp Tyr Pro Leu Asp Arg Lys Leu Tyr Ile
3650 3655 3660
Leu Glu Asp Ser His Ala Ser Leu Leu Leu Phe Gln Gln Lys His
3665 3670 3675
Glu Val Pro Ser Glu Phe Thr Gly Asp Arg Ile Leu Ile Glu Gln
3680 3685 3690
Met Gln Trp Tyr Gln Ala Ala Asp Thr Asn Val Gly Ile Val Asn
3695 3700 3705
Thr Ala Gln Asp Leu Ala Tyr Met Ile Tyr Thr Ser Gly Ser Thr
3710 3715 3720
Gly Gln Pro Lys Gly Val Met Ile Asp His Gln Ala Val Cys Asn
3725 3730 3735
Leu Cys Leu Met Ala Gln Thr Tyr Gly Ile Phe Ala Asn Ser Arg
3740 3745 3750
Val Leu Gln Phe Ala Ser Phe Ser Phe Asp Ala Ser Val Gly Glu
3755 3760 3765
Val Phe His Thr Leu Thr Asn Gly Ala Thr Leu Tyr Leu Met Asp
3770 3775 3780
Arg Asn Leu Leu Met Ala Gly Val Glu Phe Val Glu Trp Leu Arg
3785 3790 3795
Val Asn Glu Ile Thr Ser Ile Pro Phe Ile Ser Pro Ser Ala Leu
3800 3805 3810
Arg Ala Leu Pro Tyr Glu Asp Leu Pro Ala Leu Lys Tyr Ile Ser
3815 3820 3825
Thr Gly Gly Glu Ala Leu Pro Val Asp Leu Val Arg Leu Trp Gly
3830 3835 3840
Thr Glu Arg Ile Phe Leu Asn Ala Tyr Gly Pro Thr Glu Thr Thr
3845 3850 3855
Val Asp Ala Thr Ile Gly Leu Cys Thr Pro Glu Asp Lys Pro His
3860 3865 3870
Ile Gly Lys Pro Val Leu Asn Lys Lys Ala Tyr Ile Ile Asn Pro
3875 3880 3885
Asn Tyr Gln Leu Gln Pro Ile Gly Val Pro Gly Glu Leu Cys Ile
3890 3895 3900
Gly Gly Val Gly Ile Ala Pro Gly Tyr Trp Asn Arg Pro Glu Leu
3905 3910 3915
Thr Arg Glu Lys Phe Val Asp Asn Pro Phe Ala Gln Gly Glu Arg
3920 3925 3930
Met Tyr Lys Thr Gly Asp Leu Val Arg Trp Leu Pro Asp Gly Asn
3935 3940 3945
Ile Glu Phe Leu Gly Arg Ile Asp Asp Gln Val Lys Ile Arg Gly
3950 3955 3960
His Arg Ile Glu Leu Gly Glu Ile Glu Thr Arg Leu Leu Glu His
3965 3970 3975
Glu Gln Val Ile Glu Ala Val Val Leu Ala Arg Glu Asp Glu Gln
3980 3985 3990
Gly Gln Ala Tyr Leu Cys Ala Tyr Leu Val Ala Ala Asp Glu Trp
3995 4000 4005
Thr Val Ala Glu Leu Arg Lys His Leu Gly Lys Thr Leu Pro Asp
4010 4015 4020
Tyr Met Ile Pro Ala Tyr Phe Ile Glu Leu Glu Glu Phe Pro Leu
4025 4030 4035
Thr Pro Ser Gly Lys Val Asn Lys Lys Ala Leu Pro Glu Pro Asp
4040 4045 4050
Gly Gln Ile Gln Thr Gly Val Glu Tyr Val Glu Ala Thr Thr Glu
4055 4060 4065
Ser Gln Lys Ile Leu Val Glu Leu Trp Gln Glu Val Leu Arg Val
4070 4075 4080
Glu Arg Ile Gly Ile Tyr Asp Asn Phe Phe Glu Leu Gly Gly Asp
4085 4090 4095
Ser Ile Lys Ala Ile Gln Ile Thr Ala Arg Leu Arg Arg His His
4100 4105 4110
Arg Lys Leu Glu Ile Ser His Leu Phe Lys His Pro Thr Ile Ala
4115 4120 4125
Glu Leu Ala Pro Trp Met Gln Thr Ser Gln Ala Leu Leu Glu Gln
4130 4135 4140
Gly Thr Val Glu Gly Glu Val Met Leu Thr Pro Ile Gln Lys Ala
4145 4150 4155
Phe Phe Glu Glu Asn Gln Glu Gln Pro Gln His Phe Asn Gln Asp
4160 4165 4170
Ser Leu Leu Tyr Ser Ser Asn Gly Trp Asn Gln Asp Ala Ile Glu
4175 4180 4185
Gln Val Phe Glu Lys Ile Thr Glu His His Asp Ala Leu Arg Met
4190 4195 4200
Val Tyr Pro His Thr Glu Gly Lys Val Thr Gln Ile Asn Arg Gly
4205 4210 4215
Leu Glu Asp Lys Ala Phe Thr Leu Gln Val Phe Asp Phe Thr Gln
4220 4225 4230
Glu Pro Thr Asp Thr Gln Ala Thr Lys Ile Glu Gln Ile Ala Thr
4235 4240 4245
Gln Leu Gln Ala Ser Phe Asp Leu Lys Lys Gly Pro Leu Val Arg
4250 4255 4260
Leu Gly Leu Phe Thr Thr Lys Ala Gly Asp Tyr Leu Leu Ile Val
4265 4270 4275
Ile His His Leu Val Ile Asp Gly Val Ser Trp Arg Ile Leu Leu
4280 4285 4290
Glu Asp Phe His Asn Ala Tyr Gln Gln Val Ile Gln Gly Gln Ala
4295 4300 4305
Ile Val Leu Pro Glu Lys Thr Thr Ser Phe Lys Thr Trp Ser Glu
4310 4315 4320
Arg Leu Asn Glu Tyr Ala Asn Ser His Ala Leu Leu His Glu Ile
4325 4330 4335
Pro Tyr Trp Lys Gln Met Glu Glu Ile Ser Ile Ala Pro Leu Pro
4340 4345 4350
Lys Lys Gly Asn Asn Asp Gly Arg Tyr Tyr Val Lys Asp Ser Glu
4355 4360 4365
Tyr Ala Thr Met Ser Leu Thr Glu Glu Glu Thr Gln Asn Leu Leu
4370 4375 4380
Thr Arg Val His Arg Ala Tyr Arg Thr Glu Ile Asn Asp Leu Leu
4385 4390 4395
Leu Ala Ala Leu Gly Leu Ala Ser Lys Glu Trp Thr Lys Glu Asn
4400 4405 4410
Arg Val Ala Ile His Leu Glu Gly His Gly Arg Glu Glu Ile Gly
4415 4420 4425
Glu Gly Val Asp Val Asn Arg Thr Val Gly Trp Phe Thr Ser Leu
4430 4435 4440
Phe Pro Phe Val Ile Asp Leu Glu Asn Asp Glu Leu Pro Leu Ile
4445 4450 4455
Ile Lys Ser Val Lys Glu Thr Leu Arg Arg Val Pro Asn Lys Gly
4460 4465 4470
Met Gly Tyr Gly Ile Leu Lys His Leu Thr Ser Asp Ala Asn Lys
4475 4480 4485
Gln Glu Ile Thr Phe Ser Leu Arg Pro Glu Ile Ser Phe Asn Tyr
4490 4495 4500
Leu Gly Val Phe Asp Gln Gln Glu Glu Glu Ser Glu Ser Ala Gly
4505 4510 4515
Ile Pro Thr Gly Gln Pro Ile Ser Pro Gln Tyr Tyr Asp Thr His
4520 4525 4530
Leu Leu Glu Phe Asn Gly Ala Val Ser Asn Asn Gln Leu His Val
4535 4540 4545
Asn Cys Arg Phe Ala Pro Ala Ala Val Asp Arg Ala Ile Val Glu
4550 4555 4560
Ile Leu Met Glu Arg Phe Lys His His Leu Leu Leu Ile Ser Lys
4565 4570 4575
His Cys Leu Glu Lys Asp Thr Val Glu Phe Thr Pro Thr Asp Phe
4580 4585 4590
Thr Glu Lys Glu Leu Ser Gln Glu Gln Leu Asp Asp Leu Leu Asp
4595 4600 4605
Asp Leu Phe Glu Asp Ile Asp Asp Leu
4610 4615
<210> 25
<211> 2541
<212> PRT
<213> Artificial
<220>
<223> artificial sequence
<400> 25
Met Gln Lys Lys Asp Lys Ile Lys Asp Ile Tyr Ser Leu Ser Pro Leu
1 5 10 15
Gln Lys Gly Met Leu Phe His Ser Met Lys Asp Pro Gln Ser Asp Ala
20 25 30
Tyr Phe Glu Gln Val Thr Leu Leu Leu Glu Gly Val Val Asn Pro Thr
35 40 45
Tyr Leu Ala Glu Ser Ile Gln Gly Leu Val Gln Lys Tyr Asp Met Phe
50 55 60
Arg Ser Val Phe Arg Tyr Lys Lys Val Asp Pro Val Gln Val Val Leu
65 70 75 80
Ser Glu Arg Lys Ile Asp Leu Gln Ile Glu Asp Leu Thr Gln Ile Asn
85 90 95
Glu Glu Glu Gln Arg Lys Phe Ile Glu Glu Tyr Arg Lys Lys Asp Arg
100 105 110
Glu Arg Gly Phe Asp Leu Ser Arg Asp Ile Leu Leu Arg Phe Thr Leu
115 120 125
Phe Gln Thr Ala Ala Asn Arg Tyr Glu Leu Leu Trp Ser His His His
130 135 140
Ile Leu Met Asp Gly Trp Cys Thr Gly Ile Val Phe Gln Asp Leu Phe
145 150 155 160
Gln Met Tyr Gln Arg Arg Leu Ser Gly Gln Ala Leu Leu Pro Glu Val
165 170 175
Ala Pro Gln Tyr Ser Glu Tyr Ile Arg Trp Leu Lys Lys Gln Asp Asp
180 185 190
Gln Gln Ala Leu Ala Phe Trp Lys Glu Tyr Leu Gln Gly Phe Glu Asn
195 200 205
Leu Thr Gly Ile Pro Arg Leu Arg Ser Gly Asn His Pro Tyr Lys Gln
210 215 220
Glu Glu Phe Ile Phe Ser Leu Gly Glu Glu Ala Thr Gln Lys Leu Thr
225 230 235 240
Gln Thr Ala Gln Lys Tyr Gln Val Thr Leu Asn Thr Val Val Gln Thr
245 250 255
Ile Trp Gly Ala Leu Leu Gln Lys Tyr Asn Asn Thr Asn Asp Ala Ala
260 265 270
Tyr Gly Val Val Val Ser Gly Arg Pro Ala Glu Val Pro Asn Val Glu
275 280 285
Gln Met Val Gly Leu Phe Ser Asn Thr Ile Pro Ile Arg Ile Lys Lys
290 295 300
Glu Ala Gly Lys Thr Phe Gly Glu Val Leu Lys Asn Val Gln Gln Thr
305 310 315 320
Ala Leu Glu Ala Glu Lys Tyr Gly Tyr Leu Ser Leu Ala Asp Ile Gln
325 330 335
Ala Ser Ala Ala Tyr Thr His Gln Leu Leu Asp His Ile Leu Ala Phe
340 345 350
Glu Asn Phe Pro Met Asp Gln Glu Thr Phe Asn Gln Glu Asn Val Leu
355 360 365
Gly Phe Ala Val Lys Asp Ala His Thr Phe Glu Gln Thr His Tyr Asp
370 375 380
Leu Thr Val Leu Val Ile Pro Gly Lys Glu Leu Ile Phe Lys Phe Met
385 390 395 400
Tyr Asn Glu Ser Val His Ser Lys Glu Tyr Leu Asn Leu Leu Glu Leu
405 410 415
Asn Met Lys Lys Leu Val Ser Leu Val Ile Glu Gln Gln Asp Ile Phe
420 425 430
Asp Pro Ala Thr Glu Phe Val Ser Asp Leu Glu Lys Asp Lys Leu Leu
435 440 445
Thr Ile Phe Asn Arg Thr Asp Ala Lys Tyr Pro Arg Glu Lys Thr Ile
450 455 460
His Glu Leu Phe Gln Glu Gln Val Asp Lys Asn Pro Asp Gln Val Ala
465 470 475 480
Leu Val Phe Gly Glu Ala Gln Leu Thr Tyr Arg Glu Leu Asn Glu Lys
485 490 495
Ala Asn Gln Met Ala Arg Gly Leu Arg Lys Gln Gly Val Leu Pro Asp
500 505 510
Gln Val Ile Gly Leu Leu Thr Asp Arg Ser Leu Glu Met Ile Ile Ala
515 520 525
Ile Leu Ala Ile Phe Lys Ala Gly Gly Ala Tyr Met Pro Ile Asp Pro
530 535 540
Ser Tyr Pro Ser Glu Arg Ile Gln Tyr Met Leu Ala Asp Ser Arg Thr
545 550 555 560
His Leu Leu Leu Val Gln Lys Ala Glu Met Ile Pro Ala Asn Tyr Gln
565 570 575
Gly Glu Val Leu Leu Leu Thr Glu Asp Ser Trp Met Asp Glu Asn Thr
580 585 590
Asp Asn Leu Asp Leu Val Asn Gln Ala Gln Asp Leu Ala Tyr Val Met
595 600 605
Tyr Thr Ser Gly Ser Thr Gly Lys Pro Lys Gly Asn Leu Thr Thr His
610 615 620
Gln Asn Ile Val Lys Thr Ile Met Asn Asn Gly Tyr Met Glu Ile Thr
625 630 635 640
Pro Asn Asp Arg Leu Leu Gln Leu Ser Asn Tyr Ala Phe Asp Gly Ser
645 650 655
Thr Phe Asp Ile Tyr Ser Ala Leu Leu Asn Gly Ala Ser Leu Ile Leu
660 665 670
Val Pro Thr His Val Leu Met Asn Pro Thr Asp Leu Ala Ser Val Ile
675 680 685
Gln Asp Gln His Ile Thr Val Ser Phe Met Thr Thr Ser Leu Phe Asn
690 695 700
Thr Leu Val Glu Leu Asp Val Thr Ser Leu Lys His Met Arg Lys Val
705 710 715 720
Val Phe Gly Gly Glu Lys Ala Ser Ile Lys His Val Glu Lys Ala Leu
725 730 735
Asp Tyr Leu Gly Ala Gly Arg Leu Val Asn Gly Tyr Gly Pro Thr Glu
740 745 750
Thr Thr Val Phe Ala Thr Thr Tyr Thr Val Asp His Thr Ile Lys Glu
755 760 765
Thr Gly Ile Met Pro Ile Gly Arg Pro Leu Asn Asn Thr Lys Val Phe
770 775 780
Ile Leu Gly Ala Asp Asn Gln Leu Gln Pro Ile Gly Ala Leu Gly Glu
785 790 795 800
Leu Cys Val Ser Gly Glu Gly Leu Ala Arg Gly Tyr Leu Asn Leu Pro
805 810 815
Glu Leu Thr Ala Asp Arg Phe Val Glu Asn Pro Phe Met Arg Gly Glu
820 825 830
Arg Met Tyr Arg Thr Gly Asp Leu Ala Arg Trp Leu Pro Asp Gly Ser
835 840 845
Ile Glu Tyr Val Gly Arg Ile Asp Glu Gln Val Lys Ile Arg Gly His
850 855 860
Arg Ile Glu Leu Gly Glu Ile Glu Ala Arg Leu Leu Glu His Pro Ala
865 870 875 880
Ile Ser Glu Thr Val Leu Leu Ala Lys Gln Asp Glu Gln Gly His Ser
885 890 895
Phe Leu Cys Ala Tyr Leu Val Thr Asn Gly Ala Trp Ser Val Ala Glu
900 905 910
Leu Arg Lys His Ile Lys Glu Thr Leu Pro Asp Ser Met Val Pro Ser
915 920 925
Tyr Phe Ile Glu Ile Asp Lys Met Pro Leu Thr Ser Asn Gly Lys Ala
930 935 940
Asp Lys Arg Ala Leu Pro Glu Pro Asp Val Gln Gln Val Ser Ser Tyr
945 950 955 960
Ile Ala Pro Glu Thr Glu Thr Glu Glu Lys Leu Val Gln Leu Phe Gln
965 970 975
Glu Ile Leu Ser Val Glu Gln Val Gly Thr Gln Asp Asn Phe Phe Glu
980 985 990
Leu Gly Gly His Ser Leu Lys Ala Met Met Leu Val Ser Arg Met His
995 1000 1005
Lys Glu Leu Asp Ile Glu Val Pro Leu Lys Asp Val Phe Ala Arg
1010 1015 1020
Pro Ser Val Lys Glu Leu Ala Ala Phe Leu Thr Asn Thr Glu Val
1025 1030 1035
Ser Asp Tyr Ile Ala Ile Glu Pro Ala Ala Lys Gln Glu Phe Tyr
1040 1045 1050
Pro Val Ser Ser Ala Gln Arg Arg Met Tyr Val Val Glu Gln Ile
1055 1060 1065
Gly Ser Ser Asn Thr Thr Ser Tyr Asn Met Pro Phe Leu Leu Glu
1070 1075 1080
Ile Gly Gly Ala Leu Asp Val Val Gly Leu Gln Lys Ala Leu Lys
1085 1090 1095
Lys Leu Val Ile Arg His Glu Ser Leu Arg Thr Ser Phe His Met
1100 1105 1110
Val Asp Glu Val Leu Met Gln Lys Ile His Pro Asp Val Glu Trp
1115 1120 1125
Asp Leu Met Val Met Glu Ala Lys Asp Glu Asp Leu Pro Gln Ile
1130 1135 1140
Ile Asp Gly Phe Ile Gln Pro Phe Asp Leu Ser Asp Ala Ser Leu
1145 1150 1155
Phe Arg Ala Gly Leu Val Arg Met Glu Ala Asp Arg His Leu Leu
1160 1165 1170
Met Leu Asp Met His His Ile Ile Ser Asp Gly Val Ser Thr Asn
1175 1180 1185
Val Leu Phe Gln Asp Leu Met Gln Ile Tyr Gln Gly Lys Glu Leu
1190 1195 1200
Pro Ser Leu Arg Ile Gln Tyr Lys Asp Tyr Ala Val Trp Gln Gln
1205 1210 1215
Ala Glu Ala Gln Val Asn Arg Leu Arg Glu Gln Glu Gln Tyr Trp
1220 1225 1230
Leu Asn Gln Phe Ser Gly Glu Leu Pro Val Leu Glu Met Pro Thr
1235 1240 1245
Asp Tyr Thr Arg Pro Ser Ile Gln Gln Ser Glu Gly Asp Ile Trp
1250 1255 1260
Ser Phe Glu Ile Ser Ala Glu Ile Ile Asn Lys Val Lys Lys Leu
1265 1270 1275
Ser Ser Ser Gln Gly Thr Thr Leu Tyr Met Thr Leu Leu Ala Ala
1280 1285 1290
Tyr Gln Val Leu Leu Ser Lys Tyr Thr Gly Gln Glu Asp Val Ile
1295 1300 1305
Val Gly Ser Pro Ile Ala Gly Arg Pro His Ala Asp Val Glu Lys
1310 1315 1320
Ile Val Gly Met Phe Val Asn Thr Leu Ala Phe Arg Gly Gln Pro
1325 1330 1335
Lys Ser Thr Gln Thr Phe Ser Thr Tyr Leu Ser Glu Val Lys Glu
1340 1345 1350
Gln Val Leu His Ala Tyr Asp Asn Ala Glu Tyr Pro Phe Glu Glu
1355 1360 1365
Leu Leu Glu Lys Leu Asp Leu Glu Arg Asp Leu Ser Arg His Pro
1370 1375 1380
Leu Phe Asp Thr Met Phe Ala Leu Gln Asn Met Glu Met Ala Glu
1385 1390 1395
Ile Asn Ile Met Asp Leu Ser Phe Gln Pro Arg Asp Leu Thr Trp
1400 1405 1410
Lys Asn Ala Lys Phe Asp Leu Thr Trp Met Met Ala Glu Ala Glu
1415 1420 1425
Asn Leu Tyr Val Thr Ile Glu Tyr Ser Thr Ser Leu Phe Lys Pro
1430 1435 1440
Glu Thr Ile Glu Arg Leu Gly Lys Arg Phe Thr His Leu Leu Lys
1445 1450 1455
Gln Ile Gly Asp Ala Pro Glu Arg Leu Ile Ala Asp Leu Glu Val
1460 1465 1470
Ala Thr Glu Asp Glu Lys His Gln Ile Leu Ser Val Phe Asn Leu
1475 1480 1485
Thr Gln Ser Asp Tyr Pro Val Asn Lys Thr Val His Gln Leu Phe
1490 1495 1500
Glu Glu Gln Val Gln Asn Met Pro Asp Gln Lys Ala Ile Val Phe
1505 1510 1515
Gly Glu Glu Gln Val Thr Tyr Lys Glu Leu Asn Ala Lys Ala Asn
1520 1525 1530
His Leu Ala Thr Leu Leu Lys Gln Lys Gly Ile Thr Asn Glu Gln
1535 1540 1545
Leu Val Ala Val Met Ile Glu Pro Ser Ile Glu Phe Phe Val Gly
1550 1555 1560
Ile Leu Ala Val Leu Lys Ala Gly Gly Ala Tyr Leu Pro Ile Asp
1565 1570 1575
Pro Thr Tyr Pro Thr Glu Arg Ile Ala Tyr Ile Leu Glu Asp Ser
1580 1585 1590
Gln Ser Lys Val Leu Leu Val Arg Gly His Glu Gln Val Gln Thr
1595 1600 1605
Gln Phe Ala Gly Glu Ile Leu Glu Ile Asp Ser Lys Lys Leu Ser
1610 1615 1620
Thr Glu Glu Leu Lys Asp Val Pro Met Asn Asn Lys Val Thr Asp
1625 1630 1635
Leu Ala Tyr Val Ile Tyr Thr Ser Gly Ser Thr Gly Gln Pro Lys
1640 1645 1650
Gly Val Met Val Glu His Arg Ser Leu Met Asn Leu Ser Ala Trp
1655 1660 1665
His Val Gln Tyr Phe Gly Ile Thr Lys Asp Asp Arg Ser Thr Lys
1670 1675 1680
Tyr Ala Gly Val Gly Phe Asp Ala Ser Val Trp Glu Val Phe Pro
1685 1690 1695
Tyr Leu Ile Ala Gly Ala Thr Ile Tyr Val Ile Asp Gln Glu Thr
1700 1705 1710
Arg Tyr Asp Val Glu Lys Leu Asn Gln Tyr Val Thr Asp Gln Gly
1715 1720 1725
Ile Thr Ile Ser Phe Leu Pro Thr Gln Phe Ala Glu Gln Phe Met
1730 1735 1740
Leu Thr Asp His Thr Asp His Thr Ala Leu Arg Trp Leu Leu Ile
1745 1750 1755
Gly Gly Asp Lys Ala Gln Gln Ala Val Gln Gln Lys Gln Tyr Gln
1760 1765 1770
Ile Val Asn Asn Tyr Gly Pro Thr Glu Asn Thr Val Val Thr Thr
1775 1780 1785
Ser Tyr Ile Val Ser Pro Glu Asp Lys Lys Ile Pro Ile Gly Arg
1790 1795 1800
Pro Ile Ala Asn Asn Gln Val Phe Ile Leu Asn Lys Glu Asn Gln
1805 1810 1815
Leu Gln Pro Val Gly Ile Pro Gly Glu Leu Cys Val Ser Gly Asp
1820 1825 1830
Ser Leu Ala Arg Gly Tyr Leu His Arg Pro Glu Leu Thr Ser Glu
1835 1840 1845
Arg Phe Val Ala Asn Pro Phe Val Pro Gly Glu Arg Met Tyr Lys
1850 1855 1860
Thr Gly Asp Ile Ala Arg Trp Leu Pro Asp Gly Asn Ile Glu Tyr
1865 1870 1875
Leu Gly Arg Leu Asp Asp Gln Ile Lys Ile Arg Gly Tyr Arg Val
1880 1885 1890
Glu Leu Gly Glu Ile Glu Ser Ala Ile Leu Glu His Glu Ala Ile
1895 1900 1905
His Glu Thr Val Val Leu Ala Arg Gln Asp Asp Gln Asn Gln Thr
1910 1915 1920
Tyr Leu Cys Ala Tyr Val Val Pro Lys Lys Ser Phe Asp Val Ala
1925 1930 1935
Glu Leu Arg Gln Tyr Leu Gly Arg Lys Leu Pro His Phe Met Ile
1940 1945 1950
Pro Ala Phe Phe Thr Glu Met Thr Glu Phe Pro Ile Thr Ser Asn
1955 1960 1965
Gly Lys Val Asp Lys Lys Ala Leu Pro Leu Pro Asp Leu Ser Lys
1970 1975 1980
Gln Ser Glu Ile Asp Tyr Val Ala Pro Thr Thr Thr Leu Glu Glu
1985 1990 1995
Thr Leu Ala Glu Leu Trp Thr Glu Val Leu Gly Val Ser Gln Val
2000 2005 2010
Gly Ile His Asp Asn Phe Phe Lys Leu Gly Gly Asp Ser Ile Lys
2015 2020 2025
Ala Ile Gln Ile Ala Ala Arg Leu Asn Thr Lys Gln Leu Lys Leu
2030 2035 2040
Glu Val Lys Asp Leu Phe Gln Ala Gln Thr Ile Ala Gln Val Ile
2045 2050 2055
Pro Tyr Ile Lys Thr Lys Glu Ser Lys Ala Glu Gln Gly Ile Val
2060 2065 2070
Gln Gly Lys Val Glu Leu Thr Pro Ile Gln Glu Trp Phe Phe Gln
2075 2080 2085
Gln Ser Phe Asp Ile Pro His His Trp Asn Gln Ser Met Met Phe
2090 2095 2100
Tyr Arg Lys Glu Gly Trp Asp Gln His Val Val Gln Arg Val Phe
2105 2110 2115
Gln Lys Ile Ala Glu His His Asp Ala Leu Arg Met Ala Tyr Gln
2120 2125 2130
Gln Glu Asn Gly Lys Thr Ile Gln Ile Asn Arg Gly Val Glu Gly
2135 2140 2145
Lys Leu Phe Glu Leu Ser Ile Phe Asp Phe Lys Gln Gln Ala Asn
2150 2155 2160
Val Pro Glu Leu Ile Glu Gln Ala Ala Asn Arg Leu Gln Ser Ala
2165 2170 2175
Met Asn Leu Gln Asp Gly Pro Leu Val Gln Leu Gly Leu Phe Gln
2180 2185 2190
Thr Ser Glu Gly Asp His Leu Leu Ile Ala Ile His His Leu Val
2195 2200 2205
Val Asp Ala Val Ser Trp Arg Ile Ile Thr Glu Asp Phe Met Asn
2210 2215 2220
Gly Tyr Gln Gln Asp Leu Gln Gly Glu Pro Ile Ala Phe Thr Ser
2225 2230 2235
Lys Thr Asp Ser Tyr Gln Lys Trp Ala Lys Ser Leu Leu Glu Tyr
2240 2245 2250
Ala Thr Ser Glu Glu Ile Gln Ser Glu Leu Lys Tyr Trp Gln Ser
2255 2260 2265
Met Ile Ala Lys Gly Leu Pro Ala Leu Pro Arg Asp Ser Lys Val
2270 2275 2280
Gly Ala Pro Tyr Leu Leu Lys Asp Ile Gln Glu Val Ala Ile Gln
2285 2290 2295
Leu Thr Lys Glu Gln Thr Asn Lys Leu Leu Thr Asp Ala His Asn
2300 2305 2310
Ala Tyr Asn Thr Gln Ile Asn Asp Leu Leu Leu Thr Ala Leu Ala
2315 2320 2325
Leu Thr Ile Gln Glu Trp Ala Gln Thr Asn Ser Ile Ala Ile Thr
2330 2335 2340
Leu Glu Gly His Gly Arg Glu Asp Ile Gly Val Asp Ile Asp Ile
2345 2350 2355
Asn Arg Thr Val Gly Trp Phe Thr Ser Met Tyr Pro Val Val Phe
2360 2365 2370
Asp Leu Gln Lys Gln Gly Ile Ala Asn Thr Val Lys Gln Val Lys
2375 2380 2385
Glu Glu Leu Arg Gln Ile Pro Asn Lys Gly Ile Gly Tyr Gly Val
2390 2395 2400
Val Arg Tyr Leu Ser Asn Gln Gly Ser Thr Glu Leu Asp Leu Ser
2405 2410 2415
Ser His Ala Ile Asn Pro Glu Ile Ser Phe Asn Tyr Leu Gly Gln
2420 2425 2430
Met Asp Gln Ser Gly Gln Glu Glu Glu Tyr Gln Leu Ser Pro Leu
2435 2440 2445
Ser Ser Gly Gln Gln Ile Ser Gln Met Asn Gln Gly Leu Phe Pro
2450 2455 2460
Ile Asn Val Ser Gly Ile Val Val Glu Asn Gln Leu Ser Ile Gln
2465 2470 2475
Ile Ser Tyr Asp Ser Gln Ala Tyr His Asp Ser Thr Met Glu Lys
2480 2485 2490
Leu Ile Gln Arg Tyr Gln Tyr His Leu Leu Glu Ile Ile Asn His
2495 2500 2505
Cys Val Gln Gln Thr Glu Thr Glu Leu Thr Pro Ser Asp Phe Ser
2510 2515 2520
Thr Lys Glu Leu Ser Met Glu Asp Leu Glu Ser Val Phe Glu Leu
2525 2530 2535
Leu Asp Glu
2540
<210> 26
<211> 2526
<212> PRT
<213> Artificial
<220>
<223> artificial sequence
<400> 26
Met Leu Ser Lys Ala Asn Ile Lys Asp Ile Tyr Thr Leu Ser Pro Leu
1 5 10 15
Gln Lys Gly Met Leu Phe Gln His Leu Lys Glu Glu Ser Thr Ala Tyr
20 25 30
Phe Glu Gln Leu His Phe Thr Ile Lys Gly Gln Leu Tyr Val Asp Ser
35 40 45
Phe Glu Ala Ser Phe Gln His Leu Ile Asn Lys Tyr Asp Val Leu Arg
50 55 60
Thr Val Phe Leu Tyr Lys Asn Met Thr Gln Pro Met Gln Met Val Leu
65 70 75 80
Lys Glu Arg Lys Thr Ser Val His Phe Glu Asp Ile Ser His Leu Asp
85 90 95
Ser Lys Ala Val Ser Glu Tyr Val Glu Glu Phe Lys Asn Gln Asp Arg
100 105 110
Glu Lys Gly Phe Glu Leu Ser Lys Asp Ile Leu Met Arg Phe Ala Ile
115 120 125
Leu Lys Ala Gly Ala Glu Ser Tyr His Leu Ile Trp Ser Phe His His
130 135 140
Ile Leu Met Asp Gly Trp Cys Met Gly Ile Val Leu Gln Asp Leu Phe
145 150 155 160
Arg Met Tyr Gln Gln His Arg Gln Asn Ile Pro Ile Thr Val Glu Ser
165 170 175
Val Pro Ala Tyr Ser Glu Tyr Ile Arg Trp Leu Glu Lys Gln Asn Val
180 185 190
Thr Lys Ala Arg Asp Tyr Trp Lys Asn Tyr Leu Glu Gly Tyr Glu Glu
195 200 205
Leu Thr Gly Ile Ile Arg Leu Asp Thr Lys His Thr Ser His Asn Asn
210 215 220
Glu Val Gln Glu Cys Ala Phe Thr Leu Asp Lys Asp Ile Thr Glu Gly
225 230 235 240
Leu Thr Gln Leu Ala Arg His Tyr Ser Val Thr Val Asn Thr Leu Phe
245 250 255
Gln Thr Ile Trp Gly Met Leu Leu Gln Lys Tyr Asn Asn Lys Asp Asp
260 265 270
Val Val Phe Gly Ala Val Val Ser Gly Arg Pro Ser Glu Ile His Gly
275 280 285
Val Glu Asn Met Val Gly Leu Phe Ile Asn Thr Val Pro Ile Arg Ile
290 295 300
Gln Lys Gln Met Asn Asp Thr Phe Ser His Leu Leu Lys Arg Val His
305 310 315 320
Glu Ser Thr Leu Leu Ser Lys Gln Tyr Glu Phe Val Ser Leu Ala Asp
325 330 335
Ile Gln Thr Asp Ala Gly Phe Ser Gly Gln Leu Leu Asp His Ile Leu
340 345 350
Val Phe Glu Asn Tyr Pro Ile Ser Glu Gly Ser Phe Glu Glu Glu Glu
355 360 365
Phe Thr Met Asp Ser Ile Lys Thr Tyr Glu Lys Thr Ser Tyr Asp Leu
370 375 380
Asn Val Met Ile Arg Pro Asn Glu Asp Gln Leu Asp Ile Ala Phe Gln
385 390 395 400
Phe Asn Asp Asp Val Tyr Ser Ser Glu Asn Val Lys Arg Leu Phe Gln
405 410 415
His Met Lys Gln Leu Ala Leu Ala Val Ile Lys Asn Pro Asp Val Arg
420 425 430
Leu Glu Glu Ile Ala Met Ile Thr Glu Glu Glu Arg Tyr Gln Ile Leu
435 440 445
His Asp Phe Gln Gly Glu Ile Val Asp Phe Val Thr Glu Lys Thr Leu
450 455 460
Pro Glu Leu Phe Glu Asp Gln Val Lys Arg Thr Pro Glu Ala Ile Ala
465 470 475 480
Leu Arg Phe Glu Asp Gln Gln Leu Thr Tyr Gln Glu Leu Asn Gln Arg
485 490 495
Val Asn Gln Leu Ala Trp Thr Leu Arg Met Lys Gly Leu Gln Gln Glu
500 505 510
Glu Leu Val Gly Ile Met Val Gln Arg Ser Leu Glu Met Ile Val Gly
515 520 525
Val Leu Ala Val Ile Lys Ala Gly Gly Ala Tyr Val Pro Ile Asp Pro
530 535 540
Glu Tyr Pro Leu Asp Arg Ile Gln Tyr Met Leu Glu Asp Ser Gly Thr
545 550 555 560
Asn Trp Leu Leu Thr Thr Lys Gln Ser Glu Ile Pro Ser Ile Tyr Leu
565 570 575
Gly His Val Leu Tyr Leu Glu Glu Asp Thr Val Tyr His Glu Arg Ser
580 585 590
Ser Asp Val Glu Ile Val Asn Gln Ser Ser Asp Leu Ala Tyr Ile Ile
595 600 605
Tyr Thr Ser Gly Ser Thr Gly Gln Pro Lys Gly Val Met Ile Asp His
610 615 620
Arg Ala Val His Asn Leu His Leu Ser Ala Gly Ile Tyr Gly Ile Ala
625 630 635 640
Gln Gly Ser Gln Val Leu Gln Phe Ala Ser Leu Ser Phe Asp Ala Ser
645 650 655
Val Gly Asp Ile Phe His Ser Leu Leu Thr Gly Ala Thr Leu His Leu
660 665 670
Val Lys Lys Glu Gln Leu Leu Ser Gly His Ala Phe Met Glu Trp Leu
675 680 685
Asp Glu Ala Gly Ile Thr Thr Ile Pro Phe Ile Pro Pro Ser Val Leu
690 695 700
Lys Glu Leu Pro Tyr Ala Lys Leu Pro Lys Leu Lys Thr Ile Ser Thr
705 710 715 720
Gly Gly Glu Glu Leu Pro Ala Asp Leu Val Arg Ile Trp Gly Ala Asn
725 730 735
Arg Thr Phe Leu Asn Ala Tyr Gly Pro Thr Glu Thr Thr Val Asp Ala
740 745 750
Ser Ile Gly Asn Cys Val Glu Met Thr Asp Lys Pro Ser Ile Gly Thr
755 760 765
Pro Thr Val Asn Lys Arg Ala Tyr Ile Leu Asp Gln Tyr Gly His Ile
770 775 780
Gln Pro Ile Gly Val Pro Gly Glu Leu Cys Val Gly Gly Glu Gly Val
785 790 795 800
Ala Arg Gly Tyr Leu His Arg Pro Glu Leu Thr Asp Glu Lys Phe Val
805 810 815
Asn Asp Pro Tyr Val Pro Asn Gly Arg Met Tyr Lys Thr Gly Asp Leu
820 825 830
Ala Arg Trp Leu Pro Asp Gly Thr Ile Glu Phe Leu Gly Arg Met Asp
835 840 845
Gly Gln Val Lys Ile Arg Gly Phe Arg Ile Glu Leu Gly Glu Ile Glu
850 855 860
Ala Arg Leu Asn Gln Ala Pro Ser Val Lys Gln Ala Val Val Leu Ala
865 870 875 880
Arg Ser Gly Glu Gln Lys Gln Val Tyr Leu Cys Ala Tyr Leu Val Thr
885 890 895
Asp Asn Asp Leu Lys Val Ser Ala Leu Arg Lys Glu Leu Ser Gln Thr
900 905 910
Leu Pro Asp Tyr Met Ile Pro Ser Phe Phe Ile Lys Val Glu Lys Ile
915 920 925
Pro Val Thr Val Asn Gly Lys Ile Asp Lys Lys Ala Leu Pro Glu Pro
930 935 940
Glu Lys Glu Val Glu Leu Gln Thr Glu Tyr Val Ala Pro Thr Asn Pro
945 950 955 960
Thr Glu Glu Ile Leu Val Gln Ile Trp Gln Lys Val Leu Gly Met Glu
965 970 975
Arg Val Gly Ile Glu Asp Asn Phe Phe Glu Leu Gly Gly His Ser Ile
980 985 990
Lys Ala Met Met Leu Ala Ser Asn Ile Tyr Lys Glu Leu Lys Ile Asp
995 1000 1005
Leu Pro Leu Arg Glu Ile Phe Lys His Thr Thr Val Lys Glu Met
1010 1015 1020
Ala Arg Phe Ile Asp Gly Arg Asp Glu Glu Glu Tyr Val Gly Ile
1025 1030 1035
Gln Pro Ala Ala Lys Gln Glu Tyr Tyr Pro Val Ser Ser Ala Gln
1040 1045 1050
Lys Arg Met Tyr Val Ile Gln Ser Leu Glu Asp Lys Ala Gln Gly
1055 1060 1065
Thr Ser Tyr Asn Met Pro Ser Phe Tyr Lys Met Lys Gly Ser Val
1070 1075 1080
Asp Ala Glu Lys Leu Glu Lys Val Phe Gln Thr Leu Leu Asp Arg
1085 1090 1095
His Glu Ser Leu Arg Thr Ser Phe His Met Ile Glu Glu Gln Leu
1100 1105 1110
Val Gln Lys Val His Glu Gln Val Ser Trp Lys Met Asp Met Lys
1115 1120 1125
Thr Val Ser Ala Asn Asp Val Ser Arg Leu Lys Asp Ser Phe Val
1130 1135 1140
Gln Pro Phe Asp Ile Ser Thr Ala Pro Leu Phe Arg Ala Ser Leu
1145 1150 1155
Leu Thr Ile His Lys Asp Glu His Ile Leu Met Met Asp Val His
1160 1165 1170
His Ile Val Gly Asp Gly Val Ser Thr Thr Ile Leu Phe Gln Glu
1175 1180 1185
Leu Ile Gln Leu Tyr Gln Gly Gln Ala Leu Pro Glu Val Lys Val
1190 1195 1200
His Tyr Lys Asp Tyr Ala Val Trp Gln Leu Ser Gln Gln Asp Arg
1205 1210 1215
Leu Lys Glu Ser Glu Asn Phe Trp Leu Gln Gln Phe Ser Gly Glu
1220 1225 1230
Leu Pro Val Leu Glu Leu Pro Thr Asp Tyr Ser Arg Pro Pro Ile
1235 1240 1245
Arg Arg Leu Glu Gly Glu Tyr Val Ser Gln Ser Leu Arg Gly Asp
1250 1255 1260
Leu His Glu Ser Val Lys Ala Phe Met Lys Asn His Glu Val Thr
1265 1270 1275
Leu Tyr Met Val Leu Leu Ala Thr Tyr Asn Val Leu Leu His Lys
1280 1285 1290
Tyr Thr Asn Gln His Asp Ile Ile Val Gly Thr Pro Val Ser Asp
1295 1300 1305
Arg Pro His Pro Asp Val Met Ser Thr Val Gly Met Phe Val Asn
1310 1315 1320
Thr Leu Ala Val Arg Asn Gln Leu Glu Ser Glu Gln Thr Phe Glu
1325 1330 1335
Lys Phe Leu Ala Asn Val Lys Asn Lys Met Leu Glu Val Tyr Gly
1340 1345 1350
His Gln Glu Tyr Pro Phe Glu Asp Val Ile Glu Lys Val Lys Val
1355 1360 1365
Gln Arg Asp Thr Ser Arg His Pro Leu Phe Asp Thr Met Phe Gly
1370 1375 1380
Val Gln Asn Leu Glu Ile Ser His Val Glu Leu Pro Asp Trp Gly
1385 1390 1395
Ile Glu Ala Leu Asp Ile Asp Trp Thr Asn Ser Lys Phe Asp Met
1400 1405 1410
Ser Trp Met Val Phe Glu Ala Asp Gly Leu Glu Ile Gly Val Glu
1415 1420 1425
Tyr Ser Thr Ser Leu Phe Glu Arg Asn Thr Ile Gln Arg Met Ile
1430 1435 1440
Gly His Phe Glu His Ile Ile Glu Gln Ile Met Glu Asn Pro Gln
1445 1450 1455
Ile Arg Leu Ala Asp Ile Gln Leu Thr Thr Glu Asp Glu Arg Ile
1460 1465 1470
Gln Ile Leu Glu Glu Phe Asn His Gln Pro Thr Lys Ile Thr Tyr
1475 1480 1485
Asp Gln Ala Ile Gln Asn Arg Phe Glu Glu Gln Ala Met Lys Thr
1490 1495 1500
Pro Asp Ala Val Ala Leu Val Tyr Lys Gly Gln Glu Leu Thr Tyr
1505 1510 1515
Arg Glu Leu Asn Gln Arg Ser Asn Gln Met Ala Arg Thr Leu Arg
1520 1525 1530
Glu His Gly Val Gly Arg Asp Gln Ile Ile Ala Val Met Ile Asn
1535 1540 1545
Arg Ser His Glu Leu Ile Ile Ser Ile Leu Ala Val Leu Lys Ala
1550 1555 1560
Gly Gly Ala Tyr Leu Pro Ile Asp Pro Thr Tyr Pro Leu Asp Arg
1565 1570 1575
Ile Glu His Met Leu Glu Asp Ser Gln Thr Ala Met Leu Leu Thr
1580 1585 1590
Gln Lys Glu Ile Gln Ile Pro Thr Gly Tyr Ser Gly Glu Val Leu
1595 1600 1605
Phe Val Asp Gln Ala Asp Ile Tyr His Glu Asp Ala Thr Asp Leu
1610 1615 1620
Ser Ser Met Asn Gln Pro Ala Asp Leu Ala Tyr Ile Ile Tyr Thr
1625 1630 1635
Ser Gly Ser Thr Gly Lys Ser Lys Gly Val Met Ile Glu His Arg
1640 1645 1650
Ser Leu His Asn Leu Ile His Ile Ser His Pro Tyr Lys Met Gly
1655 1660 1665
Ala Gly Ser Arg Val Leu Gln Phe Ala Ser Ser Ser Phe Asp Ala
1670 1675 1680
Ser Val Ala Glu Ile Phe Pro Ala Leu Leu Thr Gly Ser Thr Leu
1685 1690 1695
Tyr Ile Glu Glu Lys Glu Glu Leu Leu Thr Asn Leu Val Pro Tyr
1700 1705 1710
Leu Leu Glu Asn Gln Ile Thr Thr Val Ala Leu Pro Pro Ser Leu
1715 1720 1725
Leu Arg Ser Val Pro Tyr Arg Glu Leu Pro Ala Leu Glu Cys Ile
1730 1735 1740
Val Ser Val Gly Glu Ala Cys Thr Phe Asp Ile Val Gln Thr Trp
1745 1750 1755
Gly Gln Asn Arg Thr Phe Ile Asn Gly Tyr Gly Pro Thr Glu Ser
1760 1765 1770
Thr Val Cys Ser Ala Phe Gly Val Val Thr Ala Glu Asp Lys Arg
1775 1780 1785
Ile Thr Ile Gly Lys Pro Phe Pro Asn Gln Lys Val Tyr Ile Ile
1790 1795 1800
Asn Glu Asn Gln Gln Leu Gln Pro Ile Gly Val Pro Gly Glu Leu
1805 1810 1815
Cys Ile Ala Gly Ala Gly Leu Ser Arg Gly Tyr Leu Asn Arg Pro
1820 1825 1830
Glu Leu Thr Gln Glu Lys Phe Val Asn Asn Pro Phe Ala Pro Gly
1835 1840 1845
Glu Arg Met Tyr Lys Thr Gly Asp Val Ala Arg Trp Leu Pro Asp
1850 1855 1860
Gly Asn Ile Glu Tyr Ala Gly Arg Met Asp Asp Gln Val Lys Val
1865 1870 1875
Arg Gly Asn Arg Val Glu Leu Gly Glu Val Thr Ser Gln Leu Leu
1880 1885 1890
Thr His Pro Ser Ile Thr Glu Ala Val Val Val Pro Ile Val Asp
1895 1900 1905
Thr His Gly Ala Thr Thr Leu Cys Ala Tyr Phe Ile Glu Asp Lys
1910 1915 1920
Glu Val Lys Val Asn Asp Leu Arg His His Leu Ala Lys Ala Leu
1925 1930 1935
Pro Glu Phe Met Ile Pro Thr Tyr Phe Ile Lys Val Asp His Ile
1940 1945 1950
Pro Leu Thr Gly Asn Gly Lys Val Asn Lys Gln Ala Leu Pro Asp
1955 1960 1965
Pro Ser Glu Phe Ile Ser Ala Gln Thr Gly His Glu Ile Val Ala
1970 1975 1980
Pro Ser Ser Gln Asp Glu Glu Ile Leu Val Gln Val Trp Glu Glu
1985 1990 1995
Val Leu Gln Phe Lys Pro Ile Gly Val Glu Asp Asn Phe Phe Glu
2000 2005 2010
Arg Gly Gly Asp Ser Ile Lys Ala Leu Gln Ile Val Ala Arg Leu
2015 2020 2025
Ser Lys Tyr Asn Arg Lys Leu Asp Ser Arg His Ile Phe Lys Asn
2030 2035 2040
Pro Thr Ile Ser Met Leu Ala Pro Tyr Leu Glu Gln Arg Gly Ala
2045 2050 2055
Leu Ile Glu Gln Asp Ser Ile Glu Gly Glu Val Pro Leu Thr Pro
2060 2065 2070
Ile Gln Ser Trp Phe Phe Glu Gln Pro Phe Val Tyr Pro His His
2075 2080 2085
Phe Asn Gln Ser Met Leu Leu Pro Asn Glu Gln Gly Trp Asp Arg
2090 2095 2100
Gln Arg Ile Glu Gln Ala Phe Thr Thr Ile Val Arg His His Asp
2105 2110 2115
Ala Leu Arg Met Lys Tyr Gln Phe Arg Glu Lys Ile Ile Gln Glu
2120 2125 2130
Asn Gln Gly Ile Glu Gly Glu Phe Phe Thr Leu His Glu Val Asp
2135 2140 2145
Val Thr Lys Glu Arg Asp Trp Gln Met Arg Ile Glu Gln Glu Ala
2150 2155 2160
Asn Gln Leu Gln Ala Ser Phe Asp Leu Thr Thr Gly Pro Leu Val
2165 2170 2175
Lys Leu Gly Leu Tyr His Thr Ala Tyr Gly Asp Tyr Leu Leu Ile
2180 2185 2190
Val Val His His Leu Leu Ile Asp Gly Val Ser Trp Arg Ile Leu
2195 2200 2205
Leu Glu Asp Phe Gln Thr Leu Tyr Glu Gln Lys Gly Glu Leu Pro
2210 2215 2220
Ala Lys Thr Thr Ser Phe Lys Ala Trp Ala Val Gln Leu Glu Gly
2225 2230 2235
Tyr Ala Arg Ser Lys Lys Leu Gln Asp Glu Ala Ser Tyr Trp Lys
2240 2245 2250
Gly Leu Leu Asn Lys Ser Ile Arg Glu Leu Pro Ala Asp Lys Glu
2255 2260 2265
Ser Ser Asp Thr Phe Leu Phe Gly Asp Thr Lys Glu Val Gln Leu
2270 2275 2280
Thr Phe Asp Ile Asn Glu Thr Gln Asp Leu Leu Thr Asp Ala His
2285 2290 2295
His Ala Tyr Lys Thr Lys Ala Asp Asp Leu Leu Leu Ala Ala Leu
2300 2305 2310
Val Leu Ser Ile Asn Glu Trp Thr Lys Gln Ser Asp Ile Ile Val
2315 2320 2325
Asn Leu Glu Gly His Gly Arg Glu Thr Ile Gly Glu Gly Ile Asp
2330 2335 2340
Leu Ser Arg Thr Ile Gly Trp Phe Thr Thr Ile Tyr Pro Val Leu
2345 2350 2355
Phe Glu Val Glu Asn His Gln Leu Ser Ser Val Ile Lys His Val
2360 2365 2370
Lys Glu Thr Leu Arg Asn Val Pro Asn Asn Gly Ile Gly Phe Gly
2375 2380 2385
Ile Leu Gln His Met Ser His Ser Asp Val Ser Gln Ser Gln Leu
2390 2395 2400
Ser Ser His His Ile Ser Phe Asn Tyr Leu Gly Gln Met Gly Glu
2405 2410 2415
Asp Ser Ala Ser Gln Ser Glu Thr Asp Asn Gly Val Leu Ile Asn
2420 2425 2430
Thr Gly Asp Gln Ile Ser Pro Met Asn Ala Asn Pro Gly Ser Leu
2435 2440 2445
Asn Met Thr Cys Leu Val Met Asn Asn Thr Leu Leu Val Thr Phe
2450 2455 2460
Asp Tyr Asn Pro Gln Arg Tyr Glu Gln Glu Thr Ile Gln Arg Leu
2465 2470 2475
Ala Asp Arg Tyr Lys Ser Asn Leu Lys Ala Val Leu Asp His Cys
2480 2485 2490
Val Gln Arg Glu Gln Thr Glu Arg Thr Pro Ser Asp Phe Ser Thr
2495 2500 2505
Lys Lys Leu Ser Leu Glu Asp Leu Asp Asp Val Phe Ala Thr Leu
2510 2515 2520
Lys Asn Leu
2525
<210> 27
<211> 2491
<212> PRT
<213> Artificial
<220>
<223> artificial sequence
<400> 27
Met Ile Asn Thr Ser Asp Val Lys Asp Ile Tyr Ser Leu Ser Pro Met
1 5 10 15
Gln Arg Gly Met Leu Phe His Thr Leu Lys Asp Lys Glu Asn Leu Ala
20 25 30
Tyr Phe Asp Gln Thr Thr Phe Gln Ile Glu Gly Asp Ile Cys Val Glu
35 40 45
Ser Leu Glu Lys Ser Phe Asn Glu Leu Ile Arg Lys Tyr Asp Val Leu
50 55 60
Arg Thr Ile Phe Leu Tyr Gln Lys Leu Lys Glu Pro Met Gln Val Val
65 70 75 80
Leu Lys Glu Arg Thr Ala Asn Ile His Tyr Glu Asp Phe Ser Met Lys
85 90 95
Ser Glu Ser Asp Lys Ala Lys Ala Leu Arg Val Ala Lys Gln Arg Asp
100 105 110
Arg Asp Glu Gly Phe Asp Leu Ser Arg Asp Ile Leu Met Arg Leu Ser
115 120 125
Leu Leu Lys Val Ala Pro Asn Gln Tyr Glu Leu Val Ile Ser Ser His
130 135 140
His Ile Ile Ile Asp Gly Trp Cys Thr Gly Ile Leu Tyr Gln Glu Leu
145 150 155 160
Phe Tyr Phe Tyr Gln Cys Phe Val Ala Asn Gln Pro Ile Pro Ala Glu
165 170 175
Lys Ser Ile Pro Tyr Ser Arg Tyr Ile Arg Trp Leu Glu Glu Gln Asp
180 185 190
Glu Glu Glu Gly Lys Ala Tyr Trp Gly Glu Tyr Leu Gln Asp Phe Glu
195 200 205
Gly Ala Ser Val Ile Pro Lys Gln Asn Ala Lys Gly Glu Lys Glu Val
210 215 220
Cys Ser Ile Asp Lys Val Thr Phe His Phe Asp Lys Lys Leu Thr Glu
225 230 235 240
Glu Leu Val Gln Val Ala Lys Thr Cys Gln Val Thr Ile Ser Thr Leu
245 250 255
Phe Gln Thr Met Trp Gly Ile Leu Leu Gln Lys Tyr Asn Asn Ser Gln
260 265 270
Glu Ala Ile Phe Gly Ser Val Ile Ser Gly Arg Ser Pro Glu Ile Pro
275 280 285
Asp Val Glu Lys Ile Val Gly Ile Phe Ile Asn Thr Ile Pro Val Arg
290 295 300
Ile Arg Thr Leu Asp Lys Gln Thr Phe Lys Glu Leu Leu Ile Gln Val
305 310 315 320
Gln Glu Ala Ser Val Asn Ser Glu Lys Tyr Asn Tyr Leu Thr Leu Ala
325 330 335
Asp Ile Gln Ala Val Thr Gly Ser Asn His Ala Leu Ile His His Ile
340 345 350
Val Ala Phe Glu Asn Phe Pro Ile Ala Ser Asp Ser Phe Val Asp Ser
355 360 365
Ser Asp Ser Asp Ser Glu Glu Leu Lys Val Val Asn Val Ile Asp Asp
370 375 380
His Glu Lys Thr Asn Phe Asp Phe Ser Val Gln Val Gln Leu Asp Thr
385 390 395 400
Glu Leu Leu Val Lys Ile Ser Tyr Asn Gln His Leu Tyr His Arg Ser
405 410 415
Phe Ile Glu Asn Ile Phe His His Leu Gln Gln Ile Ala Gly Ser Ile
420 425 430
Thr His Asn Pro Asp Ile Gln Ile Asn Glu Ile Ala Ile Val Ser Lys
435 440 445
Glu Glu Lys Lys Gln Leu Leu Arg Tyr Ser Thr Pro Ala Lys Ser Asp
450 455 460
Phe Pro Met Asp Lys Thr Ile His Gln Leu Phe Glu Glu Gln Val Ser
465 470 475 480
Arg Thr Pro Glu Gln Ile Ala Val Val Phe Lys Gly Glu Ser Phe Thr
485 490 495
Tyr Arg Glu Leu Asn Glu Lys Ala Asn Gln Leu Ala Trp Val Leu Arg
500 505 510
Lys Arg Glu Val Arg Pro Asn Glu Ile Val Ala Ile Met Ala Glu His
515 520 525
Ser Leu Glu Met Leu Val Gly Val Ile Gly Thr Leu Lys Ala Gly Ala
530 535 540
Ala Tyr Leu Pro Ile Asp Pro Ser Tyr Pro Glu Lys Arg Ile Ala His
545 550 555 560
Met Leu Gln Asp Ser Lys Ala Glu Gln Leu Leu Ile Gln Pro His Leu
565 570 575
Asn Met Pro Gln Asp Phe Lys Gly Ser Val Leu Trp Leu Thr Glu Glu
580 585 590
Ser Trp Ala Lys Glu Ser Thr Thr Asp Leu Pro Leu Ala Thr Ser Ala
595 600 605
Asn Asp Leu Ala Tyr Met Ile Tyr Thr Ser Gly Ser Thr Gly Leu Pro
610 615 620
Lys Gly Val Met Val Glu His Gln Ala Leu Val Asn Leu Val Met Trp
625 630 635 640
His Asn Glu Ala Phe Gly Val Thr Met Thr Asp Gln Cys Thr Lys Leu
645 650 655
Ala Gly Phe Gly Phe Asp Ala Ser Val Trp Glu Thr Phe Pro Pro Leu
660 665 670
Ile Gln Gly Ala Thr Leu His Val Leu Glu Glu Ser Arg Arg Gly Asp
675 680 685
Ile Tyr Ala Leu His Glu Tyr Phe Glu Lys Asn Ala Ile Thr Ile Ser
690 695 700
Phe Leu Pro Thr Gln Leu Ala Glu Gln Phe Met Glu Leu Thr Ser Ser
705 710 715 720
Thr Leu Arg Val Leu Leu Ile Gly Gly Asp Arg Ala Gln Lys Val Lys
725 730 735
Glu Thr Ser Tyr Gln Ile Ile Asn Asn Tyr Gly Pro Thr Glu Asn Thr
740 745 750
Val Val Thr Thr Ser Gly Gln Leu His Pro Glu Gln Asp Val Phe Pro
755 760 765
Ile Gly Lys Pro Ile Thr Asn His Ser Val Tyr Ile Leu Asp Gln Asn
770 775 780
Arg His Leu Gln Pro Ile Gly Ile Pro Gly Glu Leu Cys Val Ser Gly
785 790 795 800
Ala Gly Leu Ala Arg Gly Tyr Leu Asn Gln Pro Glu Leu Thr Val Glu
805 810 815
Arg Phe Val Asp Asn Pro Phe Val Pro Gly Glu Arg Met Tyr Arg Thr
820 825 830
Gly Asp Leu Val Arg Trp Arg Ile Asp Gly Ser Ile Glu Tyr Leu Gly
835 840 845
Arg Ile Asp Glu Gln Val Lys Ile Arg Gly Tyr Arg Ile Glu Leu Gly
850 855 860
Glu Ile Glu Thr Lys Leu Leu Glu His Pro Ser Ile Ser Glu Ala Leu
865 870 875 880
Val Val Ala Arg Asn Asp Glu Gln Gly Tyr Thr Tyr Leu Cys Ala Tyr
885 890 895
Val Val Ala Thr Gly Ala Trp Ser Val Ser Ser Leu Arg Glu His Leu
900 905 910
Ile Glu Thr Leu Pro Glu Tyr Met Ile Pro Ala Tyr Met Met Glu Val
915 920 925
Glu Lys Met Pro Leu Thr Ala Asn Gly Lys Ile Asp Lys Arg Ala Leu
930 935 940
Pro Val Pro Asp Arg Gln Arg Met Asn Glu Tyr Val Ala Pro Ala Thr
945 950 955 960
Glu Thr Glu Glu Lys Leu Val Leu Leu Phe Gln Glu Ile Leu Gly Leu
965 970 975
Glu Arg Ile Gly Thr Lys Asp His Phe Phe Glu Leu Gly Gly His Ser
980 985 990
Leu Lys Ala Met Met Leu Val Ser Arg Met His Lys Glu Leu Gly Val
995 1000 1005
Asp Val Gln Leu Asn Glu Met Phe Ala Arg Pro Thr Val Lys Asp
1010 1015 1020
Leu Ser Ala Tyr Ile Asp Gln Met Asn Gly Ser Ala Tyr Thr Ala
1025 1030 1035
Ile Gln Pro Val Glu Glu Gln Pro Tyr Tyr Pro Val Ser Phe Ala
1040 1045 1050
Gln Arg Arg Met Tyr Val Val Gln Gln Met Arg Asp Ser Glu Thr
1055 1060 1065
Thr Ser Tyr Asn Met Pro Phe Thr Phe Glu Leu Lys Gly Lys Leu
1070 1075 1080
His Leu Asp Lys Leu Arg Glu Ala Leu Gln Ile Leu Val Leu Arg
1085 1090 1095
His Glu Ser Leu Arg Thr Ser Phe His Met Ile Asp Glu Asn Leu
1100 1105 1110
Val Gln Lys Val Asn Lys Asp Ile Ser Trp Asp Leu Glu Val Ile
1115 1120 1125
Glu Ala Gln Glu Ser Glu Ile Glu Val Lys Leu Glu Glu Phe Ile
1130 1135 1140
Arg Pro Phe His Leu Ser Glu Ala Pro Leu Phe Arg Ala Arg Leu
1145 1150 1155
Ile Cys Leu Asn Pro Gln His His Leu Leu Ser Leu Asp Met His
1160 1165 1170
His Ile Ile Ser Asp Gly Val Ser Met Asn Leu Phe Leu Gln Glu
1175 1180 1185
Phe Met Thr Leu Tyr Gln Gly Glu Ala Leu Pro Ala Leu Ser Ile
1190 1195 1200
Gln Tyr Lys Asp Tyr Ala Val Trp Gln Gln Ser Asp Lys Gln Arg
1205 1210 1215
Ala Arg Leu Lys Glu Gln Glu Lys Tyr Trp Leu His His Phe Ser
1220 1225 1230
Gly Glu Leu Pro Thr Leu Glu Leu Pro Thr Asp Phe Pro Arg Pro
1235 1240 1245
Ala Ile Gln Gln Phe Asp Gly Asp Glu Trp Ala Phe Glu Met Asn
1250 1255 1260
Ala Asp Leu Leu Ala Lys Val Lys Gln Ile Cys Ser Ser Gln Gly
1265 1270 1275
Thr Thr Leu Tyr Met Thr Leu Leu Ala Ala Tyr Gln Val Phe Leu
1280 1285 1290
Ala Arg Tyr Thr Gly Gln Glu Asp Ile Ile Val Gly Ser Pro Ile
1295 1300 1305
Ala Gly Arg Ser His Ala Asp Leu Glu Asn Met Ile Gly Met Phe
1310 1315 1320
Val Asn Thr Leu Ala Leu Arg Gly Lys Pro Lys Ala Asp Gln Ser
1325 1330 1335
Phe Leu Ser Tyr Leu Lys Gln Val Lys Glu Thr Val Phe Gln Ala
1340 1345 1350
Tyr Ala Asn Ala Glu Tyr Pro Phe Glu Glu Leu Ile Glu Lys Leu
1355 1360 1365
Asp Leu Glu Arg Asp Met Ser Arg His Pro Leu Phe Asp Thr Leu
1370 1375 1380
Phe Ser Leu Gln Asn Met Glu Ile Ser Glu Phe Gln Met Asn Asn
1385 1390 1395
Leu Glu Ile Phe Pro Tyr Glu Thr Gly Gln Lys Asn Ala Lys Phe
1400 1405 1410
Ala Leu Ser Trp Leu Ile Ala Glu Gly Glu Ser Leu Tyr Val Thr
1415 1420 1425
Ile Glu Tyr Ser Thr Lys Cys Phe Lys Arg Glu Thr Ile Lys Arg
1430 1435 1440
Met Ala Ser His Phe Glu Gln Leu Leu Ala Gln Ile Val Glu Gln
1445 1450 1455
Pro Glu Ala Arg Ile Gly Gln Leu Glu Leu Val Ala Asp Ala Glu
1460 1465 1470
Arg Lys Met Leu Leu Glu Asp Phe Asn Leu Thr Lys Val Asp Tyr
1475 1480 1485
Pro Arg Glu Lys Thr Ile Gln Glu Leu Phe Glu Glu Gln Val Asp
1490 1495 1500
Lys Asn Pro Asp Gln Ile Ala Leu Ile Cys Gly Glu Gln Gln Phe
1505 1510 1515
Thr Tyr Glu Gln Leu Asn Val Lys Phe Asn Gln Leu Ala His Val
1520 1525 1530
Leu Arg Arg Glu Gly Val Gln Pro Asn Gln Val Ile Gly Leu Ile
1535 1540 1545
Thr Asp Arg Ser Leu Ser Met Ile Val Gly Ile Phe Gly Ile Ile
1550 1555 1560
Lys Ala Gly Gly Gly Tyr Leu Pro Ile Asp Pro Thr Tyr Pro Thr
1565 1570 1575
Glu Arg Ile Glu Tyr Met Leu Glu Asp Ser Gln Thr His Leu Leu
1580 1585 1590
Leu Val Gln His Arg Asp Met Val Pro Ala Gly Tyr Gln Gly Glu
1595 1600 1605
Val Leu Ile Ile Glu Asp Glu Ile Ser Arg Asp Glu Gln Val Ala
1610 1615 1620
Asn Ile Glu Leu Ile Asn Gln Pro Gln Asp Leu Ala Tyr Val Met
1625 1630 1635
Tyr Thr Ser Gly Ser Thr Gly Lys Pro Lys Gly Asn Leu Thr Thr
1640 1645 1650
His Arg Asn Ile Ile Lys Thr Val Cys Asn Asn Gly Tyr Ile Glu
1655 1660 1665
Ile Thr Thr Glu Asp Arg Leu Leu Gln Leu Ser Asn Tyr Ala Phe
1670 1675 1680
Asp Gly Ser Thr Phe Asp Ile Phe Ser Ser Leu Leu His Gly Ala
1685 1690 1695
Thr Leu Val Leu Val Pro Lys Glu Val Ile Leu Asn Pro Thr Asp
1700 1705 1710
Leu Ile Thr Leu Ile Arg Glu Gln Gln Ile Thr Val Ser Phe Met
1715 1720 1725
Thr Thr Ser Leu Phe Asn Ala Leu Val Glu Leu Asp Val Ser Ser
1730 1735 1740
Phe Gln Asn Met Arg Lys Ile Ala Phe Gly Gly Glu Lys Ala Ser
1745 1750 1755
Phe Lys His Val Glu Lys Ala Leu Asp Phe Leu Gly Asn Gly Arg
1760 1765 1770
Leu Val Asn Gly Tyr Gly Pro Thr Glu Thr Thr Val Phe Ala Thr
1775 1780 1785
Thr Tyr Thr Val Asp Glu Arg Ile Lys Glu Trp Gly Ile Ile Pro
1790 1795 1800
Ile Gly Arg Pro Leu His Asn Thr Thr Val His Ile Leu Ser Ala
1805 1810 1815
Asp Asp Lys Leu Gln Pro Ile Gly Val Ile Gly Glu Leu Cys Val
1820 1825 1830
Ser Gly Glu Gly Leu Ala Arg Gly Tyr Leu Asn Leu Pro Glu Leu
1835 1840 1845
Thr Met Glu Arg Phe Val Glu Asn Pro Phe Arg Pro Gly Glu Arg
1850 1855 1860
Met Tyr Arg Thr Gly Asp Leu Ala Arg Trp Leu Pro Asp Gly Val
1865 1870 1875
Leu Glu Tyr Val Gly Arg Lys Asp Glu Gln Val Lys Ile Arg Gly
1880 1885 1890
His Arg Ile Glu Leu Ser Glu Ile Glu Thr Arg Ile Leu Glu His
1895 1900 1905
Pro Ala Ile Ser Glu Thr Val Leu Leu Ala Lys Arg Asn Glu Gln
1910 1915 1920
Gly Ser Ser Tyr Leu Cys Ala Tyr Ile Val Ala His Gly Gln Trp
1925 1930 1935
Asn Ile Gln Glu Leu Arg Lys His Val Arg Asp Val Leu Pro Glu
1940 1945 1950
His Met Val Pro Ser Tyr Phe Ile Gly Leu Asp Lys Leu Pro Leu
1955 1960 1965
Thr Ser Asn Gly Lys Val Asp Lys Arg Ala Leu Pro Glu Pro Glu
1970 1975 1980
Gly Ser Leu Gln Leu Thr Arg Glu Ile Val Ala Pro Arg Asn Glu
1985 1990 1995
Ser Glu Lys Gln Leu Val Glu Ile Val Ala Glu Val Leu Gly Leu
2000 2005 2010
Glu Ala Ser Glu Ile Ser Ile Thr Asp Asn Leu Phe Glu Leu Gly
2015 2020 2025
Gly His Ser Leu Thr Ile Leu Arg Ile Leu Ala Lys Val His Thr
2030 2035 2040
Cys Asn Trp Lys Leu Glu Met Lys Asp Phe Tyr Asn Cys Lys Asn
2045 2050 2055
Leu Glu Glu Ile Ala Ser Lys Ala Thr Asp Met Gln Glu Asn Gln
2060 2065 2070
Asn Leu Ser Gly Ser Gly Ser Val Phe Lys Lys Gly Gly Lys Lys
2075 2080 2085
Ser Ile Pro Val Val Pro Val His Asp Arg Gln Lys Glu Met Glu
2090 2095 2100
His Val Leu Leu Leu Gly Ser Thr Gly Phe Leu Gly Ile His Leu
2105 2110 2115
Leu His Glu Leu Leu Gln Lys Thr Glu Ala Thr Ile Leu Cys Val
2120 2125 2130
Ile Arg Ala Glu Asn Asp Glu Ala Ala Met Gln Arg Leu Arg Lys
2135 2140 2145
Lys Ile Asp Phe Tyr Phe Thr Ser Gln Tyr Ser Ser Ser Gln Ile
2150 2155 2160
Asp Glu Trp Phe Thr Arg Ile Gln Ile Ile His Gly Asp Ile Thr
2165 2170 2175
Gln Ala Asn Phe Gly Leu Glu Ala Lys His Tyr Glu Ser Leu Gly
2180 2185 2190
Ala Ile Val Asp Thr Val Ile His Thr Ala Ala Leu Val Lys His
2195 2200 2205
Tyr Gly His Tyr Glu Glu Phe Glu Arg Ala Asn Val His Gly Thr
2210 2215 2220
Gln Gln Val Val Thr Phe Cys Leu Asn Asn Lys Leu Pro Met His
2225 2230 2235
Tyr Val Ser Thr Leu Ser Val Ser Gly Thr Thr Val Glu Glu Ala
2240 2245 2250
Thr Glu Leu Val Glu Phe Thr Glu Lys Asp Phe Tyr Val Gly Gln
2255 2260 2265
Asn Tyr Glu Ser Asn Val Tyr Leu Arg Ser Lys Phe Glu Ala Glu
2270 2275 2280
Ala Val Leu Val Gly Gly Met Glu Asn Gly Leu Asp Ala Arg Ile
2285 2290 2295
Tyr Arg Val Gly Asn Leu Thr Gly Arg Phe Gln Asp Gly Trp Phe
2300 2305 2310
Gln Glu Asn Ile Asn Glu Asn Met Phe Tyr Leu Leu Ser Lys Ala
2315 2320 2325
Phe Leu Glu Leu Gly Gly Phe Asp Gln Glu Ile Met Gln Gly Met
2330 2335 2340
Val Asp Leu Thr Pro Ile Asp Ile Cys Ala Gln Ala Ile Ile His
2345 2350 2355
Ile Ile Asn Ser Lys Gly Ile Glu Glu Arg Val Phe His Leu Gln
2360 2365 2370
Asn Pro His Leu Val Thr Tyr Asp Asp Met Tyr Arg Val Phe Glu
2375 2380 2385
Gly Leu Gly Phe Ser Arg Arg Val Gln Ser Arg Glu Asp Val Thr
2390 2395 2400
Arg Glu Leu Asp Val Met Met Ser Gln Gly Asn Glu Lys Leu Phe
2405 2410 2415
Leu Ala Gly Ile Leu Thr Thr Met Leu Asp Asp Val Glu Arg Ala
2420 2425 2430
Glu Gln Phe Asn Val Ala Val Asp Ser Ser Arg Thr Met Gln Leu
2435 2440 2445
Leu Glu Asp Thr Ser Phe Thr Tyr Pro Val Pro Asp Asp Glu Tyr
2450 2455 2460
Leu Arg Lys Leu Ala Met His Met Ile Lys Val Gly Phe Val Thr
2465 2470 2475
Pro Asn His Thr Val Ala Glu Lys Ile Gly Thr Ser Arg
2480 2485 2490
<210> 28
<211> 240
<212> PRT
<213> Artificial
<220>
<223> artificial sequence
<400> 28
Met Ala Val Ile Glu Leu Lys Asn Leu Thr Lys Lys Tyr Asn Glu Val
1 5 10 15
Tyr Ala Val Asp His Leu Asn Ile Glu Val Pro Gln Gly His Ile Tyr
20 25 30
Ala Phe Leu Gly Ser Asn Gly Ala Gly Lys Thr Thr Thr Ile Lys Met
35 40 45
Met Thr Gly Gln Leu Asn Pro Ser Glu Gly Glu Val Leu Phe Leu Gly
50 55 60
Arg Asn Ile Trp Gln Asp Arg Glu Ala Arg Arg Ile Ala Gly Tyr Ala
65 70 75 80
Pro Asp Val Pro Leu Leu His Glu Gly Leu Thr Val Arg Glu Met Val
85 90 95
Arg Phe Val Gly Ala Leu Tyr Gly Ser Asp Glu Asp Leu Asn Lys Arg
100 105 110
Val Asp Thr Leu Leu Glu His Phe Glu Leu Ala Asp Lys Ala Asp Gln
115 120 125
Leu Ile Lys Glu Tyr Ser Leu Gly Met Lys Arg Lys Val Ser Ile Ala
130 135 140
Cys Ala Leu Ile His Arg Pro Lys Ile Leu Leu Leu Asp Glu Val Thr
145 150 155 160
Asn Gly Leu Asp Pro Lys Ala Thr Arg Glu Val Lys Asn Tyr Ile Arg
165 170 175
His Phe Ala Lys Glu Glu Gly Gly Thr Val Phe Ile Thr Thr His Ile
180 185 190
Leu Asp Ile Val Glu Glu Leu Ala Asp Thr Ile Ser Ile Leu His Lys
195 200 205
Gly Lys Ile Lys Val Thr Gly Ser Met Glu Glu Leu Arg His Val Ala
210 215 220
Gly Asn Glu Glu Gly Arg Leu Glu Asp Ile Phe Leu Ser Ala Ile Glu
225 230 235 240
Claims (36)
- 브레비바실러스 종(Brevibacillus sp .)으로부터 분리한 2종 이상의 D-아미노산을 포함하는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 포함하는 사료 첨가물.
- 제1항에 있어서, C-말단 발린의 카복시-말단 -COOH 그룹이 -CH2OH로 환원된 사료 첨가물.
- 제1항에 있어서, C-말단 발린의 카복시-말단 -COOH 그룹이 -CH2OH로 환원되고 펩타이드에 대한 프로테아제 내성을 부여하는 사료 첨가물.
- 제1항에 있어서, 펩타이드가 pH 1.0, pH 13.0에서 안정적이고, 프로테아제 또는 이의 배합물에 내성을 갖는 사료 첨가물.
- 제1항에 있어서, 펩타이드가 서열 번호 1 내지 20 중 하나 이상에서 선택되는 사료 첨가물.
- 제1항에 있어서, 펩타이드가 그람 양성 세균, 그람 음성 세균, 진균, 원생생 물 또는 이의 배합물을 사멸시키는 사료 첨가물.
- 제1항에 있어서, 펩타이드가 브레비바실러스 텍사스포러스(Brevibacillus texasporous)로부터 분리된 사료 첨가물.
- 제1항에 있어서, 펩타이드를 약 0.5 내지 약 100ppm으로 첨가한 사료 첨가물.
- 제1항에 있어서, 펩타이드를 약 6 내지 약 12ppm으로 첨가한 사료 첨가물.
- 제1항에 있어서, 펩타이드를 가금류, 가축, 양식 어류, 게, 새우 및 민물 거북이 중 하나 이상에 사용하도록 개질시킨 사료에 첨가한 사료 첨가물.
- 보리, 콩, 밀, 라이밀(triticale), 호밀 및 옥수수 중에서 선택된 하나 이상의 곡물; 및브레비바실러스 종으로부터 분리한 2종 이상의 D-아미노산을 포함하는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 포함하는 곡물류 동물 사료.
- 브레비바실러스 종으로부터 분리한 2종 이상의 D-아미노산을 포함하는 분리 및 정제된, 열 안정성의 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드 약 1 내지 1000ppm을 포함하는 펩타이드류 사료 첨가물.
- 2종 이상의 D-아미노산을 포함하며 카복시-말단 환원된, pH 및 열 안정성의, 브레비바실러스 종으로부터 분리한 항미생물 펩타이드.
- 열 안정성의, 카복시-말단 환원되고 아미노 말단 메틸화된 펩타이드이고 2종 이상의 D-아미노산을 포함하는 항미생물성 펩타이드를 생성하는 수탁번호 제ATCC PTA-5854호의 미생물 브레비바실러스 텍사스포러스(Brevibacillus texasporous)의 생물학적 순수 배양물.
- 제14항에 따르는 분리 및 정제된 미생물을 포함하는 사료 첨가물.
- 제15항에 있어서, 대용유(milk replacer), 육성용 사료(grower feed), 비육용 사료(finish feed), 예비-포유용 사료(pre-starter feed) 및 포유용 사료(pre-starter feed)로 이루어진 그룹 중에서 선택된 가축용 사료와 혼합한 사료 첨가물.
- 제1항에 따르는 조성물과 동물 사료를 혼합함을 포함하여 동물에서의 체중 증가 효율 및 사료 효율을 증가시키는 방법.
- 제17항에 있어서, 동물 사료를 소, 돼지, 닭, 말, 칠면조, 양, 염소, 양식용 어류, 게, 새우 및 거북이로 이루어진 그룹 중에서 선택된 가축의 사료용으로 개질시킨 방법.
- 제17항에 있어서, 동물 사료를 닭, 칠면조, 오리, 메추라기, 콘월 암탉(Cornish hen) 및 비둘기로 이루어진 그룹 중에서 선택된 조류의 사료용으로 개질시킨 방법.
- 제17항에 있어서, 사료가 곡물, 대두분, 분리대두단백, 분리대두유, 분리대두유지, 탈지유, 어분, 육분, 골분, 혈분, 혈장 단백질, 유장, 쌀겨, 밀겨, 감미료, 미네랄, 비타민, 염 및 목초로 이루어진 그룹 중에서 선택된 방법.
- 제17항에 있어서, 펩타이드의 일일 용량이 동물의 체중 kg당 약 1밀리그람 내지 약 10그람의 범위인 방법.
- 브레비바실러스 종으로부터 분리된, 2종 이상의 D-아미노산을 포함하는, 카복시-말단 환원된, pH 및 열 안정성의 펩타이드를 포함하는, 국소 용도용의 광범위(broad spectrum) 항미생물 화합물.
- 제22항에 있어서, 펩타이드가 서열 Me2Bmt-L-dO-I-V-V-dK-V-dL-K-dY-L-V- CH2OH(서열 번호 1)를 포함하는 항미생물 화합물.
- 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시 말단 환원된 펩타이드를 생성하는 단백질을 발현시키는, BT 오페론의 서열(서열 번호 21) 또는 이의 일부를 갖는 분리 및 정제된 핵산.
- 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시 말단 환원된 펩타이드를 제조하는데 사용된 하나 이상의 효소를 포함하는, BT 오페론 단백질에 대한 하나 이상의 폴리펩타이드 서열(서열 번호 22 내지 28)을 암호화하는 분리 및 정제된 핵산.
- 서열 번호 21에 75% 이상의 상동성을 갖는 분리된 핵산.
- 제26항에 있어서, 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 제조하는 데 사용된 효소인 펩타이드 합성 오페론 단백질에 대한 하나 이상의 폴리펩타이드 서열(서열 번호 22 내지 28)을 암호화하는 핵산.
- 제27항에 있어서, 하나 이상의 BT 오페론 폴리펩타이드가 서열 번호 21로부터 발현되고, 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화 되고 카복시 말단 환원된 펩타이드를 제조하는 데 사용된 하나 이상의 효소를 포함하는 핵산.
- 브레비바실러스 텍사스포러스 E58의 분리 세균주를 포함하는 분리된 세균 샘플.
- 스타필로코쿠스(Staphylococcus), 엔테로코쿠스(Enterococcus), 뉴모코쿠스(Pneumococcus), 바실리(Bacilli), 메타노코쿠스(Methanococcus), 해모필러스(Haemophilus), 아캐오글로버스(Archaeoglobus), 보렐리아(Borrelia), 시네드로십티스(Synedrocyptis), 미코박테리아(Mycobacteria), 슈도모나스(Pseudomonas) 및 이. 콜라이(E. coli)로 이루어진 그룹 중에서 선택된 하나 이상의 세균의 성장을 억제하는, 브레비바실러스 종으로부터 분리된 2종 이상의 D-아미노산을 포함하는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드.
- 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 생성하는 BT 오페론의 서열(서열 번호 21)을 갖는 분리 및 정제된 핵산으로 형질전환시킨 세균.
- 제31항에 있어서, 핵산으로부터 발현된 단백질이 하나 이상의 BT 오페론 단 백질을 포함하는 세균.
- 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 생성하는 BT 오페론의 서열(서열 번호 21)을 갖는 분리 및 정제된 핵산을 포함하는 벡터.
- 제33항에 있어서, 핵산으로부터 발현된 단백질이 하나 이상의 BT 오페론 단백질을 포함하는 벡터.
- 서열 번호 1 내지 20에 대한 75% 초과의 서열 상동성을 갖는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 포함하는 사료 첨가물.
- 약제학적 유효량의, 브레비바실러스 종으로부터 분리된 2종 이상의 D-아미노산을 포함하는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 치료가 필요한 동물에 제공함을 포함하여 대장균증을 치료하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US54056904P | 2004-01-30 | 2004-01-30 | |
US60/540,569 | 2004-01-30 | ||
PCT/US2005/003343 WO2005074626A2 (en) | 2004-01-30 | 2005-01-28 | Compositions, methods and uses for a novel family of peptides |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20070033956A true KR20070033956A (ko) | 2007-03-27 |
Family
ID=34837403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020067017586A KR20070033956A (ko) | 2004-01-30 | 2005-01-28 | 신규 펩타이드 계열의 조성물, 방법 및 용도 |
Country Status (14)
Country | Link |
---|---|
US (2) | US7498404B2 (ko) |
EP (1) | EP1765374A4 (ko) |
JP (1) | JP2008508851A (ko) |
KR (1) | KR20070033956A (ko) |
CN (1) | CN101217970A (ko) |
AU (1) | AU2005209901A1 (ko) |
BR (1) | BRPI0507186A (ko) |
CA (1) | CA2554634A1 (ko) |
EA (1) | EA200601408A1 (ko) |
IL (1) | IL177143A0 (ko) |
MX (1) | MXPA06008503A (ko) |
NO (1) | NO20063521L (ko) |
WO (1) | WO2005074626A2 (ko) |
ZA (1) | ZA200606202B (ko) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8673290B2 (en) * | 2011-03-01 | 2014-03-18 | MYGALAXY Limited Company | Sporulation-deficient B. texasporus cells and methods for efficient and cost-effective inactivation and use thereof |
CN102835591B (zh) * | 2012-08-14 | 2017-09-15 | 北京大北农科技集团股份有限公司 | 一种易消化的哺乳仔猪教槽料及其制备方法 |
PL2900805T3 (pl) | 2012-09-25 | 2023-06-05 | Aquilón Cyl S.L. | Kompozycje probiotyczne i prebiotyczne |
JP6345186B2 (ja) * | 2012-12-17 | 2018-06-20 | エムワイギャラクシー リミテッド カンパニー | 肥満および関連疾患の治療剤としてのbtリポペプチドの使用 |
US20170191118A1 (en) | 2014-06-03 | 2017-07-06 | The Regents Of The University Of California | Non-Invasive Gene Mutation Detection in Lung Cancer Patients |
RU2603623C2 (ru) * | 2014-06-06 | 2016-11-27 | Олег Ильич Эпштейн | Ветеринарная композиция и способ улучшения жизнеспособности животных, стимуляции прироста живой массы млекопитающих и птиц, повышения эффективности иммунизации, профилактики и/или лечения инфекционных заболеваний (варианты) |
ES2802453T3 (es) * | 2016-03-24 | 2021-01-19 | Allflex Europe Sa | Uso de una composición acuosa para la disolución de biomoléculas de una muestra de tejido |
CN106597681A (zh) * | 2017-02-12 | 2017-04-26 | 李忠波 | 一种3d眼镜 |
CN107347792A (zh) * | 2017-07-14 | 2017-11-17 | 叙永县元天生态养殖有限责任公司 | 一种乌骨鸡高山人工饲养方法 |
CN110577910B (zh) * | 2019-09-17 | 2022-02-01 | 南京农业大学 | 一种侧孢短芽孢杆菌、抗菌脂肽及其在农业与食品上的应用 |
CN111280182B (zh) * | 2020-04-01 | 2020-12-01 | 北京工商大学 | 一种活性肽组合物及其应用 |
CN111269865B (zh) * | 2020-04-01 | 2020-12-01 | 北京工商大学 | 一种侧孢短芽孢杆菌菌株s62-9及其用途 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4504471A (en) * | 1982-09-27 | 1985-03-12 | Fujisawa Pharmaceutical Co., Ltd. | Animal growth promotant and method of use for animal growth |
ATE210180T1 (de) * | 1995-01-26 | 2001-12-15 | Novozymes As | Xylanase beinhaltende futterzusätze für tiere |
US5709894A (en) * | 1995-06-07 | 1998-01-20 | Biovance Nebraska | Feed additive for ruminant animals and a method for feeding a ruminant |
DE19909146A1 (de) | 1999-03-03 | 2000-09-28 | Mohamed A Marahiel | Verfahren zur gezielten biologischen Synthese von Peptiden |
CA2337923A1 (en) * | 2000-02-25 | 2001-08-25 | Raymond J. Andersen | Peptide antibiotics |
JP2002058434A (ja) * | 2000-08-21 | 2002-02-26 | Nisshin Shiryo Kk | 動物用飼料添加物 |
US6682762B2 (en) * | 2001-10-09 | 2004-01-27 | Heart-O-Dixie Animal Nutrition, Llc | Poultry and livestock feed additive |
HU227387B1 (en) | 2001-11-20 | 2011-05-30 | Novozymes Adenium Biotech As | Antimicrobial polypeptides from pseudoplectania nigrella |
-
2005
- 2005-01-28 US US11/046,560 patent/US7498404B2/en not_active Expired - Fee Related
- 2005-01-28 KR KR1020067017586A patent/KR20070033956A/ko not_active Application Discontinuation
- 2005-01-28 BR BRPI0507186-0A patent/BRPI0507186A/pt not_active IP Right Cessation
- 2005-01-28 EA EA200601408A patent/EA200601408A1/ru unknown
- 2005-01-28 EP EP05722693A patent/EP1765374A4/en not_active Withdrawn
- 2005-01-28 CA CA002554634A patent/CA2554634A1/en not_active Abandoned
- 2005-01-28 WO PCT/US2005/003343 patent/WO2005074626A2/en active Application Filing
- 2005-01-28 AU AU2005209901A patent/AU2005209901A1/en not_active Abandoned
- 2005-01-28 MX MXPA06008503A patent/MXPA06008503A/es active IP Right Grant
- 2005-01-28 CN CNA2005800095123A patent/CN101217970A/zh active Pending
- 2005-01-28 JP JP2006551608A patent/JP2008508851A/ja active Pending
-
2006
- 2006-07-26 ZA ZA200606202A patent/ZA200606202B/en unknown
- 2006-07-27 IL IL177143A patent/IL177143A0/en unknown
- 2006-08-02 NO NO20063521A patent/NO20063521L/no not_active Application Discontinuation
-
2009
- 2009-03-02 US US12/396,221 patent/US20090175981A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
MXPA06008503A (es) | 2007-01-30 |
EP1765374A4 (en) | 2010-11-03 |
AU2005209901A1 (en) | 2005-08-18 |
CN101217970A (zh) | 2008-07-09 |
CA2554634A1 (en) | 2005-08-18 |
WO2005074626A3 (en) | 2007-09-13 |
US7498404B2 (en) | 2009-03-03 |
WO2005074626A2 (en) | 2005-08-18 |
EA200601408A1 (ru) | 2007-08-31 |
BRPI0507186A (pt) | 2007-06-26 |
EP1765374A2 (en) | 2007-03-28 |
IL177143A0 (en) | 2008-03-20 |
US20060228398A1 (en) | 2006-10-12 |
NO20063521L (no) | 2006-10-26 |
ZA200606202B (en) | 2008-04-30 |
JP2008508851A (ja) | 2008-03-27 |
US20090175981A1 (en) | 2009-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20070033956A (ko) | 신규 펩타이드 계열의 조성물, 방법 및 용도 | |
KR101411144B1 (ko) | 항비만제 및 항비만 식품 | |
BRPI0817312B1 (pt) | Métodos de inibição de uma célula metanógena, e composição farmacêutica | |
CN107109373B (zh) | 新型噬菌体以及包含其的组合物 | |
CN113677799A (zh) | 一种遗传修饰乳酸杆菌及其应用 | |
US20190231828A1 (en) | Methods of microbial treatment of poultry | |
KR102224897B1 (ko) | 신규한 폴리펩타이드 및 이를 포함하는 그람음성균에 대한 항생제 | |
KR102004153B1 (ko) | 갯지렁이 유래의 신규한 더로마신 펩티드 및 이의 용도 | |
ES2788923T3 (es) | Nuevo bacteriófago y composición que comprende al mismo | |
KR102125235B1 (ko) | 닭 대장균 예방 및 치료를 위한 신규 박테리오파지 및 이를 이용한 항균조성물 | |
KR102066920B1 (ko) | 신규한 크로노박터 사카자키 특이 박테리오파지 cs3 및 이를 포함하는 항균 조성물 | |
BRPI0812486B1 (pt) | Cassete de expressão, vetor, microrganismo hospedeiro, linhagem, mistura de proteína ou mosto de fermentação, composição, aditivo nutricional, alimento de animal, e uso de peptídeo | |
JPH08504580A (ja) | 組換え型イヌ胃リパーゼ及び医薬組成物 | |
KR101121077B1 (ko) | 넙치 유래의 항균성 펩타이드인 베타디펜신을 암호화하는 신규한 유전자 및 그의 용도 | |
KR101508693B1 (ko) | 참굴 유래의 새로운 항미생물성 펩타이드 및 이의 용도 | |
CN106967740B (zh) | 一种大肠杆菌融合表达菌丝霉素、其制备方法及应用 | |
US20030059802A1 (en) | Nucleic acid and protein sequences of bovine epidermal growth factor | |
KR102016919B1 (ko) | 신규한 살모넬라균 특이 박테리오파지 sc1 및 이를 포함하는 항균 조성물 | |
KR101842673B1 (ko) | 신규한 살모넬라균 특이 박테리오파지 se1 및 이를 포함하는 항균 조성물 | |
CN114980750A (zh) | 用于抑制细菌毒素以治疗水生动物早期死亡综合征的系统、方法和组合物 | |
CN111087449B (zh) | 一种抗菌肽及其制备方法与应用 | |
CN104761625B (zh) | 防御素mNP-1在促进鸡体重增加中的应用 | |
RU2520738C2 (ru) | ПОЛИНУКЛЕОТИДЫ И ПОЛИПЕПТИДЫ ФАГА φ-mru, И ИХ ПРИМЕНЕНИЕ | |
KR102035802B1 (ko) | 돌돔 유래 pgrp2 단백질 및 이의 용도 | |
KR20120130916A (ko) | 조피볼락 유래의 IL-1β 폴리펩티드 및 이를 유효성분으로 포함하는 어류용 면역증강조성물 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |