KR20070033956A - 신규 펩타이드 계열의 조성물, 방법 및 용도 - Google Patents

신규 펩타이드 계열의 조성물, 방법 및 용도 Download PDF

Info

Publication number
KR20070033956A
KR20070033956A KR1020067017586A KR20067017586A KR20070033956A KR 20070033956 A KR20070033956 A KR 20070033956A KR 1020067017586 A KR1020067017586 A KR 1020067017586A KR 20067017586 A KR20067017586 A KR 20067017586A KR 20070033956 A KR20070033956 A KR 20070033956A
Authority
KR
South Korea
Prior art keywords
leu
glu
val
ile
thr
Prior art date
Application number
KR1020067017586A
Other languages
English (en)
Inventor
이 웨이 지앙
Original Assignee
더 텍사스 에이 앤드 엠 유니버시티 시스템
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 텍사스 에이 앤드 엠 유니버시티 시스템 filed Critical 더 텍사스 에이 앤드 엠 유니버시티 시스템
Publication of KR20070033956A publication Critical patent/KR20070033956A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/345Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Brevibacterium (G)
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K20/00Accessory food factors for animal feeding-stuffs
    • A23K20/10Organic substances
    • A23K20/142Amino acids; Derivatives thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/04Peptides having up to 20 amino acids in a fully defined sequence; Derivatives thereof
    • A61K38/10Peptides having 12 to 20 amino acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/164Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/10Antimycotics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P33/00Antiparasitic agents
    • A61P33/02Antiprotozoals, e.g. for leishmaniasis, trichomoniasis, toxoplasmosis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/04Linear peptides containing only normal peptide links
    • C07K7/08Linear peptides containing only normal peptide links having 12 to 20 amino acids

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Epidemiology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Polymers & Plastics (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Immunology (AREA)
  • Animal Husbandry (AREA)
  • Wood Science & Technology (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Food Science & Technology (AREA)
  • Biotechnology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Virology (AREA)
  • General Engineering & Computer Science (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Feed For Specific Animals (AREA)
  • Fodder In General (AREA)

Abstract

본 발명은 예를 들면, 항미생물제 또는 심지어 사료 첨가물로서 사용되는, 2종 이상의 D-아미노산을 갖는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 포함하는, 브레비바실러스 종으로부터의 신규한 펩타이드 및 이에 관련된 펩타이드의 조성물 및 특성화 방법 및 용도를 포함한다.
사료 첨가물, 항미생물제, 펩타이드, 브레비바실러스 종, 브레비바실러스 텍사스포러스, D-아미노산, BT, 오페론

Description

신규 펩타이드 계열의 조성물, 방법 및 용도{Compositions, methods and uses for a novel family of peptides}
본 발명은 일반적으로 분리 및 정제된 신규한 펩타이드의 분야, 및 보다 특히, 새로이 발견된 생물체인 브레비바실러스 텍사스포러스(Brevibacillus texasporus)로부터의 신규 펩타이드 그룹의 동정, 특성화 및 용도에 관한 것이다.
본 출원은 본원에 참조로 인용된 관련 부분인, 2004년 1월 30일자로 출원된, 미국 가특허출원번호 제60/540,569호에 대한 우선권을 주장한다. 본 발명의 영역을 제한하지 않으면서, 이의 배경은 항생제 및 사료 첨가제와 관련되어 기술된다.
항생제 남용은 광범위한 세균 약물 내성을 초래하였다. 통상적인 항생제에 대한 세균 내성에 의해 유발된 감염과 맞서기 위해 신규한 항생제가 필요하다. 미생물이 경쟁 미생물에 대항하여 화학적 전투를 치르기 위해 매우 다양한 항생제를 생산함이 널리 공지되어 있다.
미생물 기원의 많은 펩타이드 항생제는 비(非)-리보솜성 펩타이드 신타제(NRPS)에 의해 합성되며 이들은 통상적이지 않은 아미노산을 포함한다. NRPS 효 소는 일반적으로 동선상(co-linear) 모듈 구조를 갖는다(문헌[참조: Mootz, et al., 2002]). 개별 모듈의 N-말단에서 C-말단으로의 순서 및 특이성은 당해 펩타이드 생성물의 아미노산 잔기의 순차적 순서 및 실체에 상응한다. 각각의 NRPS 모듈은 특이적 아미노산을 인식하고 단계별 축합을 촉진시켜 성장하는 펩타이드 쇄를 형성한다. 특정 모듈에 의해 인식된 아미노산의 실체는 공지된 특이성의 다른 모듈에 비교하여 예측할 수 있다(문헌[참조: Challis, et al., 2000]). 이러한 엄격한 상관관계 덕택에, 미코박테리움 튜버쿨로시스(Mycobacterium tuberculosis)의 게놈 내의 미코박틴 생합성 오페론의 동정에 의해 입증된 바와 같이, 공지된 구조를 갖는 다수의 미생물 비-리보솜성 펩타이드에 대한 NRPS 요소를 암호화하는 유전자를 동정할 수 있게 되었다(문헌[참조: Quadri, et al., 1998]). 그럼에도 불구하고, 당해 분야는 신규한 항미생물제의 분리, 동정 및 특성화에 대한 지속적인 필요를 인식하고 있다.
사료 첨가제의 예는 당해 분야에 널리 공지되어 있다. 예를 들면, Register에게 허여된 미국 특허 제6,682,762호는 이러한 가금류 및 가축 사료 첨가제를 개시한다. 간략히, 당해 특허는 음식물 전해질 균형을 증가시키기 위해 36중량% 전해질, 조질 식료(roughage) 및 광유를 함유시킨 가금류 및 가축 사료 첨가제 조성물을 교시한다. 전해질 첨가 조성물의 첨가는 계란 생산, 체중, 및 열 스트레스로 인한 폐사 감소와 같은 암탉 사육 성능을 개선한다. 이러한 식단으로 사육한 브로일러(Broiler) 닭은 가공률, 사료 전환 및 체중의 증가를 제공한다. 가금류 및 가축에 대한 이러한 음식물 전해질 사료의 제조 방법 또한 기술되어 있다.
사료 첨가물의 다른 예는 미국 특허 제6,503,544호에서 저자 Nagai 등에 의한 교시인데, 다음의 3가지 성분 (a, (b) 및 (c)로 이루어진 그룹 중에서 선택된 2종 이상의 성분을 포함하는 동물 사료 첨가물을 교시한다: (a) 파인니들(Pine Needle), 산사나무 열매(Hawthorn Fruit), 대두창출(Bighead Atractylodes Rhizome), 자운영 뿌리(Milkvetch Root), 골무꽃 뿌리(Skullcap Root), 탄제린 열매(Tangerine Fruit) 및 민트 시프팅(Mint Sifting); (b) 효모 세포벽 및 락토바실러스 애시도필러스(Lactobacillus acidophilus) 및/또는 엔테로코쿠스 패시움(Enterococcus faecium)을 함유하는 살아있는 세균 제제로 구성된 살아있는 세균 혼합물; 및 (c) 유기산.
사료 첨가물은 또한 진균 및/또는 세균성 발효 부산물을 함유하는 반추동물을 위한 사료 첨가물에 대해 Julien에게 허여된 미국 특허 제5,863,574호에서 교시한 바와 같이 발효 및 기타 공정의 부산물을 포함할 수 있다. 반추동물의 사료 첨가물은 글루탐산 발효 가용물을 제공하는 무수 진균 및/또는 세균성 발효 부산물, 무수 옥수수 발효 가용물 또는 무수 글루탐산 발효 가용물 및 무수 옥수수 발효 가용물의 혼합물을 포함하며, 여기서, 무수 가용물은 약 80°F 이상 및 약 900°F 이하의 온도에서 30중량% 미만의 총 수분 함량으로 건조되어 있다.
발명의 요약
한 양태에서, 본 발명은 브레비바실러스 종(Brevibacillus sp .)으로부터 분리한 2종 이상의 D-아미노산을 포함하는 분리 및 정제된, 열 안정성의, 아미노 말 단-메틸화되고 카복시-말단 환원된 펩타이드를 포함하는 사료 첨가물이다. 당해 펩타이드의 C-말단 발린의 카복시 말단 -COOH 그룹은 -CH2OH로 환원될 수 있으며, 펩타이드에 프로테아제 내성을 부여할 수 있다. 펩타이드 사료 첨가물은 pH 1.0, pH 13.0에서 안정할 수 있으며, 프로테아제 또는 이의 배합물에 내성을 가질 수 있다. 당해 펩타이드의 예는 서열 번호 1 내지 20 중 하나 이상에서 선택될 수 있다(BT 펩타이드로 총칭함). 상기 펩타이드는 그람 양성 세균, 그람 음성 세균, 진균, 원생생물 또는 이의 배합물을 사멸시키는 것으로 밝혀졌다. 당해 펩타이드는 브레비바실러스 텍사스포러스(ATCC PTA-5854)로부터 분리될 수 있으며 약 0.5 내지 약 100ppm으로 사료에 첨가할 수 있다. 한 가지 용법에서, 당해 펩타이드를 약 6 내지 약 12ppm으로 첨가하였고 통계적으로 유의한 성장 자극을 입증하였다.
첨가 펩타이드를 가금류, 가축, 양식 어류, 게, 새우 및 민물 거북이 중 하나 이상에 사용하기 위해 개질시킨 사료에 첨가할 수 있다. 예를 들면, 당해 펩타이드는 곡물류 동물 사료, 예를 들면, 보리, 콩, 밀, 라이밀(triticale), 호밀 및 옥수수 중에서 선택된 하나 이상의 곡물; 및 브레비바실러스 종으로부터 분리된 2종 이상의 D-아미노산을 포함하는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드 중에 포함될 수 있다. 당해 펩타이드류 사료 첨가물은 약 1 내지 1000ppm의, 브레비바실러스 종으로부터 분리된 2종 이상의 D-아미노산을 갖는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 포함할 수 있다. 사실, 본 발명은 임의의 매우 다양한 사료와 함께 사용할 수 있다.
본 발명은 또한 2종 이상의 D-아미노산을 가지며 카복시 말단이 환원된 pH 및 열 안정성의, 브레비바실러스 종으로부터 분리된 항미생물성 펩타이드를 포함한다. 예를 들면, 본 발명은 카복시-말단이 환원된, 열 안정성의, 아미노 말단이 메틸화된 펩타이드이며 2종 이상의 D-아미노산을 포함할 수 있는 항미생물성 펩타이드를 생성하는 미생물 브레비바실러스 텍사스포러스 수탁번호 제ATCC PTA-5854호의 생물학적 순수 배양물을 포함한다. 더욱이, 당해 사료 첨가물은 ATCC PTA-5854의 분리 및 정제된 미생물일 수 있다. 당해 첨가물을 대용유(milk replacer), 육성용 사료(grower feed), 비육용 사료(finish feed), 예비-포유용 사료(pre-starter feed) 및 포유용 사료(pre-starter feed)로 이루어진 그룹 중에서 선택된 가축용 사료와 혼합할 수 있다.
본 발명은 또한 동물 사료에 하나 이상의 BT 펩타이드를 성장 증가에 충분한 유효량으로 제공함으로써, 동물에서 체중 증가 효율 및 사료 효율을 증가시키는 방법을 포함한다. 동물 사료는 예를 들면, 소, 돼지, 닭, 말, 칠면조, 양, 염소, 양식 어류, 게, 새우 및 거북이로 이루어진 그룹 중에서 선택된 가축의 사료로 제공하기에 적합하게 개질되어 있다. 사료의 예로는 또한 예를 들면, 닭, 칠면조, 오리, 메추라기, 콘월 암탉(Cornish hen) 및 비둘기로 이루어진 그룹 중에서 선택된 조류의 사육용 사료가 포함된다. 이와 같이, 사료는 예를 들면, 곡물, 대두분, 분리대두단백, 분리대두유, 분리대두유지, 탈지유, 어분, 육분, 골분, 혈분, 혈장 단백질, 유장, 쌀겨, 밀겨, 감미료, 미네랄, 비타민, 염 및 목초로 이루어진 그룹 중에서 선택될 수 있다. 당해 펩타이드의 일일 용량은 동물의 체중 kg당 약 0.01 내 지 약 10그람의 범위이다.
다른 양태에서, 본 발명은 브레비밥실러스 종으로부터 분리된, 2종 이상의 D-아미노산을 가지며 카복시-말단 환원된, pH 및 열 안정성인 펩타이드를 포함하는 국소 사용을 위한 광범위(broad spectrum)의 항미생물 화합물이다. 예를 들면, 당해 펩타이드는 서열 Me2Bmt-L-dO-I-V-V-dK-V-dL-K-dY-L-V-CH2OH(서열 번호 1) 또는 서열 번호 1 내지 20 중 어느 하나를 가질 수 있다.
다른 양태는 2종 이상의 D-아미노산을 포함하는, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 생성하는 BT 오페론(서열 번호 21)의 서열을 갖는 분리 및 정제된 핵산이다. 하나 이상의 효소를 포함하는 BT 오페론 단백질에 대한 하나 이상의 폴리펩타이드 서열(서열 번호 22 내지 28)을 암호화하는 분리 및 정제된 핵산을 사용하여 2종 이상의 D-아미노산을 포함하는, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 제조한다. 본 발명은 또한 서열 번호 21에 대해 75% 이상의 상동성을 갖는 이들의 분리된 핵산을 포함한다. 보다 특이적으로, 핵산은 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 제조하는데 사용된 효소인, 펩타이드 합성 오페론 단백질에 대한 하나 이상의 폴리펩타이드 서열(서열 번호 22 내지 28)을 암호화할 수 있다. 하나 이상의 BT 오페론 폴리펩타이드는 서열 번호 21로부터 발현되며, 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 제조하는데 사용된 하나 이상의 효소를 포함한다.
본 발명에 사용하기 위한 분리된 세균 샘플은 브레비바실러스 텍사스포러스 E58의 분리된 세균 균주를 포함할 수 있다. 다른 양태는 스타필로코쿠스(Staphylococcus), 엔테로코쿠스(Enterococcus), 뉴모코쿠스(Pneumococcus), 바실리(Bacilli), 메타노코쿠스(Methanococcus), 해모필러스(Haemophilus), 아캐오글로버스(Archaeoglobus), 보렐리아(Borrelia), 시네드로십티스(Synedrocyptis), 미코박테리아(Mycobacteria), 슈도모나스(Pseudomonas) 및 이. 콜라이(E. coli)로 이루어진 그룹 중에서 선택된 하나 이상의 세균의 성장을 억제하는, 브레비바실러스 종으로부터 분리된, 2종 이상의 D-아미노산을 갖는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드이다. 세균을 2종 이상의 D-아미노산을 포함하는, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 생성하는 BT 오페론의 서열(서열 번호 21)을 갖는 분리 및 정제된 핵산으로 형질전환시킬 수 있다. 당해 핵산으로부터 발현된 단백질은 하나 이상의 BT 오페론 단백질 또는 이와 관련된 것들을 포함할 수 있다. 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 생성하는 BT 오페론의 서열(서열 번호 21)을 갖는 분리 및 정제된 핵산을 포함하는 벡터를 변형 또는 분리할 수 있다. 하나 이상의 BT 오페론 단백질을 암호화하는 핵산으로부터 하나 이상의 단백질이 발현될 수 있다. 사료 첨가물은 또한 서열 번호 1 내지 20과 75% 초과의 서열 상동성을 갖는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 포함할 수 있다.
본 발명은 또한 통상적이지 않은 아미노산 및 기타 유형의 변형을 함유하는 펩타이드 및 이들 펩타이드를 합성하는 비-리보솜성 펩타이드 신타제에 관한 것이다. 본 발명은 또한 이들 펩타이드를 제조하는 방법, 및 각종 세균성 감염 및 원생생물성 감염 및 이러한 감염에 관련된 장애; 종양 세포 증식, 성장 및 확산의 치료 및 예방에; 또는 면역 조절제로서 당해 펩타이드를 단독으로 또는 통상의 항생제와 함께 상승작용적으로 사용하는 방법을 포함한다.
본 발명의 특징 및 이점을 보다 완전히 이해하기 위해, 이제부터 본 발명의 상세한 기술과 첨부한 도면을 함께 참조하며, 도면은 다음과 같다:
도 1A는 펩타이드 BT의 정제를 나타내는 겔이다. BT의 트리신 겔 분리 및 관련 항생제 활성. 클로로포름 추출 펩타이드를 미리 성형한 16.5% 트리신 겔(제조사[BioRad]로부터 구입) 상에서 분리시켰다. 한 겔을 쿠마시 블루(coomassie blue)(왼쪽)으로 염색하여 펩타이드 밴드를 나타냈다. 다른 겔(오른쪽)은 바실러스 세레우스(Bacillus cereus)와 함께 매봉한 아가 위에 놓았다. 세균 로온(lawn)에서 투명한 영역은 ~1500의 분자량을 갖는 단일 밴드로 붕괴된 종에 상응한다. 분자량 마커는 다음과 같다: 트리오세포스페이트 아이소머레이즈 26.6kD, 미오글로빈 17.0kD, 알파-락트알부민 14.4kD, 아프로티닌 6.5kD, 인슐린 b 쇄, 산화된 3.5kD 및 바시트라신 1.4kD.
도 1B는 클로로포름-추출 BT의 질량분광분석의 그래프이다. 클로로포름-추출 BT를 염화나트륨을 첨가하여 이온화시킨 후 질량분광 분석에 적용하였다. 5개 의 이온화된 BT 이성체 그룹(BT1555, BT1571, BT1583, BT1599 및 BT1613)을 검출 및 표지하였다.
도 1C는 정제된 BT1583의 질량분광분석의 그래프이다. C18 역상 HPLC의 분획 33을 질량분광 분석에 적용하였다. 오직 수소화된, 나트륨 및 칼륨 이온화된 BT1583만이 검출되었다.
도 2A는 BT1583 직렬 질량분광계 데이타의 그래프이다. 도 2B는 아미노산 조성물 및 MS/MS 실험으로부터 추론된 부분적 BT 1583 서열 구조이다(표 1 및 2)(완전한 모티프 및 서열은 각각 표 5 및 6을 참조한다).
도 3A 내지 3D는 BT NRPS 오페론의 지도이다. 도 3A는 짝쌍에 의해 연결된 2개의 콘티그(contig)로부터의 슈퍼콘티그(supercontig)의 구조도이다. 콘티그 1 및 콘티그 2는 클론으로부터 짝쌍을 공유한다. 콘티그를 순서화하고 정렬하여, 서열분석되지 않은 간극 영역에 의해 분리된 콘티그 1 및 콘티그 2의 서열을 포함하는 슈퍼콘티그를 형성하였다.
도 3B는 본 작업에서 서열분석된 영역 및 당해 영역에서 발견된 9개의 ORF의 지도이다. btA에서 btF까지의 6개의 ORF는 BT NRPS 아단위(BtA, BtB, BtC, BtD, BtE 및 BtF)를 암호화한다.
도 3C는 BT NRPS 아단위의 도메인 조직도이다. 각각의 모듈의 예측된 아미노산 기질 특이성이 각각의 A-도메인에 표시되어 있다.
도 3D는 표 3에 기술된 바와 같은 13개의 결합 포켓(pocket) 구성요소 모두의 다중 서열 정렬의 계통발생 나무이다. 추정의 특이성을 부분적 BT1583 서열을 사용하여 할당하였다. 이는 A-도메인의 이들 결합 포켓이 추정상 동일한 또는 유사한 기질 클러스터(cluster)를 함께 활성화시킴을 나타낸다.
도 3E는 BT 오페론의 핵산 서열이다(서열 번호 21).
도 3F는 BtA의 아미노산 서열이다(서열 번호 22).
도 3G는 BtB의 아미노산 서열이다(서열 번호 23).
도 3H는 BtC의 아미노산 서열이다(서열 번호 24).
도 3I는 BtD의 아미노산 서열이다(서열 번호 25).
도 3J는 BtE의 아미노산 서열이다(서열 번호 26).
도 3K는 BtF의 아미노산 서열이다(서열 번호 27).
도 3L는 BtG의 아미노산 서열이다(서열 번호 28).
도 4A 내지 4E는 각각 보존 모티프의 서열 정렬 및 BT NRPS 모듈로부터의 아데닐화, 축합, 티올화, 에피머화 및 리덕타제 도메인의 정렬이다. 보존 모티프는 문헌[참조: Marahiel, 1997])에 따라 확인하였다. 컨센서스(consensus)를 각각의 정렬 밑에 두었다. 컨센서스와 부합되는 잔기에 검은색 음영을 주었다. 12개 C-도메인 모두를 덜 보존되는 것으로 공지된 출발 C 도메인을 지시하는 * 기호와 함께 배열하였다.
도 5A 내지 5E는 각각 A) 내지 D)로 나열된 ATP-PPi 교환 검정으로부터 수득한 모듈 8, 5, 7, 4 및 2의 정제된 A-도메인 각각의 관련 기질 특이성에 대한 ATP-PPi 교환 검정이다. 최고 활성은 100%로 정의되었다. 20개 모두의 단백원성 아미노산 및 L-Orn을 각각의 검정에서 시험하였고, 배경수준은 통상 1% 이하였다. 특 이적 아미노산에 대한 A-도메인의 겉보기 Km을 아래에 나열하였다.
도 6A는 합성 BT 변이체의 요약이며, 도 6B는 BT 변이체와 상기한 바와 같은 항생제 활성 및 프로나제(Pronase) 내성에 대한 이들의 특성 사이의 상관관계이다.
본 발명의 각종 양태의 제조 및 사용이 아래에 상세히 논의되어 있지만, 본 발명은 매우 다양한 구체적 상황에서 구현될 수 있는 많은 적용가능한 발명적 개념을 제공함을 이해해야 한다. 본원에 논의된 특이적 양태는 단지 본 발명을 제조 및 사용하는 특이적 방법의 예시이며 본 발명의 영역을 제한하지 않는다.
본 발명의 이해를 돕기 위해, 다수의 용어를 아래에 정의하였다. 본원에서 정의된 용어는 본 발명에 관련된 영역의 통상적인 숙련가에 의해 통상적으로 이해되는 의미를 갖는다. 관사와 같은 용어는 단지 단수 자체만을 지칭하고자 하는 것은 아니며, 예시를 위해 사용할 수 있는 구체적 예의 일반적 부류를 포함한다. 본원의 술어는 본 발명의 특이적 양태를 기술하기 위해 사용되었지만, 이들의 사용은 청구항에 약술된 것을 제외하고는 본 발명을 제한하지 않는다.
본원에 사용된 바와 같은 용어 "가축 동물"은 예를 들면, 돼지, 소, 말, 염소, 양, 사슴, 개, 고양이 및 다수의 유용한 설치류 중 임의의 동물을 기술한다. 본원에 사용된 바와 같은 용어 "가금류"는 예를 들면, 닭, 암탉, 메추라기, 칠면조, 뿔닭 등을 포함한다. 본원에 사용된 용어 "양식 어류"는 예를 들면, 잉어, 메기, 석조송어(rainbow trout), 아유(ayu)(은어), 장어, 틸라피아, 붕장어, 연어, 숭어, 붉은 돔, 방어(yellow tail), 가자미, 복어 등을 포함한다. 다수의 기타 동물(예를 들면, 새우 및 참새우) 또한 유용할 것으로 사료된다.
본원에 사용된 바와 같이, 용어 "첨가물" 및 "사료 첨가물"은 가축, 가금류 및 어류의 건강 개선 및 현존하는 건강한 동물의 감소된 또는 낮은 체중 및/또는 증가된 성장률(예를 들면, 체중)로 인한 경제적 손실 감소를 초래하는 사료 첨가물로서 동물 사료와 함께 사용할 수 있다. 예를 들면, 본 발명의 사료 첨가물은 세균 분리물, 부분적 또는 전체적으로 분해된 세균으로부터 사용될 수 있으며, 세균으로부터 분리 및 정제되고/거나 전체 또는 부분적으로 합성적으로 합성될 수 있다. 가축 동물, 가금류 및 어류용 첨가물 또는 사료 첨가물은 분말, 낟알 또는 액상일 수 있으며 사육 조건 및 농장의 설치 및 사육 동물에 따라 사용될 것이다.
적합한 동물 사료에는 예를 들면, 녹색 사료, 사일리지(silage), 건조시킨 녹색 사료, 뿌리, 덩이줄기, 신선한 과일, 낟알 및 씨앗, 양조 낟알(brewer's grain), 즙을 짜낸 찌꺼기(promace), 양조 효모, 증류 폐기 낟알(distiller's spent grain), 제분 부산물, 당, 전분 및 오일 회수물의 생산의 부산물 및 각종 음식물 쓰레기가 포함된다. 본 발명의 사료 첨가물은 단독으로 또는 항산화제 또는 이러한 증강용 사료에 첨가할 수 있는 각종 물질의 혼합물(미네랄 혼합물, 비타민 혼합물)과 같은 기타 널리 공지된 사료 첨가물과 함께 사용할 수 있다. 특이적 사료는 또한 연령 및 발육 단계에 따라 특정한 동물 종에 맞게 개질시킬 수 있다.
본 발명의 펩타이드와 함께 사용하기에 적합한 기본 사료를 사료 제조 분야의 숙련가에게 널리 공지된 바와 같이 제조할 수 있다, 예를 들면, 본원에 참조로 인용된 관련 부분인 문헌[참조: Kirk-Othmer, Encyclopedia of Chemical Technology, 4th Ed. , vol. 10, pp. 288-300, Wiley, N. Y., 1993]에 기술된 바와 같은 것을 사용할 수 있다. 예를 들면, 기본 사료는 다음의 성분 중 하나 이상을 포함할 수 있다: 옥수수, 수수, 보리, 밀, 콩, 땅콩, 캐놀라, 어분, 유제품, 유지, 비타민 및 미네랄.
본 발명자는 NRPS 오페론이 펩타이드 생성물의 특정한 구조 세부 사항을 습득케 하는 정보원일 수 있음을 인지하였다. BT NRPS 오페론의 동정은 BT1583 펩타이드 구조의 결정적 세분을 초래한다. 토양 미생물을 신규한 항생제를 생산하는 균주에 대하여 선별하였다. 바실러스 종 E58(ATCC PTA-5854)을 면역이 위태로운 환자에게서 생명을 위협하는 병원성 감염을 초래하는 스타필로코칼 아우레우스에 대항하는 항생제 BT를 생산하는 이의 능력에 대해 분리하였다. 당해 균주는 브레비바실러스 라테로스포러스(Brevibacillus laterosporus)에 대한 이의 관련성을 기초로 하여 브레비바실러스 텍사스포러스로 명명하였다.
NRPS의 모듈은 펩타이드 생성물을 형성하기 위한 아미노산 전구체의 인식, 활성화, 변형 또는 결합에서 각각 특이적 역할을 수행하는 소단위 또는 "도메인"으로 구성되어 있다. 한 유형의 도메인, 아데닐화(A-) 도메인은 NRPS의 특정 모듈에 의해 통합되는 아미노산의 선택적 인식 및 활성화를 담당한다. 기타 A-도메인의 서열 비교와 함께, 그라미디신(Gramicidin) S NRPS의 PheA 아단위의 A-도메인의 기질-결합 포켓의 분석을 통해 A-도메인에 대한 기질 특이성의 주요 결정인자인 10개의 잔기를 결정할 수 있었다(문헌[참조: Conti, et al., 1997; Stachelhaus, et al., 1999]). 10개의 잔기를 NRPS '코돈'으로 간주하였다. NRPS 코돈 수집은 계속 발견되는 신규한 NRPS 코돈으로 여전히 성장하고 있다. 본 발명은 분리 및 정제된 핵산 및 발린, 라이신, 오르니틴 및 타이로신에 대한 신규한 NRPS 코돈의 그룹에 대해 이에 의해 암호화된 단백질을 포함한다.
아미노산 활성화 단계는 ATP-의존성이며 아미노-아실 아데닐화의 일시적 형성을 포함한다. 활성화된 아미노산은 일반적으로 A-도메인에 인접하여 위치한 다른 유형의 도메인, 티올화(T-) 도메인을 통해 펩타이드 신타제에 공유 결합한다. T-도메인은 보존적 세린 잔기에 포스포판테테이닐 인공 팔의 공유 결합에 의해 해독 후 변형된다. 활성화된 아미노산 기질은 각각의 T-도메인의 포스포판테테이닐 인공 팔에 대한 티오에스테르 결합을 통해 NRPS 상에 고정된다. NRPS의 연속하는 단위에 결합한 아미노산은 다른 유형의 도메인, 축합(C-) 도메인에 의해 촉매화된 아미드 결합의 형성에 의해 연속적으로 서로 공유 결합된다. NRPS 모듈은 또한 때때로 보조 반응, 가장 통상적인 것은 L-형태로부터 D-형태로의 아미노산 기질의 에피머화를 수행하는 부가의 기능적 도메인을 포함할 수 있다. 당해 반응은 일반적으로 주어진 NRPS 모듈의 T-도메인에 인접하여 위치한 에피머화(E-) 도메인으로 지칭되는 도메인에 의해 촉매화된다. 따라서, 통상적인 NRPS 모듈은 다음의 도메인 조직: C-A-T-(E)을 갖는다.
NRPS에 의해 조립된 생성물은 3가지의 다른 상, 즉, 쇄 개시, 쇄 연장 및 쇄 종결을 포함한다(문헌[참조: Keating & Walsh, 1999]). 펩타이드 쇄 개시는 A-도메인 및 T-도메인을 포함하는 "출발자 모듈"로 지칭되는 특수화된 모듈에 의해 수행된다. 연장 모듈은 추가로, A-도메인의 상류에 위치해 있는 C-도메인을 갖는다. 이러한 연장 도메인은 C-도메인에 의한 간섭 때문에 펩타이드 결합 형성을 개시할 수 없음이 실험적으로 증명되었다(문헌[참조: Linne & Marahie, 2000]). 모든 성장 중인 펩타이드 중간체는 연장중인 일련의 아실-S-효소 중간체로서 전좌 중 NRPS에 공유 결합되어 있다. NRPS로부터 성숙한 펩타이드 생성물을 방출시키기 위해, 말단의 아실-S-효소 결합이 깨어져야만 한다. 이러한 과정은 쇄 종결 단계이며 일반적으로 C-말단 티오에스테라제(TE) 도메인에 의해 촉매화된다. NRPS로부터의 성숙한 펩타이드의 티오에스테라제-매개 방출은, 아실-O-TE 중간체의 일시적 형성을 수반하며, 상기 아실-O-TE 중간체는 후에 가수분해되거나 가수분해되고 동시에 환형화되어 성숙한 펩타이드를 방출한다(문헌[참조: Keating, et al., 2001]). 대안적인 종결안은 알콜성 C-말단 잔기를 갖는 펩타이드의 방출을 초래하는, 마지막 NRPS 모듈에 존재하는 리덕타제(R-) 도메인에 의한 결합된 C-말단 잔기의 환원을 포함한다(문헌[참조: Gaitatzis, et al., 2001; Kessler, et al., 2004]). 이러한 리덕타제-매개 종결/C-말단 변형은 BT 생합성 중에 발생하며 BT 펩타이드의 슈퍼 프로테아제 내성에 기여한다.
NRPS 오페론의 동정 및 분리는 펩타이드 항생제의 연구에 유용하였지만, 특이적 NRPS 오페론의 동정은 도전해야 할 과제로 남아 있다. NRPS 오페론의 동정은 전통적으로 공지된 NRPS 유전자로부터의 DNA 프로브를 사용하는 하이브리드화 또는 변성된 프라이머를 사용하는 게놈 DNA의 PCR에 의해 증폭된 유전자 단편에 의해 게놈 BAC 또는 코스미드 라이브러리에서 클론을 동정하면서 시작한다. NRPS의 아미노산 서열이 일반적으로 매우 작기 때문에, 이러한 방법은 성공적일 수 있지만, 프로브 또는 프라이머가 종종 불완전하기 때문에, 일부 NRPS 오페론을 잃을 수 있다. 게다가, 미생물은 흔히 다중 NRPS 오페론을 포함하기 때문에, 프로브 또는 프라이머는 일부 NRPS 오페론을 나타낼 수 있지만, 추구되는 것은 아니다. 이는 종종 부정확한 유전자에 대해 투여된 불행을 초래하는 결과를 초래한다(문헌[참조: Hopwood, 1997]). 신규한 실리카 내 방법에서 본원에 기술한 바와 같이 사용하여 빠르고 정확한 NRPS 오페론의 동정을 가능케 하였다.
물질 및 방법. BT의 부분적 정제, E58B. 텍사스포러스 세포를 3일 동안 37℃ 공기 교반기에서 LB 1 리터 중에서 배양하였다. 배양물을 15분 동안 3000rpm에서 임상용 원심분리기에서 회전시켰다. 상층액을 수집하고 황산암모늄 500그람을 첨가 및 용해시켰다. 샘플을 15분 동안 3000rpm에서 임상용 원심분리기에서 회전시켰다. 펠릿을 증류수 200ml에 용해시켰다. 이어서 용액을 50분 동안 끓인 후 얼음 위에서 냉각시켰다. 샘플을 0.2 마이크론 필터(제조사[Nalgen])로 여과하였다. 여액을 교반 막대를 사용하여 20분 동안 실온에서 클로로포름 0.2 리터와 혼합하였다. 혼합물을 15분 동안 3000rpm에서 임상용 원심분리기에서 원심분리하여 2개의 상으로 분리하였다. 유기상을 수집하고 진공 증발기에서 건조시켰다.
C18 역상 HPLC. 건조된 클로로포름 추출물을 멸균 증류수 2ml에 용해시켰다. 용액을 30% B 내지 55% 용제 B(용제 B는 아세토니트릴 중 0.075% TFA이며, 용제 A는 수중 0.1% TFA이다)의 구배로 C18 역상 HPLC 칼럼 상에서 분획시켰다. 수득된 분획을 건조시키고 멸균 증류수에 용해시키고 플레이트 투명 영역 검정으로 항-에스. 아우레우스 활성에 대해 분석하였다. 피크 분획(분획 33)을 아미노산 조성물, 질량 분광 분석, 직렬 질량 분광 분석 및 키랄성 분석에 적용하였다.
아미노산 조성. 텍사스주의 컬리지 스테이션에 소재하는 텍사스 A&M 대학의 단백질 화학 연구실에서 아미노산 분석을 수행하였다. 샘플을 내부 표준물과 혼합하고, 진공 응축기 내의 유리관에서 건조시키고 페놀의 존재 하에 아르곤 대기하에서 24시간 동안 110℃에서 6N HCl에 의한 증기 상 가수분해에 적용시켰다. 이어서 샘플을 붕산염에 용해시키고 자동 유도화 및 탑재를 위해 휴렛 팩카드 아미노퀀트 II(Hewlett Packard AminoQuant II) 시스템으로 옮겼다. 아미노퀀트는 o-프탈알데하이드(OPA) 및 9-플루오로메틸-클로로포르메이트(FMOC)를 사용하여 가수분해된 샘플의 전(前)-칼럼 유도화에 의해 펩타이드 및 단백질을 분석한다. 유도된 아미노산을 역상 HPLC로 분리하고 다이오드 정렬 검출기를 사용한 UV 흡광도 또는 일렬 형광 검출기를 사용하여 형광에 의해 검출하였다.
질량 분광분석 및 직렬 질량 분광분석. D-형 아미노산 잔기의 검출. BT 내의 아미노산 잔기의 키랄 분석은 버지니아주 리치몬드 소재의 Commonwealth Biotechnologies, Inc.에서 수행하였다. BT를 110℃에서 18시간 동안 진공 중에서 6N HCl에서 가수분해시켰다. 아미노산을 FMOC 아미노산으로 유도하였으며 HPLC 크로마토그래피로 분리하였다. 이어서 각각의 아미노산의 용출 특성을 키랄 칼럼 상에서 결정하였다. 크로마토그래피 칼럼의 유형 둘 다에 대해, 피크는 적합한 표준과 비교하여 확인하였다.
게놈 DNA 제조. 대수기의 E58 세포를 LB 배양액으로부터 수거하고 용해 완충액[10mM 트리스(pH8.0), 100mM EDTA, 0.5% SDS]로 용해시켰다. RNase A를 첨가하여 오염된 RNA를 분해하였다. 게놈 DNA는 페놀/클로로포름을 사용하여 추출한 후 에탄올로 침전시켰다. 건조된 DNA를 TE에 재현탁시키고 분취액을 정성 대조를 위해 0.5% 아가로스 겔에서 전개시켰다.
라이브러리 구축 및 게놈 서열화. E58 게놈 라이브러리 구축, 솟건(shot-gun) 서열화 및 조립은 기관[Agencourt Biosciences Corporation(메사츠세츠주 비벌리 소재)]에서 수행하였다. 간략히, 전체 게놈 라이브러리를 약 5kb의 평균 삽입 길이로 구축하였다. 이러한 클론 10,000개를 삽입물의 말단 둘 다로부터의 자동화 DNA 서열화에 적용시켰다. 16.901개의 연속적으로 서열화된 판독물을 수집하고 조립하였다.
뉴클레오타이드 서열 및 데이타 분석. E58 게놈에 대한 모든 BLAST 분석을 지역 컴퓨터에 설치된 WU BLAST 소프트웨어 팩키지(2.0판)를 사용하여 수행하였다(Gish, W. 1996-2003. http://blast.wustl.edu). 아미노산 서열 상동성 탐색은 기관[National Center for Biotechnology Information(메릴랜드주 베데스다 소재)]의 BLSAT 서버 및 디폴트 매개변수 수치를 갖는 비-중복성(nonredundant)의 단백질 서열 데이타베이스를 사용하여 수행하였다(문헌[참조: Altschul, et al., 1990]). 아미노산 서열 정렬은 기관[Institute of Biology and Chemistry of Proteins(프랑스 리옹 소재)]의 NPS@ 웹 서버에서 운용하는 CLUSTALW 프로그램을 사용하여 수행하였다(문헌[참조: Thompson, et al., 1994]).
BT NRPS 오페론. BT NRPS 오페론(슈퍼콘티그 3)은 46kb 이상의 영역에 고정되어 있는 11개의 콘티그를 포함하였다. 비서열화 영역, 단지 한번 서열화되었던 영역 및 불량한 서열화 질을 갖는 영역이 있었다. 또한, 13개 모듈의 카복실 영역은 슈퍼콘티그 3에 의해 포괄되지 않았다. 3회의 프라이머 연장 서열화 및 1회의 게놈 워킹(walking)을 수행하여 NRPS 오페론을 마무리하였다. 슈퍼콘티그 3 내의 모든 원형 서열화 판독물을 SeqMan(Lasergene, DNASTAR Inc.)을 사용하여 추출 및 재조립하였다. 디폴트 매개변수를 재조립을 위해 사용하였다. SeqMan이 채용한 고 엄격도는 재조립된 슈퍼콘티그 3이 16개의 비서열화 간극을 갖는 17개의 콘티그로 분해되게 하였다. 모든 콘티그는 추가로 단일 범위 및 저질 영역에 대해 수동으로 조사하였다. 프라이머는 간극 내로 서열화되고 단일 범위 및 저질 영역에서 추가의 판독물을 수득하도록 설계하였다. 새로운 서열화 판독물을 원형 판독물과 합하여 새로운 슈퍼콘티그를 형성하였다. 새로운 슈퍼콘티그를 간극, 단일 범위 및 저질 영역에 대해 다시 점검하였다. 3회의 이러한 프라이머 연장 및 조립 후, 추정의 BT NRPS 오페론을 48,997bp 길이의 단일 콘티그 내로 조립하였다. 조립된 서열을 입증하기 위해, EcoRI과 HindIII를 사용한 이중 분해를 전체 영역에 총체적으로 고정되어 있는 20개의 클론을 사용하여 수행하였다. 수득된 분해 패턴은 콘티그에 의해 예측된 제한 지도와 완벽히 일치하였다(데이타는 나타내지 않았음). 콘티그의 하류 영역을 서열화하기 위해, 게놈 워킹을 제조사[Clontech]의 GenomeWalker 킷트를 사용하는 E58 게놈 DNA로 성공적으로 수행하였다. 이러한 노력은 추정의 BT NRPS 오페론(Genbank 수탁번호 #________)을 포괄하는 50,674 bp의 DNA 서열을 도출하였다.
His10-태그된(tagged) BT A-도메인 단백질의 클로닝, 과발현 및 정제. BT NRPS 모듈 8, 5, 7, 4 및 2(Bt8A, Bt5A, Bt7A, Bt4A 및 Bt2A)의 A-도메인을 암호화하는 DNA 단편을 PCR-증폭시키고, PCR 생성물을 His10-태그 재조합 단백질 발현 벡터 pET16b(Novagen) 내로 삽입시켰다. A-도메인 경계를 문헌[참조: Konz, et al., 1999])에 정의된 바와 같이 결정하였다. 발현 구축물을 이.콜라이 BL21-AI 균주(Invitrogen) 내로 형질전환시켰다. 형질전환체를 37℃에서의 L-브로쓰에서 A600 0.6으로 배양한 후, 1mM IPTG(이소프로필-β-D-티오갈락토피라노시드)와 0.2% L-아라비노스를 사용하여 유도하였다. 세포를 수거하기 전 30℃에서 추가로 2시간 동안 배양하였다. His10-태그 재조합 단백질의 정제는 변형과 함께 편람에 권해진 조건 하에 TALON 금속 친화 수지(BD Bioscience)를 사용하여 달성하였다. 간략히, 이. 콜라이 세포를 초음파로 파쇄하였다. 세포 용해물을 25,000x g에서 1시간 동안 원심분리하여 정화하였다. 이어서 His-태그 재조합 단백질을 TALON 수지와 함께 항온처리하고, 세척하고, 500mM 이미다졸로 용출시켰다. 용출된 단백질을 완충액(50mM HEPES, pH 8.0, 100mM 염화나트륨, 10mM 염화마그네슘 및 1mM EDTA)에 대하여 투석한 후 SDS PAGE와 쿠마시 블루 염색으로 분석하였다. 재조합 단백질은 계산된 것과 양립할 수 있는 겉보기 분자량을 나타내었고, 이들은 균일하게 정제되는 것으로 보였다. 정제된 단백질의 농도는 A280에 대한 계산된 몰흡광 계수를 사용하여 결정하였다.
ATP-PPi 교환 검정. ATP-PPI 교환 검정을 수행하여 A-도메인의 기질 특이성을 결정하였다. ATP-PPi 교환을 근소한 변형과 함께 상기한 바와 같이 검정하였다(문헌[참조: Stachelhaus, et al., 1998]). 검정 혼합물은 50mM HEPES(pH 8.0), 100mM NaCl, 10mM MgCl2, 2mM ATP, 0.5mM 아미노산, 0.05mM PPi, 0.15μCi [32P]파이로인산사나트륨을 함유하였다. 교환은 정제된 재조합 A-도메인 단백질을 0.1ml의 총 용적으로 첨가하여 개시시켰다. 단백질 농도는 모듈 4 및 모듈 5 A- 도메인에 대해 0.2μM이었던 반면, 모듈 7 및 모듈 8 A-도메인에 대해서는 2μM이었다. 37℃에서 15분 동안 항온처리 한 후, 종결 혼합물(100mM 파이로인산사나트륨, 3.5% HClO4 및 1.6% [w/v] 활성화 목탄) 0.5ml을 첨가하여 종결시켰다. 목탄은 원심분리하여 펠릿화하고, 40mM 파이로인산과 1.4% 과염소산으로 1차 세적한 후, 물로 세척하고 물 0.5ml에 재현탁시켰다. 목탄/물 현탁액을 섬광 유체 5.0ml을 함유하는 섬광 바이알에 첨가하고, 한계 방사능을 액체섬광계수법으로 결정하였다. 겉보기 Km 수치를 0.1 내지 10mM 범위의 기질 농도로 결정하였다.
MIC 측정 검정. 스타필로코칼 아우레우스를 LB에서 37℃에서 중간 대수기까지 배양하였고, 신선한 LB로 500배 희석하고 96-웰 미세 역가 플레이트에 분배하였다. 상이한 농도의 펩타이드를 첨가하고, 미세 역가 플레이트를 37℃에서 교반하면서 항온처리하였다. 최소 억제 농도(MIC)를 생육억제 웰을 생산한 최저 펩타이드 농도로 결정하였다. 모든 실험은 3회 수행하였고, 고도로 일치하는 MIC를 수득하였다.
BT 펩타이드의 동정. 스타필로코쿠스 아우레우스에 대한 신규한 항생제를 생산하는 토양 미생물을 찾고자 하는 노력으로 세균 균주 E58을 토양에서 분리하였다. E58이 16S rDNA 서열 상동성(98.5% 동일성)을 토대로 하여 브레비바실러스 라테로스포러스와 밀접하게 관련되어 있음이 밝혀졌다. E58을 브레비바실러스 텍사스포러스로 명명하였고 ATCC에 기탁하였다(카탈로그 번호 제PTA-5854호). E58에 의해 생산된 항생제를 BT라 명명하였고 이의 활성을 액체 E58 LB 배양액의 상층액에서 관측할 수 있었다. 따라서 무세포 배양 상층액은 BT 정제를 위한 출발 물질이었다. 항생제 활성물은 황산암모늄에 의해 침전되었는데, 이는 항생제가 단백질 또는 펩타이드임을 제안하는 것이었다(데이타는 나타내지 않았음). 추가로 활성물을 클로로포름으로 추출하였고, 이는 BT가 소분자로 이루어져 있음을 제시한다. 항생제 클로로포름 추출물을 진공 증발기에서 증발시켰고, 물에 용해시킨 후 SDS 트라이신 겔에서 전개시켰다. 각각의 반쪽에서 동일한 레인을 갖는 겔의 반쪽 2개를 단백질/펩타이드에 대해 염색하거나 BT-민감성 세균 바실러스 세레우스와 함께 매봉한 아가를 도포하여 항생제 활성에 대해 시험하였다(도 1A). 3개의 종이 염색 후에 가시화되었다:겔 적재 완충액으로부터 기원한 브로모페놀 블루 염료, 1.4kD 미만의 질량을 갖는 비공지 펩타이드 및 항생제 활성을 갖는 제3의 종. 이러한 제3의 종은 저 농도에서 ~1.5kD 밴드로서 전개하였고(원형 겔에서 분명히 가시화됨), 후에 관련 펩타이드 그룹으로 이루어진 것으로 나타났다(아래를 참조). 이들의 명확한 질량은 펩타이드가 고농도에서 응집됨을 제시하는 농도로 증가하였다. 항생제 활성은 고농도에서 펩타이드와 관련되는 것으로 보였으며, 따라서 당해 펩타이드가 BT 항생제 활성을 부여할 법하다고 결론지었다. 당해 펩타이드를 BT 펩타이드로 지칭하였다. BT 펩타이드는 분명히 당해 검정에서 저농도에서는 B. 세레우스에 대하여 유독하지 않았다. 최소의 검측가능한 BT 밴드가 ~1.5 kD에서 전개하였기 때문에, BT 펩타이드는 대략 13개의 잔기를 포함한다.
클로로포름-추출 BT를 질량분광분석 검정에 적용하였다. 펩타이드 그룹이 1550 내지 1650 달톤의 범위에서 관측되었다(도 1B). 주종은 1583의 분자량을 나타내었으며, 이를 BT1583으로 명명하였다. 다른 펩타이드는 후에 BT1583의 이성체인 것으로 밝혀졌다(표 5 및 6).
부분적 BT 서열 결정. 클로로포름-추출 BT를 추가로 C18 역상 HPLC로 정제하였다(보다 자세히는 물질 및 방법을 참조한다). BT1583은 C18 HPLC의 분획 33에서 균일하게 정제되었다(도 1C). BT1583(분획 33)의 아미노산 조성물 분석은 BT1583이 Tyr, Lys, Leu, Ile, Val 및 Orn의 잔기를 포함함을 나타냈다. BT1583은 N-말단 서열화를 어렵게 하였으며 아미노펩티다아제 M에 의한 분해에 저항성이 있는데, 이는 비-표준 N-말단 잔기를 제시하는 것이다. BT1583은 또한 카복시펩티다아제 Y에 의한 절단에 대한 저항력을 가졌는데, 이는 비-표준 C-말단 아미노산을 제시하는 것이다. 따라서 카복시-말단 서열화는 시도하지 않았다.
이어서 직렬 질량분광계(MS/MS)를 BT1583 펩타이드를 서열화하기 위해 선택하였다. MS/MS 데이타를 BT1583에 대해 수득하였고, 이들을 도 2A 및 표 2에 나타내었다. MS/MS 데이타는 BT1583이 아미노산 조성물과 상당히 관련되어 있는 13개의 아미노산 잔기를 포함함을 제시하였다. 기대한 바와 같이, 잔기 1 및 13의 질량은 임의의 표준 아미노산과 상응하지 않았다. 마지막 잔기는 103 달톤의 질량을 나타내었는데, 이는 카복실산에서 알콜로 환원된 이의 C-말단을 갖는 발린과 양립하는 것으로 보인다. C-말단 알콜성 발린의 존재는 추가로 BT NRPS의 13번째 발린-특이적 모듈 내의 리덕타제 도메인의 존재에 의해 확증되었다(아래를 참조). N-말단 잔기의 실체는 결정하기 더 어려웠다. 그럼에도 불구하고, 198의 질량을 갖는 N-말단 잔기는 Bmt {4-메틸-4-[(E)-2-부테닐]-4,N-메틸-트레오닌}의 N,N-메틸화된 형태와 양립할 수 있는 것으로 보였다(문헌[참조: Offenzeller, et al., 1996; Offenzeller, et al., 1993]).
BT1583 내의 오르니틴의 존재는 BT1583이 리보솜에 의해 합성될 수 없음을 나타낸다. D-아미노산의 존재는 이러한 생각을 뒷받침한다. 본 발명자는 BT1583 내의 가장 풍부한 잔기 중 2종의 키랄 특성을 측정하기 위해, Val 및 Leu를 선택하였다. 키랄 분석은 균일한 L-Val 잔기를 나타내었지만, L- 및 D-Leu 잔기 둘 다는 2:1의 비율임을 나타내었다.
상기한 생화학적 및 구조적 분석은 본 발명자에게 부분적 BT1583 펩타이드 서열을 제공할 수 있었다(표 2 및 도 2B 참조). N- 및 C-말단 잔기의 구조는 충분히 결정되지 않았다. 이소루이신 및 루이신은 구별할 수 없었다. D-형 Leu의 위치는 구체적으로 밝혀지지 않았다. 펩타이드의 기타 잔기의 키랄 특성은 결정되지 않았다.
E58 게놈의 솟건(shot-gun) 서열화. BT1583 펩타이드의 구조 및 생합성을 보다 잘 이해하기 위해, 본 발명자는 BT 생합성을 담당하는 유전자 또는 오페론을 동정하기로 결정하였다. 펩타이드 내의 비-단백원성 오르니틴 및 D-형 아미노산의 존재는 본 발명자가 BT1583이 생체 내에서 NRPS에 의해 합성되었다고 믿게 하였다)(문헌[참조: Marahiel, 1997]). 대부분의 NRPS 유전자는 NRPS 모듈과 펩타이드 생성물 내의 아미노산 잔기 사이의 엄격한 상관 관계를 반영하는 동선상이다. BT NRPS 오페론이 동선상인 경우, 이는 BT1583 펩타이드 내의 13개의 아미노산 잔기에 상응하는 13개의 모듈을 암호화할 것이다. 평균으로 가정하여, 각각의 모듈은 평균 3.5kb의 DNA 단편에 의해 암호화되며, 46kb 길이의 DNA 단편이 BT NRPS 오페론을 충당하기 위해 필요할 것이다. 상기한 바와 같이, NRPS 오페론을 동정하기 위한 통상의 방법은 일반적 프로브를 사용하여 코스미드 라이브러리를 프로빙하는 것을 포함한다. 불완전한 일반적 프로브는 표전 유전자를 놓칠 수 있고, 일반적으로 세균성 게놈에는 다중 NRPS 오페론이 있기 때문에, 이러한 방법은 빈번하게 조사자가 잘못된 NRPS 오페론을 추적하게 한다. 이러한 함정을 피하기 위해, 본 발명자는 게놈 내의 모든 NRPS 오페론의 편견 없는 실리카 내 개관을 제공하여 NRPS 오페론의 직접적인 비교를 가능케 하고 이에 따라 합리적인 후보 오페론을 선택할 수 있게 하는 게놈 방법을 개발하였다. 이러한 신규한 방법으로 BT NRPS 오페론을 빠르고 정확하게 동정하였다.
E58 게놈은 5 Mb인 것으로 판단되었다. E58 게놈 라이브러리는 평균 5kb의 삽입 크기로 구축하였다. 전체 게놈을 2배 범위에 대하여 서열화하였다. 서열 조립 후, E58 게놈은 700bp 내지 22.6kb 범위의 크기를 갖는 1919개의 콘티그 및 932의 단일체(singlet)로 대표되었다. 이러한 범위는 99.995%의 게놈이 클론에 의해 대표될 수 있게 할 것이다. 또한, 2개의 이웃하는 콘티그 사이의 간극의 평균 길이는 205bp 정도로 작아서 슈퍼콘티그가 구축될 수 있게 할 것이다(아래를 참조). 추가로, 이러한 분석의 슈퍼콘티그는 충분한 정보를 포함하여 정확한 실리카 내 NRPS 오페론 동정을 가능케 할 것이다.
BT NRPS 오페론의 실리카 내 동정. 후보 BT NRPS 오페론을 선택하기 위해 3단계의 과정을 사용하였다. 제1 단계, 모든 콘티그 및 단일체를 NRPS 모듈을 암호화하는 서열에 대하여 조사하였다. E58이 비. 서브틸리스와 관련되어 있기 때문에, 비. 서브틸리스로부터의 추정의 펩타이드 합성효소 PPS1을 집합된 E58 콘티그 모두를 포함하는 데이타베이스에 대한 BLAST 분석용 조회(query) 서열로 선택하였다. 128개의 콘티그는 0 내지 1로 정렬되는 P-수치를 갖는, PPS1에 대한 해독된 아미노산 서열 유사성을 나타내었다.
제2 단계, 슈퍼콘티그를 128개의 콘티그로부터 구축하였다. 동일한 삽입물의 말단으로부터의 2개의 서열화 판독물이 짝쌍을 형성한다. 슈퍼콘티그는 상이한 콘티그 내에 존재하는 짝쌍을 연결하는 콘티그의 집합이다. 짝쌍의 동정은 이웃하는 콘티그가 슈퍼콘티그를 형성하도록 배열 및 배향되게 하였다(도 3A). 31개의 슈퍼콘티그를 성공적으로 구축하여 전체 E58 NRPS 오페론 포트폴리오를 나타내었다.
후보 BT NRPS 오페론을 E58 NRPS 오페론 포트폴리오 중에서 선택하였다. 31개의 슈퍼콘티그를 BT NRPS 오페론의 내포 가능성에 대해 조사하였고, 슈퍼콘티그 3(마감된 서열을 토대로 한 이의 유전자 특성은 도 3B 및 3C에 나타내어져 있다)을 다음의 분석을 기초로 후보로서 선택하였다.
슈퍼콘티그 3은 잠정적으로 13개의 NRPS 모듈을 암호화하는 DNA 서열을 포함하였다. 슈퍼콘티그 3의 A-도메인 기질 특이성에 관한 사용가능한 정보는 부분적 BT1583 서열과의 호환성을 나타내었다. 기질 특이성-부여 아미노산 잔기의 완전한 세트를 11개의 모듈에 대해 확인할 수 있었다(모듈 2 및 13은 불완전한 DNA 서열로 인해 제외함). 모든 특이성을 예측할 수는 없었지만, 예측된 NRPS 아미노산 기질과 부분적 BT1583 서열 사이에 양호한 상관 관계가 성립되었다. 특이적으로, 모듈 4는 Ile를 포함하고 있는 것으로 예측되었으며, 모듈 9 및 12는 Leu를 포함하고 있는 것으로 예측되었다(표 3, 자세한 것은 아래를 참조). 부분적 BT1583 서열은 위치 4, 9 및 12에 Leu 또는 Ile를 가졌다. 11개 모듈의 기질 부여 아미노산의 계통발생학적 분석은 함께 그룹화된 동일하거나 매우 유사한 아미노산을 포함하고 있는 것으로 예상됨을 나타내었다(도 3D). 예를 들면, 모두 Val을 포함하고 있는 것으로 예측된 모듈 5, 6 및 8이 클러스터를 형성하였다. 모듈 7, 10 및 3은 다른 클러스터를 형성하는 유사한 양이온성 아미노산(각각, Lys 및 Orn)을 포함하고 있는 것으로 예측되었다.
슈퍼콘티그 3에 의해 암호화되는 NRPS 내의 E-도메인 위치는 부분적 BT1583 펩타이드 구조와의 호환성을 나타내었다. 4개의 E-도메인이 모듈 3, 7, 9 및 11에서 발견되었다(도 3C). 이들의 위치는 모든 L-형 Val 잔기 및 2:1 L- 대 D-형 Leu 잔기 비율의 상기한 BT1583 키랄 특성과 일치하였다.
따라서 슈퍼 콘티그 3은 BT NRPS 오페론에 대한 후보 유전자좌로서 확인되었다. 프라이머 연장 및 게놈 워킹을 수행하여 당해 유전자좌의 고질의 서열을 수득하였다. 이러한 노력은 추정의 BT NRPS 오페론을 포괄하는 51,821 bp의 콘티그를 도출하였다(Genbank 수탁번호#), 도 3F를 참조.
추정의 BT NRPS 아단위. 10개의 개방형 판독틀(ORF)을 해독 분석 및 blast 탐색을 통해 서열화된 영역에서 확인하였다(문헌[참조: Altschul, et al., 1997])(도 3B). 중간의 6개의 ORF(btA에서 btF로 명명)가 BT NRPS의 6개의 아단위(BtA에서 BtF)를 암호화하는 것으로 예측되었고, 이들의 좌표는 표 4에 나열되어 있다. 추정의 아단위의 서열 분석은 통상적인 동선상 NRPS의 모듈 구조를 확증하였다(도 3C). 각각 A-도메인 및 T-도메인을 포함하는 모듈은 C-도메인에 의해 연결되어 있다. 탑재 모듈 BtA는 T-도메인이 뒤를 따르는 A-도메인을 가졌다. 추정의 BT NRPS 아단위에 대한 2종의 주목할 만한 전반적인 특징이 있다. 첫째, 6개의 아단위 중 4개는 이중-모듈 구조를 나타낸다. 둘째, 모든 보조의 E-도메인은 추정의 NRPS 아단위의 중간에서 다소 말단 쪽에 존재한다. 보존 도메인의 서열 정렬은 도 4에 나타내어져 있다.
모듈 13 내의 리덕타제 도메인. 약 500개 아미노산의 도메인이 BtF 또는 모듈 13의 C-말단에서 확인되었다. BLAST 분석은 이것이 다른 NRPS 및 폴리케티드 합성효소로부터의 수개의 NADPH-의존성 리덕타제와의 높은 유사성을 가짐을 나타내었다. 에스. 아우란티아카의(S. aurantiaca) MxcG 및 에스. 세레비키애(S. cereviciae)의 Lys2로부터의 리덕타제 도메인과의 이의 정렬은 도 4E에 나타내어져 있다. 유사한 리덕타제 도메인 또한 그라미시딘 A NRPS 내에서 확인되었다(문헌[참조: Kessler, et al., 2004]). 모든 3가지의 리덕타제가 NADPH-의존성 반응에서 이들의 기질을 상응하는 알데하이드로 환원시킴이 실험적으로 입증되었다(문헌[참조: Gaitatzis, et al, 2001; Kessler, et al., 2004; Sagisaka & Shimura, 1959]). 믹소첼린(myxochelin) A 및 그라미디신 A에 대하여, 알데하이드는 추가로 알콜로 환원된다. 두번째 환원 단계에 대한 정확한 메커니즘은 확인되지 않았다. 이들 리덕타제 그 자체 또는 기타 단백질이 두번째 환원 단계를 수행하거나, 두번째 환원 단계는 자발적인 것이다. MS/MS 실험은 BT1583의 C-말단 잔기가 발린의 알콜성 형태일 수 있음을 제안하였다(도 2B). 마지막 추정의 BT NRPS 모듈의 A-도메인 특이성 예측 및 모듈 내의 리덕타제 도메인의 존재는 이러한 제안을 확증하였다.
btG는 ABC 운반자를 암호화한다. btG는 btF의 바로 하류에 있는 ORF이며, 다른 bt ORF와 동일한 방향으로 전사된다. 개시 코돈 ATG는 btF 종결 코돈의 61bp 하류에 위치해 있다. 해독된 아미노산 서열은 ATP-결합 카세트(ABC) 운반자 상위 계열의 일원에 대한 높은 유사성을 나타내었다(데이타는 나타내지 않았음). ABC 운반자 ORF는 통상적인 NRPS 오페론에서 발견된다. 이들의 역할은 세포 밖으로 펩타이드를 배출해 냄으로써 펩타이드 항생제 생성물에 대한 내성을 갖는 숙주를 제공하는 것으로 제안되어 왔다. 추정의 BtG ABC 운반자의 정확한 역할이 정립될 필요가 있다.
BT1583 펩타이드 서열 세분. 기질 특이성-부여 잔기(문헌[참조: Stachelhaus, et al., 1999])를 13개 A-도메인 모두로부터 추출하였고 공중 NRPS 코돈 데이타베이스 내에서 아미노산 결합 포켓 구성성분의 집합과 비교하였다(raynam.chm.jhu.edu/~nrps/index.html)(문헌[참조: Challis, et al., 2000]). 기질 특이성 예측은 서열 정렬을 토대로 하였고 이들은 표 3에 나열되어 있다. 제1 모듈의 아미노산-결합 포켓 구성성분은 트레오닌/디하이드로트레오닌에 대한 NRPS 코돈과의 완벽한 부합을 나타내었으며, 이는 모듈 1이 트레오닌 유도체를 포함하는 것으로 예측되었다. N,N-메틸화된 Bmt는 MS/MS 데이타에 따라 N-말단 아미노산 잔기인 것으로 제안되었다(도 2B 및 표2). 2개의 제안이 서로 100% 일치하지는 않지만, 둘 다 N-말단 아미노산 잔기로서 트레오닌 유도체를 필요로 한다.
상기한 바와 같이, NRPS 코돈 데이타베이스에 따라 모듈 4(Ile), 모듈 9(Leu) 및 모듈 12(Leu)에 대하여 3개의 명확한 특이성을 할당할 수 있었다. 이들 할당은 부분적 BT1583 서열과 호환가능하였으며, 따라서 BT1583 펩타이드의 위치 4, 9 및 12는 각각 Ile, Leu 및 Leu로 정의되었다. 오직 BT1583 펩타이드의 Ile만이 위치 4에 할당되었기 때문에, 잔여 Leu는 BT1583 펩타이드의 위치 2에 할당되었다. 따라서 모듈 2의 A-도메인 특이성은 Leu인 것으로 추론되었다. E-도메인 위치 정보와 함께 이들 할당은 본 발명자가 BT1583 펩타이드 서열을 (CH3)2-Bmt-Leu-dOrn-Ile-Val-Val-dLys-Val-dLeu-Lys-dTyr-Leu-Val-CH2OH로 정의하게 하였다.
BT 생합성 중 신규한 NRPS 코돈. 모듈 5, 6 및 8의 아미노산-결합 포켓 구성성분은 동일하다. 이들은 모듈 13의 아미노산-결합 포켓 구성성분과 단 하나의 잔기만 다르다. NRPS 코돈 데이타베이스에서 아미노산-결합 포켓 구성성분의 이들 세트에 대하여 어떠한 양호한 부합성도 발견되지 않았다. 그러나, 이들은 당해 데이타베이스에서 특정한 Ile, Leu 또는 Val NRPS 코돈에 대한 유사성을 나타내었다. 부분적인 BT1583 펩타이드 서열이 위치 5, 6, 8 및 13에서 Val 잔기를 갖기 때문에, 모듈 5, 6, 8 및 13이 Val을 포함하는 것으로 추론되었다. 모듈 5, 6, 8 및 13의 아미노산-결합 포켓 구성성분은 Val에 대한 잠재적으로 신규한 NRPS 코돈을 나타낸다.
모듈 7 및 10의 아미노산-결합 포켓 구성성분은 동일하며 이들은 모듈 3의 아미노산-결합 포켓 구성성분과 단 하나의 잔기만 다르다. NRPS 코돈 데이타베이스에서 아미노산-결합 포켓 구성성분의 이들 세트에 대하여 어떠한 부합성도 발견되지 않았다. 부분적 BT1583 펩타이드 서열이 위치 7 및 10에 Lys 잔기를 갖기 때문에, 이들 모듈의 특이성은 Lys인 것으로 추론되었다. 마찬가지로 부분적 BT1583 펩타이드 서열은 위치 3에 Orn 잔기(구조상 Lys와 매우 유사한)를 가졌으며, 따라서 모듈 3의 특이성은 Orn인 것으로 추론되었다. 모듈 7 및 10의 아미노산-결합 포켓 구성성분은 잠재적으로 Lys에 대한 최초의 NRPS 코돈을 나타내며, 모듈 3의 아미노산-결합 포켓 구성성분은 Orn에 대한 잠재적으로 신규한 NRPS 코돈을 나타낸다.
NRPS 코돈 데이타베이스에 따른 모듈 11에 대한 특이성 예측은 매우 모호하였다. NRPS 코돈 데이타베이스에서 당해 세트의 아미노산-결합 포켓 구성성분에 대한 어떠한 양호한 부합성도 발견되지 않았다. 그러나, 당해 데이타베이스에서 특정한 Phe, Trp 또는 Tyr NRPS 코돈에 대한 유사성이 나타났다(데이타는 나타내지 않았음). 부분적 BT1583 펩타이드 서열이 위치 11에서 Tyr 잔기를 가졌기 때문에, 모듈 11의 A-도메인 특이성은 Tyr인 것으로 추론되었다. 모듈 11의 아미노산-결합 포켓 구성성분은 Tyr에 대한 잠재적으로 신규한 NRPS 코돈을 나타낸다.
BT NRPS 오페론의 실체 확인. BT 생합성이 신규한 NRPS 코돈을 포함하기 때문에, 신규한 코돈의 실험적 정립(특히, 신규한 발린 및 라이신 코돈)이 BT NRPS 오페론의 실체를 확인하는 데 결정적이다. 게다가, BT1583 내의 위치 4에서의 Ile의 배치가 3개의 Leu 잔기의 배치에 영향을 주기 때문에, 모듈 4 코돈 또한 검사할 필요가 있었다.
NRPS 모듈의 정제된 재조합 A-도메인이 ATP-PPi 교환 검정에서 NRPS 모듈의 동계 아미노산 기질을 선택적으로 그리고 효율적으로 활성화하기 때문에(문헌[참조: Konz, et al., 1999; Mootz & Marahiel, 1997]), ATP-PPi 교환 검정이 NRPS 모듈 특이성 및 신규한 NRPS 코돈을 실험적으로 정립하는 데 사용되어 왔다. BT NRPS의 모듈 8, 5, 7, 4 및 2의 재조합 A-도메인을 물질 및 방법에 기술된 바와 같이 정제하였다. 거의 완전한 가용성의 재조합 A-도메인 단백질을 수득하였다. A-도메인 특이성은 ATP-PPi 교환 및 Km 검정으로 결정하였고(물질 및 방법 참조), 결과는 도 5에 나타내어져 있다. 모든 20개의 단백원성 아미노산 및 L-Orn을 각각의 A-도메인 단백질에 대하여 시험하였고, 실험 중 배경 소음은 일반적으로 1% 이하였다.
모듈 8 A-도메인 단백질은 L-Lys(10%) 및 L-Ile(4%)를 최소 활성화하면서, L-Val(100%)를 활성화하는 것으로 보였다. 겉보기 Km은 L-Val에 대하여 2.75mM인 것으로 결정되었다. 이들 결과는 신규한 발린 NRPS 코돈을 확증하였다. 유사하게, 모듈 5 A-도메인 단백질이 L-Val(100%), L-Ile(23%) 및 L-Leu(17%)를 활성화하는 것으로 밝혀졌다. 겉보기 Km은 L-Val에 대하여 1.11mM 및 L-Ile에 대하여 2.78mM인 것으로 결정되었으며, 이는 L-Val이 모듈 5에 대한 바람직한 기질임을 분명하게 나타낸다.
L-Lys는 모듈 7 A-도메인 단백질에 의해 활성화된 유일한 아미노산이었다. 겉보기 Km 수치는 1.12mM인 것으로 결정되었다. 이들 결과는 최초 Lys NRPS 코돈을 정립하였다.
모듈 4 A-도메인 단백질은 L-Val(9%) 및 L-Leu(7%)를 최소 활성화하면서, L-Ile(100%)를 선택적으로 활성화하는 것으로 보였다. L-Ile에 대한 겉보기 Km 수치는 0.5mM로 측정되었다.
모듈 2 A-도메인 단백질은 매우 모호한 것으로 밝혀졌다. 이는 L-Val(67%)의 현저한 활성화 및 L-Ile(19%) 및 L-Phe(3.5%)의 약한 활성화와 함께, 거의 동일한 효율로 L-Leu(98%) 및 L-Met(100%)를 활성화하였다.
일반적으로, 모든 정제된 A-도메인 단백질은 ATP-PPi 교환 검정에서 예측된 아미노산 기질을 선택적으로 활성화하는 것으로 밝혀졌다. 이들 결과는 BT NRPS 오페론의 실체를 실험적으로 확증하였다.
합성 펩타이드. BT 펩타이드와 BT NRPS 오페론의 실체를 추가로 확인하기 위해, 합성 펩타이드 P81(도 6)을 제조하였고(제조사[Biomer Technology], 캘리포니아주 콩코드 소재), 이의 특성에 대해 검사하였다. Bmt가 시판되지 않기 때문에, 본 발명자는 정의된 BT1583 서열에 따라 펩타이드를 합성할 수 없었으며 지질펩타이드 P81을 합성하기 위해 옥탄산-변형 트레오닌을 사용하여 BT1583을 모방하였다. P81은 BT1583과 같은 총체적인 항생제 활성 및 프로나아제 내성을 나타내었다. 이들 결과는 정의된 BT1583 펩타이드 서열 및 BT NRPS 오페론의 실체에 대한 지지를 더하였다.
C-말단 알콜성 변형의 유의성을 조사하기 위해, P81(P59)의 아미드 형태를 합성하였다. P59는 항생제 활성을 나타내었지만, 프로나아제 내성은 나타내지 않았다. 이들 결과는 C-말단 알콜성 변형이 P81 및 아마도 BT1583에 대한 프로테아제 내성을 부여하는 핵심 역할을 수행함을 나타낸다.
최초 BT NRPS 모듈에 대한 코돈이 공지된 Thr NRPS 코돈과 완벽히 부합하기 때문에, 위치 1에 비변형 Thr을 갖는 활성 BT 이성체의 가능성을 조사할 필요가 있었다. 따라서 P81(P58)의 아미드 형태를 합성하였고, P58은 불량한 항생제 활성을 나타내었다. 이들 결과는 Thr 유도체(변형되지 않기 보다는)를 확증하였다. Thr은 항생제 활성을 부여하기 위해 위치 1에 있어야 할 필요가 있다.
L- 및 D-형 잔기는 위치 5(Val)를 제외하고 BT1583의 중간에서 교환된다. 교환 키랄성이 펩타이드 항생제 그라미디신 A에 대한 핵심 구조 특성이기 때문에, 본 발명자는 모듈 5에 대한 E-도메인의 암호화 서열을 잃었는지의 여부를 조사하기로 결정하였다. P59(P80)의 D/L 교환 버전을 합성하였다. P80은 항생제 활성을 나타내지 않았다. 상기한 결과는 단지 BT1583 펩타이드 구조(N-말단 잔기를 제외한) 뿐만 아니라, BT NRPS 오페론의 실체를 확증하였다.
BT1583 펩타이드 구조, BT NRPS 오페론 및 BT NRPS는 본 발명자가 BT1583의 이성체에 대한 축퇴성 변형을 제안하게 한다(표 5). 각각의 모듈의 상대적 기질 선택성을 기초로 하여, 유의미한 양으로 E58에 의해 생산되는 경향이 있는 BT 이성체를 예측하였으며 표 6에 나열하였다. 대부분의 예측된 BT 이성체는 MS/MS에 의해 실험적으로 확인되었다(데이타는 나타내지 않았음).
BT 펩타이드의 구조 및 생합성을 생화학, 생물리학 및 게놈학의 통합된 방법을 사용하여 결정하였다. 정제된 BT1583(주요 BT 이성체)을 사용한 아미노산 조성물 및 직렬 질량분광분석 실험은 부분적 펩타이드 구조를 산출하였다. 부분적 구조 내의 오르니틴 및 D-형 잔기의 존재는 펩타이드가 생체 내에서 비-리보솜성 펩타이드 합성효소에 의해 합성되었음을 나타내었다. BT NRPS 오페론을 신규한 실리카 내 유전자 수색안을 통해 신속하고 정확하게 동정하였다. BT NRPS 오페론의 서열 분석은 이것이 동선상 모듈 NRPS를 암호화함을 나타내었다. BT NRPS의 동선상 특성은 본 발명자가 BT 오페론 게놈 정보를 사용하고 BT1583 서열을 (CH3)2-Bmt-L-dO-I-V-V-dK-V-dL-K-dY-L-V-OH로 정의할 수 있게 하였다. 추가로, 발린, 라이신, 오르니틴 및 타이로신에 대한 신규한 NRPS 코돈이 발견되었고 본원에 기록되어 있다.
실리카 내 NRPS 오페론 동정. 통상적인 NRPS 유전자 동정은 일반적 프로브를 사용하여 게놈 코스미드 라이브러리를 프로빙하는 것을 포함한다. 이러한 방법은 연구자가 다중 NRPS 오페론을 갖는 게놈 내에서 잘못된 유전자를 추적하게끔 하는 유전된 결점을 갖는다. 본원에 나타낸 바와 같이, NRPS 유전자 동정은 최적의 적합성을 찾기 위해 동일한 시기에 비교한 경우, 게놈 내의 모든 NRPS 오페론에 대하여 개선된다. 다행히도, 서열화 비용이 현저히 감소하여 미생물 게놈의 통상적인 서열화를 가능케 하였다. 2배 범위는 정확한 NRPS 오페론 동정에 충분하였다. 실제 BT NRPS 오페론 선택에서, 다음의 두 세트의 정보를 산출하여 최적의 후보를 찾기 위해 비교하였다: 기질-결합 포켓 구성성분의 유사성에 따른 NRPS 모듈 군집(clustering) 패턴; 및 D-형 잔기의 위치와 같은 위치 정보. 신규한 NRPS 코돈을 포함하는 오페론(즉, BT NRPS 오페론의 모듈 5, 6 및 8의 경우에)의 후보자격 정립에는 모듈 군집 기법이 특히 강력하다. 실리카 내 전략은 게놈 내에 다수의 NRPS 오페론을 갖는 균주(E58과 같은) 내에서의 NRPS 오페론 동정에 특히 유용하다.
Figure 112006062856872-PCT00001
Figure 112006062856872-PCT00002
Figure 112006062856872-PCT00003
* 정보는 BT1583 펩타이드 서열 세분을 위해 사용하였다.
** 당해 위치의 Leu는 오직 Ile만이 위치 4에 할당되었다는 사실로부터 추론하였다.
Figure 112006062856872-PCT00004
Figure 112006062856872-PCT00005
번호는 아미노산 잔기 위치를 나타낸다.
Figure 112006062856872-PCT00006
사료 첨가물로서의 BT.(닭 성장 증진 실험에 BT1583보다는 반-정제된 BT 펩타이드를 사용하였다.)
BT 펩타이드의 구조 및 이의 생물학적 및 생화학적 특성을 토대로 하여, 본 연구자는 사료 첨가물로서의 이의 용도를 시험하기에 충분한 물질을 제조하였다. 요약하면, 사용된 펩타이드의 특성은 다음의, 수많은 잠재적 자연 변이체 또는 이성체(>8) 및 유도체(>30)를 갖는 13개의 아미노산 잔기와 같았다. 생물학적으로, BT 펩타이드가 그람(+) 세균에 의해 생산된 천연 생성물이었음이 밝혀졌다. BT 펩타이드 계열은 비-리보솜성 펩타이드 신타제(NRPS)에 의해 합성되며, 클로닝 및 특성화가 본원에 개시되어 있다. 이러한 펩타이드 중 하나, BT1583: Me2Bmt-L-dO-I-V-V-dK-V-dL-K-dY-L-V-CH2OH(서열 번호 1)를 추가의 연구를 위해 선택하였는데, 이것이 양이온성 및 아마도 양쪽성이기 때문이다. 이는 예외적인 아미노산 잔기를 포함하고/거나 다중 변형을 포함한다.
BT1583은 이의 높은 수준의 안정성 때문에 선택하였다. 당해 펩타이드에 대하여 관찰된 높은 안정성은 다음의 특성 중 하나 이상을 포함하였다: (1) 어떠한 공지된 효소도 이를 분해할 수 없다; (2) 이것은 마우스 또는 닭 GI 관에서 분해되지 않는다; (3) 이는 오토클레이빙될 수 있다; (4) 이는 사료 펠릿화 과정에서 생존할 수 있다; (5) 이는 극한 pH(pH1.0 및 pH13.0)를 견딜 수 있다; 및 (6) 이를 불활성화시키는 유일하게 공지된 시험관 내 방법은 pH 1.0과 100℃에 밤새 두는 것이다.
BT1583의 뚜렷한 안정성 외에, 그람 양성 세균에 대한 시험관 내 항세균 활성이 입증되었다, 예를 들면, 대부분의 그람(+):MIC = 1 마이크로그람/ml. 그람(-)에 대하여, 다음은 관측된 항미생물 활성이었다: 이. 콜라이: MIC > 20 마이크로그람/ml; 슈도모나스 및 살모넬라: MIC > 100 마이크로그람/ml. BT1583은 또한 항진균 활성을 나타낸다, 예를 들면, 에스. 세레비지애: MIC = 50 마이크로그람/ml. 항 원생생물 활성 또한 BT1583에서 관측되었다, 테트라하이메나: MIC = 25 마이크로그람/ml.
BT1583 생산을 위해 E58 균주를 선택하였는데, E58 균주가 빠른 성장 및 높은 펩타이드 생산자 균주이기 때문이었다. 추가로, 빠른 펩타이드 생합성 외에, 당해 균주는 또한 염가의 배지에서, 예를 들면, 0.4센트/L의 낮은 배지 가격 및 예를 들면, 0.5g/L의 수율로 성장한다. 성장은 일반적으로 공기 교반기에서 수행하였지만, 발효될 수도 있다. 추가로, 펩타이드 및 균주를 용이한, 일 단계 정제 공정을 위해 널리 공지된 과정의 광범위한 적용 없이 사용할 수 있다.
다음의 표 및 예는 브로일러 닭에서의, 예를 들면, 21일째 배터리(battery) 시험에서, BT1583 펩타이드의 성장 촉진 능력 및 특성을 나타낸다.
Figure 112006062856872-PCT00007
간략히, 펩타이드를 배터리(시험 2-1 및 2-2)에서 직접 사육한 20일생 브로일러의 성장 및 사료 전환을 연구하기 위해 펩타이드를 반 정제 형태로 사용하였다. 사료 대조군, 6ppm의 펩타이드 및 12ppm의 펩타이드에 대하여 2개의 양을 검사하였고, 우리 당 4마리의 조류를 사용하여 치료 당 12회를 반복하였다. 당해 연구에 사용된 식단은 다음과 같았다.
Figure 112006062856872-PCT00008
BT1583를 옥수수 분말 담체 200그람에 첨가하였다.
Figure 112006062856872-PCT00009
Figure 112006062856872-PCT00010
Figure 112006062856872-PCT00011
Figure 112006062856872-PCT00012
Figure 112006062856872-PCT00013
Figure 112006062856872-PCT00014
Figure 112006062856872-PCT00015
Figure 112006062856872-PCT00016
직접 사육한 3주생 브로일러의 성장 및 사료 전환에 대한 TAMUS BT1583을 평가하기 위해, 산업용 펠릿화된 포유용 사료를 제공하였다(배터리 중, 시험 3-1 및 3-2). 간략히, 다음의 6가지 처리 처방계획을 시험하였다: 대조군, 모넨신 90ppm, BMD 50 50ppm, BT1583 12ppm, 모넨신 + BMD 50, 모넨신 + BT1583 12ppm. 다시 우리 당 4마리의 조류로 처리당 8회의 연구 반복을 사용하였다.
Figure 112006062856872-PCT00017
BT1583을 옥수수 분말 200그람을 통해 첨가하였다.
Figure 112006062856872-PCT00018
Figure 112006062856872-PCT00019
Figure 112006062856872-PCT00020
Figure 112006062856872-PCT00021
Figure 112006062856872-PCT00022
Figure 112006062856872-PCT00023
Figure 112006062856872-PCT00024
Figure 112006062856872-PCT00025
바닥 우리(floor pen)에서 직접 사육한 42일생 브로일러의 성장 및 사료 전환에 대한 TAMUS BT1583을 평가하기 위한 보다 완전한 연구는 다음과 같을 수 있다: 여섯(6)개 그룹의 처리, 대조군, 모넨신 90ppm, BT1583 12ppm, 모넨신 + BMD 50ppm, 모넨신 + BT1583 12ppm 및 BMD 50ppm. 이번에는 우리 당 40마리의 조류로, 처리 당 10회의 연구 반복을 사용하여 사료 첨가물로서 BT1583 펩타이드의 사용 효과를 평가하였다.
식품-생산 동물에서 성장을 촉진하는 경우, BT1583 펩타이드는 사료 전환과 부가적인 체중 증가에서 약 10포인트를 제공한 것으로 밝혀졌다. 본 발명의 한가지 확실한 이점은 닭 GI관에서 전혀 또는 거의 흡수되지 않으며, 따라서 이를 광범위한 사용에 유용하게 한다는 것이다. 추가로, 통상적인 항생제와 달리, 본 발명은 세균막을 표적으로 할 수 있으며, 현재는 한두 가지의 돌연변이로 변형될 수 있는 약물 표적이 아니어서 약물 내성의 개발을 가능케 한다. 추가로, 가능한 숙주 면역 조절을 통한 성장 증진이 닭에 내재되어 있으며 약물 내성과 관계없음을 밝혔다. 대안적으로, 본 발명을 제한하지 않으면서, 본 발명은 세균 감염에 대한 동물용의 유일한 항생제로서 사용될 수 있다. 또한, 현재까지, 당해 펩타이드의 성장 촉진 활성의 감소는 관찰되지 않았다.
BT1583 단독으로 및 이를 널리 사용된 코키디오스태트 모넨신(MON)과 함께 사용하는 것으로서 당해 프로젝트를 위해 고안된 신규한 항-미생물제의 성능을 MON만을 단독으로 제공하는 것, 또한 널리 사용된 항미생물제 박티트라신 MD(BMD)과 함께 MON을 제공하는 것 및 BMD만 단독으로 제공하는 것과 비교하기 위한 브로일러 바닥 우리 시험.
다음 농도의 각각의 처리를 평가하였다:
1: 무첨가
2: 모넨신(MON) 99 ppm
3: BT1583 12 ppm
4: BT1583 12ppm + MON 99ppm
5: MON 99ppm + BMD 55ppm
6: BMD 55ppm
당해 연구는 처리 당 10개의 우리를 포함하였으며, 우리 당 40마리의 조류를 부화일에 수용하였다. 감소된 단백질(대략 23 내지 20%) 및 증가된 대사성 에너지(대략 1400 내지 1455kcal/lb)의 2종의 기본 옥수수-콩류 식단을 각각 0일 내지 21일째까지(포유용 사료) 및 22일째 내지 42일째까지(육성용 사료) 사용하였다. 처리 전혼합물을 측정하고 필요한 수준으로 식단에 혼합하였다. 0일 및 21일째 사이의 폐사율은 최적으로 성장하는 모든 조류에서 1% 미만이었으며 모든 그룹에서 우수한 건강 상태를 유지하였다.
연구 22일째에 시작하여, 당해 연구 감독자는 사육장 온도 및 기류를 조절하여 실험을 받은 적이 없는 무리 내의 대장균증 발발을 촉구하는 산업 조건을 모방하였다. 이는 당해 연구를 위한 자연 챌린지(challenge)를 자극하기 위해 수행하였다. 폐사율은 42일째에 대략 10%의 사육장 평균까지 상승하였다. 이들 주요 폐사는 BT1583 또는 MON을 받지 않은 그룹에서 발생하였다. 손상은 대장균증의 손상과 일치하였다(공기낭, 폐렴, 간주위염, 심주위염 및 극심한 이환률). 모든 폐사율을 문서화하였다(사망시 체중 및 부검 관측). 모든 조류 및 사료는 42일째에 칭량하였다. 모든 잔여 조류를 42일째에 질식시켜 안락사시켰으며, 동물 시체는 렌더링(rendering)용으로 제출되었다.
모든 데이타를 하기한 바와 같이 분석하였고 표 26에서 30에 걸쳐 나타내었다. 다음의 변수를 시험하였다: 반응 변수: 조류 당 증가, 증가 당 사료, 폐사율(%), 증가 당 조정 사료. 42일째에 0.05 수준의 유의도를 사용한, 하나의 차단 인자 = 위치를 사용하는 일원 분산분석(One Way ANOVA)로부터의 F 검정.
모든 반응 변수: ANOVA F 비율이 유의미한 경우, 0.05의 총 유의도 수준을 사용한, 유형 1 평균 오차와의 이원 비교를 위한 LSD T-검정 과정. 밑선 평균(아래의 표 30 참조)은 평균에서 유의미하지 않은 차이를 갖는 그룹을 지시한다.
조류 당 체중 증가(lb 단위)
처리 42일째 증가/조류
무첨가 3.900d
모넨신(MON) 99ppm 4.111bed
BT1583 12ppm 4.333ab
MON 99ppm + BT1583 12ppm 4.385a
MON 99ppm + BMD 55ppm 4.127c
BMD 55ppm 3.971cd
체중 증가는 MON + BMD 및 MON 그룹에 의해 제공된 것보다 MON + BT1583을 받은 그룹이 유의미하게 무거웠으며(p<0.05), 42일째에 측정한, BT1583을 부여받은 브로일러 2개 그룹이 가장 무거웠다.
사료/증가: 표 27은 MON + BT1583을 제공받은 브로일러가 BT1583만을 제공받은 그룹을 제외한 다른 모든 그룹보다 더 낮은(p<0.05) 사료/증가 수치를 가졌음을 나타낸다.
사료/증가
처리 42일째 사료/증가
무첨가 2.189d
모넨신(MON) 99ppm 1.854a
BT1583 12ppm 1.722ab
MON 99ppm + BT1583 12ppm 1.689a
MON 99ppm + BMD 55ppm 1.885bc
BMD 55ppm 2.147c
조정된 사료/증가: 각각의 우리에서의 폐사 동물의 총 체중을 최종적으로 살아 남은 동물의 체중에 더하여, 이 수치를 초기 체중을 감하여 감소시킨 후 총 사료 소비량으로 나누어 조정된 사료/증가를 계산하였다.
표 28은 사료/증가 수차에 대한 자연 챌린지의 효과를 입증한다. 심지어 폐사율에 대한 조정과 함께, MON + BT1583를 제공받은 브로일러는 다시 BT1583만을 제공받은 그룹을 제외한 다른 모든 그룹보다 유의미하게 낮은(p<0.05) 조정된 사료/증가 수치를 가졌다.
조정된 사료/증가
처리 42일째 조정된 사료/증가
무첨가 1.928c
모넨신(MON) 99ppm 1.761b
1583 12ppm 1.704ab
MON 99ppm + BT1583 12ppm 1.654a
MON 99ppm + BMD 55ppm 1.725b
BMD 55ppm 1.838bc
폐사율: 주요 폐사는 급성 및 만성 대장균증에 의해 유발되었다. BT1583 또는 모넨신만 제공받거나 이를 배합하여 제공받은 브로일러는 무첨가 대조군보다 낮은 폐사율을 가졌다.
급성 및 만성 대장균증에 의해 폐사율
처리 42일째 폐사율(%)
무첨가 17.50c
모넨신(MON) 99ppm 8.00a
1583 12ppm 2.75a
MON 99ppm + BT1583 12ppm 3.50a
MON 99ppm + BMD 55ppm 7.75abc
BMD 55ppm 18.25bc
모넨신은 승인된 폴리에테르 항생제이며 가금류 산업에서 항-원생생물제로 사용된다. 모넨신 및 그람 음성 세균에 대한 기타 폴리에테르 항생제에 의한 미미한 효능이 많은 조사자 및 가금류 산업자들에 의해 문서화되어 있다. BT1583 또한 그람 음성 세균에 대한 효능을 갖는다. 대장균은 보건학적으로나 경제학적으로나 식품 산업에서 주요한 문제가 되어 왔다. 당해 병원체에 대해 매우 효과적인 대부분의 생성물은 21일생 이상의 브로일러에 사용하기에는 너무 비싸거나 대중적인 건강 관심을 불러일으키는 사람 건강 상품과의 유사성 때문에 시장에서 밀려났다. 당해 연구는 BT1583이 모의 상업적 브로일러 조건 하에 사육된 3주 내지 4주생의 실험받은 적이 없는 닭에서 대장균증에 대하여 매우 효과적임을 입증하였다. 당해 시험에서 관찰된, 모넨신 및 BMD만을 그리고 이들을 배합하여 제공한 것 이상의 BT1583에 의해 획득된 20+ 포인트 체중 증가 이득 및 10+ 포인트 사료/증가 이득은 당해 생성물이 가금류 산업의 미래를 위한 매우 귀중한 도구일 수 있음을 강력히 제시한다.
Figure 112006062856872-PCT00026
본원에 기술한 특정 양태는 예시로서 나타내었으며 본 발명을 제한하지 않음을 이해할 것이다. 본 발명의 주요 특성은 본 발명의 영역을 벗어나지 않으면서 다양한 양태로 사용될 수 있다. 당해 분야의 숙련가는 본원에 기술된 특이적 과정에 대한 무수한 동등한 방법일 뿐인 통상적인 실험을 사용하여 인지 또는 확인할 수 있을 것이다. 이러한 동등한 방법은 본 발명의 영역 내에 있는 것으로 간주되며 본 청구항에 의해 포괄된다.
본 명세서에 언급한 모든 문헌 및 특허 출원은 본 발명이 관계된 분야의 숙련가의 기술 수준을 나타낸다. 모든 문헌 및 특허 출원은 각각의 개별 문헌 또는 특허 출원이 참조 인용되어 있음이 특별히 그리고 개별적으로 제시된 바와 같이, 동일한 정도로 본원에 참조 인용되어 있다.
본원에 개시 및 청구된 모든 조성물 및/또는 방법은 본원에 비추어 불필요한 실험 없이 제조 및 실행될 수 있다. 본 발명의 조성물 및 방법이 바람직한 양태의 관점에서 기술된 반면, 당해 분야의 숙련가는 본 발명의 개념, 정신 및 영역을 벗어나지 않으면서 본원에 기술된 조성물 및/또는 방법 및 방법의 단계 또는 단계 순서에 변형을 가할 수 있음을 명확히 이해할 것이다. 보다 특히, 화학적 및 생리학적으로 관련된 특정 제제로 본원에 기술된 제제를 대체할 수 있으며, 동일하거나 유사한 결과가 달성될 것임이 명확해질 것이다. 당해 분야의 숙련가에게 명확한 이러한 유사한 치환 및 변형 모두 첨부된 청구항에 의해 정의된 바와 같이 본 발명의 정신, 영역 및 개념 내에 있는 것으로 사료된다.
참조 문헌
Figure 112006062856872-PCT00027
Figure 112006062856872-PCT00028
Figure 112006062856872-PCT00029
<110> The Texas A&M University System <120> COMPOSITIONS, METHODS AND USES FOR A NOVEL FAMILY OF PEPTIDES <130> TAMU 1007 <150> US 60/540,569 <151> 2004-01-30 <160> 28 <170> KopatentIn 1.71 <210> 1 <211> 13 <212> PRT <213> Artificial <220> <223> synthetic oligonucleotide <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Orn <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-Form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-Form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 1 Xaa Leu Xaa Ile Val Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 2 <211> 13 <212> PRT <213> Artificial <220> <223> artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-Form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-Form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 2 Xaa Met Xaa Ile Val Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 3 <211> 13 <212> PRT <213> Artificial <220> <223> artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 3 Xaa Val Xaa Ile Val Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 4 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 4 Xaa Ile Xaa Ile Val Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 5 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 5 Xaa Phe Xaa Ile Val Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 6 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 6 Xaa Leu Xaa Ile Ile Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 7 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 7 Xaa Leu Xaa Ile Leu Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 8 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 8 Xaa Met Xaa Ile Ile Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 9 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of Ornithine lysine leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 9 Xaa Met Xaa Ile Leu Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 10 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 10 Xaa Val Xaa Ile Ile Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 11 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 11 Xaa Val Xaa Ile Leu Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 12 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 12 Xaa Ile Xaa Ile Ile Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 13 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 13 Xaa Ile Xaa Ile Leu Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 14 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 14 Xaa Phe Xaa Ile Ile Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 15 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 15 Xaa Phe Xaa Ile Leu Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 16 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form ofleucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 16 Xaa Leu Xaa Val Val Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 17 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of Ornithine lysine leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 17 Xaa Met Xaa Val Val Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 18 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 18 Xaa Val Xaa Val Val Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 19 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 19 Xaa Ile Xaa Val Val Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 20 <211> 13 <212> PRT <213> Artificial <220> <223> Artificial sequence <220> <221> MOD_RES <222> (1)..(1) <223> 4-methyl-4-[(E)-2-butenyl]-4,N-methyl-Threonine <220> <221> MOD_RES <222> (3)..(3) <223> D-form of Ornithine <220> <221> MOD_RES <222> (7)..(7) <223> D-form of lysine <220> <221> MOD_RES <222> (9)..(9) <223> D-form of leucine <220> <221> MOD_RES <222> (11)..(11) <223> D-form of tyrosine <220> <221> MOD_RES <222> (13)..(13) <223> C-terminal Alcoholic Valine <400> 20 Xaa Phe Xaa Val Val Val Xaa Val Xaa Lys Xaa Leu Xaa 1 5 10 <210> 21 <211> 50674 <212> DNA <213> Artificial <220> <223> artificial sequence <400> 21 attcgttgga tccagtgtgg tggaattcaa accctcagtg ggtaaagata ttgccagagt 60 cttgaaatgt accaaacagg gaaatgggta ccttgaaggc gacaaatatg tagtaacctg 120 ggcatttggc catctggtta cgctggctga tcctgaagcc tatggagaga catataaagc 180 ttggaagctg gaggatttac cactgttgcc gtctcgcctg caattaactg tcatcagaca 240 gagctccaag caatatcaga ttgtaaaaaa attattagcg cgtcaggata tttcagaagt 300 gattattgct actgatgctg gtcgtgaagg tgagctggtg gcgcgatgga ttttagaaaa 360 ggcacatgtg aaaaagccta ttaaacgact atggatttcc tctgtgactg ataaagcaat 420 cagtgatggc ttcagaaagc tgcgagatgg caaggaatac gagaatctct atgcttctgc 480 tgtagctcgc gctgaagctg actggtttgt cgggatcaat gccactcgtg ctcttacaac 540 gaagcataat gcccagctct cctgcgggcg tgtacaaact cctacagtgg caatgattgc 600 caaacgtgag gaggagattc aaaggttcgt tcctcgcccc tattatggtg ttcaagcgat 660 cacaggtaat ggattaaagc ttacgtggca ggatcagcaa accaaagata tgaagacgtt 720 taccaaggag aaggctgaga aaattgtcga aagcagtaaa aacaagcaag ctgaaattat 780 tgacatcaag aaggctgaca agaaaagctt cgccccagct ttatatgatc taactgagct 840 acaacgtgat gcgaataagc gttttggttt ttcggcaaag gaaaccctct ccattatgca 900 agggctatac gaaacacata aggtactcac atacccgcgg acagattctc gctatttgac 960 atcagatatt gtcgaaacat tacctgatcg attgagagcg atatctgtta agccatacac 1020 tccgtttgca gctaagctgt taaagcaacc gattcgagct ggtaaacatg tagtggataa 1080 tagcaaggta tctgatcacc atgcgattat tccaactgag caatctgtgc tgttaaataa 1140 gcttagcgat aaggaacgta aaatttatga ccttgtggtt aaacgctttc tggctgtgct 1200 atatccgcct tttgaatatg aacaaattag tattcgtgcc cgaattggca acgaggaatt 1260 tctagcaaaa gggaagacga taacgcatca gggctggaag gaaatttatg ataatcactt 1320 tgatgaagag gatcaaggag atggattaaa agaacagctt ttaccaacgc ttgtacaagg 1380 tgagcaacta tctgtacaaa ccgtttcttt tacaaaaggg gaaacaaaac ctccagagcc 1440 atttacggag gctacactcc tttcagctat ggagaatcct gtccgttata tgggacaggt 1500 tgataagcag ctagccaaaa cattaggtga gacaggtgga ttaggaactg ttgctactcg 1560 cgccgatatt attgaaaaat tgtttaatag cttcctcatt gaaaagcgca gcaagcatat 1620 tcatattact tctaaaggaa agcaattact tgagcttgta ccagaaggac ttcgctcacc 1680 ggctcttact gctgaatggg aagtgaagct tggagcgatc tcgaaaggaa gcctggctaa 1740 aaacagcttc atacaggaaa tgaagaagta tgcagagcaa atcgttcaac agatcaaatt 1800 tagtgagcaa aagtttcgtc atgacaatct gactcgctcc aaatgcccgg attgtggaaa 1860 gctgatgctt gaggtaaatg ggaaaaaagg aaaaatgtta gtttgtcagg atcgtgagtg 1920 tggtcaccgt aaggccgtat ccaaggttac aaatgccaga tgcccacaat gtcgaaagaa 1980 gatggagatg cgtggggaag gagaaggaaa gatattcgta tgcaaatgcg gacatcgtga 2040 aaaactgtcg acgtttaacg acagacgtag caaggagaaa cagacaaatg tttcgaaacg 2100 agatgtagcc cagtatatga aaaatcagca acgagatcaa gaaagcttag gtaatccagc 2160 cttgatggag gcattaaaga attttaagct agatcagtaa gtcattttat atagaaaaga 2220 taggctcgaa aataaggcgc ccgctctctt tattagctaa gagaaagggc gtctatttta 2280 gcttctcttt tctatatgga aaaaaggaat taacaaaatc tgaagaaaat ttcagaattt 2340 attattttta tgttaagaga ttttgaaaga agtgcatcta tttactttat ccataaatga 2400 aagcaaaaat gagattgtta tattccataa aatgtaaatg tttttatatc ttggaaaaca 2460 tagagtcgag aacgctgttc actatacaag aagactatag atacgagctt ttacggctat 2520 ttttacgatt tgataacgcc ttcttttttt agtctaataa aaaacagtaa cgaatcgaaa 2580 aaataacaat aatttgattg gtaaataaca ttgttactaa ttcacagaaa acaaaatcat 2640 tatttttaca taataaaaac ataataataa aatgtgatag aaaaatattg aagaaaatgt 2700 ccattattgg tagtattgaa aaataaacct gtaattttat gtattataat gcaattattt 2760 gtcgcatatt tactagcata aatgttagcg atgatgtgag caaatcgtta cctgttagaa 2820 ggaagatcag ctacatatga ttcaaaattt ttcgtttttt tattttaaaa gacaaagagg 2880 tggtcctgat ggatttatct acattaaatt ttttgggtga aacagaaaag cataagttat 2940 tgaatcaatt caatgatacg gacgctaatt ttcctcagga gatgaccatt catgggctgt 3000 ttgaaaagca agtccaagaa agaccgaatc aaactgcggt aatttttaat gaacaaagta 3060 tgacgtataa agaaatgaat gaacgagcca atcaagtagc acatagctta cggaagcatg 3120 gagctgctcc agatgagatc gttggaattc tagcagatcg caacatggac atgcttattt 3180 ccattctcgg cgtattaaag gctggagctg cttatatgcc tattgatcct acatacccta 3240 cagaacgtat tctttatatg atccatgata gccagaccaa aattgtctta gctgaacata 3300 gagagatggt tccggaaggc tgtaatgcag agctgatcct cttgcacgat agctcccttt 3360 taaacgaaga gacatctgat ctagagcatg taaataagcc tgaagatttg gcctatatta 3420 tctatacatc aggttctact ggtaaaccaa aaggggttat gattgaacat cgaaatgtca 3480 ttcgcttgct atttaatgac agaaacctat ttgattttac tagtgatgat gtctggaccg 3540 ttttccattc gttctgtttt gacttctctg tttgggagat gtatggggct ttactgtatg 3600 gaggaaaaat cgttctcgtc tcttttgaga tagctagaga tcctcaggcc ttccgagatt 3660 tacttcagga gcaaaaggtt acgattttaa atcaaacccc tacagctttt tatcagctct 3720 cgtctcaaga gatgcagcac tcagacagca atctatcgat tcgtaaaatc atttttggtg 3780 gagaagcgtt gacgccatca cagttgaaag catggaaaca aaaatatcca aatacagcct 3840 tgattaatat gtacggtatt acagaaacaa ctgttcatgt gacttataag gagtttcaat 3900 tacatgatat ggacagcaca gttagcaata tcggaaagcc tatcccaacg cttagaacct 3960 atgttttaga ttccaagaga aacctagctc caattggagt gaaaggtgaa ctgtatgtga 4020 gcggcaaggg agtagcccgc ggttatttaa acaaacctga attgacggaa gaacggttta 4080 tggataaccc gtttgttgct ggagaaagaa tgtatcgcac aggagaccta gctagatggc 4140 tacctgaagg agagctagaa tatctaggca ggattgacca tcaggtaaaa atcagaggct 4200 atcgcattga actcggagaa atagaagccg agctattgaa gcaaaaaggg attaaagaag 4260 cagtagtttt agttacaaat gataaagatg cacaaccaca attacatgcc tatttaacat 4320 ctaaggaaga tttggcagca gcagatcttc gtaatcaact tactacaaca ttaccctctt 4380 acatgattcc ggctcatttc atttttgtgt cgcaaatgcc tgttacgcca aatggaaaaa 4440 ttgataaaga atcacttcgt aaaatagaac catcacttca agaaagccct acagaagctt 4500 atgtagctcc acaaacacct acagaaaagc aattagtcca catatgggaa gaaaatattg 4560 gaatgcaacc gatcagcata gacgataatt attttgctct aggtggtgat tccatcaaag 4620 cgattaagct attgcatgct ataaataaag agtttcagat tagtttccaa attggagatt 4680 tgtataagca tggaaccatt agagaaatgg gacagcaaat cggtgaaaag ggcaagcaat 4740 ctagcaatca aaaactgttg aaacttcagg aattggaccg tttaaaagag aaaattttgg 4800 gaagtgagaa atagtcatgt cggataagct aagcaacgct aaagacctat ttccaatgag 4860 cgatatacag ctagggatgg tctaccattc gttaaaacat gtacacgaag ctgtatacca 4920 tgatcaattt gtttatcaag tagatgatga ttcatttgat gttcatgtgc tagagcaagc 4980 gatgagaatg atggttgata agcacgacat cttaaaaacc agctttcata ttgaggaatt 5040 ttccactcca gttcaagtag tgcaccagga ggtttctgtt cgaattgatg agacagacat 5100 tacgcatctg ggagaaaaac aaaaagagta tatccatcag tatttggcac aggatcgtca 5160 atcccctttt gatgtaacaa ccgctcctct atggagaatg agcgttttta aactgaatgc 5220 aagccaagtt gctttagtct ggatctttca tcatgctatt ttggatggat ggagtgttgc 5280 atcttttatt acggaattaa ttgatgttta tttcaaatta aagcacaaaa cttgcacttt 5340 ggagcatttg aacacgacct ataaggatta tgtgattgat cagatgctat tatctgagca 5400 aaatgagctg cgtgaatatt ggaaagaaga attaaaagat tacaaacggc tacagctccc 5460 agtaaaagtg gatgaaaatg gcggtgttca cgttaccgtt gttgagaagc tagaccctga 5520 cattataaat aaatgcagag aaattgcaca agctcatcac attccattaa agaccgtatg 5580 cctaacagcc tttctttcta tgatgcatat gatttcttat gagagagacc tgactgtggg 5640 attgattgag aacaaccgac caattataga agatgctgaa aaggtgttgg gatgttttct 5700 taactcagtt ccattccgcg ccattataaa gaaagatatg agctacagag agctattaga 5760 gcagacacag caaaagcttg ttgagattaa aacatatgga agactttcct ttgctaagat 5820 tattgaagta attggcgata cgggaagcga gcgtaatcca gtttttgact gtctttttaa 5880 ctttgtcgac ttccatgtat ttaaagggat aaaggatcat aaagtaaagt tttggttaga 5940 tggatatgaa aaaacaaaca ccatgtttga cttttctgtt tcgaccacaa tggatgacta 6000 ttttgttcgg gttgtatctg cactgccaga agaagatacg ataaaactaa ttaactatta 6060 tcaacgaatt ttagaaaaga ttgctcttca catagatgaa aaaatagata aacaagccaa 6120 tcttgatgaa aaggaaagcc acttgctgct agaggaatgg aatcaaacgt cagttgatta 6180 tccagacaag caaacattgc ataaacggtt tgaggagcaa gtagccaaaa atgaagatca 6240 ggtagcgctg gaatatgagg ataagcagct tacctatagg gaattgaacg ctaaagccaa 6300 tcaattggca cgtgttttac agaagcataa tacgctgcca actcaggtag ttggtctaat 6360 ggcagagcgt tcactagaga tgataatagg cattcttggg atattaaaag ccggcggagc 6420 ttatatgcct attgacccta cgtatcctgc ggagcgtatc caatatatgc tcgaagatag 6480 tcgatcctat ctcttacttg tacaaaaagc agaaatgatt ccagccaatt atcaggggga 6540 agtacttatc ctcacagagg aactttgggc agatgagaat acagagaacc tggaactagt 6600 caatcagccg caggatgttg ccaatatcat gtatacatct gggactacag gaaagccaaa 6660 aggtatcctg atcactcatc gaaacattat gactaccata atcaacaatg gctatctcga 6720 tattttttca acagatcgaa tattgcaaat atctaactat gcttttgatg gttctacctt 6780 tgatatatac agtgctttgc taaacggagc tactctcgtg ctagttccca agcaaacact 6840 catgaatacg accgatctgt tagcaatcat caaagatagc aatatcacgg tagctttaat 6900 gacaacctct ctattcaata cgttggttga tcttgatgta accagcttcc aacatacacg 6960 taaggtttta tttggcgggg aaaaggcttc atgtaagcat gtagaaaaag cattggatta 7020 tttgggtgaa gggcgcctag taaatggata tggtccgaca gaaacaacgg tgttcgctac 7080 tacctataca gtcgataaca cgattaaaaa gctgggaagt atcccgatcg gacgtccttt 7140 gagcaacact tcggtatata tttttggatt agatgatcaa ttacaaccac ttggagtacc 7200 aggggagtta tgtgtagcag gagaatgcat ttcgcctgga tatctgaatc gtcccgactt 7260 aacggcagac aaatttattg ataatccact taaaccaggt gagagaatgt accgtacagg 7320 tgacctagtt cgttggctgc ctgaaggtgt catggaatac atggggcgga ttgatgaaca 7380 agtcaagatt cgtggacatc gtatcgagct aggggagatt gaggcaaagc tgcttgagca 7440 tccttcgatt cgagaaacag tgctggtggc taaacaggat gcaaatggcc attctttttt 7500 aggtgcgtat cttgttacag acaacttctg ccctgtaacg gaattacgga attatctgat 7560 ggaaaccttg ccagaatata tggttccttc ttattttatc gagctggata gcctaccgct 7620 tacttcaaat ggaaaagtag ataagcgagc attgcccgaa ccggaatctc aggctttaca 7680 cgcatatacc atgccggaga atgagacgga agaaaaattg gttcagctat tccaggaagt 7740 gatggatgta gagcgtgttg gtactcaaga tagcttttat gaattaggcg gtcattcctt 7800 aaaagcaatg cttttggttt cacgaattca taaggatttt ggaataaaga taccgttgaa 7860 ggaagtattc agtcgtccga ccgtgaagga attggctgcc tatctgactg ggtcagaaga 7920 agcaaactat attgaaattg aagcagcaga agagaaacca tactatccag ttactgccgc 7980 ccaaaaacgg atgtatatcg cccagcaatg ggaggatggg gaagccacta gcagttatca 8040 catgccgttt atgatggaaa tcacagggcc tcttcaagta gaaaagctac aacaaacagt 8100 aaagagtctt gtcgcaaggc acgagtcgtt gcggacatca tttcacatga tcaatgaagt 8160 attgatgcaa aagatacatg cagatgtatt gtgggattta gacattgatc tagagtcagt 8220 tgtcgcttca gagcaagaaa ttgatgaaaa aatgttccaa ttcctccgca aatttgattt 8280 gagtcaagct cctctcttta gagctaagct gattcgtgtc aatgctagtc ggcatgtatt 8340 gttattagat atgcaccata ttatttcgga tggattttca taccagatat tttttgatga 8400 gcttaccaag ctgtatcagg gcgatgaact gccatctctc aaaatacaat ataaggatta 8460 tgccgtttgg cagcattcgg aagaacaaca gaagcgtttg caacagcaag aggattattg 8520 gttaggtcaa ttccaagggg aaattcctgt tctggaattg cctacggatt accagcgccc 8580 ggttgataaa cagtttgctg gagcattatt cacacacggg ttatctgctg gtctaacaga 8640 gaagctgaga aaattagcga ttaaggaaaa aacgacgtta tacaccgtac tgctgacggt 8700 ctataacatt ctattgagca aatatacaag tcaagaggac ctcattgtag gtacaccgat 8760 tgctggacgt ccacatgctg atttagacag agtatttggg atgtttgtaa acacgctggc 8820 catcagaaca gctccaaaag tagagcattc cttcttaacg tatctatctg aggtcaaaga 8880 aacagtgcta ggtgcttatc aaaatccaga ctatccattt gaggagctgg ttgaaaaaac 8940 gctagttcag cgcgatgtaa gccgtaatcc tttattcgat gtaatgttct ccgtagagaa 9000 attaccatct gctgtacagt tcgatgattt acgtttctgc ccacgcttat ttgattggaa 9060 gaaggcaaaa tttgacttgg attggacagt ggtggaaggt gaatcattgg aggttttggt 9120 tgaatatagc acgagcttgt tcgatcgggc gaccattgag cgcatggcta agcattttga 9180 gcatattttg gagcaaatcc ttgatcagcc agacctgtct atttctgaga ttgaactgct 9240 gaccgaggca gaaaaacaac aaattttgat tgagtttaat caatcggata aatcctttga 9300 cagcgaaaaa acaattcagg agcaatttga agaatgggca gaaaaagccc cgcacagcat 9360 tgccttagtc tttaaagaca agcaaatgac ctatcaggaa ttaaatcaac gtgctaacca 9420 agttgcgcat ttattacgtg gcaatgggat ttccgcaaat gattttatcg gtttaatggt 9480 ggatcgatcg tttgagatga tcattagtat gctaggtatt ttgaaggcgg gtggagccta 9540 cctacctatt gatcctgatt atcctgagga ccgtatcgat tatatgttat ctgacagcaa 9600 agcgaagatt ctcttaaagc aaagtgacca aactgcacca gcttcctttg aaggtaaagt 9660 catcgctatt gatactccag aattgctaga gatggatata gaaaatattc ctaaggtgaa 9720 taactcatcc gacttggctt atatcattta tacatctgga tcaaccggaa aaccaaaagg 9780 agtattgatt aatcatcgat gcgtgatcaa tatgcagctt acagctgaaa cctttggtat 9840 ctatccttcg agtcgtattc tacagtttgc atcctttagt tttgattcat ctgtgggcga 9900 gattttttat acattattaa acggagcatg cctgtatttg gtagaaaagg atttgctttt 9960 atccggtaat gaattcgtgg catggctaaa gaaaaatcgg attagctcga ttccatttat 10020 ttcaccgtcg gctctgcgga tgcttcctta tgaggattta cctgatctcg catatataag 10080 tacgggtggg gagacattgc cggctgacct tgttaaagcg tggggagaaa atcgtgtctt 10140 cctaaatgca tatggcccga cggaaacaac tgtagatgcc actgtcggtg tatgtacacc 10200 agaagggaaa ccgcatatcg gtagacccgt tacgaataaa aaggtgtacg tagtaaatag 10260 taacaatcaa ttacagccga ttggtgttcc tggcgagctt tgcattggcg gggaaggggt 10320 tgcacttggc tatctaaaca gacctgatct aacccaagaa aaattcgttt ccaatccgtt 10380 tgccccgggt gaaagaatgt accgctccgg agacttagtc agatggctac ctgatggaac 10440 aattgagtac ttcggaagat tagacgatca agtaaaaatt agaggtcacc gtattgaact 10500 aggagagatt gaaacaaggc tactagagca tccatccatt aaagaagcca ttgtcattcc 10560 acgttctgat gagtcagagg ctacatattt atgcagctat ttgattgcag aaggatcatg 10620 gaatgcggct gacttacgta agtatttgaa ggcttcttta ccggaatata tgataccttc 10680 gtattttgtg gagctgcacg agctaccgct aacacctaat ggaaaagtta ataaaaaagc 10740 attaccaaaa ccagaaaagc aaatgcagag agggaaggat tatgtagccc ctactaaccc 10800 tatccaatcc attttatctc agatttggac tgatgtgctt ggtgttgaaa atataggaat 10860 tcacgacaat ttctttgaat taggtggaga ttcaattaaa gccatccaaa tttcagctcg 10920 acttaataag cataatctca aggttaaaat gcgggaattg tttaagaacc caacgattgc 10980 tgagctaagt ctgcttgtac aacagatcgt tcaggagatc gatcaaggag tagtagaagg 11040 aaatattccg cttacaccga tccagcattg gttctttacc caatcattcc cgcaggtcaa 11100 ccattacaat caatcggttc ttctttttaa tgcggagggc tgggatgagc agaaagtaga 11160 caaagctttt gagatgctaa cccagcacca tgatgcactg cgaatcgtat atagcctcga 11220 cgagcaaggg gttgtacagc gtaaccgggg attggaaggc tcgaactatc atttcgaaat 11280 cattgatgca agacaagatg gagaagatca gtcgaactgg aaagcagcgg cgaatcggat 11340 gcaggcaagt atggatatcg tagaaggacc tttagtgcag atcggattgt tccgtgctaa 11400 tgaaggagct tatttgttaa ttgccattca tcacttagtg gtagatgggg tgtcttggcg 11460 tatcctacta gaagacttct atcatttata taacggaaac gactctttgc cattaaaaac 11520 gacctcgttc caagcatggt ctcaaaagct ccaagagtac gcccaaagca aggagctaga 11580 acatgagctt tcctattggc gccatttaga tgaagctatc acggactata ccttacacaa 11640 agatatagaa gccgcaacct caaataagac aacctatgag gaatttttaa ctgtatcgat 11700 gtctttatca actgaggaaa cccaacagct agtaacagag gctcataaag cgtaccaaac 11760 ggaaataaat gatctgctac tcacggcact ggctttagct ttgaaggaat ggacgaataa 11820 agagcagttg ctagttagta tggaggggca tggacgtgaa gaaattctag ataacgtaga 11880 tatctcccgt acagttgggt ggtttacatc agagtatccg gttgctattc atctgacgaa 11940 aacagacatt tcgtttgcca ttaaacaagt aaaggaaacg ttgcgtcgtg tacctaacaa 12000 agggtttggc tatgggattc ttaaatattt ggcaaaagag acgttcaagc ttaagccaga 12060 aatcagtttt aactatctag gccaatttac agataaggaa gaggggaact cctctttaat 12120 gggtgatctg attagcccgg caaataccag tgagctgtcc ctagatatca atggaagtat 12180 agaagctgac agactgcaaa tgcactttag ttataactct cgtgcgtact atccagagac 12240 aatcgcaacc cttgttcaaa acttcaaatc ctacttgctt gagattatca atcattgccg 12300 ggcgaaagaa ggagtagagc atacaccaag cgactttgat atcaatgatc tcaccatgga 12360 agaactagat gatatttttg atgacctgga agaagaggta tacaaataac taggcaaaaa 12420 tatggagtga tttagatatg tttagcagaa gtaatgtgca aaatttgtat cgcttatctc 12480 ctatgcaaaa agggatctta tttcattcct taaaagataa agaaaatcat gcctattttg 12540 atcaactgat cttcactttg gaaggtaagg tagagcttga atatttggaa gaagccttta 12600 cccaattaat caaaaagcat gatattttac gaactgtttt tcgttacaaa aaagtaaaag 12660 aacctgtaca aatggtatta aaggaaagaa gctccactat ttattttgaa gatatttctc 12720 atctggagcc agaagaaaaa gtgaattaca ttaagcagtt taaaatgagg gatcgggaga 12780 aggggtttga cctctcccgg gacctcctca tccgaatgtc attatttaag cttgatcagg 12840 agcagtatca gttaataatg agtaatcacc atatcattat ggatggttgg tgccttggca 12900 ttatccttac tgatttctta cgtatgtata aaggaatcgt gaatcatacc cctgttccat 12960 acgagcatgt gacaccttac agtaagcata ttcaatggct agaaaaacag gatcatcagg 13020 aagcaaagga tttttatcaa cagctattag agggatacga caaagtaaca ggtgttccac 13080 agcaattagt acgggcgaat cacgaagaat atactcacgg acaatgcatc gtgaaattaa 13140 atcaagaaac tgccgaccga ttgattgcca tagccaaagc ctaccaggtt acagtcaata 13200 ccgtcttcca aacgatttgg gggatattat tacaaaaata taataatacg gatgacatag 13260 tatttggatc agttgtctcg gggagaccgg cagagattcc tgatgttgaa aaaatggttg 13320 ggctatttat caatacaatt cctgtgcgaa tcaaagctga tcaacaagag cgatttgaca 13380 cgctagtagc caaagtacag gaaatggcct tggcttcaga atcatatgat tatctttcgt 13440 tggcagatat tcatccagaa gctggcgatt ttatcaatca tattattgcg tttgaaaatt 13500 tttatatcga tatggacagc tttaatcagc tagcagataa aaaagagctt ggattctcgc 13560 tcgcattcgc cacagatcat cacgagcaaa ccaattatga tctaagtgtg caggcgcaga 13620 ttggtgatga atcttccatt aaaattttat ataattccaa gctttataca tcggaataca 13680 tagcaaatgt aattgatcat tttgttactg tggctgacat agtggctgct aatcctagca 13740 tccctgtaaa ggaaatcgat attttaacaa aagataaaaa agatcagatt ctctatggtt 13800 ttaacaatac ctatgcagat tatccaagag agaagaccat ccatcagcta tttgaagaac 13860 aagtagataa aaatccgaat cagatcgcac ttgtgtttaa agaagagaag ctgacttacg 13920 gtgaggtaaa tgcgaaagca aatcagttgg catacgtgtt aagaaagcaa ggtgtacagc 13980 ctaatgatgt aatcggcatc atcaccgaac gctccccaga aatgatcata ggcattttgg 14040 cgatttttaa agcaggcgga gcttatatgc caattgatcc ttcttatccg gctgaacgca 14100 ttcaatatat gctacaggat aatcaaacga agctattatt agtgcaaaaa caagaaatga 14160 taccagccaa ttatcaggga gaggtattgt tcttaaccca agagagttgg atgcatgagg 14220 aaacatctaa tccggctcat attactcaag cacaggcttt agcatatgtg atgtatacct 14280 ctggttctac aggagagcct aagggcattt tgacaacaca tcaaaatatt atgaagaccg 14340 tcattcataa cggttatgtt gagattacgc caggagattg cttgtcgcag ctctccaatt 14400 atgcctttga cggctctacc tttgaaatct atggggcatt attgcatgga gctacattac 14460 ttttagtaac aaaagaggct gtactcaata tgaatgagct ggcacgtctt attaagaagg 14520 agcaagtgac ggtttccttc atgacgactg ctctgtttaa tacactggtg gatttggata 14580 taacgtgctt tcaatcgata cgaaaggtgt tgttcggagg agagcttgct tcggttaagc 14640 atgtcctgaa agcccttgat tatttaggcg agcaccgggt tatcaatgtg tatggaccaa 14700 cggaaactac cgtgtatgct acctattact ctgtagatca ctccatgctg acgagggcat 14760 ctgttcctat cggaagaccg attaataaca cgaaagctta cattgtaaat acagatggac 14820 agcctcagcc aataggagta gtcggtgagc tatgcattgg cggtgagggg gtagcatgtg 14880 gttatcttaa ccgtccagag ctgacaaaga aacatttcgt ggataatccg tttgtcttgg 14940 gtgaacgaat gtattgtacc ggagatttag cccgcttttt accagacggc aacatcgaat 15000 acatcgggcg gatggatgaa caggtaaaga ttcgtggtca ccggattgag ctgggcgaaa 15060 tcgaaaaggt tcttttacag cacccagcta tcagcgagac agtgctttta gcaaaacgag 15120 atgagcaagg ccattcctat ctgtgtgcgt atatagtagg tcaggtattt tggactgtta 15180 cagagctgcg tcaacacttg atggaatcct tgccagaata catggtgcct tcctacttta 15240 tcgagattga gaaactaccg cttacggcaa acgggaaggt agataagcga gcgttgcctg 15300 aaccagacag aaaaatgggc agtgcttacg ttgctccaga gaacgaaaca gaggagaagc 15360 tggttcaatt tttccaagag attttgggtg ttgagcgagt tggcacgcag gatacatttt 15420 tcgagcttgg tggtcactcc cttaaggcaa tgatgctcgt tttacagatt cataaagaaa 15480 tgggcattga agtcccgtta aaggagatat ttacacgtcc taccatcaaa gaattagcgg 15540 cgtatattca taagatggat cgctctgcct acagcatgat tgagccaact gccaaacaag 15600 agtattatcc agtctccttt gcccaaagac gaatgtttgt agtgcagcaa attagagata 15660 cgaatacaac cagctacaat atgccgattt tgctagaaat agaaggggct cttgataggg 15720 aaaatgtgag acaaactctg aagaaattga tagagcgtca tgaatcaatg agaacgtcat 15780 tccatatgat tgacgagacc ttgctacaaa aggtgcatga tgatgtgaca tgggaaatgg 15840 aggagatgga agcgtctgag gaagaagttt atgctttgac aaaatccttc attcgtcctt 15900 ttgatctcgg tcaagctcca ttgtttagag caggattaat tcgtgttaat tctgagcgtc 15960 atttgctgct gctagatacg catcacatta tctcagatgg cgtatctact aacatactct 16020 ttcaagattt tacgcaatta tatcgtggac gagagctgcc tgccctgcga attcaataca 16080 aggatttcgc cgtctggcaa caaggagagg ctcagcttgc tcgtttgcaa gaacaagaag 16140 aatactggct gaaacaattt tcagagagtg tgcctgtact agagcttcct actgattttc 16200 cacgtccagc gatgcagcag tttgatggtg acgtattgga ctttgcatta aatcagcaag 16260 tatggcagga attacaacag ctcattgtta aagagggctg tacggcttac atgatattgc 16320 tggcggctta tcatgtcttg ctttccaagt attcgtcgca aaacgatatt gtgataggtt 16380 ccccgatagc aggccgaaca aatgctgatt tgcaatcgat tgtcgggatg tttgttaaca 16440 cgctggctat ccgcaccaaa tcagagggaa ctcagacatt ccgcgagttt ctctctacga 16500 ttaaacaact ggttcttcaa gctcaatcca atgcagagta tccatttgaa gagctggttg 16560 ataaggtaaa tccaagtcgc gatctaagtc gccagccttt atttgacaca atctttgtca 16620 tgcaaaacat ggatattacc gaggttgcga tacaaggtct ttcaatcgta acgaaggaca 16680 tggaatggaa gcattcaaaa tttgatctta catgggcggc tgtagagaaa gaatccttgc 16740 atttttcagt tgaatatagt acccgcttat ttaagaaaga aacaatcgag cggatggcga 16800 agcattttgc ccatttgcta aatcaagtgg cggaaaatcc tgacttgagc ctttcagata 16860 tggaattggc aacggatgaa gaagtgtacc agcttttgga ggagtttaat aatacagaag 16920 ctgattatcc gagtgataaa acgattcacc agcagtttga gcagaaggta gaggaaaacc 16980 ctgatcagat agcgttgtta tttaaagata aggaaattac ttacggacag ttgaatgcaa 17040 aagcaaatca atttgctcgc gtattaagaa agcatggggt acagccggat caagtggttg 17100 gattaatcac tgatcgttcc attgaaatga tgataggaat tttggcaatc ttaaaagctg 17160 gcggagccta tttgccaatt gatccttctt atccattaga acggattacc tacatgctag 17220 aggatagtca ggcacagctt ttgattgtgc aggaagctgc tatgattcca gaggggtatc 17280 agggcaaagt attgcttcta gcagaagagt gttggatgca ggaggaagcg tccaacttag 17340 agttgattaa tgatgcccag gatttggcgt atgtgatgta tacctcaggg tctactggta 17400 agccaaaggg caatctgacg actcaccaaa acattttgag aaccatcatc aacaatggat 17460 ttatcgagat tgtaccagca gaccgtctat tacagctatc gaactacgcc tttgatggct 17520 ctaccttcga tatctacagc gcgctattaa atggagccac tcttgtactg gtgccaaaag 17580 aggtcatgct aaatccaatg gagctggcga ggatcgtccg cgagcaggat attacggttt 17640 cgtttatgac cacgtccctg ttccatacgc tagtggagct tgacgtgact agtatgaaat 17700 ccatacgcaa ggttgtattt ggtggggaaa aggcttcata caagcatgta gaaaaggctc 17760 tggattatct cggagaaggc cgtttagtaa atggatacgg ccctacagaa acaaccgttt 17820 ttgctaccac atacacggtg gattctagta tcaaggaaac gggaattgta ccgattggcc 17880 gtccgttaaa caatacgagt gtctatattt tgaatgagaa taatcaacca cagccgattg 17940 gagtaccagg ggaattgtgc gttggcggag caggaattgc acgtggatat ttaaaccgtc 18000 cagagctgac agcagagcgc tttgtggata atccgtttct tgtaggagat agaatgtatc 18060 ggacgggaga tatggctaga ttcttaccag atggcaacat tgagtacatc ggacgaatgg 18120 atgaacaagt gaagattcgc ggacatcgaa ttgaactggg cgaaattgaa aaaagtctcc 18180 tggagtaccc tgctatcagt gaagcagtac ttgtcgcaaa acgtgatgaa caaggtcatt 18240 cctatctgtg cgcttatgtt gtaagcacgg atcaatggac ggtggctaag gtacgtcaac 18300 acatactgga ggctctgcca gagtacatgg taccatccta tttcgttgag cttgaaaagc 18360 tacctcttac ttctaatggc aaggtagaca agcgtgcatt gcctgaacca gatcgagtga 18420 ttaccaatga gtatgtggcg gcagtcaatg agacagagga gaagctagtt cagtttttcc 18480 aagagatctt agctgtagac cgagtcggaa cgcaggatac attctttgaa ttgggtggtc 18540 attccctaaa agcaatgatg ctggtttcaa gaatacacaa ggaattagaa atagaggttc 18600 cgttaaaaga agtattcgcc agacaaaccg ttaaagaatt agcagcctat atcagacagg 18660 ctgaacagtc ggattacagc gaaatccaac cggccatgga gcaagaatac tacccggtat 18720 ctaatgcaca gcgacggatg tatgtggttc agcaaatgag agatgtagaa acaacaggct 18780 acaatatgcc gttctattta gaaatggagg gtgctcttga ggtagaaaag ctatctctag 18840 ctttgaaaca actaattgag cgtcatgagt cattgcgaac ctccttccat atggttgaag 18900 atgaactgat gcaaaaggta catgcagaag tcgcatggga gatggaaatg attcatgccg 18960 tagaggaaga agttcaacag ctgaccgatt cctttatgcg tcctttcgat cttgctaagg 19020 cgccattatt ccgagcgaga ctcattcaaa tcaatccgaa gcgacattta ttgatgctgg 19080 atatgcatca tatcatctca gatggggtat cgatgaatgt attgttccag gatataacgc 19140 agttgtatca agggatagag ctgagtcctc tcaagattca atacaaggat tttgcggtgt 19200 ggcaacaagg catcgctcag gttgtccgtt ttcaggagca ggaaaggtat tggttaaacc 19260 aattctctgg tgacctacca attttggaaa tggtaactga ttatccacga ccagccatac 19320 agcagttcga cggagattcc tggtcatttg aaattgatgc caaagtattg gacagcataa 19380 agcaattgtc agctaagcaa ggcactacgt tgtatatgac tctattggcg atttatcaaa 19440 tcctgttagc caagtatacc cgtcaagatg acatcattgt cggaactccg atcgcaggaa 19500 gacctcatgc agacacagag agcattgtgg ggatgtttgt caatacacta gccctacgtg 19560 gtcaaccaaa agaagagcaa tctttcatct cttacttatc agaagtgaaa gaaaacgtac 19620 tacaagccta tgccaacgct gattatccat ttgaagagtt ggtagagaag ctgcatttgc 19680 aaagagatat gagtcgtcat ccattgtttg atacgatgtt tgttttacaa aacatggata 19740 tgtccgatat aaatatttct ggtctaaagc ttcattcgcg tgatttaaac tggaaaaatg 19800 caaaatttga tatgacctgg atgatagccg aacaaaataa tctattgatt tcggttgagt 19860 acagtaccaa cctgtttaaa catgaaacca ttcaaaggct agaaaagcat ttcacttatt 19920 tagtagaaca agtggctaag catccggatt gcttactcag agatttagaa ctcacaacag 19980 acgaagaaaa acagcaaata ctgacggtat ttaacgatac tgctactgat gatttacagg 20040 atttatccat ttgccatcta ttcgaacaac aagtgcagcg tttttcagat cggccggcac 20100 ttgtgtttaa agaaaagcag ctcacataca gtgagttcca tgcaaaagta aatcaattag 20160 cccgggtact cagaaagaaa ggtgtgcagc cggatcaagc ggttggatta atcaccgatc 20220 gttccattga gatgatgata gggattttcg ccatcctaaa agcaggcgga gcttatatgc 20280 caattgatcc ttcctatcca atcgatcgga tcgagcacat gctagaggac agccggacta 20340 agttgttatt cgtgcaaaaa acagaaatga tccctgctag ctatcagggg gaggtattac 20400 tcctagcgga agagtgctgg atgcatgaag attcatcgaa tttggagctg atcaataaaa 20460 cacaggattt ggcatatgtc atgtatacct caggttctac tggtaaacca aagggcaacc 20520 tgacaacgca ccaaaacatt ttgaccacca tcatcaacaa tggctatatc gagatcgcgc 20580 caacagaccg tctattacag ctatctaact atgcttttga tggctctacc ttcgatatct 20640 acagtgcgct attaaatgga gccactcttg tactggtgcc aaaagaggtc atgttaaatc 20700 caatggagct ggcgaagatc gtccgcgagc aggatattac ggtttcgttt atgaccacgt 20760 ccctgttcca tacgctagtg gagcttgacg tgactagtat gaaatccatg cgcaaggttg 20820 tatttggcgg ggaaaaggct tcatacaagc atgtagaaaa ggctctggat tatctcggag 20880 aaggccgttt agtaaatgga tacggcccta cagaaacaac cgttttcgct accacataca 20940 ccgtggattc tagcatcaag gaaacgggaa tcgtaccgat tggacgtccg ttaaacaata 21000 cgagtgtcta tgtcttaaat gagaataatc agcttcagcc gattggagta ccaggggaat 21060 tgtgcgttgg cggagcagga attgcacggg gctatttaaa tcgtccagag ctaacagcag 21120 agcgctttgt ggaaaatcct ttcgtgtcag gagatagaat gtatcgtacc ggtgatttag 21180 cacgttggtt gccggatgga agcatggagt atttaggacg gatggatgag caggttaagg 21240 tacgcggtta ccgaattgag ctgggagaaa tagagacaag attattggag catccttcta 21300 taagcgcagc ggttttacta gcaaagcaag atgagcaagg gcattcgtac ctatgtgctt 21360 acatcgttgc aaatggggta tggacggttg cggaactacg taagcatcta agcgaggctt 21420 tgccagaata catggtgcct acttattttg ttgaactaga gcagatacca ttcacttcta 21480 atggaaaggt gaacaaacgc gctttaccag agccagaagg acaaatgacc agtgtatatg 21540 tggccccaga aacggagaca gaagcaaaag tagcagcgtt attccaagag attttgggtg 21600 tcgagagagt tggtacacag gacatgttct ttgagctggg tggtcattcg ctaaaagcga 21660 tgatgctcgt tttacgaatg aataaagaac tgggcatcga ggtgcctttg aaagaggtat 21720 tcgcccatcc tactgtcaag gaattggcag caacgatcga ccttcttgat cgatcaggcc 21780 actcagagat tgagcctgcc ccaaggcagg aattctatcc ggtatcttcc gcgcagagac 21840 ggatgtacgt ggtgcagcat ttaggaaatg tccaaacaac cagctacaat atgccgcttt 21900 tccttgaagt ggagggagct ttagaaattg ataagcttca tctagcactt gagaaattgg 21960 tcgaaagaca cgagtcgcta cgaacctcct ttcatatggt tgacgaagag ctgatgcagc 22020 aggtgcatga agaggtggcc tgggatttag agatcatgga tggaacggaa ggagaccttg 22080 caagcatcac agcaggattt atacgtccgt ttgatctcag ccaagctcca ttgttccgtg 22140 caggcatcgt gcggattagc cctgagagat tccttttcat gctagatatg caccatatca 22200 tctcagacgg agtttctacc aatgtattgt tcaaggatat aacgcagctc tatcaaggaa 22260 aggacctgcc ccctcttccg atacagtaca aggactacgc tgtgtggcaa caagctgatg 22320 ctcaagtgac tcgcttacaa gatcaggaaa gctattggtt acatcaattt gctggagaag 22380 cttctgtctt ggaaatgccg acagatttcc cgcgtcctgc agtccagcag ttcgaaggag 22440 atgtatggac ctttgagatt gatgctgaca ttctcagcca gttgaaaaaa ttatcagtga 22500 gtcagggttc tactctatat atgactttat tggcggttta tcaggtgttg ctggctaagt 22560 ataccggtca agatgatatt attgtcggtt caccaattgc cggacgccct catgcggatg 22620 tagagagcat cgtcggtatg ttcgtcaaca cgctagcttt acgtggacag cctgtaggag 22680 agcagacgtt tattacctat ctggcacaag ttaaggaaca ggttttacaa gcttatgcca 22740 atgcagagta tccatttgag aaattggtag agaagctcga tttacaacga gatatgagtc 22800 gccatccact cttcgatacg atgtttactt tgcaaaacat ggagatgact gatattgatt 22860 tggcaggctt gaccttcaag ccatttgatt ttgaatggaa aaatgccaag tttgacatgg 22920 attggacaat gcttgaggaa gaaacactca aggtagctat tgaatacagt acaagcctgt 22980 atacaaaaga aaccattagc agaatggctc aacatttcac ctatgtttta caacaaatta 23040 ttgagcatcc agccattcgt ttggctgaaa tcaaaattgc tactctacca gaaattgaac 23100 agattttaac gcaatttaat gatactaggg ccaattaccc tgataaccaa accattcata 23160 gtctattcga gcaacaagtg gagcgtacac cagaacagat agctgttgtc tatcaggatc 23220 aatccatcac gtatcgtgag cttaatgaac gtgcaaatag attggcacgt tgcttgatcg 23280 acaaagggat acagagaaat caatttgttg caatcatggc ggatcgttcc atagaaaccg 23340 ttattggaat gatgggaatt ctcaaagcag gaggagctta tgttccaatt gatcctgatt 23400 accctctaga tcgaaagctg tatattcttg aagacagcca tgcatcacta ttattgttcc 23460 agcaaaagca tgaggtcccc tcagaattca caggtgatcg gatattaatt gagcagatgc 23520 agtggtacca agcggctgat acgaatgtgg ggatcgtcaa tacagctcaa gatttggcgt 23580 atatgatcta tacctcaggt tctacaggtc aaccaaaagg ggtaatgatt gatcatcaag 23640 cagtatgtaa cctatgctta atggcccaaa cctatggaat ctttgcgaat agtcgcgttc 23700 tacagtttgc ctcctttagc tttgacgctt ccgtaggaga ggttttccat acccttacaa 23760 atggagccac tctctatctg atggatcgca atttgctcat ggctggcgtt gagtttgttg 23820 aatggttacg agtaaatgaa ataacttcta ttccgtttat ctcgccttct gcattgcgtg 23880 cattgccgta tgaggattta ccagcattga aatatatcag tacaggtggg gaagcattac 23940 ctgtagattt agtcagacta tggggaactg agcgaatctt cttaaatgca tatggcccga 24000 ctgaaacaac agtagatgca acgattggct tatgtacgcc agaggataag ccacatattg 24060 gtaagcctgt gttgaataaa aaagcctaca ttattaatcc aaattatcaa cttcagccaa 24120 ttggggtacc gggtgagtta tgcatcggtg gagtagggat tgctcctgga tattggaacc 24180 gccctgaact aactagagag aaatttgtgg ataatccatt tgcccaaggc gaaagaatgt 24240 ataagacggg ggacttagta cgttggcttc cagatggaaa tattgagttt ttaggacgta 24300 ttgatgatca ggtgaaaatt cgtggacacc gaattgaatt gggtgaaatt gagacgcggc 24360 ttcttgagca tgagcaggta atagaggcgg ttgtgctggc gcgtgaagat gaacaaggtc 24420 aagcttatct gtgtgcttat ctggtagcag cagatgaatg gacggtagca gaactgcgca 24480 aacatctagg aaaaacactg cccgattata tgattcctgc ttattttatc gagcttgagg 24540 agtttccttt gacaccaagc gggaaggtga ataaaaaagc tttaccagag cctgatggac 24600 aaatacaaac gggagtggag tacgtagagg ctactaccga aagccaaaaa atccttgttg 24660 agctttggca agaggtgtta cgtgtcgagc ggatcggtat ttacgataac ttctttgagc 24720 tgggcggtga ctccatcaaa gcaattcaaa tcacagcaag attgcgtcgc caccaccgca 24780 agctggaaat cagccatctg tttaagcacc caacgattgc agagcttgct ccatggatgc 24840 aaaccagtca ggcattactt gaacaaggaa ctgttgaagg cgaagttatg ctcacgccaa 24900 ttcaaaaagc attctttgaa gaaaatcagg aacagccgca gcattttaat caggattcgt 24960 tactgtacag ctcgaatggc tggaaccaag atgcgatcga gcaggtattt gaaaaaataa 25020 cggagcatca cgatgccctg cgaatggtgt atccgcatac cgagggcaag gtgactcaga 25080 tcaacagggg acttgaggac aaggcgttca cattgcaggt gttcgatttt acccaagaac 25140 caactgatac gcaggcaacg aaaattgagc aaatcgctac tcaattgcaa gcgagctttg 25200 atttaaaaaa gggacctctg gtacgacttg gcttatttac caccaaggct ggggattatt 25260 tactgatcgt gatccatcac ctagtgattg acggcgtctc ttggcgtata ttgcttgagg 25320 attttcataa tgcttatcag caagtcattc aaggtcaagc aattgtactt cctgaaaaaa 25380 cgacctcctt taaaacatgg agtgagcgct tgaatgaata tgcaaatagt catgctcttt 25440 tacacgagat tccatattgg aagcagatgg aagaaatatc gatcgcccct cttcctaaaa 25500 aaggaaacaa tgacggtaga tattatgtga aggacagcga atatgccacg atgagtctaa 25560 cagaagaaga aacccaaaat cttcttactc gtgtacatcg agcttatcga acggagatta 25620 atgatctgtt gcttgctgca ttaggattag caagtaagga atggacaaaa gagaatcgag 25680 tggctatcca cttagagggt catggtcgtg aggaaatagg tgaaggggta gatgtcaacc 25740 gcactgttgg atggtttacc tccctgttcc cattcgtgat tgatttagaa aatgacgaat 25800 tgcctctcat cattaaatcg gtaaaagaaa ccttgcgccg agttcctaat aaaggcatgg 25860 gctacggcat actcaagcat ctgacaagcg atgcgaacaa acaggagata accttctcgc 25920 ttcgcccaga gatcagcttt aactatctgg gggtatttga tcaacaagag gaggaaagcg 25980 aatctgctgg gattcctact ggtcagccga tcagcccgca atattatgac acgcacctgc 26040 tggagtttaa tggagcggtc tcgaataacc agttgcatgt aaattgccga tttgctcctg 26100 cagccgttga tcgagcgatt gttgaaattt tgatggagcg cttcaagcac catttacttc 26160 taattagtaa gcattgcttg gaaaaggata ccgtagaatt tacacctact gattttacag 26220 aaaaggaatt aagccaagaa cagcttgacg atctattaga tgatttgttt gaagacatag 26280 atgatctgta atcgcaatga gataggtggt gccacacatc gtgcaaaaaa aagacaagat 26340 caaagatatc tattcacttt ctccgttgca aaagggtatg ctatttcatt ccatgaaaga 26400 cccgcagagc gatgcctatt tcgagcaggt tacccttttg ctggaggggg ttgtaaaccc 26460 aacctatttg gctgaaagta ttcagggact cgtacaaaaa tacgacatgt tccgaagtgt 26520 gttccgctat aaaaaagtag accctgttca ggttgtgctt agtgaacgaa aaatagattt 26580 acagattgag gaccttactc aaatcaatga agaagagcaa cggaaattca ttgaggaata 26640 tagaaaaaag gaccgggaaa gaggcttcga cctttcccgg gatatcctgc tacgttttac 26700 attgtttcaa acagccgcca atcggtatga attactgtgg agtcatcatc atatcctgat 26760 ggatggctgg tgtacgggta tcgtttttca ggatttattt caaatgtacc aacgtcgctt 26820 gtcaggacag gccttacttc cagaggtggc ccctcaatat agcgaatata tacgctggtt 26880 aaagaaacaa gatgaccaac aagcattggc attttggaag gagtatctac aggggtttga 26940 aaaccttacg ggaatcccgc gtctaaggtc aggcaatcat ccctacaagc aagaggaatt 27000 cattttctcc ttgggagagg aagctacaca aaaactaacg caaacggctc aaaagtatca 27060 ggtgacctta aatactgttg tgcaaacaat ttggggagcg ttattgcaaa aatacaataa 27120 cacgaatgac gcggcctacg gtgtggttgt ctccggacga cccgccgagg tgccaaatgt 27180 tgaacaaatg gtggggttat ttagtaatac cattcctatt cgtattaaaa aagaagcagg 27240 aaaaacgttt ggggaagtgc tgaaaaacgt acagcaaaca gcgctggagg cagaaaaata 27300 cggatatctt tctttagccg atattcaggc gagcgcagct tatacgcatc aattgcttga 27360 tcatatttta gcgtttgaaa atttcccgat ggatcaagaa acatttaatc aagaaaacgt 27420 tctcggattt gccgtgaagg atgcccacac gtttgagcag acgcactatg atctgaccgt 27480 gctagtcatt cctggcaagg aattaatctt taagtttatg tataacgaaa gtgttcattc 27540 aaaagagtac ctcaatcttt tagagctgaa tatgaaaaag ctggtctctt tggttattga 27600 gcagcaggat atctttgacc cagctaccga gtttgtatct gatttggaaa aggataagct 27660 tttaaccatt tttaatcgta cggatgcaaa gtacccaaga gaaaaaacga ttcatgagct 27720 gtttcaagag caggttgaca agaaccctga tcaagtggca ctcgtatttg gcgaggctca 27780 actaacatac cgcgagctga acgaaaaggc gaatcaaatg gcccgcggtt tgcgcaaaca 27840 aggggtttta cctgatcagg tgatagggtt acttacggat cgttccttag agatgatcat 27900 agccattcta gcgatcttta aagctggtgg cgcttatatg cctatcgacc catcttatcc 27960 gagtgaacgc attcaataca tgctagcaga tagtcgtacc catttgctat tggtgcaaaa 28020 agctgaaatg atcccagcta attatcaggg tgaggtacta ctgttaacag aagatagctg 28080 gatggacgag aatacagata atttagattt ggtcaaccaa gcacaagacc ttgcttatgt 28140 catgtatacc tcaggttcaa caggtaaacc aaagggaaat ctgacaaccc atcaaaatat 28200 cgtcaagacc atcatgaaca atggttacat ggagattacg ccaaatgatc gtcttctcca 28260 gttgtccaat tacgcgtttg atggatcaac ctttgatata tacagcgcat tgttaaacgg 28320 agcttctctt attttagtac caacgcatgt actgatgaat ccgactgatt tggcatcggt 28380 cattcaagac cagcatatta ccgtgtcctt tatgacaaca tctctattta acactctggt 28440 tgagctggat gtgactagtc tcaaacacat gcgtaaggtg gtgtttggag gagaaaaggc 28500 ttcgatcaag cacgtagaaa aagcgctgga ttatttggga gctggacgtt tggtcaatgg 28560 gtatggacca acagaaacta ctgtttttgc cactacctat acggtggacc atacgatcaa 28620 ggagacgggg attatgccga taggtcgccc gttgaacaat acgaaggtgt ttattttagg 28680 agcagacaat caactacagc cgataggtgc attaggcgag ctatgtgtga gcggggaagg 28740 gcttgcccgc gggtatctca atcttccaga gctgactgct gatcgtttcg ttgaaaatcc 28800 ttttatgcgg ggagagagaa tgtatcgcac aggggattta gcgcgttggt taccggatgg 28860 aagcattgag tacgtaggta gaatagatga acaagttaag attcggggac atcggatcga 28920 attaggtgaa attgaagcta gattactaga gcatcctgct attagcgaga ccgttttgct 28980 ggcgaagcag gatgagcagg ggcattcctt cctatgtgcc tatctagtga caaatggtgc 29040 ctggtcagtc gcagagcttc gcaagcatat caaggaaaca ttgccggatt ctatggtgcc 29100 atcttatttt atcgagatag ataaaatgcc gctcacttca aatggcaagg cagacaagcg 29160 tgcattgcca gagccagatg ttcaacaagt aagctcttat attgctcctg agaccgaaac 29220 agaggaaaag ctggttcaat tatttcaaga aatcctaagt gttgaacaag tcggtacgca 29280 ggataatttc ttcgagctgg gcggacattc gttaaaagcg atgatgctgg tttcaagaat 29340 gcacaaggaa ttagatatag aagtaccgct caaggacgtg tttgctcgac cttcagtaaa 29400 agaattggcc gcatttctta caaacacaga agtgtcggat tatatagcga ttgaaccggc 29460 ggcaaaacag gaattttatc cggtttcttc tgcacagcgc cgaatgtatg tagtagagca 29520 aatcggtagc agtaatacaa ccagctacaa tatgcctttt ttgcttgaaa taggaggagc 29580 cctcgatgta gtagggttac aaaaagcatt aaagaaactg gtcataagac atgaatcgtt 29640 gagaacgtcc tttcacatgg ttgatgaggt attaatgcag aagatccatc ctgacgtgga 29700 atgggattta atggtcatgg aagcaaaaga cgaggacctt ccgcaaatca ttgatggttt 29760 tatccagccg tttgatttaa gtgacgcttc tttatttaga gcgggactcg tacgaatgga 29820 agctgatcga catctactga tgcttgatat gcaccatatt atttcagatg gggtatcaac 29880 caatgtatta ttccaagacc tgatgcaaat ctatcagggc aaggagctcc cttctcttag 29940 aattcaatac aaggattatg ctgtttggca gcaggcagaa gcccaggtta atcgtttacg 30000 agaacaggag cagtattggc ttaaccaatt ttcgggagag ttacctgtac tggaaatgcc 30060 taccgattac actcgtccat ctattcagca gtcagaaggg gatatatggt catttgaaat 30120 tagtgccgag atcataaaca aagtaaagaa actgtcctcc tcgcagggta caaccttgta 30180 tatgacattg ctggccgcct accaagtatt attgtcaaaa tatacggggc aagaggacgt 30240 tattgtgggt tctcctattg ctggccgacc tcatgcggat gtagaaaaga ttgttggtat 30300 gttcgtgaac acgttagcct tcagagggca gccaaaatca actcaaacct ttagtacata 30360 tctgtccgag gttaaggagc aggtattgca cgcctatgac aatgcagaat atccgtttga 30420 ggaattactt gaaaagcttg atttagaaag agatctaagt cgtcatccac tgtttgatac 30480 catgtttgct ttgcagaata tggaaatggc tgaaatcaat atcatggatc tctcctttca 30540 gccgcgggat ttaacatgga aaaatgcaaa attcgacctg acatggatga tggcggaagc 30600 ggaaaatttg tatgtcacca ttgagtatag tacctcgctc tttaagccag aaacaattga 30660 gcgattaggt aaacgattca cccatttact aaaacagatc ggggatgctc ctgaacgttt 30720 gattgctgac ttagaagtag cgacggagga tgaaaaacat cagattttat cggtatttaa 30780 tttgactcaa tcggattatc cagtaaataa aaccgttcat cagctctttg aggagcaagt 30840 gcaaaatatg cctgatcaaa aggcgatagt atttggtgaa gagcaagtaa catacaaaga 30900 attaaacgcc aaagccaacc atctggctac cctcttaaaa caaaaaggca taacaaacga 30960 gcaacttgtg gctgttatga ttgagccttc catcgagttt tttgtaggca ttctagctgt 31020 tctaaaagca ggaggggctt atctaccaat tgacccaact tatccgacgg aacgaattgc 31080 ctatattttg gaggatagtc aatcaaaggt tctgttagtg agaggtcatg aacaggtaca 31140 gacacaattt gctggggaaa tcttggaaat tgatagcaag aagttgtcta ccgaagagct 31200 gaaagacgta cctatgaata acaaagtaac cgatctagcc tatgtcattt atacatcggg 31260 ttccactggg caaccaaaag gtgtcatggt ggagcataga tcgttgatga atctttcagc 31320 ttggcacgtt cagtattttg gcatcacaaa ggatgatcga agcaccaaat acgcaggggt 31380 tggatttgat gcatctgtat gggaggtctt cccttactta atagctggtg caacgattta 31440 cgtcatcgat caagagacaa gatacgatgt agaaaaactg aatcagtacg taacagatca 31500 agggattacg atcagctttt tacctacgca atttgctgaa cagtttatgc tgacagatca 31560 tacggatcat actgccctac gctggttgct tatcggcggt gataaagccc agcaagccgt 31620 tcagcagaag cagtatcaga ttgtaaataa ctatgggcct actgagaaca cggttgtaac 31680 aaccagctat atagtgagtc ctgaggataa aaaaatcccg atagggcgtc caattgctaa 31740 taatcaggta tttatcctga ataaagagaa tcaattacag ccagtaggga ttccaggtga 31800 actatgcgtt agcggcgaca gcctagcacg cggctatctg catcgtccag agttaacgag 31860 tgagcgtttt gtagctaatc cgtttgtccc tggcgaacgc atgtataaaa ccggagatat 31920 tgcccgctgg ttaccagatg gaaatattga gtatctaggt agattggatg atcaaattaa 31980 gatcagagga taccgggttg aattaggtga gatagaatcc gctattttgg agcatgaagc 32040 aattcatgag acagtagtgc tcgcaagaca agacgatcag aatcagacat atctatgtgc 32100 ttatgttgta ccgaaaaaat cttttgatgt agccgagctt cgtcaatatc taggcagaaa 32160 gctacctcac tttatgattc cggccttttt tacggaaatg acagagttcc caattacatc 32220 gaatgggaaa gtagataaaa aagcactccc actaccggat ttgtccaagc aatcagagat 32280 cgattacgtt gccccaacca ccacgttaga agaaacgctg gcggaactat ggacagaagt 32340 gctaggagtt tcccaagtgg gaatccatga taacttcttt aaactgggtg gggattcgat 32400 caaggctatt cagattgcag caagattaaa tacgaagcaa ttaaaattgg aagttaagga 32460 tttattccag gcacaaacga ttgctcaggt tattccatac atcaaaacca aggaaagtaa 32520 agctgagcaa ggaattgttc aaggaaaggt agagctaacc cctatacagg aatggttttt 32580 ccagcaatcc ttcgatattc cacatcattg gaatcagtcc atgatgtttt atcgaaagga 32640 agggtgggat cagcacgttg tacaaagggt gttccaaaaa attgcagaac accatgatgc 32700 cttgcgaatg gcttatcagc aggaaaatgg caaaacgatt cagatcaatc gcggagtgga 32760 aggcaagttg tttgagctaa gcatttttga ctttaaacaa caggcgaatg tgccagagct 32820 gatcgagcaa gcagctaatc gtctacaatc cgcaatgaac ttgcaggacg gtccattggt 32880 tcaactggga ctctttcaga catctgaggg ggatcatctt ttgatagcaa ttcatcactt 32940 agtggtcgat gccgtttcat ggcgaatcat tacggaggat ttcatgaatg gctatcaaca 33000 agatttgcag ggagagccga ttgcatttac gagcaaaaca gactcctacc aaaaatgggc 33060 caagagcctg ctagagtacg ctactagtga agaaattcaa tcagagctga aatactggca 33120 aagcatgatt gcaaaagggt tacctgcatt gccaagagat tcaaaagtag gtgccccgta 33180 tctactcaag gatatacaag aggtcgctat ccaattgaca aaagagcaaa cgaataaact 33240 attaacggat gcccataacg cctacaacac acagattaac gatcttttgt tgacagcatt 33300 agctctaact attcaggaat gggcacaaac caattcaatc gcaattacac tagaaggaca 33360 tggacgcgag gatattgggg tggacattga cattaaccgt acagttggtt ggtttacgtc 33420 catgtatcca gtggtatttg atttgcagaa gcaagggatt gcaaatacgg ttaagcaagt 33480 aaaagaagag ctgcgacaaa taccgaataa agggattggc tatggggttg ttagatacct 33540 atcgaatcaa ggaagtacag agctggatct aagctcccat gcgataaatc cagagattag 33600 cttcaattac cttgggcaaa tggatcaatc tggacaggaa gaggagtatc aattgtcccc 33660 attgtcttcc ggtcaacaga ttagtcagat gaatcaaggc ttgttcccga taaatgtgag 33720 tggaattgta gtggaaaatc agttgtccat tcaaatatct tatgatagcc aagcttatca 33780 tgattctact atggaaaagc tgattcaacg ttatcaatat cacttgttgg agattattaa 33840 tcattgtgtt cagcagacag aaacagaatt aaccccgagt gatttttcca ccaaagagct 33900 ttcgatggag gatttagaat cagtatttga gttactagat gaataaactt tggttatgtc 33960 attaggaggc tttatatgtt aagtaaagca aatattaaag acatctatac attatctccg 34020 ctacaaaaag gcatgttatt tcagcattta aaagaagaaa gcacggctta ttttgagcaa 34080 ttacacttta cgattaaggg acaactatat gtagatagct ttgaagcaag ctttcagcat 34140 ctcataaaca aatatgatgt gctacgaacc gtttttctgt ataaaaatat gacccagccc 34200 atgcaaatgg ttttaaaaga aagaaaaaca agtgtgcatt ttgaagatat ctcccaccta 34260 gattctaaag ccgtgagtga atatgttgaa gagtttaaaa atcaggatcg ggagaaggga 34320 tttgaactct cgaaggacat tctcatgcgt tttgctattt tgaaggctgg tgctgagtcc 34380 tatcatttaa tttggagctt ccatcatatt ttaatggacg gctggtgcat gggcattgtg 34440 ttacaggatt tgttcagaat gtatcagcag catcgtcaaa atataccgat taccgttgag 34500 agcgttcctg cctatagcga gtatatccgt tggcttgaga agcagaatgt aacaaaggcg 34560 agggattact ggaaaaatta cttagagggc tatgaggaat taacaggtat cattcgtctc 34620 gatacgaagc atacgagtca caacaacgag gtacaggaat gcgcctttac actggataag 34680 gacataacgg aaggacttac tcagcttgct cgtcattatt cagtgacagt aaatacgctt 34740 tttcaaacaa tttggggcat gctgttgcaa aagtataaca ataaggatga tgttgtgttt 34800 ggtgcggtcg tatctggccg cccctctgaa atccatggcg tagaaaacat ggttggcttg 34860 tttatcaaca ctgtccctat tcgtattcaa aaacaaatga atgatacctt tagccattta 34920 ttaaaaagag ttcacgaatc tacgctattg tctaaacagt atgagtttgt atccttggca 34980 gatattcaaa ccgatgcagg attttctggt caattgctag atcacatctt agtttttgaa 35040 aactatccga taagtgaagg ttcttttgag gaagaagaat ttacgatgga tagtataaaa 35100 acctatgaga aaacaagcta tgacctaaac gtgatgattc ggcctaatga ggatcagctt 35160 gatattgcct tccaattcaa cgatgacgtg tactcaagcg aaaatgtaaa aagactgttc 35220 cagcatatga agcaactggc tctagctgta atcaagaatc cggatgtgcg cttggaagaa 35280 atagcaatga tcacagaaga ggaacgctat caaatcttgc acgatttcca aggggagata 35340 gttgattttg taacagaaaa aacgcttcct gaactgtttg aagaccaggt gaaacgaact 35400 ccagaagcaa ttgcacttcg atttgaagat caacaattga cctatcagga gctaaatcag 35460 cgagtaaatc aattagcttg gacactaaga atgaagggct tgcagcaaga agaactcgtt 35520 ggaattatgg tgcagcgctc attagaaatg atcgttggtg tgctagccgt tataaaagca 35580 ggcggcgcat acgtaccaat tgatccggaa tatccgcttg accgaatcca atatatgctg 35640 gaagacagtg gaaccaattg gctgttaacc acgaaacaga gcgaaattcc ttccatctat 35700 ctagggcatg tcctgtatct tgaggaagat acggtgtatc acgagcggtc ttcagatgta 35760 gagattgtaa atcaatccag cgacttagct tatattatct acacgtccgg ttctactggt 35820 cagcctaagg gtgtcatgat tgatcatcgt gctgttcata atttgcattt gtcagcagga 35880 atctatggaa tcgcacaggg aagccaggtt ttgcagtttg cctctttaag ctttgatgct 35940 tcggtgggtg atatcttcca cagcctatta acgggagcta ccttgcatct tgtaaaaaaa 36000 gagcaattgc tatccggaca cgcctttatg gagtggttag acgaagctgg cattacgact 36060 attccgttta ttccaccaag cgtcctaaaa gaattaccat atgcaaaact gcctaagctc 36120 aaaacaatca gtactggcgg ggaagaatta ccggctgatt tagtaaggat ttggggagca 36180 aaccgcacat ttttaaatgc atatggtccg acagaaacga cggttgatgc ttcgattggt 36240 aattgtgtag agatgacgga taagccttcg attggtacgc caaccgttaa taagcgagcg 36300 tatattttgg atcaatacgg tcatattcag ccaatcggtg ttcccgggga attatgcgta 36360 ggtggagaag gcgtagctcg tggatattta catagacctg agcttacaga tgaaaagttc 36420 gtgaacgatc cttatgtacc aaacgggaga atgtataaaa cgggagactt agctagatgg 36480 ttgccggatg gaacaatcga atttttaggc cgtatggatg gccaagtaaa aattcgtgga 36540 tttaggattg agcttggaga aattgaagct cggctaaacc aagccccatc tgtaaagcaa 36600 gctgtggttc tagctcgttc aggagaacaa aagcaggtat acctatgcgc atatttggtg 36660 acggacaacg atttaaaggt ttctgcccta cgtaaggaat taagtcaaac gttaccagac 36720 tatatgattc catcgttttt tataaaagtc gaaaagattc cagtcacagt aaacggcaag 36780 atagacaaga aagccttgcc agaaccagaa aaagaagtag agctgcaaac cgaatatgta 36840 gctccaacga acccaacaga ggagattctt gtacagattt ggcaaaaggt gctgggaatg 36900 gagcgagtag ggatagagga taacttcttt gagctaggtg gtcactctat caaggcaatg 36960 atgcttgctt ccaatattta taaggaatta aagattgatc tgcctttgcg tgagattttt 37020 aagcatacga cagtaaaaga aatggcgcgt tttatcgacg gtcgggatga ggaagaatac 37080 gtcggaattc aacccgcagc caaacaagaa tactaccctg tctcttctgc acaaaaaagg 37140 atgtatgtca ttcaatcatt ggaagataag gctcaaggca cgagctataa tatgccgtct 37200 ttctataaaa tgaagggctc ggtagatgca gagaaattag agaaggtatt ccaaacatta 37260 ttggatcggc acgaatcatt acgaacctcc tttcatatga tcgaggagca gctagttcaa 37320 aaggttcacg aacaggtttc atggaaaatg gacatgaaaa ccgtcagcgc caatgatgtt 37380 tcaagattaa aggattcgtt tgtccaaccg tttgacatca gtacagctcc tttgttccga 37440 gccagtcttc ttacgattca taaagatgag cacattctta tgatggatgt acaccatatt 37500 gtaggagacg gtgtttcgac cacgatcttg ttccaggagc ttatccagtt gtatcaaggg 37560 caagcgctac ctgaagtgaa ggtacactat aaagattacg ctgtgtggca attgtcccag 37620 caggatcgtt tgaaagaaag tgaaaatttc tggttgcagc aattttctgg agagttgccg 37680 gtgttggagc tacctactga ttattctcgt cccccaattc gccgattgga aggagaatat 37740 gtaagccaaa gcctacgtgg tgatctccat gaaagcgtaa aagccttcat gaaaaatcac 37800 gaagtaacgc tatatatggt actgcttgcg acatataacg ttcttctgca caaatacacg 37860 aatcagcacg acattattgt tggtacgcct gtttcggacc gaccgcatcc agatgtcatg 37920 tccactgtcg gtatgtttgt aaatacgctg gcagtccgaa atcagttgga gtctgagcaa 37980 accttcgaaa agtttttagc aaatgtgaaa aataaaatgc tagaggtcta tggtcatcag 38040 gagtatccgt ttgaagatgt aattgaaaaa gtaaaggttc aaagggatac aagcagacat 38100 ccgctatttg acacaatgtt tggtgtacaa aatctggaga tatcccacgt ggagctaccc 38160 gattggggta tagaagcatt ggatattgac tggactaact ccaagtttga tatgagctgg 38220 atggtatttg aagcagacgg tctagaaatt ggcgtggagt atagcacaag cctatttgag 38280 cgcaatacga ttcagcgaat gatcggacac tttgaacata tcatcgagca gattatggaa 38340 aatcctcaaa ttcgtttagc tgatattcag ttgacgacag aagatgagag aatccaaatc 38400 ttagaggaat tcaatcatca accaacaaaa ataacctacg atcaggcaat ccaaaacaga 38460 tttgaagaac aggctatgaa gacacctgat gcagtggcac ttgtatataa aggtcaggag 38520 ttaacctatc gtgagcttaa ccaaagatca aatcagatgg ctcgtacatt aagagagcat 38580 ggggtcgggc gtgatcaaat aattgcggtc atgattaatc gttcacatga gctgatcatt 38640 agtatcctag ccgtattaaa ggcaggagga gcatacctgc caattgatcc aacgtacccg 38700 cttgatcgga ttgaacacat gctagaggat agccagactg caatgctgtt aactcaaaaa 38760 gaaatccaaa tacctacagg atattcaggg gaagttctct tcgttgatca agctgatatt 38820 tatcatgagg atgctacgga tttatctagt atgaatcagc ctgcggattt ggcctatatt 38880 atttacacat caggctctac tggaaagtcc aagggagtaa tgatcgagca tcgttcatta 38940 cataatctga ttcatatttc tcacccctat aaaatgggag caggaagcag agtccttcaa 39000 tttgcctcta gcagctttga tgcctcggta gcagagatct ttccagctct tttaactgga 39060 tcaactttat atatagaaga gaaagaggag ctattaacca atttagttcc ctacttactt 39120 gagaatcaaa taacaacagt agcattgccg ccatctttat taagatccgt tccttatagg 39180 gaactgccag ctttagagtg catagttagt gtcggagaag cttgcacatt tgacattgta 39240 caaacttggg ggcaaaaccg cacctttata aacggatacg gccctacaga atcaactgtt 39300 tgcagtgcct ttggtgtggt tacagcagag gacaagcgta tcacgattgg taaaccgttc 39360 cctaatcaaa aggtctatat catcaatgaa aatcaacagc tacaaccaat cggggttcca 39420 ggtgagcttt gcatagcagg ggctggatta agccgtgggt acttgaatcg tccagagctg 39480 acacaggaaa aatttgtaaa caaccccttt gcacctggtg agcgtatgta taaaacagga 39540 gacgtagctc gctggttgcc tgatggcaat atcgaatatg ccggtcgtat ggatgatcag 39600 gttaaagtac gcggaaatcg ggtcgagctt ggggaggtta ccagccaatt acttacgcat 39660 ccttcgatta cagaagctgt tgttgtacca atagtcgata cacatggagc aacgacacta 39720 tgcgcctatt tcatcgagga taaagaagtg aaggtcaacg atttgcgcca tcatttggct 39780 aaagctctac ctgagtttat gattcctact tactttatta aagtagatca tattccattg 39840 acaggaaacg gaaaggtaaa taaacaagca ttacctgacc cttccgaatt catttcagca 39900 caaacaggcc atgaaatcgt tgccccttct tctcaggacg aggaaatact ggttcaggta 39960 tgggaagaag tcctgcagtt caaaccgatt ggggtagagg acaacttctt tgaacgaggc 40020 ggagactcca ttaaggcatt gcaaatcgta gctagactta gtaaatataa tcggaaattg 40080 gatagtagac atatttttaa aaatccaacg atttccatgc tggctcctta ccttgaacaa 40140 agaggtgctt tgattgaaca agattcaatt gaaggcgaag tgccgcttac accgattcaa 40200 tcctggttct ttgaacaacc ctttgtgtat ccacaccact ttaatcaatc tatgcttcta 40260 ccaaatgaac aaggctggga tcgtcaacga atagaacaag catttacaac cattgttaga 40320 caccatgatg ccttaagaat gaagtaccag tttagagaga agatcattca agaaaatcag 40380 ggtatcgagg gagagttttt taccctgcat gaggtggatg taaccaagga aagagactgg 40440 caaatgcgca tcgaacaaga agcgaatcaa ctccaagcaa gctttgattt gacaacaggc 40500 cctcttgtaa agcttggctt ataccatacg gcatatggcg attatcttct gattgttgta 40560 catcatctct taattgatgg tgtctcatgg cgcatcctgc tggaggattt ccagacgctt 40620 tatgagcaaa agggtgagtt gccagcgaaa accacttcct ttaaggcgtg ggctgtacaa 40680 ctggaggggt atgctcgcag caaaaagcta caagacgagg caagctactg gaaagggttg 40740 ttgaataaat cgataagaga gctgcctgcg gataaggaat caagcgatac attcctcttt 40800 ggagatacaa aagaagtaca gcttaccttt gatataaatg aaacccaaga cctgcttacg 40860 gatgcccacc atgcttataa gacaaaagcg gatgatttat tgctggcagc gttggttctt 40920 agcataaatg agtggacgaa gcaaagcgat atcatagtga atttggaagg tcatggccgt 40980 gagacgatcg gcgaaggcat tgatttgagc cgtacaattg gctggtttac tacaatttat 41040 ccagttctgt ttgaagtaga gaaccatcaa ctttccagcg tgattaaaca tgtaaaagaa 41100 acgctgcgca atgtaccgaa taatggtatt ggttttggga tcttacaaca catgtctcat 41160 tctgatgtaa gccagagcca attaagttct catcacataa gcttcaacta cctaggtcag 41220 atgggagaag attccgctag tcagtctgag acggataatg gagtccttat caatacagga 41280 gaccagataa gcccaatgaa cgcaaatccg ggctcgctta atatgacttg ccttgtaatg 41340 aataatacgt tgcttgttac ttttgattat aatccgcaac gttacgaaca ggagacaatt 41400 caacgtctgg cagatcgtta taagagcaat ttaaaagcag tcctcgatca ttgtgttcaa 41460 cgagagcaga cagagcgaac acctagtgat tttagtacga agaagctttc tttagaggac 41520 ttagacgacg tgtttgcaac acttaaaaat ctataaaggt atcctgagga ggagaagatt 41580 aacttgatta atacctcaga cgtcaaagac atttatagtt tatccccgat gcaacgagga 41640 atgttatttc atacattaaa agacaaagaa aaccttgcct attttgatca gacaactttt 41700 caaatagaag gtgacatatg tgtcgaatcc cttgagaaaa gttttaacga gctgattcgc 41760 aagtatgatg ttctgcgtac gatcttttta tatcagaaat taaaagagcc gatgcaggtt 41820 gtgttaaagg agagaacagc aaacattcat tatgaggatt tctctatgaa gagcgagtcg 41880 gataaagcaa aggctcttcg tgtagcaaaa cagagggacc gggacgaggg ctttgacctc 41940 tcccgggaca tcctcatgcg gttatcttta ttaaaagtcg cccctaacca atacgaatta 42000 gtgatcagta gccaccatat tatcattgat ggatggtgta caggaatttt gtatcaggag 42060 ctgttttatt tttatcaatg cttcgtagca aatcaaccta tccctgctga gaaatcgatt 42120 ccgtatagca gatatattcg ttggcttgaa gaacaggatg aagaggaagg aaaagcctat 42180 tggggtgaat atctacaaga tttcgagggg gcatctgtta tccctaagca aaacgctaag 42240 ggagagaagg aagtatgctc cattgataag gtaaccttcc actttgataa aaagctgacg 42300 gaggaactgg tgcaggtagc aaaaacttgc caagtaacaa taagtacctt gtttcaaaca 42360 atgtggggca tcctgctcca aaagtataat aactcgcagg aagctatatt tggatcggtt 42420 atttcaggaa gatcaccaga gattcctgat gtggaaaaaa tagttggaat ttttattaat 42480 accattcctg ttcgcattcg tacattggac aagcaaacct tcaaggaatt gctgatccag 42540 gttcaggagg catctgtcaa ctctgaaaaa tataattatc taacattggc tgatattcaa 42600 gcggttaccg gatcgaatca tgcacttatc catcatattg tggcatttga aaatttcccg 42660 attgcctcgg acagcttcgt agattcgagc gattccgatt cagaagaatt gaaagttgtg 42720 aacgtcatag acgatcatga aaagaccaac tttgatttta gtgtgcaagt tcagcttgat 42780 acagagttac tagtaaaaat ctcttataat caacatcttt atcatagaag ctttattgaa 42840 aatatctttc atcacctgca acagattgcc gggtctatca ctcataaccc agatattcaa 42900 ataaatgaga tagctattgt ttctaaggaa gagaagaagc aactattacg ctattccact 42960 ccagccaagt cagattttcc aatggataaa accattcatc agctatttga ggagcaggta 43020 tcacggacac cagagcagat cgcggtcgtt tttaaagggg agtccttcac ctatcgcgag 43080 ttaaatgaaa aggcaaatca attggcatgg gtgctaagaa aacgggaggt aagacctaac 43140 gagatcgttg cgatcatggc agagcactct ctagagatgc tggttggggt gattgggact 43200 ttaaaggcag gtgcggccta tcttcctatt gacccatcct acccagaaaa aagaatcgct 43260 catatgctac aagatagcaa agcggagcaa ctacttatcc agcctcattt gaatatgcca 43320 caggacttta agggaagtgt cttatggtta acagaagaga gctgggcgaa ggagagtacg 43380 accgatctgc cgcttgcaac gagtgcaaat gatctagcat acatgattta tacctcaggc 43440 tcaacaggac tgccgaaggg agttatggtt gagcatcaag ccttggttaa tttagttatg 43500 tggcataacg aggcatttgg cgtaaccatg actgatcaat gcacgaaatt ggcgggattt 43560 ggattcgatg cgtcggtgtg ggagaccttc cctccgctta tacagggagc gacgcttcat 43620 gtgttagagg aatcgagacg tggagatatt tatgctctgc atgaatactt tgaaaagaat 43680 gcgatcacca ttagcttctt gcctactcaa ttagccgaac aatttatgga gcttacaagc 43740 agtacattac gtgtgttact cattggcggt gaccgagccc aaaaggttaa agagacatcg 43800 tatcaaatca taaacaacta cggtccaacc gaaaatacag tagtcacgac gagcggtcaa 43860 ctgcatcctg agcaggatgt cttccctatt ggaaagccga tcaccaatca cagcgtttat 43920 attttagatc agaacagaca tctacagccg atcggaatac ctggcgagct gtgcgtcagt 43980 ggtgcagggc ttgctagagg ctaccttaat cagcctgaac tcaccgtaga acgctttgtt 44040 gataatccct ttgtacctgg agagagaatg tatcgcacag gggacttagt tcgttggaga 44100 atcgatggta gcatcgaata tctgggaagg attgacgagc aagtcaagat tcgaggatac 44160 agaattgagt taggtgagat cgaaacaaag cttcttgagc atccttccat tagtgaggcg 44220 ctcgtcgtgg ctcgaaatga cgagcaaggt tatacctatc tatgcgctta tgtggtagca 44280 actggggcct ggagcgtatc ttcattacgt gagcatttaa tcgaaacatt gcccgaatat 44340 atgattccag cttacatgat ggaagtggaa aaaatgccgc ttactgcaaa cggaaagata 44400 gataagcgag cgttaccagt gcctgatagg caaagaatga acgaatatgt ggcacctgca 44460 acagagacag aggaaaagct agttctactg ttccaagaga ttttaggact tgagcgtatt 44520 ggtactaaag atcacttctt tgaattaggg ggacattcgc tgaaggcgat gatgcttgtg 44580 tctcgtatgc acaaggagct aggtgtggat gtgcagttaa atgagatgtt tgctcgtcca 44640 acggttaaag atctatctgc ttacatagat cagatgaacg gctctgctta cacagcaatt 44700 caaccagtgg aggaacagcc ttattatcct gtttcttttg cccaaagaag aatgtatgtt 44760 gtacagcaaa tgagagatag tgaaacgacg agctataaca tgccgtttac gtttgagcta 44820 aaaggaaagc tacatctgga caagctgcga gaagcgttac agattctggt tctacgacat 44880 gaaagtctgc gtacatcctt tcatatgatt gatgaaaatc ttgttcaaaa agtgaataaa 44940 gatatttcat gggatttaga agtaatagaa gctcaggagt cagagataga agtaaaactg 45000 gaggaattta tcagaccgtt ccatttaagt gaggctccgc ttttcagagc tcgtttaatt 45060 tgcttgaatc cacagcatca tcttttgagc ttagacatgc atcatattat ttcagatgga 45120 gtatctatga acctgttcct acaggaattc atgacactct atcagggaga agcattgcca 45180 gcgctctcta ttcaatacaa ggattacgcc gtatggcaac aatcagacaa gcagcgagct 45240 agattaaaag agcaggaaaa atattggtta catcattttt ctggagagct gcctacctta 45300 gaattgccaa cagattttcc acgccctgca atacagcaat ttgatggaga tgaatgggcg 45360 tttgaaatga atgctgatct tttagcgaag gtcaaacaga tctgctctag ccaaggcacg 45420 acgttatata tgacgcttct cgctgcttat caggtgttct tagccagata taccgggcag 45480 gaggatatca ttgtaggttc tccaattgct ggacgttctc atgctgattt ggaaaacatg 45540 ataggtatgt ttgtcaatac attagctttg cgcggtaagc caaaggcaga tcaatccttc 45600 ctctcctatt taaaacaggt aaaagagacc gtattccaag catacgcgaa cgcagaatat 45660 ccatttgaag agttgattga gaaactcgat ttagaacgag atatgagccg tcatccgcta 45720 tttgatacct tgttctcttt gcaaaatatg gaaatatctg agttccaaat gaataatcta 45780 gagatttttc cttatgaaac gggacaaaag aatgcaaaat tcgctcttag ctggttaata 45840 gcagaaggag agtcccttta tgtaacaatc gaatacagca ccaaatgctt taagcgagaa 45900 accattaaac gcatggcaag tcattttgaa caactgctag cccaaattgt tgagcaaccg 45960 gaagcgcgca ttggccaact ggagttagta gcagatgccg aaagaaaaat gttactggaa 46020 gactttaatc tgacaaaagt cgactatcca cgggaaaaaa caattcaaga attatttgaa 46080 gagcaggtgg acaaaaaccc tgatcaaatc gcgcttatat gtggagagca acagtttacc 46140 tacgaacaat taaatgtgaa atttaaccaa ttagctcacg tattaagaag agaaggcgtt 46200 caacccaatc aggtaatagg gctaattacg gatcgatcgc tgtcgatgat tgtaggtatt 46260 tttggaatta taaaagcagg tgggggctat ctgccaatcg atccgaccta tcctaccgaa 46320 agaattgaat acatgcttga agatagtcaa actcacctat tgttggtaca acacagagac 46380 atggttccag caggttatca gggagaggtt ttgataatag aggatgagat aagtcgagat 46440 gaacaagtag ctaacataga attgatcaat cagccgcaag acttggctta tgtcatgtac 46500 acatctggct ctacaggtaa accaaagggg aacctgacta ctcatcgaaa cattatcaaa 46560 acggtatgca ataacggata tattgagata acgactgagg atcgtctttt gcagttatct 46620 aattatgctt ttgacggctc tacctttgat atattcagct cgttattaca cggagcaacg 46680 ctggtactgg taccaaaaga agtgatcttg aatccaacag acttgattac attgatacgc 46740 gaacagcaga tcactgtatc gtttatgact acctcattgt ttaatgcatt agtggaactg 46800 gatgtaagca gtttccaaaa catgcgcaag atcgcatttg gaggagaaaa ggcttccttt 46860 aagcatgtgg aaaaggcatt ggatttcctc ggaaatggac gattggtgaa tggatatggt 46920 cccacagaaa caaccgtttt tgctacaacc tacactgtgg atgagcgcat aaaggaatgg 46980 gggattatac cgattggtcg accgctacat aatactacgg tccacatttt aagcgctgat 47040 gacaagctac agccaattgg agtcattgga gaactgtgcg taagcggtga aggattggca 47100 cgcggttacc ttaatctacc agagttgacg atggagcgat ttgttgaaaa tccatttaga 47160 cctggtgaaa gaatgtaccg cacaggggac ttggctcgtt ggttaccgga tggggttctt 47220 gaatatgtag gacgcaagga tgaacaagtg aaaattcgcg gacatcgcat tgagcttagt 47280 gaaattgaaa caaggatatt ggagcatcct gcgatcagtg aaacggttct gctagccaag 47340 cgaaatgagc aaggcagctc atacctgtgc gcttatattg ttgcccatgg ccaatggaat 47400 atccaagaat tgcgcaaaca tgtaagagat gttttgccag aacacatggt gccttcttat 47460 tttattggct tagacaaact tccacttacc tccaatggta aagtcgacaa acgagcattg 47520 ccagaaccag agggcagcct gcaactgact agagaaattg ttgctccacg caatgaatct 47580 gaaaaacagt tagttgaaat tgttgctgag gttctgggac tagaagctag tgaaataagt 47640 attaccgata atctttttga gctaggtgga cattccctaa cgattctgag aatccttgct 47700 aaggttcata catgtaactg gaagcttgaa atgaaagact tctataattg caagaacctt 47760 gaggaaatag caagcaaggc aactgatatg caggaaaatc aaaatctgtc tggcagtggc 47820 tcagtcttta aaaagggtgg gaagaaatca atcccggtag tacccgtcca cgatagacaa 47880 aaagaaatgg agcatgtttt attgctcggc tccactggtt tcttaggtat tcatttgcta 47940 catgagctgc tacagaaaac agaagcgaca attctttgcg tcattcgtgc agaaaatgat 48000 gaggctgcta tgcaacgact acgcaaaaaa attgattttt actttacctc acagtacagt 48060 agctctcaaa ttgatgagtg gtttacccgc atccaaatca ttcacggtga tattacgcaa 48120 gccaactttg gattagaggc aaaacattac gagtcgctag gagctatcgt tgacactgtc 48180 attcatacgg ctgcattggt gaagcactac gggcactatg aagagtttga aagagcaaat 48240 gtacatggaa ctcagcaagt agttaccttt tgcttgaaca ataaattacc aatgcactat 48300 gtttcaaccc tgagcgtttc gggaaccacc gttgaagaag caacagagct tgtagaattt 48360 accgagaagg acttttatgt tggtcaaaac tatgagtcaa atgtatatct gagaagtaaa 48420 tttgaagccg aagccgtact tgttggcgga atggaaaacg gactcgatgc acgtatctac 48480 cgggttggca atttaacagg acgctttcag gatggatggt tccaggaaaa tatcaatgaa 48540 aatatgtttt atctcctatc gaaagccttc cttgagcttg gaggttttga tcaggaaatt 48600 atgcagggta tggttgattt aacccctatt gatatatgtg cacaagctat tatacacatc 48660 atcaacagca aaggaattga ggaaagagtc ttccatttac agaatccgca cttggtaaca 48720 tacgatgata tgtatcgtgt atttgaaggg cttggctttt ctagacgggt acaaagtcga 48780 gaagatgtta cacgtgaact agatgtaatg atgtctcagg gtaatgaaaa gctatttttg 48840 gctgggattc tgaccacgat gttggatgat gtagagcgtg ctgaacaatt taatgttgca 48900 gtcgattcaa gtaggacaat gcagctatta gaggatacct cgtttaccta tcctgttcct 48960 gatgatgagt atttgcgcaa gctggctatg catatgatca aagttgggtt tgttactcct 49020 aatcatactg ttgctgaaaa gataggaact agtcgttagc gctatgctag cgactggttc 49080 ccaacctaaa tgaatagcta aaggaaggag agggaaccca tggcagtcat tgaactaaaa 49140 aaccttacga aaaagtataa tgaggtctat gctgttgatc atctaaatat agaagtacct 49200 caaggacata tttatgcgtt tttaggtagc aatggggcgg gaaagacaac cacaattaaa 49260 atgatgacgg gccaattgaa cccttcagag ggagaggttc tatttctagg gcgcaatatt 49320 tggcaggatc gtgaggcaag aagaattgcg ggctatgctc cagacgttcc acttcttcat 49380 gaaggattga cagtcagaga aatggtacgc tttgtggggg ctctttatgg tagtgacgaa 49440 gatctgaata aacgtgttga cacgttgtta gaacattttg agctggcaga taaagcagac 49500 cagcttatta aagaatactc attaggaatg aaacgaaagg tttcgattgc ttgcgcattg 49560 attcatcgcc ccaaaatctt gctattagac gaagttacga atgggttgga cccaaaggcg 49620 acccgtgaag tgaaaaatta tattcgacat tttgccaaag aagagggtgg tactgttttt 49680 attacgaccc atattttgga cattgttgaa gaattagccg ataccatttc catcctgcat 49740 aaaggaaaaa tcaaagtgac gggaagcatg gaagaattgc gtcatgtggc aggcaatgaa 49800 gaaggtcgat tggaagatat ctttttatcc gctatcgagt agtaggaggt gacagaattg 49860 tatgtgggca caaacgaaat ggattagttt cttttacaca agacccttct ttaatcgctt 49920 ttttatccat agtccttcta aatggatcat ttatgtgggc ttgggaacca ttgctattgc 49980 catgtacttt tcggagaatt ttgggcagct tctcttacat gccagtctca gtgctagatt 50040 gatgcttctc ataggggaat gtatttttgt cggtttgctt cgtggcatga atacgttgac 50100 acaacaaatg tacgctgatc gattactgac attgttttat gtatcgggag tttctccgtt 50160 tcggatgatc cttgggcaat ctacttcaag tctacctctg tacacgtggt catccattat 50220 gattgctatt ccattaacga ttggctattc cgccatggaa agagttctgt atgttttgtt 50280 attcctagtc gtttctctat tgatgatttg gttaacagac atcttaagcc gatttttaat 50340 ggttctgacc atgcggtttt tccctattat tgtcaaaaca ttcgtaggta tctcctcgct 50400 tgcctatgtt gctttaattg gcctattggt ttgggcattg attgaggttg aaacaatttc 50460 tccagaagct tggcagagct tagagcgttt tatggtatat gttttgtgca ttttcgcggt 50520 cggtcttgga gcgttgtttc tattctctga acaaattgga gggttttatt acgaaagctg 50580 gctgaaccat gcggagtcgc aagataggac cagaccagaa acacaggaaa atctatcgaa 50640 tttggtcaaa aacgctcatg atgccatcgt tttt 50674 <210> 22 <211> 641 <212> PRT <213> Artificial <220> <223> artificial sequence <400> 22 Met Asp Leu Ser Thr Leu Asn Phe Leu Gly Glu Thr Glu Lys His Lys 1 5 10 15 Leu Leu Asn Gln Phe Asn Asp Thr Asp Ala Asn Phe Pro Gln Glu Met 20 25 30 Thr Ile His Gly Leu Phe Glu Lys Gln Val Gln Glu Arg Pro Asn Gln 35 40 45 Thr Ala Val Ile Phe Asn Glu Gln Ser Met Thr Tyr Lys Glu Met Asn 50 55 60 Glu Arg Ala Asn Gln Val Ala His Ser Leu Arg Lys His Gly Ala Ala 65 70 75 80 Pro Asp Glu Ile Val Gly Ile Leu Ala Asp Arg Asn Met Asp Met Leu 85 90 95 Ile Ser Ile Leu Gly Val Leu Lys Ala Gly Ala Ala Tyr Met Pro Ile 100 105 110 Asp Pro Thr Tyr Pro Thr Glu Arg Ile Leu Tyr Met Ile His Asp Ser 115 120 125 Gln Thr Lys Ile Val Leu Ala Glu His Arg Glu Met Val Pro Glu Gly 130 135 140 Cys Asn Ala Glu Leu Ile Leu Leu His Asp Ser Ser Leu Leu Asn Glu 145 150 155 160 Glu Thr Ser Asp Leu Glu His Val Asn Lys Pro Glu Asp Leu Ala Tyr 165 170 175 Ile Ile Tyr Thr Ser Gly Ser Thr Gly Lys Pro Lys Gly Val Met Ile 180 185 190 Glu His Arg Asn Val Ile Arg Leu Leu Phe Asn Asp Arg Asn Leu Phe 195 200 205 Asp Phe Thr Ser Asp Asp Val Trp Thr Val Phe His Ser Phe Cys Phe 210 215 220 Asp Phe Ser Val Trp Glu Met Tyr Gly Ala Leu Leu Tyr Gly Gly Lys 225 230 235 240 Ile Val Leu Val Ser Phe Glu Ile Ala Arg Asp Pro Gln Ala Phe Arg 245 250 255 Asp Leu Leu Gln Glu Gln Lys Val Thr Ile Leu Asn Gln Thr Pro Thr 260 265 270 Ala Phe Tyr Gln Leu Ser Ser Gln Glu Met Gln His Ser Asp Ser Asn 275 280 285 Leu Ser Ile Arg Lys Ile Ile Phe Gly Gly Glu Ala Leu Thr Pro Ser 290 295 300 Gln Leu Lys Ala Trp Lys Gln Lys Tyr Pro Asn Thr Ala Leu Ile Asn 305 310 315 320 Met Tyr Gly Ile Thr Glu Thr Thr Val His Val Thr Tyr Lys Glu Phe 325 330 335 Gln Leu His Asp Met Asp Ser Thr Val Ser Asn Ile Gly Lys Pro Ile 340 345 350 Pro Thr Leu Arg Thr Tyr Val Leu Asp Ser Lys Arg Asn Leu Ala Pro 355 360 365 Ile Gly Val Lys Gly Glu Leu Tyr Val Ser Gly Lys Gly Val Ala Arg 370 375 380 Gly Tyr Leu Asn Lys Pro Glu Leu Thr Glu Glu Arg Phe Met Asp Asn 385 390 395 400 Pro Phe Val Ala Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Ala Arg 405 410 415 Trp Leu Pro Glu Gly Glu Leu Glu Tyr Leu Gly Arg Ile Asp His Gln 420 425 430 Val Lys Ile Arg Gly Tyr Arg Ile Glu Leu Gly Glu Ile Glu Ala Glu 435 440 445 Leu Leu Lys Gln Lys Gly Ile Lys Glu Ala Val Val Leu Val Thr Asn 450 455 460 Asp Lys Asp Ala Gln Pro Gln Leu His Ala Tyr Leu Thr Ser Lys Glu 465 470 475 480 Asp Leu Ala Ala Ala Asp Leu Arg Asn Gln Leu Thr Thr Thr Leu Pro 485 490 495 Ser Tyr Met Ile Pro Ala His Phe Ile Phe Val Ser Gln Met Pro Val 500 505 510 Thr Pro Asn Gly Lys Ile Asp Lys Glu Ser Leu Arg Lys Ile Glu Pro 515 520 525 Ser Leu Gln Glu Ser Pro Thr Glu Ala Tyr Val Ala Pro Gln Thr Pro 530 535 540 Thr Glu Lys Gln Leu Val His Ile Trp Glu Glu Asn Ile Gly Met Gln 545 550 555 560 Pro Ile Ser Ile Asp Asp Asn Tyr Phe Ala Leu Gly Gly Asp Ser Ile 565 570 575 Lys Ala Ile Lys Leu Leu His Ala Ile Asn Lys Glu Phe Gln Ile Ser 580 585 590 Phe Gln Ile Gly Asp Leu Tyr Lys His Gly Thr Ile Arg Glu Met Gly 595 600 605 Gln Gln Ile Gly Glu Lys Gly Lys Gln Ser Ser Asn Gln Lys Leu Leu 610 615 620 Lys Leu Gln Glu Leu Asp Arg Leu Lys Glu Lys Ile Leu Gly Ser Glu 625 630 635 640 Lys <210> 23 <211> 2530 <212> PRT <213> Artificial <220> <223> artificial sequence <400> 23 Met Ser Asp Lys Leu Ser Asn Ala Lys Asp Leu Phe Pro Met Ser Asp 1 5 10 15 Ile Gln Leu Gly Met Val Tyr His Ser Leu Lys His Val His Glu Ala 20 25 30 Val Tyr His Asp Gln Phe Val Tyr Gln Val Asp Asp Asp Ser Phe Asp 35 40 45 Val His Val Leu Glu Gln Ala Met Arg Met Met Val Asp Lys His Asp 50 55 60 Ile Leu Lys Thr Ser Phe His Ile Glu Glu Phe Ser Thr Pro Val Gln 65 70 75 80 Val Val His Gln Glu Val Ser Val Arg Ile Asp Glu Thr Asp Ile Thr 85 90 95 His Leu Gly Glu Lys Gln Lys Glu Tyr Ile His Gln Tyr Leu Ala Gln 100 105 110 Asp Arg Gln Ser Pro Phe Asp Val Thr Thr Ala Pro Leu Trp Arg Met 115 120 125 Ser Val Phe Lys Leu Asn Ala Ser Gln Val Ala Leu Val Trp Ile Phe 130 135 140 His His Ala Ile Leu Asp Gly Trp Ser Val Ala Ser Phe Ile Thr Glu 145 150 155 160 Leu Ile Asp Val Tyr Phe Lys Leu Lys His Lys Thr Cys Thr Leu Glu 165 170 175 His Leu Asn Thr Thr Tyr Lys Asp Tyr Val Ile Asp Gln Met Leu Leu 180 185 190 Ser Glu Gln Asn Glu Leu Arg Glu Tyr Trp Lys Glu Glu Leu Lys Asp 195 200 205 Tyr Lys Arg Leu Gln Leu Pro Val Lys Val Asp Glu Asn Gly Gly Val 210 215 220 His Val Thr Val Val Glu Lys Leu Asp Pro Asp Ile Ile Asn Lys Cys 225 230 235 240 Arg Glu Ile Ala Gln Ala His His Ile Pro Leu Lys Thr Val Cys Leu 245 250 255 Thr Ala Phe Leu Ser Met Met His Met Ile Ser Tyr Glu Arg Asp Leu 260 265 270 Thr Val Gly Leu Ile Glu Asn Asn Arg Pro Ile Ile Glu Asp Ala Glu 275 280 285 Lys Val Leu Gly Cys Phe Leu Asn Ser Val Pro Phe Arg Ala Ile Ile 290 295 300 Lys Lys Asp Met Ser Tyr Arg Glu Leu Leu Glu Gln Thr Gln Gln Lys 305 310 315 320 Leu Val Glu Ile Lys Thr Tyr Gly Arg Leu Ser Phe Ala Lys Ile Ile 325 330 335 Glu Val Ile Gly Asp Thr Gly Ser Glu Arg Asn Pro Val Phe Asp Cys 340 345 350 Leu Phe Asn Phe Val Asp Phe His Val Phe Lys Gly Ile Lys Asp His 355 360 365 Lys Val Lys Phe Trp Leu Asp Gly Tyr Glu Lys Thr Asn Thr Met Phe 370 375 380 Asp Phe Ser Val Ser Thr Thr Met Asp Asp Tyr Phe Val Arg Val Val 385 390 395 400 Ser Ala Leu Pro Glu Glu Asp Thr Ile Lys Leu Ile Asn Tyr Tyr Gln 405 410 415 Arg Ile Leu Glu Lys Ile Ala Leu His Ile Asp Glu Lys Ile Asp Lys 420 425 430 Gln Ala Asn Leu Asp Glu Lys Glu Ser His Leu Leu Leu Glu Glu Trp 435 440 445 Asn Gln Thr Ser Val Asp Tyr Pro Asp Lys Gln Thr Leu His Lys Arg 450 455 460 Phe Glu Glu Gln Val Ala Lys Asn Glu Asp Gln Val Ala Leu Glu Tyr 465 470 475 480 Glu Asp Lys Gln Leu Thr Tyr Arg Glu Leu Asn Ala Lys Ala Asn Gln 485 490 495 Leu Ala Arg Val Leu Gln Lys His Asn Thr Leu Pro Thr Gln Val Val 500 505 510 Gly Leu Met Ala Glu Arg Ser Leu Glu Met Ile Ile Gly Ile Leu Gly 515 520 525 Ile Leu Lys Ala Gly Gly Ala Tyr Met Pro Ile Asp Pro Thr Tyr Pro 530 535 540 Ala Glu Arg Ile Gln Tyr Met Leu Glu Asp Ser Arg Ser Tyr Leu Leu 545 550 555 560 Leu Val Gln Lys Ala Glu Met Ile Pro Ala Asn Tyr Gln Gly Glu Val 565 570 575 Leu Ile Leu Thr Glu Glu Leu Trp Ala Asp Glu Asn Thr Glu Asn Leu 580 585 590 Glu Leu Val Asn Gln Pro Gln Asp Val Ala Asn Ile Met Tyr Thr Ser 595 600 605 Gly Thr Thr Gly Lys Pro Lys Gly Ile Leu Ile Thr His Arg Asn Ile 610 615 620 Met Thr Thr Ile Ile Asn Asn Gly Tyr Leu Asp Ile Phe Ser Thr Asp 625 630 635 640 Arg Ile Leu Gln Ile Ser Asn Tyr Ala Phe Asp Gly Ser Thr Phe Asp 645 650 655 Ile Tyr Ser Ala Leu Leu Asn Gly Ala Thr Leu Val Leu Val Pro Lys 660 665 670 Gln Thr Leu Met Asn Thr Thr Asp Leu Leu Ala Ile Ile Lys Asp Ser 675 680 685 Asn Ile Thr Val Ala Leu Met Thr Thr Ser Leu Phe Asn Thr Leu Val 690 695 700 Asp Leu Asp Val Thr Ser Phe Gln His Thr Arg Lys Val Leu Phe Gly 705 710 715 720 Gly Glu Lys Ala Ser Cys Lys His Val Glu Lys Ala Leu Asp Tyr Leu 725 730 735 Gly Glu Gly Arg Leu Val Asn Gly Tyr Gly Pro Thr Glu Thr Thr Val 740 745 750 Phe Ala Thr Thr Tyr Thr Val Asp Asn Thr Ile Lys Lys Leu Gly Ser 755 760 765 Ile Pro Ile Gly Arg Pro Leu Ser Asn Thr Ser Val Tyr Ile Phe Gly 770 775 780 Leu Asp Asp Gln Leu Gln Pro Leu Gly Val Pro Gly Glu Leu Cys Val 785 790 795 800 Ala Gly Glu Cys Ile Ser Pro Gly Tyr Leu Asn Arg Pro Asp Leu Thr 805 810 815 Ala Asp Lys Phe Ile Asp Asn Pro Leu Lys Pro Gly Glu Arg Met Tyr 820 825 830 Arg Thr Gly Asp Leu Val Arg Trp Leu Pro Glu Gly Val Met Glu Tyr 835 840 845 Met Gly Arg Ile Asp Glu Gln Val Lys Ile Arg Gly His Arg Ile Glu 850 855 860 Leu Gly Glu Ile Glu Ala Lys Leu Leu Glu His Pro Ser Ile Arg Glu 865 870 875 880 Thr Val Leu Val Ala Lys Gln Asp Ala Asn Gly His Ser Phe Leu Gly 885 890 895 Ala Tyr Leu Val Thr Asp Asn Phe Cys Pro Val Thr Glu Leu Arg Asn 900 905 910 Tyr Leu Met Glu Thr Leu Pro Glu Tyr Met Val Pro Ser Tyr Phe Ile 915 920 925 Glu Leu Asp Ser Leu Pro Leu Thr Ser Asn Gly Lys Val Asp Lys Arg 930 935 940 Ala Leu Pro Glu Pro Glu Ser Gln Ala Leu His Ala Tyr Thr Met Pro 945 950 955 960 Glu Asn Glu Thr Glu Glu Lys Leu Val Gln Leu Phe Gln Glu Val Met 965 970 975 Asp Val Glu Arg Val Gly Thr Gln Asp Ser Phe Tyr Glu Leu Gly Gly 980 985 990 His Ser Leu Lys Ala Met Leu Leu Val Ser Arg Ile His Lys Asp Phe 995 1000 1005 Gly Ile Lys Ile Pro Leu Lys Glu Val Phe Ser Arg Pro Thr Val 1010 1015 1020 Lys Glu Leu Ala Ala Tyr Leu Thr Gly Ser Glu Glu Ala Asn Tyr 1025 1030 1035 Ile Glu Ile Glu Ala Ala Glu Glu Lys Pro Tyr Tyr Pro Val Thr 1040 1045 1050 Ala Ala Gln Lys Arg Met Tyr Ile Ala Gln Gln Trp Glu Asp Gly 1055 1060 1065 Glu Ala Thr Ser Ser Tyr His Met Pro Phe Met Met Glu Ile Thr 1070 1075 1080 Gly Pro Leu Gln Val Glu Lys Leu Gln Gln Thr Val Lys Ser Leu 1085 1090 1095 Val Ala Arg His Glu Ser Leu Arg Thr Ser Phe His Met Ile Asn 1100 1105 1110 Glu Val Leu Met Gln Lys Ile His Ala Asp Val Leu Trp Asp Leu 1115 1120 1125 Asp Ile Asp Leu Glu Ser Val Val Ala Ser Glu Gln Glu Ile Asp 1130 1135 1140 Glu Lys Met Phe Gln Phe Leu Arg Lys Phe Asp Leu Ser Gln Ala 1145 1150 1155 Pro Leu Phe Arg Ala Lys Leu Ile Arg Val Asn Ala Ser Arg His 1160 1165 1170 Val Leu Leu Leu Asp Met His His Ile Ile Ser Asp Gly Phe Ser 1175 1180 1185 Tyr Gln Ile Phe Phe Asp Glu Leu Thr Lys Leu Tyr Gln Gly Asp 1190 1195 1200 Glu Leu Pro Ser Leu Lys Ile Gln Tyr Lys Asp Tyr Ala Val Trp 1205 1210 1215 Gln His Ser Glu Glu Gln Gln Lys Arg Leu Gln Gln Gln Glu Asp 1220 1225 1230 Tyr Trp Leu Gly Gln Phe Gln Gly Glu Ile Pro Val Leu Glu Leu 1235 1240 1245 Pro Thr Asp Tyr Gln Arg Pro Val Asp Lys Gln Phe Ala Gly Ala 1250 1255 1260 Leu Phe Thr His Gly Leu Ser Ala Gly Leu Thr Glu Lys Leu Arg 1265 1270 1275 Lys Leu Ala Ile Lys Glu Lys Thr Thr Leu Tyr Thr Val Leu Leu 1280 1285 1290 Thr Val Tyr Asn Ile Leu Leu Ser Lys Tyr Thr Ser Gln Glu Asp 1295 1300 1305 Leu Ile Val Gly Thr Pro Ile Ala Gly Arg Pro His Ala Asp Leu 1310 1315 1320 Asp Arg Val Phe Gly Met Phe Val Asn Thr Leu Ala Ile Arg Thr 1325 1330 1335 Ala Pro Lys Val Glu His Ser Phe Leu Thr Tyr Leu Ser Glu Val 1340 1345 1350 Lys Glu Thr Val Leu Gly Ala Tyr Gln Asn Pro Asp Tyr Pro Phe 1355 1360 1365 Glu Glu Leu Val Glu Lys Thr Leu Val Gln Arg Asp Val Ser Arg 1370 1375 1380 Asn Pro Leu Phe Asp Val Met Phe Ser Val Glu Lys Leu Pro Ser 1385 1390 1395 Ala Val Gln Phe Asp Asp Leu Arg Phe Cys Pro Arg Leu Phe Asp 1400 1405 1410 Trp Lys Lys Ala Lys Phe Asp Leu Asp Trp Thr Val Val Glu Gly 1415 1420 1425 Glu Ser Leu Glu Val Leu Val Glu Tyr Ser Thr Ser Leu Phe Asp 1430 1435 1440 Arg Ala Thr Ile Glu Arg Met Ala Lys His Phe Glu His Ile Leu 1445 1450 1455 Glu Gln Ile Leu Asp Gln Pro Asp Leu Ser Ile Ser Glu Ile Glu 1460 1465 1470 Leu Leu Thr Glu Ala Glu Lys Gln Gln Ile Leu Ile Glu Phe Asn 1475 1480 1485 Gln Ser Asp Lys Ser Phe Asp Ser Glu Lys Thr Ile Gln Glu Gln 1490 1495 1500 Phe Glu Glu Trp Ala Glu Lys Ala Pro His Ser Ile Ala Leu Val 1505 1510 1515 Phe Lys Asp Lys Gln Met Thr Tyr Gln Glu Leu Asn Gln Arg Ala 1520 1525 1530 Asn Gln Val Ala His Leu Leu Arg Gly Asn Gly Ile Ser Ala Asn 1535 1540 1545 Asp Phe Ile Gly Leu Met Val Asp Arg Ser Phe Glu Met Ile Ile 1550 1555 1560 Ser Met Leu Gly Ile Leu Lys Ala Gly Gly Ala Tyr Leu Pro Ile 1565 1570 1575 Asp Pro Asp Tyr Pro Glu Asp Arg Ile Asp Tyr Met Leu Ser Asp 1580 1585 1590 Ser Lys Ala Lys Ile Leu Leu Lys Gln Ser Asp Gln Thr Ala Pro 1595 1600 1605 Ala Ser Phe Glu Gly Lys Val Ile Ala Ile Asp Thr Pro Glu Leu 1610 1615 1620 Leu Glu Met Asp Ile Glu Asn Ile Pro Lys Val Asn Asn Ser Ser 1625 1630 1635 Asp Leu Ala Tyr Ile Ile Tyr Thr Ser Gly Ser Thr Gly Lys Pro 1640 1645 1650 Lys Gly Val Leu Ile Asn His Arg Cys Val Ile Asn Met Gln Leu 1655 1660 1665 Thr Ala Glu Thr Phe Gly Ile Tyr Pro Ser Ser Arg Ile Leu Gln 1670 1675 1680 Phe Ala Ser Phe Ser Phe Asp Ser Ser Val Gly Glu Ile Phe Tyr 1685 1690 1695 Thr Leu Leu Asn Gly Ala Cys Leu Tyr Leu Val Glu Lys Asp Leu 1700 1705 1710 Leu Leu Ser Gly Asn Glu Phe Val Ala Trp Leu Lys Lys Asn Arg 1715 1720 1725 Ile Ser Ser Ile Pro Phe Ile Ser Pro Ser Ala Leu Arg Met Leu 1730 1735 1740 Pro Tyr Glu Asp Leu Pro Asp Leu Ala Tyr Ile Ser Thr Gly Gly 1745 1750 1755 Glu Thr Leu Pro Ala Asp Leu Val Lys Ala Trp Gly Glu Asn Arg 1760 1765 1770 Val Phe Leu Asn Ala Tyr Gly Pro Thr Glu Thr Thr Val Asp Ala 1775 1780 1785 Thr Val Gly Val Cys Thr Pro Glu Gly Lys Pro His Ile Gly Arg 1790 1795 1800 Pro Val Thr Asn Lys Lys Val Tyr Val Val Asn Ser Asn Asn Gln 1805 1810 1815 Leu Gln Pro Ile Gly Val Pro Gly Glu Leu Cys Ile Gly Gly Glu 1820 1825 1830 Gly Val Ala Leu Gly Tyr Leu Asn Arg Pro Asp Leu Thr Gln Glu 1835 1840 1845 Lys Phe Val Ser Asn Pro Phe Ala Pro Gly Glu Arg Met Tyr Arg 1850 1855 1860 Ser Gly Asp Leu Val Arg Trp Leu Pro Asp Gly Thr Ile Glu Tyr 1865 1870 1875 Phe Gly Arg Leu Asp Asp Gln Val Lys Ile Arg Gly His Arg Ile 1880 1885 1890 Glu Leu Gly Glu Ile Glu Thr Arg Leu Leu Glu His Pro Ser Ile 1895 1900 1905 Lys Glu Ala Ile Val Ile Pro Arg Ser Asp Glu Ser Glu Ala Thr 1910 1915 1920 Tyr Leu Cys Ser Tyr Leu Ile Ala Glu Gly Ser Trp Asn Ala Ala 1925 1930 1935 Asp Leu Arg Lys Tyr Leu Lys Ala Ser Leu Pro Glu Tyr Met Ile 1940 1945 1950 Pro Ser Tyr Phe Val Glu Leu His Glu Leu Pro Leu Thr Pro Asn 1955 1960 1965 Gly Lys Val Asn Lys Lys Ala Leu Pro Lys Pro Glu Lys Gln Met 1970 1975 1980 Gln Arg Gly Lys Asp Tyr Val Ala Pro Thr Asn Pro Ile Gln Ser 1985 1990 1995 Ile Leu Ser Gln Ile Trp Thr Asp Val Leu Gly Val Glu Asn Ile 2000 2005 2010 Gly Ile His Asp Asn Phe Phe Glu Leu Gly Gly Asp Ser Ile Lys 2015 2020 2025 Ala Ile Gln Ile Ser Ala Arg Leu Asn Lys His Asn Leu Lys Val 2030 2035 2040 Lys Met Arg Glu Leu Phe Lys Asn Pro Thr Ile Ala Glu Leu Ser 2045 2050 2055 Leu Leu Val Gln Gln Ile Val Gln Glu Ile Asp Gln Gly Val Val 2060 2065 2070 Glu Gly Asn Ile Pro Leu Thr Pro Ile Gln His Trp Phe Phe Thr 2075 2080 2085 Gln Ser Phe Pro Gln Val Asn His Tyr Asn Gln Ser Val Leu Leu 2090 2095 2100 Phe Asn Ala Glu Gly Trp Asp Glu Gln Lys Val Asp Lys Ala Phe 2105 2110 2115 Glu Met Leu Thr Gln His His Asp Ala Leu Arg Ile Val Tyr Ser 2120 2125 2130 Leu Asp Glu Gln Gly Val Val Gln Arg Asn Arg Gly Leu Glu Gly 2135 2140 2145 Ser Asn Tyr His Phe Glu Ile Ile Asp Ala Arg Gln Asp Gly Glu 2150 2155 2160 Asp Gln Ser Asn Trp Lys Ala Ala Ala Asn Arg Met Gln Ala Ser 2165 2170 2175 Met Asp Ile Val Glu Gly Pro Leu Val Gln Ile Gly Leu Phe Arg 2180 2185 2190 Ala Asn Glu Gly Ala Tyr Leu Leu Ile Ala Ile His His Leu Val 2195 2200 2205 Val Asp Gly Val Ser Trp Arg Ile Leu Leu Glu Asp Phe Tyr His 2210 2215 2220 Leu Tyr Asn Gly Asn Asp Ser Leu Pro Leu Lys Thr Thr Ser Phe 2225 2230 2235 Gln Ala Trp Ser Gln Lys Leu Gln Glu Tyr Ala Gln Ser Lys Glu 2240 2245 2250 Leu Glu His Glu Leu Ser Tyr Trp Arg His Leu Asp Glu Ala Ile 2255 2260 2265 Thr Asp Tyr Thr Leu His Lys Asp Ile Glu Ala Ala Thr Ser Asn 2270 2275 2280 Lys Thr Thr Tyr Glu Glu Phe Leu Thr Val Ser Met Ser Leu Ser 2285 2290 2295 Thr Glu Glu Thr Gln Gln Leu Val Thr Glu Ala His Lys Ala Tyr 2300 2305 2310 Gln Thr Glu Ile Asn Asp Leu Leu Leu Thr Ala Leu Ala Leu Ala 2315 2320 2325 Leu Lys Glu Trp Thr Asn Lys Glu Gln Leu Leu Val Ser Met Glu 2330 2335 2340 Gly His Gly Arg Glu Glu Ile Leu Asp Asn Val Asp Ile Ser Arg 2345 2350 2355 Thr Val Gly Trp Phe Thr Ser Glu Tyr Pro Val Ala Ile His Leu 2360 2365 2370 Thr Lys Thr Asp Ile Ser Phe Ala Ile Lys Gln Val Lys Glu Thr 2375 2380 2385 Leu Arg Arg Val Pro Asn Lys Gly Phe Gly Tyr Gly Ile Leu Lys 2390 2395 2400 Tyr Leu Ala Lys Glu Thr Phe Lys Leu Lys Pro Glu Ile Ser Phe 2405 2410 2415 Asn Tyr Leu Gly Gln Phe Thr Asp Lys Glu Glu Gly Asn Ser Ser 2420 2425 2430 Leu Met Gly Asp Leu Ile Ser Pro Ala Asn Thr Ser Glu Leu Ser 2435 2440 2445 Leu Asp Ile Asn Gly Ser Ile Glu Ala Asp Arg Leu Gln Met His 2450 2455 2460 Phe Ser Tyr Asn Ser Arg Ala Tyr Tyr Pro Glu Thr Ile Ala Thr 2465 2470 2475 Leu Val Gln Asn Phe Lys Ser Tyr Leu Leu Glu Ile Ile Asn His 2480 2485 2490 Cys Arg Ala Lys Glu Gly Val Glu His Thr Pro Ser Asp Phe Asp 2495 2500 2505 Ile Asn Asp Leu Thr Met Glu Glu Leu Asp Asp Ile Phe Asp Asp 2510 2515 2520 Leu Glu Glu Glu Val Tyr Lys 2525 2530 <210> 24 <211> 4617 <212> PRT <213> Artificial <220> <223> artificial sequence <400> 24 Met Phe Ser Arg Ser Asn Val Gln Asn Leu Tyr Arg Leu Ser Pro Met 1 5 10 15 Gln Lys Gly Ile Leu Phe His Ser Leu Lys Asp Lys Glu Asn His Ala 20 25 30 Tyr Phe Asp Gln Leu Ile Phe Thr Leu Glu Gly Lys Val Glu Leu Glu 35 40 45 Tyr Leu Glu Glu Ala Phe Thr Gln Leu Ile Lys Lys His Asp Ile Leu 50 55 60 Arg Thr Val Phe Arg Tyr Lys Lys Val Lys Glu Pro Val Gln Met Val 65 70 75 80 Leu Lys Glu Arg Ser Ser Thr Ile Tyr Phe Glu Asp Ile Ser His Leu 85 90 95 Glu Pro Glu Glu Lys Val Asn Tyr Ile Lys Gln Phe Lys Met Arg Asp 100 105 110 Arg Glu Lys Gly Phe Asp Leu Ser Arg Asp Leu Leu Ile Arg Met Ser 115 120 125 Leu Phe Lys Leu Asp Gln Glu Gln Tyr Gln Leu Ile Met Ser Asn His 130 135 140 His Ile Ile Met Asp Gly Trp Cys Leu Gly Ile Ile Leu Thr Asp Phe 145 150 155 160 Leu Arg Met Tyr Lys Gly Ile Val Asn His Thr Pro Val Pro Tyr Glu 165 170 175 His Val Thr Pro Tyr Ser Lys His Ile Gln Trp Leu Glu Lys Gln Asp 180 185 190 His Gln Glu Ala Lys Asp Phe Tyr Gln Gln Leu Leu Glu Gly Tyr Asp 195 200 205 Lys Val Thr Gly Val Pro Gln Gln Leu Val Arg Ala Asn His Glu Glu 210 215 220 Tyr Thr His Gly Gln Cys Ile Val Lys Leu Asn Gln Glu Thr Ala Asp 225 230 235 240 Arg Leu Ile Ala Ile Ala Lys Ala Tyr Gln Val Thr Val Asn Thr Val 245 250 255 Phe Gln Thr Ile Trp Gly Ile Leu Leu Gln Lys Tyr Asn Asn Thr Asp 260 265 270 Asp Ile Val Phe Gly Ser Val Val Ser Gly Arg Pro Ala Glu Ile Pro 275 280 285 Asp Val Glu Lys Met Val Gly Leu Phe Ile Asn Thr Ile Pro Val Arg 290 295 300 Ile Lys Ala Asp Gln Gln Glu Arg Phe Asp Thr Leu Val Ala Lys Val 305 310 315 320 Gln Glu Met Ala Leu Ala Ser Glu Ser Tyr Asp Tyr Leu Ser Leu Ala 325 330 335 Asp Ile His Pro Glu Ala Gly Asp Phe Ile Asn His Ile Ile Ala Phe 340 345 350 Glu Asn Phe Tyr Ile Asp Met Asp Ser Phe Asn Gln Leu Ala Asp Lys 355 360 365 Lys Glu Leu Gly Phe Ser Leu Ala Phe Ala Thr Asp His His Glu Gln 370 375 380 Thr Asn Tyr Asp Leu Ser Val Gln Ala Gln Ile Gly Asp Glu Ser Ser 385 390 395 400 Ile Lys Ile Leu Tyr Asn Ser Lys Leu Tyr Thr Ser Glu Tyr Ile Ala 405 410 415 Asn Val Ile Asp His Phe Val Thr Val Ala Asp Ile Val Ala Ala Asn 420 425 430 Pro Ser Ile Pro Val Lys Glu Ile Asp Ile Leu Thr Lys Asp Lys Lys 435 440 445 Asp Gln Ile Leu Tyr Gly Phe Asn Asn Thr Tyr Ala Asp Tyr Pro Arg 450 455 460 Glu Lys Thr Ile His Gln Leu Phe Glu Glu Gln Val Asp Lys Asn Pro 465 470 475 480 Asn Gln Ile Ala Leu Val Phe Lys Glu Glu Lys Leu Thr Tyr Gly Glu 485 490 495 Val Asn Ala Lys Ala Asn Gln Leu Ala Tyr Val Leu Arg Lys Gln Gly 500 505 510 Val Gln Pro Asn Asp Val Ile Gly Ile Ile Thr Glu Arg Ser Pro Glu 515 520 525 Met Ile Ile Gly Ile Leu Ala Ile Phe Lys Ala Gly Gly Ala Tyr Met 530 535 540 Pro Ile Asp Pro Ser Tyr Pro Ala Glu Arg Ile Gln Tyr Met Leu Gln 545 550 555 560 Asp Asn Gln Thr Lys Leu Leu Leu Val Gln Lys Gln Glu Met Ile Pro 565 570 575 Ala Asn Tyr Gln Gly Glu Val Leu Phe Leu Thr Gln Glu Ser Trp Met 580 585 590 His Glu Glu Thr Ser Asn Pro Ala His Ile Thr Gln Ala Gln Ala Leu 595 600 605 Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr Gly Glu Pro Lys Gly Ile 610 615 620 Leu Thr Thr His Gln Asn Ile Met Lys Thr Val Ile His Asn Gly Tyr 625 630 635 640 Val Glu Ile Thr Pro Gly Asp Cys Leu Ser Gln Leu Ser Asn Tyr Ala 645 650 655 Phe Asp Gly Ser Thr Phe Glu Ile Tyr Gly Ala Leu Leu His Gly Ala 660 665 670 Thr Leu Leu Leu Val Thr Lys Glu Ala Val Leu Asn Met Asn Glu Leu 675 680 685 Ala Arg Leu Ile Lys Lys Glu Gln Val Thr Val Ser Phe Met Thr Thr 690 695 700 Ala Leu Phe Asn Thr Leu Val Asp Leu Asp Ile Thr Cys Phe Gln Ser 705 710 715 720 Ile Arg Lys Val Leu Phe Gly Gly Glu Leu Ala Ser Val Lys His Val 725 730 735 Leu Lys Ala Leu Asp Tyr Leu Gly Glu His Arg Val Ile Asn Val Tyr 740 745 750 Gly Pro Thr Glu Thr Thr Val Tyr Ala Thr Tyr Tyr Ser Val Asp His 755 760 765 Ser Met Leu Thr Arg Ala Ser Val Pro Ile Gly Arg Pro Ile Asn Asn 770 775 780 Thr Lys Ala Tyr Ile Val Asn Thr Asp Gly Gln Pro Gln Pro Ile Gly 785 790 795 800 Val Val Gly Glu Leu Cys Ile Gly Gly Glu Gly Val Ala Cys Gly Tyr 805 810 815 Leu Asn Arg Pro Glu Leu Thr Lys Lys His Phe Val Asp Asn Pro Phe 820 825 830 Val Leu Gly Glu Arg Met Tyr Cys Thr Gly Asp Leu Ala Arg Phe Leu 835 840 845 Pro Asp Gly Asn Ile Glu Tyr Ile Gly Arg Met Asp Glu Gln Val Lys 850 855 860 Ile Arg Gly His Arg Ile Glu Leu Gly Glu Ile Glu Lys Val Leu Leu 865 870 875 880 Gln His Pro Ala Ile Ser Glu Thr Val Leu Leu Ala Lys Arg Asp Glu 885 890 895 Gln Gly His Ser Tyr Leu Cys Ala Tyr Ile Val Gly Gln Val Phe Trp 900 905 910 Thr Val Thr Glu Leu Arg Gln His Leu Met Glu Ser Leu Pro Glu Tyr 915 920 925 Met Val Pro Ser Tyr Phe Ile Glu Ile Glu Lys Leu Pro Leu Thr Ala 930 935 940 Asn Gly Lys Val Asp Lys Arg Ala Leu Pro Glu Pro Asp Arg Lys Met 945 950 955 960 Gly Ser Ala Tyr Val Ala Pro Glu Asn Glu Thr Glu Glu Lys Leu Val 965 970 975 Gln Phe Phe Gln Glu Ile Leu Gly Val Glu Arg Val Gly Thr Gln Asp 980 985 990 Thr Phe Phe Glu Leu Gly Gly His Ser Leu Lys Ala Met Met Leu Val 995 1000 1005 Leu Gln Ile His Lys Glu Met Gly Ile Glu Val Pro Leu Lys Glu 1010 1015 1020 Ile Phe Thr Arg Pro Thr Ile Lys Glu Leu Ala Ala Tyr Ile His 1025 1030 1035 Lys Met Asp Arg Ser Ala Tyr Ser Met Ile Glu Pro Thr Ala Lys 1040 1045 1050 Gln Glu Tyr Tyr Pro Val Ser Phe Ala Gln Arg Arg Met Phe Val 1055 1060 1065 Val Gln Gln Ile Arg Asp Thr Asn Thr Thr Ser Tyr Asn Met Pro 1070 1075 1080 Ile Leu Leu Glu Ile Glu Gly Ala Leu Asp Arg Glu Asn Val Arg 1085 1090 1095 Gln Thr Leu Lys Lys Leu Ile Glu Arg His Glu Ser Met Arg Thr 1100 1105 1110 Ser Phe His Met Ile Asp Glu Thr Leu Leu Gln Lys Val His Asp 1115 1120 1125 Asp Val Thr Trp Glu Met Glu Glu Met Glu Ala Ser Glu Glu Glu 1130 1135 1140 Val Tyr Ala Leu Thr Lys Ser Phe Ile Arg Pro Phe Asp Leu Gly 1145 1150 1155 Gln Ala Pro Leu Phe Arg Ala Gly Leu Ile Arg Val Asn Ser Glu 1160 1165 1170 Arg His Leu Leu Leu Leu Asp Thr His His Ile Ile Ser Asp Gly 1175 1180 1185 Val Ser Thr Asn Ile Leu Phe Gln Asp Phe Thr Gln Leu Tyr Arg 1190 1195 1200 Gly Arg Glu Leu Pro Ala Leu Arg Ile Gln Tyr Lys Asp Phe Ala 1205 1210 1215 Val Trp Gln Gln Gly Glu Ala Gln Leu Ala Arg Leu Gln Glu Gln 1220 1225 1230 Glu Glu Tyr Trp Leu Lys Gln Phe Ser Glu Ser Val Pro Val Leu 1235 1240 1245 Glu Leu Pro Thr Asp Phe Pro Arg Pro Ala Met Gln Gln Phe Asp 1250 1255 1260 Gly Asp Val Leu Asp Phe Ala Leu Asn Gln Gln Val Trp Gln Glu 1265 1270 1275 Leu Gln Gln Leu Ile Val Lys Glu Gly Cys Thr Ala Tyr Met Ile 1280 1285 1290 Leu Leu Ala Ala Tyr His Val Leu Leu Ser Lys Tyr Ser Ser Gln 1295 1300 1305 Asn Asp Ile Val Ile Gly Ser Pro Ile Ala Gly Arg Thr Asn Ala 1310 1315 1320 Asp Leu Gln Ser Ile Val Gly Met Phe Val Asn Thr Leu Ala Ile 1325 1330 1335 Arg Thr Lys Ser Glu Gly Thr Gln Thr Phe Arg Glu Phe Leu Ser 1340 1345 1350 Thr Ile Lys Gln Leu Val Leu Gln Ala Gln Ser Asn Ala Glu Tyr 1355 1360 1365 Pro Phe Glu Glu Leu Val Asp Lys Val Asn Pro Ser Arg Asp Leu 1370 1375 1380 Ser Arg Gln Pro Leu Phe Asp Thr Ile Phe Val Met Gln Asn Met 1385 1390 1395 Asp Ile Thr Glu Val Ala Ile Gln Gly Leu Ser Ile Val Thr Lys 1400 1405 1410 Asp Met Glu Trp Lys His Ser Lys Phe Asp Leu Thr Trp Ala Ala 1415 1420 1425 Val Glu Lys Glu Ser Leu His Phe Ser Val Glu Tyr Ser Thr Arg 1430 1435 1440 Leu Phe Lys Lys Glu Thr Ile Glu Arg Met Ala Lys His Phe Ala 1445 1450 1455 His Leu Leu Asn Gln Val Ala Glu Asn Pro Asp Leu Ser Leu Ser 1460 1465 1470 Asp Met Glu Leu Ala Thr Asp Glu Glu Val Tyr Gln Leu Leu Glu 1475 1480 1485 Glu Phe Asn Asn Thr Glu Ala Asp Tyr Pro Ser Asp Lys Thr Ile 1490 1495 1500 His Gln Gln Phe Glu Gln Lys Val Glu Glu Asn Pro Asp Gln Ile 1505 1510 1515 Ala Leu Leu Phe Lys Asp Lys Glu Ile Thr Tyr Gly Gln Leu Asn 1520 1525 1530 Ala Lys Ala Asn Gln Phe Ala Arg Val Leu Arg Lys His Gly Val 1535 1540 1545 Gln Pro Asp Gln Val Val Gly Leu Ile Thr Asp Arg Ser Ile Glu 1550 1555 1560 Met Met Ile Gly Ile Leu Ala Ile Leu Lys Ala Gly Gly Ala Tyr 1565 1570 1575 Leu Pro Ile Asp Pro Ser Tyr Pro Leu Glu Arg Ile Thr Tyr Met 1580 1585 1590 Leu Glu Asp Ser Gln Ala Gln Leu Leu Ile Val Gln Glu Ala Ala 1595 1600 1605 Met Ile Pro Glu Gly Tyr Gln Gly Lys Val Leu Leu Leu Ala Glu 1610 1615 1620 Glu Cys Trp Met Gln Glu Glu Ala Ser Asn Leu Glu Leu Ile Asn 1625 1630 1635 Asp Ala Gln Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr 1640 1645 1650 Gly Lys Pro Lys Gly Asn Leu Thr Thr His Gln Asn Ile Leu Arg 1655 1660 1665 Thr Ile Ile Asn Asn Gly Phe Ile Glu Ile Val Pro Ala Asp Arg 1670 1675 1680 Leu Leu Gln Leu Ser Asn Tyr Ala Phe Asp Gly Ser Thr Phe Asp 1685 1690 1695 Ile Tyr Ser Ala Leu Leu Asn Gly Ala Thr Leu Val Leu Val Pro 1700 1705 1710 Lys Glu Val Met Leu Asn Pro Met Glu Leu Ala Arg Ile Val Arg 1715 1720 1725 Glu Gln Asp Ile Thr Val Ser Phe Met Thr Thr Ser Leu Phe His 1730 1735 1740 Thr Leu Val Glu Leu Asp Val Thr Ser Met Lys Ser Ile Arg Lys 1745 1750 1755 Val Val Phe Gly Gly Glu Lys Ala Ser Tyr Lys His Val Glu Lys 1760 1765 1770 Ala Leu Asp Tyr Leu Gly Glu Gly Arg Leu Val Asn Gly Tyr Gly 1775 1780 1785 Pro Thr Glu Thr Thr Val Phe Ala Thr Thr Tyr Thr Val Asp Ser 1790 1795 1800 Ser Ile Lys Glu Thr Gly Ile Val Pro Ile Gly Arg Pro Leu Asn 1805 1810 1815 Asn Thr Ser Val Tyr Ile Leu Asn Glu Asn Asn Gln Pro Gln Pro 1820 1825 1830 Ile Gly Val Pro Gly Glu Leu Cys Val Gly Gly Ala Gly Ile Ala 1835 1840 1845 Arg Gly Tyr Leu Asn Arg Pro Glu Leu Thr Ala Glu Arg Phe Val 1850 1855 1860 Asp Asn Pro Phe Leu Val Gly Asp Arg Met Tyr Arg Thr Gly Asp 1865 1870 1875 Met Ala Arg Phe Leu Pro Asp Gly Asn Ile Glu Tyr Ile Gly Arg 1880 1885 1890 Met Asp Glu Gln Val Lys Ile Arg Gly His Arg Ile Glu Leu Gly 1895 1900 1905 Glu Ile Glu Lys Ser Leu Leu Glu Tyr Pro Ala Ile Ser Glu Ala 1910 1915 1920 Val Leu Val Ala Lys Arg Asp Glu Gln Gly His Ser Tyr Leu Cys 1925 1930 1935 Ala Tyr Val Val Ser Thr Asp Gln Trp Thr Val Ala Lys Val Arg 1940 1945 1950 Gln His Ile Leu Glu Ala Leu Pro Glu Tyr Met Val Pro Ser Tyr 1955 1960 1965 Phe Val Glu Leu Glu Lys Leu Pro Leu Thr Ser Asn Gly Lys Val 1970 1975 1980 Asp Lys Arg Ala Leu Pro Glu Pro Asp Arg Val Ile Thr Asn Glu 1985 1990 1995 Tyr Val Ala Ala Val Asn Glu Thr Glu Glu Lys Leu Val Gln Phe 2000 2005 2010 Phe Gln Glu Ile Leu Ala Val Asp Arg Val Gly Thr Gln Asp Thr 2015 2020 2025 Phe Phe Glu Leu Gly Gly His Ser Leu Lys Ala Met Met Leu Val 2030 2035 2040 Ser Arg Ile His Lys Glu Leu Glu Ile Glu Val Pro Leu Lys Glu 2045 2050 2055 Val Phe Ala Arg Gln Thr Val Lys Glu Leu Ala Ala Tyr Ile Arg 2060 2065 2070 Gln Ala Glu Gln Ser Asp Tyr Ser Glu Ile Gln Pro Ala Met Glu 2075 2080 2085 Gln Glu Tyr Tyr Pro Val Ser Asn Ala Gln Arg Arg Met Tyr Val 2090 2095 2100 Val Gln Gln Met Arg Asp Val Glu Thr Thr Gly Tyr Asn Met Pro 2105 2110 2115 Phe Tyr Leu Glu Met Glu Gly Ala Leu Glu Val Glu Lys Leu Ser 2120 2125 2130 Leu Ala Leu Lys Gln Leu Ile Glu Arg His Glu Ser Leu Arg Thr 2135 2140 2145 Ser Phe His Met Val Glu Asp Glu Leu Met Gln Lys Val His Ala 2150 2155 2160 Glu Val Ala Trp Glu Met Glu Met Ile His Ala Val Glu Glu Glu 2165 2170 2175 Val Gln Gln Leu Thr Asp Ser Phe Met Arg Pro Phe Asp Leu Ala 2180 2185 2190 Lys Ala Pro Leu Phe Arg Ala Arg Leu Ile Gln Ile Asn Pro Lys 2195 2200 2205 Arg His Leu Leu Met Leu Asp Met His His Ile Ile Ser Asp Gly 2210 2215 2220 Val Ser Met Asn Val Leu Phe Gln Asp Ile Thr Gln Leu Tyr Gln 2225 2230 2235 Gly Ile Glu Leu Ser Pro Leu Lys Ile Gln Tyr Lys Asp Phe Ala 2240 2245 2250 Val Trp Gln Gln Gly Ile Ala Gln Val Val Arg Phe Gln Glu Gln 2255 2260 2265 Glu Arg Tyr Trp Leu Asn Gln Phe Ser Gly Asp Leu Pro Ile Leu 2270 2275 2280 Glu Met Val Thr Asp Tyr Pro Arg Pro Ala Ile Gln Gln Phe Asp 2285 2290 2295 Gly Asp Ser Trp Ser Phe Glu Ile Asp Ala Lys Val Leu Asp Ser 2300 2305 2310 Ile Lys Gln Leu Ser Ala Lys Gln Gly Thr Thr Leu Tyr Met Thr 2315 2320 2325 Leu Leu Ala Ile Tyr Gln Ile Leu Leu Ala Lys Tyr Thr Arg Gln 2330 2335 2340 Asp Asp Ile Ile Val Gly Thr Pro Ile Ala Gly Arg Pro His Ala 2345 2350 2355 Asp Thr Glu Ser Ile Val Gly Met Phe Val Asn Thr Leu Ala Leu 2360 2365 2370 Arg Gly Gln Pro Lys Glu Glu Gln Ser Phe Ile Ser Tyr Leu Ser 2375 2380 2385 Glu Val Lys Glu Asn Val Leu Gln Ala Tyr Ala Asn Ala Asp Tyr 2390 2395 2400 Pro Phe Glu Glu Leu Val Glu Lys Leu His Leu Gln Arg Asp Met 2405 2410 2415 Ser Arg His Pro Leu Phe Asp Thr Met Phe Val Leu Gln Asn Met 2420 2425 2430 Asp Met Ser Asp Ile Asn Ile Ser Gly Leu Lys Leu His Ser Arg 2435 2440 2445 Asp Leu Asn Trp Lys Asn Ala Lys Phe Asp Met Thr Trp Met Ile 2450 2455 2460 Ala Glu Gln Asn Asn Leu Leu Ile Ser Val Glu Tyr Ser Thr Asn 2465 2470 2475 Leu Phe Lys His Glu Thr Ile Gln Arg Leu Glu Lys His Phe Thr 2480 2485 2490 Tyr Leu Val Glu Gln Val Ala Lys His Pro Asp Cys Leu Leu Arg 2495 2500 2505 Asp Leu Glu Leu Thr Thr Asp Glu Glu Lys Gln Gln Ile Leu Thr 2510 2515 2520 Val Phe Asn Asp Thr Ala Thr Asp Asp Leu Gln Asp Leu Ser Ile 2525 2530 2535 Cys His Leu Phe Glu Gln Gln Val Gln Arg Phe Ser Asp Arg Pro 2540 2545 2550 Ala Leu Val Phe Lys Glu Lys Gln Leu Thr Tyr Ser Glu Phe His 2555 2560 2565 Ala Lys Val Asn Gln Leu Ala Arg Val Leu Arg Lys Lys Gly Val 2570 2575 2580 Gln Pro Asp Gln Ala Val Gly Leu Ile Thr Asp Arg Ser Ile Glu 2585 2590 2595 Met Met Ile Gly Ile Phe Ala Ile Leu Lys Ala Gly Gly Ala Tyr 2600 2605 2610 Met Pro Ile Asp Pro Ser Tyr Pro Ile Asp Arg Ile Glu His Met 2615 2620 2625 Leu Glu Asp Ser Arg Thr Lys Leu Leu Phe Val Gln Lys Thr Glu 2630 2635 2640 Met Ile Pro Ala Ser Tyr Gln Gly Glu Val Leu Leu Leu Ala Glu 2645 2650 2655 Glu Cys Trp Met His Glu Asp Ser Ser Asn Leu Glu Leu Ile Asn 2660 2665 2670 Lys Thr Gln Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr 2675 2680 2685 Gly Lys Pro Lys Gly Asn Leu Thr Thr His Gln Asn Ile Leu Thr 2690 2695 2700 Thr Ile Ile Asn Asn Gly Tyr Ile Glu Ile Ala Pro Thr Asp Arg 2705 2710 2715 Leu Leu Gln Leu Ser Asn Tyr Ala Phe Asp Gly Ser Thr Phe Asp 2720 2725 2730 Ile Tyr Ser Ala Leu Leu Asn Gly Ala Thr Leu Val Leu Val Pro 2735 2740 2745 Lys Glu Val Met Leu Asn Pro Met Glu Leu Ala Lys Ile Val Arg 2750 2755 2760 Glu Gln Asp Ile Thr Val Ser Phe Met Thr Thr Ser Leu Phe His 2765 2770 2775 Thr Leu Val Glu Leu Asp Val Thr Ser Met Lys Ser Met Arg Lys 2780 2785 2790 Val Val Phe Gly Gly Glu Lys Ala Ser Tyr Lys His Val Glu Lys 2795 2800 2805 Ala Leu Asp Tyr Leu Gly Glu Gly Arg Leu Val Asn Gly Tyr Gly 2810 2815 2820 Pro Thr Glu Thr Thr Val Phe Ala Thr Thr Tyr Thr Val Asp Ser 2825 2830 2835 Ser Ile Lys Glu Thr Gly Ile Val Pro Ile Gly Arg Pro Leu Asn 2840 2845 2850 Asn Thr Ser Val Tyr Val Leu Asn Glu Asn Asn Gln Leu Gln Pro 2855 2860 2865 Ile Gly Val Pro Gly Glu Leu Cys Val Gly Gly Ala Gly Ile Ala 2870 2875 2880 Arg Gly Tyr Leu Asn Arg Pro Glu Leu Thr Ala Glu Arg Phe Val 2885 2890 2895 Glu Asn Pro Phe Val Ser Gly Asp Arg Met Tyr Arg Thr Gly Asp 2900 2905 2910 Leu Ala Arg Trp Leu Pro Asp Gly Ser Met Glu Tyr Leu Gly Arg 2915 2920 2925 Met Asp Glu Gln Val Lys Val Arg Gly Tyr Arg Ile Glu Leu Gly 2930 2935 2940 Glu Ile Glu Thr Arg Leu Leu Glu His Pro Ser Ile Ser Ala Ala 2945 2950 2955 Val Leu Leu Ala Lys Gln Asp Glu Gln Gly His Ser Tyr Leu Cys 2960 2965 2970 Ala Tyr Ile Val Ala Asn Gly Val Trp Thr Val Ala Glu Leu Arg 2975 2980 2985 Lys His Leu Ser Glu Ala Leu Pro Glu Tyr Met Val Pro Thr Tyr 2990 2995 3000 Phe Val Glu Leu Glu Gln Ile Pro Phe Thr Ser Asn Gly Lys Val 3005 3010 3015 Asn Lys Arg Ala Leu Pro Glu Pro Glu Gly Gln Met Thr Ser Val 3020 3025 3030 Tyr Val Ala Pro Glu Thr Glu Thr Glu Ala Lys Val Ala Ala Leu 3035 3040 3045 Phe Gln Glu Ile Leu Gly Val Glu Arg Val Gly Thr Gln Asp Met 3050 3055 3060 Phe Phe Glu Leu Gly Gly His Ser Leu Lys Ala Met Met Leu Val 3065 3070 3075 Leu Arg Met Asn Lys Glu Leu Gly Ile Glu Val Pro Leu Lys Glu 3080 3085 3090 Val Phe Ala His Pro Thr Val Lys Glu Leu Ala Ala Thr Ile Asp 3095 3100 3105 Leu Leu Asp Arg Ser Gly His Ser Glu Ile Glu Pro Ala Pro Arg 3110 3115 3120 Gln Glu Phe Tyr Pro Val Ser Ser Ala Gln Arg Arg Met Tyr Val 3125 3130 3135 Val Gln His Leu Gly Asn Val Gln Thr Thr Ser Tyr Asn Met Pro 3140 3145 3150 Leu Phe Leu Glu Val Glu Gly Ala Leu Glu Ile Asp Lys Leu His 3155 3160 3165 Leu Ala Leu Glu Lys Leu Val Glu Arg His Glu Ser Leu Arg Thr 3170 3175 3180 Ser Phe His Met Val Asp Glu Glu Leu Met Gln Gln Val His Glu 3185 3190 3195 Glu Val Ala Trp Asp Leu Glu Ile Met Asp Gly Thr Glu Gly Asp 3200 3205 3210 Leu Ala Ser Ile Thr Ala Gly Phe Ile Arg Pro Phe Asp Leu Ser 3215 3220 3225 Gln Ala Pro Leu Phe Arg Ala Gly Ile Val Arg Ile Ser Pro Glu 3230 3235 3240 Arg Phe Leu Phe Met Leu Asp Met His His Ile Ile Ser Asp Gly 3245 3250 3255 Val Ser Thr Asn Val Leu Phe Lys Asp Ile Thr Gln Leu Tyr Gln 3260 3265 3270 Gly Lys Asp Leu Pro Pro Leu Pro Ile Gln Tyr Lys Asp Tyr Ala 3275 3280 3285 Val Trp Gln Gln Ala Asp Ala Gln Val Thr Arg Leu Gln Asp Gln 3290 3295 3300 Glu Ser Tyr Trp Leu His Gln Phe Ala Gly Glu Ala Ser Val Leu 3305 3310 3315 Glu Met Pro Thr Asp Phe Pro Arg Pro Ala Val Gln Gln Phe Glu 3320 3325 3330 Gly Asp Val Trp Thr Phe Glu Ile Asp Ala Asp Ile Leu Ser Gln 3335 3340 3345 Leu Lys Lys Leu Ser Val Ser Gln Gly Ser Thr Leu Tyr Met Thr 3350 3355 3360 Leu Leu Ala Val Tyr Gln Val Leu Leu Ala Lys Tyr Thr Gly Gln 3365 3370 3375 Asp Asp Ile Ile Val Gly Ser Pro Ile Ala Gly Arg Pro His Ala 3380 3385 3390 Asp Val Glu Ser Ile Val Gly Met Phe Val Asn Thr Leu Ala Leu 3395 3400 3405 Arg Gly Gln Pro Val Gly Glu Gln Thr Phe Ile Thr Tyr Leu Ala 3410 3415 3420 Gln Val Lys Glu Gln Val Leu Gln Ala Tyr Ala Asn Ala Glu Tyr 3425 3430 3435 Pro Phe Glu Lys Leu Val Glu Lys Leu Asp Leu Gln Arg Asp Met 3440 3445 3450 Ser Arg His Pro Leu Phe Asp Thr Met Phe Thr Leu Gln Asn Met 3455 3460 3465 Glu Met Thr Asp Ile Asp Leu Ala Gly Leu Thr Phe Lys Pro Phe 3470 3475 3480 Asp Phe Glu Trp Lys Asn Ala Lys Phe Asp Met Asp Trp Thr Met 3485 3490 3495 Leu Glu Glu Glu Thr Leu Lys Val Ala Ile Glu Tyr Ser Thr Ser 3500 3505 3510 Leu Tyr Thr Lys Glu Thr Ile Ser Arg Met Ala Gln His Phe Thr 3515 3520 3525 Tyr Val Leu Gln Gln Ile Ile Glu His Pro Ala Ile Arg Leu Ala 3530 3535 3540 Glu Ile Lys Ile Ala Thr Leu Pro Glu Ile Glu Gln Ile Leu Thr 3545 3550 3555 Gln Phe Asn Asp Thr Arg Ala Asn Tyr Pro Asp Asn Gln Thr Ile 3560 3565 3570 His Ser Leu Phe Glu Gln Gln Val Glu Arg Thr Pro Glu Gln Ile 3575 3580 3585 Ala Val Val Tyr Gln Asp Gln Ser Ile Thr Tyr Arg Glu Leu Asn 3590 3595 3600 Glu Arg Ala Asn Arg Leu Ala Arg Cys Leu Ile Asp Lys Gly Ile 3605 3610 3615 Gln Arg Asn Gln Phe Val Ala Ile Met Ala Asp Arg Ser Ile Glu 3620 3625 3630 Thr Val Ile Gly Met Met Gly Ile Leu Lys Ala Gly Gly Ala Tyr 3635 3640 3645 Val Pro Ile Asp Pro Asp Tyr Pro Leu Asp Arg Lys Leu Tyr Ile 3650 3655 3660 Leu Glu Asp Ser His Ala Ser Leu Leu Leu Phe Gln Gln Lys His 3665 3670 3675 Glu Val Pro Ser Glu Phe Thr Gly Asp Arg Ile Leu Ile Glu Gln 3680 3685 3690 Met Gln Trp Tyr Gln Ala Ala Asp Thr Asn Val Gly Ile Val Asn 3695 3700 3705 Thr Ala Gln Asp Leu Ala Tyr Met Ile Tyr Thr Ser Gly Ser Thr 3710 3715 3720 Gly Gln Pro Lys Gly Val Met Ile Asp His Gln Ala Val Cys Asn 3725 3730 3735 Leu Cys Leu Met Ala Gln Thr Tyr Gly Ile Phe Ala Asn Ser Arg 3740 3745 3750 Val Leu Gln Phe Ala Ser Phe Ser Phe Asp Ala Ser Val Gly Glu 3755 3760 3765 Val Phe His Thr Leu Thr Asn Gly Ala Thr Leu Tyr Leu Met Asp 3770 3775 3780 Arg Asn Leu Leu Met Ala Gly Val Glu Phe Val Glu Trp Leu Arg 3785 3790 3795 Val Asn Glu Ile Thr Ser Ile Pro Phe Ile Ser Pro Ser Ala Leu 3800 3805 3810 Arg Ala Leu Pro Tyr Glu Asp Leu Pro Ala Leu Lys Tyr Ile Ser 3815 3820 3825 Thr Gly Gly Glu Ala Leu Pro Val Asp Leu Val Arg Leu Trp Gly 3830 3835 3840 Thr Glu Arg Ile Phe Leu Asn Ala Tyr Gly Pro Thr Glu Thr Thr 3845 3850 3855 Val Asp Ala Thr Ile Gly Leu Cys Thr Pro Glu Asp Lys Pro His 3860 3865 3870 Ile Gly Lys Pro Val Leu Asn Lys Lys Ala Tyr Ile Ile Asn Pro 3875 3880 3885 Asn Tyr Gln Leu Gln Pro Ile Gly Val Pro Gly Glu Leu Cys Ile 3890 3895 3900 Gly Gly Val Gly Ile Ala Pro Gly Tyr Trp Asn Arg Pro Glu Leu 3905 3910 3915 Thr Arg Glu Lys Phe Val Asp Asn Pro Phe Ala Gln Gly Glu Arg 3920 3925 3930 Met Tyr Lys Thr Gly Asp Leu Val Arg Trp Leu Pro Asp Gly Asn 3935 3940 3945 Ile Glu Phe Leu Gly Arg Ile Asp Asp Gln Val Lys Ile Arg Gly 3950 3955 3960 His Arg Ile Glu Leu Gly Glu Ile Glu Thr Arg Leu Leu Glu His 3965 3970 3975 Glu Gln Val Ile Glu Ala Val Val Leu Ala Arg Glu Asp Glu Gln 3980 3985 3990 Gly Gln Ala Tyr Leu Cys Ala Tyr Leu Val Ala Ala Asp Glu Trp 3995 4000 4005 Thr Val Ala Glu Leu Arg Lys His Leu Gly Lys Thr Leu Pro Asp 4010 4015 4020 Tyr Met Ile Pro Ala Tyr Phe Ile Glu Leu Glu Glu Phe Pro Leu 4025 4030 4035 Thr Pro Ser Gly Lys Val Asn Lys Lys Ala Leu Pro Glu Pro Asp 4040 4045 4050 Gly Gln Ile Gln Thr Gly Val Glu Tyr Val Glu Ala Thr Thr Glu 4055 4060 4065 Ser Gln Lys Ile Leu Val Glu Leu Trp Gln Glu Val Leu Arg Val 4070 4075 4080 Glu Arg Ile Gly Ile Tyr Asp Asn Phe Phe Glu Leu Gly Gly Asp 4085 4090 4095 Ser Ile Lys Ala Ile Gln Ile Thr Ala Arg Leu Arg Arg His His 4100 4105 4110 Arg Lys Leu Glu Ile Ser His Leu Phe Lys His Pro Thr Ile Ala 4115 4120 4125 Glu Leu Ala Pro Trp Met Gln Thr Ser Gln Ala Leu Leu Glu Gln 4130 4135 4140 Gly Thr Val Glu Gly Glu Val Met Leu Thr Pro Ile Gln Lys Ala 4145 4150 4155 Phe Phe Glu Glu Asn Gln Glu Gln Pro Gln His Phe Asn Gln Asp 4160 4165 4170 Ser Leu Leu Tyr Ser Ser Asn Gly Trp Asn Gln Asp Ala Ile Glu 4175 4180 4185 Gln Val Phe Glu Lys Ile Thr Glu His His Asp Ala Leu Arg Met 4190 4195 4200 Val Tyr Pro His Thr Glu Gly Lys Val Thr Gln Ile Asn Arg Gly 4205 4210 4215 Leu Glu Asp Lys Ala Phe Thr Leu Gln Val Phe Asp Phe Thr Gln 4220 4225 4230 Glu Pro Thr Asp Thr Gln Ala Thr Lys Ile Glu Gln Ile Ala Thr 4235 4240 4245 Gln Leu Gln Ala Ser Phe Asp Leu Lys Lys Gly Pro Leu Val Arg 4250 4255 4260 Leu Gly Leu Phe Thr Thr Lys Ala Gly Asp Tyr Leu Leu Ile Val 4265 4270 4275 Ile His His Leu Val Ile Asp Gly Val Ser Trp Arg Ile Leu Leu 4280 4285 4290 Glu Asp Phe His Asn Ala Tyr Gln Gln Val Ile Gln Gly Gln Ala 4295 4300 4305 Ile Val Leu Pro Glu Lys Thr Thr Ser Phe Lys Thr Trp Ser Glu 4310 4315 4320 Arg Leu Asn Glu Tyr Ala Asn Ser His Ala Leu Leu His Glu Ile 4325 4330 4335 Pro Tyr Trp Lys Gln Met Glu Glu Ile Ser Ile Ala Pro Leu Pro 4340 4345 4350 Lys Lys Gly Asn Asn Asp Gly Arg Tyr Tyr Val Lys Asp Ser Glu 4355 4360 4365 Tyr Ala Thr Met Ser Leu Thr Glu Glu Glu Thr Gln Asn Leu Leu 4370 4375 4380 Thr Arg Val His Arg Ala Tyr Arg Thr Glu Ile Asn Asp Leu Leu 4385 4390 4395 Leu Ala Ala Leu Gly Leu Ala Ser Lys Glu Trp Thr Lys Glu Asn 4400 4405 4410 Arg Val Ala Ile His Leu Glu Gly His Gly Arg Glu Glu Ile Gly 4415 4420 4425 Glu Gly Val Asp Val Asn Arg Thr Val Gly Trp Phe Thr Ser Leu 4430 4435 4440 Phe Pro Phe Val Ile Asp Leu Glu Asn Asp Glu Leu Pro Leu Ile 4445 4450 4455 Ile Lys Ser Val Lys Glu Thr Leu Arg Arg Val Pro Asn Lys Gly 4460 4465 4470 Met Gly Tyr Gly Ile Leu Lys His Leu Thr Ser Asp Ala Asn Lys 4475 4480 4485 Gln Glu Ile Thr Phe Ser Leu Arg Pro Glu Ile Ser Phe Asn Tyr 4490 4495 4500 Leu Gly Val Phe Asp Gln Gln Glu Glu Glu Ser Glu Ser Ala Gly 4505 4510 4515 Ile Pro Thr Gly Gln Pro Ile Ser Pro Gln Tyr Tyr Asp Thr His 4520 4525 4530 Leu Leu Glu Phe Asn Gly Ala Val Ser Asn Asn Gln Leu His Val 4535 4540 4545 Asn Cys Arg Phe Ala Pro Ala Ala Val Asp Arg Ala Ile Val Glu 4550 4555 4560 Ile Leu Met Glu Arg Phe Lys His His Leu Leu Leu Ile Ser Lys 4565 4570 4575 His Cys Leu Glu Lys Asp Thr Val Glu Phe Thr Pro Thr Asp Phe 4580 4585 4590 Thr Glu Lys Glu Leu Ser Gln Glu Gln Leu Asp Asp Leu Leu Asp 4595 4600 4605 Asp Leu Phe Glu Asp Ile Asp Asp Leu 4610 4615 <210> 25 <211> 2541 <212> PRT <213> Artificial <220> <223> artificial sequence <400> 25 Met Gln Lys Lys Asp Lys Ile Lys Asp Ile Tyr Ser Leu Ser Pro Leu 1 5 10 15 Gln Lys Gly Met Leu Phe His Ser Met Lys Asp Pro Gln Ser Asp Ala 20 25 30 Tyr Phe Glu Gln Val Thr Leu Leu Leu Glu Gly Val Val Asn Pro Thr 35 40 45 Tyr Leu Ala Glu Ser Ile Gln Gly Leu Val Gln Lys Tyr Asp Met Phe 50 55 60 Arg Ser Val Phe Arg Tyr Lys Lys Val Asp Pro Val Gln Val Val Leu 65 70 75 80 Ser Glu Arg Lys Ile Asp Leu Gln Ile Glu Asp Leu Thr Gln Ile Asn 85 90 95 Glu Glu Glu Gln Arg Lys Phe Ile Glu Glu Tyr Arg Lys Lys Asp Arg 100 105 110 Glu Arg Gly Phe Asp Leu Ser Arg Asp Ile Leu Leu Arg Phe Thr Leu 115 120 125 Phe Gln Thr Ala Ala Asn Arg Tyr Glu Leu Leu Trp Ser His His His 130 135 140 Ile Leu Met Asp Gly Trp Cys Thr Gly Ile Val Phe Gln Asp Leu Phe 145 150 155 160 Gln Met Tyr Gln Arg Arg Leu Ser Gly Gln Ala Leu Leu Pro Glu Val 165 170 175 Ala Pro Gln Tyr Ser Glu Tyr Ile Arg Trp Leu Lys Lys Gln Asp Asp 180 185 190 Gln Gln Ala Leu Ala Phe Trp Lys Glu Tyr Leu Gln Gly Phe Glu Asn 195 200 205 Leu Thr Gly Ile Pro Arg Leu Arg Ser Gly Asn His Pro Tyr Lys Gln 210 215 220 Glu Glu Phe Ile Phe Ser Leu Gly Glu Glu Ala Thr Gln Lys Leu Thr 225 230 235 240 Gln Thr Ala Gln Lys Tyr Gln Val Thr Leu Asn Thr Val Val Gln Thr 245 250 255 Ile Trp Gly Ala Leu Leu Gln Lys Tyr Asn Asn Thr Asn Asp Ala Ala 260 265 270 Tyr Gly Val Val Val Ser Gly Arg Pro Ala Glu Val Pro Asn Val Glu 275 280 285 Gln Met Val Gly Leu Phe Ser Asn Thr Ile Pro Ile Arg Ile Lys Lys 290 295 300 Glu Ala Gly Lys Thr Phe Gly Glu Val Leu Lys Asn Val Gln Gln Thr 305 310 315 320 Ala Leu Glu Ala Glu Lys Tyr Gly Tyr Leu Ser Leu Ala Asp Ile Gln 325 330 335 Ala Ser Ala Ala Tyr Thr His Gln Leu Leu Asp His Ile Leu Ala Phe 340 345 350 Glu Asn Phe Pro Met Asp Gln Glu Thr Phe Asn Gln Glu Asn Val Leu 355 360 365 Gly Phe Ala Val Lys Asp Ala His Thr Phe Glu Gln Thr His Tyr Asp 370 375 380 Leu Thr Val Leu Val Ile Pro Gly Lys Glu Leu Ile Phe Lys Phe Met 385 390 395 400 Tyr Asn Glu Ser Val His Ser Lys Glu Tyr Leu Asn Leu Leu Glu Leu 405 410 415 Asn Met Lys Lys Leu Val Ser Leu Val Ile Glu Gln Gln Asp Ile Phe 420 425 430 Asp Pro Ala Thr Glu Phe Val Ser Asp Leu Glu Lys Asp Lys Leu Leu 435 440 445 Thr Ile Phe Asn Arg Thr Asp Ala Lys Tyr Pro Arg Glu Lys Thr Ile 450 455 460 His Glu Leu Phe Gln Glu Gln Val Asp Lys Asn Pro Asp Gln Val Ala 465 470 475 480 Leu Val Phe Gly Glu Ala Gln Leu Thr Tyr Arg Glu Leu Asn Glu Lys 485 490 495 Ala Asn Gln Met Ala Arg Gly Leu Arg Lys Gln Gly Val Leu Pro Asp 500 505 510 Gln Val Ile Gly Leu Leu Thr Asp Arg Ser Leu Glu Met Ile Ile Ala 515 520 525 Ile Leu Ala Ile Phe Lys Ala Gly Gly Ala Tyr Met Pro Ile Asp Pro 530 535 540 Ser Tyr Pro Ser Glu Arg Ile Gln Tyr Met Leu Ala Asp Ser Arg Thr 545 550 555 560 His Leu Leu Leu Val Gln Lys Ala Glu Met Ile Pro Ala Asn Tyr Gln 565 570 575 Gly Glu Val Leu Leu Leu Thr Glu Asp Ser Trp Met Asp Glu Asn Thr 580 585 590 Asp Asn Leu Asp Leu Val Asn Gln Ala Gln Asp Leu Ala Tyr Val Met 595 600 605 Tyr Thr Ser Gly Ser Thr Gly Lys Pro Lys Gly Asn Leu Thr Thr His 610 615 620 Gln Asn Ile Val Lys Thr Ile Met Asn Asn Gly Tyr Met Glu Ile Thr 625 630 635 640 Pro Asn Asp Arg Leu Leu Gln Leu Ser Asn Tyr Ala Phe Asp Gly Ser 645 650 655 Thr Phe Asp Ile Tyr Ser Ala Leu Leu Asn Gly Ala Ser Leu Ile Leu 660 665 670 Val Pro Thr His Val Leu Met Asn Pro Thr Asp Leu Ala Ser Val Ile 675 680 685 Gln Asp Gln His Ile Thr Val Ser Phe Met Thr Thr Ser Leu Phe Asn 690 695 700 Thr Leu Val Glu Leu Asp Val Thr Ser Leu Lys His Met Arg Lys Val 705 710 715 720 Val Phe Gly Gly Glu Lys Ala Ser Ile Lys His Val Glu Lys Ala Leu 725 730 735 Asp Tyr Leu Gly Ala Gly Arg Leu Val Asn Gly Tyr Gly Pro Thr Glu 740 745 750 Thr Thr Val Phe Ala Thr Thr Tyr Thr Val Asp His Thr Ile Lys Glu 755 760 765 Thr Gly Ile Met Pro Ile Gly Arg Pro Leu Asn Asn Thr Lys Val Phe 770 775 780 Ile Leu Gly Ala Asp Asn Gln Leu Gln Pro Ile Gly Ala Leu Gly Glu 785 790 795 800 Leu Cys Val Ser Gly Glu Gly Leu Ala Arg Gly Tyr Leu Asn Leu Pro 805 810 815 Glu Leu Thr Ala Asp Arg Phe Val Glu Asn Pro Phe Met Arg Gly Glu 820 825 830 Arg Met Tyr Arg Thr Gly Asp Leu Ala Arg Trp Leu Pro Asp Gly Ser 835 840 845 Ile Glu Tyr Val Gly Arg Ile Asp Glu Gln Val Lys Ile Arg Gly His 850 855 860 Arg Ile Glu Leu Gly Glu Ile Glu Ala Arg Leu Leu Glu His Pro Ala 865 870 875 880 Ile Ser Glu Thr Val Leu Leu Ala Lys Gln Asp Glu Gln Gly His Ser 885 890 895 Phe Leu Cys Ala Tyr Leu Val Thr Asn Gly Ala Trp Ser Val Ala Glu 900 905 910 Leu Arg Lys His Ile Lys Glu Thr Leu Pro Asp Ser Met Val Pro Ser 915 920 925 Tyr Phe Ile Glu Ile Asp Lys Met Pro Leu Thr Ser Asn Gly Lys Ala 930 935 940 Asp Lys Arg Ala Leu Pro Glu Pro Asp Val Gln Gln Val Ser Ser Tyr 945 950 955 960 Ile Ala Pro Glu Thr Glu Thr Glu Glu Lys Leu Val Gln Leu Phe Gln 965 970 975 Glu Ile Leu Ser Val Glu Gln Val Gly Thr Gln Asp Asn Phe Phe Glu 980 985 990 Leu Gly Gly His Ser Leu Lys Ala Met Met Leu Val Ser Arg Met His 995 1000 1005 Lys Glu Leu Asp Ile Glu Val Pro Leu Lys Asp Val Phe Ala Arg 1010 1015 1020 Pro Ser Val Lys Glu Leu Ala Ala Phe Leu Thr Asn Thr Glu Val 1025 1030 1035 Ser Asp Tyr Ile Ala Ile Glu Pro Ala Ala Lys Gln Glu Phe Tyr 1040 1045 1050 Pro Val Ser Ser Ala Gln Arg Arg Met Tyr Val Val Glu Gln Ile 1055 1060 1065 Gly Ser Ser Asn Thr Thr Ser Tyr Asn Met Pro Phe Leu Leu Glu 1070 1075 1080 Ile Gly Gly Ala Leu Asp Val Val Gly Leu Gln Lys Ala Leu Lys 1085 1090 1095 Lys Leu Val Ile Arg His Glu Ser Leu Arg Thr Ser Phe His Met 1100 1105 1110 Val Asp Glu Val Leu Met Gln Lys Ile His Pro Asp Val Glu Trp 1115 1120 1125 Asp Leu Met Val Met Glu Ala Lys Asp Glu Asp Leu Pro Gln Ile 1130 1135 1140 Ile Asp Gly Phe Ile Gln Pro Phe Asp Leu Ser Asp Ala Ser Leu 1145 1150 1155 Phe Arg Ala Gly Leu Val Arg Met Glu Ala Asp Arg His Leu Leu 1160 1165 1170 Met Leu Asp Met His His Ile Ile Ser Asp Gly Val Ser Thr Asn 1175 1180 1185 Val Leu Phe Gln Asp Leu Met Gln Ile Tyr Gln Gly Lys Glu Leu 1190 1195 1200 Pro Ser Leu Arg Ile Gln Tyr Lys Asp Tyr Ala Val Trp Gln Gln 1205 1210 1215 Ala Glu Ala Gln Val Asn Arg Leu Arg Glu Gln Glu Gln Tyr Trp 1220 1225 1230 Leu Asn Gln Phe Ser Gly Glu Leu Pro Val Leu Glu Met Pro Thr 1235 1240 1245 Asp Tyr Thr Arg Pro Ser Ile Gln Gln Ser Glu Gly Asp Ile Trp 1250 1255 1260 Ser Phe Glu Ile Ser Ala Glu Ile Ile Asn Lys Val Lys Lys Leu 1265 1270 1275 Ser Ser Ser Gln Gly Thr Thr Leu Tyr Met Thr Leu Leu Ala Ala 1280 1285 1290 Tyr Gln Val Leu Leu Ser Lys Tyr Thr Gly Gln Glu Asp Val Ile 1295 1300 1305 Val Gly Ser Pro Ile Ala Gly Arg Pro His Ala Asp Val Glu Lys 1310 1315 1320 Ile Val Gly Met Phe Val Asn Thr Leu Ala Phe Arg Gly Gln Pro 1325 1330 1335 Lys Ser Thr Gln Thr Phe Ser Thr Tyr Leu Ser Glu Val Lys Glu 1340 1345 1350 Gln Val Leu His Ala Tyr Asp Asn Ala Glu Tyr Pro Phe Glu Glu 1355 1360 1365 Leu Leu Glu Lys Leu Asp Leu Glu Arg Asp Leu Ser Arg His Pro 1370 1375 1380 Leu Phe Asp Thr Met Phe Ala Leu Gln Asn Met Glu Met Ala Glu 1385 1390 1395 Ile Asn Ile Met Asp Leu Ser Phe Gln Pro Arg Asp Leu Thr Trp 1400 1405 1410 Lys Asn Ala Lys Phe Asp Leu Thr Trp Met Met Ala Glu Ala Glu 1415 1420 1425 Asn Leu Tyr Val Thr Ile Glu Tyr Ser Thr Ser Leu Phe Lys Pro 1430 1435 1440 Glu Thr Ile Glu Arg Leu Gly Lys Arg Phe Thr His Leu Leu Lys 1445 1450 1455 Gln Ile Gly Asp Ala Pro Glu Arg Leu Ile Ala Asp Leu Glu Val 1460 1465 1470 Ala Thr Glu Asp Glu Lys His Gln Ile Leu Ser Val Phe Asn Leu 1475 1480 1485 Thr Gln Ser Asp Tyr Pro Val Asn Lys Thr Val His Gln Leu Phe 1490 1495 1500 Glu Glu Gln Val Gln Asn Met Pro Asp Gln Lys Ala Ile Val Phe 1505 1510 1515 Gly Glu Glu Gln Val Thr Tyr Lys Glu Leu Asn Ala Lys Ala Asn 1520 1525 1530 His Leu Ala Thr Leu Leu Lys Gln Lys Gly Ile Thr Asn Glu Gln 1535 1540 1545 Leu Val Ala Val Met Ile Glu Pro Ser Ile Glu Phe Phe Val Gly 1550 1555 1560 Ile Leu Ala Val Leu Lys Ala Gly Gly Ala Tyr Leu Pro Ile Asp 1565 1570 1575 Pro Thr Tyr Pro Thr Glu Arg Ile Ala Tyr Ile Leu Glu Asp Ser 1580 1585 1590 Gln Ser Lys Val Leu Leu Val Arg Gly His Glu Gln Val Gln Thr 1595 1600 1605 Gln Phe Ala Gly Glu Ile Leu Glu Ile Asp Ser Lys Lys Leu Ser 1610 1615 1620 Thr Glu Glu Leu Lys Asp Val Pro Met Asn Asn Lys Val Thr Asp 1625 1630 1635 Leu Ala Tyr Val Ile Tyr Thr Ser Gly Ser Thr Gly Gln Pro Lys 1640 1645 1650 Gly Val Met Val Glu His Arg Ser Leu Met Asn Leu Ser Ala Trp 1655 1660 1665 His Val Gln Tyr Phe Gly Ile Thr Lys Asp Asp Arg Ser Thr Lys 1670 1675 1680 Tyr Ala Gly Val Gly Phe Asp Ala Ser Val Trp Glu Val Phe Pro 1685 1690 1695 Tyr Leu Ile Ala Gly Ala Thr Ile Tyr Val Ile Asp Gln Glu Thr 1700 1705 1710 Arg Tyr Asp Val Glu Lys Leu Asn Gln Tyr Val Thr Asp Gln Gly 1715 1720 1725 Ile Thr Ile Ser Phe Leu Pro Thr Gln Phe Ala Glu Gln Phe Met 1730 1735 1740 Leu Thr Asp His Thr Asp His Thr Ala Leu Arg Trp Leu Leu Ile 1745 1750 1755 Gly Gly Asp Lys Ala Gln Gln Ala Val Gln Gln Lys Gln Tyr Gln 1760 1765 1770 Ile Val Asn Asn Tyr Gly Pro Thr Glu Asn Thr Val Val Thr Thr 1775 1780 1785 Ser Tyr Ile Val Ser Pro Glu Asp Lys Lys Ile Pro Ile Gly Arg 1790 1795 1800 Pro Ile Ala Asn Asn Gln Val Phe Ile Leu Asn Lys Glu Asn Gln 1805 1810 1815 Leu Gln Pro Val Gly Ile Pro Gly Glu Leu Cys Val Ser Gly Asp 1820 1825 1830 Ser Leu Ala Arg Gly Tyr Leu His Arg Pro Glu Leu Thr Ser Glu 1835 1840 1845 Arg Phe Val Ala Asn Pro Phe Val Pro Gly Glu Arg Met Tyr Lys 1850 1855 1860 Thr Gly Asp Ile Ala Arg Trp Leu Pro Asp Gly Asn Ile Glu Tyr 1865 1870 1875 Leu Gly Arg Leu Asp Asp Gln Ile Lys Ile Arg Gly Tyr Arg Val 1880 1885 1890 Glu Leu Gly Glu Ile Glu Ser Ala Ile Leu Glu His Glu Ala Ile 1895 1900 1905 His Glu Thr Val Val Leu Ala Arg Gln Asp Asp Gln Asn Gln Thr 1910 1915 1920 Tyr Leu Cys Ala Tyr Val Val Pro Lys Lys Ser Phe Asp Val Ala 1925 1930 1935 Glu Leu Arg Gln Tyr Leu Gly Arg Lys Leu Pro His Phe Met Ile 1940 1945 1950 Pro Ala Phe Phe Thr Glu Met Thr Glu Phe Pro Ile Thr Ser Asn 1955 1960 1965 Gly Lys Val Asp Lys Lys Ala Leu Pro Leu Pro Asp Leu Ser Lys 1970 1975 1980 Gln Ser Glu Ile Asp Tyr Val Ala Pro Thr Thr Thr Leu Glu Glu 1985 1990 1995 Thr Leu Ala Glu Leu Trp Thr Glu Val Leu Gly Val Ser Gln Val 2000 2005 2010 Gly Ile His Asp Asn Phe Phe Lys Leu Gly Gly Asp Ser Ile Lys 2015 2020 2025 Ala Ile Gln Ile Ala Ala Arg Leu Asn Thr Lys Gln Leu Lys Leu 2030 2035 2040 Glu Val Lys Asp Leu Phe Gln Ala Gln Thr Ile Ala Gln Val Ile 2045 2050 2055 Pro Tyr Ile Lys Thr Lys Glu Ser Lys Ala Glu Gln Gly Ile Val 2060 2065 2070 Gln Gly Lys Val Glu Leu Thr Pro Ile Gln Glu Trp Phe Phe Gln 2075 2080 2085 Gln Ser Phe Asp Ile Pro His His Trp Asn Gln Ser Met Met Phe 2090 2095 2100 Tyr Arg Lys Glu Gly Trp Asp Gln His Val Val Gln Arg Val Phe 2105 2110 2115 Gln Lys Ile Ala Glu His His Asp Ala Leu Arg Met Ala Tyr Gln 2120 2125 2130 Gln Glu Asn Gly Lys Thr Ile Gln Ile Asn Arg Gly Val Glu Gly 2135 2140 2145 Lys Leu Phe Glu Leu Ser Ile Phe Asp Phe Lys Gln Gln Ala Asn 2150 2155 2160 Val Pro Glu Leu Ile Glu Gln Ala Ala Asn Arg Leu Gln Ser Ala 2165 2170 2175 Met Asn Leu Gln Asp Gly Pro Leu Val Gln Leu Gly Leu Phe Gln 2180 2185 2190 Thr Ser Glu Gly Asp His Leu Leu Ile Ala Ile His His Leu Val 2195 2200 2205 Val Asp Ala Val Ser Trp Arg Ile Ile Thr Glu Asp Phe Met Asn 2210 2215 2220 Gly Tyr Gln Gln Asp Leu Gln Gly Glu Pro Ile Ala Phe Thr Ser 2225 2230 2235 Lys Thr Asp Ser Tyr Gln Lys Trp Ala Lys Ser Leu Leu Glu Tyr 2240 2245 2250 Ala Thr Ser Glu Glu Ile Gln Ser Glu Leu Lys Tyr Trp Gln Ser 2255 2260 2265 Met Ile Ala Lys Gly Leu Pro Ala Leu Pro Arg Asp Ser Lys Val 2270 2275 2280 Gly Ala Pro Tyr Leu Leu Lys Asp Ile Gln Glu Val Ala Ile Gln 2285 2290 2295 Leu Thr Lys Glu Gln Thr Asn Lys Leu Leu Thr Asp Ala His Asn 2300 2305 2310 Ala Tyr Asn Thr Gln Ile Asn Asp Leu Leu Leu Thr Ala Leu Ala 2315 2320 2325 Leu Thr Ile Gln Glu Trp Ala Gln Thr Asn Ser Ile Ala Ile Thr 2330 2335 2340 Leu Glu Gly His Gly Arg Glu Asp Ile Gly Val Asp Ile Asp Ile 2345 2350 2355 Asn Arg Thr Val Gly Trp Phe Thr Ser Met Tyr Pro Val Val Phe 2360 2365 2370 Asp Leu Gln Lys Gln Gly Ile Ala Asn Thr Val Lys Gln Val Lys 2375 2380 2385 Glu Glu Leu Arg Gln Ile Pro Asn Lys Gly Ile Gly Tyr Gly Val 2390 2395 2400 Val Arg Tyr Leu Ser Asn Gln Gly Ser Thr Glu Leu Asp Leu Ser 2405 2410 2415 Ser His Ala Ile Asn Pro Glu Ile Ser Phe Asn Tyr Leu Gly Gln 2420 2425 2430 Met Asp Gln Ser Gly Gln Glu Glu Glu Tyr Gln Leu Ser Pro Leu 2435 2440 2445 Ser Ser Gly Gln Gln Ile Ser Gln Met Asn Gln Gly Leu Phe Pro 2450 2455 2460 Ile Asn Val Ser Gly Ile Val Val Glu Asn Gln Leu Ser Ile Gln 2465 2470 2475 Ile Ser Tyr Asp Ser Gln Ala Tyr His Asp Ser Thr Met Glu Lys 2480 2485 2490 Leu Ile Gln Arg Tyr Gln Tyr His Leu Leu Glu Ile Ile Asn His 2495 2500 2505 Cys Val Gln Gln Thr Glu Thr Glu Leu Thr Pro Ser Asp Phe Ser 2510 2515 2520 Thr Lys Glu Leu Ser Met Glu Asp Leu Glu Ser Val Phe Glu Leu 2525 2530 2535 Leu Asp Glu 2540 <210> 26 <211> 2526 <212> PRT <213> Artificial <220> <223> artificial sequence <400> 26 Met Leu Ser Lys Ala Asn Ile Lys Asp Ile Tyr Thr Leu Ser Pro Leu 1 5 10 15 Gln Lys Gly Met Leu Phe Gln His Leu Lys Glu Glu Ser Thr Ala Tyr 20 25 30 Phe Glu Gln Leu His Phe Thr Ile Lys Gly Gln Leu Tyr Val Asp Ser 35 40 45 Phe Glu Ala Ser Phe Gln His Leu Ile Asn Lys Tyr Asp Val Leu Arg 50 55 60 Thr Val Phe Leu Tyr Lys Asn Met Thr Gln Pro Met Gln Met Val Leu 65 70 75 80 Lys Glu Arg Lys Thr Ser Val His Phe Glu Asp Ile Ser His Leu Asp 85 90 95 Ser Lys Ala Val Ser Glu Tyr Val Glu Glu Phe Lys Asn Gln Asp Arg 100 105 110 Glu Lys Gly Phe Glu Leu Ser Lys Asp Ile Leu Met Arg Phe Ala Ile 115 120 125 Leu Lys Ala Gly Ala Glu Ser Tyr His Leu Ile Trp Ser Phe His His 130 135 140 Ile Leu Met Asp Gly Trp Cys Met Gly Ile Val Leu Gln Asp Leu Phe 145 150 155 160 Arg Met Tyr Gln Gln His Arg Gln Asn Ile Pro Ile Thr Val Glu Ser 165 170 175 Val Pro Ala Tyr Ser Glu Tyr Ile Arg Trp Leu Glu Lys Gln Asn Val 180 185 190 Thr Lys Ala Arg Asp Tyr Trp Lys Asn Tyr Leu Glu Gly Tyr Glu Glu 195 200 205 Leu Thr Gly Ile Ile Arg Leu Asp Thr Lys His Thr Ser His Asn Asn 210 215 220 Glu Val Gln Glu Cys Ala Phe Thr Leu Asp Lys Asp Ile Thr Glu Gly 225 230 235 240 Leu Thr Gln Leu Ala Arg His Tyr Ser Val Thr Val Asn Thr Leu Phe 245 250 255 Gln Thr Ile Trp Gly Met Leu Leu Gln Lys Tyr Asn Asn Lys Asp Asp 260 265 270 Val Val Phe Gly Ala Val Val Ser Gly Arg Pro Ser Glu Ile His Gly 275 280 285 Val Glu Asn Met Val Gly Leu Phe Ile Asn Thr Val Pro Ile Arg Ile 290 295 300 Gln Lys Gln Met Asn Asp Thr Phe Ser His Leu Leu Lys Arg Val His 305 310 315 320 Glu Ser Thr Leu Leu Ser Lys Gln Tyr Glu Phe Val Ser Leu Ala Asp 325 330 335 Ile Gln Thr Asp Ala Gly Phe Ser Gly Gln Leu Leu Asp His Ile Leu 340 345 350 Val Phe Glu Asn Tyr Pro Ile Ser Glu Gly Ser Phe Glu Glu Glu Glu 355 360 365 Phe Thr Met Asp Ser Ile Lys Thr Tyr Glu Lys Thr Ser Tyr Asp Leu 370 375 380 Asn Val Met Ile Arg Pro Asn Glu Asp Gln Leu Asp Ile Ala Phe Gln 385 390 395 400 Phe Asn Asp Asp Val Tyr Ser Ser Glu Asn Val Lys Arg Leu Phe Gln 405 410 415 His Met Lys Gln Leu Ala Leu Ala Val Ile Lys Asn Pro Asp Val Arg 420 425 430 Leu Glu Glu Ile Ala Met Ile Thr Glu Glu Glu Arg Tyr Gln Ile Leu 435 440 445 His Asp Phe Gln Gly Glu Ile Val Asp Phe Val Thr Glu Lys Thr Leu 450 455 460 Pro Glu Leu Phe Glu Asp Gln Val Lys Arg Thr Pro Glu Ala Ile Ala 465 470 475 480 Leu Arg Phe Glu Asp Gln Gln Leu Thr Tyr Gln Glu Leu Asn Gln Arg 485 490 495 Val Asn Gln Leu Ala Trp Thr Leu Arg Met Lys Gly Leu Gln Gln Glu 500 505 510 Glu Leu Val Gly Ile Met Val Gln Arg Ser Leu Glu Met Ile Val Gly 515 520 525 Val Leu Ala Val Ile Lys Ala Gly Gly Ala Tyr Val Pro Ile Asp Pro 530 535 540 Glu Tyr Pro Leu Asp Arg Ile Gln Tyr Met Leu Glu Asp Ser Gly Thr 545 550 555 560 Asn Trp Leu Leu Thr Thr Lys Gln Ser Glu Ile Pro Ser Ile Tyr Leu 565 570 575 Gly His Val Leu Tyr Leu Glu Glu Asp Thr Val Tyr His Glu Arg Ser 580 585 590 Ser Asp Val Glu Ile Val Asn Gln Ser Ser Asp Leu Ala Tyr Ile Ile 595 600 605 Tyr Thr Ser Gly Ser Thr Gly Gln Pro Lys Gly Val Met Ile Asp His 610 615 620 Arg Ala Val His Asn Leu His Leu Ser Ala Gly Ile Tyr Gly Ile Ala 625 630 635 640 Gln Gly Ser Gln Val Leu Gln Phe Ala Ser Leu Ser Phe Asp Ala Ser 645 650 655 Val Gly Asp Ile Phe His Ser Leu Leu Thr Gly Ala Thr Leu His Leu 660 665 670 Val Lys Lys Glu Gln Leu Leu Ser Gly His Ala Phe Met Glu Trp Leu 675 680 685 Asp Glu Ala Gly Ile Thr Thr Ile Pro Phe Ile Pro Pro Ser Val Leu 690 695 700 Lys Glu Leu Pro Tyr Ala Lys Leu Pro Lys Leu Lys Thr Ile Ser Thr 705 710 715 720 Gly Gly Glu Glu Leu Pro Ala Asp Leu Val Arg Ile Trp Gly Ala Asn 725 730 735 Arg Thr Phe Leu Asn Ala Tyr Gly Pro Thr Glu Thr Thr Val Asp Ala 740 745 750 Ser Ile Gly Asn Cys Val Glu Met Thr Asp Lys Pro Ser Ile Gly Thr 755 760 765 Pro Thr Val Asn Lys Arg Ala Tyr Ile Leu Asp Gln Tyr Gly His Ile 770 775 780 Gln Pro Ile Gly Val Pro Gly Glu Leu Cys Val Gly Gly Glu Gly Val 785 790 795 800 Ala Arg Gly Tyr Leu His Arg Pro Glu Leu Thr Asp Glu Lys Phe Val 805 810 815 Asn Asp Pro Tyr Val Pro Asn Gly Arg Met Tyr Lys Thr Gly Asp Leu 820 825 830 Ala Arg Trp Leu Pro Asp Gly Thr Ile Glu Phe Leu Gly Arg Met Asp 835 840 845 Gly Gln Val Lys Ile Arg Gly Phe Arg Ile Glu Leu Gly Glu Ile Glu 850 855 860 Ala Arg Leu Asn Gln Ala Pro Ser Val Lys Gln Ala Val Val Leu Ala 865 870 875 880 Arg Ser Gly Glu Gln Lys Gln Val Tyr Leu Cys Ala Tyr Leu Val Thr 885 890 895 Asp Asn Asp Leu Lys Val Ser Ala Leu Arg Lys Glu Leu Ser Gln Thr 900 905 910 Leu Pro Asp Tyr Met Ile Pro Ser Phe Phe Ile Lys Val Glu Lys Ile 915 920 925 Pro Val Thr Val Asn Gly Lys Ile Asp Lys Lys Ala Leu Pro Glu Pro 930 935 940 Glu Lys Glu Val Glu Leu Gln Thr Glu Tyr Val Ala Pro Thr Asn Pro 945 950 955 960 Thr Glu Glu Ile Leu Val Gln Ile Trp Gln Lys Val Leu Gly Met Glu 965 970 975 Arg Val Gly Ile Glu Asp Asn Phe Phe Glu Leu Gly Gly His Ser Ile 980 985 990 Lys Ala Met Met Leu Ala Ser Asn Ile Tyr Lys Glu Leu Lys Ile Asp 995 1000 1005 Leu Pro Leu Arg Glu Ile Phe Lys His Thr Thr Val Lys Glu Met 1010 1015 1020 Ala Arg Phe Ile Asp Gly Arg Asp Glu Glu Glu Tyr Val Gly Ile 1025 1030 1035 Gln Pro Ala Ala Lys Gln Glu Tyr Tyr Pro Val Ser Ser Ala Gln 1040 1045 1050 Lys Arg Met Tyr Val Ile Gln Ser Leu Glu Asp Lys Ala Gln Gly 1055 1060 1065 Thr Ser Tyr Asn Met Pro Ser Phe Tyr Lys Met Lys Gly Ser Val 1070 1075 1080 Asp Ala Glu Lys Leu Glu Lys Val Phe Gln Thr Leu Leu Asp Arg 1085 1090 1095 His Glu Ser Leu Arg Thr Ser Phe His Met Ile Glu Glu Gln Leu 1100 1105 1110 Val Gln Lys Val His Glu Gln Val Ser Trp Lys Met Asp Met Lys 1115 1120 1125 Thr Val Ser Ala Asn Asp Val Ser Arg Leu Lys Asp Ser Phe Val 1130 1135 1140 Gln Pro Phe Asp Ile Ser Thr Ala Pro Leu Phe Arg Ala Ser Leu 1145 1150 1155 Leu Thr Ile His Lys Asp Glu His Ile Leu Met Met Asp Val His 1160 1165 1170 His Ile Val Gly Asp Gly Val Ser Thr Thr Ile Leu Phe Gln Glu 1175 1180 1185 Leu Ile Gln Leu Tyr Gln Gly Gln Ala Leu Pro Glu Val Lys Val 1190 1195 1200 His Tyr Lys Asp Tyr Ala Val Trp Gln Leu Ser Gln Gln Asp Arg 1205 1210 1215 Leu Lys Glu Ser Glu Asn Phe Trp Leu Gln Gln Phe Ser Gly Glu 1220 1225 1230 Leu Pro Val Leu Glu Leu Pro Thr Asp Tyr Ser Arg Pro Pro Ile 1235 1240 1245 Arg Arg Leu Glu Gly Glu Tyr Val Ser Gln Ser Leu Arg Gly Asp 1250 1255 1260 Leu His Glu Ser Val Lys Ala Phe Met Lys Asn His Glu Val Thr 1265 1270 1275 Leu Tyr Met Val Leu Leu Ala Thr Tyr Asn Val Leu Leu His Lys 1280 1285 1290 Tyr Thr Asn Gln His Asp Ile Ile Val Gly Thr Pro Val Ser Asp 1295 1300 1305 Arg Pro His Pro Asp Val Met Ser Thr Val Gly Met Phe Val Asn 1310 1315 1320 Thr Leu Ala Val Arg Asn Gln Leu Glu Ser Glu Gln Thr Phe Glu 1325 1330 1335 Lys Phe Leu Ala Asn Val Lys Asn Lys Met Leu Glu Val Tyr Gly 1340 1345 1350 His Gln Glu Tyr Pro Phe Glu Asp Val Ile Glu Lys Val Lys Val 1355 1360 1365 Gln Arg Asp Thr Ser Arg His Pro Leu Phe Asp Thr Met Phe Gly 1370 1375 1380 Val Gln Asn Leu Glu Ile Ser His Val Glu Leu Pro Asp Trp Gly 1385 1390 1395 Ile Glu Ala Leu Asp Ile Asp Trp Thr Asn Ser Lys Phe Asp Met 1400 1405 1410 Ser Trp Met Val Phe Glu Ala Asp Gly Leu Glu Ile Gly Val Glu 1415 1420 1425 Tyr Ser Thr Ser Leu Phe Glu Arg Asn Thr Ile Gln Arg Met Ile 1430 1435 1440 Gly His Phe Glu His Ile Ile Glu Gln Ile Met Glu Asn Pro Gln 1445 1450 1455 Ile Arg Leu Ala Asp Ile Gln Leu Thr Thr Glu Asp Glu Arg Ile 1460 1465 1470 Gln Ile Leu Glu Glu Phe Asn His Gln Pro Thr Lys Ile Thr Tyr 1475 1480 1485 Asp Gln Ala Ile Gln Asn Arg Phe Glu Glu Gln Ala Met Lys Thr 1490 1495 1500 Pro Asp Ala Val Ala Leu Val Tyr Lys Gly Gln Glu Leu Thr Tyr 1505 1510 1515 Arg Glu Leu Asn Gln Arg Ser Asn Gln Met Ala Arg Thr Leu Arg 1520 1525 1530 Glu His Gly Val Gly Arg Asp Gln Ile Ile Ala Val Met Ile Asn 1535 1540 1545 Arg Ser His Glu Leu Ile Ile Ser Ile Leu Ala Val Leu Lys Ala 1550 1555 1560 Gly Gly Ala Tyr Leu Pro Ile Asp Pro Thr Tyr Pro Leu Asp Arg 1565 1570 1575 Ile Glu His Met Leu Glu Asp Ser Gln Thr Ala Met Leu Leu Thr 1580 1585 1590 Gln Lys Glu Ile Gln Ile Pro Thr Gly Tyr Ser Gly Glu Val Leu 1595 1600 1605 Phe Val Asp Gln Ala Asp Ile Tyr His Glu Asp Ala Thr Asp Leu 1610 1615 1620 Ser Ser Met Asn Gln Pro Ala Asp Leu Ala Tyr Ile Ile Tyr Thr 1625 1630 1635 Ser Gly Ser Thr Gly Lys Ser Lys Gly Val Met Ile Glu His Arg 1640 1645 1650 Ser Leu His Asn Leu Ile His Ile Ser His Pro Tyr Lys Met Gly 1655 1660 1665 Ala Gly Ser Arg Val Leu Gln Phe Ala Ser Ser Ser Phe Asp Ala 1670 1675 1680 Ser Val Ala Glu Ile Phe Pro Ala Leu Leu Thr Gly Ser Thr Leu 1685 1690 1695 Tyr Ile Glu Glu Lys Glu Glu Leu Leu Thr Asn Leu Val Pro Tyr 1700 1705 1710 Leu Leu Glu Asn Gln Ile Thr Thr Val Ala Leu Pro Pro Ser Leu 1715 1720 1725 Leu Arg Ser Val Pro Tyr Arg Glu Leu Pro Ala Leu Glu Cys Ile 1730 1735 1740 Val Ser Val Gly Glu Ala Cys Thr Phe Asp Ile Val Gln Thr Trp 1745 1750 1755 Gly Gln Asn Arg Thr Phe Ile Asn Gly Tyr Gly Pro Thr Glu Ser 1760 1765 1770 Thr Val Cys Ser Ala Phe Gly Val Val Thr Ala Glu Asp Lys Arg 1775 1780 1785 Ile Thr Ile Gly Lys Pro Phe Pro Asn Gln Lys Val Tyr Ile Ile 1790 1795 1800 Asn Glu Asn Gln Gln Leu Gln Pro Ile Gly Val Pro Gly Glu Leu 1805 1810 1815 Cys Ile Ala Gly Ala Gly Leu Ser Arg Gly Tyr Leu Asn Arg Pro 1820 1825 1830 Glu Leu Thr Gln Glu Lys Phe Val Asn Asn Pro Phe Ala Pro Gly 1835 1840 1845 Glu Arg Met Tyr Lys Thr Gly Asp Val Ala Arg Trp Leu Pro Asp 1850 1855 1860 Gly Asn Ile Glu Tyr Ala Gly Arg Met Asp Asp Gln Val Lys Val 1865 1870 1875 Arg Gly Asn Arg Val Glu Leu Gly Glu Val Thr Ser Gln Leu Leu 1880 1885 1890 Thr His Pro Ser Ile Thr Glu Ala Val Val Val Pro Ile Val Asp 1895 1900 1905 Thr His Gly Ala Thr Thr Leu Cys Ala Tyr Phe Ile Glu Asp Lys 1910 1915 1920 Glu Val Lys Val Asn Asp Leu Arg His His Leu Ala Lys Ala Leu 1925 1930 1935 Pro Glu Phe Met Ile Pro Thr Tyr Phe Ile Lys Val Asp His Ile 1940 1945 1950 Pro Leu Thr Gly Asn Gly Lys Val Asn Lys Gln Ala Leu Pro Asp 1955 1960 1965 Pro Ser Glu Phe Ile Ser Ala Gln Thr Gly His Glu Ile Val Ala 1970 1975 1980 Pro Ser Ser Gln Asp Glu Glu Ile Leu Val Gln Val Trp Glu Glu 1985 1990 1995 Val Leu Gln Phe Lys Pro Ile Gly Val Glu Asp Asn Phe Phe Glu 2000 2005 2010 Arg Gly Gly Asp Ser Ile Lys Ala Leu Gln Ile Val Ala Arg Leu 2015 2020 2025 Ser Lys Tyr Asn Arg Lys Leu Asp Ser Arg His Ile Phe Lys Asn 2030 2035 2040 Pro Thr Ile Ser Met Leu Ala Pro Tyr Leu Glu Gln Arg Gly Ala 2045 2050 2055 Leu Ile Glu Gln Asp Ser Ile Glu Gly Glu Val Pro Leu Thr Pro 2060 2065 2070 Ile Gln Ser Trp Phe Phe Glu Gln Pro Phe Val Tyr Pro His His 2075 2080 2085 Phe Asn Gln Ser Met Leu Leu Pro Asn Glu Gln Gly Trp Asp Arg 2090 2095 2100 Gln Arg Ile Glu Gln Ala Phe Thr Thr Ile Val Arg His His Asp 2105 2110 2115 Ala Leu Arg Met Lys Tyr Gln Phe Arg Glu Lys Ile Ile Gln Glu 2120 2125 2130 Asn Gln Gly Ile Glu Gly Glu Phe Phe Thr Leu His Glu Val Asp 2135 2140 2145 Val Thr Lys Glu Arg Asp Trp Gln Met Arg Ile Glu Gln Glu Ala 2150 2155 2160 Asn Gln Leu Gln Ala Ser Phe Asp Leu Thr Thr Gly Pro Leu Val 2165 2170 2175 Lys Leu Gly Leu Tyr His Thr Ala Tyr Gly Asp Tyr Leu Leu Ile 2180 2185 2190 Val Val His His Leu Leu Ile Asp Gly Val Ser Trp Arg Ile Leu 2195 2200 2205 Leu Glu Asp Phe Gln Thr Leu Tyr Glu Gln Lys Gly Glu Leu Pro 2210 2215 2220 Ala Lys Thr Thr Ser Phe Lys Ala Trp Ala Val Gln Leu Glu Gly 2225 2230 2235 Tyr Ala Arg Ser Lys Lys Leu Gln Asp Glu Ala Ser Tyr Trp Lys 2240 2245 2250 Gly Leu Leu Asn Lys Ser Ile Arg Glu Leu Pro Ala Asp Lys Glu 2255 2260 2265 Ser Ser Asp Thr Phe Leu Phe Gly Asp Thr Lys Glu Val Gln Leu 2270 2275 2280 Thr Phe Asp Ile Asn Glu Thr Gln Asp Leu Leu Thr Asp Ala His 2285 2290 2295 His Ala Tyr Lys Thr Lys Ala Asp Asp Leu Leu Leu Ala Ala Leu 2300 2305 2310 Val Leu Ser Ile Asn Glu Trp Thr Lys Gln Ser Asp Ile Ile Val 2315 2320 2325 Asn Leu Glu Gly His Gly Arg Glu Thr Ile Gly Glu Gly Ile Asp 2330 2335 2340 Leu Ser Arg Thr Ile Gly Trp Phe Thr Thr Ile Tyr Pro Val Leu 2345 2350 2355 Phe Glu Val Glu Asn His Gln Leu Ser Ser Val Ile Lys His Val 2360 2365 2370 Lys Glu Thr Leu Arg Asn Val Pro Asn Asn Gly Ile Gly Phe Gly 2375 2380 2385 Ile Leu Gln His Met Ser His Ser Asp Val Ser Gln Ser Gln Leu 2390 2395 2400 Ser Ser His His Ile Ser Phe Asn Tyr Leu Gly Gln Met Gly Glu 2405 2410 2415 Asp Ser Ala Ser Gln Ser Glu Thr Asp Asn Gly Val Leu Ile Asn 2420 2425 2430 Thr Gly Asp Gln Ile Ser Pro Met Asn Ala Asn Pro Gly Ser Leu 2435 2440 2445 Asn Met Thr Cys Leu Val Met Asn Asn Thr Leu Leu Val Thr Phe 2450 2455 2460 Asp Tyr Asn Pro Gln Arg Tyr Glu Gln Glu Thr Ile Gln Arg Leu 2465 2470 2475 Ala Asp Arg Tyr Lys Ser Asn Leu Lys Ala Val Leu Asp His Cys 2480 2485 2490 Val Gln Arg Glu Gln Thr Glu Arg Thr Pro Ser Asp Phe Ser Thr 2495 2500 2505 Lys Lys Leu Ser Leu Glu Asp Leu Asp Asp Val Phe Ala Thr Leu 2510 2515 2520 Lys Asn Leu 2525 <210> 27 <211> 2491 <212> PRT <213> Artificial <220> <223> artificial sequence <400> 27 Met Ile Asn Thr Ser Asp Val Lys Asp Ile Tyr Ser Leu Ser Pro Met 1 5 10 15 Gln Arg Gly Met Leu Phe His Thr Leu Lys Asp Lys Glu Asn Leu Ala 20 25 30 Tyr Phe Asp Gln Thr Thr Phe Gln Ile Glu Gly Asp Ile Cys Val Glu 35 40 45 Ser Leu Glu Lys Ser Phe Asn Glu Leu Ile Arg Lys Tyr Asp Val Leu 50 55 60 Arg Thr Ile Phe Leu Tyr Gln Lys Leu Lys Glu Pro Met Gln Val Val 65 70 75 80 Leu Lys Glu Arg Thr Ala Asn Ile His Tyr Glu Asp Phe Ser Met Lys 85 90 95 Ser Glu Ser Asp Lys Ala Lys Ala Leu Arg Val Ala Lys Gln Arg Asp 100 105 110 Arg Asp Glu Gly Phe Asp Leu Ser Arg Asp Ile Leu Met Arg Leu Ser 115 120 125 Leu Leu Lys Val Ala Pro Asn Gln Tyr Glu Leu Val Ile Ser Ser His 130 135 140 His Ile Ile Ile Asp Gly Trp Cys Thr Gly Ile Leu Tyr Gln Glu Leu 145 150 155 160 Phe Tyr Phe Tyr Gln Cys Phe Val Ala Asn Gln Pro Ile Pro Ala Glu 165 170 175 Lys Ser Ile Pro Tyr Ser Arg Tyr Ile Arg Trp Leu Glu Glu Gln Asp 180 185 190 Glu Glu Glu Gly Lys Ala Tyr Trp Gly Glu Tyr Leu Gln Asp Phe Glu 195 200 205 Gly Ala Ser Val Ile Pro Lys Gln Asn Ala Lys Gly Glu Lys Glu Val 210 215 220 Cys Ser Ile Asp Lys Val Thr Phe His Phe Asp Lys Lys Leu Thr Glu 225 230 235 240 Glu Leu Val Gln Val Ala Lys Thr Cys Gln Val Thr Ile Ser Thr Leu 245 250 255 Phe Gln Thr Met Trp Gly Ile Leu Leu Gln Lys Tyr Asn Asn Ser Gln 260 265 270 Glu Ala Ile Phe Gly Ser Val Ile Ser Gly Arg Ser Pro Glu Ile Pro 275 280 285 Asp Val Glu Lys Ile Val Gly Ile Phe Ile Asn Thr Ile Pro Val Arg 290 295 300 Ile Arg Thr Leu Asp Lys Gln Thr Phe Lys Glu Leu Leu Ile Gln Val 305 310 315 320 Gln Glu Ala Ser Val Asn Ser Glu Lys Tyr Asn Tyr Leu Thr Leu Ala 325 330 335 Asp Ile Gln Ala Val Thr Gly Ser Asn His Ala Leu Ile His His Ile 340 345 350 Val Ala Phe Glu Asn Phe Pro Ile Ala Ser Asp Ser Phe Val Asp Ser 355 360 365 Ser Asp Ser Asp Ser Glu Glu Leu Lys Val Val Asn Val Ile Asp Asp 370 375 380 His Glu Lys Thr Asn Phe Asp Phe Ser Val Gln Val Gln Leu Asp Thr 385 390 395 400 Glu Leu Leu Val Lys Ile Ser Tyr Asn Gln His Leu Tyr His Arg Ser 405 410 415 Phe Ile Glu Asn Ile Phe His His Leu Gln Gln Ile Ala Gly Ser Ile 420 425 430 Thr His Asn Pro Asp Ile Gln Ile Asn Glu Ile Ala Ile Val Ser Lys 435 440 445 Glu Glu Lys Lys Gln Leu Leu Arg Tyr Ser Thr Pro Ala Lys Ser Asp 450 455 460 Phe Pro Met Asp Lys Thr Ile His Gln Leu Phe Glu Glu Gln Val Ser 465 470 475 480 Arg Thr Pro Glu Gln Ile Ala Val Val Phe Lys Gly Glu Ser Phe Thr 485 490 495 Tyr Arg Glu Leu Asn Glu Lys Ala Asn Gln Leu Ala Trp Val Leu Arg 500 505 510 Lys Arg Glu Val Arg Pro Asn Glu Ile Val Ala Ile Met Ala Glu His 515 520 525 Ser Leu Glu Met Leu Val Gly Val Ile Gly Thr Leu Lys Ala Gly Ala 530 535 540 Ala Tyr Leu Pro Ile Asp Pro Ser Tyr Pro Glu Lys Arg Ile Ala His 545 550 555 560 Met Leu Gln Asp Ser Lys Ala Glu Gln Leu Leu Ile Gln Pro His Leu 565 570 575 Asn Met Pro Gln Asp Phe Lys Gly Ser Val Leu Trp Leu Thr Glu Glu 580 585 590 Ser Trp Ala Lys Glu Ser Thr Thr Asp Leu Pro Leu Ala Thr Ser Ala 595 600 605 Asn Asp Leu Ala Tyr Met Ile Tyr Thr Ser Gly Ser Thr Gly Leu Pro 610 615 620 Lys Gly Val Met Val Glu His Gln Ala Leu Val Asn Leu Val Met Trp 625 630 635 640 His Asn Glu Ala Phe Gly Val Thr Met Thr Asp Gln Cys Thr Lys Leu 645 650 655 Ala Gly Phe Gly Phe Asp Ala Ser Val Trp Glu Thr Phe Pro Pro Leu 660 665 670 Ile Gln Gly Ala Thr Leu His Val Leu Glu Glu Ser Arg Arg Gly Asp 675 680 685 Ile Tyr Ala Leu His Glu Tyr Phe Glu Lys Asn Ala Ile Thr Ile Ser 690 695 700 Phe Leu Pro Thr Gln Leu Ala Glu Gln Phe Met Glu Leu Thr Ser Ser 705 710 715 720 Thr Leu Arg Val Leu Leu Ile Gly Gly Asp Arg Ala Gln Lys Val Lys 725 730 735 Glu Thr Ser Tyr Gln Ile Ile Asn Asn Tyr Gly Pro Thr Glu Asn Thr 740 745 750 Val Val Thr Thr Ser Gly Gln Leu His Pro Glu Gln Asp Val Phe Pro 755 760 765 Ile Gly Lys Pro Ile Thr Asn His Ser Val Tyr Ile Leu Asp Gln Asn 770 775 780 Arg His Leu Gln Pro Ile Gly Ile Pro Gly Glu Leu Cys Val Ser Gly 785 790 795 800 Ala Gly Leu Ala Arg Gly Tyr Leu Asn Gln Pro Glu Leu Thr Val Glu 805 810 815 Arg Phe Val Asp Asn Pro Phe Val Pro Gly Glu Arg Met Tyr Arg Thr 820 825 830 Gly Asp Leu Val Arg Trp Arg Ile Asp Gly Ser Ile Glu Tyr Leu Gly 835 840 845 Arg Ile Asp Glu Gln Val Lys Ile Arg Gly Tyr Arg Ile Glu Leu Gly 850 855 860 Glu Ile Glu Thr Lys Leu Leu Glu His Pro Ser Ile Ser Glu Ala Leu 865 870 875 880 Val Val Ala Arg Asn Asp Glu Gln Gly Tyr Thr Tyr Leu Cys Ala Tyr 885 890 895 Val Val Ala Thr Gly Ala Trp Ser Val Ser Ser Leu Arg Glu His Leu 900 905 910 Ile Glu Thr Leu Pro Glu Tyr Met Ile Pro Ala Tyr Met Met Glu Val 915 920 925 Glu Lys Met Pro Leu Thr Ala Asn Gly Lys Ile Asp Lys Arg Ala Leu 930 935 940 Pro Val Pro Asp Arg Gln Arg Met Asn Glu Tyr Val Ala Pro Ala Thr 945 950 955 960 Glu Thr Glu Glu Lys Leu Val Leu Leu Phe Gln Glu Ile Leu Gly Leu 965 970 975 Glu Arg Ile Gly Thr Lys Asp His Phe Phe Glu Leu Gly Gly His Ser 980 985 990 Leu Lys Ala Met Met Leu Val Ser Arg Met His Lys Glu Leu Gly Val 995 1000 1005 Asp Val Gln Leu Asn Glu Met Phe Ala Arg Pro Thr Val Lys Asp 1010 1015 1020 Leu Ser Ala Tyr Ile Asp Gln Met Asn Gly Ser Ala Tyr Thr Ala 1025 1030 1035 Ile Gln Pro Val Glu Glu Gln Pro Tyr Tyr Pro Val Ser Phe Ala 1040 1045 1050 Gln Arg Arg Met Tyr Val Val Gln Gln Met Arg Asp Ser Glu Thr 1055 1060 1065 Thr Ser Tyr Asn Met Pro Phe Thr Phe Glu Leu Lys Gly Lys Leu 1070 1075 1080 His Leu Asp Lys Leu Arg Glu Ala Leu Gln Ile Leu Val Leu Arg 1085 1090 1095 His Glu Ser Leu Arg Thr Ser Phe His Met Ile Asp Glu Asn Leu 1100 1105 1110 Val Gln Lys Val Asn Lys Asp Ile Ser Trp Asp Leu Glu Val Ile 1115 1120 1125 Glu Ala Gln Glu Ser Glu Ile Glu Val Lys Leu Glu Glu Phe Ile 1130 1135 1140 Arg Pro Phe His Leu Ser Glu Ala Pro Leu Phe Arg Ala Arg Leu 1145 1150 1155 Ile Cys Leu Asn Pro Gln His His Leu Leu Ser Leu Asp Met His 1160 1165 1170 His Ile Ile Ser Asp Gly Val Ser Met Asn Leu Phe Leu Gln Glu 1175 1180 1185 Phe Met Thr Leu Tyr Gln Gly Glu Ala Leu Pro Ala Leu Ser Ile 1190 1195 1200 Gln Tyr Lys Asp Tyr Ala Val Trp Gln Gln Ser Asp Lys Gln Arg 1205 1210 1215 Ala Arg Leu Lys Glu Gln Glu Lys Tyr Trp Leu His His Phe Ser 1220 1225 1230 Gly Glu Leu Pro Thr Leu Glu Leu Pro Thr Asp Phe Pro Arg Pro 1235 1240 1245 Ala Ile Gln Gln Phe Asp Gly Asp Glu Trp Ala Phe Glu Met Asn 1250 1255 1260 Ala Asp Leu Leu Ala Lys Val Lys Gln Ile Cys Ser Ser Gln Gly 1265 1270 1275 Thr Thr Leu Tyr Met Thr Leu Leu Ala Ala Tyr Gln Val Phe Leu 1280 1285 1290 Ala Arg Tyr Thr Gly Gln Glu Asp Ile Ile Val Gly Ser Pro Ile 1295 1300 1305 Ala Gly Arg Ser His Ala Asp Leu Glu Asn Met Ile Gly Met Phe 1310 1315 1320 Val Asn Thr Leu Ala Leu Arg Gly Lys Pro Lys Ala Asp Gln Ser 1325 1330 1335 Phe Leu Ser Tyr Leu Lys Gln Val Lys Glu Thr Val Phe Gln Ala 1340 1345 1350 Tyr Ala Asn Ala Glu Tyr Pro Phe Glu Glu Leu Ile Glu Lys Leu 1355 1360 1365 Asp Leu Glu Arg Asp Met Ser Arg His Pro Leu Phe Asp Thr Leu 1370 1375 1380 Phe Ser Leu Gln Asn Met Glu Ile Ser Glu Phe Gln Met Asn Asn 1385 1390 1395 Leu Glu Ile Phe Pro Tyr Glu Thr Gly Gln Lys Asn Ala Lys Phe 1400 1405 1410 Ala Leu Ser Trp Leu Ile Ala Glu Gly Glu Ser Leu Tyr Val Thr 1415 1420 1425 Ile Glu Tyr Ser Thr Lys Cys Phe Lys Arg Glu Thr Ile Lys Arg 1430 1435 1440 Met Ala Ser His Phe Glu Gln Leu Leu Ala Gln Ile Val Glu Gln 1445 1450 1455 Pro Glu Ala Arg Ile Gly Gln Leu Glu Leu Val Ala Asp Ala Glu 1460 1465 1470 Arg Lys Met Leu Leu Glu Asp Phe Asn Leu Thr Lys Val Asp Tyr 1475 1480 1485 Pro Arg Glu Lys Thr Ile Gln Glu Leu Phe Glu Glu Gln Val Asp 1490 1495 1500 Lys Asn Pro Asp Gln Ile Ala Leu Ile Cys Gly Glu Gln Gln Phe 1505 1510 1515 Thr Tyr Glu Gln Leu Asn Val Lys Phe Asn Gln Leu Ala His Val 1520 1525 1530 Leu Arg Arg Glu Gly Val Gln Pro Asn Gln Val Ile Gly Leu Ile 1535 1540 1545 Thr Asp Arg Ser Leu Ser Met Ile Val Gly Ile Phe Gly Ile Ile 1550 1555 1560 Lys Ala Gly Gly Gly Tyr Leu Pro Ile Asp Pro Thr Tyr Pro Thr 1565 1570 1575 Glu Arg Ile Glu Tyr Met Leu Glu Asp Ser Gln Thr His Leu Leu 1580 1585 1590 Leu Val Gln His Arg Asp Met Val Pro Ala Gly Tyr Gln Gly Glu 1595 1600 1605 Val Leu Ile Ile Glu Asp Glu Ile Ser Arg Asp Glu Gln Val Ala 1610 1615 1620 Asn Ile Glu Leu Ile Asn Gln Pro Gln Asp Leu Ala Tyr Val Met 1625 1630 1635 Tyr Thr Ser Gly Ser Thr Gly Lys Pro Lys Gly Asn Leu Thr Thr 1640 1645 1650 His Arg Asn Ile Ile Lys Thr Val Cys Asn Asn Gly Tyr Ile Glu 1655 1660 1665 Ile Thr Thr Glu Asp Arg Leu Leu Gln Leu Ser Asn Tyr Ala Phe 1670 1675 1680 Asp Gly Ser Thr Phe Asp Ile Phe Ser Ser Leu Leu His Gly Ala 1685 1690 1695 Thr Leu Val Leu Val Pro Lys Glu Val Ile Leu Asn Pro Thr Asp 1700 1705 1710 Leu Ile Thr Leu Ile Arg Glu Gln Gln Ile Thr Val Ser Phe Met 1715 1720 1725 Thr Thr Ser Leu Phe Asn Ala Leu Val Glu Leu Asp Val Ser Ser 1730 1735 1740 Phe Gln Asn Met Arg Lys Ile Ala Phe Gly Gly Glu Lys Ala Ser 1745 1750 1755 Phe Lys His Val Glu Lys Ala Leu Asp Phe Leu Gly Asn Gly Arg 1760 1765 1770 Leu Val Asn Gly Tyr Gly Pro Thr Glu Thr Thr Val Phe Ala Thr 1775 1780 1785 Thr Tyr Thr Val Asp Glu Arg Ile Lys Glu Trp Gly Ile Ile Pro 1790 1795 1800 Ile Gly Arg Pro Leu His Asn Thr Thr Val His Ile Leu Ser Ala 1805 1810 1815 Asp Asp Lys Leu Gln Pro Ile Gly Val Ile Gly Glu Leu Cys Val 1820 1825 1830 Ser Gly Glu Gly Leu Ala Arg Gly Tyr Leu Asn Leu Pro Glu Leu 1835 1840 1845 Thr Met Glu Arg Phe Val Glu Asn Pro Phe Arg Pro Gly Glu Arg 1850 1855 1860 Met Tyr Arg Thr Gly Asp Leu Ala Arg Trp Leu Pro Asp Gly Val 1865 1870 1875 Leu Glu Tyr Val Gly Arg Lys Asp Glu Gln Val Lys Ile Arg Gly 1880 1885 1890 His Arg Ile Glu Leu Ser Glu Ile Glu Thr Arg Ile Leu Glu His 1895 1900 1905 Pro Ala Ile Ser Glu Thr Val Leu Leu Ala Lys Arg Asn Glu Gln 1910 1915 1920 Gly Ser Ser Tyr Leu Cys Ala Tyr Ile Val Ala His Gly Gln Trp 1925 1930 1935 Asn Ile Gln Glu Leu Arg Lys His Val Arg Asp Val Leu Pro Glu 1940 1945 1950 His Met Val Pro Ser Tyr Phe Ile Gly Leu Asp Lys Leu Pro Leu 1955 1960 1965 Thr Ser Asn Gly Lys Val Asp Lys Arg Ala Leu Pro Glu Pro Glu 1970 1975 1980 Gly Ser Leu Gln Leu Thr Arg Glu Ile Val Ala Pro Arg Asn Glu 1985 1990 1995 Ser Glu Lys Gln Leu Val Glu Ile Val Ala Glu Val Leu Gly Leu 2000 2005 2010 Glu Ala Ser Glu Ile Ser Ile Thr Asp Asn Leu Phe Glu Leu Gly 2015 2020 2025 Gly His Ser Leu Thr Ile Leu Arg Ile Leu Ala Lys Val His Thr 2030 2035 2040 Cys Asn Trp Lys Leu Glu Met Lys Asp Phe Tyr Asn Cys Lys Asn 2045 2050 2055 Leu Glu Glu Ile Ala Ser Lys Ala Thr Asp Met Gln Glu Asn Gln 2060 2065 2070 Asn Leu Ser Gly Ser Gly Ser Val Phe Lys Lys Gly Gly Lys Lys 2075 2080 2085 Ser Ile Pro Val Val Pro Val His Asp Arg Gln Lys Glu Met Glu 2090 2095 2100 His Val Leu Leu Leu Gly Ser Thr Gly Phe Leu Gly Ile His Leu 2105 2110 2115 Leu His Glu Leu Leu Gln Lys Thr Glu Ala Thr Ile Leu Cys Val 2120 2125 2130 Ile Arg Ala Glu Asn Asp Glu Ala Ala Met Gln Arg Leu Arg Lys 2135 2140 2145 Lys Ile Asp Phe Tyr Phe Thr Ser Gln Tyr Ser Ser Ser Gln Ile 2150 2155 2160 Asp Glu Trp Phe Thr Arg Ile Gln Ile Ile His Gly Asp Ile Thr 2165 2170 2175 Gln Ala Asn Phe Gly Leu Glu Ala Lys His Tyr Glu Ser Leu Gly 2180 2185 2190 Ala Ile Val Asp Thr Val Ile His Thr Ala Ala Leu Val Lys His 2195 2200 2205 Tyr Gly His Tyr Glu Glu Phe Glu Arg Ala Asn Val His Gly Thr 2210 2215 2220 Gln Gln Val Val Thr Phe Cys Leu Asn Asn Lys Leu Pro Met His 2225 2230 2235 Tyr Val Ser Thr Leu Ser Val Ser Gly Thr Thr Val Glu Glu Ala 2240 2245 2250 Thr Glu Leu Val Glu Phe Thr Glu Lys Asp Phe Tyr Val Gly Gln 2255 2260 2265 Asn Tyr Glu Ser Asn Val Tyr Leu Arg Ser Lys Phe Glu Ala Glu 2270 2275 2280 Ala Val Leu Val Gly Gly Met Glu Asn Gly Leu Asp Ala Arg Ile 2285 2290 2295 Tyr Arg Val Gly Asn Leu Thr Gly Arg Phe Gln Asp Gly Trp Phe 2300 2305 2310 Gln Glu Asn Ile Asn Glu Asn Met Phe Tyr Leu Leu Ser Lys Ala 2315 2320 2325 Phe Leu Glu Leu Gly Gly Phe Asp Gln Glu Ile Met Gln Gly Met 2330 2335 2340 Val Asp Leu Thr Pro Ile Asp Ile Cys Ala Gln Ala Ile Ile His 2345 2350 2355 Ile Ile Asn Ser Lys Gly Ile Glu Glu Arg Val Phe His Leu Gln 2360 2365 2370 Asn Pro His Leu Val Thr Tyr Asp Asp Met Tyr Arg Val Phe Glu 2375 2380 2385 Gly Leu Gly Phe Ser Arg Arg Val Gln Ser Arg Glu Asp Val Thr 2390 2395 2400 Arg Glu Leu Asp Val Met Met Ser Gln Gly Asn Glu Lys Leu Phe 2405 2410 2415 Leu Ala Gly Ile Leu Thr Thr Met Leu Asp Asp Val Glu Arg Ala 2420 2425 2430 Glu Gln Phe Asn Val Ala Val Asp Ser Ser Arg Thr Met Gln Leu 2435 2440 2445 Leu Glu Asp Thr Ser Phe Thr Tyr Pro Val Pro Asp Asp Glu Tyr 2450 2455 2460 Leu Arg Lys Leu Ala Met His Met Ile Lys Val Gly Phe Val Thr 2465 2470 2475 Pro Asn His Thr Val Ala Glu Lys Ile Gly Thr Ser Arg 2480 2485 2490 <210> 28 <211> 240 <212> PRT <213> Artificial <220> <223> artificial sequence <400> 28 Met Ala Val Ile Glu Leu Lys Asn Leu Thr Lys Lys Tyr Asn Glu Val 1 5 10 15 Tyr Ala Val Asp His Leu Asn Ile Glu Val Pro Gln Gly His Ile Tyr 20 25 30 Ala Phe Leu Gly Ser Asn Gly Ala Gly Lys Thr Thr Thr Ile Lys Met 35 40 45 Met Thr Gly Gln Leu Asn Pro Ser Glu Gly Glu Val Leu Phe Leu Gly 50 55 60 Arg Asn Ile Trp Gln Asp Arg Glu Ala Arg Arg Ile Ala Gly Tyr Ala 65 70 75 80 Pro Asp Val Pro Leu Leu His Glu Gly Leu Thr Val Arg Glu Met Val 85 90 95 Arg Phe Val Gly Ala Leu Tyr Gly Ser Asp Glu Asp Leu Asn Lys Arg 100 105 110 Val Asp Thr Leu Leu Glu His Phe Glu Leu Ala Asp Lys Ala Asp Gln 115 120 125 Leu Ile Lys Glu Tyr Ser Leu Gly Met Lys Arg Lys Val Ser Ile Ala 130 135 140 Cys Ala Leu Ile His Arg Pro Lys Ile Leu Leu Leu Asp Glu Val Thr 145 150 155 160 Asn Gly Leu Asp Pro Lys Ala Thr Arg Glu Val Lys Asn Tyr Ile Arg 165 170 175 His Phe Ala Lys Glu Glu Gly Gly Thr Val Phe Ile Thr Thr His Ile 180 185 190 Leu Asp Ile Val Glu Glu Leu Ala Asp Thr Ile Ser Ile Leu His Lys 195 200 205 Gly Lys Ile Lys Val Thr Gly Ser Met Glu Glu Leu Arg His Val Ala 210 215 220 Gly Asn Glu Glu Gly Arg Leu Glu Asp Ile Phe Leu Ser Ala Ile Glu 225 230 235 240

Claims (36)

  1. 브레비바실러스 종(Brevibacillus sp .)으로부터 분리한 2종 이상의 D-아미노산을 포함하는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 포함하는 사료 첨가물.
  2. 제1항에 있어서, C-말단 발린의 카복시-말단 -COOH 그룹이 -CH2OH로 환원된 사료 첨가물.
  3. 제1항에 있어서, C-말단 발린의 카복시-말단 -COOH 그룹이 -CH2OH로 환원되고 펩타이드에 대한 프로테아제 내성을 부여하는 사료 첨가물.
  4. 제1항에 있어서, 펩타이드가 pH 1.0, pH 13.0에서 안정적이고, 프로테아제 또는 이의 배합물에 내성을 갖는 사료 첨가물.
  5. 제1항에 있어서, 펩타이드가 서열 번호 1 내지 20 중 하나 이상에서 선택되는 사료 첨가물.
  6. 제1항에 있어서, 펩타이드가 그람 양성 세균, 그람 음성 세균, 진균, 원생생 물 또는 이의 배합물을 사멸시키는 사료 첨가물.
  7. 제1항에 있어서, 펩타이드가 브레비바실러스 텍사스포러스(Brevibacillus texasporous)로부터 분리된 사료 첨가물.
  8. 제1항에 있어서, 펩타이드를 약 0.5 내지 약 100ppm으로 첨가한 사료 첨가물.
  9. 제1항에 있어서, 펩타이드를 약 6 내지 약 12ppm으로 첨가한 사료 첨가물.
  10. 제1항에 있어서, 펩타이드를 가금류, 가축, 양식 어류, 게, 새우 및 민물 거북이 중 하나 이상에 사용하도록 개질시킨 사료에 첨가한 사료 첨가물.
  11. 보리, 콩, 밀, 라이밀(triticale), 호밀 및 옥수수 중에서 선택된 하나 이상의 곡물; 및
    브레비바실러스 종으로부터 분리한 2종 이상의 D-아미노산을 포함하는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드
    를 포함하는 곡물류 동물 사료.
  12. 브레비바실러스 종으로부터 분리한 2종 이상의 D-아미노산을 포함하는 분리 및 정제된, 열 안정성의 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드 약 1 내지 1000ppm을 포함하는 펩타이드류 사료 첨가물.
  13. 2종 이상의 D-아미노산을 포함하며 카복시-말단 환원된, pH 및 열 안정성의, 브레비바실러스 종으로부터 분리한 항미생물 펩타이드.
  14. 열 안정성의, 카복시-말단 환원되고 아미노 말단 메틸화된 펩타이드이고 2종 이상의 D-아미노산을 포함하는 항미생물성 펩타이드를 생성하는 수탁번호 제ATCC PTA-5854호의 미생물 브레비바실러스 텍사스포러스(Brevibacillus texasporous)의 생물학적 순수 배양물.
  15. 제14항에 따르는 분리 및 정제된 미생물을 포함하는 사료 첨가물.
  16. 제15항에 있어서, 대용유(milk replacer), 육성용 사료(grower feed), 비육용 사료(finish feed), 예비-포유용 사료(pre-starter feed) 및 포유용 사료(pre-starter feed)로 이루어진 그룹 중에서 선택된 가축용 사료와 혼합한 사료 첨가물.
  17. 제1항에 따르는 조성물과 동물 사료를 혼합함을 포함하여 동물에서의 체중 증가 효율 및 사료 효율을 증가시키는 방법.
  18. 제17항에 있어서, 동물 사료를 소, 돼지, 닭, 말, 칠면조, 양, 염소, 양식용 어류, 게, 새우 및 거북이로 이루어진 그룹 중에서 선택된 가축의 사료용으로 개질시킨 방법.
  19. 제17항에 있어서, 동물 사료를 닭, 칠면조, 오리, 메추라기, 콘월 암탉(Cornish hen) 및 비둘기로 이루어진 그룹 중에서 선택된 조류의 사료용으로 개질시킨 방법.
  20. 제17항에 있어서, 사료가 곡물, 대두분, 분리대두단백, 분리대두유, 분리대두유지, 탈지유, 어분, 육분, 골분, 혈분, 혈장 단백질, 유장, 쌀겨, 밀겨, 감미료, 미네랄, 비타민, 염 및 목초로 이루어진 그룹 중에서 선택된 방법.
  21. 제17항에 있어서, 펩타이드의 일일 용량이 동물의 체중 kg당 약 1밀리그람 내지 약 10그람의 범위인 방법.
  22. 브레비바실러스 종으로부터 분리된, 2종 이상의 D-아미노산을 포함하는, 카복시-말단 환원된, pH 및 열 안정성의 펩타이드를 포함하는, 국소 용도용의 광범위(broad spectrum) 항미생물 화합물.
  23. 제22항에 있어서, 펩타이드가 서열 Me2Bmt-L-dO-I-V-V-dK-V-dL-K-dY-L-V- CH2OH(서열 번호 1)를 포함하는 항미생물 화합물.
  24. 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시 말단 환원된 펩타이드를 생성하는 단백질을 발현시키는, BT 오페론의 서열(서열 번호 21) 또는 이의 일부를 갖는 분리 및 정제된 핵산.
  25. 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시 말단 환원된 펩타이드를 제조하는데 사용된 하나 이상의 효소를 포함하는, BT 오페론 단백질에 대한 하나 이상의 폴리펩타이드 서열(서열 번호 22 내지 28)을 암호화하는 분리 및 정제된 핵산.
  26. 서열 번호 21에 75% 이상의 상동성을 갖는 분리된 핵산.
  27. 제26항에 있어서, 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 제조하는 데 사용된 효소인 펩타이드 합성 오페론 단백질에 대한 하나 이상의 폴리펩타이드 서열(서열 번호 22 내지 28)을 암호화하는 핵산.
  28. 제27항에 있어서, 하나 이상의 BT 오페론 폴리펩타이드가 서열 번호 21로부터 발현되고, 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화 되고 카복시 말단 환원된 펩타이드를 제조하는 데 사용된 하나 이상의 효소를 포함하는 핵산.
  29. 브레비바실러스 텍사스포러스 E58의 분리 세균주를 포함하는 분리된 세균 샘플.
  30. 스타필로코쿠스(Staphylococcus), 엔테로코쿠스(Enterococcus), 뉴모코쿠스(Pneumococcus), 바실리(Bacilli), 메타노코쿠스(Methanococcus), 해모필러스(Haemophilus), 아캐오글로버스(Archaeoglobus), 보렐리아(Borrelia), 시네드로십티스(Synedrocyptis), 미코박테리아(Mycobacteria), 슈도모나스(Pseudomonas) 및 이. 콜라이(E. coli)로 이루어진 그룹 중에서 선택된 하나 이상의 세균의 성장을 억제하는, 브레비바실러스 종으로부터 분리된 2종 이상의 D-아미노산을 포함하는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드.
  31. 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 생성하는 BT 오페론의 서열(서열 번호 21)을 갖는 분리 및 정제된 핵산으로 형질전환시킨 세균.
  32. 제31항에 있어서, 핵산으로부터 발현된 단백질이 하나 이상의 BT 오페론 단 백질을 포함하는 세균.
  33. 2종 이상의 D-아미노산을 포함하는 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 생성하는 BT 오페론의 서열(서열 번호 21)을 갖는 분리 및 정제된 핵산을 포함하는 벡터.
  34. 제33항에 있어서, 핵산으로부터 발현된 단백질이 하나 이상의 BT 오페론 단백질을 포함하는 벡터.
  35. 서열 번호 1 내지 20에 대한 75% 초과의 서열 상동성을 갖는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 포함하는 사료 첨가물.
  36. 약제학적 유효량의, 브레비바실러스 종으로부터 분리된 2종 이상의 D-아미노산을 포함하는 분리 및 정제된, 열 안정성의, 아미노 말단-메틸화되고 카복시-말단 환원된 펩타이드를 치료가 필요한 동물에 제공함을 포함하여 대장균증을 치료하는 방법.
KR1020067017586A 2004-01-30 2005-01-28 신규 펩타이드 계열의 조성물, 방법 및 용도 KR20070033956A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US54056904P 2004-01-30 2004-01-30
US60/540,569 2004-01-30
PCT/US2005/003343 WO2005074626A2 (en) 2004-01-30 2005-01-28 Compositions, methods and uses for a novel family of peptides

Publications (1)

Publication Number Publication Date
KR20070033956A true KR20070033956A (ko) 2007-03-27

Family

ID=34837403

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067017586A KR20070033956A (ko) 2004-01-30 2005-01-28 신규 펩타이드 계열의 조성물, 방법 및 용도

Country Status (14)

Country Link
US (2) US7498404B2 (ko)
EP (1) EP1765374A4 (ko)
JP (1) JP2008508851A (ko)
KR (1) KR20070033956A (ko)
CN (1) CN101217970A (ko)
AU (1) AU2005209901A1 (ko)
BR (1) BRPI0507186A (ko)
CA (1) CA2554634A1 (ko)
EA (1) EA200601408A1 (ko)
IL (1) IL177143A0 (ko)
MX (1) MXPA06008503A (ko)
NO (1) NO20063521L (ko)
WO (1) WO2005074626A2 (ko)
ZA (1) ZA200606202B (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8673290B2 (en) * 2011-03-01 2014-03-18 MYGALAXY Limited Company Sporulation-deficient B. texasporus cells and methods for efficient and cost-effective inactivation and use thereof
CN102835591B (zh) * 2012-08-14 2017-09-15 北京大北农科技集团股份有限公司 一种易消化的哺乳仔猪教槽料及其制备方法
PL2900805T3 (pl) 2012-09-25 2023-06-05 Aquilón Cyl S.L. Kompozycje probiotyczne i prebiotyczne
JP6345186B2 (ja) * 2012-12-17 2018-06-20 エムワイギャラクシー リミテッド カンパニー 肥満および関連疾患の治療剤としてのbtリポペプチドの使用
US20170191118A1 (en) 2014-06-03 2017-07-06 The Regents Of The University Of California Non-Invasive Gene Mutation Detection in Lung Cancer Patients
RU2603623C2 (ru) * 2014-06-06 2016-11-27 Олег Ильич Эпштейн Ветеринарная композиция и способ улучшения жизнеспособности животных, стимуляции прироста живой массы млекопитающих и птиц, повышения эффективности иммунизации, профилактики и/или лечения инфекционных заболеваний (варианты)
ES2802453T3 (es) * 2016-03-24 2021-01-19 Allflex Europe Sa Uso de una composición acuosa para la disolución de biomoléculas de una muestra de tejido
CN106597681A (zh) * 2017-02-12 2017-04-26 李忠波 一种3d眼镜
CN107347792A (zh) * 2017-07-14 2017-11-17 叙永县元天生态养殖有限责任公司 一种乌骨鸡高山人工饲养方法
CN110577910B (zh) * 2019-09-17 2022-02-01 南京农业大学 一种侧孢短芽孢杆菌、抗菌脂肽及其在农业与食品上的应用
CN111280182B (zh) * 2020-04-01 2020-12-01 北京工商大学 一种活性肽组合物及其应用
CN111269865B (zh) * 2020-04-01 2020-12-01 北京工商大学 一种侧孢短芽孢杆菌菌株s62-9及其用途

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4504471A (en) * 1982-09-27 1985-03-12 Fujisawa Pharmaceutical Co., Ltd. Animal growth promotant and method of use for animal growth
ATE210180T1 (de) * 1995-01-26 2001-12-15 Novozymes As Xylanase beinhaltende futterzusätze für tiere
US5709894A (en) * 1995-06-07 1998-01-20 Biovance Nebraska Feed additive for ruminant animals and a method for feeding a ruminant
DE19909146A1 (de) 1999-03-03 2000-09-28 Mohamed A Marahiel Verfahren zur gezielten biologischen Synthese von Peptiden
CA2337923A1 (en) * 2000-02-25 2001-08-25 Raymond J. Andersen Peptide antibiotics
JP2002058434A (ja) * 2000-08-21 2002-02-26 Nisshin Shiryo Kk 動物用飼料添加物
US6682762B2 (en) * 2001-10-09 2004-01-27 Heart-O-Dixie Animal Nutrition, Llc Poultry and livestock feed additive
HU227387B1 (en) 2001-11-20 2011-05-30 Novozymes Adenium Biotech As Antimicrobial polypeptides from pseudoplectania nigrella

Also Published As

Publication number Publication date
MXPA06008503A (es) 2007-01-30
EP1765374A4 (en) 2010-11-03
AU2005209901A1 (en) 2005-08-18
CN101217970A (zh) 2008-07-09
CA2554634A1 (en) 2005-08-18
WO2005074626A3 (en) 2007-09-13
US7498404B2 (en) 2009-03-03
WO2005074626A2 (en) 2005-08-18
EA200601408A1 (ru) 2007-08-31
BRPI0507186A (pt) 2007-06-26
EP1765374A2 (en) 2007-03-28
IL177143A0 (en) 2008-03-20
US20060228398A1 (en) 2006-10-12
NO20063521L (no) 2006-10-26
ZA200606202B (en) 2008-04-30
JP2008508851A (ja) 2008-03-27
US20090175981A1 (en) 2009-07-09

Similar Documents

Publication Publication Date Title
KR20070033956A (ko) 신규 펩타이드 계열의 조성물, 방법 및 용도
KR101411144B1 (ko) 항비만제 및 항비만 식품
BRPI0817312B1 (pt) Métodos de inibição de uma célula metanógena, e composição farmacêutica
CN107109373B (zh) 新型噬菌体以及包含其的组合物
CN113677799A (zh) 一种遗传修饰乳酸杆菌及其应用
US20190231828A1 (en) Methods of microbial treatment of poultry
KR102224897B1 (ko) 신규한 폴리펩타이드 및 이를 포함하는 그람음성균에 대한 항생제
KR102004153B1 (ko) 갯지렁이 유래의 신규한 더로마신 펩티드 및 이의 용도
ES2788923T3 (es) Nuevo bacteriófago y composición que comprende al mismo
KR102125235B1 (ko) 닭 대장균 예방 및 치료를 위한 신규 박테리오파지 및 이를 이용한 항균조성물
KR102066920B1 (ko) 신규한 크로노박터 사카자키 특이 박테리오파지 cs3 및 이를 포함하는 항균 조성물
BRPI0812486B1 (pt) Cassete de expressão, vetor, microrganismo hospedeiro, linhagem, mistura de proteína ou mosto de fermentação, composição, aditivo nutricional, alimento de animal, e uso de peptídeo
JPH08504580A (ja) 組換え型イヌ胃リパーゼ及び医薬組成物
KR101121077B1 (ko) 넙치 유래의 항균성 펩타이드인 베타디펜신을 암호화하는 신규한 유전자 및 그의 용도
KR101508693B1 (ko) 참굴 유래의 새로운 항미생물성 펩타이드 및 이의 용도
CN106967740B (zh) 一种大肠杆菌融合表达菌丝霉素、其制备方法及应用
US20030059802A1 (en) Nucleic acid and protein sequences of bovine epidermal growth factor
KR102016919B1 (ko) 신규한 살모넬라균 특이 박테리오파지 sc1 및 이를 포함하는 항균 조성물
KR101842673B1 (ko) 신규한 살모넬라균 특이 박테리오파지 se1 및 이를 포함하는 항균 조성물
CN114980750A (zh) 用于抑制细菌毒素以治疗水生动物早期死亡综合征的系统、方法和组合物
CN111087449B (zh) 一种抗菌肽及其制备方法与应用
CN104761625B (zh) 防御素mNP-1在促进鸡体重增加中的应用
RU2520738C2 (ru) ПОЛИНУКЛЕОТИДЫ И ПОЛИПЕПТИДЫ ФАГА φ-mru, И ИХ ПРИМЕНЕНИЕ
KR102035802B1 (ko) 돌돔 유래 pgrp2 단백질 및 이의 용도
KR20120130916A (ko) 조피볼락 유래의 IL-1β 폴리펩티드 및 이를 유효성분으로 포함하는 어류용 면역증강조성물

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid