KR20170099907A

KR20170099907A - 곤충 해충의 방제에 유용한 변형된 Cry1Ca 독소

Info

Publication number: KR20170099907A
Application number: KR1020177017297A
Authority: KR
Inventors: 조엘 제이 시츠; 케네스 나바; 토마스 미드; 티모시 디 헤이; 세크 이 탄; 오드리 제인 에테; 토드 피 글랜시; 잔나 마이 암스트롱; 트리스탄 이 코람; 크리쉬나 엠 마두리; 제임스 이 킹; 라이언 엠 리; 가오펭 린; 지앤취앤 리
Original assignee: 다우 아그로사이언시즈 엘엘씨
Priority date: 2014-12-30
Filing date: 2015-12-16
Publication date: 2017-09-01
Also published as: CA3192494A1; CA2972016C; CN114213510A; RU2017122359A; AU2015372474B2; JP2018501798A; BR112017013514A2; UY36482A; US20230183300A1; MX2017008413A; AR103310A1; EP3240560A1; US10570182B2; CO2017006326A2; TW201629091A; ZA201704299B; CN114213511A; CN107106634A; CL2017001707A1; US20200157154A1

Abstract

본 발명은 바실루스 투린기엔시스(Bacillus thuringiensis) 변형된 Cry1Ca 살곤충 독소 및 이들 독소를 코딩하는 폴리뉴클레오티드 서열에 관한 것이다. 트랜스제닉 식물에서의 용도 및 곤충 해충 손상으로부터 작물을 보호하는 방법이 기재된다.

Description

곤충 해충의 방제에 유용한 변형된 Cry1Ca 독소 {MODIFIED Cry1Ca TOXINS USEFUL FOR CONTROL OF INSECT PESTS}

본 발명은 바실루스 투린기엔시스(Bacillus thuringiensis) 살충 독소의 변형, 이들 독소를 코딩하는 폴리뉴클레오티드 서열 및 이들 독소를 생산하는 트랜스제닉 식물에 관한 것이다.

곤충 및 다른 해충으로 인해 농부는 작물 손실 및 이들 해충을 방제 하에 두기 위한 비용으로 매년 수십억 달러를 지불한다. 재배지 작물의 손실 뿐만 아니라, 곤충 해충은 또한 채소 및 과일 재배자, 관상용 꽃의 생산자 및 가정 정원사에게도 부담이 된다. 농업 생산 환경에서 곤충 해충에 의해 유발된 손실은 작물 수확량의 감소, 작물 품질의 저하 및 수확 비용의 증가를 포함한다.

곤충 해충은 주로 곤충 성장의 억제, 곤충 섭식 또는 재생산의 방지, 또는 사멸 유발을 통해 작용하는 화학 살충제의 집중 적용에 의해 방제된다. 이에 따라 우수한 곤충 방제에 도달할 수 있으나, 이들 화학물질은 때때로 다른 유익한 곤충에 영향을 미칠 수 있다. 화학 살충제의 광범위한 사용으로부터 발생하는 또 다른 문제는 저항성 곤충 집단의 출현이다. 이는 다양한 저항성 관리 실시에 의해 부분적으로 개선되었으나, 대안적 해충 방제제에 대한 필요는 증가하고 있다. 생물학적 해충 방제제, 예컨대 델타-내독소와 같이 살충 독소를 발현하는 바실루스 투린기엔시스 (B.t.) 균주가 또한 작물 식물에 적용되어 만족스러운 결과를 나타냄으로써, 화학 살충제에 대한 대안 또는 보완을 제공하였다. 이들 델타-내독소 중 일부를 코딩하는 유전자를 단리하고, 이종 숙주에서의 그의 발현을 밝혀내어 경제적으로 중요한 곤충 해충의 방제를 위한 또 다른 도구를 제공하였다. 특히, 트랜스제닉 식물에서 살곤충 독소, 예컨대 바실루스 투린기엔시스 델타-내독소의 발현은 선택된 곤충 해충에 대해 효율적인 보호를 제공하였고, 이러한 독소를 발현하는 트랜스제닉 식물은 상업화되어 농부가 화학 곤충 방제제의 적용을 감소시키게 되었다.

인시류는 해마다 많은 양의 손상을 유발하는 농업, 원예 및 가정 해충의 중요한 군이다. 이 곤충 목은 잎- 및 뿌리-섭식 유충 및 성충을 포괄한다. 인시류 곤충 해충은 하기를 포함하나 이에 제한되지는 않는다: 아크로이아 그리셀라(Achroia grisella), 아클레리스 글로베라나(Acleris gloverana), 아클레리스 바리아나(Acleris variana), 아독소피에스 오라나(Adoxophyes orana), 아그로티스 입실론(Agrotis ipsilon) (검거세미밤나방 "BCW"), 알라바마 아르길라세아(Alabama argillacea), 알소필라 포메타리아(Alsophila pometaria), 아미엘로이스 트란시텔라(Amyelois transitella), 아나가스타 쿠에니엘라(Anagasta kuehniella), 아나르시아 리네아텔라(Anarsia lineatella), 아니소타 세나토리아(Anisota senatoria), 안테라에아 페르니이(Antheraea pernyi), 안티카르시아 겜마탈리스(Anticarsia gemmatalis) (벨벳빈 모충 "VBC"), 아르킵스(Archips) 종, 아르기로타에니아(Argyrotaenia) 종, 아테티스 민다라(Athetis mindara), 봄빅스 모리(Bombyx mori), 부쿨라트릭스 투르베리엘라(Bucculatrix thurberiella), 카드라 카우텔라(Cadra cautella), 코리스토네우라(Choristoneura) 종, 코킬리스 호스페스(Cochylis hospes), 콜리아스 유리테메(Colias eurytheme), 코르시라 세팔로니카(Corcyra cephalonica), 시디아 라티페레아누스(Cydia latiferreanus), 시디아 포모넬라(Cydia pomonella), 다타나 인테게리마(Datana integerrima), 덴드롤리무스 시비리쿠스(Dendrolimus sibiricus), 데스미아 푸네랄리스(Desmia funeralis), 디아파니아 히알리나타(Diaphania hyalinata), 디아파니아 니티달리스(Diaphania nitidalis), 디아트라에아 그란디오셀라(Diatraea grandiosella) (남서부 옥수수 천공충 "SWCB"), 디아트라에아 사카랄리스(Diatraea saccharalis), 엔노모스 서브시그나리아(Ennomos subsignaria), 에오레우마 로프티니(Eoreuma loftini), 에페스티아 엘루텔라(Ephestia elutella), 에란니스 틸리아리아(Erannis tiliaria), 에스티그메네 아크레아(Estigmene acrea), 율리아 살루브리콜라(Eulia salubricola), 유포코엘리아 암비구엘라(Eupocoellia ambiguella), 유포에실리아 암비구엘라(Eupoecilia ambiguella), 유프록티스 크리소로에아(Euproctis chrysorrhoea), 육소아 메소리아(Euxoa messoria), 갈레리아 멜로넬라(Galleria mellonella), 그라폴리타 몰레스타(Grapholita molesta), 하리시나 아메리카나(Harrisina americana), 헬리코베르파 서브플렉사(Helicoverpa subflexa), 헬리코베르파 제아(Helicoverpa zea) (옥수수 이삭벌레 "CEW"), 헬리오티스 비레센스(Heliothis virescens) (회색담배나방 "TBW"), 헤밀레우카 올리비아에(Hemileuca oliviae), 호모에오소마 엘렉텔룸(Homoeosoma electellum), 히판트리아 쿠네아(Hyphantria cunea), 케이페리아 리코페르시셀라(Keiferia lycopersicella), 람브디나 피스셀라리아 피스셀라리아(Lambdina fiscellaria fiscellaria), 람브디나 피스셀라리아 루구브로사(Lambdina fiscellaria lugubrosa), 류코마 살리시스(Leucoma salicis), 로베시아 보트라나(Lobesia botrana), 록소스테게 스틱티칼리스(Loxostege sticticalis), 리만트리아 디스파르(Lymantria dispar), 마칼라 티리살리스(Macalla thyrisalis), 말라코소마(Malacosoma) 종, 마메스트라 브라시카에(Mamestra brassicae), 마메스트라 콘피구라타(Mamestra configurata), 만두카 퀸퀘마쿨라타(Manduca quinquemaculata), 만투카 섹타(Manduca sexta), 마루카 테스툴랄리스(Maruca testulalis), 멜란크라 픽타(Melanchra picta), 오페로프테라 브루마타(Operophtera brumata), 오르기이아(Orgyia) 종, 오스트리니아 누빌랄리스(Ostrinia nubilalis) (유럽 옥수수 천공충 "ECB"), 팔레아크리타 베르나타(Paleacrita vernata), 파파이페마 네브리스(Papaipema nebris) (일반 자루 천공충), 파필리오 크레스폰테스(Papilio cresphontes), 펙티노포라 고시피엘라(Pectinophora gossypiella), 프리가니디아 칼리포르니카(Phryganidia californica), 필로노릭테르 블란카르델라(Phyllonorycter blancardella), 피에리스 나피(Pieris napi), 피에리스 라파에(Pieris rapae), 플라티페나 스카브라(Plathypena scabra), 플라티노타 플로우엔다나(Platynota flouendana), 플라티노타 스툴타나(Platynota stultana), 플라티프틸리아 카르두이닥틸라(Platyptilia carduidactyla), 플로디아 인테르푼크텔라(Plodia interpunctella), 플루텔라 크실로스텔라(Plutella xylostella) (배추좀나방 "DBM"), 폰티아 프로토디세(Pontia protodice), 슈달레티아 우니푼크타(Pseudaletia unipuncta), 슈도플루시아 인클루덴스(Pseudoplusia includens) (대두 자벌레 "SBL"), 사불로데스 아에그로타타(Sabulodes aegrotata), 쉬주라 콘신나(Schizura concinna), 시토트로가 세레알렐라(Sitotroga cerealella), 스필로노타 오셀라나(Spilonota ocellana), 스포도프테라 에리다니아(Spodoptera eridania) (남부 거염벌레 "SAW"), 스포도프테라 프루기페르다(Spodoptera frugiperda) (가을 거염벌레 "FAW"), 스포도프테라 엑시구아(Spodoptera exigua) (비트 거염벌레 "BAW"), 타우마토포에아 피티오캄파(Thaumatopoea pityocampa), 엔솔라 비셀리엘라(Ensola bisselliella), 트리코플루시아 니(Trichoplusia ni) (양배추 자벌레 "CL"), 우데아 루비갈리스(Udea rubigalis), 크실로미게스 쿠리알리스(Xylomyges curialis), 및 이포노메우타 파델라(Yponomeuta padella). 일반적으로, 상기 열거된 임의의 속 (및 다른 것들)은 또한 본 발명의 일부로서 표적화될 수 있다. 임의의 이들 속에서 임의의 추가 곤충도 (표적으로서) 또한 본 발명의 범위 내에 포함된다.

바실루스 투린기엔시스 (B.t.)는 델타 내독소 또는 Cry 단백질로 공지된 살곤충 결정 단백질을 생산하는 토양-매개, 그람-양성, 포자 형성 박테리아이다 (문헌 [Schnepf et al., 1998]에서 검토됨). 새로운 살곤충 특성을 갖는 신규 결정 (Cry) 단백질이 계속 증가하는 속도로 발견되고 있으며, 440종이 넘는 Cry 유전자가 보고되었다. 현재, 57가지 1차 상동성 등급으로 분류된 450종이 넘는 특유한 Cry 및 세포독소 (Cyt) 단백질이 존재한다. Cry 단백질은 서열 동일성의 정도에 기초하여 명명되며, 1차, 2차 및 3차 경계는 각각 대략 45%, 78% 및 95% 동일성에서 나타나고; 가까운 대립유전자는 새로운 4차 명칭을 할당받는다 (Crickmore et al., 1998). 델타 내독소의 광범위한 목록이 http://www.lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/intro.html에서 유지되고 정기적으로 개정되고 있다. 현재, 추가의 Cyt 독소 및 영양 살곤충 단백질 (VIP) 독소 등과 함께, "Cry" 독소의 73종의 주요 군 (Cry1-Cry73)이 존재한다. 각각의 번호군 중 다수는 대문자 하위군을 갖고, 대문자 하위군은 소문자 하위-하위군을 갖는다. (예를 들어, Cry1은 A-L을 갖고, Cry1A는 a-i를 가짐).

B.t. 단백질은 현재까지 성공적으로 등록되거나 규제 완화되고 상업화된 곤충-저항성 트랜스제닉 식물을 생성하는데 사용되어 왔다. 이들은 옥수수에서 Cry1Ab, Cry1Ac, Cry1F, Vip3A, Cry34Ab1/Cry35Ab1, 및 Cry3Bb, 목화에서 Cry1Ac, Vip3A 및 Cry2Ab, 및 감자에서 Cry3A를 포함한다. B.t. 독소는 생물살충제 시장의 90%를 넘게 차지하고, 본질적으로 곤충 섭식에 대한 저항성을 제공하도록 개발된 트랜스제닉 작물에 대한 전체 유전자 공급원을 대표한다.

Cry 단백질은 감수성 곤충의 중장 세포에 작용함으로써 기능하는 경구 중독제이다. 다수의 Cry 단백질의 활성 형태는 3가지 특징적인 단백질 도메인을 포함한다. 가장 잘 연구된 B.t. 단백질은 3-도메인 Cry 델타-내독소의 구성원이다. 이들 단백질의 크기는 대략 70 kDa 내지 130 kDa 범위이다. 1차 단백질 서열 분석이 5개의 고도로 보존된 서열 블록 및 보존된 블록 3 및 5 사이의 고도의 서열 변이성을 밝혀내었다 (Schnepf et al., 1998).

예로서 Cry1Aa1, Cry2Aa1, Cry3Aa1, Cry3Bb1, Cry4Aa, Cry4Ba 및 Cry8Ea1에 대해 3차원 결정 구조가 결정되었다. 이들 구조는 현저하게 유사하고, 하기 특색을 갖는 3개의 특징적인 도메인으로 구성된다 (문헌 [de Maagd et al., 2003]에서 검토됨). 도메인 I는 나선 5가 6개의 양쪽친매성 나선으로 둘러싸인 7개의 알파 나선의 묶음이다. 이 도메인은 중장 막 삽입 및 포어 형성에 관련되었다. 이는 용혈소 및 콜리신을 포함한 다른 포어 형성 단백질과 상동성을 공유한다. 도메인 II는 베타 프리즘으로 함께 패킹된 3개의 역평행 베타 시트로 구성된다. 이 도메인은 비텔린 및 자칼린을 포함한 특정 탄수화물-결합 단백질과 상동성을 공유한다. 이 도메인의 루프는 곤충 중장 수용체 결합에 있어서 중요한 역할을 한다. Cry1A 단백질에서, 도메인 II 베타 시트의 정점에서의 표면 노출 루프가 인시류 카드헤린 수용체에 결합하는 것에 관련된다. 도메인 III는 그의 예가 Cry1A 단백질의 경우에 아미노펩티다제 및 알칼리성 포스파타제인 제2 부류의 수용체와 상호작용하는 베타 샌드위치 구조이다 (Piggot and Ellar, 2007). 구조적으로 이 도메인은 단백질, 예컨대 글루카나제, 갈락토스 옥시다제, 시알리다제 및 다른 것의 탄수화물-결합 도메인에 관련된다. 이 도메인은 특정 부류의 수용체 단백질에 결합하며, 아마도 올리고머 독소 프리-포어의 삽입에 참여할 것이다. 보존된 B.t. 서열 블록 2 및 3은 각각 도메인 2의 N-말단 및 C-말단 근처에서 맵핑된다. 따라서, 이들 보존된 서열 블록 2 및 3은 3개의 기능적 도메인 사이의 대략적인 경계 영역이다. 보존된 DNA의 이들 영역 및 단백질 상동성이 재조합 B.t. 독소를 조작하는데 이용되어 왔다 (미국 특허 번호 6,090,931, WO 91/01087, WO95/06730, WO 1998022595).

Cry 단백질 작용 방식에 대한 하나의 제안된 모델은 감수성 곤충의 중장 막에서의 포어 형성에 기초한다 (Knowles and Ellar, 1987). 이 모델의 현재 버전에서 (Bravo et al., 2007), 인시류 중장 막 상의 카드헤린 및 아미노펩티다제 수용체 둘 다에 대한 결합이 Cry 단백질 독성에 요구된다. 포어 형성 모델에 따르면, Cry 단백질 중독은 여러 단계를 수반한다: 1) 활성화된 코어 독소에 대한 가용성 Cry 전독소의 단백질분해 처리; 2) 곤충 중장 상의 카드헤린 수용체에 대한 Cry 단백질 결합; 3) α-나선 영역을 제거하기 위한 코어 독소 N-말단에서의 추가의 단백질분해 절단; 4) 프리-포어를 형성하기 위한 Cry 단백질 올리고머화; 5) 제2 부위 막 수용체 (아미노펩티다제 및 알칼리성 포스파타제)에 대한 프리-포어 결합; 6) 막으로의 프리-포어 삽입 및 7) 중장 파괴 및 곤충 사멸로 이어지는 삼투성 세포 용해.

곤충-저항성 트랜스제닉 식물 기술의 광범위한 채택은 해충 집단에서 이들 식물에 의해 생산된 살곤충 단백질에 대한 저항성이 발생할 우려가 제기된다. 은신처와의 조합, 및 상이한 독소와의 교대, 또는 공동-배치로 단백질을 고용량으로 배치하는 것을 포함하여 B.t.-기반 곤충 저항성 형질의 유용성을 보존하기 위한 여러 전략이 제안되었다 (McGaughey et al. (1998), "B.t. Resistance Management," Nature Biotechnol. 16:144-146).

B.t. Cry 단백질에 대한 곤충 저항성은 여러 메카니즘을 통해 발생할 수 있다 (Heckel et al., 2007, Piggot and Ellar, 2007). Cry 단백질에 대한 여러 수용체 단백질 부류가 곤충 내에서 확인되었으며, 여러 예가 각각의 수용체 부류 내에 존재한다. 특정한 Cry 단백질에 대한 저항성은, 예를 들어 수용체 단백질의 카드헤린 도메인의 독소-결합 부분 내에서의 돌연변이에 의해 발생할 수 있다. 추가의 저항성 수단은 전독소-프로세싱 프로테아제를 통해 매개될 수 있다. 따라서, 인시목 종에서의 Cry1A 독소에 대한 저항성은 적어도 4종의 특징적인 주요 저항성 유전자에 의한 복잡한 유전적 기초를 갖는다. Cry 단백질에 대해 저항성을 갖는 인시류 곤충이, 플루텔라 크실로스텔라 (Tabashnik, 1994), 트리코플루시아 니 (Janmaat and Myers 2003, 2005), 헬리코베르파 제아 (Tabashnik et al., 2008), 및 스포도프테라 프루기페르다 (Storer, et al., 2010)에 대하여 재배지에서 발생하였다. 새로운 고효능 Cry 단백질의 개발은 인시류 곤충 해충의 관리를 위한 추가의 도구를 제공할 것이다.

본 발명은 Cry1Ac 및 Cry1F에 대해 저항성을 갖는 곤충을 방제하는데 효과적인 B.t. 살곤충 단백질을 제공한다. 이들 단백질 독소는 유리하게는 농경 작물을 곤충 섭식 손상으로부터 보호하는데 사용될 수 있다. 충분한 양의 기능적 활성 단백질이 관심 작물에 존재하도록 하는 방식으로 이들 곤충 독소를 발현하는 능력이 또한 본 발명의 대상이다.

서열식별번호: 2의 잔기 2 내지 68을 포함하며, 여기서 아미노산 잔기 54는 Gly 및 Ala로 이루어진 군으로부터 선택되고, 아미노산 잔기 57은 Leu 및 Met로 이루어진 군으로부터 선택되고, 아미노산 잔기 68은 Val, Phe, 및 Ile로 이루어진 군으로부터 선택되는 것인 변형된 Cry1Ca 독소. 서열식별번호: 210의 잔기 2 내지 628을 포함하며, 여기서 아미노산 잔기 54는 Gly 및 Ala로 이루어진 군으로부터 선택되고, 아미노산 잔기 57은 Leu 및 Met로 이루어진 군으로부터 선택되고, 아미노산 잔기 68은 Val, Phe, 및 Ile로 이루어진 군으로부터 선택되고, 아미노산 잔기 73은 Trp, Ala 및 Met로 이루어진 군으로부터 선택되고, 아미노산 잔기 596은 Phe, Met 및 Ala로 이루어진 군으로부터 선택되고, 아미노산 잔기 620은 Leu 및 Phe로 이루어진 군으로부터 선택되는 것인 변형된 Cry1Ca 독소. 서열식별번호: 36의 아미노산 잔기 629 내지 1164로 이루어진 카르복시 말단 연장부를 추가로 포함하는 상기 변형된 Cry1Ca 독소. 서열식별번호: 36의 아미노산 잔기 629 내지 1164로 이루어진 카르복시 말단 연장부를 추가로 포함하는 상기 변형된 Cry1Ca 독소. 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 상기 변형된 Cry1Ca 독소. 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 상기 변형된 Cry1Ca 독소. 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 상기 변형된 Cry1Ca 독소. 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 상기 변형된 Cry1Ca 독소.

변형된 Cry1Ca 독소를 코딩하는 DNA, 변형된 Cry1Ca 독소를 생산하는 트랜스제닉 식물 및 변형된 Cry1Ca 독소를 사용하여 곤충 해충을 방제하는 방법이 본 발명에 포함된다.

본 발명은 식물 및 농업에 해로운 절지동물 해충을 방제하기 위한 신규 물질 및 방법에 관한 것이다. 바람직한 실시양태에서, 본 발명은 인시류 해충의 방제를 위한 물질 및 방법을 제공한다.

본 발명에 따라 유용한 특정 B.t. Cry 단백질 (내독소, 독소)은 MR-1206으로 명명되는 B.t. 단리물로부터 수득할 수 있는 독소를 포함한다. 본 발명은 또한 프로테아제 프로세싱에 저항성이 있거나, 또는 유전자가 이종 발현 시스템으로 형질전환된 경우에 고 수준으로 발현하는 개선된 인시류-활성 특성을 갖는 예시된 B.t. 단리물 및 독소의 돌연변이체의 용도를 포함한다. 돌연변이체를 제조하는 절차는 미생물학 분야에 널리 공지되어 있다. 자외선 및 화학적 돌연변이유발원, 예컨대 니트로소구아니딘이 이 목적을 위해 광범위하게 사용된다.

본 발명의 단백질 독소는 다양한 방식으로 표적 곤충과 접촉하도록 "적용"되거나 또는 제공될 수 있다. 예를 들어, 트랜스제닉 식물 (여기서, 단백질은 식물에 의해 생산되고 식물 내에 존재함)이 사용될 수 있고, 이는 관련 기술분야에 널리-공지되어 있다. 독소 유전자의 발현은 또한 뿌리, 잎 등과 같은 식물의 특정 조직에서 선택적으로 달성될 수 있다. 이는, 예를 들어 조직-특이적 프로모터의 사용을 통해 달성될 수 있다. 분무 적용이 또 다른 예이며, 이는 또한 관련 기술분야에 공지되어 있다. 본 발명의 단백질은 목적하는 최종 용도를 위해 적절하게 제제화된 다음, 침입이 발견되기 전에, 표적 곤충이 발견된 후에, 그 이전 및 이후 둘 다 등에서 보호될 식물 상에 및/또는 식물 주위에 및/또는 식물 부근에 분무 (또는 다르게는 적용)될 수 있다. 본 발명의 단백질은 또한 적절하게 제제화되고, 단백질이 식물의 뿌리 구역과 접촉하여 이를 뿌리 섭식 곤충으로부터 보호하도록 하는 종자 처리로서 종자에 적용될 수 있다. 예를 들어 미끼 과립이 또한 사용될 수 있고, 이는 관련 기술분야에 공지되어 있다.

본 발명의 단백질을 사용하여 실질적으로 임의의 유형의 식물을 인시류 곤충에 의한 손상으로부터 보호할 수 있다. 이러한 식물의 예는 몇 가지 예로 메이즈, 해바라기, 대두, 목화, 카놀라, 벼, 수수, 밀, 보리, 채소, 관상식물, 페퍼 (고추 포함), 사탕무, 과일, 및 잔디풀을 포함한다. 특히 바람직한 식물은 메이즈, 대두 및 목화이다. 가장 바람직한 식물은 메이즈이다. 또 다른 가장 바람직한 식물은 대두이다. 또 다른 가장 바람직한 식물은 목화이다.

본 발명의 한 실시양태에서, 본 발명의 폴리뉴클레오티드 서열은 대략 68-71 kDa의 독소를 코딩한다. 이들 독소는 인시류 해충, 특히 가을 거염벌레, 배추좀나방, 남서부 옥수수 천공충, 남부 거염벌레, 옥수수 이삭벌레, 및 유럽 옥수수 천공충을 방제하는데 사용된다. 바람직한 실시양태에서, 본 발명은 형질전환 식물 세포가 표적 해충에 의해 소비되는 조직에서 본 발명의 살충 독소를 생산하고 함유하도록 본 발명의 적어도 하나의 폴리뉴클레오티드 서열로 형질전환된 식물 세포에 관한 것이다.

대안적으로, 본 발명의 B.t. 단리물, 또는 본원에 기재된 살충 독소 단백질을 코딩하는 유전자를 발현하는 재조합 미생물이 곤충 해충을 방제하는데 사용될 수 있다. 이와 관련하여, 본 발명은 실질적으로 무손상인 B.t. 세포, 및/또는 실질적으로 무손상인 세포가 표적 해충의 환경에 적용된 경우에 살충 활성이 연장되도록 처리된 본 발명의 독소를 함유하는 재조합 세포의 처리를 포함한다. 처리된 세포는 살충 독소에 대해 보호 코팅으로서 작용한다. 독소는 표적 곤충에 의해 섭취되면 활성이 된다.

본 발명의 한 측면은 살충 단백질 및 폴리펩티드 또는 그의 생물학적 활성 부분을 코딩하는 뉴클레오티드 서열을 포함하는 단리된 핵산 분자 뿐만 아니라 본 발명의 독소를 코딩하는 핵산을 확인하기 위한 혼성화 프로브로서 사용하기에 충분한 핵산 분자에 관한 것이다. 본원에 사용된 용어 "핵산 분자"는 DNA 분자 (예를 들어, cDNA 또는 게놈 DNA) 및 RNA 분자 (예를 들어, mRNA) 및 뉴클레오티드 유사체를 사용하여 생성된 DNA 또는 RNA의 유사체를 포함하도록 의도된다. 핵산 분자는 단일-가닥 또는 이중-가닥일 수 있지만, 이중-가닥 DNA가 바람직하다.

본 발명의 단백질을 코딩하는 뉴클레오티드 서열은 서열식별번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39에 제시된 서열, 및 그의 상보체를 포함한다. "상보체"는 주어진 뉴클레오티드 서열에 대해 혼성화되어 안정한 듀플렉스 (이중-가닥) 분자를 형성할 수 있도록 주어진 뉴클레오티드 서열에 대해 충분히 상보적인 뉴클레오티드 서열을 의도한다. 이들 뉴클레오티드 서열에 의해 코딩되는 살충 활성 변형된 Cry1Ca 독소에 대해 상응하는 아미노산 서열은 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40에 제시된다.

본 발명의 독소-코딩 뉴클레오티드 서열의 단편인 핵산 분자가 또한 본 발명에 포괄된다. "단편"은 본 발명의 변형된 Cry1Ca 독소의 단편을 코딩하는 뉴클레오티드 서열의 부분을 의도한다. 뉴클레오티드 서열의 단편은 본 발명의 독소 단백질의 생물학적 활성 부분을 코딩할 수 있거나, 또는 이는 하기 개시된 방법을 사용하여 혼성화 프로브 또는 PCR 프라이머로서 사용될 수 있는 단편일 수 있다.

서열의 간단한 설명

서열식별번호: 1은 DIG-468을 코딩하는 DNA 서열이다.

서열식별번호: 2는 DIG-468 단백질 서열이다.

서열식별번호: 3은 DIG-483를 코딩하는 DNA 서열이다.

서열식별번호: 4는 DIG-483 단백질 서열이다.

서열식별번호: 5는 DIG-485를 코딩하는 DNA 서열이다.

서열식별번호: 6은 DIG-485 단백질 서열이다.

서열식별번호: 7은 DIG-487을 코딩하는 DNA 서열이다.

서열식별번호: 8은 DIG-487 단백질 서열이다.

서열식별번호: 9는 DIG-462를 코딩하는 DNA 서열이다.

서열식별번호: 10은 DIG-462 단백질 서열이다.

서열식별번호: 11은 DIG-463을 코딩하는 DNA 서열이다.

서열식별번호: 12는 DIG-463 단백질 서열이다.

서열식별번호: 13은 DIG-464를 코딩하는 DNA 서열이다.

서열식별번호: 14는 DIG-464 단백질 서열이다.

서열식별번호: 15는 DIG-465를 코딩하는 DNA 서열이다.

서열식별번호: 16은 DIG-465 단백질 서열이다.

서열식별번호: 17은 DIG-466를 코딩하는 DNA 서열이다.

서열식별번호: 18은 DIG-466 단백질 서열이다.

서열식별번호: 19는 DIG-467을 코딩하는 DNA 서열이다.

서열식별번호: 20은 DIG-467 단백질 서열이다.

서열식별번호: 21은 DIG-469를 코딩하는 DNA 서열이다.

서열식별번호: 22는 DIG-469 단백질 서열이다.

서열식별번호: 23은 DIG-473를 코딩하는 DNA 서열이다.

서열식별번호: 24는 DIG-473 단백질 서열이다.

서열식별번호: 25는 DIG-474를 코딩하는 DNA 서열이다.

서열식별번호: 26은 DIG-474 단백질 서열이다.

서열식별번호: 27은 DIG-482를 코딩하는 DNA 서열이다.

서열식별번호: 28은 DIG-482 단백질 서열이다.

서열식별번호: 29는 메이즈에 대해 최적화된 변형된 Cry1Ca 코돈 (IRDIG544.11)을 코딩하는 DNA 서열이다.

서열식별번호: 30은 변형된 Cry1Ca 단백질 단백질 독소 서열 (IRDIG544.11)이다.

서열식별번호: 31은 고 GC 코돈 최적화된, 변형된 Cry1Ca, IRDIG544.12를 코딩하는 DNA 서열이다.

서열식별번호: 32는 IRDIG544.12에 대한 단백질 독소 서열이다.

서열식별번호: 33은 변형된 Cry1Ca, IRDIG544.9를 코딩하는 쌍자엽식물 최적화 DNA 서열이다.

서열식별번호: 34는 변형된 Cry1Ca, IRDIG544.9의 단백질 서열이다.

서열식별번호: 35는 변형된 Cry1Ca, IRDIG544.8을 코딩하는 쌍자엽식물 최적화 DNA 서열이다.

서열식별번호: 36은 쌍자엽식물에 대해 최적화된 IRDIG544.8 단백질 코돈이다.

서열식별번호: 37은 Cry1Ab 전독소 절편에 융합된 변형된 Cry1Ca 독소를 코딩하는 DNA 서열이다.

서열식별번호: 38은 서열식별번호: 37의 DNA로부터 생산된 단백질 독소 서열이다.

서열식별번호: 39는 TraP12에 융합된 변형된 Cry1Ca, IRDIG544.12를 코딩하는 고 GC 코돈 최적화 DNA 서열이다.

서열식별번호: 40은 TraP12에 융합된 변형된 Cry1Ca 독소, IRDIG544.12이다.

도 1은 잎 펀치에 의해 샘플링된 T₁ 메이즈 잎에서 구축물 115752에 의한 DIG-465의 및 구축물 115753에 의한 DIG-473의 발현 수준을 보여준다.
도 2는 FAW 또는 Cry1Fa 저항성 FAW에 의해 유발된 메이즈에서의 잎 손상의 양 대 DIG-465의 발현 수준의 플롯이다.
도 3은 FAW 또는 Cry1Fa 저항성 FAW에 의해 유발된 메이즈에서의 잎 손상의 양 대 DIG-473의 발현 수준의 플롯이다.

본원에서 용어 "유전 물질"의 사용은 모든 유전자, 핵산, DNA 및 RNA를 포함하도록 의도된다. 이들 서열은 유전자가 식물, 특히 메이즈 및 쌍자엽식물에서 형질전환되는 경우 발현된 단백질 독소의 안정성을 증가시키는 방식으로 변경되었다. 본원에서 논의된 단백질 독소는 전형적으로 "살곤충제" 또는 "살곤충"으로 지칭된다. 살곤충제 및 살곤충은 본원에서 단백질 독소가 본원에 추가로 정의된 바와 같은 "기능적 활성"을 가지며, 곤충 방제제로서 사용된다는 것을 의미한다.

"기능적 활성"은 본원에서 단백질 독소가 단백질이 경구 활성이거나, 또는 독성 효과를 갖거나, 또는 섭식을 방해하거나 또는 저지할 수 있는 (이는 곤충 사멸을 유발할 수도 또는 유발하지 않을 수도 있음) 곤충 방제제로서 기능한다는 것을 의미한다. 곤충이 트랜스제닉 식물 발현, 제제화된 단백질 조성물(들), 분무가능한 단백질 조성물(들), 미끼 매트릭스 또는 다른 전달 시스템을 통해 전달되는 유효량의 독소와 접촉하는 경우, 그 결과는 전형적으로 곤충의 사멸이거나 또는 곤충에 이용가능한 독소를 만드는 공급원을 곤충이 섭식하지 않는 것이다.

용어 "올리고뉴클레오티드"의 사용은 RNA 또는 DNA의 뉴클레오티드의 단쇄로 이루어진 거대분자를 의미한다. 이러한 길이는 적어도 1개의 뉴클레오티드일 수 있으나, 전형적으로 약 10 내지 약 12개 뉴클레오티드의 범위이다. 올리고뉴클레오티드의 길이의 결정은 관련 기술분야의 통상의 기술자의 기술 범위 내에 있고, 본원에서 제한되지 않아야 한다. 따라서, 올리고뉴클레오티드는 10개 미만 또는 12개 초과일 수 있다. 본 발명은 이들 부류의 독소를 코딩하는 폴리뉴클레오티드 서열 뿐만 아니라, 독소를 발현하는 재조합 숙주를 생산하기 위한 이들 폴리뉴클레오티드 서열의 용도에 관한 것이다.

본원에 사용된 바와 같이 용어 "독성의" 또는 "독성"의 사용은 바실루스 투린기엔시스에 의해 생산된 독소가 본원에 정의된 바와 같은 "기능적 활성"을 갖는다는 것을 의미한다.

용어 "변형된 Cry1Ca 독소(들)"의 사용은 본원에 기재된 서열 목록의 모든 단백질 서열 및 그의 모든 변이체를 포함하는 것을 의미한다.

본원에서 용어 "유전 물질"의 사용은 모든 유전자, 핵산, DNA 및 RNA를 포함하는 것을 의미한다.

폴리뉴클레오티드, DNA, RNA, 올리고뉴클레오티드 및 프라이머의 뉴클레오티드 잔기의 명명을 위해, 및 단백질의 아미노산 잔기의 명명를 위해, 표준 IUPAC 약어가 본 문헌 전반에 걸쳐 사용된다. 핵산 서열은 표준 5'에서 3'으로의 방향으로 제시되며, 단백질 서열은 표준인 아미노 (N) 말단에서 카르복시 (C) 말단으로의 방향으로 제시된다.

본 발명의 독소 및 유전자는 추가로 그의 아미노산 및 뉴클레오티드 서열, 및 전장 DNA 및 아미노산 서열에 의해 포함되는 특유한 단편의 서열로 정의될 수 있다. 각각의 신규 부류 내의 분자의 서열은 특정 예시된 서열에 대한 상동성과 관련하여, 뿐만 아니라 특정 예시된 프로브 및 프라이머와 혼성화되거나 또는 이에 의해 증폭되는 능력과 관련하여 정의될 수 있다. 본원에 제공된 독소의 부류는 또한 특정 항체와의 그의 면역반응성에 기초하여 확인될 수 있다.

독소 구조. 본 발명의 독소는 또한 구조 및 도메인 조성과 관련하여 특징화될 수 있다. 생물활성 스펙트럼의 차이와 단백질 서열 변이성의 상관관계는 블록 3 및 5 사이의 "초가변" 영역이 B.t. 델타-내독소 사이의 곤충 특이성의 차이의 원인이 된다는 초기 가설에 도달하였다.

천연 전장 Cry1Ca 단백질을 코딩하는 유전자가 메이즈 세포에 삽입되어 발현되는 경우, 적어도 5가지 검출가능한 단백질분해에 의한 분해 생성물이 관찰된다. 이들 5가지 폴리펩티드는 하기 아미노산 길이를 갖는 것으로 결정되었다: 1-1164, 1-628, 29-628, 74-628, 및 74-596. 검출된 5가지 Cry1Ca 분해 생성물 중에서, 단편 중 2개는 중요한 드라이버 곤충 해충에 대해 불활성인 것으로 밝혀졌다. 대부분의 경우, 이들 2가지 불활성 단편이 메이즈 세포에서 검출되는 Cry1Ca-관련 단백질의 주요 부분을 차지한다. 메이즈에서의 Cry1Ca에 대한 천연 전장 유전자의 발현은 중요한 곤충 해충, 예컨대 에스. 프루기페르다에 대해 불충분한 기능적 활성을 갖는 식물을 발생시킨다.

말단절단 천연 Cry1Ca 단백질 (aa 1-628)을 발현하는 유전자가 메이즈 세포에 삽입되어 발현되는 경우, 단백질분해 프로세싱이 보다 적게 발생한다. 대부분이 비프로세싱되고 기능적 활성인 채로 남아있다. 따라서 메이즈 세포에서의 말단절단 Cry1Ca 유전자의 발현은 메이즈 세포에서의 감소된 단백질분해로 인해 중요한 곤충 해충에 대해 충분한 기능적 활성을 갖는 식물을 발생시킨다.

Cry1Ca의 1차 아미노산 서열의 변경은 중요한 곤충 해충에 대해 지속적인 생물학적 활성을 허용하고, 프로테아제 효소로서 키모트립신을 사용하여 시험관내에서 측정시에 단백질의 보다 적은 단백질분해 프로세싱을 발생시킨다. 변경된 Cry1Ca 단백질의 보다 적은 단백질분해 프로세싱은 식물에 보다 많은 양의 기능적 활성 단백질이 축적되도록 하며, 표적 곤충 해충에 대해 보다 큰 활성을 발생시킨다.

프로테아제 감수성 변이체. 곤충 장 프로테아제는 전형적으로 곤충이 먹이 단백질로부터 필요한 아미노산을 수득하는 것을 보조하는 기능을 한다. 가장 잘 이해된 곤충 소화 프로테아제가 세린 프로테아제라는 것인데, 이는 특히 인시류 종에서 가장 흔한 유형인 것으로 보인다 (Englemann and Geraerts, 1980). 딱정벌레류 곤충은 인시류 장보다 더 중성 내지 산성인 장을 갖는다. 대다수의 딱정벌레류 유충 및 성충, 예를 들어 콜로라도 감자 딱정벌레는 약간 산성인 중장을 가지며, 시스테인 프로테아제가 주요 단백질분해 활성을 제공한다 (Wolfson and Murdock, 1990). 더욱 정확하게는, 문헌 [Thie and Houseman (1990)]에서는 콜로라도 감자 딱정 벌레에서 카텝신 B-유사 및 카텝신 H-유사 시스테인 프로테아제들과, 카텝신 D-유사 아스파르틸 프로테아제가 확인 및 특성화되었다. 문헌 [Gillikin et al., (1992)]에서는 서부 옥수수 뿌리벌레 유충의 장에서의 단백질분해 활성이 특징화되었으며 이는 주로 시스테인 프로테아제임이 발견되었다. 미국 특허 번호 7230167은 세린 프로테아제, 카텝신 G가 서부 옥수수 뿌리벌레에 존재함이 개시되어 있다. 곤충 장 프로테아제의 다양성 및 상이한 활성 수준은 특정한 B.t. 독소에 대한 곤충의 감수성에 영향을 줄 수 있다.

한 실시양태에서, 독소는 메이즈 식물에서 자연적으로 발견되는 프로테아제에 의해 발현된 단백질의 프로테아제 프로세싱의 수준을 유의하게 감소시키는 그의 아미노산 서열에서의 특정 변화를 갖는다. 아미노산의 변화는 메이즈에서 발현되는 경우 단백질의 높은 수준의 기능적 활성을 발생시킨다. 프로테아제 절단 부위는 화학적 유전자 합성 또는 스플라이스 중첩 PCR에 의해 목적 위치에 도입될 수 있다 (Horton et al., 1989). 예를 들어 세린 프로테아제 인식 서열이 특정 곤충 해충의 중장 내에서 목적하는 결실 지점에서의 단백질 프로세싱에 영향을 미치도록 Cry 단백질 구조 내의 특정 부위에 임의로 삽입될 수 있다. 인시류 중장 세린 프로테아제, 예컨대 트립신 또는 트립신-유사 효소, 키모트립신, 엘라스타제 등 (Christeller et al., 1992)은 목적 프로세싱 부위에서 프로테아제 인식 서열을 조작함으로써 Cry 단백질의 활성화에 사용될 수 있다. 마찬가지로, 딱정벌레류 세린 프로테아제, 예컨대 트립신, 키모트립신 및 카텝신 G-유사 프로테아제는 목적 프로세싱 부위에서 인식 서열을 조작함으로써 유사하게 사용될 수 있다. 추가로, 딱정벌레류 시스테인 프로테아제, 예컨대 카텝신 (B-유사, L-유사, O-유사, 및 K-유사 프로테아제) (Koiwa et al., 2000 및 Bown et al., 2004), 메탈로프로테아제, 예컨대 ADAM10 (Ochoa-Campuzano et al., 2007), 및 아스파르트산 프로테아제, 예컨대 카텝신 D-유사 및 E-유사, 펩신, 플라스멥신, 및 키모신은 목적 프로세싱 부위에서 인식 서열을 조작함으로써 사용될 수 있다.

본 발명의 범위는 곤충, 식물 또는 미생물 프로테아제에 의한 보다 큰 변이체 단백질의 단백질분해 절단을 허용 또는 제거하도록 적절한 위치에서의 프로테아제 프로세싱 부위의 도입 또는 제거에 의해 본 발명의 살곤충 단백질에 대한 코딩 서열을 조작하여 생산된 변이체 Cry1Ca 살곤충 단백질을 포함한다. 이러한 조작의 최종 결과는 무손상 (전장) 독소 단백질과 동일하거나 그보다 더 우수한 활성을 갖는 독소 분자의 생성이다.

그의 DNA 기질의 인식 및 절단에서 제II형 제한 엔도뉴클레아제와 연관된 높은 서열 특이성과 달리, 단백질분해 효소는 절단 인식 부위를 포함하는 아미노 서열에서 보다 더 비특이적이다. 일부 범용성은 일부 프로테아제 절단 부위, 특히 카텝신 B, K, L, 및 S와 비교하여 카텝신 G를 포함하는 아미노산 구조와 관련하여 발견되었다 (Bown et al., 2004). 하기 예시된 프로테아제 절단 부위의 명명법에서, 절단 부위로부터 상류 아미노산 잔기 (즉 N-말단을 향함)는 P1, P2, P3, P4, P5 등으로 넘버링되고, 잔기 P1은 절단 부위에 바로 인접하고, 잔기 P5는 절단 부위로부터 N-말단 방향으로 5번째로 가장 멀리 있다. 절단 부위로부터 하류 아미노산 잔기 (즉 C-말단을 향함)는 P1', P2', P3', P4', P5' 등으로 넘버링되고, 잔기 P1'는 절단 부위에 바로 인접하고, 잔기 P5'는 절단 부위로부터 C-말단 방향으로 5번째로 가장 멀리 있다. 카텝신 G는 P1 잔기 글루타민, 리신, 트립토판, 또는 페닐알라닌 뒤에서 우선적 절단을 나타내는 것으로 공지되어 있으며, 여기서 잔기 P2, P3, P4, P5 등, 및 P1', P2', P3', P4', P5' 등은 천연 단백질에서 보통 발견되는 20가지 아미노산 중 임의의 것일 수 있다. 어느 정도 증진된 절단 부위 서열 특이성은 카텝신 B, K, L, 및 S에 의해 입증되며, 여기서 P2 아미노산의 측쇄는 카텝신의 기질 결합 부위 S2에 핏팅된다. 이들 카텝신의 S2 부위는 큰 소수성 측쇄 (예를 들어 발린, 류신, 이소류신, 페닐알라닌, 트립토판, 및 티로신에서 발견된 바와 같음)를 갖는 P2 아미노산과 우선적으로 상호작용하고, 하전된 측쇄를 갖는 P2 잔기와의 상호작용을 기피한다 (예외적으로 카텝신 B 및 L은 P2 위치에 아르기닌의 큰 친수성 하전된 측쇄를 허용함). 일부 특이성은 P3 위치에서 아미노산의 동일성에서 나타난다. 예를 들어, 카텝신 L은 페닐알라닌 또는 아르기닌이 P2 위치를 점유하는 경우 P1 위치에서 아르기닌 뒤를 우선적으로 절단한다. P3 아미노산은 방향족 유형 (예를 들어 페닐알라닌, 트립토판, 히스티딘, 또는 티로신) 또는 소수성 유형 (예를 들어 알라닌, 발린, 류신, 이소류신, 페닐알라닌, 트립토판, 또는 티로신)일 수 있다. 위치 P4, P5 등, 및 P1', P2', P3', P4', P5' 등은 천연 단백질에서 보통 발견되는 20가지 아미노산 중 임의의 것일 수 있다.

단백질분해 절단은 각 프로테아제에 대한 대상 절단 서열의 이용가능성에 추가로 의존하며; 단백질의 3차원 구조 내의 잠재적 절단 부위의 격리는 단백질을 특정한 프로테아제에 의한 절단에 저항성을 갖도록 할 수 있다. 곤충 장 프로테아제의 다양성 및 상이한 활성 수준은 특정한 B.t. 독소에 대한 곤충의 감수성에 영향을 미칠 수 있는 것으로 생각된다. 생화학 및 분자 생물학 분야의 통상의 기술자는 감수성 곤충의 장 프로테아제에 의한 보다 큰 단백질의 프로테아제 절단/활성화에 의해 생성된 살곤충 단백질 단편의 생화학적 특징을 조사할 수 있다 (폴리펩티드의 N-말단 및 C-말단을 포함하는 아미노산의 서열의 결정을 포함하나 이에 제한되지는 않음). 또한 비감수성 곤충 또는 숙주 식물의 장의 프로테아제 체제, 및 조작자를 B.t. 살곤충 단백질의 코딩 서열 내의 적절한 위치, 비감수성 곤충의 장 프로테아제에 의해 절단되기 쉬운 서열 또는 B.t. 살곤충 단백질이 트랜스제닉적으로 생산될 것으로 기대되는 숙주 식물에서 특징화할 수 있다. 본 발명의 B.t. 살곤충 단백질의 이러한 분석 및 조작은 본 발명의 범위 내에 포함될 것으로 이해된다.

또 다른 실시양태에서, 독소는 식물 및 박테리아를 포함한 다양한 상이한 발현 시스템에서 발현되는 경우 단백질 발현의 수준을 유의하게 증진시키는 그의 아미노산 서열에서의 특정 변화를 갖는다. 단백질의 증가된 발현의 결과로 발현 시스템에서 기능성 활성이 증가한다. 이는 치사 용량 미만의 단백질 독소를 제공받은 곤충의 작은 집단의 생존으로 인해 곤충에서 독소에 대한 저항성이 발생하는 것을 방지할 수 있도록 곤충에게 고용량의 독소를 제공하는데 유리하다.

유전자 및 독소. 본원의 실시양태의 단백질 분자는 공지된 살충 단백질, 특히 B.t. Cry 단백질, 보다 특히 Cry1Ca 단백질 (진뱅크 수탁 번호 AAA22343)에 상동인 아미노산 서열을 포함한다. 실시양태의 뉴클레오티드 서열에 의해 코딩되는 예측된 아미노산 서열은 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40으로 개시된다.

본 발명의 독소의 서열은 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40으로 제공된다. 바람직한 실시양태에서, 본 발명의 독소는 하기 특징 중 적어도 하나를 갖는다:

(a) 상기 독소는 서열식별번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39로 이루어진 군으로부터 선택된 뉴클레오티드 서열, 또는 그의 상보적 서열과 엄격한 조건 하에 혼성화되는 뉴클레오티드 서열에 의해 코딩된다.

(b) 상기 독소는 바실루스 투린기엔시스 단리물로부터 대략 68-71 kDa 곤충 독소, 또는 그의 단편에 대해 생성된 항체와 면역반응성이다.

(c) 상기 독소는 이러한 뉴클레오티드 서열의 부분이 프라이머 쌍을 사용하여 PCR에 의해 증폭되어 약 25-40 bp의 단편을 생성할 수 있는 뉴클레오티드 서열에 의해 코딩된다,

(d) 상기 독소는 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40에 제시된 아미노산 서열의 살충 부분을 포함한다,

(e) 상기 독소는 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40으로 이루어진 군으로부터 선택된 아미노산 서열의 살충 부분과 적어도 약 (90%) 상동성을 갖는 아미노산 서열을 포함한다,

(f) 상기 독소는 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40을 코딩하는 DNA로 이루어진 군으로부터 선택된 뉴클레오티드 서열의 살곤충 부분과 엄격한 조건 하에 혼성화되는 뉴클레오티드 서열에 의해 코딩된다,

(g) 상기 독소는 바실루스 투린기엔시스 단리물, MR-1206으로부터의 대략 68 kDa 또는 130 kDa 살충 독소, 또는 그의 단편에 대한 항체와 면역반응성이다.

(h) 상기 독소는 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40으로 이루어진 군으로부터 선택된 아미노산 서열 및 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40의 살충 부분과 적어도 약 (90%) 상동성을 갖는 아미노산 서열을 포함한다.

본원에 예시된 특정 유전자, 이들 유전자의 변이 및 이들 유전자의 단편은 또한 예를 들어 임의의 여러 상업적 공급업체에 의해 현재 실시되는 방법에 의한 합성 구축에 의해 수득될 수 있다 (예를 들어 미국 특허 번호 7482119 참조). 이들 유전자, 또는 그의 부분 또는 변이체는 또한 예를 들어 유전자 합성기의 사용 및 예를 들어 미국 특허 번호 5,380,831 방법에 의해 또한 합성에 의해 구축될 수 있다. 대안적으로, 합성 또는 자연 발생 유전자의 변이는 점 돌연변이를 만드는 표준 분자 생물학적 기술을 사용하여 용이하게 구축될 수 있다. 이들 유전자의 단편은 또한 표준 절차에 따라 상업적으로 입수가능한 엑소뉴클레아제 또는 엔도뉴클레아제를 사용하여 만들어질 수 있다. 예를 들어, 효소, 예컨대 Bal31 또는 부위-지정 돌연변이유발이 이들 유전자의 말단으로부터 뉴클레오티드를 체계적으로 절단하는데 사용될 수 있다. 또한, 활성 독소 단편을 코딩하는 유전자 단편은 다양한 제한 효소를 사용하여 수득될 수 있다.

본 발명의 독소-코딩 뉴클레오티드 서열의 단편인 핵산 분자는 의도되는 용도에 따라 적어도 약 15, 20, 30, 40, 50, 60, 75, 100, 200, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 3000, 3500개 뉴클레오티드, 또는 최대로 본원에 개시된 전장의 본 발명의 살곤충 독소-코딩 뉴클레오티드 서열에 존재하는 개수의 뉴클레오티드 (예를 들어, 서열식별번호: 1의 경우 1,878개 뉴클레오티드; 서열식별번호: 37의 경우 3,495개 뉴클레오티드)를 포함한다. 본 발명의 청구된 단백질의 생물학적 활성 부분을 코딩하는 뉴클레오티드 서열의 단편은 적어도 약 15, 25, 30, 40, 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 800, 900, 1000, 1100 또는 1200개의 인접 아미노산, 또는 최대로 본 발명의 전장 살곤충 단백질에 존재하는 총 개수의 아미노산 (예를 들어, 서열식별번호: 2의 경우 625개 아미노산 또는 서열식별번호: 38의 경우 1,164개 아미노산)을 코딩할 것이다.

재조합 숙주. 본 발명의 독소-코딩 유전자는 광범위하게 다양한 미생물 또는 식물 숙주 내로 도입될 수 있다. 독소 유전자의 발현은 직접적으로 또는 간접적으로 살충 단백질을 세포내에서 생산 및 유지한다. 적합한 미생물 숙주, 예를 들어 슈도모나스를 사용하는 경우, 미생물은 그가 증식하고 섭취될 해충 환경에 적용될 수 있다. 그 결과는 해충의 방제이다. 대안적으로, 독소 유전자의 숙주인 미생물은 독소의 활성을 연장시키고 세포를 안정화시키는 조건 하에서 처리될 수 있다. 이어서, 독성 활성을 유지하는 처리된 세포는 표적 해충의 환경에 적용될 수 있다.

독소 유전자가 적합한 벡터를 통해 미생물 숙주 내로 도입되고, 상기 숙주가 살아있는 상태로 환경에 적용되는 경우, 특정 숙주 미생물이 사용되는 것이 필수적이다. 하나 이상의 관심 작물의 "식물권" (엽면, 엽권, 근권 및/또는 근면)을 점유하는 것으로 공지된 미생물 숙주가 선택된다. 이들 미생물은 특정한 환경 (작물 및 다른 곤충 서식지)에서 야생형 토착 미생물과 성공적으로 경쟁할 수 있도록 선택되고, 폴리펩티드 살충제를 발현하는 유전자의 안정한 유지 및 발현을 제공하고, 바람직하게는 환경 분해 및 불활성화로부터의 살충제의 개선된 보호를 제공한다.

B.t. 포자 또는 재조합 숙주 세포는 또한 식물에 적용되거나 또는 식물에서 적용을 위해 제제화되기 전에 처리될 수 있다. 예를 들어, 단리된 B.t. 포자 및/또는 독소 결정은 살곤충 활성이 연장되도록 화학적으로 처리될 수 있고, 이에 의해 본 발명의 처리된 폴리펩티드를 포함한다 (미국 특허 번호 4,695,462 및 Gaertner et al., 1993).

수많은 미생물이 매우 다양한 중요한 작물의 엽면 (식물 잎의 표면) 및/또는 근권 (식물 뿌리 주위 토양)에 산다는 것이 알려져 있다. 이들 미생물은 박테리아, 조류, 및 진균을 포함한다. 특히 관심있는 것은 미생물, 예컨대 박테리아, 예를 들어 슈도모나스, 에르위니아(Erwinia), 세라티아(Serratia), 클레브시엘라(Klebsiella), 크산토모나스(Xanthomonas), 스트렙토미세스(Streptomyces), 리조비움(Rhizobium), 시노리조비움(Sinorhizobium), 로도슈도모나스(Rhodopseudomonas), 메틸로필리우스(Methylophilius), 아그로박테리움(Agrobacterium), 아세토박터(Acetobacter), 락토바실루스(Lactobacillus), 아르트로박터(Arthrobacter), 아조토박터(Azotobacter), 류코노스톡(Leuconostoc), 및 알칼리게네스(Alcaligenes) 속; 진균, 특히 효모, 예를 들어 사카로미세스(Saccharomyces), 크립토코쿠스(Cryptococcus), 클루이베로미세스(Kluyveromyces), 스포로볼로미세스(Sporobolomyces), 로도토룰라(Rhodotorula), 및 아우레오바시디움(Aureobasidium) 속이다. 특히 관심있는 것은 식물권 박테리아 종, 예컨대 슈도모나스 시린가에(Pseudomonas syringae), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 세라티아 마르세센스(Serratia marcescens), 아세토박터 크실리눔(Acetobacter xylinum), 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens), 아그로박테리움 라디오박터(Agrobacterium radiobacter), 로도슈도모나스 스페로이데스(Rhodopseudomonas spheroides), 크산토모나스 캄페스트리스(Xanthomonas campestris), 시노리조비움 멜리로티(Sinorhizobium meliloti) (이전에 리조비움 멜리로티(Rhizobium meliloti)), 알칼리게네스 유트로푸스(Alcaligenes eutrophus), 및 아조토박터 비네란디이(Azotobacter vinelandii); 식물권 효모 종, 예컨대 로도토룰라 루브라(Rhodotorula rubra), 알. 글루티니스(R. glutinis), 알. 마리나(R. marina), 알. 아우란티아카(R. aurantiaca), 크립토코쿠스 알비두스(Cryptococcus albidus), 씨. 디풀루엔스(C. diffluens), 씨. 라우렌티이(C. laurentii), 사카로미세스 로세이(Saccharomyces rosei), 에스. 프레토리엔시스 (S. pretoriensis), 에스. 세레비지아에(S. cerevisiae), 스포로볼로미세스 로세우스(Sporobolomyces roseus), 에스. 오도루스(S. odorus), 클루이베로미세스 베로나에(Kluyveromyces veronae), 및 아우레오바시디움 폴루란스(Aureobasidium pollulans)이다. 특히 관심있는 것은 유색 미생물이다.

본 발명의 바람직한 실시양태는 본 발명의 살곤충 단백질 또는 그의 변이체를 코딩하는 유전자를 사용한 식물의 형질전환이다. 형질전환 식물은 형질전환 식물의 세포내 방제량의 본 발명의 살곤충 단백질 또는 그의 변이체의 존재에 의해 곤충 표적 해충에 의한 공격에 대해 저항성을 갖는다. B.t. 살곤충 독소의 살곤충 특성을 코딩하는 유전 물질을 특정한 곤충 해충에 의해 섭취된 식물의 게놈에 도입함으로써, 성충 또는 유충은 먹이 식물을 소모한 후 사멸할 것이다. 단자엽 및 쌍자엽 분류의 수많은 구성원이 형질전환되었다. 트랜스제닉 농경 작물 뿐만 아니라 과일 및 채소가 상업적 관심 대상이다. 이러한 작물은 메이즈, 벼, 대두, 카놀라, 해바라기, 알팔파, 수수, 밀, 목화, 땅콩, 토마토, 감자 등을 포함하나, 이에 제한되지는 않는다. 외래 유전 물질을 단자엽 또는 쌍자엽 식물 세포 내로 도입하고 도입된 유전자를 안정하게 유지 및 발현하는 생식력 있는 식물을 수득하기 위한 여러 기술이 존재한다. 이러한 기술은 마이크로입자 상에 코팅된 유전 물질을 직접적으로 세포 내로 가속화하는 것을 포함한다 (미국 특허 4945050 및 5141131). 식물은 아그로박테리움 기술을 사용하여 형질전환될 수 있다 (미국 특허 5177010, 미국 특허 5104310, 유럽 특허 출원 0131624B1, 유럽 특허 출원 120516, 유럽 특허 출원 159418B, 유럽 특허 출원 176112, 미국 특허 5149645, 미국 특허 5469976, 미국 특허 5464763, 미국 특허 4940838, 미국 특허 4693976, 유럽 특허 출원 116718, 유럽 특허 출원 290799, 유럽 특허 출원 320500, 유럽 특허 출원 604662, 유럽 특허 출원 627752, 유럽 특허 출원 0267159, 유럽 특허 출원 0292435, 미국 특허 5231019, 미국 특허 5463174, 미국 특허 4762785, 미국 특허 5004863, 및 미국 특허 5159135 참조). 다른 형질전환 기술은 WHISKERS™ 기술을 포함한다 (미국 특허 5302523 및 미국 특허 5464765 참조). 전기천공 기술이 또한 식물을 형질전환하기 위해 사용될 수 있다 (WO 87/06614, 미국 특허 5472869, 미국 특허 5384253, WO9209696, 및 WO9321335 참조). 이들 형질전환 특허 및 공보는 모두 참조로 포함된다. 식물 형질전환을 위한 수많은 기술 뿐만 아니라, 외래 유전자와 접촉되는 조직의 유형이 또한 다양할 수 있다. 이러한 조직은 배아발생 조직, 제I형 및 제II형 캘러스 조직, 배축, 분열조직 등을 포함하나, 이에 제한되지는 않을 것이다. 거의 모든 식물 조직은 통상의 기술자의 기술 내에서 적절한 기술을 사용하여 탈분화 동안에 형질전환될 수 있다.

변형된 Cry1Ca 살곤충 독소 및 변이체를 코딩하는 유전자는 상기 개시된 바와 같이 관련 기술분야에 널리 공지된 다양한 기술을 사용하여 식물 세포 내로 삽입될 수 있다. 예를 들어, 형질전환 미생물 세포 및 이. 콜라이에서 기능하는 복제 시스템의 선택을 가능하게 하는 마커를 포함하는 수많은 클로닝 벡터가 고등 식물 내로의 삽입을 위한 외래 유전자의 제조 및 변형에 이용가능하다. 이러한 조작은, 예를 들어 의도된 용도에 목적되는 바와 같이 돌연변이의 삽입, 말단절단, 부가, 결실 또는 치환을 포함할 수 있다. 벡터는 예를 들어, pBR322, pUC 시리즈, M13mp 시리즈, pACYC184 등을 포함한다. 따라서, Cry 단백질 또는 변이체를 코딩하는 서열은 적합한 제한 부위에서 벡터 내로 삽입될 수 있다. 생성된 플라스미드는 이. 콜라이의 형질전환에 사용되며, 그의 세포는 적합한 영양 배지에서 배양된 다음, 수거되고, 작업가능한 양의 플라스미드가 회수되도록 용해된다. 서열 분석, 제한 단편 분석, 전기영동, 및 다른 생화학적-분자 생물학적 방법이 일반적으로 분석 방법으로서 수행된다. 각각의 조작 후에, 사용된 DNA 서열은 절단되어, 다음 DNA 서열에 연결될 수 있다. 각각의 조작된 DNA 서열은 동일한 또는 다른 플라스미드에서 클로닝될 수 있다.

식물 형질전환 방법에 따라, 보조 DNA 서열이 필요할 수 있다. 예를 들어, Ti 또는 Ri 플라스미드가 식물 세포의 형질전환에 사용되는 경우, Ti 또는 Ri 플라스미드의 적어도 T-DNA 우측 경계 반복부, 그러나 종종 우측 경계 반복부 및 좌측 경계 반복부 둘 다가, 삽입될 목적 유전자의 플랭킹 영역으로서 식물 세포내로 연결될 것이다. 식물 세포의 형질전환을 위한 T-DNA-함유 벡터의 용도가 집중적으로 연구되었고, EP 120516; 문헌 [Lee and Gelvin (2008), Fraley et al., (1986), 및 An et al., (1985)]에 충분히 기재되었고, 이는 관련 분야에 널리 확립되어 있다.

삽입된 DNA가 식물 게놈에 통합되면, 후속 세대 전반에 걸쳐 비교적 안정하다. 식물 세포를 형질전환시키는데 사용되는 벡터는 보통 형질전환 식물 세포에 제초제 또는 항생제, 예컨대 특히 비알라포스, 카나마이신, G418, 블레오마이신, 또는 히그로마이신에 대한 내성을 부여하는 단백질을 코딩하는 선택 마커 유전자를 함유한다. 개별적으로 사용되는 선택 마커 유전자는 따라서 형질전환 세포의 선택을 가능하게 해야 하고, 삽입된 DNA를 함유하지 않는 세포의 성장은 선택적 화합물에 의해 억제된다.

수많은 기술이 DNA를 숙주 식물 세포 내로 삽입하는데 이용가능하다. 이들 기술은 형질전환 작용제로서 아그로박테리움 투메파시엔스 또는 아그로박테리움 리조게네스(Agrobacterium rhizogenes)에 의해 전달되는 T-DNA로의 형질전환을 포함한다. 추가적으로, 전달될 DNA를 함유하는 리포솜과의 식물 원형질체의 융합, DNA의 직접 주입, 바이오리스틱 형질전환 (마이크로입자 충격), 또는 전기천공 뿐만 아니라 다른 가능한 방법이 사용될 수 있다. 식물 형질전환 분야의 통상의 기술자라면 다수의 방법론이 형질전환 식물의 생산에 이용가능하다는 점과, 그들이 다양한 숙주식물 종 사이의 생물학적 차이에 순응하도록 변형 및 특수화될 수 있다는 점을 이해할 것이다.

아그로박테리움 균주가 형질전환에 사용되는 경우, 삽입될 DNA는 특수 플라스미드, 즉 중간 (셔틀) 벡터 또는 이원 벡터 내로 클로닝될 것이다. 중간 벡터는 Ti 또는 Ri 플라스미드와 중간 플라스미드 사이에 상동인 서열로 인해 상동 재조합에 의하여 Ti 또는 Ri 플라스미드 또는 그의 유도체 내로 통합될 수 있다. Ti 또는 Ri 플라스미드는 또한 T-DNA의 전달에 필요한 vir 유전자를 포함하는 vir 영역을 포함한다. 중간 벡터는 아그로박테리아에서 복제될 수 없다. 중간 벡터는 헬퍼 플라스미드에 의해 (박테리아 접합을 통해), 전기천공에 의해, 화학적으로 매개되는 직접 DNA 형질전환에 의해, 또는 다른 방법론에 의해 아그로박테리움 투메파시엔스로 전달될 수 있다. 이원 벡터는 이. 콜라이 및 아그로박테리움 세포, 둘 다에서 자율적으로 복제될 수 있다. 이는 우측 및 좌측 T-DNA 경계 반복부 영역에 의해 프레이밍되며, 형질전환 식물 세포 선택을 위해 기능하는 선택 마커 유전자, 클로닝 링커, 클로닝 폴리링커, 또는 식물 세포 형질전환을 위해 예정된 유전자에 대한 도입 부위로서 기능할 수 있는 다른 서열을 포함할 수 있는 서열을 포함한다. 이들은 전기천공에 의해, 또는 직접 DNA에 의해 아그로박테리움 세포에 직접 형질전환되거나 (Holsters et al., (1978)), 화학적으로 매개되어 형질전환되거나, 또는 박테리아 접합에 의해 또는 다른 방법론에 의해 도입될 수 있다. 숙주 세포로서 사용된 아그로박테리움은 vir 영역을 수반하는 플라스미드를 포함해야 한다. 이러한 vir 영역은 T-DNA를 식물 세포 내로 전이시키는데 필요하다. B.t. 살곤충 독소 단백질 또는 그의 변이체를 코딩하는 유전자를 함유하는 것에 대해 부가적인 추가의 T-DNA 영역이 아그로박테리움 숙주 세포에 존재할 수 있다. 이와 같이 형질전환 박테리아는 식물 세포의 형질전환에 사용된다. 이롭게는, DNA를 식물 세포 내로 전달하기 위해 식물 외식편 (예를 들어, 잎 조각, 자루 절편, 뿌리 뿐만 아니라 원형질체 또는 현탁액-배양된 세포)이 아그로박테리움 투메파시엔스 또는 아그로박테리움 리조게네스와 함께 배양될 수 있다. 이어서, 형질전환 식물 세포의 선택을 위한 항생제 또는 제초제를 함유할 수 있는 적합한 성장 조건 및 배양 배지에 배치한 후, 감염된 식물 물질로부터 전체 식물을 재생시킬 수 있다. 이어서, 이와 같이 수득한 식물은 삽입된 DNA의 존재에 대해 시험될 수 있다.

형질전환 세포는 일반적 방식으로 식물 내부에서 성장한다. 이들은 배세포를 형성하고 형질전환 형질(들)을 자손 식물에 물려줄 수 있다. 이러한 식물은 보통의 방식으로 성장하고 동일한 형질전환 유전성 인자 또는 다른 유전성 인자를 갖는 식물과 교배될 수 있다. 생성되는 잡종 개체는 상응하는 표현형 특성, 예를 들어 식물 해충 곤충의 섭식 방제 능력을 갖는다.

주사 및 전기천공을 위해 사용되는 것의 경우에 플라스미드의 구축에 특별한 요구가 주어지지 않는다. 보편적 플라스미드, 예컨대, 예를 들어, 식물 세포로 전달될 목적 유전자 모두를 함유하도록 적절하게 변형된 pUC 유도체를 사용하는 것이 가능하다.

식물 세포 내로 삽입된 재조합 폴리뉴클레오티드의 활성은 삽입부에 인접한 내인성 식물 DNA의 영향에 의존할 수 있다. 따라서, 다른 옵션은 삽입을 위한 식물 게놈에서 탁월한 위치로 공지된 사례의 이점을 갖는다. Cry1F 및 Cry1Ac 목화 사례와 관련하여 예를 들어 WO 2005/103266 A1을 참조한다; 대상 B.t. 살곤충 독소 유전자가 이들 게놈 유전자좌에 Cry1F 또는 Cry1Ac 삽입물 대신 대체될 수 있다. 예를 들어 표적화된 상동 재조합이 본 발명에 따라 사용될 수 있다. 이러한 유형의 기술은 예를 들어, 표적화된 재조합을 위한 아연 핑거의 사용에 관련된 WO 03/080809 및 대응되는 공개 미국 출원 (USPA 20030232410)의 대상이다. 레콤비나제 (예를 들어 cre-lox 및 flp-frt)의 사용이 또한 관련 기술분야에 공지되어 있다.

본 발명의 바람직한 실시양태에서, 식물은 유전자로 형질전환될 것이며, 여기서 단백질 코딩 영역의 코돈 사용빈도는 식물에 대해 최적화되어 있다. 예를 들어, 본원에 참조로 포함된 미국 특허 번호 5,380,831을 참조한다. 또한, 유리하게는, 말단절단 독소를 코딩하는 식물이 사용될 것이다. 말단절단 독소는 전형적으로 전장 독소의 약 55% 내지 약 80%를 코딩할 것이다. 식물에서 사용하기 위한 합성 B.t. 유전자를 생성하는 방법은 관련 기술분야에 공지되어 있다 (Stewart 2007).

또 다른 변수는 선택 마커의 선택이다. 특정한 마커에 대한 선호는 통상의 기술자의 판단이지만, 하기의 선택 마커 중 임의의 것이 선택 마커로서 기능할 수 있는, 본원에 나열되지 않은 임의의 다른 유전자와 함께 사용될 수 있다. 이러한 선택 마커는 항생제 카나마이신, 네오마이신 및 G418에 대한 저항성을 코딩하는, 트랜스포손 Tn5의 아미노글리코시드 포스포트랜스퍼라제 유전자 (Aph II), 뿐만 아니라 글리포세이트; 히그로마이신; 메토트렉세이트; 포스피노트리신 (비알라포스), 이미다졸리논, 술포닐우레아 및 트리아졸로피리미딘 제초제, 예컨대 클로로술푸론, 브로목시닐, 달라폰 등에 대한 내성을 코딩하는 유전자를 포함하나, 이에 제한되지는 않는다. 이러한 유전자의 예는 본원에 참조로 포함된 문헌 [Merlo, (2002)]에 제공된다.

선택 마커 뿐만 아니라, 리포터 유전자를 사용하는 것이 바람직할 수 있다. 일부 경우에서, 리포터 유전자는 선택 마커 없이 사용될 수 있다. 리포터 유전자는 전형적으로 수용자 유기체 또는 조직에 성장 이점을 제공하지 않는 유전자이다. 리포터 유전자는 전형적으로 일부 표현형 변화 또는 효소 특성을 제공하는 단백질을 코딩한다. 바람직한 리포터 유전자는 글루쿠로니다제 (GUS) 유전자이다. 리포터 유전자의 다른 예는 문헌 [Merlo (2002)]에 제공된다.

형질전환 기술에도 불구하고, 유전자는 바람직하게는 벡터 내에 식물 프로모터를 포함함으로써 식물 세포에서 B.t. 살곤충 독소 유전자 및 변이체를 발현시키도록 구성된 유전자 전달 벡터에 도입된다. 식물 프로모터 뿐만 아니라, 다양한 공급원으로부터의 프로모터가 식물 세포에서 효율적으로 사용되어, 외래 유전자를 발현할 수 있다. 예를 들어, 박테리아 기원의 프로모터, 예컨대 옥토핀 신타제 프로모터, 노팔린 신타제 프로모터, 만노핀 신타제 프로모터; 바이러스 기원의 프로모터, 예컨대 콜리플라워 모자이크 바이러스의 35S 및 19S 프로모터 등이 사용될 수 있다. 식물 프로모터는 리불로스-1,6-비스포스페이트 (RUBP) 카르복실라제 소형 서브유닛 (ssu), 베타-콘글리시닌 프로모터, 파세올린 프로모터, ADH (알콜 데히드로게나제) 프로모터, 열-쇼크 프로모터, ADF (액틴 탈중합 인자) 프로모터, 및 조직 특이적 프로모터를 포함하나, 이에 제한되지는 않는다. 프로모터는 또한 전사 효율을 개선할 수 있는 특정 인핸서 서열 요소를 함유할 수 있다. 전형적인 인핸서는 ADH1-인트론 1 및 ADH1-인트론 6을 포함하나, 이에 제한되지 않는다. 구성적 프로모터가 사용될 수 있다. 구성적 프로모터는 거의 모든 세포 유형에서 거의 항상 연속 유전자 발현을 유도한다 (예를 들어, 액틴, 유비퀴딘, CaMV 35S). 조직 특이적 프로모터는 특정 세포 또는 조직 유형, 예컨대 잎 또는 종자에서의 유전자 발현 (예를 들어, 제인, 올레오신, 나핀, ACP (아실 담체 단백질))을 담당하며, 이들 프로모터가 또한 사용될 수 있다. 식물 발생의 특정 단계 동안에 활성인 프로모터 뿐만 아니라, 특정한 식물 조직 및 기관에서 활성인 프로모터가 또한 사용될 수 있다. 이러한 프로모터의 예는 뿌리 특이적, 화분-특이적, 배아 특이적, 옥수수 수염 특이적, 목화 섬유 특이적, 종자 내배유 특이적, 체관부 특이적 프로모터 등을 포함하나, 이에 제한되지는 않는다.

특정 환경 하에서 유도성 프로모터를 사용하는 것이 바람직할 수 있다. 유도성 프로모터는 특정 신호, 예컨대: 물리적 자극 (예를 들어, 열 쇼크 유전자); 광 (예를 들어, RUBP 카르복실라제); 호르몬 (예를 들어, 글루코코르티코이드); 항생제 (예를 들어, 테트라시클린); 대사물; 및 스트레스 (예를 들어, 가뭄)에 반응하는 유전자의 발현을 담당한다. 식물에서 기능하는 다른 바람직한 전사 및 번역 요소, 예컨대 5' 비번역 리더 서열, RNA 전사 종결 서열 및 폴리-아데닐레이트 부가 신호 서열이 사용될 수 있다. 수많은 식물-특이적 유전자 전달 벡터가 관련 기술분야에 공지되어 있다.

본 발명은 전능이지 않은 (비-전능) 식물 세포, 증식 물질이 아닌 식물 세포 (예를 들어, 일부 실시양태에서 잎 세포; 종자 세포는 일부 실시양태에서 제외됨), 및 전체 식물로 분화할 수 없는 식물 세포를 포함한다. 본 발명은 전체 식물로의 재생 이외의 용도를 갖는 식물 세포를 포함한다. 예를 들어, 상기 식물 세포는 단백질 (예컨대 본 발명의 DIG-465 단백질)을 생산하는데 사용될 수 있다. 따라서, 본 발명의 식물 세포는 전능성 이외의 용도를 갖는 것을 포함한다 (즉, 본 발명의 일부 세포는 전체 식물로 재생될 수 없음). 그러나, 일부 실시양태는 전체 식물로 재생될 수 있는 종자 세포 및 식물 세포를 포함한다.

본 발명의 독소 및 유전자를 확인하는 추가의 방법은 올리고뉴클레오티드 프로브의 사용을 통한 것이다. 이들 프로브는 검출가능한 뉴클레오티드 서열이다. 이들 서열은 적절한 방사능 표지에 의해 검출가능하게 될 수 있거나, 또는 미국 특허 번호 6268132에 기재된 바와 같이 내재적으로 형광성이 되게 할 수 있다. 관련 기술분야에 널리 공지된 바와 같이, 프로브 분자 및 핵산 샘플이 두 분자 사이에 강한 염기-쌍형성 결합을 형성함으로써 혼성화되는 경우, 프로브 및 샘플은 상당한 서열 상동성을 갖는 것으로 합리적으로 가정될 수 있다. 바람직하게는, 혼성화는, 예를 들어 문헌 [Keller and Manak (1993)]에 기재된 바와 같은, 관련 기술분야에 널리 공지된 기술에 의해 엄격한 조건 하에서 수행된다. 프로브의 검출은 혼성화가 일어났는지 여부를 공지된 방식으로 결정하기 위한 수단을 제공한다. 이러한 프로브 분석은 본 발명의 독소-코딩 유전자를 확인하는 신속한 방법을 제공한다. 본 발명에 따라 프로브로서 사용되는 뉴클레오티드 절편은 DNA 합성기 및 표준 절차를 사용하여 합성될 수 있다. 이들 뉴클레오티드 서열은 또한 본 발명의 유전자를 증폭시키기 위한 PCR 프라이머로서 사용될 수 있다.

본원에 사용된 용어 "엄격한 조건" 또는 "엄격한 혼성화 조건"은 프로브가 다른 서열에 혼성화되는 것보다 검출가능하게 더 큰 정도로 (예를 들어, 배경에 비해 적어도 2배) 그의 표적 서열에 혼성화될 (어닐링될) 조건을 지칭하는 것으로 의도된다. 엄격한 조건은 서열 의존성이며, 상이한 상황에 따라 다를 것이다. 혼성화 및/또는 세척 조건의 엄격성을 제어함으로써, 프로브에 100% 상보적인 표적 서열을 확인할 수 있다 (상동 프로빙). 다르게는, 엄격함 조건을 조절하여 서열에서 일부 미스매칭을 가능하게 하여, 보다 낮은 정도의 유사성이 검출되도록 한다 (이종 프로빙). 일반적으로, 프로브는 길이가 약 1000개 뉴클레오티드 미만, 바람직하게는 길이가 500개 뉴클레오티드 미만이다.

전형적으로, 엄격한 조건은 염 농도가 pH 7.0 내지 pH 8.3에서 Na 이온 약 1.5 M 미만, 전형적으로는 Na 이온 농도 (또는 다른 염) 약 0.01 내지 1.0 M이고, 온도가 짧은 프로브 (예를 들어, 10 내지 50개의 뉴클레오티드)에 대해서는 적어도 약 30℃이고, 긴 프로브 (예를 들어, 50개 초과의 뉴클레오티드)에 대해서는 적어도 약 60℃인 조건일 것이다. 엄격한 조건은 또한 포름아미드와 같은 탈안정화제를 첨가함으로써 달성될 수 있다. 예시적인 저 엄격도 조건은 37℃에서 30% 내지 35% 포름아미드, 1 M NaCl, 1% SDS (소듐 도데실 술페이트)의 완충제 용액을 사용한 혼성화, 및 50℃ 내지 55℃에서 1x 내지 2xSSC (20xSSC = 3.0 M NaCl/0.3 M 시트르산삼나트륨)에서의 세척을 포함한다. 예시적인 중간 정도의 엄격도 조건은 37℃에서 40% 내지 45% 포름아미드, 1.0 M NaCl, 1% SDS에서의 혼성화, 및 55℃ 내지 60℃에서 0.5x 내지 1xSSC에서의 세척을 포함한다. 예시적인 고 엄격도 조건은 37℃에서 50% 포름아미드, 1 M NaCl, 1% SDS에서의 혼성화, 및 60℃ 내지 65℃에서 0.1xSSC에서의 세척을 포함한다. 임의로, 세척 완충제는 약 0.1% 내지 약 1% SDS를 포함할 수 있다. 혼성화의 지속시간은 일반적으로 약 24시간 미만, 통상적으로 약 4 내지 약 12시간이다.

특이성은 전형적으로 혼성화후 세척의 함수이고, 결정적인 인자는 이온 강도 및 최종 세척 용액의 온도이다. DNA/DNA 하이브리드에 있어서, 열융점 (Tm)은 상보적 표적 서열의 50%가 완벽하게 매치된 프로브에 혼성화되는 온도 (정의된 이온 강도 및 pH 하에서)이다. Tm은 각각의 1%의 미스매칭에 대해 약 1℃만큼 감소하며; 따라서, Tm, 혼성화 조건 및/또는 세척 조건을 조정하여 목적 동일성의 서열의 어닐링을 용이하게 할 수 있다. 예를 들어, >90% 동일성을 갖는 서열이 목적되는 경우, Tm은 10℃ 감소할 수 있다. 일반적으로, 엄격한 조건은 정해진 이온 강도 및 pH에서 특정 서열 및 그의 상보체에 대한 Tm보다 약 5℃ 더 낮도록 선택된다. 그러나, 고도로 엄격한 조건은 Tm보다 1℃, 2℃, 3℃, 또는 4℃ 더 낮은 온도에서 혼성화 및/또는 세척을 사용할 수 있고; 중간 정도의 엄격한 조건은 Tm보다 6℃, 7℃, 8℃, 9℃, 또는 10℃ 더 낮은 온도에서 혼성화 및/또는 세척을 사용할 수 있고, 낮은 엄격한 조건은 Tm보다 11℃, 12℃, 13℃, 14℃, 15℃, 또는 20℃ 더 낮은 온도에서 혼성화 및/또는 세척을 사용할 수다.

Tm (℃)은 실험적으로 결정될 수 있거나 또는 계산에 의해 근사화될 수 있다. DNA-DNA 하이브리드에 있어서, Tm은 문헌 [Meinkoth and Wahl (1984)]의 식으로부터 근사화될 수 있다:

Tm (℃) = 81.5℃ + 16.6(log M) + 0.41(%GC) - 0.61(%포름아미드) - 500/L;

여기서, M은 1가 양이온의 몰농도이며, %GC는 DNA 중 구아노신 및 시토신 뉴클레오티드의 백분율이고, %포름아미드는 혼성화 용액 중 포름아미드의 백분율이며, L은 염기쌍 중 하이브리드의 길이이다.

대안적으로, 하기 식에 의해 Tm이 기재된다 (Beltz et al., 1983).

Tm (℃) = 81.5℃ + 16.6(log[Na+]) + 0.41(%GC) - 0.61(%포름아미드) - 600/L

여기서, [Na+]는 나트륨 이온의 몰농도이며, %GC는 DNA 중 구아노신 및 시토신 뉴클레오티드의 백분율이고, %포름아미드는 혼성화 용액 중 포름아미드의 백분율이며, L은 염기쌍 중 하이브리드의 길이이다.

상기 식, 혼성화 및 세척 조성물, 및 목적 Tm을 사용하여, 통상의 기술자는 혼성화 및/또는 세척 용액의 엄격도의 변동이 내재적으로 기재된다는 것을 이해할 것이다. 목적하는 정도의 미스매칭이 45℃ 미만의 Tm (수용액) 또는 32℃ 미만의 Tm (포름아미드 용액)을 발생시키는 경우, 보다 높은 온도가 사용될 수 있도록 SSC 농도를 증가시키는 것이 바람직하다. 핵산의 혼성화에 대한 광범위한 안내를 문헌 [Tijssen (1993) 및 Ausubel et al., (1995)]에서 찾아볼 수 있다. 문헌 [Sambrook et al., (1989)]을 또한 참조한다.

고정된 DNA가 방사성 표지된 유전자-특이적 프로브와 서던 블롯 상에서 혼성화되는 것이 표준 방법에 의해 수행될 수 있다 ([Sambrook et al., 상기 문헌]). 폴리뉴클레오티드 프로브의 표지에 사용되는 방사성 동위원소는 32P, 33P, 14C, 또는 3H를 포함할 수 있다. 폴리뉴클레오티드 프로브 분자 내로의 방사성 동위원소의 혼입은 분자 생물학 분야의 통상의 기술자에게 널리 공지된 여러 방법 중 임의의 것에 의해 이루어질 수 있다. (예를 들어, [Sambrook et al., 상기 문헌] 참조). 일반적으로, 혼성화 및 후속 세척은 본 발명의 독소 코딩 유전자에 대하여 상동성을 갖는 표적 서열의 검출을 허용하는 엄격한 조건 하에 실시될 수 있다. 이중-가닥 DNA 유전자 프로브에 대해, 6X SSPE, 5X 덴하르트(Denhardt) 용액, 0.1% SDS, 0.1 ㎎/mL 변성 DNA에서 DNA 하이브리드의 Tm보다 20℃-25℃ 낮은 온도에서 밤새 혼성화가 수행될 수 있다 [20X SSPE는 3M NaCl, 0.2 M NaHPO4, 및 0.02M EDTA (에틸렌디아민 테트라-아세트산 나트륨 염)이고; 100X 덴하르트 용액은 20 gm/L 폴리비닐피롤리돈, 20 gm/L 피콜(Ficoll) 유형 400 및 20 gm/L 소 혈청 알부민 (분획 V)이다].

세척은 전형적으로 하기와 같이 실시될 수 있다:

(1) 실온에서 15분 동안 1X SSPE, 0.1% SDS에서 2회 (저 엄격도 세척).

(2) Tm -20℃에서 15분 동안 0.2X SSPE, 0.1% SDS에서 1회 (중간 정도의 엄격도 세척).

올리고뉴클레오티드 프로브에 대해, 6X SSPE, 5X 덴하르트 용액, 0.1% SDS, 0.1 mg/mL 변성 DNA에서 하이브리드의 Tm보다 10-20℃ 낮은 온도에서 밤새 혼성화가 수행될 수 있다. 올리고뉴클레오티드 프로브에 대한 Tm은 하기 식에 의해 결정할 수 있다 (Suggs et al., 1981).

Tm (℃ ) = 2(T/A 염기 쌍의 수) + 4(G/C 염기 쌍의 수)

세척은 전형적으로 하기와 같이 실시될 수 있다:

(2) 혼성화 온도에서 15분 동안 1X SSPE, 0.1% SDS에서 1회 (중간 정도의 엄격도 세척).

관련 기술분야의 숙련자는 혼성화를 위한 프로브 분자 및 프로브와 표적 분자 사이에 형성된 하이브리드 분자가 방사성 표지 이외의 수단에 의해 검출가능하게 될 수 있음을 알 것이다.

변이체 독소. 본 발명에 따른 유용한 유전자 및 독소는 개시된 말단절단 서열 뿐만 아니라 전장 서열, 이들 서열의 단편, 변이체, 돌연변이체 및 본원에 구체적으로 예시된 독소의 특징적 살충 활성을 보유한 융합 단백질을 포함한다. 본원에 사용된 용어 유전자의 "변이체" 또는 "변이"는 동일한 독소를 코딩하거나 살충 활성을 갖는 등가의 독소를 코딩하는 뉴클레오티드 서열을 지칭한다. 추가로 본원에 사용된 용어 "등가의 독소"는 표적 해충에 대해 본 발명의 독소와 동일하거나 본질적으로 동일한 생물학적 활성을 갖는 독소를 지칭한다. 따라서, 본 발명의 독소의 변이체 또는 변이는 본 발명의 독소의 활성의 적어도 약 30%, 바람직하게는 적어도 약 50%, 보다 바람직하게는 적어도 약 70%, 보다 더 바람직하게는 적어도 약 80%를 가질 것이다. 살충 활성을 측정하는 방법은 관련 기술분야에 널리 공지되어 있으며, 본원에 예시된다. "변이체"는 본원에서 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40의 아미노산 서열에 대해 적어도 약 60%, 65%, 바람직하게는 약 70%, 75%, 보다 바람직하게는 약 80%, 85%, 가장 바람직하게는 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 갖는 단백질 또는 폴리펩티드를 포함하도록 의도된다. 변이체는 또한 염격한 조건 하에 서열식별번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 또는 39, 또는 그의 상보체의 핵산 분자에 혼성화되는 핵산 분자에 의해 코딩되는 폴리펩티드를 포함한다. 이러한 변이체는 일반적으로 청구된 활성을 유지할 것이다. 변이체는 돌연변이 유발로 인해 아미노산 서열이 상이한 폴리펩티드를 포함한다. 본 발명에 의해 포괄되는 변이체 단백질은 살충 활성이다.

1차 아미노산 서열 수준에서는 상이하지만 동일한 또는 유사한 전체 본질적 3차원 구조, 표면 전하 분포 등을 보유하는 변이체 단백질이 또한 설계될 수 있다. 예를 들어 미국 특허 번호 7,058,515; 문헌 [Larson et al., (2002); Crameri et al., (1997); Stemmer, W. P .C. (1994a); Stemmer, W. P .C. (1994b) " Stemmer, W. P. C. (1995); Crameri et al., (1996a); 및 Crameri et al., (1996b)]을 참조한다.

본 발명의 특정 독소가 본원에 구체적으로 예시된다. 이들 독소는 단지 본 발명의 독소의 예시이므로, 본 발명이 예시된 독소와 동일한 또는 유사한 살충 활성을 갖는 변이체 또는 등가의 독소 (및 등가의 독소를 코딩하는 뉴클레오티드 서열)를 포함한다는 것이 용이하게 명백해질 것이다. 등가의 독소는 예시된 독소와 아미노산 상동성을 가질 것이다. 아미노산 동일성은 전형적으로 60% 초과, 바람직하게는 75% 초과, 보다 바람직하게는 80% 초과, 보다 바람직하게는 90% 초과일 것이며, 95% 초과일 수 있다. 아미노산 상동성은 생물학적 활성을 설명하거나 또는 궁극적으로 생물학적 활성을 담당하는 3차원 구조의 결정에 관련된 독소의 임계 영역에서 가장 높을 것이다. 이와 관련하여, 특정 아미노산 치환이 허용가능하고, 이들 치환이 활성에 중요하지 않은 영역에 있거나 분자의 3차원 구조에 영향을 미치지 않는 보존적 아미노산 치환인 경우에 예상될 수 있다. 예를 들어, 아미노산은 하기 부류로 분류될 수 있다: 비극성, 비하전된 극성, 염기성 및 산성. 한 부류의 아미노산이 동일한 유형의 또 다른 아미노산으로 교체되는 보존적 치환은 치환이 화합물의 생물학적 활성을 실질적으로 변경시키지 않는 한 본 발명의 범위 내에 포함된다. 표 1은 각각의 부류에 속하는 아미노산의 예의 목록을 제공한다.

표 1

아미노산의 부류 및 예.

일부 경우, 비-보존적 치환이 이루어질 수도 있다. 결정적 인자는 이들 치환이 독소의 생물학적 활성을 유의하게 손상시키지 않아야 한다는 것이다.

본 발명의 바람직한 살곤충 독소 단백질은 서열식별번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 또는 39의 뉴클레오티드 서열에 대해 충분히 동일한 뉴클레오티드 서열에 의해 코딩된다. "충분히 동일한"은 아미노산 또는 뉴클레오티드 서열이 표준 파라미터를 사용하여 본원에 기재된 정렬 프로그램 중 하나로 분석시에 참조 서열과 비교하여 적어도 약 60% 또는 65% 서열 동일성, 바람직하게는 약 70% 또는 75% 서열 동일성, 보다 바람직하게는 약 80% 또는 85% 서열 동일성, 가장 바람직하게는 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 것을 의도한다. 관련 기술분야의 통상의 기술자는 이들 값이, 코돈 축중성, 아미노산 유사성, 리딩 프레임 위치 설정 등을 고려함으로써 2개의 뉴클레오티드 서열에 의해 코딩된 단백질의 상응하는 동일성을 결정하기 위해 적절하게 조정될 수 있다는 것을 인식할 것이다.

2개의 아미노산 서열의 또는 2개의 핵산 서열의 동일성 퍼센트를 결정하기 위하여, 서열을 최적의 비교 목적을 위해 정렬한다. 2개의 서열 사이의 동일성 퍼센트는 서열에 의해 공유된 동일한 위치의 수의 함수이다 (즉, 동일성 퍼센트 = 동일한 위치의 수/위치 (예를 들어, 중첩 위치)의 총수 x100). 한 실시양태에서, 2개의 서열은 길이가 동일하다. 2개의 서열 사이의 동일성 퍼센트는 갭을 허용하거나 허용하지 않으면서, 하기 기재된 것들과 유사한 기술을 이용하여 결정될 수 있다. 동일성 퍼센트의 계산에서, 전형적으로 정확한 매치를 계수한다.

2개의 서열 사이의 동일성 퍼센트의 결정은 수학적 알고리즘을 이용하여 달성될 수 있다. 2개의 서열의 비교에 사용된 수학적 알고리즘의 비제한적 예는 문헌 [Karlin and Altschul (1990)]의 알고리즘이며, 문헌 [Karlin and Altschul (1993)]에서와 같이 변형되었다. 이러한 알고리즘은 문헌 [Altschul et al., (1990)]의 BLASTN 및 BLASTX 프로그램에 혼입된다. BLAST 검색은 핵산 또는 단백질 데이터베이스에서 질의 서열과 상동인 (유사한) 서열을 확인하는데 편리하게 사용될 수 있다. BLAST 뉴클레오티드 검색이 BLASTN 프로그램, 점수 = 100, 워드 길이 = 12로 수행되어, 본 발명의 청구된 핵산 분자에 대해 상동성을 갖는 뉴클레오티드 서열이 확인될 수 있다. BLAST 단백질 검색이 BLASTX 프로그램, 점수 = 50, 워드 길이 = 3으로 수행되어, 본 발명의 청구된 살곤충 단백질 분자에 대한 상동성을 갖는 아미노산 서열이 확인될 수 있다.

비교 목적으로 갭이 있는 정렬을 수득하기 위해, 갭드(Gapped) BLAST가 문헌 [Altschul et al., (1997)]에 기재된 바와 같이 사용될 수 있다. 대안적으로, PSI-Blast를 사용하여 분자 사이의 먼 관계를 검출하는 반복 검색을 수행할 수 있다 (Altschul et al., (1997)). BLAST, 갭드 BLAST 및 PSI-Blast 프로그램을 사용하는 경우, 각 프로그램 (예를 들어, BLASTX 및 BLASTN)의 디폴트 파라미터가 사용될 수 있다. www.ncbi.nlm.nih.gov를 참조한다. 정렬은 또한 검사에 의해 수동으로 수행될 수 있다.

서열 비교에 사용되는 수학적 알고리즘의 비제한적 예는 클러스탈W(ClustalW) 알고리즘이다 (Thompson et al., (1994)). 클러스탈W는 서열을 비교하고, 아미노산 또는 DNA 서열의 전체를 정렬하고, 그에 따라 전체 아미노산 서열 또는 뉴클레오티드 서열의 서열 보존에 관한 데이터를 제공할 수 있다. 클러스탈W 알고리즘은 여러 개의 상업적으로 입수가능한 DNA/아미노산 분석 소프트웨어 패키지, 예컨대 벡터 NTI 프로그램 스위트(Vector NTI Program Suite) (인비트로젠, 인크.(Invitrogen, Inc.), 캘리포니아주 칼스배드)의 ALIGNX 모듈에서 사용된다. 아미노산 서열을 ALIGNX로 정렬한 경우, 갭 개방 페널티 10, 갭 연장 페널티 0.1 및 blosum63mt2 비교 매트릭스를 갖는 디폴트 설정을 편리하게 사용할 수 있다. 2개의 단백질 서열을 ALIGNX로 정렬한 후에, 2개의 서열 사이의 아미노산 유사성 (컨센서스) 또는 동일성 퍼센트가 평가될 수 있다. 2개의 DNA 서열을 ALIGNX로 정렬한 경우, 갭 개방 페널티 15, 갭 연장 페널티 6.6 및 swgapdnamt 비교 매트릭스를 갖는 디폴트 설정을 편리하게 사용할 수 있다. 2개의 DNA 서열을 ALIGNX로 정렬한 후에, 2개의 서열 사이의 동일성 퍼센트가 평가될 수 있다.

클러스탈W 정렬의 분석에 유용한 소프트웨어 프로그램의 제2 비제한적 예는 GeneDoc™이다 (칼 니콜라스(Karl Nicholas)에 의해 개발됨, http://iubio.bio.indiana.edu/soft/molbio/ibmpc/genedoc-readme.html). GeneDoc™은 다수의 단백질 사이의 아미노산 (또는 DNA) 유사성 및 동일성의 평가를 가능하게 한다.

서열의 비교에 사용되는 수학적 알고리즘의 또 다른 비제한적 예는 문헌 [Myers and Miller (1988)]의 알고리즘이다. 이러한 알고리즘은 wEMBOSS 서열 정렬 소프트웨어 패키지 (http://emboss.sourceforge.net/에서 입수가능함)의 일부인 wSTRETCHER 프로그램에 포함된다. STRETCHER은 선형 공간을 사용하는 전형적인 동적 프로그래밍 알고리즘의 변형을 사용하여 2개의 서열의 최적 전체 정렬을 계산한다. 출력은 표준 정렬 파일이다. 정렬의 계산에 사용되는 치환 매트릭스, 갭 삽입 페널티 및 갭 연장 페널티는 명시될 수 있다. 뉴클레오티드 서열의 비교를 위해 STRETCHER 프로그램을 사용할 때, 갭 개방 페널티 16 및 갭 연장 페널티 4가 사용될 수 있다. DNA 서열을 비교하기 위한 점수화 매트릭스 파일은 EDNAFULL이다. 아미노산 서열의 비교에 사용될 때, 갭 개방 페널티 12 및 갭 연장 페널티 2가 사용될 수 있다. 단백질 서열을 비교하기 위한 점수화 매트릭스 파일은 EBLOSUM62이다.

서열의 비교에 사용되는 수학적 알고리즘의 추가의 비제한적 예는 문헌 [Needleman and Wunsch (1970)]의 알고리즘이며, 이는 서열 정렬 소프트웨어 패키지 갭(GAP) 버전 10 및 wNEEDLE (http://emboss.sourceforge.net/)에 혼입된다. 갭 버전 10은 하기 파라미터를 사용하여 서열 동일성 또는 유사성을 결정하는데 사용될 수 있다: 뉴클레오티드 서열의 경우, % 동일성 및 % 유사성은 갭 가중치 50 및 길이 가중치 3, 및 nwsgapdna. cmp 점수화 매트릭스를 사용하여 확인된다. 아미노산 서열 비교의 경우, % 동일성 및 % 유사성은 갭 가중치 8 및 길이 가중치 2, 및 BLOSUM62 점수화 프로그램을 사용하여 결정된다. wNEEDLE는 2개의 입력 서열을 판독하고, 그의 전체 길이를 따라 최적 정렬 (갭 포함)을 찾아내고, 그의 최적 전체 서열 정렬을 파일에 기록한다. 알고리즘은 모든 가능한 정렬을 찾아내어 최선의 것을 선택함으로써 정렬이 최적이 되도록 하는 동적 프로그래밍 방법을 사용한다. 모든 가능한 잔기 또는 뉴클레오티드 매치에 대한 값을 함유하는 점수화 매트릭스가 판독된다. wNEEDLE는 최대의 가능한 점수를 갖는 정렬을 찾아내며, 여기서 정렬의 점수는 점수화 매트릭스로부터 취해진 매치의 합에서 정렬된 서열 내의 갭의 개방 및 연장에서 생기는 페널티를 차감한 것과 동일하다. 치환 매트릭스 및 갭 개방 및 연장 페널티는 사용자-명시된다. 아미노산 서열이 비교될 때, 디폴트 갭 개방 페널티 10, 갭 연장 페널티 0.5, 및 EBLOSUM62 비교 매트릭스가 사용된다. DNA 서열을 wNEEDLE를 사용하여 비교한 경우, 갭 개방 페널티 10, 갭 연장 페널티 0.5, 및 EDNAFULL 비교 매트릭스가 사용된다.

등가의 프로그램이 또한 사용될 수 있다. "등가의 프로그램"은 임의의 2개의 당해 서열에 대해, ALIGNX, wNEEDLE, 또는 wSTRETCHER에 의해 생성된 상응하는 정렬과 비교한 경우 동일한 뉴클레오티드 잔기 매치 및 동일한 서열 동일성 퍼센트를 갖는 정렬을 생성시키는 임의의 서열 비교 프로그램을 의도한다. % 동일성은 보고된 정렬된 영역 (길이에서 임의의 갭을 포함함) 상에서의 2개의 서열 사이의 동일한 매치의 백분율이고, % 유사성은 보고된 정렬된 영역 (길이에서 임의의 갭을 포함함) 상에서의 2개의 서열 사이의 매치의 백분율이다.

독소 단편 및 등가물. 예시적인 독소의 살충 활성을 보유하는 단편 및 등가물은 본 발명의 범위 내에 포함될 것이다. 또한, 유전자 코드의 축중성으로 인해, 다양한 상이한 DNA 서열이 본원에 개시된 아미노산 서열을 코딩할 수 있다. 동일한, 또는 본질적으로 동일한 독소를 코딩하는 이들 대안적 DNA 서열을 생성하는 것은 관련 기술분야의 숙련된 통상의 기술자의 기술 내에 충분히 포함된다. 이들 변이체 DNA 서열은 본 발명의 범위 내에 포함된다. 본원에 사용된 "본질적으로 동일한" 서열의 언급은 살충 활성에 실질적으로 영향을 미치지 않는 아미노산 치환, 결실, 부가 또는 삽입을 갖는 서열을 지칭한다. 살충 활성을 보유한 단편이 이 정의에 또한 포함된다.

변경은 생물학적 활성을 유지하는 폴리펩티드를 발생시키도록 본 발명의 살곤충 단백질 및 변이체의 아미노 또는 카르복시 말단에서 만들어질 수 있다. 단편 또는 생물학적 활성 부분은 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40에 제시된 아미노산 서열과 충분히 동일한 아미노산 서열을 포함하는 폴리펩티드 단편을 포함한다. 델타 내독소 단백질의 생물학적 활성 부분은 길이가 예를 들어 10, 25, 50, 100개 또는 그 초과의 아미노산인 폴리펩티드일 수 있다. 이러한 생물학적 활성 부분은 관련 기술분야에 널리 공지된 재조합 단백질 조작 기술에 의해 제조될 수 있고, 살곤충 활성에 대해 평가될 수 있다. 살충 활성을 측정하는 방법은 관련 기술분야에 널리 공지되어 있다. 본원에 사용된 단편은 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40의 적어도 8개의 인접 아미노산을 포괄한다. 그러나, 본 발명은 다른 단편, 예컨대 약 10, 20, 30, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100 ,1150, 또는 1200개 초과의 아미노산, 최대로 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40의 살곤충 단백질 또는 변이체 단백질의 전장까지의 단백질 내의 임의의 단편을 포괄한다.

개선된 생물학적 활성, 해충 스펙트럼 또는 저항성 곤충 집단을 방제하는 능력을 갖는 단편이 또한 본 발명에 제공된다. 변형은 개선된 포어 형성 및 이에 의해 살충 활성을 갖는 단편이 생산되도록 Cry 단백질에 대해 이루어질 수 있다. 3-도메인 Cry 단백질의 경우, 도메인 1은 감수성 곤충의 중장에서 포어 형성에 관여하는 7개의 α-나선으로 구성된다. 개선된 활성을 갖는 변형된 DIG 단백질은 도메인 1의 α-헬릭스 1 및 α-헬릭스 2에 대해 추정 2차 구조 상동성을 갖는 영역에 N-말단 결실을 갖도록 설계될 수 있다.

이들 독소의 활성 단편을 직접적으로 수득하기 위하여 프로테아제가 사용될 수 있다. 본 발명의 살곤충 독소의 단편은 적어도 약 15, 25, 30, 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 800, 900, 1000, 1100 또는 1200개의 인접 아미노산, 또는 최대로 본 발명의 전장 살곤충 독소 내에 존재하는 총 개수의 아미노산 (예를 들어, 서열식별번호: 2의 경우 625개 아미노산 또는 서열식별번호: 4의 경우 625개 아미노산)을 포함할 것이다.

코어 독소 및 전독소 키메라. 대다수의 바실루스 투린기엔시스 델타-내독소 결정 단백질 분자는 2개의 기능적 절편으로 구성된다. 프로테아제-저항성 코어 독소는 제1 절편이고, 단백질 분자의 약 제1 절반부에 상응한다. 분자의 대략 C-말단 절반부가 제2 절편이다. 본 출원의 목적을 위해, 이 제2 절편은 "전독소 절편"으로서 본원에 지칭될 것이다. 전독소 절편은 독소 결정 형성에 참여하는 것으로 여겨진다 (Arvidson et al., (1989)). 전체 130 kDa의 독소 분자는 곤충의 장에서 프로테아제에 의해 저항성 코어 절편으로 신속하게 프로세싱된다. 따라서 전독소 절편은 독소 분자의 프로테아제 프로세싱을 감소시킴으로써 (Haider et al., (1986)) 또는 독소 용해도를 감소시킴으로써 (Aronson et al., (1991)) 곤충에 대한 코어의 접근성을 제한함으로써 독소에 대한 부분적 곤충 특이성을 전달할 수 있다.

Cry1Fa와 Cry1Ab의 독소 도메인 내에서 유리하게 연결된 키메라 단백질이 보고되었다 (미국 특허 번호 5,527,883). 구역 내의 다른 성공도 문헌에서 보고되었다. 예를 들어, 하이브리드 델타-내독소의 구축이 하기 관련 기술분야에서 보고된다. 국제 특허 출원 공개 번호 WO 95/30753은 Cry1F의 비-독성 전독소 단편이 미국 특허 번호 5,128,130에 개시된 Cry1Ac/Cry1Ab로부터의 비-독성 전독소 단편으로 대체된 슈도모나스 플루오레센스에서의 생산을 위한 하이브리드 비. 투린기엔시스 델타-내독소의 구축을 개시한다. 그 특허는 또한 Cry1Ac의 비-독성 전독소 절편의 부분이 Cry1Ab의 상응하는 비-독성 전독소 단편으로 대체된 피. 플루오레센스에서의 생산을 위한 하이브리드 비. 투린기엔시스 델타-내독소의 구축을 개시한다. 미국 특허 번호 5,055,294는 피. 플루오레센스에서의 생산을 위한 Cry1Ac (아미노산 잔기 1-466)와 Cry1Ab (아미노산 잔기 466-1155) 사이의 특정 하이브리드 델타-내독소의 구축을 개시한다. 상기 언급된 특허는 활성 독소 절편 내의 하이브리드 독소의 구축은 개시하였으나, 하이브리드 독소의 살곤충 활성과 관련하여 어떠한 구체적 내용도 제시하지 않았다. 국제 특허 출원 공개 번호 WO 95/30752는 Cry1C의 비-독성 전독소 절편이 Cry1Ab로부터의 비-독성 전독소 절편으로 대체된 피. 플루오레센스에서의 생산을 위한 하이브리드 비. 투린기엔시스 델타-내독소의 구축을 개시한다. 상기 언급된 출원은 하이브리드 델타-내독소의 스포도프테라 엑시구아에 대한 활성이 모 활성 독소, Cry1C의 것보다 개선됨을 추가로 개시한다. 국제 특허 출원 공개 번호 WO 95/06730은 도메인 3에 커플링된 Cry1E의 도메인 1 및 2 및 Cry1C의 비-독성 전독소 절편으로 이루어진 하이브리드 비. 투린기엔시스 델타-내독소의 구축을 개시한다. 만두카 섹타 (Cry1C 및 Cry1E에 대해 감수성임), 스포도프테라 엑시구아 (Cry1C에 대해 감수성임) 및 마메스트라 브라시카에 (Cry1C에 대해 감수성임)에 대해 수행된 곤충 생물검정은 Cry1E/Cry1C 하이브리드 독소가 엠. 섹타, 에스. 엑시구아 및 엠. 브라시카에에 대해 활성임을 보여준다. 생물검정 결과는 LC₅₀ 값 (50% 사망률을 제공하는 독소 농도)보다는 EC₅₀ 값 (50% 성장 감소를 제공하는 독소 농도)으로 표현되었다. 생물검정에 사용된 델타-내독소가 비. 투린기엔시스에서 생산되었을지라도, 오직 델타-내독소의 인공-생성 활성 절편이 이용되었으며, 상업적 비. 투린기엔시스 제제에 존재하는 비. 투린기엔시스에 의해 전형적으로 생산된 자연-생산된 결정은 이용되지 않았다. 생물검정 결과는 에스. 프루기페르다에 대해 하이브리드 Cry1E/Cry1C 결정의 LC₅₀ 값이 본래 Cry1C보다 1.5 내지 1.7배 더 낮다는 것을 (즉, 보다 활성임을) 나타내었다. 하이브리드 독소의 활성 또는 유용성와 관련하여 데이터가 제공되지는 않았으나, 이 기술은 또한 Cry1Ab (도메인 1 및 2) 및 Cry1C (도메인 3 및 비-독성 전독소 절편) 사이의 하이브리드 비. 투린기엔시스 델타-내독소의 구축을 개시한다.

문헌 [Lee et al., (1995)]은 활성 독소 절편 내의 Cry1Ac와 Cry1Aa 사이의 하이브리드 비. 투린기엔시스 델타-내독소의 구축을 보고한다. 하이브리드 독소의 인공 생성 활성 절편이 감수성 곤충 솔가장자리 막 소포 (BBMV)에서의 단백질 상호작용을 시험하는데 사용되었다. 하이브리드 독소의 생물활성은 보고되지 않았다. 문헌 [Honee et al., (1991)]은 Cry1C (도메인 1)와 Cry1Ab (도메인 2 및 3) 사이의 하이브리드 델타-내독소 및 Cry1Ab (도메인 1)와 Cry1C (도메인 2 및 3) 사이의 상호 하이브리드의 구축을 보고한다. 이들 하이브리드는 감수성 곤충에 대한 활성의 임의의 유의한 증가를 보여주는데 실패하였다. 게다가, Cry1C (도메인 1)/Cry1Ab (도메인 2 및 3) 하이브리드 독소는 프로테아제 분해에 대해 과다감수성인 것으로 밝혀졌다. 감수성 곤충 유충에 대해 활성의 어떠한 유의한 증가도 관찰되지 않았으나, 문헌 [Schnepf et al., (1990)]의 보고는 도메인 2의 작은 부분이 Cry1Aa의 상응하는 영역으로 대체된 Cry1Ac 하이브리드 독소의 구축을 개시한다.

본 발명의 키메라 독소는 B.t. 독소의 전체 코어 N-말단 독소 부분을 포함하고, 독소 부분의 말단을 지난 일부 지점에서 단백질은 이종 전독소 서열로의 전이를 갖는다. 이종 전독소 절편으로의 전이는 대략 천연 독소/전독소 접합부에서 발생할 수 있거나, 또는 천연 전독소의 부분 (독소 부분을 지나 연장됨)이 하류에서 발생하는 이종 전독소로의 전이와 함께 유지될 수 있다. 예를 들어, 본 발명의 키메라 독소는 변형된 Cry1Ca 독소, 예컨대 DIG-473 또는 DIG-465의 아미노산 1-628의 전체 독소 부분 및 이종 전독소 절편 (아미노산 629에서 C-말단까지)을 가질 수 있다. 바람직한 실시양태에서, 이종 전독소 절편 부분은 Cry1Ab로부터 가져온다.

관련 기술분야의 통상의 기술자라면, 심지어 특정 부류 내의 B.t. 독소가 길이 및 코어 독소 부분으로부터 전독소 부분으로의 정확한 전이 위치가 어느 정도 달라질 것임을 이해할 것이다. 코어 독소 부분에서 전독소 부분으로의 전이는 전형적으로 전장 독소의 약 50% 내지 약 60%에서 일어날 것이다. 본 발명의 키메라 독소는 이 코어 N-말단 독소 부분의 전체 연장부를 포함하고, 이는 IRDIG544.12 살곤충 독소 단백질의 전체 628개 아미노산 길이이다. 본 발명의 한 실시양태에서 서열식별번호: 15는 DIG-465-코딩 DNA의 1887개 뉴클레오티드 서열을 개시하며, 그의 5'-말단 1887개 뉴클레오티드는 돌연변이 L57A (아미노산 위치 57에 있는 류신이 알라닌으로 치환됨)를 갖는 Cry1Ca의 코어 독소 절편에 대한 코딩 영역을 포함한다. 서열식별번호: 16은 전장 DIG-465의 폴리펩티드 628개 아미노산 서열을 개시하며, Cry1Ca의 N-말단 코어 부분은 상기 언급된 아미노산 치환을 갖는다. 본 발명의 또 다른 대상에서 서열식별번호: 23은 돌연변이 F596M (아미노산 위치 596에 있는 페닐알라닌이 메티오닌으로 치환됨)을 갖는 Cry1Ca의 코어 독소 절편에 대한 코딩 영역을 포함하는 DIG-473-코딩 DNA의 1887개 뉴클레오티드 서열을 개시한다. 서열식별번호: 24는 상기 언급된 아미노산 치환을 갖는 Cry1Ca의 부분을 포함하는 전장 DIG-473 폴리펩티드의 628개 아미노산 서열을 개시한다.

전독소 부분과 관련하여, 천연 Cry1Ab 전독소 부분의 전체 연장부는 Cry1Ab 전장 단백질의 독소 부분의 말단으로부터 분자의 C-말단까지 연장된다. 이 전독소의 마지막의 약 100 내지 150개 아미노산이 주의를 끌며, 이를 본 발명의 키메라 독소 내에 포함시키는 것이 중요하다.

Cry 단백질이 선택적 살곤충 활성을 가지고 있기 때문에, 대부분은 제한된 범위의 표적 해충에 대해 활성이다. 따라서, Cry 단백질의 생물학적 활성 특성을 추가로 개선시킬 필요가 있다. 특유한 결합 특성 및 작용 방식을 갖는 Cry 단백질이 방제되는 곤충 해충의 범위를 확대하거나 B.t. 저항성 발생에 대항하기 위한 전략에 유용하다.

도메인 III 변형. 본원에 기재된 바와 같이, 본 발명의 B.t. 살곤충 독소는 3-도메인 유형 독소이고, 도메인 I, 도메인 II 및 도메인 III를 포함한다. 도메인 III는 특정 부류의 수용체 단백질에 결합하며, 아마도 올리고머 독소 프리-포어의 삽입에 참여할 것이다. 도메인 III 치환을 포함하는 특정 하이브리드 독소는 스포돕테라 엑시구아에 대해 우수한 독성을 갖는 것으로 밝혀졌으며 (de Maagd et al., 1996), Cry 독소 도메인 교환의 설계에 대한 지침이 존재한다 (Knight et al., 2004).

도메인 I 변형. 생화학적 및 분자 접근법을 사용하는 수많은 연구는 Cry 단백질 결합 및 곤충 중장 막으로의 삽입의 결정자에 관한 정보를 제공하였다 (문헌 [Piggot and Ellar, 2007]에서 검토됨). Cry1A 및 Cry3A 단백질로부터의 도메인 I이 막에서의 삽입 및 포어 형성 능력에 대해 연구되었다. 도메인 I의 α-나선 4 및 5가 막 삽입 및 포어 형성에서 중요한 역할을 하고 (Walters et al., 1993, Gazit et al., 1998; Nunez-Valdez et al., 2001), 이때 다른 나선은 우산살과 같이 막 표면과 접촉하는 것으로 제안되었다 (Gazit et al., 1998).

알파-나선 3은 일부 경우에 올리고머 프리-포어 형성 및 독성에 요구되는 것으로 보인다. 일부 α-나선 3 돌연변이체는 수용체에 결합할 수 있으나 올리고머를 형성하지 않고, 만두카 섹타에 대해 비-독성이다 (문헌 [Jimenez-Juarez et al., 2008]에서 검토됨). 그러나, Cry3Aa1의 단백질분해 활성 형태는 α-나선 1, 2 및 3이 결여되어 있다 (Carroll et al., 1997).

알파-나선 1은 수용체 결합에 따라 제거된다. 문헌 [Gomez et al., (2002)]에서, BBMV 수용체 결합 시 형성된 Cry1Ab 올리고머에 도메인 I의 α-나선 1 부분이 결여되어 있음이 발견되었다. 또한, 문헌 [Soberon et al., (2007)]에서, 3차원 Cry 구조 상에서 α-나선 1을 둘러싸는 대략 60개의 아미노산이 결여되어 있는 Cry1Ab 및 Cry1Ac의 N-말단 결실 돌연변이체가 분자량 약 60 kDa의 단량체들을 카드헤린 결합의 부재 하에 프리-포어로 조립할 수 있는 것으로 나타났다. 이들 N-말단 결실 돌연변이체는 Cry-저항성 곤충 유충에 대해 활성인 것으로 보고되었다. 또한, 문헌 [Diaz-Mendoza et al., (2007)]은 지중해 옥수수 천공충 (세사미아 노나그리오이데스(Sesamia nonagrioides))에 대한 활성을 보유한 43 kDa 및 46 kDa의 Cry1Ab 단편이 기재하였다. 이들 단편은 아미노산 잔기 116 내지 423을 포함하는 것으로 입증되었지만, 정확한 아미노산 서열은 밝혀지지 않았으며, 이들 단백질 분해 단편의 활성 메카니즘은 공지되어 있지 않다. 문헌 [Gomez et al., (2002), Soberon et al., 2007 및 Diaz-Mendoza et al., (2007)]에서의 결과는 Cry1Ab의 N-말단으로부터의 아미노산 36개의 결실이 살곤충 활성의 상실을 초래하였음이 보고된 문헌 [Hofte et al., (1986)]에서의 결과와 대조적이다.

항-독소 항체. 등가의 독소 및/또는 이들 등가의 독소를 코딩하는 유전자는 본원에 제공된 교시를 사용하여 바실루스 투린기엔시스 단리물 및/또는 DNA 라이브러리로부터 유래될 수 있다. 본 발명의 살충 독소를 수득하기 위한 다수의 방법이 존재한다. 예를 들어, 본원에 개시된 및 청구된 살충 독소에 대해 면역반응성인 항체는 다른 독소를 단백질의 혼합물로부터 확인 및 분리하는데 사용될 수 있다. 특히, 항체는 가장 불변하고 다른 B.t. 독소와 가장 구분되는 독소의 부분에 대해 생성될 수 있다. 이어서 이들 항체는 예를 들어 면역침전, 효소 연결 면역흡착 검정 (ELISA), 또는 이뮤노블롯팅 (웨스턴 블롯팅)에 의해 특징적 활성을 갖는 등가의 독소를 구체적으로 확인하는 데 사용될 수 있다. 본원에 개시된 독소 또는 등가의 독소, 또는 이들 독소의 단편에 대한 항체를 관련 기술분야에서의 표준 절차를 사용하여 용이하게 제조할 수 있다. 이들 독소를 코딩하는 유전자는 이어서 독소를 생산하는 미생물로부터 수득될 수 있다.

B.t. 살곤충 독소가 단리되면, 그 독소에 특이적인 항체가 관련 기술분야에 널리 공지된 통상적인 방법에 의해 발생될 수 있다. 수주 또는 수개월의 기간에 걸친 선택된 숙주 내로의 반복 주입은 면역 반응을 유발하여 유의한 항-B.t. 독소의 혈청 역가를 발생시킨다. 바람직한 숙주는 포유동물 종이고, 보다 고도로 바람직한 종은 토끼, 염소, 양 및 마우스이다. 이러한 면역화 동물로부터 채혈된 혈액은 B.t. 살곤충 독소와 반응성인 항혈청 (폴리클로날 항체)을 수득하기 위하여 확립된 방법에 의해 처리될 수 있다. 그 후 항혈청은 관련 기술분야에 공지된 기술에 따라 독소에의 흡착에 의해 친화성 정제될 수 있다. 친화성 정제된 항혈청을 관련 기술분야에 공지된 절차를 사용하여 항혈청 내의 이뮤노글로불린 분획을 단리시킴으로써 추가로 정제할 수 있다. 생성된 물질은 B.t. 살곤충 독소와 반응성인 이뮤노글로불린의 불균질한 집단이다.

항-B.t. 독소 항체는 또한 면역원성 담체에 접합된 B.t. 살곤충 독소의 합성 펩티드 단편으로 이루어진 반합성 면역원을 제조함으로써 생성될 수 있다. 펩티드 단편의 제조에 유용한 다수의 방식 및 기기가 관련 기술분야에 널리 공지되어 있다. 다수의 적합한 면역원성 담체, 예컨대 소 혈청 알부민 (BSA) 또는 키홀 림펫 헤모시아닌이 또한 관련 기술분야에 널리 공지되어 있으며, 이는 면역원 및 담체 단백질을 커플링시키는 기술이 그러한 바와 같다. 반합성 면역원이 구축되면, B.t. 살곤충 독소 단편에 특이적인 항체의 제조 절차는 천연 B.t. 독소와 반응성인 항체의 제조에 사용되는 것과 동일하다.

항-B.t. 독소 모노클로날 항체 (MAb)는 정제된 B.t. 살곤충 독소를 사용하여 용이하게 제조된다. MAb를 제조하는 방법은 15년에 걸쳐 실행되었으며, 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다. 아주반트 중 정제된 B.t. 살곤충 독소의 반복된 복강내 또는 피하 주사는 대부분의 동물에서 면역 반응을 유발한다. 고면역화된 B-림프구를 동물로부터 제거하고 무기한 배양이 가능한 적합한 융합 파트너 세포주와 융합시킨다. B-림프구가 과다면역화되고 MAb의 생성에 사용될 수 있는 바람직한 동물은 포유동물이다. 보다 바람직한 동물은 래트 및 마우스이며, 가장 바람직한 것은 BALB/c 마우스 계통이다.

다수의 포유동물 세포주가 하이브리도마의 생산에 적합한 융합 파트너이다. 다수의 이러한 세포주는 아메리칸 타입 컬쳐 콜렉션 (American Type Culture Collection; ATCC, 버지니아주 마나사스) 및 상업적 공급업체로부터 입수가능하다. 바람직한 융합 파트너 세포주는 마우스 골수종 및 HL-1® 프렌들리(Friendly) 골수종-653 세포주 (벤트렉스 (Ventrex), 메인주 포틀랜드)가 가장 바람직하다. 융합되면, 생성된 하이브리도마를 1 내지 2주 동안 선택 성장 배지 중에서 배양한다. 2가지 널리 공지된 선택 시스템이 비융합 골수종 세포의 제거, 또는 혼합 하이브리도마 배양물로부터의 골수종 세포들 사이의 융합에 이용가능하다. 선택 시스템을 선택하는 것은 면역화된 마우스의 계통 및 사용되는 골수종 융합 파트너에 따른다. 문헌 [Taggart and Samloff, (1983)]에 기술된 AAT 선택 시스템이 사용될 수 있으나; 상기 언급된 바람직한 마우스 계통 및 융합 파트너와의 상용성으로 인해, 문헌 [Littlefield, (1964)]에 기재된 HAT (하이포크산틴, 아미노프테린, 티미딘) 선택 시스템이 바람직하다. 이어서, 소비된 성장 배지를 면역특이적 MAb 분비에 대하여 스크리닝한다. 효소 결합 면역흡착 검정 (ELISA) 절차가 이 목적에 최상으로 적합하지만, 큰 부피의 스크리닝용으로 수정된 방사면역검정이 또한 허용된다. 상당한 수의 관계없는 또는 덜 요망되는 배양을 연속적으로 줄이도록 설계된 다수의 스크린이 수행될 수 있다. B.t. 살곤충 독소와 반응성인 MAb를 분비하는 배양물은 공지된 B.t. 살곤충 독소와의 교차 반응성에 대해 스크리닝될 수 있다. 바람직한 B.t. 살곤충 독소에 우선적으로 결합하는 MAb는 상업적으로 입수가능한 분석물을 이용하여 이소타이핑될 수 있다. 바람직한 MAb는 IgG 부류이고, 더욱 고도로 바람직한 MAb는 IgG1 및 IgG2a 하위이소형이다.

바람직한 MAb를 분비하는 하이브리도마 배양물은 단클론성 및 안정성을 확립하기 위하여 수회 서브클로닝될 수 있다. 진핵성, 비-부착 세포 배양물을 서브클로닝하는 널리 공지된 방법은 한계 희석, 연질 아가로스 및 형광 활성 세포 분류 기술을 포함한다. 각각의 서브클로닝 후, 생성된 배양물은 바람직하게는 항체 분비 및 이소형에 대하여 재분석하여 안정한 바람직한 MAb-분비 배양물이 확립되었음을 보장한다.

항-B.t. 독소 항체는 본 발명의 청구된 B.t. 살곤충 독소 및 그의 변이체 또는 단편을 검출하는 다양한 방법에서 유용하다. 리포팅 기로 표지된 항체가 다양한 환경에서 항원의 존재를 확인하는데 사용될 수 있다는 것이 널리 공지되어 있다. 방사성동위원소로 표지된 항체가 큰 정확성 및 감수성으로 다양한 생물 유체 중 항원의 존재의 확인을 위하여 방사선면역검정에서 수십년 동안 사용되었다. 보다 최근에는, 효소 표지된 항체가 ELISA 검정에서 방사성표지된 항체의 대용물로서 사용되었다. 또한, 본 발명의 B.t. 살곤충 독소에 대하여 면역반응성인 항체는 고정화 물질, 예컨대 폴리스티렌 웰 또는 입자에 결합시켜 면역검정에서 사용하여 B.t. 독소가 시험 샘플에 존재하는지를 결정할 수 있다.

하나의 바람직한 실시양태에서, 살곤충 단백질 또는 변이체는 본 발명의 독소를 발현하는 핵산 서열을 포함하는 트랜스제닉 식물을 통해 경구로 전달된다. 본 발명은 본 발명의 핵산 분자를 식물 내로 도입하는 단계를 포함하며, 여기서 독소는 곤충을 방제하는데 유효한 양으로 트랜스제닉 식물에서 발현가능한 것인, 곤충-저항성 트랜스제닉 식물을 생산하는 방법을 제공한다. 비제한적 예에서, 기본 클로닝 전략은 전장 또는 변형 Cry 코딩 서열 (CDS)을 NcoI 및 SacI 제한 부위에서 식물 발현 플라스미드 내로 서브클로닝하는 것일 수 있다. 예를 들어, 게이트웨이(Gateway)® 기술 또는 표준 제한 효소 단편 클로닝 절차를 사용하여 식물 발현 요소 (예를 들어, 식물 발현가능한 프로모터, 3' 말단 전사 종결 및 폴리아데닐레이트 부가 결정자 등)의 제어 하에 적절한 Cry 코딩 영역을 함유하는 생성된 식물 발현 카세트를 이원 벡터 플라스미드 내로 서브클로닝한다. 게이트웨이® 기술이 사용되는 경우, 예를 들어, LR 클로나제(LR Clonase)™ (인비트로젠)를 사용하여 전장 및 변형된 유전자 식물 발현 카세트를 이원 식물 형질전환 플라스미드로 재조합시킬 수 있다. 플라스미드가 이. 콜라이 및 아그로박테리움 세포에 존재하는 경우, 항생제 스펙티노마이신에 대한 저항성을 부여하는 박테리아 유전자를 보유하는 이원 식물 형질전환 벡터를 사용하는 것이 편리하다. 목적하는 숙주 식물에서 기능적인 식물-발현가능한 선택 마커 유전자를 함유하는 이원 벡터 플라스미드를 사용하는 것이 또한 편리하다. 식물-발현성 선택 마커 유전자의 예는 항생제 카나마이신, 네오마이신 및 G418에 대한 저항성을 코딩하는, 트랜스포손 Tn5의 아미노글리코시드 포스포트랜스퍼라제 유전자 (Aph II) 뿐만 아니라 글리포세이트; 히그로마이신; 메토트렉세이트; 포스피노트리신 (비알라포스), 이미다졸리논, 술포닐우레아 및 트리아졸로피리미딘 제초제, 예컨대 클로로술푸론, 브로목시닐, 달라폰 등에 대한 내성을 코딩하는 유전자를 포함하나, 이에 제한되지는 않는다.

대안적으로, DIG-465, DIG-473, DIG-468, DIG-483, DIG-462, DIG-463, DIG-464, DIG-466, DIG-467, DIG-469, DIG-474, DIG-482, DIG-485, DIG-487, IRDIG544.8, IRDIG544.9, IRDIG544.11, 또는 IRDIG544.12 유전자 삽입물을 함유하는 이원 식물 형질전환 벡터의 플라스미드 구조물은 아그로박테리움 조작 분야의 통상의 기술자에게 널리 공지된 표준 분자 생물학 방법에 의해 후보 아그로박테리움 단리물로부터 제조된 플라스미드 DNA의 제한 소화 핑거프린트 맵핑에 의해 수행된다.

아그로박테리움-매개된 형질전환 방법을 통해 형질전환 식물을 수득하는 관련 기술분야의 통상의 기술자는 Z707S 이외의 다른 아그로박테리움 균주가 사용될 수 있다는 것 및 균주의 선택이 형질전환시키고자 하는 숙주 식물 종의 동일성에 좌우될 수 있다는 것을 이해할 것이다.

다음은 본 발명을 실시하기 위한 절차를 설명하는 예이다. 이들 실시예는 제한하는 것으로 간주되지 않아야 한다. 달리 언급되지 않는 한 모든 백분율은 중량 기준이고, 모든 용매 혼합물 비율는 부피 기준이다. 본원에서 지칭되거나 인용된 모든 특허, 특허 출원, 가출원 및 공개는 본 명세서의 명백한 교시와 상반되지 않는 정도로 그 전체내용이 참조로 포함된다. 구체적으로 나타내거나 시사하지 않는 한, 단수 용어는 본원에 사용된 바와 같은 "적어도 하나"를 의미한다.

실시예 1

B.t. 살곤충 단백질에 대한 코딩 서열의 식물-최적화 버전의 설계

트랜스제닉 단자엽 및 쌍자엽 식물에서 살곤충 단백질을 생산하기 위해 식물 코돈 편향을 갖는 DNA 서열을 설계하고 합성하였다. 메이즈 (제아 메이스 엘.)에 대한 코돈 사용빈도 표를 진뱅크에 기탁된 서열로부터 수득된 706개의 단백질 코딩 서열 (CDS)로부터 계산하였다. 담배 (니코티아나 타바쿰(Nicotiana tabacum), 1268 CDS), 카놀라 (브라시카 나푸스(Brassica napus), 530 CDS), 목화 (고시피움 히르수툼(Gossypium hirsutum), 197 CDS) 및 대두 (글리신 맥스(Glycine max); 약 1000 CDS)에 대한 코돈 사용빈도 표는 웹사이트 http://www.kazusa.or.jp/codon/의 데이터로부터 다운로드받았다. 어느 한 식물 유형에서 아미노산에 대해 총 코돈 사용의 약 10% 미만으로 사용된 임의의 여분 코돈을 생략한 후에, 적절한 가중 평균 상대량으로 메이즈 및 쌍자엽 데이터세트 둘 다에 공통인 고도로 사용된 코돈을 포함하는 편향 코돈 세트를 계산하였다. 살곤충 단백질을 코딩하는 식물 최적화 서열을 유도하기 위해, 살곤충 단백질 DNA 서열에 대한 코돈 치환이, 생성된 DNA 서열이 식물-최적화 코돈 편향 표의 전체 코돈 조성을 갖도록 이루어졌다. 바람직하지 않은 제한 효소 인식 부위, 잠재적 식물 인트론 스플라이스 부위, A/T 또는 C/G 잔기가 길게 이어진 부분, 및 식물 세포에서의 코딩 영역의 RNA 안정성, 전사 또는 번역을 방해할 수 있는 다른 모티프가 제거되도록 서열의 추가의 개량이 이루어졌다. 목적 제한 효소 인식 부위가 도입되고, 긴 내부 오픈 리딩 프레임 (+1 이외의 프레임)이 제거되도록 다른 변화가 이루어졌다. 이들 변화는 모두 식물-편향된 코돈 조성을 유지하는 제약 내에서 이루어졌다. 설계를 완성하기 위해, 모든 6개의 오픈 리딩 프레임에서 번역 정지 코돈을 코딩하는 서열을 코딩 영역의 3' 말단에 부가하고, 적절한 제한 인식 부위를 서열의 5' 및 3' 말단에 부가하였다. 설계된 서열의 합성은 상업적 공급자 (DNA2.0, 캘리포니아주 멘로 파크)에 의해 수행되었다. 합성 유전자의 생산에 관한 추가의 안내는, 예를 들어 WO 97/13402 및 미국 특허 번호 5,380,831에서 찾아볼 수 있다.

본 발명의 DIG 단백질을 코딩하는 식물-최적화 DNA 서열 (서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40)이 서열식별번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 및 39로 개시된다. 서열식별번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 및 39에 개시된 서열을 포함하는 DNA 분자를 상업적 엔티티 (DNA2.0)로 합성에 의해 조립하였다.

실시예 2

살곤충 독소를 코딩하는 발현 플라스미드의 구축 및 박테리아 숙주에서의 발현.

표준 클로닝 방법을 식물-최적화 코딩 영역에 의해 코딩된 DIG-465 (서열식별번호: 16), DIG-473 (서열식별번호: 24), DIG-468 (서열식별번호: 2), DIG-483 (서열식별번호: 4), DIG-462 (서열식별번호: 10), DIG-463 (서열식별번호: 12), DIG-464 (서열식별번호: 14), DIG-466 (서열식별번호: 18), DIG-467 (서열식별번호: 20), DIG-469 (서열식별번호: 22), DIG-474 (서열식별번호: 26), DIG-482 (서열식별번호: 28), DIG-485 (서열식별번호: 6), 및 DIG-487 (서열식별번호: 8) 단백질을 생산하도록 조작된 슈도모나스 플루오레센스(Pseudomonas fluorescens) (Pf) 발현 플라스미드의 구축에 사용하였다. 제한 엔도뉴클레아제를 뉴 잉글랜드 바이오랩스(New England BioLabs) (NEB; 매사추세츠주 입스위치)로부터 입수하였고, T4 DNA 리가제 (인비트로젠 코포레이션(Invitrogen Corporation), 캘리포니아주 칼스배드)를 DNA 라이게이션에 사용하였다.

기본 클로닝 전략은 DIG-465, DIG-473, DIG-468, DIG-483, DIG-462, DIG-463, DIG-464, DIG-466, DIG-467, DIG-469, DIG-474, DIG-482, DIG-485, 또는 DIG-487 독소 코딩 서열 (CDS)을 pDOW1169에 제한 부위, 예컨대 SpeI 및 XhoI에서 서브클로닝하고, 이에 의해 이것이 플라스미드 pKK223-3 (피엘 파마시아(PL Pharmacia), 위스콘신주 밀워키)으로부터의 Ptac 프로모터 및 rrnBT1T2 터미네이터의 발현 제어 하에 놓이게 되는 것을 수반한다. pDOW1169는 RSF1010 복제 기점, pyrF 유전자, 및 리보솜 결합 부위, 이에 이어서 단백질 코딩 영역을 함유하는 DNA 단편이 도입될 수 있는 제한 효소 인식 부위가 있는 저 카피 플라스미드이다 (미국 특허 출원 US20080193974). 발현 플라스미드를 DC454 (돌연변이 ΔpyrF 및 lsc::lacIQI를 갖는 거의 야생형인 피. 플루오레센스 균주), 또는 그의 유도체 내로 전기천공에 의해 형질전환시키고, SOC-소이 가수분해물 배지에서 회수하고, 선택 배지 (우라실이 결여되어 있는 M9 글루코스 한천, [Sambrook et al., 상기 문헌]) 상에 플레이팅하였다. 미생물학적 조작에 관한 상세내용은 본원에 참조로 포함되는 문헌 [Squires, C. H. et al., (2004)], 미국 특허 출원 20060008877, 미국 특허 출원 20080193974, 및 미국 특허 출원 20080058262에서 이용가능하다. 균주를 미니프렙 플라스미드 DNA의 제한 소화에 의해 검증하였다.

진탕 플라스크에서의 성장 및 발현 분석. 특징화 및 곤충 생물검정을 위한 DIG-465, DIG-473, DIG-468, DIG-483, DIG-462, DIG-463, DIG-464, DIG-466, DIG-467, DIG-469, DIG-474, DIG-482, DIG-485, 또는 DIG-487 독소의 생산을 발현 구축물을 보유하는 진탕-플라스크-성장시킨 피. 플루오레센스 균주에 의해 달성하였다. 1% 글루코스 및 미량 원소가 보충된 M9 배지에서 성장시킨 종자 배양물을 사용하여 5% 글리세롤을 포함하는 50 mL의 규정 최소 배지 (테크노바(Teknova) 카탈로그 번호 3D7426, 캘리포니아주 홀리스터)에 접종하였다. 진탕시키면서 30℃에서 24시간 동안 초기 인큐베이션한 후에 이소프로필-β-D-1-티오갈락토피라노시드 (IPTG)의 첨가에 의해 Ptac 프로모터를 통한 살곤충 단백질 독소 유전자의 발현을 유도하였다. 배양물을 유도 시점에 및 유도후 다양한 시점에 샘플링하였다. 세포 밀도를 600 nm에서의 광학 밀도 (OD₆₀₀)에 의해 측정하였다. 예를 들어, 문헌 [Huang et al., 2007] 및 미국 특허 출원 20060008877에 기재된 바와 같이, 슈도모나스 플루오레센스의 성장에 적합한 다른 배양 배지를 또한 사용할 수 있다.

진탕 플라스크 샘플의 세포 분획화 및 SDS-PAGE 분석. 각각의 샘플링 시간에, 0.5 mL 분취물을 5분 동안 14000 x g에서 원심분리하였다. 세포 펠릿을 -80℃에서 동결시켰다. 동결된 진탕 플라스크 세포 펠릿 샘플로부터의 가용성 및 불용성 분획을 버그버스터(BugBuster) 마스터 믹스 (EMD밀리포어(EMDMillipore)®, 독일 다름슈타트)를 사용하여 생성하였다. 각각의 세포 펠릿을 0.5 mL 버그버스터 마스터 믹스™ 용액에 재현탁시키고, 30분 동안 실온에서 진탕시키면서 인큐베이션하였다. 샘플을 3분 동안 0.1 mm 유리 비드를 갖는 비드비터를 사용하여 용해시켰다. 용해물을 14,000 rpm에서 5분 동안 원심분리하고, 상청액을 가용성 분획으로서 회수하였다. 이어서 펠릿 (불용성 분획)을 동등 부피의 추출 완충제 (8 M 우레아, 0.5 M NaCl, 25 mM NaPO4, pH 10.4)에 재현탁시켰다.

샘플을 디티오트레이톨 (DTT)을 함유하는 2X 누페이지(NuPAGE) 트리스 글리신 SDS 샘플 완충제 (인비트로젠, 캘리포니아주 칼스배드)와 1:1 혼합하고, 5분 동안 비등시킨 후에 노벡스 4-20% 트리스 글리신 SDS 폴리아크릴아미드 겔 (인비트로젠, 캘리포니아주 칼스배드) 상에 로딩하였다. 전기영동을 권장된 트리스-글리신 완충제 중에서 수행하였다. 겔을 제조업체 (바이오-라드 인크.(Bio-Rad Inc.), 캘리포니아주 허큘레스) 프로토콜에 따라 바이오-세이프(Bio-Safe) 쿠마시 염료로 염색하고, GE 타이푼 시리즈 영상화 시스템 (펜실베니아주 피츠버그)을 사용하여 영상화하였다.

봉입체 제조. Cry 단백질 봉입체 (IB) 제조는, SDS-PAGE 및 MALDI-MS (매트릭스 보조 레이저 탈착/이온화 질량 분광측정법)에 의해 입증되는 바와 같이 불용성 B.t. 살곤충 단백질을 생산하는 피. 플루오레센스 발효물로부터의 세포 상에서 수행하였다. 피. 플루오레센스 발효 펠릿을 37℃ 수조에서 해동시켰다. 세포를 용해 완충제 (50 mM 트리스, pH 7.5, 200 mM NaCl, 20 mM EDTA 이나트륨 염 (에틸렌디아민테트라아세트산), 1% 트리톤 X-100, 및 5 mM 디티오트레이톨 (DTT); 5 mL/L의 박테리아 프로테아제 억제제 칵테일 (P8465 시그마-알드리치(Sigma-Aldrich), 미주리주 세인트 루이스)을 사용 직전에 첨가함)에 25% w/v로 재현탁시켰다. 핸드-헬드 균질화기를 최저 설정으로 사용하여 세포를 현탁시켰다 (티슈 티어러(Tissue Tearor), 바이오스펙 프로덕츠, 인크.(BioSpec Products, Inc.), 오클라호마주 바틀스빌). 리소자임 (25 mg의 시그마-알드리치 L7651, 닭 난백 유래)을 금속 스패튤라를 사용하여 혼합함으로써 세포 현탁액에 첨가하고, 현탁액을 실온에서 1시간 동안 인큐베이션하였다. 현탁액을 얼음 상에서 15분 동안 냉각시키고, 이어서 브랜슨 소니파이어(Branson Sonifier) 250 (2회의 1분의 세션, 50%의 듀티 사이클, 30%의 출력)를 사용하여 초음파처리하였다. 세포 용해를 현미경검사에 의해 체크하였다. 필요한 경우 추가의 25 mg의 리소자임을 첨가하고, 인큐베이션 및 초음파처리를 반복하였다. 세포 용해를 현미경검사에 의해 확인하였을 때, 용해물을 11,500 x g으로 25분 동안 (4℃) 원심분리하여 IB 펠릿을 형성시키고, 상청액을 따라내었다. IB 펠릿을 100 mL 용해 완충제로 현탁시키고, 핸드-헬드 혼합기로 균질화하고, 상기와 같이 원심분리하였다. 상청액이 무색이 되며 IB 펠릿이 단단해지고 회백색의 색이 될 때까지, IB 펠릿을 현탁 (50 mL 용해 완충제 중), 균질화, 초음파처리 및 원심분리에 의해 반복적으로 세척하였다. 최종 세척의 경우, IB 펠릿을 2 mM EDTA를 함유하는 멸균-여과 (0.22 μm) 증류수에 현탁시키고, 원심분리하였다. 최종 펠릿을 2 mM EDTA를 함유하는 멸균-여과 증류수에 현탁시키고, 1 mL 분취물로 -80℃에 저장하였다.

IB 제제 중 단백질의 SDS-PAGE 분석 및 정량화는, IB 펠릿의 1 mL 분취물을 해동시키고, 멸균-여과 증류수로 1:20 희석함으로써 수행하였다. 이어서 희석된 샘플을 4X 환원 샘플 완충제 [250 mM 트리스, pH 6.8, 40% 글리세롤 (v/v), 0.4%의 브로모페놀 블루(Bromophenol Blue) (w/v), 8% SDS (w/v) 및 8% β-메르캅토-에탄올 (v/v)]와 비등시키고, 노벡스® 4-20% 트리스-글리신 상에 로딩하고, 12+2 웰 겔 (인비트로젠)을 1X 트리스/글리신/SDS 완충제 (바이오라드)로 전개시켰다. 겔을 200 볼트에서 60분 동안 전개시킨 다음, 쿠마시 블루(Coomassie Blue) (45% 메탄올, 10% 아세트산 중 50% G-250/50% R-250)로 염색하고, 증류수 중 7% 아세트산, 5% 메탄올로 탈염색하였다. 표적 밴드의 정량화는, 밴드에 대한 밀도측정 값을 동일한 겔 상에서 전개시킨 소 혈청 알부민 (BSA) 샘플에 대하여 비교함으로써 수행하여, 표준 곡선을 생성하였다.

봉입체의 가용화. DIG-465, DIG-473, DIG-468, DIG-483, DIG-462, DIG-463, DIG-464, DIG-466, DIG-467, DIG-469, DIG-474, DIG-482, DIG-485, 또는 DIG-487 단백질을 함유하는 Pf 클론으로부터의 봉입체 현탁액의 6 mL를 에펜도르프 모델 5415C 미세원심분리기 (대략 14,000 x g)의 가장 높은 설정 상에서 원심분리하여 함유물을 펠릿화하였다. 저장 완충제 상청액을 제거하고, 50 mL 원추형 튜브 내에서 25 mL의 100 mM 탄산나트륨 완충제, pH 11로 대체하였다. 함유물을 피펫을 사용하여 재현탁시키고, 볼텍싱하여 철저히 혼합하였다. 튜브를 완만한 요동 플랫폼 상에 4℃에서 밤새 두어 표적 단백질을 추출하였다. 추출물을 30,000 x g에서 4℃에서 30분 동안 원심분리하고, 생성된 상청액을 아미콘(Amicon) 울트라-15 재생 셀룰로오스 원심분리 필터 장치 (30,000의 분자량의 컷오프; 밀리포어)를 사용하여 5배 농축시켰다. 이어서, 샘플 완충제를 일회용 PD-10 칼럼 (지이 헬스케어(GE Healthcare), 뉴저지주 피스카타웨이)을 사용하여 10 mM CAPS [3-(시클로헥사미노)1-프로판술폰산] pH 10으로 변화시켰다.

겔 전기영동. 농축된 추출물을 환원제로서 5 mM 디티오트레이톨을 함유하는 누페이지® LDS 샘플 완충제 (인비트로젠) 중에 1:50 희석함으로써 전기영동을 위해 제조하고, 4분 동안 95℃에서 가열하였다. 샘플을 (표준 곡선 생성을 위해) 0.2 내지 2 μg/레인 범위의 5개의 BSA 표준물과 함께 4-12% 누페이지® 겔의 이중 레인에 로딩하였다. 전압을 트래킹 염료가 겔의 바닥에 도달할 때까지 MOPS SDS 전개 완충제 (인비트로젠)를 사용하여 200V에서 적용하였다. 겔을 45% 메탄올, 10% 아세트산 중 0.2% 쿠마시 블루 G-250으로 염색하고, 배경이 투명해질 때까지 처음에는 간단하게 45% 메탄올, 10% 아세트산으로 탈염색하고 다음에 길게 7% 아세트산, 5% 메탄올로 탈염색하였다. 탈염색 후에, 겔을 바이오라드 플루오르-S 멀티이미저(Fluor-S MultiImager)로 스캐닝하였다. 기기의 퀀터티 원(Quantity One) v.4.5.2 소프트웨어를 사용하여 염색된 단백질 밴드의 배경-차감 부피를 수득하고, BSA 표준 곡선을 생성하였으며, 이를 사용하여 스톡 용액 중 DIG-465, DIG-473, DIG-468, DIG-483, DIG-462, DIG-463, DIG-464, DIG-466, DIG-467, DIG-469, DIG-474, DIG-482, DIG-485, 또는 DIG-487 단백질의 농도를 계산하였다.

DIG-465, DIG-473, DIG-468, DIG-483, DIG-463, DIG-464, DIG-466, DIG-467, DIG-469, DIG-474, DIG-482, DIG-485, 및 DIG-487의 발현 수준을 슈도모나스 플루오레센스 박테리아 세포에서 발현되는 경우 말단절단 Cry1Ca (DIG-462)의 발현 수준과 비교하였다. 말단절단 Cry1Ca (DIG-462)는 대략 1 g/l로 발현된 반면, DIG-473은 대략 0.5 g/l로 발현되었다. DIG-465는 말단절단 Cry1Ca보다 대략 5배 더 높이, 4.9 g/l로 발현되었다. 이들 시험관내 결과는 L57A 돌연변이가 말단절단 Cry1Ca 단백질을 보다 많이 발현시킨다는 것을 보여준다.

실시예 3

슈도모나스 플루오레센스에서 생산된 DIG 단백질의 살곤충 활성

B.t. 살곤충 독소 DIG-462, DIG-463, DIG-464, DIG-465, DIG-466, DIG-467, DIG-468, DIG-469, DIG-470, DIG-473, 및 DIG-474가 배추좀나방 (DBM; 플루텔라 크실로스텔라 (린나에우스)) 및 가을 거염벌레 (FAW, 스포도프테라 프루기페르다 (스미스))를 포함한 인시류 종에 대해 활성인 것으로 입증되었다.

샘플 제조 및 생물검정. 10 mM CAPS pH 10 내의 봉입체 제제를 10 mM CAPS, pH 10에서 적절하게 희석하였고, 모든 생물검정은 이 완충제로 이루어진 대조군 처리를 함유하였으며, 이는 사멸률 또는 성장 억제에 대한 배경 체크로서 제공된다.

생물검정 완충제 중 단백질 농도를 BSA를 사용하여 겔 전기영동에 의해 추정하여, 겔 밀도측정을 위한 표준 곡선을 생성하였으며, 이는 바이오라드 영상화 시스템 (퀀터티 원 소프트웨어 버전 4.5.2를 사용하는 플루오르-S 멀티이미저)을 사용하여 측정하였다. 겔 매트릭스 중 단백질을 쿠마시 블루-기반 염색으로 염색하고, 판독 전에 탈염색하였다.

정제된 단백질을 인공 곤충 먹이에서 신생 인시류 유충을 사용하여 수행한 생물검정에서 살곤충 활성에 대해 시험하였다. DBM 및 FAW의 유충을 상업적 곤충실험실 (벤존 리서치 인크.(Benzon Research Inc.), 펜실베니아주 칼라일)에 의해 유지되는 콜로니로부터 수득된 알로부터 부화시켰다. rFAW의 유충을 독점적 콜로니 (다우 아그로사이언시스 엘엘씨(Dow AgroSciences LLC), 인디애나주 인디애나폴리스)로부터 수거한 알로부터 부화시켰다.

이들 생물검정은 곤충 생물검정을 위해 특수하게 설계된 128-웰 플라스틱 트레이 (씨-디 인터내셔널(C-D International), 뉴저지주 피트만)에서 수행하였다. 각각의 웰은 1.0 mL의 다수-종 인시목 먹이 (사우스랜드 프로덕츠(Southland Products), 아칸소주 레이크 빌리지)를 함유하였다. 단백질 샘플의 40 μL 분취물을 피펫으로 각각의 웰의 1.5 cm² 먹이 표면 상에 전달하였다 (26.7 μL/cm²). 웰 내 표면적의 제곱 센티미터 (cm²) 당 DIG 단백질의 양 (ng)으로서 Cry 단백질 농도를 계산하였다. 처리된 트레이를 먹이 표면 상의 액체가 증발하거나 먹이 내로 흡수될 때까지 흄 후드에서 유지하였다.

우화 수시간 이내에, 습윤 낙타모 브러시로 개별 유충을 피킹하고, 웰당 유충 1마리를 처리된 먹이 상에 위치시켰다. 이어서, 감염된 웰을 가스 교환을 허용하도록 통기되는, 투명한 플라스틱의 접착 시트 (씨-디 인터내셔널, 뉴저지주 피트만)로 밀봉하였다. 생물검정 트레이를 제어된 환경 조건 (28℃, ~60% 상대 습도, 16:8 [명:암]) 하에서 5일 동안 유지한 후에, 각각의 단백질 샘플에 노출된 곤충의 총수, 사멸 곤충의 수 및 생존 곤충의 중량을 기록하였다. 사멸률 퍼센트 및 성장 억제 퍼센트를 각각의 처리에 대해 계산하였다. 성장 억제 (GI)는 하기와 같이 계산하였다:

GI = [1 - (TWIT/TNIT)/(TWIBC/TNIBC)]

여기서 TWIT는 처리군에서의 곤충의 총 중량이고,

TNIT는 처리군에서의 곤충의 총수이고;

TWIBC는 배경 체크 (완충제 대조군)에서의 곤충의 총 중량이고,

TNIBC는 배경 체크 (완충제 대조군)에서의 곤충의 총수이다.

DBM 생물검정에서, 10 및 300 ng/cm²의 DIG-462, DIG-463, DIG-464, DIG-465, DIG-466, DIG-467, DIG-468, DIG-469, DIG-470, DIG-471, DIG-472, DIG-473, 및 DIG-474를 곤충 종에 대해 시험하였다. FAW를 DIG-462, DIG-465, DIG-473의 봉입체 제제와 함께 1X 및 5X 희석률에서 시험하였다. 사멸률 및 성장 억제 퍼센트 결과를 비교하였다.

사멸률은 DIG-462, DIG-463, DIG-464, DIG-465, DIG-466, DIG-468, DIG-469, DIG-473, 및 DIG-474 처리의 경우 300 ng/cm²에서 100%였다 (표 2 및 표 3). 성장 억제는 DIG-465 및 DIG-473 처리의 경우 10 ng/cm²에서 70-90% 성장 억제 및 300 ng/cm²에서 100% 억제였다 (표 2).

표 2

사멸률 및 성장 억제 둘 다를 측정하는, DBM에 대한 DIG-462, DIG-465 및 DIG-473 단백질의 생물검정 시험의 결과

사멸률의 경우, ++ = 10 ng/cm²에서 0-20% 및 300 ng/cm²에서 100%, +++ = 10 ng/cm²에서 30-60% 및 300 ng/cm²에서 100%. 성장 억제의 경우, ++++ = 10 ng/cm²에서 70-90% 성장 억제 및 300 ng/cm²에서 100% 억제.

표 3

10 ng/cm² 및 300 ng/cm² 농도에서 DBM에 대해 시험된 단백질 돌연변이체의 생물검정 결과

FAW 유충에 대한 Cry1Ca 코어 독소 (DIG-462), DIG-465, 및 DIG-473 단백질의 성장 억제는 모든 처리에서 >40%인 것으로 결정되었다 (표 4). 단백질을 전체 강도에서 시험하고, 완충제 (10 mM CAPS, pH 10)로 5-배 희석하였다.

표 4

FAW에 대한 DIG-462, DIG-465, 및 DIG-473의 성장 억제 퍼센트

키모트립신에 의해 소화될 정제 단백질의 DBM 활성 및 감수성을 평가하였다. DIG-473이 키모트립신 절단에 대해 저항성인 한편 동시에 DBM에 대해 DIG-462와 동일한 효력을 갖는다는 예상하지 못한 놀라운 발견이 있었다. 이는 시험관내 키모트립신 절단에 감수성인 Cry1Ca 코어 (DIG-462) 및 DIG-465 단백질과는 대조적이다 (표 5).

표 5

DBM (DIG-462는 표준임)에 대한 활성 및 키모트립신에 의한 절단에 대한 단백질 저항성을 갖는 단백질

실시예 4

유럽 옥수수 천공충 (ECB), 남서부 옥수수 천공충 (SWCB) 및 남부 거염벌레 (SAW) 생물검정

생물검정을 32-웰 시험 트레이에서 수행하였다. 대략 5 mL의 2% 물-한천 용액을 각각의 웰에 적용하고, 한천이 완전히 고체화되도록 하였다.

식물은 대략 3주령이었고, T₁ 세대에서 시험하였다. T₁ 잎 물질의 3중 반복이 완료되었다. 1개의 잎을 절단하고 (1" X 0.5" 직사각형), 트레이의 단일 웰에 넣었다. 각각의 웰을 ECB, Cry1Fa rECB 또는 SWCB의 10마리 개별 곤충 유충 (통상적으로 24시간령 미만)으로 감염시켰다. SAW의 경우, 5마리 개별 곤충 유충을 웰당 감염시켰다. B104 근교계 기원의 종자 기재 식물 및 황색 형광 단백질 (YFP) 형질전환 식물이 음성 대조군으로서 제공되었다.

이어서, 감염된 웰을 가스 교환을 허용하도록 통기되는, 투명한 플라스틱의 접착 시트 (씨-디 인터내셔널, 뉴저지주 피트만)로 밀봉하였다. 트레이를 콘비론(conviron) 인큐베이터에 넣고, 3일 동안 28℃ (16:8h 명:암, 60% RH)에서 유지시킨 후, 각각의 잎 조각에 대한 손상의 총량 (0, 5, 10, 15, 25, 50, 75% 손상 등, 100%까지)을 기록하였다.

곤충 유충이 말단절단 Cry1Ca 변형된 단백질을 함유하는 식물에 노출된 경우에 ECB 및 Cry1Fa 저항성 ECB (rECB)에 의해 유발된 섭식 손상이 감소하였다. 먹이 생물검정에서 시험될 때, 정제된 전장 Cry1Ca를 인공 곤충 먹이 위에 놓고 개별 곤충이 독소를 함유하는 먹이를 섭식하도록 하는 경우에 변형된 Cry1Ca는 ECB 및 rECB에 대해 불활성인 것으로 밝혀졌다. 그러나, >120 ng/cm²의 농도에서 메이즈에서 발현되는 경우, 식물에서의 Cry1Ca의 발현은 ECB 및 특히 rECB에 의해 유발되는 섭식 손상에 대해 예상하지 못한 보호를 제공한다.

표 6

유럽 옥수수 천공충 (ECB) 및 Cry1Fa-저항성 ECB (rECB)에 섭식시킨 경우의 IRDIG544.12 T₁ 메이즈의 생물검정 결과

곤충 유충을 말단절단 Cry1Ca 변형된 단백질을 140-340 ng/cm²의 단백질 발현 범위에서 함유하는 식물에 노출시켰을 때 남서부 옥수수 천공충 (SWCB) 및 남부 거염벌레 (SAW)에 의해 유발된 섭식 손상의 감소가 관찰되었다 (표 7). 평균 발현은 210 ng/cm² (표준 편차 35)였다.

표 7

남서부 옥수수 천공충 (SWCB) 및 남부 거염벌레 (SAW)에게 섭식시킨 경우의 IRDIG544.12 T₁ 메이즈 식물의 생물검정

옥수수 천공충에 대한 재배지 시험을 2개 위치에 수행하였다: 하나는 미국 인디애나주 (IN), 다른 하나는 미국 미시시피주 (MS). 다수의 구축물 및 사례를 각각의 처리에 대해 시험하였다. Cry1Ab 및 Cry1F는 ECB 시험에서 양성 대조군으로서 제공되었다. 널이 음성 대조군으로서 제공되었다.

ECB 효능을 평가하기 위해, 각각의 식물에게 V6-V7 단계 식물의 윤생에 10마리 제2령 ECB 유충을 제공하였다. MS에서, 남서부 옥수수 천공충 (SWCB) 제2령 유충을 또한 V9 옥수수의 윤생에 인공적으로 감염시켰다 (식물당 22마리 유충). 사용된 ECB 및 SWCB는 벤존 래보러토리에서 입수하였다. 두 ECB 시험에서, 식물을 감염 2주 후에 잎 손상에 대해 평가하였으며 (거스리 1-9 척도) (Guthrie et al. 1960), 여기서 1은 가시적 손상 없는 경우이고, 9는 대부분의 잎이 긴 병변을 갖는 경우이다 (표 8). MS SWCB 시험에서, 식물을 자루 손상 및 살아있는 곤충에 대해 윤생 등급화 4-5일 후에 조사하였다. 수집된 데이터는 자루당 터널의 수, 터널 길이 및 자루당 살아있는 유충/번데기를 포함하였다.

표 8

옥수수 천공충 손상 점수 기준 (윤생 손상).

ECB 재배지 시험. ECB 윤생 손상을 Cry1Ca 활성에 대해 측정하였으며, 널과 비교한 경우 유의하게 보다 우수한 윤생 보호를 나타내었다. Cry1Ca 사례 활성은 Cry1Ab 및 Cry1F에 의해 제공된 윤생 보호와 통계학상 동등하지 않았다.

MS에서 생성된 데이터는 Cry1Ca에 대한 예상하지 못한 높은 수준의 식물 보호를 추가로 보강하였다. 높은 섭식 압박이 이 연구에서 확립되었다. 널 상의 잎 및 자루 손상에 비교한 경우 Cry1Ca에서 유의한 방제가 측정되었다. 단지 몇 마리의 살아있는 곤충만이 Cry1Ca 자루에서 생존한 것으로 밝혀졌다. 널과 비교한 경우 Cry1Ab 및 Cry1F 사례에서 유의한 윤생 및 자루 보호가 측정되었다.

표 9

ECB 잎 윤생 데이터, IN (다수의 사례에 대한 평균)

상이한 문자가 뒤따르는 평균은 유의하게 상이하다 (P ≤ 0.05).

표 10

ECB 잎 윤생 및 자루 데이터, MS (다수의 사례에 대한 평균)

모든 데이터 칼럼에서, 모든 유전자 사례는 널 값과 유의하게 상이하였다 (P < 0.05). 각각의 칼럼 내에서, 상이한 문자가 뒤따르는 평균은 유의하게 상이하다 (P ≤ 0.05).

SWCB 시험에서, B.t.당 오직 2개의 사례를 평가하였다. 높은 섭식 압박이 이 연구에서 확립되었다. 통계학상 동등한 자루 보호 및 자루당 유충 및 번데기의 수가 Cry1Ab, Cry1F, 및 Cry1Ca 사례에서 측정되었다.

표 11

SWCB 잎 윤생 및 자루 데이터, MS

각각의 칼럼 내에서, 상이한 문자가 뒤따르는 평균은 유의하게 상이하다 (P ≤0.05).

Cry1Ca의 활성 형태는 아미노산 29-628로 구성된다. 전장 (1-1164), 또는 절단된 형태 (1-628 및 29-628)는 곤충에게 제공되는 경우 이들이 29-628 형태로 프로세싱되기 때문이 활성이다.

실시예 5

옥수수 이삭벌레 재배지 시험

옥수수 이삭벌레에 대한 재배지 시험은 다수의 구축물 및 사례 (서열식별번호: 31)를 사용하여 인디애나주 파울러에서 수행하였다. 널은 음성 대조군으로서 제공되었다. 각각의 식물에게 옥수수 이삭의 녹색 수염에 5마리의 제1령 유충을 제공하였다. CEW는 벤존 래보러토리로부터 입수하였다. 사례당 플롯당 10개의 옥수수 이삭을 평가하여 CEW로 감염된 옥수수 이삭에서 커넬 손상의 수준을 평가하였다. 모든 트랜스제닉 사례는 널과 비교한 경우에 유의하게 보다 낮은 수준의 커넬 손상을 제공하였다. Cry1Ca 식물 상에서 유충 섭식의 유의한 억제가 존재하였다 (표 12).

표 12

CEW 커넬 소비 데이터, IN

실시예 6

아그로박테리움 형질전환.

이원 식물 형질전환 및 발현 플라스미드의 구축에 표준 클로닝 방법을 사용하였다. cry1Ca 발현 카세트를 함유하는 아그로박테리움 이원 플라스미드를 게이트웨이® 기술 (인비트로젠, 캘리포니아주 칼스배드)을 사용하여 조작하고, 아그로박테리움-매개 식물 형질전환에 사용하였다. 제한 엔도뉴클레아제를 뉴 잉글랜드 바이오랩스 (NEB; 매사추세츠주 입스위치)로부터 입수하고, T4 DNA 리가제 (인비트로젠)를 DNA 라이게이션에 사용하였다. 게이트웨이 반응을 게이트웨이® LR 클로나제® 효소 믹스 (인비트로젠)를 사용하여 수행하였다. 뉴클레오스핀(NucleoSpin)® 플라스미드 제조 키트 또는 뉴클레오본드® AX Xtra 미디 키트(NucleoBond® AX Xtra Midi kit) (둘 다 마슈레-나겔(Macherey-Nagel))를 사용하여 제조업체의 지침에 따라 플라스미드 제조를 수행하였다. 겔 단리 후 DNA 단편을 퀴아퀵(QIAquick) PCR 정제 키트 또는 퀴아엑스 II(QIAEX II) 겔 추출 키트 (둘 다 퀴아젠(Qiagen))를 사용하여 정제하였다.

살곤충 단백질 또는 그의 단편을 코딩하는 뉴클레오티드 서열을 포함하는 DNA 단편은 상업적 공급자 (예를 들어 DNA2.0, 캘리포니아주 멘로 파크)에 의해 합성하여, 표준 플라스미드 벡터에 클로닝된 단편으로 공급될 수 있거나, 또는 적절한 뉴클레오티드 서열을 함유하는 다른 구축물의 표준 분자 생물학 조작에 의해 수득될 수 있었다. 각각의 유전자에 대해 내부인 특유한 제한 부위를 확인하고, 각각 특정 결실 또는 삽입을 함유하는 각각의 유전자의 단편들을 합성하였다. 변형된 Cry 단편을 적절한 제한 부위에서 다른 Cry 단편으로 서브클로닝하여 목적 전장 단백질, 융합 단백질 또는 결실 변이체 단백질을 코딩하는 코딩 영역을 수득하였다.

아그로박테리움 투메파시엔스 균주 Z707S (Z707의 스트렙토마이신-저항성 유도체; Hepburn et al., 1985)의 전기-적격 세포를 제조하고, 전기천공을 사용하여 형질전환시켰다 (Weigel and Glazebrook, 2002). 전기천공 후, 1 mL의 YEP 브로쓰 (gm/L: 효모 추출물, 10; 펩톤, 10; NaCl, 5)를 큐벳에 첨가하고, 세포-YEP 현탁액을 15 mL 배양 튜브로 옮기고, 4시간 동안 연속 교반하면서 수조에서 28℃에서 인큐베이션하였다. 세포를 스펙티노마이신 (200 μg/mL) 및 스트렙토마이신 (250 μg/mL)을 포함하는 YEP 플러스 한천 (25 gm/L) 상에 플레이팅하고, 플레이트를 28℃에서 2-4일 동안 인큐베이션하였다. 잘 분리된 단일 콜로니를 선택하고, 상기와 같이 스펙티노마이신 및 스트렙토마이신을 포함하는 새로운 YEP + 한천 플레이트 상에 스트리킹하고, 28℃에서 1-3일 동안 인큐베이션하였다.

이원 식물 형질전환 벡터 중 살곤충 단백질 유전자 삽입물의 존재에 대해, 선택된 아그로박테리움 콜로니로부터 제조된 주형 플라스미드 DNA와 함께 벡터-특이적 프라이머를 사용하여 PCR 분석을 수행하였다. 상기와 같이 스펙티노마이신 및 스트렙토마이신을 포함하는 YEP에서 밤새 성장시킨 배양물 15 mL 중 4 mL 분취물로부터의 세포 펠릿을 제조업체의 지침에 따라 수행된 퀴아젠 스핀 미니 프렙을 사용하여 추출하였다. 아그로박테리움 전기천공 형질전환에 사용된 이원 벡터로부터의 플라스미드 DNA를 대조군으로서 포함시켰다. 인비트로젠으로부터의 Taq DNA 폴리머라제를 0.5x 농도로 제조업체의 지침에 따라 사용하여 PCR 반응을 완료하였다. 하기 조건으로 프로그래밍된 MJ 리서치 펠티에 써멀 사이클러(MJ Research Peltier Thermal Cycler)에서 PCR 반응을 수행하였다: 단계 1) 94℃에서 3분 동안; 단계 2) 94℃에서 45초 동안; 단계 3) 55℃에서 30초 동안; 단계 4) 72℃에서 예상되는 생성물 길이 kb당 1분씩; 단계 5) 단계 2로 29회; 단계 6) 72℃에서 10분 동안. 사이클링 후 4℃에서 반응을 유지하였다. 증폭 생성물을 아가로스 겔 전기영동 (예를 들어 0.7% 내지 1% 아가로스, w/v)에 의해 분석하고, 에티듐 브로마이드 염색에 의해 가시화하였다. PCR 생성물이 플라스미드 대조군과 동일한 콜로니를 선택하였다.

표 13

메이즈에서 DIG-465 및 DIG-473의 발현을 위한 플라스미드의 설명

실시예 7

단자엽 식물에서의 DIG-465 및 DIG-473 B.t. 살곤충 단백질 및 변이체의 생산.

메이즈의 아그로박테리움-매개된 형질전환. 하이 II F₁ 교배 (Armstrong et al., 1991)로부터의 종자를 95%의 메트로-믹스(Metro-Mix) 360 무토양 성장 배지 (선 그로 홀티컬쳐(Sun Gro Horticulture), 워싱턴주 벨뷰) 및 5% 점토/양토의 혼합물을 함유하는 5-갤런-포트에 식재하였다. 16:8시간 명:암 광주기로 고압 나트륨 및 금속 할라이드 램프의 조합을 사용하여 온실에서 식물을 성장시켰다. 형질전환을 위한 미성숙 F₂ 배아를 얻기 위해, 제어된 형매-수분을 수행하였다. 수분 8-10일 후에 배아가 대략 1.0 내지 2.0 mm 크기일 때 미성숙 배아를 단리하였다.

감염 및 공동-배양. 메이즈 이삭을, 액체 비누로 문지르고, 2분 동안 70% 에탄올 중에 침지시킨 다음, 30분 동안 20% 상업용 표백제 (0.1% 차아염소산나트륨) 중에 침지시킨 후에 멸균수로 세정하여 표면 멸균시켰다. 100 mg/L 스펙티노마이신, 10 mg/L 테트라시클린 및 250 mg/L 스트렙토마이신을 함유하는 YEP 고체 배지 상에서 28℃에서 2-3일 동안 성장시킨 1-2 루프의 박테리아를 100 μM 아세토시린곤을 함유하는 5 mL의 액체 감염 배지 (LS 기초 배지 (Linsmaier and Skoog, 1965), N6 비타민 (Chu et al., 1975), 1.5 mg/L 2,4-디클로로페녹시아세트산 (2,4-D), 68.5 gm/L 수크로스, 36.0 gm/L 글루코스, 6 mM L-프롤린, pH 5.2) 내로 옮김으로써 초이원 벡터를 함유하는 아그로박테리움 세포의 현탁액을 제조하였다. 균일한 현탁액이 달성될 때까지 용액을 볼텍싱하고, 농도를 자주색 필터가 구비된 클렛-서머슨(Klett-Summerson) 비색계를 사용하여 200 클렛 단위의 최종 밀도로 조정하였다. 미성숙 배아를 2 mL의 감염 배지를 함유하는 미세 원심분리 튜브 내로 직접 단리하였다. 배지를 제거하고, 밀도가 200 클렛 단위인 아그로박테리움 용액 1 mL로 대체하고, 아그로박테리움 및 배아 용액을 실온에서 5분 동안 인큐베이션한 다음, 암기 조건 하에 25℃에서 5일 동안 공동-배양 배지 (LS 기초 배지, N6 비타민, 1.5 mg/L 2,4-D, 30.0 gm/L 수크로스, 6 mM L-프롤린, 0.85 mg/L AgNO3, 100 μM 아세토시린곤, 3.0 gm/L 겔란(Gellan) 검 (피토테크놀로지 래보러토리즈(PhytoTechnology Laboratories), 캔자스주 레넥사), pH 5.8)로 옮겼다.

공동-배양 후에, 배아를 선택 배지로 옮기고, 이후에 대략 8주의 기간에 걸쳐 형질전환 단리물을 수득하였다. 식물 발현가능한 pat 또는 bar 선택 마커 유전자를 함유하는 초이원 플라스미드로 형질전환된 메이즈 조직의 선택을 위해, LS 기재 배지 (LS 기초 배지, N6 비타민, 1.5 mg/L 2,4-D, 0.5 gm/L MES (2-(N-모르폴리노)에탄술폰산 1수화물; 피토테크놀로지스 래버러토리즈), 30.0 gm/L 수크로스, 6 mM L-프롤린, 1.0 mg/L AgNO3, 250 mg/L 세포탁심, 2.5 gm/L 젤란 검, pH 5.7)를 비알라포스(Bialaphos) (골드 바이오테크놀로지(Gold BioTechnology))와 함께 사용하였다. 배아발생 단리물을 수득할 때까지 3 mg/L 비알라포스를 함유하는 선택 배지로 배아를 옮겼다. 회수된 단리물을 재생 및 추가 분석을 위해 2주 간격으로 새로운 선택 배지로 옮김으로써 증대시켰다.

재생 및 종자 생산. 재생을 위해, 배양물을 "28" 유도 배지 (MS 염 및 비타민, 30 gm/L 수크로스, 5 mg/L 벤질아미노퓨린, 0.25 mg/L 2,4-D, 3 mg/L 비알라포스, 250 mg/L 세포탁심, 2.5 gm/L 겔란 검, pH 5.7)로 1주일 동안 저광 조건 (14 μEm-2s-1) 하에, 이어서 1주일 동안 고광 조건 (대략 89 μEm-2s-1) 하에 옮겼다. 이후에 조직을 "36" 재생 배지 (유도 배지와 동일, 예외적으로, 식물 성장 조절인자 결여됨)로 옮겼다. 묘목이 3-5 cm 길이로 성장하였을 때, 이를 SHGA 배지 (Schenk and Hildebrandt salts and vitamins (1972); PhytoTechnologies Labr.), 1.0 gm/L 미오-이노시톨, 10 gm/L 수크로스 및 2.0 gm/L 겔란 검, pH 5.8)를 함유하는 유리 배양 튜브로 옮겨서, 싹 및 뿌리의 추가의 성장 및 발달을 가능하게 하였다. 본원에 이전에 기재된 바와 동일한 토양 혼합물에 식물을 이식하고, 온실에서 개화까지 성장시켰다. 종자 생산을 위해 제어된 수분을 수행하였다.

구축물 115752에 의한 DIG-465의 발현 수준 및 구축물 115753에 의한 DIG-473의 발현 수준이 도 1에 제시된다. 둘 다는 조직 샘플을 수득하기 위해 잎 펀치를 사용하여 잎에서 측정시에 유사한 수준의 그의 각 단백질을 대략 70-80 ng/cm²로 발현시켰다.

전장 Cry1Ca 단백질 (MR-1206) (mw 130 kDa)을 코딩하는 유전자를 발현하는 메이즈로부터의 추출물의 SDS-PAGE를 수행하였다. 적어도 5가지 단백질 생성물이 Cry1Ca에 대해 지시된 폴리클로날 항체를 사용하는 면역-블롯팅에 의해 검출되었다. 메이즈에 삽입된 유전자에 의해 코딩되는 바와 같은 전장 (130 kDa) 단백질이 검출되었다. 다른 밴드는 이 단백질의 단백질분해 생성물을 나타낸다. 코어 독소를 나타내는 아미노산 서열 1-628로 구성된 단백질 단편은 70 kDa의 분자량을 갖는 것으로 결정되었다. 68 kDa 밴드는 N-말단으로부터 처음 28개 아미노산이 결실된 아미노산 29-628로 구성된 단백질을 나타낸다. 처음 3개의 밴드는 에스. 프루기페르다 및 다른 인시류 곤충에 대해 기능적으로 활성이었다. 제4 밴드는 아미노산 74-628로 구성된 절단 단백질 (mw 62 kDa)을 나타내고, 제5 밴드는 아미노산 74-596으로 추가로 프로세싱된 Cry1Ca 단백질 (mw 59 kDa)을 나타내었다. 62 kDa 및 59 kDa 밴드는 에스. 프루기페르다 및 다른 인시류 곤충에 대해 기능적으로 활성이 아니였으나, 여전히 주요 단백질 생성물을 나타낸다.

실시예 8

트랜스제닉 메이즈의 생물검정.

식물 세포에서 생산된 DIG-465 및 DIG-473 단백질 및 변이체의 생물활성을 관련 기술분야의 통상의 기술자에게 공지된 방법에 의해 입증하였다 (예를 들어, 문헌 [Huang et al., 2006] 참조). DIG-465 또는 DIG-473 단백질 또는 변이체를 생산하는 식물로부터 유래된 다양한 식물 조직 또는 조직 조각을 제어된 섭식 환경에서 표적 곤충에게 섭식시킴으로써 효능이 입증될 수 있다. 대안적으로, DIG-465 또는 DIG-473 단백질 또는 변이체를 생산하는 식물로부터 유래된 다양한 식물 조직으로부터 단백질 추출물을 제조하고, 본원에 이전에 기재된 바와 같은 인공 사료 생물검정에 혼입시킬 수 있었다. 이러한 섭식 검정의 결과는 DIG-465 또는 DIG-473 단백질 또는 변이체를 생산하지 않는 숙주 식물로부터의 적절한 대조군 조직, 또는 다른 대조군 샘플을 사용하는 유사하게 수행된 생물검정과 비교되어야 하는 것으로 이해된다.

구축물 115752 (DIG-465)로부터 메이즈에서 생산된 다양한 사례의 생물학적 활성을 FAW 또는 Cry1Fa 저항성 FAW (rFAW)의 섭식 활성에 의해 유발된 잎 손상을 방지하는 것에 대해 시험하였다. 결과는 DIG-465 단백질을 발현하는 사례가 단백질을 발현하지 않는 식물보다 적은 섭식 손상을 나타내고, 효과는 용량 의존성으로, DIG-465의 발현이 높을수록 FAW 또는 rFAW에 의해 유발되는 섭식 손상이 적어지며, rFAW에 대해 명백하게 더 크게 영향을 미친다는 것을 보여준다 (표 14 및 도 2).

유사하게, 구축물 115753 (DIG-473)으로부터 메이즈에서 생산된 다양한 사례의 생물학적 활성을 FAW 또는 Cry1Fa 저항성 FAW (rFAW)의 섭식 활성에 의해 유발되는 잎 손상을 방지하는 것에 대해 시험하였다. 결과는 DIG-473 단백질을 발현하는 사례가 단백질을 발현하지 않는 식물보다 적은 섭식 손상을 나타내고, 효과는 용량 의존성으로, DIG-473의 발현이 높을수록 FAW 또는 rFAW에 의해 유발되는 섭식 손상이 적어지며, rFAW에 대해 명백하게 더 크게 영향을 미친다는 것으로 보여준다 (표 14 및 도 3).

표 14

DIG-465, DIG-473, 또는 대조군에 노출된 경우의 FAW 생물검정 데이터

실시예 9

쌍자엽 식물에서의 Bt 살곤충 단백질 및 변이체의 생산.

아라비돕시스 형질전환. 아라비돕시스 탈리아나 Col-01을 꽃 침지 방법을 사용하여 형질전환시켰다 (Weigel and Glazebrook, 2002). 선택된 아그로박테리움 콜로니를 사용하여 선택에 적절한 항생제를 함유하는 YEP 브로쓰의 1 mL 내지 15 mL 배양물에 접종하였다. 배양물을 밤새 28℃에서 220 rpm에서 연속 교반하면서 인큐베이션하였다. 각각의 배양물을 사용하여 선택에 적절한 항생제를 함유하는 YEP 브로쓰의 2개의 500 mL 배양물에 접종하고, 새로운 배양물을 밤새 28℃에서 연속 교반하면서 인큐베이션하였다. 세포를 대략 8700 x g에서 10분 동안 실온에서 원심분리하고, 생성된 상청액을 따라내었다. 세포 펠릿을 부드럽게 하기를 함유하는 500 mL의 침윤 배지에 재현탁시켰다: 1/2x 무라시게(Murashige) 및 스쿠그(Skoog) 염 (시그마-알드리치)/갬보르그(Gamborg) B5 비타민 (골드 바이오테크놀로지, 미주리주 세인트 루이스), 10% (w/v) 수크로스, 0.044 μM 벤질아미노퓨린 (10 μL/L의 DMSO 중 1 mg/mL 스톡) 및 300 μL/L 실웨트(Silwet) L-77. 대략 1개월령의 식물을 가장 새로운 화서가 침수되도록 주의하면서 배지에 15초 종안 침지시켰다. 이어서 식물을 옆으로 눕혀 24시간 동안 덮어 두고 (투명 또는 불투명), 물로 세척하고, 똑바로 세워놓았다. 식물을 22℃에서 16:8 명:암 광주기로 성장시켰다. 침지 대략 4주 후에, 종자를 수거하였다.

아라비돕시스 성장 및 선택. 새로 수거된 T₁ 종자를 적어도 7일 동안 실온에서 건조제의 존재 하에 건조시켰다. 종자를 0.1% 한천/물 (시그마-알드리치) 용액에 현탁시킨 다음, 4℃에서 2일 동안 계층화하였다. 식재를 제조하기 위해, 10.5 인치 x 21 인치 발아 트레이 (티.오. 플라스틱스 인크.(T.O. Plastics Inc.), 미네소타주 클리어워터) 내 선샤인 믹스 LP5(Sunshine Mix LP5) (선 그로 홀티컬쳐 인크., 워싱턴주 벨뷰)를 미세 버미큘라이트로 덮고, 습윤될 때까지 호글랜드 용액 (Hoagland and Arnon, 1950)으로 지하-관개한 다음, 24시간 동안 배수시켰다. 계층화된 종자를 버미큘라이트에 파종하고 습윤 돔 (코드 프로덕츠(KORD Products), 캐나다 온타리오 브라말레아)으로 7일 동안 덮었다. 종자를 발아시키고, 식물을 콘비론 (모델 CMP4030 또는 CMP3244; 컨트롤드 인바이런먼츠 리미티드(Controlled Environments Limited), 캐나다 매니토바주 윈니펙)에서 일정한 온도 (22℃) 및 습도 (40-50%) 하에 120-150 μmol/m²sec의 광 강도로 긴 낮 조건 (16:8 명/암 광주기) 하에 성장시켰다. 식물에 초기에 호글랜드 용액을 급수하고, 후속적으로 토양을 수분은 있지만 습윤되지는 않게 유지되도록 탈이온수를 급수하였다.

파종 5-6일 후에 돔을 제거하고, 비형질전환 종자로부터 발아한 식물을 사멸시키기 위해 화학적 선택제를 식물에 분무하였다. 예를 들어, 이원 식물 형질전환 벡터에 의해 제공되는 식물 발현가능한 선택 마커 유전자가 pat 또는 bar 유전자인 경우에 (Wehrmann et al., 1996), 형질전환 식물에 피날레(Finale) (5.78% 글루포시네이트 암모늄, 파르남 캄파니즈 인크.(Farnam Companies Inc.), 애리조나주 피닉스)의 1000X 용액을 분무함으로써 선택할 수 있었다. 5-7일 간격으로 2회의 순차적 분무를 수행하였다. 최종 분무로부터 7-10일 후에 생존물 (활발하게 성장하는 식물)을 확인하고, 선샤인 믹스 LP5로 제조된 포트 내로 이식하였다. 이식된 식물을 3-4일 동안 습윤 돔으로 덮고, 상기 언급된 성장 조건 하에서 콘비론 인큐베이터에 넣었다.

쌍자엽 식물 형질전환 분야의 통상의 기술자는 다른 식물 발현가능한 선택 마커 유전자 (예를 들어, 제초제 내성 유전자)가 사용되는 경우에 형질전환 식물의 다른 선택 방법도 이용가능하다는 것을 이해할 것이다.

실시예 10

DIG 단백질을 포함하는 트랜스제닉 글리신 맥스

Cry1Ca 단백질을 포함하는 핵산에 대한 발현 벡터를 보유하는 10 내지 20종의 트랜스제닉 T₀ 글리신 맥스 식물을 관련 기술분야에 공지된 바와 같이, 예를 들어 아그로박테리움-매개 형질전환에 의해 제조하였다. 성숙 대두 (글리신 맥스) 종자를 16시간 동안 염소 가스로 밤새 멸균시켰다. 염소 가스로 멸균시킨 후, 종자를 라미나르(LAMINAR)™ 유동 후드 내의 개방 용기에 놓아두어 염소 가스를 없앴다. 다음에, 멸균된 종자에 24℃에서 블랙 박스를 사용하여 암실에서 16시간 동안 멸균 H₂O를 흡수시켰다.

분할-종자 대두의 제조. 배축 프로토콜의 부분을 포함하는 분할 대두 종자는, 종피를 분리하고 제거하며 종자를 2개의 자엽 섹션으로 분할하기 위해 종자의 제를 따라 스칼펠에 고정된 #10 블레이드를 사용하여 세로로 절단한 대두 종자 물질의 제조에 요구되었다. 배축을 부분적으로 제거하는데 세심한 주의가 필요하였으며, 여기서 배축의 약 1/2 - 1/3이 자엽의 마디 끝에 여전히 부착된 채로 있었다.

접종. 이어서, 배축의 일부 부분을 포함하는 분할 대두 종자를 DIG 단백질을 포함하는 이원 플라스미드를 함유하는 아그로박테리움 투메파시엔스 (예를 들어, 균주 EHA 101 또는 EHA 105)의 용액 중에 약 30분 동안 침지시켰다. 배축을 포함하는 자엽을 침지시키기 전에 아그로박테리움 투메파시엔스 용액을 λ=0.6 OD₆₅₀의 최종 농도로 희석하였다.

공동-배양. 접종 후에, 분할 대두 종자를 한 장의 여과지로 덮인 페트리 디쉬 내 공동-배양 배지 상에서 5일 동안 아그로박테리움 투메파시엔스 균주와 공동-배양하였다 (Wang, Kan. Agrobacterium Protocols. 2. 1. New Jersey: Humana Press, 2006. Print.).

싹 유도. 공동-배양 5일 후에, 분할 대두 종자는 B5 염, B5 비타민, 28 mg/L 제1철, 38 mg/L Na₂EDTA, 30 g/L 수크로스, 0.6 g/L MES, 1.11 mg/L BAP, 100 mg/L 티멘틴(TIMENTIN)™, 200 mg/L 세포탁심, 및 50 mg/L 반코마이신 (pH 5.7)으로 이루어진 액체 싹 유도 (SI) 배지에서 세척하였다. 분할 대두 종자를 이어서 B5 염, B5 비타민, 7 g/L 노블 한천, 28 mg/L 제1철, 38 mg/L Na₂EDTA, 30 g/L 수크로스, 0.6 g/L MES, 1.11 mg/L BAP, 50 mg/L 티멘틴™, 200 mg/L 세포탁심, 50 mg/L 반코마이신 (pH 5.7)으로 이루어진 싹 유도 I (SI I) 배지 상에서 자엽의 편평한 면을 위로 향하게 하고 자엽의 마디 끝은 배지에 침지되도록 하면서 배양하였다. 배양 2주 후에, 형질전환 분할 대두 종자로부터의 외식편을 6 mg/L 글루포시네이트 (리버티(LIBERTY)®)가 보충된 SI I 배지를 함유하는 싹 유도 II (SI II) 배지로 옮겼다.

싹 신장. SI II 배지 상에서 배양 2주 후에, 외식편으로부터 자엽을 제거하고, 자엽의 기저부에서 절단을 수행함으로써, 배축을 함유하는 플러시 싹 패드를 절제하였다. 이와 같이 자엽으로부터 단리된 싹 패드를 싹 신장 (SE) 배지에 옮겼다. SE 배지는 MS 염, 28 mg/L 제1철, 38 mg/L Na₂EDTA, 30 g/L 수크로스 및 0.6 g/L MES, 50 mg/L 아스파라긴, 100 mg/L L-피로글루탐산, 0.1 mg/L IAA, 0.5 mg/L GA3, 1 mg/L 제아틴 리보시드, 50 mg/L 티멘틴™, 200 mg/L 세포탁심, 50 mg/L 반코마이신, 6 mg/L 글루포시네이트, 7 g/L 노블 한천 (pH 5.7)으로 이루어졌다. 이 배양물을 2주마다 새로운 SE 배지에 옮겼다. 배양물을 80-90 μmol/m²sec의 광 강도 하에 18시간 광주기를 사용하여 24℃ 하의 콘비론™ 성장 챔버 내에서 성장시켰다.

발근. 자엽 싹 패드로부터 발생된 신장된 싹을, 이러한 자엽 싹 패드의 기저부에서 신장된 싹을 절단하고, 신장된 싹을 1 내지 3분 동안 1 mg/L IBA (인돌 3-부티르산)에 담가두어 단리함으로써 발근을 촉진시켰다. 다음에, 신장된 싹을 피타 트레이 내 발근 배지 (MS 염, B5 비타민, 28 mg/L 제1철, 38 mg/L Na₂EDTA, 20 g/L 수크로스 및 0.59 g/L MES, 50 mg/L 아스파라긴, 100 mg/L L-피로글루탐산, 7 g/L 노블 한천, pH 5.6)로 옮겼다.

배양. 1-2주 동안 24℃, 18시간 광주기에서 콘비론™ 성장 챔버 내에서 배양한 후에, 뿌리가 발생된 싹을 뚜껑이 있는 선데 컵 내의 토양 혼합물로 옮기고, 소식물체의 적응을 위해 일정한 온도 (22℃) 및 습도 (40-50%) 하에 120 내지 150 μmol/m²sec의 광 강도에서 긴 낮 조건 (16시간 명기/8시간 암기) 하에 콘비론™ 성장 챔버 (모델 CMP4030 및 CMP3244, 컨트롤드 인바이런먼츠 리미티드, 캐나다 매니토바주 윈니펙)에 넣었다. 이와 같이 발근된 모종은 선데 컵에서 수주 동안 적응시킨 후에, 강건한 트랜스제닉 대두 식물의 추가의 적응 및 확립을 위해 온실로 옮겼다.

트랜스제닉 계통의 발생 및 형태학적 특징을 비형질전환 식물과 비교하였다. 식물 뿌리, 싹, 잎 및 생식 특징을 비교하였다. 트랜스제닉 및 비형질전환 식물의 뿌리 길이 및 성장 패턴에 있어서 어떠한 관찰가능한 차이도 존재하지 않았다. 식물 싹 특징, 예컨대 높이, 잎의 수 및 크기, 개화 시기, 꽃의 크기 및 외관은 유사하였다. 일반적으로, 시험관내 및 온실내 토양에서 배양하였을 때, 트랜스제닉 계통과 DIG 단백질이 발현되지 않은 것 사이에는 어떠한 관찰가능한 형태학적 차이도 존재하지 않았다.

실시예 11

추가의 작물 종의 형질전환

관련 기술분야의 통상의 기술자에게 공지된 방법, 예를 들어 이전에 미국 특허 7,838,733의 실시예 9, 또는 PCT 국제 특허 공개 번호 WO 2007/053482의 실시예 12에 기재된 것과 실질적으로 동일한 기술을 사용하여, 목화를 B.t. 단백질 (엽록체 통과 펩티드의 존재 또는 부재 하에)로 형질전환시켜 인시류 곤충의 방제를 제공하였다.

본원에 기재된 실시예 및 실시양태는 예시적 목적을 위한 것이고, 그를 고려하여 관련 기술분야의 통상의 기술자에게 다양한 변형 또는 변화가 제안될 것이고 본 출원의 취지와 범위 및 첨부된 청구범위의 범위 내에 포함되어야 함을 이해해야 한다. 본원에 제공된 교시와 함께, 관련 기술분야의 통상의 기술자는 본원에 기재된 다양한 독소 및 폴리뉴클레오티드 서열을 용이하게 생산 및 사용할 수 있다.

SEQUENCE LISTING <110> Dow AgroSciences LLC Sheets, Joel Narva, Ken E. Meade, Thomas Hey, Timothy Tan, Sek Yee Etter, Audrey Glancy, Todd Armstrong, Janna Coram, Tristan Madduri, Krishna King, James Edward Lee, Ryan M. Lin, Gaofeng Li, Jianquan <120> CRY1CA MUTANTS USEFUL FOR CONTROL OF INSECT PESTS <130> 70951 <160> 40 <170> PatentIn version 3.5 <210> 1 <211> 1878 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 1 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180 atcgacttcg tctggggaat tgtccagtgg gatgcgtttc tggtgcagat agagcagctg 240 atcaacgaga ggatcgctga gttcgcgaga aatgctgcaa tcgccaacct tgaagggctt 300 ggcaacaact tcaacatcta cgtggaggcg ttcaaggagt gggaagagga ccctaagaat 360 ccagcgacca gaacgagggt tatagatcgg ttccgcatcc tcgatggcct tttggagagg 420 gacatcccga gcttccgcat ttcgggattt gaggttcctc tgctctcagt ctacgctcaa 480 gctgctaatc tgcatctggc catcttgagg gattcagtca tctttggcga acgctggggt 540 cttacgacta tcaacgtgaa cgagaactac aatcggttga ttcggcacat agacgagtat 600 gccgaccact gtgctaacac ctacaatagg ggtctgaaca atctgccaaa gtcaacgtat 660 caagactgga taacctacaa taggctcaga cgggacctca ctctcaccgt gctggacata 720 gctgccttct ttccgaacta cgacaaccgg agatatccta ttcaacccgt tggtcagctc 780 actcgcgagg tctacaccga tcccctcatc aacttcaatc cccagctgca atcggtcgca 840 cagctgccca ccttcaatgt gatggaaaac tcagcgatcc ggaatcccca tctgtttgac 900 atacttaaca acctcactat cttcaccgat tggttttcag ttggacgcaa cttctactgg 960 ggagggcaca gagtgatttc aagcctcatt ggaggaggga acattacatc gcctatctat 1020 ggaagggagg ccaaccaaga gccaccaagg tctttcacct tcaacggtcc ggtgttcaga 1080 acacttagca atcccacatt gcgcttgctg caacagccgt ggccagcacc accattcaat 1140 ctgaggggag tggagggtgt ggagttctcg acgcctacaa actcctttac gtacagaggc 1200 agagggacag tggactcact gacagaactc ccacctgagg acaactctgt tcctccgagg 1260 gagggctact cgcaccggct ttgccatgcc accttcgtcc agaggtctgg cacgcctttt 1320 ctgaccactg gggttgtctt tagctggact caccgctcag cgacgctgac caacacaatc 1380 gacccagaga ggatcaatca gatccctctg gtgaagggct ttcgcgtttg gggtggcaca 1440 agcgtgatca ccggacctgg tttcactggt ggggatatcc tcagacgcaa tacgtttggc 1500 gatttcgtga gccttcaagt caacatcaat tccccaatca cccagagata tcggctccgc 1560 ttcagatacg cctcatccag agacgcaagg gtcatcgtcc ttactggagc agccagcacc 1620 ggagtcggag gccaagttag cgtcaacatg ccgttgcaga aaacgatgga aatcggtgaa 1680 aacctcacca gcagaacctt tcgctataca gatttcagca accctttctc cttcagagcc 1740 aatccggaca taatcggcat atccgagcag cccttgttcg gtgctgggtc catctcttct 1800 ggcgagctgt acatcgacaa gattgagatc attctcgcag atgcgactct ggaggctgaa 1860 tcggatcttg aaaggtga 1878 <210> 2 <211> 625 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 2 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu 65 70 75 80 Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn 85 90 95 Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys 100 105 110 Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile 115 120 125 Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser 130 135 140 Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln 145 150 155 160 Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly 165 170 175 Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg 180 185 190 Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr 195 200 205 Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile 210 215 220 Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile 225 230 235 240 Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro 245 250 255 Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe 260 265 270 Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met 275 280 285 Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn 290 295 300 Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp 305 310 315 320 Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr 325 330 335 Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe 340 345 350 Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg 355 360 365 Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val 370 375 380 Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly 385 390 395 400 Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser 405 410 415 Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe 420 425 430 Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser 435 440 445 Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg 450 455 460 Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr 465 470 475 480 Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg 485 490 495 Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro 500 505 510 Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp 515 520 525 Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly 530 535 540 Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu 545 550 555 560 Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe 565 570 575 Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu 580 585 590 Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile 595 600 605 Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu 610 615 620 Arg 625 <210> 3 <211> 1878 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 3 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg ccggcttcct tgttggcctt 180 atcgacttcg tctggggaat tgtccagtgg gatgcgtttc tggtgcagat agagcagctg 240 atcaacgaga ggatcgctga gttcgcgaga aatgctgcaa tcgccaacct tgaagggctt 300 ggcaacaact tcaacatcta cgtggaggcg ttcaaggagt gggaagagga ccctaagaat 360 ccagcgacca gaacgagggt tatagatcgg ttccgcatcc tcgatggcct tttggagagg 420 gacatcccga gcttccgcat ttcgggattt gaggttcctc tgctctcagt ctacgctcaa 480 gctgctaatc tgcatctggc catcttgagg gattcagtca tctttggcga acgctggggt 540 cttacgacta tcaacgtgaa cgagaactac aatcggttga ttcggcacat agacgagtat 600 gccgaccact gtgctaacac ctacaatagg ggtctgaaca atctgccaaa gtcaacgtat 660 caagactgga taacctacaa taggctcaga cgggacctca ctctcaccgt gctggacata 720 gctgccttct ttccgaacta cgacaaccgg agatatccta ttcaacccgt tggtcagctc 780 actcgcgagg tctacaccga tcccctcatc aacttcaatc cccagctgca atcggtcgca 840 cagctgccca ccttcaatgt gatggaaaac tcagcgatcc ggaatcccca tctgtttgac 900 atacttaaca acctcactat cttcaccgat tggttttcag ttggacgcaa cttctactgg 960 ggagggcaca gagtgatttc aagcctcatt ggaggaggga acattacatc gcctatctat 1020 ggaagggagg ccaaccaaga gccaccaagg tctttcacct tcaacggtcc ggtgttcaga 1080 acacttagca atcccacatt gcgcttgctg caacagccgt ggccagcacc accattcaat 1140 ctgaggggag tggagggtgt ggagttctcg acgcctacaa actcctttac gtacagaggc 1200 agagggacag tggactcact gacagaactc ccacctgagg acaactctgt tcctccgagg 1260 gagggctact cgcaccggct ttgccatgcc accttcgtcc agaggtctgg cacgcctttt 1320 ctgaccactg gggttgtctt tagctggact caccgctcag cgacgctgac caacacaatc 1380 gacccagaga ggatcaatca gatccctctg gtgaagggct ttcgcgtttg gggtggcaca 1440 agcgtgatca ccggacctgg tttcactggt ggggatatcc tcagacgcaa tacgtttggc 1500 gatttcgtga gccttcaagt caacatcaat tccccaatca cccagagata tcggctccgc 1560 ttcagatacg cctcatccag agacgcaagg gtcatcgtcc ttactggagc agccagcacc 1620 ggagtcggag gccaagttag cgtcaacatg ccgttgcaga aaacgatgga aatcggtgaa 1680 aacctcacca gcagaacctt tcgctataca gatttcagca accctttctc cttcagagcc 1740 aatccggaca taatcggcat atccgagcag cccttgttcg gtgctgggtc catctcttct 1800 ggcgagctgt acatcgacaa gattgagatc attctcgcag atgcgactct ggaggctgaa 1860 tcggatcttg aaaggtga 1878 <210> 4 <211> 625 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 4 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Ala Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu 65 70 75 80 Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn 85 90 95 Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys 100 105 110 Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile 115 120 125 Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser 130 135 140 Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln 145 150 155 160 Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly 165 170 175 Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg 180 185 190 Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr 195 200 205 Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile 210 215 220 Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile 225 230 235 240 Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro 245 250 255 Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe 260 265 270 Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met 275 280 285 Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn 290 295 300 Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp 305 310 315 320 Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr 325 330 335 Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe 340 345 350 Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg 355 360 365 Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val 370 375 380 Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly 385 390 395 400 Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser 405 410 415 Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe 420 425 430 Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser 435 440 445 Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg 450 455 460 Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr 465 470 475 480 Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg 485 490 495 Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro 500 505 510 Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp 515 520 525 Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly 530 535 540 Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu 545 550 555 560 Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe 565 570 575 Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu 580 585 590 Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile 595 600 605 Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu 610 615 620 Arg 625 <210> 5 <211> 1878 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 5 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcgc cgttggcctt 180 atcgacttcg tctggggaat tgtccagtgg gatgcgtttc tggtgcagat agagcagctg 240 atcaacgaga ggatcgctga gttcgcgaga aatgctgcaa tcgccaacct tgaagggctt 300 ggcaacaact tcaacatcta cgtggaggcg ttcaaggagt gggaagagga ccctaagaat 360 ccagcgacca gaacgagggt tatagatcgg ttccgcatcc tcgatggcct tttggagagg 420 gacatcccga gcttccgcat ttcgggattt gaggttcctc tgctctcagt ctacgctcaa 480 gctgctaatc tgcatctggc catcttgagg gattcagtca tctttggcga acgctggggt 540 cttacgacta tcaacgtgaa cgagaactac aatcggttga ttcggcacat agacgagtat 600 gccgaccact gtgctaacac ctacaatagg ggtctgaaca atctgccaaa gtcaacgtat 660 caagactgga taacctacaa taggctcaga cgggacctca ctctcaccgt gctggacata 720 gctgccttct ttccgaacta cgacaaccgg agatatccta ttcaacccgt tggtcagctc 780 actcgcgagg tctacaccga tcccctcatc aacttcaatc cccagctgca atcggtcgca 840 cagctgccca ccttcaatgt gatggaaaac tcagcgatcc ggaatcccca tctgtttgac 900 atacttaaca acctcactat cttcaccgat tggttttcag ttggacgcaa cttctactgg 960 ggagggcaca gagtgatttc aagcctcatt ggaggaggga acattacatc gcctatctat 1020 ggaagggagg ccaaccaaga gccaccaagg tctttcacct tcaacggtcc ggtgttcaga 1080 acacttagca atcccacatt gcgcttgctg caacagccgt ggccagcacc accattcaat 1140 ctgaggggag tggagggtgt ggagttctcg acgcctacaa actcctttac gtacagaggc 1200 agagggacag tggactcact gacagaactc ccacctgagg acaactctgt tcctccgagg 1260 gagggctact cgcaccggct ttgccatgcc accttcgtcc agaggtctgg cacgcctttt 1320 ctgaccactg gggttgtctt tagctggact caccgctcag cgacgctgac caacacaatc 1380 gacccagaga ggatcaatca gatccctctg gtgaagggct ttcgcgtttg gggtggcaca 1440 agcgtgatca ccggacctgg tttcactggt ggggatatcc tcagacgcaa tacgtttggc 1500 gatttcgtga gccttcaagt caacatcaat tccccaatca cccagagata tcggctccgc 1560 ttcagatacg cctcatccag agacgcaagg gtcatcgtcc ttactggagc agccagcacc 1620 ggagtcggag gccaagttag cgtcaacatg ccgttgcaga aaacgatgga aatcggtgaa 1680 aacctcacca gcagaacctt tcgctataca gatttcagca accctttctc cttcagagcc 1740 aatccggaca taatcggcat atccgagcag cccttgttcg gtgctgggtc catctcttct 1800 ggcgagctgt acatcgacaa gattgagatc attctcgcag atgcgactct ggaggctgaa 1860 tcggatcttg aaaggtga 1878 <210> 6 <211> 625 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 6 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Ala Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu 65 70 75 80 Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn 85 90 95 Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys 100 105 110 Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile 115 120 125 Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser 130 135 140 Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln 145 150 155 160 Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly 165 170 175 Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg 180 185 190 Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr 195 200 205 Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile 210 215 220 Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile 225 230 235 240 Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro 245 250 255 Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe 260 265 270 Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met 275 280 285 Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn 290 295 300 Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp 305 310 315 320 Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr 325 330 335 Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe 340 345 350 Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg 355 360 365 Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val 370 375 380 Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly 385 390 395 400 Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser 405 410 415 Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe 420 425 430 Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser 435 440 445 Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg 450 455 460 Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr 465 470 475 480 Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg 485 490 495 Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro 500 505 510 Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp 515 520 525 Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly 530 535 540 Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu 545 550 555 560 Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe 565 570 575 Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu 580 585 590 Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile 595 600 605 Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu 610 615 620 Arg 625 <210> 7 <211> 1878 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 7 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcat ggttggcctt 180 atcgacttcg tctggggaat tgtccagtgg gatgcgtttc tggtgcagat agagcagctg 240 atcaacgaga ggatcgctga gttcgcgaga aatgctgcaa tcgccaacct tgaagggctt 300 ggcaacaact tcaacatcta cgtggaggcg ttcaaggagt gggaagagga ccctaagaat 360 ccagcgacca gaacgagggt tatagatcgg ttccgcatcc tcgatggcct tttggagagg 420 gacatcccga gcttccgcat ttcgggattt gaggttcctc tgctctcagt ctacgctcaa 480 gctgctaatc tgcatctggc catcttgagg gattcagtca tctttggcga acgctggggt 540 cttacgacta tcaacgtgaa cgagaactac aatcggttga ttcggcacat agacgagtat 600 gccgaccact gtgctaacac ctacaatagg ggtctgaaca atctgccaaa gtcaacgtat 660 caagactgga taacctacaa taggctcaga cgggacctca ctctcaccgt gctggacata 720 gctgccttct ttccgaacta cgacaaccgg agatatccta ttcaacccgt tggtcagctc 780 actcgcgagg tctacaccga tcccctcatc aacttcaatc cccagctgca atcggtcgca 840 cagctgccca ccttcaatgt gatggaaaac tcagcgatcc ggaatcccca tctgtttgac 900 atacttaaca acctcactat cttcaccgat tggttttcag ttggacgcaa cttctactgg 960 ggagggcaca gagtgatttc aagcctcatt ggaggaggga acattacatc gcctatctat 1020 ggaagggagg ccaaccaaga gccaccaagg tctttcacct tcaacggtcc ggtgttcaga 1080 acacttagca atcccacatt gcgcttgctg caacagccgt ggccagcacc accattcaat 1140 ctgaggggag tggagggtgt ggagttctcg acgcctacaa actcctttac gtacagaggc 1200 agagggacag tggactcact gacagaactc ccacctgagg acaactctgt tcctccgagg 1260 gagggctact cgcaccggct ttgccatgcc accttcgtcc agaggtctgg cacgcctttt 1320 ctgaccactg gggttgtctt tagctggact caccgctcag cgacgctgac caacacaatc 1380 gacccagaga ggatcaatca gatccctctg gtgaagggct ttcgcgtttg gggtggcaca 1440 agcgtgatca ccggacctgg tttcactggt ggggatatcc tcagacgcaa tacgtttggc 1500 gatttcgtga gccttcaagt caacatcaat tccccaatca cccagagata tcggctccgc 1560 ttcagatacg cctcatccag agacgcaagg gtcatcgtcc ttactggagc agccagcacc 1620 ggagtcggag gccaagttag cgtcaacatg ccgttgcaga aaacgatgga aatcggtgaa 1680 aacctcacca gcagaacctt tcgctataca gatttcagca accctttctc cttcagagcc 1740 aatccggaca taatcggcat atccgagcag cccttgttcg gtgctgggtc catctcttct 1800 ggcgagctgt acatcgacaa gattgagatc attctcgcag atgcgactct ggaggctgaa 1860 tcggatcttg aaaggtga 1878 <210> 8 <211> 625 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 8 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Met Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu 65 70 75 80 Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn 85 90 95 Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys 100 105 110 Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile 115 120 125 Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser 130 135 140 Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln 145 150 155 160 Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly 165 170 175 Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg 180 185 190 Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr 195 200 205 Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile 210 215 220 Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile 225 230 235 240 Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro 245 250 255 Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe 260 265 270 Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met 275 280 285 Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn 290 295 300 Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp 305 310 315 320 Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr 325 330 335 Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe 340 345 350 Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg 355 360 365 Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val 370 375 380 Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly 385 390 395 400 Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser 405 410 415 Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe 420 425 430 Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser 435 440 445 Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg 450 455 460 Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr 465 470 475 480 Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg 485 490 495 Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro 500 505 510 Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp 515 520 525 Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly 530 535 540 Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu 545 550 555 560 Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe 565 570 575 Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu 580 585 590 Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile 595 600 605 Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu 610 615 620 Arg 625 <210> 9 <211> 1887 <212> DNA <213> Bacillus thuringiensis <400> 9 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180 atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240 gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300 gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360 cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540 cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600 gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660 tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780 ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900 ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020 cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380 aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500 acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740 ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800 atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860 gaggctgaat cggatcttga aaggtga 1887 <210> 10 <211> 628 <212> PRT <213> Bacillus thuringiensis <400> 10 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg 625 <210> 11 <211> 1887 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 11 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg ccggcttcct tgttggcctt 180 atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240 gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300 gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360 cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540 cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600 gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660 tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780 ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900 ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020 cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380 aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500 acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740 ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800 atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860 gaggctgaat cggatcttga aaggtga 1887 <210> 12 <211> 628 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 12 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Ala Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg 625 <210> 13 <211> 1887 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 13 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcat ggttggcctt 180 atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240 gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300 gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360 cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540 cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600 gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660 tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780 ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900 ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020 cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380 aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500 acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740 ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800 atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860 gaggctgaat cggatcttga aaggtga 1887 <210> 14 <211> 628 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 14 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Met Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg 625 <210> 15 <211> 1887 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 15 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcgc cgttggcctt 180 atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240 gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300 gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360 cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540 cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600 gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660 tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780 ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900 ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020 cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380 aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500 acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740 ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800 atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860 gaggctgaat cggatcttga aaggtga 1887 <210> 16 <211> 628 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 16 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Ala Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg 625 <210> 17 <211> 1887 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 17 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180 atcgacttcg tctggggaat tttcggaccc tcccagtggg atgcgtttct ggtgcagata 240 gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300 gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360 cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540 cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600 gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660 tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780 ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900 ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020 cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380 aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500 acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740 ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800 atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860 gaggctgaat cggatcttga aaggtga 1887 <210> 18 <211> 628 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 18 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg 625 <210> 19 <211> 1887 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 19 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180 atcgacttcg tctggggaat tatcggaccc tcccagtggg atgcgtttct ggtgcagata 240 gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300 gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360 cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540 cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600 gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660 tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780 ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900 ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020 cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380 aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500 acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740 ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800 atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860 gaggctgaat cggatcttga aaggtga 1887 <210> 20 <211> 628 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 20 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Ile Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg 625 <210> 21 <211> 1887 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 21 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180 atcgacttcg tctggggaat tgtcggaccc tcccaggcgg atgcgtttct ggtgcagata 240 gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300 gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360 cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540 cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600 gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660 tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780 ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900 ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020 cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380 aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500 acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740 ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800 atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860 gaggctgaat cggatcttga aaggtga 1887 <210> 22 <211> 628 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 22 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Ala Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg 625 <210> 23 <211> 1887 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 23 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180 atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240 gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300 gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360 cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540 cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600 gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660 tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780 ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900 ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020 cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380 aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500 acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740 ttcagagcca atccggacat aatcggcata tccgagcagc ccttgatggg tgctgggtcc 1800 atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860 gaggctgaat cggatcttga aaggtga 1887 <210> 24 <211> 628 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 24 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Met Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg 625 <210> 25 <211> 1887 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 25 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180 atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240 gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300 gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360 cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540 cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600 gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660 tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780 ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900 ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020 cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380 aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500 acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740 ttcagagcca atccggacat aatcggcata tccgagcagc ccttggccgg tgctgggtcc 1800 atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860 gaggctgaat cggatcttga aaggtga 1887 <210> 26 <211> 628 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 26 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Ala Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg 625 <210> 27 <211> 1887 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 27 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg ccggcttcct tgttggcctt 180 atcgacttcg tctggggaat tgtcggaccc tcccagatgg atgcgtttct ggtgcagata 240 gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300 gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360 cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540 cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600 gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660 tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780 ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900 ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020 cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380 aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500 acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740 ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800 atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860 gaggctgaat cggatcttga aaggtga 1887 <210> 28 <211> 628 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 28 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Ala Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Met Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg 625 <210> 29 <211> 1887 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 29 atggataaca accccaacat taacgagtgc atcccctaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccataga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggatta 180 atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240 gagcaattaa ttaatgaaag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300 gaagggcttg gcaacaactt caacatctac gtggaagcat ttaaggagtg ggaagaggac 360 cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540 cgctggggtc ttacgactat caacgtgaat gaaaactaca atcggttgat tcggcacata 600 gacgagtatg ccgaccactg tgctaacacc tacaataggg gattaaataa tctgccaaag 660 tcaacgtatc aagactggat aacatataat aggctcagac gggacctcac tctcaccgtg 720 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780 ggtcagctca ctcgcgaggt ctacaccgat ccattaatta atttcaatcc ccagctgcaa 840 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900 ctctttgaca tacttaataa tctcactatc ttcaccgatt ggttttcagt tggacgcaac 960 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020 cctatctatg gaagggaggc caaccaggag ccaccaaggt ctttcacctt caacggtccg 1080 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380 aatacaatcg acccagagag aattaatcaa atccctctgg tgaagggctt tcgcgtttgg 1440 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500 acgtttggcg atttcgtgag ccttcaagtc aacattaatt ccccaatcac ccagagatat 1560 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740 ttcagagcca atccggatat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800 atctcttcag gcgagctgta catcgataaa attgagatca ttctcgcaga tgcgactctc 1860 gaggctgaat cggatcttga aaggtga 1887 <210> 30 <211> 628 <212> PRT <213> Bacillus thuringiensis <400> 30 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg 625 <210> 31 <211> 1887 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 31 atggataaca acccgaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60 gaggtgctgc tggacggcga gaggatctca accggcaaca gcagcatcga catcagcctg 120 tccctggtgc agttcctggt gagcaacttc gtgccgggcg gcggcttcct ggtgggatta 180 atcgacttcg tgtggggcat cgtcggcccg tcccagtggg acgccttcct ggttcagatc 240 gagcaattaa ttaatgaaag gatagcagag ttcgcgagga acgcggccat cgccaacctg 300 gagggcctgg gcaacaactt caacatctac gtggaagcat ttaaggagtg ggaggaggac 360 cccaagaacc cggccacgag gacgagggtg atcgaccgct ttcgcatcct ggacggcctg 420 ctggagaggg acatcccgtc cttcagaatc agcggcttcg aggtcccgct gctgtccgtg 480 tacgcgcaag cggccaacct gcacctggcg atcctgaggg actccgtgat attcggcgag 540 aggtggggcc tgaccaccat caacgtgaat gaaaactaca accggctgat aaggcacatc 600 gacgagtacg ccgaccactg cgccaacacc tacaataggg gattaaataa tctgcccaag 660 agcacctacc aagactggat cacatataac cggctgagga gggacctgac cctgaccgtg 720 ctggacatcg ccgcgttctt cccgaactac gacaataggc gctacccgat ccagccggtg 780 ggccagctga cccgcgaggt gtacaccgac ccattaatta atttcaaccc gcagctccag 840 tccgtggccc agctgccgac cttcaacgtg atggagaaca gcgccatccg gaacccgcac 900 ctgttcgaca tcctgaataa tctgaccatc ttcaccgact ggttctcagt gggccggaac 960 ttctactggg gcggccatag ggtgatctcc agcctgatcg gcggcggcaa catcacctcc 1020 ccgatctacg ggagggaggc gaaccaggag ccgccgaggt ccttcacctt caacggcccg 1080 gtgtttagga ccctgtccaa cccgaccctg aggctgctcc agcagccgtg gccggcgccg 1140 ccgttcaacc tgaggggcgt ggagggcgtg gagttcagca ccccgaccaa cagcttcacc 1200 taccggggga ggggcaccgt ggactcactg accgagctgc cgccggagga caacagcgtg 1260 ccgccgaggg agggctacag ccataggctg tgccacgcca ccttcgtgca gaggagcggc 1320 accccgttct tgacgaccgg cgtggtgttc tcctggaccc accggagcgc gaccctgacc 1380 aatacaatcg acccggagag aattaatcaa atcccgctgg tgaagggctt ccgggtgtgg 1440 ggcggcacct ccgtgatcac cgggccgggc tttaccggcg gcgacatcct gaggaggaac 1500 acgttcggcg acttcgtgag cctccaagtg aacattaata gcccgatcac ccagcgctac 1560 cggctgaggt tccgctacgc gtcaagccgc gacgcgaggg tgatcgtgct gaccggcgcg 1620 gcctcaaccg gcgtgggcgg ccaagtgtcc gtgaacatgc cgctgcaaaa gacgatggag 1680 atcggcgaga acctgacctc aaggaccttc cgctacaccg acttcagcaa cccgttcagc 1740 tttagggcca acccggatat aatcggcatc agcgagcagc cgctgttcgg cgccggctcc 1800 atctcaagcg gcgagctgta catcgataaa atcgagatca tcctggcgga cgcgaccttg 1860 gaggccgagt ccgacctgga gaggtga 1887 <210> 32 <211> 628 <212> PRT <213> Bacillus thuringiensis <400> 32 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg 625 <210> 33 <211> 1887 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 33 atggacaaca atcccaatat caatgagtgc atcccataca actgcctttc aaatcccgag 60 gaagtcttac tggatgggga aaggattagc actggcaatt ccagcattga catttccttg 120 agtctcgttc aattccttgt gagcaacttt gtgcctggcg gagggttctt ggttggtctc 180 atagactttg tttggggaat tgtaggacca tcacagtggg atgccttctt agtccagatt 240 gaacagctta tcaatgagag aatagctgag ttcgcaagaa atgctgcaat cgctaacttg 300 gagggactcg gcaacaactt caacatctac gtggaggctt tcaaagaatg ggaagaagat 360 cctaagaatc cagctactag gactagagtc atcgataggt ttaggattct tgatgggctg 420 ttggagcgtg acattccttc ctttaggatt agtggcttcg aggttcctct cctttctgtc 480 tatgctcaag cagccaatct ccatctcgcc attctccgtg attcagtaat cttcggagaa 540 agatggggtt tgacaacgat caatgtgaat gagaactaca acagattgat cagacacatt 600 gatgagtatg ctgatcattg tgctaacaca tacaacagag ggcttaacaa cctcccgaaa 660 tcaacatatc aagattggat aacctacaat agattgagga gggatctcac actgactgta 720 ctcgacattg ctgctttctt tcccaactac gataaccgta gatatcccat tcaacccgtc 780 ggacaactca ctcgtgaagt gtacacagat ccccttatca acttcaaccc acagttacaa 840 agtgttgcac agctgccaac cttcaatgtg atggaaaact ctgccattag gaatccacat 900 ctgtttgaca tacttaacaa cttgactatc tttacggatt ggtttagtgt ggggaggaac 960 ttctattggg gaggtcacag agtgattagc tctcttatcg gaggtgggaa cattacttca 1020 ccaatctatg gacgtgaagc aaatcaagaa ccaccacgtt cattcacctt caatggaccc 1080 gttttcagaa cactgtccaa tccgactctg agactgttgc agcaaccttg gccagcacct 1140 cctttcaact tgaggggtgt agagggagtc gagttttcca cacctactaa cagtttcacc 1200 tataggggtc gtggaactgt tgattctctt actgaacttc ctccagagga caattctgtt 1260 cctccgaggg aaggctattc acaccgtttg tgtcatgcaa cttttgttca gaggtctggc 1320 acacctttct taacaactgg cgtcgttttc agctggacac ataggagtgc aaccctcacg 1380 aatactatcg atccagagag aatcaatcag attcctcttg ttaagggctt tagggtgtgg 1440 ggtgggacct cagtgataac tggtcccggt ttcaccggag gagacatact tagaaggaac 1500 acctttgggg atttcgtttc tcttcaagta aacatcaatt ctcctatcac ccagagatac 1560 agacttaggt ttagatatgc tagtagccgt gacgccagag tcatagtgtt gactggtgct 1620 gcatcaactg gtgttggtgg gcaagtttca gtgaacatgc cacttcaaaa gacaatggag 1680 ataggtgaga acttgacgtc cagaaccttc agatacactg acttttctaa tcctttctct 1740 tttcgtgcta atccagacat cataggaatc agtgaacaac cgttgtttgg agctggttcc 1800 atttctagtg gagaattgta cattgacaag attgagatca tacttgccga tgccacgctc 1860 gaggctgaat ctgatctcga aaggtga 1887 <210> 34 <211> 628 <212> PRT <213> Bacillus thuringiensis <400> 34 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg 625 <210> 35 <211> 3495 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 35 atggacaaca atcccaatat caatgagtgc atcccataca actgcctttc aaatcccgag 60 gaagtcttac tggatgggga aaggattagc actggcaatt ccagcattga catttccttg 120 agtctcgttc aattccttgt gagcaacttt gtgcctggcg gagggttctt ggttggtctc 180 atagactttg tttggggaat tgtaggacca tcacagtggg atgccttctt agtccagatt 240 gaacagctta tcaatgagag aatagctgag ttcgcaagaa atgctgcaat cgctaacttg 300 gagggactcg gcaacaactt caacatctac gtggaggctt tcaaagaatg ggaagaagat 360 cctaagaatc cagctactag gactagagtc atcgataggt ttaggattct tgatgggctg 420 ttggagcgtg acattccttc ctttaggatt agtggcttcg aggttcctct cctttctgtc 480 tatgctcaag cagccaatct ccatctcgcc attctccgtg attcagtaat cttcggagaa 540 agatggggtt tgacaacgat caatgtgaat gagaactaca acagattgat cagacacatt 600 gatgagtatg ctgatcattg tgctaacaca tacaacagag ggcttaacaa cctcccgaaa 660 tcaacatatc aagattggat aacctacaat agattgagga gggatctcac actgactgta 720 ctcgacattg ctgctttctt tcccaactac gataaccgta gatatcccat tcaacccgtc 780 ggacaactca ctcgtgaagt gtacacagat ccccttatca acttcaaccc acagttacaa 840 agtgttgcac agctgccaac cttcaatgtg atggaaaact ctgccattag gaatccacat 900 ctgtttgaca tacttaacaa cttgactatc tttacggatt ggtttagtgt ggggaggaac 960 ttctattggg gaggtcacag agtgattagc tctcttatcg gaggtgggaa cattacttca 1020 ccaatctatg gacgtgaagc aaatcaagaa ccaccacgtt cattcacctt caatggaccc 1080 gttttcagaa cactgtccaa tccgactctg agactgttgc agcaaccttg gccagcacct 1140 cctttcaact tgaggggtgt agagggagtc gagttttcca cacctactaa cagtttcacc 1200 tataggggtc gtggaactgt tgattctctt actgaacttc ctccagagga caattctgtt 1260 cctccgaggg aaggctattc acaccgtttg tgtcatgcaa cttttgttca gaggtctggc 1320 acacctttct taacaactgg cgtcgttttc agctggacac ataggagtgc aaccctcacg 1380 aatactatcg atccagagag aatcaatcag attcctcttg ttaagggctt tagggtgtgg 1440 ggtgggacct cagtgataac tggtcccggt ttcaccggag gagacatact tagaaggaac 1500 acctttgggg atttcgtttc tcttcaagta aacatcaatt ctcctatcac ccagagatac 1560 agacttaggt ttagatatgc tagtagccgt gacgccagag tcatagtgtt gactggtgct 1620 gcatcaactg gtgttggtgg gcaagtttca gtgaacatgc cacttcaaaa gacaatggag 1680 ataggtgaga acttgacgtc cagaaccttc agatacactg acttttctaa tcctttctct 1740 tttcgtgcta atccagacat cataggaatc agtgaacaac cgttgtttgg agctggttcc 1800 atttctagtg gagaattgta cattgacaag attgagatca tacttgccga tgccacgctc 1860 gaggctgaat ctgatctcga aagggcacag aaagctgtaa acgcattgtt tacaagttct 1920 aatcaaatcg gactcaaaac cgatgttacg gactatcaca tagatagggt ttctaatctt 1980 gtggaatgtc tttcagatga gttttgttta gatgagaaga aagaactttc agaaaaggtc 2040 aagcacgcca aaagactgtc cgatgaaagg aatctccttc aagacccaaa ctttcgtgga 2100 atcaataggc agctcgacag aggttggaga gggagcacag atatcaccat tcaaggagga 2160 gatgacgttt tcaaagagaa ctatgtcacc ttgttaggca cctttgatga gtgctatcca 2220 acttatctgt atcagaagat tgatgaatcc aagctgaagg cttacacaag atatcagctc 2280 agaggataca tcgaggactc ccaagatttg gagatatact tgattcgtta caatgcaaaa 2340 catgagaccg tgaatgttcc tggtactgga agtctctggc cactgtctgc tccgtcacct 2400 attgggaaat gtgcccatca ctcccaccat ttctcattgg acatagacgt tggctgcaca 2460 gatttgaatg aagatttggg tgtttgggtc atcttcaaga tcaaaactca agacggacac 2520 gctcgtttag gaaacttaga gtttcttgaa gagaagccct tggttgggga ggcacttgcc 2580 agagtaaaga gagctgaaaa gaagtggaga gataagaggg agaaacttga gtgggagact 2640 aacattgtgt acaaggaagc caaagaaagc gtggatgctc ttttcgtgaa ctctcagtat 2700 gataggttac aagcagacac caacatagca atgatacatg cagctgacaa aagagtccat 2760 tctattcgtg aggcttactt gccagaactt agtgtgattc ccggtgtcaa cgctgccatt 2820 ttcgaggaat tggaaggaag aatctttacg gctttcagcc tctatgacgc taggaatgtt 2880 atcaagaatg gtgatttcaa caatggcctc tcatgttgga atgtgaaagg tcatgttgat 2940 gtagaggagc aaaacaatca ccgtagcgtg ctggttgtcc cagaatggga agccgaagta 3000 agccaagaag ttagagtttg ccctggaaga ggctacattc tgcgtgtcac cgcttacaaa 3060 gaaggatatg gcgaagggtg cgtgactatt catgagattg agaacaatac tgacgaactt 3120 aagttttcaa actgcgtcga ggaggaagtg tatcctaaca acacagtgac ttgtaatgac 3180 tatacagcaa cgcaagagga atacgagggg acatacacca gtcgtaatcg tggttatgat 3240 ggtgcttatg aaagcaattc atccgttcca gctgactatg ccagtgccta cgaagagaag 3300 gcttacacgg atggcagaag agataaccca tgtgagtcca acagaggtta tggtgattac 3360 actcctcttc cagctggtta cgtgactaaa gagttagagt actttccgga gactgataag 3420 gtttggattg aaatcggaga gacagaaggg acattcatag tagattcagt tgagcttctt 3480 ctcatggaag aatga 3495 <210> 36 <211> 1164 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 36 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser 625 630 635 640 Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Arg 645 650 655 Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu 660 665 670 Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp 675 680 685 Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile Asn Arg Gln 690 695 700 Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly 705 710 715 720 Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp 725 730 735 Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu 740 745 750 Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln 755 760 765 Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val 770 775 780 Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Pro Ser Pro 785 790 795 800 Ile Gly Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp 805 810 815 Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe 820 825 830 Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe 835 840 845 Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg 850 855 860 Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr 865 870 875 880 Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val 885 890 895 Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile 900 905 910 His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro 915 920 925 Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu 930 935 940 Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val 945 950 955 960 Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys 965 970 975 Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val 980 985 990 Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro 995 1000 1005 Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr 1010 1015 1020 Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp 1025 1030 1035 Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asn 1040 1045 1050 Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu Tyr 1055 1060 1065 Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr 1070 1075 1080 Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu 1085 1090 1095 Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Ser 1100 1105 1110 Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val 1115 1120 1125 Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile 1130 1135 1140 Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu 1145 1150 1155 Leu Leu Leu Met Glu Glu 1160 <210> 37 <211> 3495 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 37 atggataaca atccgaacat caatgaatgc atcccgtaca actgcctgag caacccggaa 60 gaagtgctgt tggatggaga acggatatca actggtaatt catcaattga tatttctctg 120 tcacttgttc agtttctggt atctaacttc gtcccaggcg gaggattcct ggttggatta 180 atagattttg tatggggaat agttggccct tctcaatggg atgcatttct agtacaaatt 240 gaacaattaa ttaatgaaag aatagctgaa tttgctagga atgctgctat tgctaattta 300 gaaggattag gaaacaattt caatatatat gtggaagcat ttaaagaatg ggaagaagat 360 cctaagaatc cagcaaccag gaccagagta attgatcgct ttcgtatact tgatgggcta 420 cttgaaaggg acattccttc gtttcgaatt tctggatttg aagtacccct tttatccgtt 480 tatgctcaag cggccaatct gcatctagct atattaagag attctgtaat ttttggagaa 540 agatggggat tgacaacgat aaatgtcaat gaaaactata atagactaat taggcatatt 600 gatgaatatg ctgatcactg tgcaaatacg tataatcggg gattaaataa tttaccgaaa 660 tctacgtatc aagattggat aacatataat cgattgcgga gagacttaac attgactgta 720 ttagatatcg ccgctttctt tccaaactat gacaatagga gatatccaat tcagccagtt 780 ggtcaactaa caagggaagt ttatacggac ccattaatta attttaatcc acagttacag 840 tctgtagctc aattacctac ttttaacgtt atggagaaca gcgcaattag aaatcctcat 900 ttatttgata tattgaataa tcttacaatc tttacggatt ggtttagtgt tggacgcaat 960 ttttattggg gaggacatcg agtaatatct agccttatag gaggtggtaa cataacatct 1020 cctatatatg gaagagaggc gaaccaggag cctccaagat cctttacttt taatggaccg 1080 gtatttagga ctttatcaaa tcctacttta cgattattac agcaaccttg gccagcgcca 1140 ccatttaatt tacgtggtgt tgaaggagta gaattttcta cacctacaaa tagctttacg 1200 tatcgaggaa gaggtacggt tgattcttta actgaattgc cgcctgagga taatagtgtg 1260 ccacctcgcg aaggatatag tcatcgttta tgtcatgcaa cttttgttca aagatctgga 1320 acaccttttt taacaactgg tgtagtattt tcttggacgc atcgtagtgc aactcttaca 1380 aatacaattg atccagagag aattaatcaa atacctttag tgaaaggatt tagagtttgg 1440 gggggcacct ctgtcattac aggaccagga tttacaggag gggatatcct tcgaagaaat 1500 acctttggtg attttgtatc tctacaagtc aatattaatt caccaattac ccaaagatac 1560 cgtttaagat ttcgttacgc ttccagtagg gatgcacgag ttatagtatt aacaggagcg 1620 gcatccacag gagtgggagg ccaagttagt gtaaatatgc ctcttcagaa aactatggaa 1680 ataggggaga acttaacatc tagaacattt agatataccg attttagtaa tcctttttca 1740 tttagagcta atccagatat aattgggata agtgaacaac ctctatttgg tgcaggttct 1800 attagtagcg gtgaacttta tatagataaa attgaaatta ttctagcaga tgcaacattt 1860 gaagcagaat ctgatttaga aagagcacaa aaggcggtga atgccctgtt tacttcttcc 1920 aatcaaatcg ggttaaaaac cgatgtgacg gactatcata tcgatcgagt atccaattta 1980 gttgagtgtt tatctgatga attttgtctg gatgaaaaaa aagaattgtc cgagaaagtc 2040 aaacatgcga agcgacttag tgatgagcgg aatttacttc aagatccaaa ctttagaggg 2100 atcaatagac aactagaccg tggctggaga ggaagtacgg atattaccat ccaaggaggc 2160 gatgacgtat ccaaagagaa ttacgttacg ctattgggta cctttgatga gtgctactta 2220 acgtatttat atcaaaaaat agatgagtcg aaattaaaag cctatacccg ttaccaatta 2280 agagggtata tcgaagatag tcaagactta gaaatctatt taattcgcta caatgccaaa 2340 cacgaaacag taaatgtgcc aggtacgggt tccttatggc cgctttcagc cccaagtcca 2400 atcggaaaat gtgcccatca ttcccatcat ttctccttgg acattgatgt tggatgtaca 2460 gacttaaatg aggacttagg tgtatgggtg atattcaaga ttaagacgca agatggccat 2520 gcaagactag gaaatctaga atttctcgaa gagaaaccat tagtaggaga agcactagct 2580 cgtgtgaaaa gagcggagaa aaaatggaga gacaaacgtg aaaaattgga atgggaaaca 2640 aatattgttt ataaagaggc aaaagaatct gtagatgctt tatttgtaaa ctctcaatat 2700 gatagattac aagcggatac caacatcgcg atgattcatg cggcagataa acgcgttcat 2760 agcattcgag aagcttatct gcctgagctg tctgtgattc cgggtgtcaa tgcggctatt 2820 tttgaagaat tagaagggcg tattttcact gcattctccc tatatgatgc gagaaatgtc 2880 attaaaaatg gtgattttaa taatggctta tcctgctgga acgtgaaagg gcatgtagat 2940 gtagaagaac aaaacaacca ccgttcggtc cttgttgttc cggaatggga agcagaagtg 3000 tcacaagaag ttcgtgtctg tccgggtcgt ggctatatcc ttcgtgtcac agcgtacaag 3060 gagggatatg gagaaggttg cgtaaccatt catgagatcg agaacaatac agacgaactg 3120 aagtttagca actgtgtaga agaggaagta tatccaaaca acacggtaac gtgtaatgat 3180 tatactgcga ctcaagaaga atatgagggt acgtacactt ctcgtaatcg aggatatgac 3240 ggagcctatg aaagcaattc ttctgtacca gctgattatg catcagccta tgaagaaaaa 3300 gcatatacag atggacgaag agacaatcct tgtgaatcta acagaggata tggggattac 3360 acaccactac cagctggcta tgtgacaaaa gaattagagt acttcccaga aaccgataag 3420 gtatggattg agatcggaga aacggaagga acattcatcg tggacagcgt ggaattactt 3480 cttatggagg aataa 3495 <210> 38 <211> 1164 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 38 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser 625 630 635 640 Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Arg 645 650 655 Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu 660 665 670 Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp 675 680 685 Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile Asn Arg Gln 690 695 700 Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly 705 710 715 720 Asp Asp Val Ser Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp 725 730 735 Glu Cys Tyr Leu Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu 740 745 750 Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln 755 760 765 Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val 770 775 780 Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Pro Ser Pro 785 790 795 800 Ile Gly Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp 805 810 815 Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe 820 825 830 Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe 835 840 845 Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg 850 855 860 Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr 865 870 875 880 Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val 885 890 895 Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile 900 905 910 His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro 915 920 925 Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu 930 935 940 Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val 945 950 955 960 Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys 965 970 975 Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val 980 985 990 Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro 995 1000 1005 Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr 1010 1015 1020 Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp 1025 1030 1035 Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asn 1040 1045 1050 Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu Tyr 1055 1060 1065 Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr 1070 1075 1080 Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu 1085 1090 1095 Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Ser 1100 1105 1110 Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val 1115 1120 1125 Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile 1130 1135 1140 Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu 1145 1150 1155 Leu Leu Leu Met Glu Glu 1160 <210> 39 <211> 2109 <212> DNA <213> Artificial Sequence <220> <223> synthesized coding region <400> 39 atggcacaga gcagtaggat ctgccacggt gtgcagaacc cgtgcgtgat catctcgaac 60 ctgagcaagt ccaaccagaa caagtcaccg ttctccgtgt ccctcaagac ccaccagcac 120 ccgagagcct acccgatcag cagctcctgg ggactgaaga agagtggcat gaccctgatc 180 ggctccgagc tgagaccgct gaaggtgatg tccagcgtgt cagcggataa caacccgaac 240 atcaacgagt gcatccccta caactgcctg agcaaccccg aggaggtgct gctggacggc 300 gagaggatct caaccggcaa cagcagcatc gacatcagcc tgtccctggt gcagttcctg 360 gtgagcaact tcgtgccggg cggcggcttc ctggtgggat taatcgactt cgtgtggggc 420 atcgtcggcc cgtcccagtg ggacgccttc ctggttcaga tcgagcaatt aattaatgaa 480 aggatagcag agttcgcgag gaacgcggcc atcgccaacc tggagggcct gggcaacaac 540 ttcaacatct acgtggaagc atttaaggag tgggaggagg accccaagaa cccggccacg 600 aggacgaggg tgatcgaccg ctttcgcatc ctggacggcc tgctggagag ggacatcccg 660 tccttcagaa tcagcggctt cgaggtcccg ctgctgtccg tgtacgcgca agcggccaac 720 ctgcacctgg cgatcctgag ggactccgtg atattcggcg agaggtgggg cctgaccacc 780 atcaacgtga atgaaaacta caaccggctg ataaggcaca tcgacgagta cgccgaccac 840 tgcgccaaca cctacaatag gggattaaat aatctgccca agagcaccta ccaagactgg 900 atcacatata accggctgag gagggacctg accctgaccg tgctggacat cgccgcgttc 960 ttcccgaact acgacaatag gcgctacccg atccagccgg tgggccagct gacccgcgag 1020 gtgtacaccg acccattaat taatttcaac ccgcagctcc agtccgtggc ccagctgccg 1080 accttcaacg tgatggagaa cagcgccatc cggaacccgc acctgttcga catcctgaat 1140 aatctgacca tcttcaccga ctggttctca gtgggccgga acttctactg gggcggccat 1200 agggtgatct ccagcctgat cggcggcggc aacatcacct ccccgatcta cgggagggag 1260 gcgaaccagg agccgccgag gtccttcacc ttcaacggcc cggtgtttag gaccctgtcc 1320 aacccgaccc tgaggctgct ccagcagccg tggccggcgc cgccgttcaa cctgaggggc 1380 gtggagggcg tggagttcag caccccgacc aacagcttca cctaccgggg gaggggcacc 1440 gtggactcac tgaccgagct gccgccggag gacaacagcg tgccgccgag ggagggctac 1500 agccataggc tgtgccacgc caccttcgtg cagaggagcg gcaccccgtt cttgacgacc 1560 ggcgtggtgt tctcctggac ccaccggagc gcgaccctga ccaatacaat cgacccggag 1620 agaattaatc aaatcccgct ggtgaagggc ttccgggtgt ggggcggcac ctccgtgatc 1680 accgggccgg gctttaccgg cggcgacatc ctgaggagga acacgttcgg cgacttcgtg 1740 agcctccaag tgaacattaa tagcccgatc acccagcgct accggctgag gttccgctac 1800 gcgtcaagcc gcgacgcgag ggtgatcgtg ctgaccggcg cggcctcaac cggcgtgggc 1860 ggccaagtgt ccgtgaacat gccgctgcaa aagacgatgg agatcggcga gaacctgacc 1920 tcaaggacct tccgctacac cgacttcagc aacccgttca gctttagggc caacccggat 1980 ataatcggca tcagcgagca gccgctgttc ggcgccggct ccatctcaag cggcgagctg 2040 tacatcgata aaatcgagat catcctggcg gacgcgacct tggaggccga gtccgacctg 2100 gagaggtga 2109 <210> 40 <211> 702 <212> PRT <213> Artificial Sequence <220> <223> translated from synthesized coding region <400> 40 Met Ala Gln Ser Ser Arg Ile Cys His Gly Val Gln Asn Pro Cys Val 1 5 10 15 Ile Ile Ser Asn Leu Ser Lys Ser Asn Gln Asn Lys Ser Pro Phe Ser 20 25 30 Val Ser Leu Lys Thr His Gln His Pro Arg Ala Tyr Pro Ile Ser Ser 35 40 45 Ser Trp Gly Leu Lys Lys Ser Gly Met Thr Leu Ile Gly Ser Glu Leu 50 55 60 Arg Pro Leu Lys Val Met Ser Ser Val Ser Ala Asp Asn Asn Pro Asn 65 70 75 80 Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu Ser Asn Pro Glu Glu Val 85 90 95 Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly Asn Ser Ser Ile Asp Ile 100 105 110 Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn Phe Val Pro Gly Gly 115 120 125 Gly Phe Leu Val Gly Leu Ile Asp Phe Val Trp Gly Ile Val Gly Pro 130 135 140 Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu Ile Asn Glu 145 150 155 160 Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn Leu Glu Gly 165 170 175 Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys Glu Trp Glu 180 185 190 Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile Asp Arg Phe 195 200 205 Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg Ile 210 215 220 Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn 225 230 235 240 Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly Glu Arg Trp 245 250 255 Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile Arg 260 265 270 His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Asn Arg Gly 275 280 285 Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile Thr Tyr Asn 290 295 300 Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile Ala Ala Phe 305 310 315 320 Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro Val Gly Gln 325 330 335 Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe Asn Pro Gln 340 345 350 Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Glu Asn Ser 355 360 365 Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn Leu Thr Ile 370 375 380 Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly His 385 390 395 400 Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr Ser Pro Ile 405 410 415 Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe Asn 420 425 430 Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu Gln 435 440 445 Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Glu Gly Val 450 455 460 Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly Thr 465 470 475 480 Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro Pro 485 490 495 Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln Arg 500 505 510 Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr His 515 520 525 Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg Ile Asn Gln 530 535 540 Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val Ile 545 550 555 560 Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr Phe 565 570 575 Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro Ile Thr Gln 580 585 590 Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val 595 600 605 Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly Gln Val Ser 610 615 620 Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu Asn Leu Thr 625 630 635 640 Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg 645 650 655 Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly Ala 660 665 670 Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile Ile 675 680 685 Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu Arg 690 695 700

Claims

서열식별번호: 2의 잔기 2 내지 68을 포함하며, 여기서 서열식별번호: 2의 아미노산 잔기 54는 Gly 및 Ala로 이루어진 군으로부터 선택되고, 서열식별번호: 2의 아미노산 잔기 57은 Leu 및 Met로 이루어진 군으로부터 선택되고, 서열식별번호: 2의 아미노산 잔기 68은 Val, Phe, 및 Ile로 이루어진 군으로부터 선택되는 것인, 변형된 Cry1Ca 독소.
서열식별번호: 10의 잔기 2 내지 628을 포함하며, 여기서 서열식별번호: 2의 아미노산 잔기 54는 Gly 및 Ala로 이루어진 군으로부터 선택되고, 서열식별번호: 2의 아미노산 잔기 57은 Leu 및 Met로 이루어진 군으로부터 선택되고, 서열식별번호: 2의 아미노산 잔기 68은 Val, Phe, 및 Ile로 이루어진 군으로부터 선택되고, 서열식별번호: 2의 아미노산 잔기 73은 Trp, Ala 및 Met로 이루어진 군으로부터 선택되고, 서열식별번호: 2의 아미노산 잔기 596은 Phe, Met 및 Ala로 이루어진 군으로부터 선택되고, 서열식별번호: 2의 아미노산 잔기 620은 Leu 및 Phe로 이루어진 군으로부터 선택되는 것인 변형된 Cry1Ca 독소.
제1항에 있어서, 서열식별번호: 36의 아미노산 잔기 629 내지 1164로 이루어진 카르복시 말단 연장부를 추가로 포함하는 변형된 Cry1Ca 독소.
제2항에 있어서, 서열식별번호: 36의 아미노산 잔기 629 내지 1164로 이루어진 카르복시 말단 연장부를 추가로 포함하는 변형된 Cry1Ca 독소.
제1항에 있어서, 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 변형된 Cry1Ca 독소.
제2항에 있어서, 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 변형된 Cry1Ca 독소.
제3항에 있어서, 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 변형된 Cry1Ca 독소.
제4항에 있어서, 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 변형된 Cry1Ca 독소.
서열식별번호: 2, 서열식별번호: 4, 서열식별번호: 6, 서열식별번호: 8, 서열식별번호: 10, 서열식별번호: 12, 서열식별번호: 14, 서열식별번호: 16, 서열식별번호: 18, 서열식별번호: 20, 서열식별번호: 22, 서열식별번호: 24, 서열식별번호: 26, 서열식별번호: 28, 서열식별번호: 30, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 36, 서열식별번호: 38, 및 서열식별번호: 40으로 이루어진 군으로부터 선택되는 변형된 Cry1Ca 독소.
제1항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
제2항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
제3항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
제4항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
제5항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
제6항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
제7항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
제8항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
서열식별번호: 1, 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25, 서열식별번호: 27, 서열식별번호: 29, 서열식별번호: 31, 서열식별번호: 33, 서열식별번호: 35, 서열식별번호: 37, 및 서열식별번호: 39로 이루어진 군으로부터 선택되는 핵산 서열.
제1항 내지 제9항 중 어느 한 항의 변형된 Cry1Ca 독소 중 하나 이상을 생산할 수 있는 트랜스제닉 식물, 식물 부분 또는 종자.
제19항에 있어서, 메이즈, 해바라기, 대두, 목화, 카놀라, 벼, 수수, 밀, 보리, 채소, 관상식물, 페퍼, 사탕무, 과일 및 잔디풀로 이루어진 군으로부터 선택된 트랜스제닉 식물, 식물 부분 또는 종자.
제19항에 있어서, 메이즈, 대두 및 목화로 이루어진 군으로부터 선택된 트랜스제닉 식물, 식물 부분 또는 종자.
제19항에 있어서, 메이즈인 트랜스제닉 식물, 식물 부분 또는 종자.
제19항에 있어서, 대두인 트랜스제닉 식물, 식물 부분 또는 종자.
제19항에 있어서, 목화인 트랜스제닉 식물, 식물 부분 또는 종자.
하나 이상의 변형된 Cry1Ca 독소를 발현하는 트랜스제닉 식물을 성장시키고, 감수성 해충을 상기 트랜스제닉 식물 상에서 섭식시키는 것을 포함하는, 식물 곤충 해충을 방제하는 방법.
제25항에 있어서, 하나 이상의 변형된 Cry1Ca 독소가 제1항 내지 제9항 중 어느 한 항의 하나 이상의 변형된 Cry1Ca 독소를 포함하는 것인 방법.
하나 이상의 변형된 Cry1Ca 독소를 발현하는 트랜스제닉 식물을 성장시키고, 감수성 해충을 상기 트랜스제닉 식물 상에서 섭식시키는 것을 포함하는, 다른 Cry 독소에 대한 저항성이 발생한 식물 곤충 해충을 방제하는 방법.