KR101854478B1

KR101854478B1 - 변형 ＣＲＹ１Ｃａ 살곤충 ＣＲＹ 단백질

Info

Publication number: KR101854478B1
Application number: KR1020127018297A
Authority: KR
Inventors: 토마스 미드; 케네쓰 나르바; 티모씨 헤이; 이그나시오 라리누아; 애런 티 우슬리; 스테파니 엘 버튼
Original assignee: 다우 아그로사이언시즈 엘엘씨
Priority date: 2009-12-16
Filing date: 2010-12-16
Publication date: 2018-05-03
Also published as: CN102762096A; UA112286C2; BR112012015005A2; CO6592053A2; ZA201204918B; KR20120101546A; RU2012130019A; EP2512224A4; WO2011084627A2; CL2012001631A1; MX2012007124A; AU2010339916B2; US20130025006A1; CA2782554A1; NZ601094A; IL220335A; EP2512224A2; JP2013514772A; AR079502A1; WO2011084627A3

Abstract

본 발명은 DIG-109 및 DIG-152의 변이체뿐만 아니라 DIG-109 및 DIG-152로서 본원에서 표기되는 단백질을 포함하는 변형된 살곤충 B.t. Cry1Ca 단백질, 이들 단백질을 코딩하는 핵산, 이 단백질을 이용하여 해충을 방제하는 방법, 트랜스제닉 숙주 세포에서 이 단백질을 생성하는 방법, 및 이 단백질을 생성하는 트랜스제닉 식물을 포함한다. DIG-109 및 DIG-152 단백질은 Cry1Ab 전독소 절편 및 B.t. Cry1Ca의 코어 독소 절편으로 구성된 키메라 펩티드를 포함한다. DIG-109 및 DIG-152 단백질의 살곤충 활성 변이체가 또한 개시된다.

Description

변형 ＣＲＹ１Ｃａ 살곤충 ＣＲＹ 단백질{MODIFIED CRY1Ca INSECTICIDAL CRY PROTEINS}

본 발명은 새로운 살곤충 Cry 단백질 및 곤충 해충 방제를 위한 그의 용도에 관한 것이다.

밤나방 (Fall armyworm) (FAW; 스포도프테라 프루기페르다 (Spodoptera frugiperda))은 옥수수 및 기타 작물, 예컨대 대두 및 목화에 상당한 손상을 야기한다.

바실루스 투린기엔시스 (Bacillus thuringiensis, B.t.)는 델타 내독소 또는 Cry 단백질로 공지된 살충성 결정 단백질을 생성하는 토양성 박테리아이다. Cry 단백질은 민감한 곤충의 중장 세포에 작용함으로써 그 기능을 하는 경구 중독제 (intoxicant)이다. 델타 내독소의 광범위한 목록은 하기 웹사이트에서 유지되며 정기적으로 갱신된다: lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/intro.html.

Cry 단백질, 가장 현저하게는 Cry1F를 코딩하는 유전자를 발현하는 트랜스제닉 (transgenic) 옥수수는 FAW에 대하여 상업적 수준의 효능을 제공한다.

FAW-내성 트랜스제닉 옥수수의 성공에도 불구하고, 내성 곤충 집단의 발생의 가능성은 FAW 제어에 있어서 Cry 단백질의 장기간 지속성을 위협하며, FAW 및 기타 해충의 방제를 위한 새로운 Cry 단백질의 발견 및 개발 필요성을 야기한다. B.t. Cry 단백질에 대한 곤충 내성이 몇몇 기작을 통하여 발생할 수 있다 (문헌[Heckel et al., 2007], [Pigott and Ellar, 2007]). Cry 단백질에 대한 다수의 수용체 단백질 부류가 곤충들 내에서 확인되었으며, 다수의 예가 각각의 수용체 부류 내에 존재한다. 특정 Cry 단백질에 대한 내성은 예를 들어 수용체 단백질의 카드헤린 도메인의 독소 결합 부분 내에서의 돌연변이에 의해 발생할 수 있다. 추가의 내성 수단은 전독소 (protoxin) 프로세싱 프로테아제를 통하여 매개될 수 있다. 따라서, 인시목의 종에서의 Cry 독소에 대한 내성은 적어도 4가지의 특유한 주요 내성 유전자에 의한 복잡한 유전적 기반을 갖는다. Cry 단백질에 대하여 내성을 갖는 인시목 곤충이, 플루텔라 자일로스텔라 (Plutella xylostella) (문헌[Tabashnik, et al., 1994]), 트리코플루시아 니 (Trichoplusia ni) (문헌[Janmaat and Myers 2003, 2005]), 및 헬리코베르파 제아에 (Helicoverpa zeae) (문헌[Tabashnik et al., 2008])에 대하여 경작지에서 발생하였다. 새로운 고 효력 Cry 단백질이 개발되면 FAW 및 기타 곤충 해충의 관리를 위한 추가의 도구를 제공할 것이다. 트랜스제닉 옥수수에서 조합되어 생성되는 상이한 작용 양식을 갖는 Cry 단백질들은 FAW 곤충 내성의 발생을 방지하고 곤충 해충 방제에 있어서의 B.t. 기술의 장기간 유용성을 보장한다.

발명의 간단한 요약

본 발명은 DIG-109 및 DIG-152의 변이체뿐만 아니라 DIG-109 및 DIG-152로서 본원에서 표기되는 단백질을 포함하는 살곤충 B.t. Cry 단백질, 이들 단백질을 코딩하는 핵산, 이 단백질을 이용하여 해충을 방제하는 방법, 트랜스제닉 숙주 세포에서 이 단백질을 생성하는 방법, 및 이 단백질을 생성하는 트랜스제닉 식물을 제공한다.

실시예 1에 기술된 바와 같이, DIG-109 및 DIG-152 단백질은 B.t. Cry1Ca의 코어 독소 절편 및 Cry1Ab 전독소 절편으로 구성된 키메라 펩티드를 포함한다. DIG-109 및 DIG-152 단백질의 살곤충 활성 변이체가 또한 기술된다.

본원에 보고된 놀라운 발견은 DIG-109 및 DIG-152 단백질이 Cry1F에 대하여 내성을 갖는 사탕수수 명나방 유충 및 밤나방 유충의 집단에 대하여 활성을 갖는다는 것이다. 따라서, DIG-109 및 DIG-152 단백질은 인시목 해충의 방제에 사용하기에 이상적인 후보이다. 상기 단백질들은 내성 곤충 집단의 발생을 방제하기 위하여 Cry1F, Cry1Ab, 및 Cry1Ac와 같은 다른 Cry 단백질과 조합하여 또는 단독으로 사용될 수 있다. 그러한 해충의 논의에 대해서는 예를 들어 문헌[Tabashnik, PNAS (2008), vol. 105 no. 49, 19029-19030]을 참조한다.

DIG-109 및 DIG-152의 살곤충 활성 단편, 및 그러한 단편을 코딩하는 뉴클로오티드가 본 발명의 또 다른 측면이다.

일 실시양태에서, 본 발명은 하기로 이루어진 군으로부터 선택된 코어 독소 절편을 포함하는 단리된 DIG-109 단백질 폴리펩티드를 제공한다:

(a) 서열 1의 잔기 28 내지 619의 아미노산 서열을 포함하는 폴리펩티드;

(b) 서열 1의 잔기 28 내지 619의 아미노산 서열에 대한 서열 동일성이 90% 이상인 아미노산 서열을 포함하는 폴리펩티드;

(c) 서열 1에 의해 코딩되는 단백질의 발현 또는 활성에 악영향을 주지 않는 20개 이하의 아미노산 치환, 결실 또는 변형을 갖는 서열 1의 잔기 28 내지 619의 아미노산 서열을 포함하는 폴리펩티드.

또 다른 실시양태에서, 본 발명은 하기로 이루어진 군으로부터 선택된 DIG-109 코어 독소 절편을 포함하는 단리된 DIG-109 독소 폴리펩티드를 제공한다:

(a) 서열 1의 잔기 1 내지 619의 아미노산 서열을 포함하는 폴리펩티드;

(b) 서열 1의 잔기 1 내지 619의 아미노산 서열에 대한 서열 동일성이 90% 이상인 아미노산 서열을 포함하는 폴리펩티드;

(c) 서열 1에 의해 코딩되는 단백질의 발현 또는 활성에 악영향을 주지 않는 20개 이하의 아미노산 치환, 결실 또는 변형을 갖는 서열 1의 잔기 1 내지 619의 아미노산 서열을 포함하는 폴리펩티드.

또 다른 실시양태에서, 본 발명은 DIG-109 단백질을 포함하는 식물을 제공한다.

또 다른 실시양태에서, 본 발명은 해충 집단을 살충적 유효량의 DIG-109 단백질과 접촉시키는 단계를 포함하는 해충 집단의 방제 방법을 제공한다.

또 다른 실시양태에서, 본 발명은 DIG-109 단백질을 코딩하는 단리된 핵산을 제공한다.

또 다른 실시양태에서, 본 발명은 바실루스 투린기엔시스로부터 유래되지 않은 그리고 식물에서 발현을 추진할 수 있는 프로모터에 작동가능하게 연결된, DIG-109 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 DNA 작제물을 제공한다. 또한 본 발명은 게놈 내로 안정하게 혼입된 DNA 작제물을 포함하는 트랜스제닉 식물 및 상기 식물 내로 작제물을 도입하는 단계를 포함하는, 해충으로부터 식물을 보호하는 방법을 제공한다.

서열의 간단한 설명

서열 1 Cry1Ca 코어 독소 절편; 619 aa

서열 2 제1 Cry1Ab 전독소 절편; 545 aa

서열 3 DIG-152 키메라 단백질; 1164 aa (Pf 버전)

서열 4 제2 Cry1Ab 전독소 절편; 545 aa

서열 5 DIG-109 키메라 단백질; 1164 aa (마이즈(maize) 버전)

서열 6 Cry1Ca436 펩티드; 10 aa

서열 7 Cry1Ca591 펩티드; 10 aa

서열 8 DIG-109를 코딩하는 마이즈 최적화 CDS; 3492 bp

서열 9 ZGP3S 올리고뉴클레오티드; 21 nt

서열 10 ZGP3A 올리고뉴클레오티드; 21 nt

서열 11 TQZGP3 올리고뉴클레오티드; 23 nt

서열 12 DSM2S 올리고뉴클레오티드; 17 nt

서열 13 DSM2A 올리고뉴클레오티드; 19 nt

서열 14 DSM2FQ 올리고뉴클레오티드; 20 nt

서열 15 Cry1CaS 올리고뉴클레오티드; 18 nt

서열 16 Cry1CaA 올리고뉴클레오티드; 18 nt

서열 17 Cry1Ca 올리고뉴클레오티드; 23 nt

서열 18 AAD1S 올리고뉴클레오티드; 20 nt

서열 19 AAD1A 올리고뉴클레오티드; 22 nt

서열 20 AAD1 올리고뉴클레오티드; 24 nt

서열 21 Y1CAS 올리고뉴클레오티드; 18 nt

서열 22 Y1CAR 올리고뉴클레오티드; 18 nt

서열 23 F6Y1CA 올리고뉴클레오티드; 23 nt

서열 24 IVF-Taq 올리고뉴클레오티드; 18 nt

서열 25 IVR-TAQ 올리고뉴클레오티드; 19 nt

서열 26 IV-프로브 올리고뉴클레오티드; 26 nt

서열 27 DIG-110; 1079 aa

서열 28 DIG-110의 마이즈 최적화 코딩 영역; 3237 bp

서열 29 DIG-111; 543 aa

서열 30 DIG-111의 마이즈 최적화 코딩 영역; 1629 bp

서열 31 DIG-112; 1044 aa

서열 32 DIG-112의 마이즈 최적화 코딩 영역; 3132 bp

서열 33 DIG-113; 508 aa

서열 34 DIG-113의 마이즈 최적화 코딩 영역; 1524 bp

서열 35 DIG-114; 582 aa

서열 36 DIG-114의 마이즈 최적화 코딩 영역; 1746 bp

DIG -109 및 DIG -152 단백질, 및 살곤충 활성 변이체 . 전장의 서열 5의 DIG-109 단백질 및 서열 3의 DIG-152 단백질에 더하여, 본 발명은 살곤충 활성 변이체를 포함한다. 본 출원인은 "변이체"라는 용어에 단편, 특정 결실 및 삽입 돌연변이체 및 특정 융합 단백질을 포함시키고자 한다. DIG-109 및 DIG-152의 Cry1Ca 코어 독소 절편은 고전적인 3도메인형 (3-domain) Cry 단백질이다. 본 발명에 포함되는 DIG-109 및 DIG-152 단백질의 변이체의 기술의 서두로서, 3도메인형 Cry 단백질의 구성을 일반적으로, 그리고 DIG-109 및 DIG-152 단백질 독소의 구성을 구체적으로 간략하게 재검토하는 것이 유용할 것이다.

대다수의 바실루스 투린기엔시스 델타-내독소 결정 단백질 분자는 2개의 기능성 절편으로 구성된다. 프로테아제-내성 코어 독소는 상기 단백질 분자의 대략적으로 제1 절반에 상응하며, 제1 절편이다. 대략 130 kDa의 전체 전독소 분자는 곤충 장 내의 프로테아제에 의해 내성 코어 절편으로 급속하게 프로세싱된다. 이러한 프로세싱에 의해 결실되는 절편은 본원에서 "전독소 절편"으로 칭해진다. 상기 전독소 절편은 독소 결정 형성에 참여하는 것으로 여겨진다 (문헌[Arvidson et al., (1989)]). 따라서 전독소 절편은 독소 분자의 프로테아제 프로세싱을 감소시킴으로써 (문헌[Haider et al., (1986)]) 또는 독소 용해성을 감소시킴으로써 (문헌[Aronson et al., (1991)]) 곤충에 대한 상기 코어의 접근성을 제한함으로써 독소에 대한 부분적 곤충 특이성을 전할 수 있다. 심지어 특정 부류 내인 B.t. 독소는 길이 면에서 그리고 코어 독소 절편으로부터 전독소 절편으로의 전위 (transition)의 정확한 위치 면에서 어느 정도 가변적이다. 코어 독소 절편으로부터 전독소 절편으로의 전위는 전형적으로 전장 독소의 약 50% 내지 약 60% 사이에서 일어난다. 서열 3은 전장 DIG-152 폴리펩티드의 1164개 아미노산 서열을 개시하며, 이 중 N-말단의 619개 아미노산은 서열 1에 개시된 Cry1Ca 코어 독소를 포함한다. 서열 5는 전장 DIG-109 폴리펩티드의 1164개 아미노산 서열을 개시하며, 이 중 N-말단의 619개 아미노산은 Cry1Ca 코어 독소를 포함한다.

3차원 결정 구조가 Cry1Aa1, Cry2Aa1, Cry3Aa1, Cry3Bb1, Cry4Aa, Cry4Ba 및 Cry8Ea1에 대하여 결정되었다. 이들 코어 독소 구조는 현저하게 유사하며, 하기에 기술된 특징을 갖는 3개의 특유한 도메인으로 이루어진다 (문헌[de Maagd et al., 2003]에서 재검토됨).

도메인 I은 나선 5가 6개의 양쪽친매성 나선으로 둘러싸인 7개의 알파 나선의 번들(bundle)이다. 이 도메인은 기공 형성에 연루되어 있으며, 용혈소 및 콜리신을 포함하는 다른 기공 형성 단백질과 상동성을 공유한다. Cry1Ca 코어 독소 단백질의 도메인 I은 서열 1의 아미노산 잔기 36 내지 254를 포함한다. [DIG-109 및 DIG-152 키메라 단백질은 Cry1Ca 코어 독소 절편을 포함하며, 따라서 서열 1에 개시된 Cry1Ca 코어 독소 절편의 아미노산 서열에 할당된 좌표는 서열 5에 개시된 DIG-109 키메라 단백질의 아미노산 서열 및 서열 3에 개시된 DIG-152 키메라 단백질의 아미노산 서열에도 적용됨을 이해하여야 한다.]

도메인 II는 베타 프리즘으로 함께 패킹된 (packed) 3개의 역평행 베타 시트로 형성된다. 이 도메인의 루프는 곤충 중장 수용체 결합에 있어서 중요한 역할을 한다. Cry1A 단백질에 있어서, 도메인 II 베타 시트의 정점의 표면 노출 루프는 인시목 카드헤린 수용체에의 결합에 관련된다. Cry3Aa 도메인 II 루프는 유사한 방식으로 렙티노타르사 데셈리네아타 (Leptinotarsa decemlineata) (Say) (콜로라도 (Colorado) 감자 딱정벌레)의 막 결부된 메탈로프로테아제에 결합한다 (문헌[Ochoa-Campuzano et al., 2007]). 도메인 II는 비텔린 및 자칼린을 비롯한 특정 탄수화물 결합 단백질과 상동성을 공유한다. Cry1Ca 코어 독소 단백질의 도메인 II는 서열 1의 아미노산 잔기 262 내지 458을 포함한다.

도메인 III은 2개의 역평행 베타 시트의 베타 샌드위치 (sandwich)이다. 구조적으로 이러한 도메인은 단백질, 예컨대 글루카나아제, 갈락토스 옥시다아제, 시알리다아제 및 기타의 것의 탄수화물 결합 도메인에 관련된다. 도메인 III은 특정한 부류의 수용체 단백질에 결합하며, 아마도 제2 부류의 수용체와 상호작용하는 올리고머형 독소 프리포어(pre-pore)의 삽입에 참여하는데, 상기 제2 부류의 수용체의 예로는 Cry1A 단백질의 경우 아미노펩티다아제 및 알칼리 포스파타아제가 있다 (문헌[Pigott and Ellar, 2007]). 유사한 Cry 도메인 III 수용체는 초시목에서는 동정되지 않았다. 보존된 B.t. 서열 블록 2 및 3은 각각 도메인 2의 N-말단 및 C-말단 근처에서 지도화된다. 따라서, 이들 보존된 서열 블록 2 및 3은 3개의 기능성 도메인 사이의 대략적인 경계 영역이다. 보존된 DNA 및 단백질 상동성의 이들 영역은 재조합 B.t. 독소의 조작을 위하여 활용되었다 (미국 특허 제6090931호, 국제 특허 공개 제WO 1991/01087호, 동 제WO 1995/06730호, 동 제WO 1998/022595호). Cry1Ca 단백질의 도메인 III은 서열 1의 아미노산 잔기 468 내지 617을 포함한다.

도메인 I의 α-나선 1은 수용체 결합 후에 제거됨이 보고되었다. 문헌[Aronson et al. (1999)]에서는 BBMV에 결합된 Cry1Ac가 α-나선 1의 바로 뒤의 잔기 59에서 시작하는 프로테이나아제 K 절단으로부터 보호되었음이 입증되었으며; 유사한 결과가 Cry1Ab에 대하여 인용되었다. 문헌[Gomez et al., (2002)]에서는 BBMV 수용체 결합시에 형성된 Cry1Ab 올리고머에서 도메인 I의 α-나선 1 부분이 결여되었음이 발견되었다. 또한, 문헌[Soberon et al., (2007)]에서는 3차원 Cry 구조 상에서 α-나선 1을 포함하는 대략 60개 아미노산이 결여된 Cry1Ab 및 Cry1Ac의 N-말단 결실 돌연변이체가 카드헤린 결합의 부재 하에 분자량 약 60 kDa의 단량체를 프리포어로 조립할 수 있음이 밝혀졌다. 이들 N-말단 결실 돌연변이체는 Cry 내성 곤충 유충에서 활성을 갖는 것으로 보고되었다. 더욱이, 문헌[Diaz-Mendoza et al., (2007)]에는 지중해 옥수수 명나방 (세사미아 노나그리오이데스 (Sesamia nonagrioides))에 대한 활성을 유지하는 43 kDa 및 46 kDa의 Cry1Ab 단편이 기술되어 있다. 이들 단편은 아미노산 잔기 116 내지 423을 포함하는 것으로 입증되었지만, 정확한 아미노산 서열은 해명되지 않았으며, 이들 단백질 분해 단편의 활성 기작은 공지되어 있지 않다. 문헌[Gomez et al., (2002)], [Soberon et al., 2007] 및 [Diaz-Mendoza et al., (2007)]의 결과는 Cry1Ab의 N-말단으로부터의 36개 아미노산의 결실이 살곤충 활성을 상실시킴을 보고한 문헌[Hofte et al., (1986)]의 것과 대조를 이룬다.

본 출원인은 나선 1, 2A, 2B, 3, 및 4의 시작과 끝, 및 Cry1Ca 코어 독소의 도메인 I에서의 그들 사이의 스페이서 영역의 위치를 추정하였으며, 이는 Cry1Ca 아미노산 서열을 구조가 공지된 Cry8Ea1의 아미노산 서열과 비교함에 의한 것이었다. 이들 위치가 표 1에 기술되어 있다.

DIG -109 및 DIG -152의 아미노 말단 결실 변이체 . 본 발명은 그의 측면들 중 하나에서 살곤충 활성을 향상시키고 곤충에 의한 내성의 발생을 회피하기 위하여 알파 나선 1, 2A, 및 2B의 전부 또는 일부가 결실된 DIG-109 및 DIG-152 변이체를 제공한다. 이들 변형은 개선된 속성, 예컨대 개선된 표적 해충 스펙트럼, 효력, 및 곤충 내성 관리성을 갖는 DIG-109 및 DIG-152 변이체를 제공하도록 행해진다. 본 발명의 일부 실시양태에서, 본 발명의 변형은 전독소 활성화 및 기공 형성의 효율에 영향을 주어 곤충 중독에 이르게 할 수 있다. 더 구체적으로, 개선된 속성을 갖는 DIG-109 및 DIG-152 변이체를 제공하기 위하여, 단계적 결실이 기술되어 있으며, 이는 N-말단을 코딩하는 유전자의 일부를 제거한다. 결실은 α-나선 3 내지 7의 구조적 완전성을 유지하면서 도메인 I에서 α-나선 1의 전부 및 α-나선 2의 전부 또는 일부를 제거한다. 따라서 본 발명은 부분적으로는 더욱 효율적인 기공 형성을 위하여 도메인 1의 α-나선 구성요소를 조작함으로써 만들어진 Cry 단백질 효능에 대한 개선에 관한 것이다. 더 구체적으로, 본 발명은 부분적으로는 Cry1 단백질의 도메인 I의 α-나선 1 및 2에 대하여 추정 2차 구조 상동성을 갖는 영역에서 N-말단 결실을 갖도록 설계된 개선된 DIG-109 및 DIG-152 단백질에 관한 것이다.

DIG-109 및 DIG-152 독소의 살곤충 특성을 개선시키는 결실은 예측 α-나선 2A가 시작되기 전에 개시될 수 있으며, α-나선 2B가 끝난 후 종결될 수 있지만, 바람직하게는 α-나선 3 내로 연장되지 않는다.

N-말단 결실 변이체의 코딩 서열을 설계함에 있어서, 메티오닌을 코딩하는 ATG 시작 코돈은 상기 결실 변이체를 발현하도록 설계된 뉴클레오티드 서열의 5' 말단에 삽입된다. 트랜스제닉 식물에서의 사용용으로 설계된 서열에 있어서, 문헌[Varshavsky (1997)]의 "N-말단 규칙"에 충실한 것이 유익할 수 있다. 일부 아미노산은 단백질의 N-말단 잔기로서 디스플레이될 때 진핵 세포에서 단백질 불안정성 및 분해에 기여할 수 있음이 교시되어 있다. 예를 들어, 효모 및 포유류 세포에서의 관찰로부터 수집된 데이터는 N-말단 불안정화 아미노산이 F, L, W, Y, R, K, H, I, N, Q, D, E 및 가능하게는 P임을 나타낸다. 단백질 분해 기작의 특질은 유기체들 사이에서 다소 상이할 수 있는 반면, 상기에 보이는 N-말단 불안정화 아미노산의 동일성 (identity)의 보존은 유사한 기작이 식물 세포에서 기능할 수 있음을 시사한다. 예를 들어, 문헌[Worley et al., (1998)]에서는 식물에 있어서 N-말단 규칙이 염기성 및 방향족 잔기를 포함함이 발견되었다. 대상 B.t. 살곤충 단백질의 α-나선 3의 시작 근처에서의 식물 프로테아제에 의한 단백질 분해적 절단은 불안정화 N-말단 아미노산을 노출시킬 수 있다는 가능성이 있다. 그러한 프로세싱은 신속한 붕괴를 위하여 절단 단백질을 표적으로 하고 효과적인 곤충 방제에 불충분한 수준으로 B.t. 살곤충 단백질의 축적을 한정할 수 있다. 따라서, 불안정화 아미노산들 중 하나에서 시작되는 N-말단 결실 변이체에 있어서, 본 출원인은 번역 개시 메티오닌과 불안정화 아미노산 사이에 G (글리신) 아미노산을 특정하는 코돈을 부가하는 것을 선호한다.

실시예 13 및 14는 본 발명에 따른 DIG-109 및 DIG-152의 아미노-말단 결실 변이체의 구체예를 제공한다. 추가의 유용한 단편은 어느 단편이 독성을 유지하는지를 결정하기 위하여 전장 가용화 결정 단백질의 트립신 또는 키모트립신 소화에 의해 생성된 단편들의 곤충 생물분석법에 의해 확인될 수 있거나, 또는 Cry 단백질 코딩 영역의 DNA 단편에 의해 코딩되는 독성 단백질 단편의 서열의 결정에 의해 확인될 수 있다. 이 단백질은 대부분은 전독소와 비교하여 짧은 N-말단 및 긴 C-말단 절단(truncation)을 갖는다. 가장 작은 독성 단편의 N-말단은 당업계에서 일상적으로 이용가능한 기술에 의해 트립신- 또는 키모트립신-처리 용해성 결정 단백질의 N-말단 아미노산 서열 결정에 의해 편리하게 결정된다.

키메라 독소. 하나의 Cry 독소의 코어 독소 도메인이 또 다른 Cry 독소의 전독소 절편에 융합된 것을 이용하는 키메라 단백질이 이전에 보고되었다. DIG-109 및 DIG-152 변이체는 Cry1Ca 독소 (이는 전장일 수 있거나 상기에 기술된 N-말단 결실을 가질 수 있음)의 N-말단 독소 코어 절편이 상기 코어 독소 절편의 말단을 지난 어떤 지점에서 이종 전독소 절편에 융합된 것을 포함하는 독소를 포함한다. 이종 전독소 절편으로의 전위는 대략적으로 코어 독소/전독소 접합부에서 나타날 수 있거나, 또는 대안에 있어서 천연 전독소의 일부분 (코어 독소 절편을 지나 연장함)은 유지되고 이종 전독소로의 전위는 하류에서 일어날 수 있다. 일례로서, 대상 발명의 키메라 독소는 Cry1Ca (아미노산 1-619)의 전체 코어 독소 절편 및 이종 전독소 (아미노산 620 내지 C-말단)를 갖는다. 바람직한 실시양태에서, 전독소의 이종 절편은 서열 2 및 서열 4에 예시된 바와 같이 Cry1Ab 델타-내독소로부터 유래된다.

프로테아제 민감성 변이체 . 전형적으로 곤충 장 프로테아제는 곤충이 식이 단백질로부터 필요한 아미노산을 수득하는 것을 돕는 기능을 한다. 가장 잘 이해된 곤충 소화 프로테아제가 세린 프로테아제라는 것인데, 이는 특히 인시목 종에서 가장 일반적인 유형인 것으로 보인다 (문헌[Englemann and Geraerts, 1980]). 초시목 곤충은 인시목 장보다 더욱 중성 내지 산성인 장을 갖는다. 대다수의 초시목 유충 및 성충, 예를 들어 콜로라도 (Colorado) 감자 딱정벌레는 약간 산성인 중장을 가지며, 시스테인 프로테아제가 주요 단백질 분해 활성을 제공한다 (문헌[Wolfson and Murdock, 1990]). 더욱 정확하게는, 문헌[Thie and Houseman (1990)]에서는 콜로라도 감자 딱정 벌레에서 카텝신 B-유사 및 카텝신 H-유사 시스테인 프로테아제들과, 카텝신 D-유사 아스파르틸 프로테아제가 확인 및 특성화되었다. 문헌[Gillikin et al., (1992)]에서는 서양 옥수수 뿌리벌레 (western corn rootworm) 유충의 장에서의 단백질 분해 활성이 특성화되었으며 이는 주로 시스테인 프로테아제임이 발견되었다. 미국 특허 제7230167호에는 세린 프로테아제, 카텝신 G가 서양 옥수수 뿌리벌레에 존재함이 개시되어 있다. 곤충 장 프로테아제의 다양성 및 상이한 활성 수준은 특정 B.t. 독소에 대한 곤충의 민감성에 영향을 줄 수 있다.

본 발명의 또 다른 실시양태에서, 프로테아제 절단 부위는 특정한 곤충 해충의 민감한 유충의 중장 내에서의 단백질 프로세싱에 영향을 주기 위하여 요망되는 위치에서 조작될 수 있다 (문헌[Walters et al., 2008]). 이들 프로테아제 절단 부위는 화학적 유전자 합성법 또는 스플라이스 중첩 PCR법과 같은 방법에 의해 도입될 수 있다 (문헌[Horton et al., 1989]). 예를 들어 세린 프로테아제 인식 서열이, 요망되는 결실 지점에서의 단백질 프로세싱을 민감한 유충의 중장 내에서 초래하도록 Cry 단백질 구조 내의 특정 부위에 임의로 삽입될 수 있다. 그러한 방식으로 활용될 수 있는 세린 프로테아제는 인시목 중장 세린 프로테아제, 예컨대 트립신 또는 트립신-유사 효소, 키모트립신, 엘라스타아제 등을 포함한다 (문헌[Christeller et al., 1992]). 또한, 비분획화 유충 중장 프로테아제 제제를 이용하여 생성한 Cry 단백질 소화 생성물의 서열 결정에 의해 또는 쇄자 연막소포 (brush-border membrane vesicle)에의 결합에 의해 실험적으로 확인된 결실 부위는 단백질 활성화를 초래하도록 조작될 수 있다. 유전자 결실에 의해 또는 프로테아제 절단 부위의 도입에 의해 생성된 변형 Cry 단백질은 오스트리니아 누빌랄리스 (Ostrinia nubilalis), 디아트라에아 그란디오셀라 (Diatraea grandiosella), 헬리코베르파 제아 (Helicoverpa zea), 아그로티스 입실론 (Agrotis ipsilon), 스포도프테라 프루기페르다, 스포도프테라 엑시구아 (Spodoptera exigua), 디아트라에아 사카랄리스 (Diatraea saccharalis), 록사그로티스 알비코스타 (Loxagrotis albicosta) 및 기타 표적 해충을 포함하는 인시목 해충에 대하여 개선된 활성을 갖는다.

초시목 세린 프로테아제, 예컨대 트립신, 키모트립신 및 카텝신 G-유사 프로테아제, 초시목 시스테인 프로테아제, 예컨대 카텝신 (B-유사, L-유사, O-유사, 및 K-유사 프로테아제) (문헌[Koiwa et al., (2000)] 및 [Bown et al., (2004)], 초시목 메탈로프로테아제, 예컨대 ADAM 10 (문헌[Ochoa-Campuzano et al., (2007)]), 및 초시목 아스파르트산 프로테아제, 예컨대 카텝신 D-유사 및 E-유사, 펩신, 플라스멥신, 및 키모신은 특정한 곤충 해충의 민감한 유충의 중장 내에서의 Cry 단백질 프로세싱에 영향을 주기 위하여 요망되는 프로세싱 부위에서의 적절한 인식 서열의 조작에 의해 추가로 활용될 수 있다.

그러한 프로테아제 절단 부위의 도입에 바람직한 위치는 α-나선 2B와 α-나선 3 사이의 "스페이서" 영역 내, 예를 들어 Cry1Ca 코어 독소 단백질의 아미노산 85 내지 90 (서열 1 및 표 1) 내일 수 있다. 유전자 결실에 의해 또는 프로테아제 절단 부위의 도입에 의해 생성되는 변형 Cry 단백질은, 밤나방, 사탕수수 명나방 등을 포함하지만 이에 한정되는 것은 아닌 곤충 해충에 대하여 개선된 활성을 갖는다.

폴리펩티드의 N-말단 또는 C-말단 잔기를 포함하는 아미노산의 서열의 결정을 가능하게 하기 위하여 다양한 기술이 존재한다. 예를 들어, 자동 에드만(Edman) 분해법을 순차적인 방식으로 이용하여 잔기 당 98%의 정확도로 30개 이하의 아미노산 잔기의 N-말단 아미노산 서열을 결정할 수 있다. 또한, 폴리펩티드의 카르복시 말단을 포함하는 아미노산 서열의 결정이 또한 가능하다 (문헌[Bailey et al., (1992)]; 미국 특허 제6046053호). 따라서, 일부 실시양태에서, 단백질 분해적 프로세싱에 의해, 예를 들어 곤충의 장으로부터 제조된 프로테아제에 의해 활성화된 B.t. Cry 단백질이 특성화될 수 있으며, 활성화된 독소 단편의 N-말단 또는 C-말단 아미노산이 확인될 수 있다. 곤충, 식물 또는 미생물 프로테아제에 의한 더욱 큰 변이체 단백질의 단백질 분해적 절단을 허용하거나 또는 그를 제거하기 위하여 코딩 서열 내의 적절한 위치에서의 프로테아제 프로세싱 부위의 도입 또는 제거에 의해 생성된 DIG-109 및 DIG-152 변이체는 본 발명의 범주 내이다. 그러한 조작의 최종 결과는 온전한 (전장) 독소 단백질과 동일하거나 그보다 더 우수한 활성을 갖는 독소 단편 분자의 생성인 것으로 이해된다.

DIG -109 및 DIG -152 독소의 도메인. DIG-109 및 DIG-152 독소에서 예시되는 Cry1Ca 코어 독소 절편의 별도의 도메인들 (및 그러한 도메인들에 대하여 90%, 95%, 또는 97% 동일한 변이체)은 증가된 스펙트럼의 해충 독성, 개선된 효력 또는 증가된 단백질 안정성을 갖는 새로운 독소를 제공하기 위하여 다른 Cry 독소 유래의 도메인과 조합을 형성하는 데 유용할 것으로 예상된다. Cry1Ca 코어 독소 단백질의 도메인 I은 서열 1의 아미노산 잔기 36 내지 254로 이루어진다. Cry1Ca 코어 독소 단백질의 도메인 II는 서열 1의 아미노산 잔기 262 내지 458로 이루어진다. Cry1Ca 코어 독소 단백질의 도메인 III은 서열 1의 아미노산 잔기 468 내지 617로 이루어진다. 도메인 스와핑 (swapping) 또는 셔플링 (shuffling)은 변경된 델타-내독소 단백질을 생성하는 기작이다. 도메인 II 및 III은 델타-내독소 단백질들 사이에서 스와핑되어 개선된 살충 활성 또는 표적 스펙트럼을 갖는 하이브리드 또는 키메라 독소를 생성할 수 있다. 도메인 II는 수용체 결합에 연루된다. 도메인 III은 특정한 부류의 수용체 단백질에 결합하며, 아마도 올리고머형 독소 프리포어의 삽입에 참여할 것이다. 다른 독소에서의 일부의 도메인 III의 치환은 스포도프테라 엑시구아에 대하여 탁월한 독성을 생성하는 것으로 밝혀졌으며 (문헌[de Maagd et al., (1996)], Cry 독소 도메인 스와프의 설계에 대하여 지침이 존재한다 (문헌[Knight et al., (2004)].

재조합 단백질을 제조하는 방법 및 상기 단백질을 살충 활성에 대하여 시험하는 방법이 당업계에 공지되어 있다 (예를 들어, 문헌[Naimov et al., (2001)], [de Maagd et al., (1996)], [Ge et al., (1991)], [Schnepf et al., (1990)], [Rang et al., (1999)] 참조). Cry1A 및 Cry3A 단백질 유래의 도메인 I이 막 내에 기공을 삽입 및 형성하는 능력에 대하여 연구되었다. 도메인 I의 α-나선 4 및 5는 막 삽입 및 기공 형성에서 중요한 역할을 하는 반면 (문헌[Walters et al., 1993], [Gazit et al., 1998]; [Nunez-Valdez et al., 2001]), 다른 나선들은 우산살과 같이 막 표면과 접촉하는 것으로 제안되어 있다 (문헌[Bravo et al., (2007)]; [Gazit et al., (1998)]).

제한된 수의 아미노산 결실, 치환 또는 부가를 만들어서 생성한 DIG -109 및 DIG-152 변이체 . 서열 1의 Cry1Ca 코어 독소 절편의 아미노산 서열에 대한 아미노산 결실, 치환 및 부가는 순차적인 방식으로 쉽게 만들어질 수 있으며, 살곤충 활성에 대한 그러한 변이의 영향은 생물분석법에 의해 시험될 수 있다. 변화의 수가 수적인 면에서 제한된다면, 그러한 시험은 불합리한 실험을 수반하지 않는다. 본 발명은 10개 이하, 15개 이하 또는 20개 이하의 독립적인 아미노산 부가, 결실 또는 치환이 초래된 코어 독소 (서열 1의 아미노산 1-619)의 살곤충 활성 변이체를 포함한다.

본 발명은 서열 1의 아미노산 1-619에 대하여 90%, 95% 또는 97% 동일한 코어 독소 절편을 갖는 DIG-109 및 DIG-152 변이체를 포함한다. 변이체는 랜덤 돌연변이를 만듦으로써 만들어질 수 있거나 또는 변이체는 설계될 수 있다. 설계된 돌연변이체의 경우, 궁극적으로는 생물 활성에 책임이 있는 3차원 구성의 결정에 연루되거나 또는 생물 활성의 이유를 밝히는 독소의 중요한 영역에서 아미노산 동일성이 유지될 때 천연 독소와 유사한 활성을 갖는 변이체를 생성할 확률이 높다. 높은 확률의 활성 유지는 또한 치환이 보존적일 경우 나타난다. 아미노산은 하기 부류에 배치될 수 있다: 비극성, 비하전 극성, 염기성 및 산성. 하나의 부류의 아미노산이 동일한 유형의 또 다른 아미노산으로 대체되는 보존적 치환은 변이체의 생물 활성을 실질적으로 변경시킬 가능성이 가장 적다. 표 2는 각각의 부류에 속하는 아미노산의 예의 목록을 제공한다.

일부 예에서, 비보존적 치환이 또한 초래될 수 있다. 중요한 인자는 이들 치환이 독소의 생물 활성을 유의하게 손상시키지 않아야 한다는 것이다. 변이체는 돌연변이 유발로 인하여 아미노산 서열이 상이한 폴리펩티드를 포함한다. 본 발명에 포함되는 변이체 단백질은 생물 활성을 가지며, 즉, 상기 단백질은 천연 단백질의 요망되는 생물 활성을 계속하여 보유하는데, 즉, 살충 활성을 유지한다.

서열 수준에서는 상이하지만 동일하거나 유사한 전체적인 본질적 3차원 구조, 표면 전하 분포 등을 유지하는 변이체 단백질이 또한 설계될 수 있다. 예를 들어, 미국 특허 제7058515호; 문헌[Larson et al., (2002)]; [Stemmer (1994a, 1994b, 1995)]; 및 [Crameri et al., (1996a, 1996b, 1997)]을 참조한다.

핵산. DIG-109 독소를 코딩하거나 또는 DIG-152 독소를 코딩하는 단리된 핵산이 본 발명의 일 측면이다. 이는 서열 1, 서열 3 및 서열 5를 코딩하는 핵산 및 그의 상보체를 포함하며, 그 외에 서열 1, 서열 3 및 서열 5의 살곤충성 변이체를 코딩하는 다른 핵산도 포함한다. 본 출원인에 의하면, "단리된"이라는 것은 핵산 분자가 그의 천연 환경으로부터 옮겨져서 인간의 손에 의해 다른 환경에 두어졌음을 의미한다. 유전자 코드의 중복성 때문에 다양한 상이한 DNA 서열들이 본원에 개시된 아미노산 서열을 코딩할 수 있다. 동일하거나, 또는 본질적으로 동일한 독소를 코딩하는 이들 대안적인 DNA 서열을 생성하는 것은 당업계의 숙련자의 기술 이내이다.

유전자 합성. 본원에 개시된 개선된 Cry 단백질을 코딩하는 유전자는 당업계에 공지된 다양한 방법에 의해 만들어질 수 있다. 예를 들어, 합성 유전자 절편 및 합성 유전자는 포스파이트 트리-에스테르 및 포스포르아미다이트 화학에 의해 만들어질 수 있으며 (문헌[Caruthers et al., 1987]), 판매사는 요구에 따라 유전자 합성을 수행할 수 있다. 전장 유전자는 예를 들어 제한효소 단편의 라이게이션에 의한 것 또는 또는 중첩 올리고뉴클레오티드의 폴리머라아제 연쇄 반응 조립에 의한 것을 포함하는 다양한 방식으로 조립될 수 있다 (문헌[Stewart and Burgin, 2005]). 또한, 말단 유전자 결실은 부위 특이적 말단 올리고뉴클레오티드를 이용하여 PCR 증폭에 의해 만들어질 수 있다.

DIG-109 독소 또는 DIG-152 독소를 코딩하는 핵산은 예를 들어 임의의 몇몇 상업적 공급처에 의해 현재 실행되는 방법에 의한 합성적 작제에 의해 만들어질 수 있다 (예를 들어, 미국 특허 제7482119B2호 참조). 이들 유전자, 또는 그의 부분 또는 변이체가 예를 들어 유전자 합성기의 사용 및 예를 들어 미국 특허 제5380831호의 설계 방법에 의해 또한 합성 작제될 수 있다. 대안적으로, 합성 또는 천연 유전자의 변이는 점 돌연변이를 만드는 표준 분자 생물학 기술을 이용하여 쉽게 작제될 수 있다. 이들 유전자의 단편은 또한 표준 절차에 따라 구매가능한 엑소뉴클레아제 또는 엔도뉴클레아제를 이용하여 만들어질 수 있다. 예를 들어 효소, 예컨대 Bal31 또는 부위 특이적 돌연변이 유발법을 이용하여 이들 유전자의 말단으로부터 뉴클레오티드를 조직적으로 절단할 수 있다. 또한, 활성 독소 단편을 코딩하는 유전자 단편은 다양한 제한 효소를 이용하여 수득될 수 있다.

DIG-109 독소 또는 DIG-152 독소의 아미노산 서열이 주어질 경우, 코딩 서열은 의도된 숙주가 선호하는 코돈을 이용하여 당해 단백질 서열을 역번역하고, 그 후 문제를 야기할 수 있는 서열을 제거하기 위하여 대안적인 (중복성) 코돈을 이용하여 상기 서열을 개량함으로써 설계될 수 있다. 또한, 주기적 종결 코돈을 비코딩 판독 프레임 (reading frame) 내로 조작하여 넣어서, 긴 의도하지 않은 개방 판독 프레임을 제거할 수 있다.

서열 동일성의 정량화. 두 아미노산 서열의 또는 두 핵산 서열의 동일성 %를 결정하기 위하여, 서열들을 최적의 비교 목적용으로 정렬한다. 두 서열 사이의 동일성 %는 상기 서열이 공유하는 동일한 위치의 수의 함수이다 (즉, 동일성 % = 동일한 위치의 수/위치의 총수 (예를 들어, 중첩 위치) x 100). 일 실시양태에서, 두 서열은 동일한 길이의 것이다. 두 서열 사이의 동일성 %는 갭을 허용하거나 허용하지 않고서 하기에 기술된 것과 유사한 기술을 이용하여 결정될 수 있다. 동일성 %를 계산하는 데 있어서, 전형적으로 정확한 매치 (match)가 카운팅된다.

두 서열 사이의 동일성 %의 결정은 수학적 알고리즘을 이용하여 성취될 수 있다. 그러한 알고리즘의 비제한적 예로는 BLAST (문헌[Altschul et al., 1990], 및 [Karlin and Altschul, 1990])가 있으며, 이는 문헌[Karlin and Altschul (1993)]에서와 같이 수정되고 BLASTN 및 BLASTX 프로그램 내에 포함된다. BLAST 검색은 핵산 또는 단백질 데이터베이스에서 질의 서열에 대하여 상동성인 (유사한) 서열을 확인하기 위하여 편리하게 사용될 수 있다. BLASTN 검색은 본 발명의 청구된 핵산 분자에 대하여 상동성을 갖는 뉴클레오티드 서열을 확인하기 위하여 수행될 수 있다 (스코어 = 100, 단어 길이 = 12). BLASTX 검색은 본 발명의 청구된 살곤충 단백질 분자에 대하여 상동성을 갖는 아미노산 서열을 확인하기 위하여 수행될 수 있다 (스코어 = 50, 단어 길이 = 3).

갭 형성식 (Gapped) BLAST (문헌[Altschul et al., (1997)])를 이용하여 비교 목적용의 갭 형성 정렬을 수득할 수 있다. 대안적으로, 분자들 사이의 거리 관계를 탐지하는 반복된 검색을 수행하기 위하여 PSI-Blast를 이용할 수 있다 (문헌[Altschul et al., 상기 문헌]). BLAST, 갭 형성식 BLAST, 및 PSI-Blast 프로그램을 이용할 때, 각각의 프로그램의 디폴트 (default) 파라미터가 이용될 수 있다. www.ncbi.nlm.nih.gov.를 참조한다.

서열 비교에 이용되는 수학적 알고리즘의 비제한적 예로는 ClustalW 알고리즘이 있다 (문헌[Thompson et al., 1994]). ClustalW는 서열들을 비교하며 아미노산 또는 DNA 서열의 전체를 정렬시키고, 따라서 전체 아미노산 서열 또는 뉴클레오티드 서열의 서열 보존에 관한 데이터를 제공할 수 있다. ClustalW 알고리즘은 몇몇 구매가능한 DNA/아미노산 분석 소프트웨어 패키지, 예컨대 벡터 NTI 프로그램 스위트 (Vector NTI Program Suite) (인비트로겐, 인크. (Invitrogen, Inc.), 미국 캘리포니아주 칼스바드)의 ALIGNX 모듈에서 사용된다. ALIGNX를 이용하여 아미노산 서열들을 정렬시킬 때, 두 서열 사이의 아미노산 유사성 (콘센서스 (consensus)) 또는 동일성 %를 평가하기 위하여 10의 갭 오픈 페널티 (Gap open penalty), 0.1의 갭 연장 페널티 및 blosum63mt2 비교 매트릭스를 포함하는 디폴트 설정치를 편리하게 이용할 수 있다. ALIGNX를 이용하여 DNA 서열들을 정렬시킬 때, 두 서열 사이의 동일성 %를 평가하기 위하여 15의 갭 오픈 페널티, 6.6의 갭 연장 페널티 및 swgapdnamt 비교 매트릭스를 포함하는 디폴트 설정치를 편리하게 이용할 수 있다.

서열들의 비교에 이용되는 수학적 알고리즘의 또 다른 비제한적 예로는 문헌[Myers and Miller (1988)]의 것이 있다. 그러한 알고리즘은 wEMBOSS 서열 정렬 소프트웨어 패키지 (http://emboss.sourceforge.net/에서 입수가능함)의 일부인 wSTRETCHER 프로그램 내에 포함된다. wSTRETCHER은 선형 공간을 이용하는 고전적인 동적 프로그래밍 알고리즘의 변형을 이용하여 두 서열의 최적의 전역 정렬을 계산한다. 정렬의 계산에 사용되는 치환 매트릭스, 갭 삽입 페널티 및 갭 연장 페널티는 특정될 수 있다. 뉴클레오티드 서열들의 비교를 위하여 wSTRETCHER 프로그램을 이용할 때, 스코어링 매트릭스 파일 EDNAFULL에서 16의 갭 오픈 페널티 및 4의 갭 연장 페널티가 이용될 수 있다. 아미노산 서열들의 비교에 사용될 때, EBLOSUM62 스코어링 매트릭스 파일에서 12의 갭 오픈 페널티 및 2의 갭 연장 페널티가 이용될 수 있다.

서열들의 비교에 이용되는 수학적 알고리즘의 추가의 비제한적 예로는 문헌[Needleman and Wunsch (1970)]의 것이 있으며, 이는 서열 정렬 소프트웨어 패키지 GAP 버전 10 및 wNEEDLE (http://emboss.sourceforge.net/) 내에 포함된다. GAP 버전 10은 하기 파라미터를 이용하여 서열 동일성 또는 유사성을 결정하기 위하여 사용될 수 있다: 뉴클레오티드 서열의 경우, 동일성 % 및 유사성 %는 50의 갭 가중치 및 3의 길이 가중치와, nwsgapdna.cmp 스코어링 매트릭스를 이용하여 찾아낸다. 아미노산 서열 비교의 경우, 동일성 % 및 유사성 %는 8의 갭 가중치 및 2의 길이 가중치와, BLOSUM62 스코어링 프로그램을 이용하여 결정한다.

wNEEDLE는 2개의 입력 서열을 판독하고, 그의 전체 길이를 따라 최적 정렬 (갭을 포함함)을 찾아내고, 그의 최적의 전역 서열 정렬을 파일에 기록한다. 알고리즘은 모든 가능한 정렬을 탐구하고, 모든 가능한 잔기 또는 뉴클레오티드 매치에 대한 값을 포함하는 스코어링 매트릭스를 이용하여 최상의 것을 찾아낸다. wNEEDLE는 최대의 가능한 스코어를 갖는 정렬을 찾아내며, 여기서, 정렬의 스코어는 스코어링 매트릭스로부터 취해진 매치의 합에서 정렬된 서열들 내의 갭의 개방 및 연장에서 생기는 페널티를 차감한 것과 동일하다. 치환 매트릭스 및 갭 개방 및 연장 페널티는 사용자에 의해 특정된다. 아미노산 서열들이 비교될 때, 10의 디폴트 갭 개방 페널티, 0.5의 갭 연장 페널티 및 EBLOSUM62 비교 매트릭스가 이용된다. DNA 서열을 wNEEDLE를 사용하여 비교할 때, 10의 갭 개방 페널티, 0.5의 갭 연장 페널티 및 EDNAFULL 비교 매트릭스가 이용된다.

등가의 프로그램이 또한 사용될 수 있다. "등가의 프로그램"은 당해의 임의의 두 서열에 있어서, ALIGNX, wNEEDLE, 또는 wSTRETCHER에 의해 생성된 상응하는 정렬과 비교할 때 동일한 뉴클레오티드 또는 아미노산 잔기 매치 및 동일한 서열 동일성 %를 갖는 정렬을 생성하는 임의의 서열 비교 프로그램을 의도한다. 동일성 %는 보고된 정렬 영역 (길이 면에서 임의의 갭을 포함함)에 걸쳐 두 서열 사이의 동일한 매치의 백분율이며, 유사성 %는 보고된 정렬 영역 (길이 면에서 임의의 갭을 포함함)에 걸쳐 두 서열 사이의 매치의 백분율이다.

또한 정렬은 조사에 의해 수동으로 수행될 수 있다.

재조합 숙주. 대상 발명의 독소 코딩 유전자는 광범위하게 다양한 미생물 또는 식물 숙주 내로 도입될 수 있다. 독소 유전자의 발현은 직접적으로 또는 간접적으로 살충 단백질을 세포내에서 생성 및 유지한다. 적합한 미생물 숙주, 예를 들어 슈도모나스 (Pseudomonas)를 이용하여, 미생물을 그가 증식하고 섭취되는 해충 환경에 적용될 수 있다. 그 결과는 해충의 방제이다. 대안적으로, 독소 유전자의 숙주가 되는 미생물은 독소의 활성을 연장시키고 세포를 안정화시키는 조건 하에 처리될 수 있다. 그 후, 독소 활성을 유지하는 처리된 세포는 표적 해충의 환경에 적용될 수 있다.

B.t. 독소 유전자를 적합한 벡터를 통하여 미생물 숙주 내로 도입하고 상기 숙주를 살아있는 상태로 상기 환경에 적용할 경우, 특정한 숙주 미생물을 사용하는 것이 필수적이다. 관심있는 하나 이상의 작물의 "식물권" (엽면, 엽권, 근권, 및/또는 근면)을 점유하는 것으로 공지된 미생물 숙주가 선택된다. 이들 미생물은 특정 환경 (작물 및 기타 곤충 서식지)에서 야생형 상재 미생물과 성공적으로 경쟁할 수 있도록 선택되며, 이는 폴리펩티드 살충제를 코딩하는 유전자의 안정한 유지 및 발현을 제공하고, 바람직하게는 환경적 분해 및 불활성화로부터의 살충제의 개선된 보호를 제공한다.

다수의 미생물이 광범위하게 다양한 주요 작물의 엽면 (식물 잎의 표면) 및/또는 근권 (식물 뿌리를 둘러싸고 있는 토양)에 서식하는 것으로 공지되어 있다. 이들 미생물은 박테리아, 조류 및 진균류를 포함한다. 특히 관심있는 것은 박테리아, 예를 들어 슈도모나스 속, 에르위니아 (Erwinia) 속, 세라티아 (Serratia) 속, 클렙시엘라 (Klebsiella) 속, 잔토모나스 (Xanthomonas) 속, 스트렙토마이세스 (Streptomyces) 속, 리조븀 (Rhizobium) 속, 시노리조븀 (Sinorhizobium) 속, 로도슈도모나스 (Rhodopseudomonas) 속, 메틸로필리우스 (Methylophilius) 속, 아그로박테륨 (Agrobacterium) 속, 아세토박터 (Acetobacter) 속, 락토바실루스 (Lactobacillus) 속, 아트로박터 (Arthrobacter) 속, 아조토박터 (Azotobacter) 속, 류코노스톡 (Leuconostoc) 속, 및 알칼리게네스 (Alcaligenes) 속과 같은 식물권 박테리아 종; 진균류, 특히 효모, 예를 들어 사카로마이세스 (Saccharomyces) 속, 크립토코커스 (Cryptococcus) 속, 클루이베로마이세스 (Kluyveromyces) 속, 스포로볼로마이세스 (Sporobolomyces) 속, 로도토룰라 (Rhodotorula) 속, 및 아우레오바시듐 (Aureobasidium) 속과 같은 미생물이다. 특히 관심있는 것은 식물권 세균종, 예컨대 슈도모나스 시린개 (Pseudomonas syringae), 슈도모나스 플루오레센스 (Pseudomonas fluorescens), 세라티아 마르세센스 (Serratia marcescens), 아세토박터 자일리눔 (Acetobacter xylinum), 아그로박테륨 투메파시엔스 (Agrobacterium tumefaciens), 아그로박테륨 라디오박터 (Agrobacterium radiobacter), 로도슈도모나스 스페로이데스 (Rhodopseudomonas spheroides), 잔토모나스 캄페스트리스 (Xanthomonas campestris), 시노리조븀 멜리로티 (Sinorhizobium meliloti) (이전에는 리조븀 멜리로티 (Rhizobium meliloti)), 알칼리게네스 유트로푸스 (Alcaligenes eutrophus), 및 아조토박터 비넬란디이 (Azotobacter vinelandii); 및 식물권 효모 종, 예컨대 로도토룰라 루브라 (Rhodotorula rubra), 알. 글루티니스 (R. glutinis), 알. 마리나 (R. marina), 알. 아우란티아카 (R. aurantiaca), 크립토코커스 알비두스 (Cryptococcus albidus), 씨. 디플루엔스 (C. diffluens), 씨. 라우렌티이 (C. laurentii), 사카로마이세스 로세이 (Saccharomyces rosei), 에스. 프레토리엔시스 (S. pretoriensis), 에스. 세레비지애 (S. cerevisiae), 스포로볼로마이세스 로세우스 (Sporobolomyces roseus), 에스. 오도루스 (S. odorus), 클루이베로마이세스 베로내 (Kluyveromyces veronae), 및 아우레오바시듐 폴룰란스 (Aureobasidium pollulans)이다. 특히 관심있는 것은 착색 미생물이다.

곤충 해충의 방제 방법

곤충이 트랜스제닉 식물 발현, 제형화된 단백질 조성물(들), 스프레이가능 단백질 조성물(들), 미끼 매트릭스 또는 기타 전달 시스템을 통하여 전달되는 유효량의 독소와 접촉하게 될 때, 그 결과는 전형적으로 곤충의 죽음이거나, 또는 독소가 곤충에게 이용가능해지게 하는 공급원을 곤충이 먹지 않게 되는 것이다.

대상 단백질 독소는 다양한 방식으로 표적 곤충과 접촉하도록 "적용되거나" 또는 제공될 수 있다. 예를 들어, 트랜스제닉 식물 (여기서, 당해 단백질은 식물에 의해 생성되며 식물 내에 존재함)이 사용될 수 있으며, 이는 당업계에 공지되어 있다. 독소 유전자의 발현은 또한 뿌리, 잎 등과 같은 식물의 특정 조직에서 선택적으로 달성될 수 있다. 이는 예를 들어 조직 특이적 프로모터의 이용을 통하여 성취될 수 있다. 스프레이-온 (Spray-on) 적용이 또 다른 예이며 이는 또한 당업계에 공지되어 있다. 대상 단백질은 요망되는 최종 용도용으로 적절하게 제형화되고, 그 후 만연함이 발견되기 전에, 표적 곤충이 발견된 후에, 전후에 및 기타 등등에 보호할 식물 상에 및/또는 상기 식물 주위에 / 상기 식물 근처에 스프레이될 수 있다 (또는 다르게는 적용될 수 있다). 예를 들어 미끼 과립이 또한 사용될 수 있으며, 이는 당업계에 공지되어 있다.

트랜스제닉 식물

대상 단백질을 이용하여 실질적으로 임의의 유형의 식물을 인시목 곤충에 의한 손상으로부터 보호할 수 있다. 그러한 식물의 예는 몇 가지만을 들자면 마이즈, 해바라기, 대두, 목화, 카놀라, 벼, 수수류, 담배, 밀, 보리, 야채류, 장식용 식물, 후추 (매운 후추를 포함함), 사탕무, 과실 및 잔디를 포함한다. 식물의 형질전환 방법은 당업계에 공지되어 있으며, 예시적인 형질전환법이 실시예에 기술되어 있다.

대상 발명의 바람직한 실시양태는 대상 살곤충 단백질 또는 그의 변이체를 코딩하는 유전자를 이용하여 식물을 형질전환시키는 것이다. 형질전환된 식물은 형질전환된 식물의 세포 내의 대상 살곤충 단백질 또는 그의 변이체의 방제량의 존재에 의해 곤충 표적 해충에 의한 공격에 대하여 내성을 갖는다. 살곤충 특성의 B.t. 살곤충 독소를 코딩하는 유전 물질을 특정 곤충 해충이 먹는 식물의 게놈 내로 혼입함으로써 성체 또는 유충은 먹이 식물을 소비한 후 죽게 된다. 단자엽 식물 및 쌍자엽 식물 분류의 다수의 구성원이 형질전환되었다. 트랜스제닉 농경작물과, 과실 및 야채류가 상업적으로 관심이 있다. 그러한 작물은 마이즈, 벼, 대두, 카놀라, 해바라기, 알팔파, 수수류, 밀, 목화, 땅콩, 토마토, 감자 등을 포함하지만, 이에 한정되는 것은 아니다. 외래 유전 물질을 식물 세포 내로 도입하기 위한, 그리고 도입된 유전자를 안정하게 유지 및 발현하는 식물을 수득하기 위한 몇몇 기술이 존재한다. 그러한 기술은 미세 입자 상에 코팅된 유전 물질의 세포 내로의 직접적인 가속화를 포함한다 (미국 특허 제4945050호 및 미국 특허 제5141131). 식물은 아그로박테륨 기술을 이용하여 형질전환될 수 있으며, 미국 특허 제5177010호, 미국 특허 제5104310호, 유럽 특허 출원 제0131624B1호, 유럽 특허 출원 제120516호, 유럽 특허 출원 제159418B1호, 유럽 특허 출원 제176112호, 미국 특허 제5149645호, 미국 특허 제5469976호, 미국 특허 제5464763호, 미국 특허 제4940838호, 미국 특허 제4693976호, 유럽 특허 출원 제116718호, 유럽 특허 출원 제290799호, 유럽 특허 출원 제320500호, 유럽 특허 출원 제604662호, 유럽 특허 출원 제627752호, 유럽 특허 출원 제0267159호, 유럽 특허 출원 제0292435호, 미국 특허 제5231019호, 미국 특허 제5463174호, 미국 특허 제4762785호, 미국 특허 제5004863호, 및 미국 특허 제5159135호를 참조한다. 다른 형질전환 기술은 휘스커스 (WHISKERS)^TM 기술을 포함하며, 미국 특허 제5302523호 및 미국 특허 제5464765호를 참조한다. 또한 전기천공 기술이 식물의 형질전환에 사용되었으며, 국제 특허 공개 제WO 1987/06614호, 미국 특허 제5472869, 미국 특허 제5384253, 국제 특허 공개 제WO 1992/09696호, 및 국제 특허 공개 제WO 1993/21335호를 참조한다. 모든 이들 형질전환 특허 및 간행물은 본원에 참고로 포함된다. 식물을 형질전환시키는 다수의 기술에 더하여, 외래 유전자와 접촉시키는 조직의 유형도 다양할 수 있다. 그러한 조직은 배발생 조직, 제I형 및 제II형 유합 조직, 배축, 분열 조직 등을 포함하지만, 이에 한정되는 것은 아니다. 거의 모든 식물 조직은 당업자의 기술 이내의 적절한 기술을 이용하여 탈분화 동안 형질전환될 수 있다.

DIG-109 또는 DIG-152 독소를 코딩하는 유전자 또는 그의 변이체는 상기에 개시된 바와 같이 당업계에 공지된 다양한 기술을 이용하여 식물 세포 내로 삽입될 수 있다. 예를 들어, 에스케리키아 콜라이 (Escherichia coli)에서 기능적인 복제 시스템 및 형질전환된 미생물 세포의 선발을 가능케 하는 마커를 포함하는 다수의 클로닝 벡터가 고등 식물 내로의 삽입을 위한 외래 유전자의 제조 및 변형에 이용가능하다. 그러한 조작은 예를 들어 의도된 용도에 요망될 경우 돌연변이의 삽입, 절단, 부가 또는 치환을 포함할 수 있다. 벡터는 예를 들어 pBR322, pUC 시리즈, M13mp 시리즈, pACYC184 등을 포함한다. 따라서, Cry 단백질 또는 변이체를 코딩하는 서열은 적합한 제한효소 부위에서 벡터 내로 삽입될 수 있다. 생성된 플라스미드는 세포가 적합한 영양 배지에서 배양되는 이. 콜라이의 형질전환에 사용되며, 그 후 수확되고 용해되어서 작업가능한 양의 플라스미드가 회수되도록 한다. 서열 분석, 제한효소 단편 분석, 전기영동 및 기타 생화학적-분자 생물학적 방법이 분석 방법으로서 일반적으로 실시된다. 각각의 조작 후, 사용된 DNA 서열은 절단되고 다음 DNA 서열에 연결될 수 있다. 각각의 조작된 DNA 서열은 동일하거나 다른 플라스미드 내에 클로닝될 수 있다.

식물 세포의 형질전환에 있어서의 T-DNA 함유 벡터의 사용은 집중적으로 연구되었으며, 유럽 특허 출원 제120516호; 문헌[Lee and Gelvin (2008)], [Fraley et al., (1986)], 및 [An et al., (1985)]에 충분히 기술되어 있고, 당해 분야에 잘 확립되어 있다.

일단 삽입 DNA가 식물 게놈 내로 통합되었으면, 이것은 후속 세대 전체에 걸쳐 비교적 안정하다. 식물 세포의 형질전환에 사용되는 벡터는 보통형질전환 식물 세포에 특히 비알라포스, 카나마이신, G418, 블레오마이신 또는 하이그로마이신과 같은 항생제 또는 제초제에 대한 내성을 부여하는 단백질을 코딩하는 선발가능 마커 유전자를 함유한다. 따라서, 개별적으로 이용되는 선발가능 마커 유전자는 형질전환된 세포의 선발은 가능케 하여야 하는 반면 삽입 DNA를 함유하지 않는 세포의 성장은 선발 화합물에 의해 억제된다.

다수의 기술이 숙주 식물 세포 내로 DNA를 삽입하는 데 이용가능하다. 그러한 기술은 형질전환 에이전트 (agent)로서 아그로박테륨 투메파시엔스 또는 아그로박테륨 리조게네스 (Agrobacterium rhizogenes)에 의해 전달되는 T-DNA를 이용한 형질전환을 포함한다. 부가적으로, 식물 원형질체와, 전달할 DNA를 함유하는 리포좀의 융합, DNA의 직접적인 주입, 바이오리스틱스 (biolistics) 형질전환 (미세입자총 (microparticle bombardment), 또는 전기천공법과, 다른 가능한 방법이 이용될 수 있다.

대상 발명의 바람직한 실시양태에서, 식물은 단백질 코딩 영역의 코돈 사용이 식물에 대하여 최적화된 유전자로 형질전환된다. 예를 들어, 본원에 참고로 포함된 미국 특허 제5380831호를 참조한다. 또한, 유리하게는 절단 독소를 코딩하는 식물이 사용된다. 절단 독소는 전형적으로 전장 독소의 약 55% 내지 약 80%를 코딩한다. 식물에서 사용하기 위한 합성 B.t. 유전자를 생성하는 방법은 당업계에 공지되어 있다 (문헌[Stewart 2007]).

형질전환 기술에 관계없이, 유전자는 바람직하게는 벡터 내에 식물 프로모터를 포함시킴으로써 식물 세포에서 B.t. 살곤충 독소 유전자 및 변이체를 발현하도록 된 유전자 전달 벡터 내로 혼입된다. 식물 프로모터에 더하여, 다양한 공급원 유래의 프로모터가 외래 유전자의 발현을 위하여 식물 세포에서 효율적으로 사용될 수 있다. 예를 들어, 박테리아 기원의 프로모터, 예컨대 옥토파인 신타아제 프로모터, 노팔린 신타아제 프로모터, 만노파인 신타아제 프로모터; 식물 바이러스 기원의 프로모터, 예컨대 꽃양배추 모자이크 바이러스의 35S 및 19S 프로모터 등이 이용될 수 있다. 식물 프로모터는 리불로스-1,6-비스포스페이트 (RUBP) 카르복실라아제 소형 서브유닛 (carboxylase small subunit; ssu), 베타-콘글리시닌 프로모터, 파세올린 프로모터, ADH (알코올 데히드로게나아제) 프로모터, 열충격 (heat-shock) 프로모터, ADF (액틴 탈중합 인자 (actin depolymerization factor)) 프로모터 및 조직 특이적 프로모터를 포함하지만, 이에 한정되는 것은 아니다. 프로모터는 또한 전사 효율을 향상시킬 수 있는 특정한 인핸서 서열 요소를 함유할 수 있다. 전형적인 인핸서는 ADH1-인트론 1 및 ADH1-인트론 6을 포함하지만, 이에 한정되는 것은 아니다. 구성적 (Constitutive) 프로모터가 사용될 수 있다. 구성적 프로모터는 거의 모든 세포 유형에서 그리고 거의 모든 시점에서 계속적인 유전자 발현을 지시한다 (예를 들어, 액틴, 유비퀴틴, CaMV 35S). 조직 특이적 프로모터는 특정 세포 또는 조직 유형, 예컨대 잎 또는 종자에서의 유전자 발현에 책임이 있으며 (예를 들어, 제인, 올레오신, 나핀, 아실 운반 단백질 (Acyl Carrier Protein; ACP)), 이들 프로모터가 또한 이용될 수 있다. 또한, 특정 식물 조직 및 기관에서 활성을 가질 뿐만 아니라 특정한 단계의 식물의 발달 동안 활성을 갖기도 하는 프로모터가 이용될 수 있다. 그러한 프로모터의 예는 뿌리 특이적, 화분 특이적, 배아 특이적, 옥수수 수염 특이적, 면화 특이적, 종자 내배유 특이적, 체관부 특이적인 프로모터 등을 포함하지만, 이에 한정되는 것은 아니다.

특정한 상황 하에서, 유도성 프로모터를 사용하는 것이 바람직할 수 있다. 유도성 프로모터는 특정 신호, 예컨대 물리적 자극 (예를 들어, 열충격 유전자); 광 (예를 들어, RUBP 카르복실라아제); 호르몬 (예를 들어, 글루코코르티코이드); 항생제 (예를 들어, 테트라사이클린); 대사산물; 및 스트레스 (예를 들어, 가뭄)에 응답하는 유전자의 발현에 책임이 있다. 식물에서 기능하는 다른 바람직한 전사 및 번역 요소, 예컨대 5' 비번역 리더 서열, RNA 전사 종결 서열 및 폴리아데닐레이트 부가 신호 서열이 이용될 수 있다. 다수의 식물 특이적 유전자 전달 벡터가 당업계에 공지되어 있다.

곤충 내성 (IR) 형질을 포함하는 트랜스제닉 작물은 북미 전체에 걸쳐 옥수수 및 목화 식물에서 만연하며, 이들 형질의 사용은 전세계적으로 확대되고 있다. IR 형질과 제초제 내성 (herbicide tolerance; HT) 형질이 조합된 상업적 트랜스제닉 작물이 다수의 종자 회사에 의해 개발되었다. 이들은 B.t. 살곤충 단백질에 의해 부여되는 IR 형질과 아세토락테이트 신타아제 (Acetolactate Synthase; ALS) 저해제, 예컨대 술포닐우레아, 이미다졸리논, 트리아졸로피리미딘, 술폰아닐리드 등, 글루타민 신테타아제 (Glutamine Synthetase; GS) 저해제, 예컨대 비알라포스, 글루포시네이트 등, 4-히드록시페닐피루베이트 디옥시게나아제 (HydroxyPhenylPyruvate Dioxygenase; HPPD) 저해제, 예컨대 메소트리온, 이속사플루톨 등, 5-엔올피루빌쉬키메이트-3-포스페이트 신타아제 (5-EnolPyruvylShikimate-3-Phosphate Synthase; EPSPS) 저해제, 예컨대 글리포세이트 등, 및 아세틸-조효소 A 카르복실라아제 (Acetyl-Coenzyme A Carboxylase; ACCase) 저해제, 예컨대 할록시포프, 퀴잘로포프, 디클로포프 등에 대한 내성과 같은 HT 형질의 조합을 포함한다. 트랜스제닉 제공 단백질은 제초제 화학물질류, 예컨대 페녹시 산 제초제 및 피리딜옥시아세테이트 옥신 제초제 (국제 특허 공개 제WO 2007/053482 A2호 참조), 또는 페녹시 산 제초제 및 아릴옥시페녹시프로피오네이트 제초제 (국제 특허 공개 제WO 2005107437 A2, A3호 참조)에 대한 내성을 식물에 제공하는 다른 예가 공지되어 있다. IR 형질을 통하여 다수의 해충 문제를 방제하는 능력은 가치있는 상품 컨셉트 (concept)이며, 이러한 제품 컨셉트의 편리함은 곤충 방제 형질 및 잡초 방제 형질이 동일 식물에서 조합될 경우 향상된다. 또한, 대상 발명의 것과 같은 B.t. 살곤충 단백질에 의해 부여되는 IR 형질과, 하나 이상의 추가의 HT 형질, 예컨대 상기에 언급된 것의 단일 식물 조합에 하나 이상의 추가의 제1세대 형질 (input trait) (예를 들어, B.t.-유래된 단백질 또는 다른 살곤충 단백질에 의해 부여되는 다른 곤충 내성, RNAi 등과 같은 기작에 의해 부여되는 곤충 내성, B.t.-유래된 단백질 또는 다른 살선충 단백질에 의해 부여되는 선충류 내성, RNAi 등과 같은 기작에 의해 부여되는 선충류 내성, 질병 내성, 스트레스 내성, 개선된 질소 이용성 등), 또는 제2세대 형질 (output trait) (예를 들어, 고 오일 함량, 건강한 오일 조성, 영양 개선 등)과 더해진 것을 통하여 개선된 가치가 수득될 수 있다. 그러한 조합은 다수의 유전자의 동시 도입을 수반하는 신규한 형질전환 이벤트 (event) (분자적 스택)로서 공동으로 또는 통상적인 교배 (교배 스택 (stack))를 통하여 수득될 수 있다. 이득은 곤충 해충을 관리하는 능력 및 작물 식물에서의 개선된 잡초 방제성을 포함하는데, 이는 생산자 및/또는 소비자에게 이차적인 이득을 제공한다. 따라서, 대상 발명은 다수의 농경적 쟁점을 유연하게 그리고 비용 효과적으로 제어하는 능력을 갖는, 개선된 작물 품질의 완전한 농경 패키지를 제공하기 위하여 다른 형질과 조합되어 이용될 수 있다.

표적 해충

본 발명의 DIG-109 독소 및 DIG-152 독소는 인시목 곤충의 방제에 사용하기에 특히 적합하다. 인시목은 매해 매우 많은 양의 손상을 야기하는 농업적, 원예적 및 가정 해충의 중요한 군이다. 이 해충 목은 엽면을 먹는 그리고 뿌리를 먹는 유충 및 성충을 포함한다. 인시목 곤충 해충은 아초로이아 그리셀라 (Achoroia grisella), 아클레리스 글로베라나 (Acleris gloverana), 아클레리스 바리아나 (Acleris variana), 아독소파이에스 오라나 (Adoxophyes orana), 아그로티스 입실론 (검거세미나방), 알라바마 아르길라세아 (Alabama argillacea), 알소필라 포메타리아 (Alsophila pometaria), 아마이엘로이스 트란시텔라 (Amyelois transitella), 아나가스타 쿠에니엘라 (Anagasta kuehniella), 아나르시아 리네아텔라 (Anarsia lineatella), 아니소타 세나토리아 (Anisota senatoria), 안테라에아 페르나이이 (Antheraea pernyi), 안티카르시아 겜마탈리스 (Anticarsia gemmatalis), 아르칩스 (Archips) sp., 아르가이로타에니아 (Argyrotaenia) sp., 아테티스 민다라 (Athetis mindara), 봄바익스 모리 (Bombyx mori), 부쿨라트릭스 투르베리엘라 (Bucculatrix thurberiella), 카드라 카우텔라 (Cadra cautella), 코리스토네우라 (Choristoneura) sp., 코카일스 호스페스 (Cochylls hospes), 콜리아스 에우라이테메 (Colias eurytheme), 코르사이라 세팔로니카 (Corcyra cephalonica), 사이디아 라티페레아누스 (Cydia latiferreanus), 사이디아 포모넬라 (Cydia pomonella), 다타나 인테게리마 (Datana integerrima), 덴드로리무스 시베리쿠스 (Dendrolimus sibericus), 데스미아 페네랄리스 (Desmia feneralis), 디아파니아 하이알리나타 (Diaphania hyalinata), 디아파니아 니티달리스 (Diaphania nitidalis), 디아트라에아 그란디오셀라 (남서부 옥수수 명나방), 디아트라에아 사카랄리스 (사탕수수 명나방), 엔노모스 서브시그나리아 (Ennomos subsignaria), 에오레우마 로프티니 (Eoreuma loftini), 에스페스티아 엘루텔라 (Esphestia elutella), 에라니스 틸라리아 (Erannis tilaria), 에스티그메네네 아크레아 (Estigmene acrea), 율리아 살루브리콜라 (Eulia salubricola), 유포코엘리아 암비구엘라 (Eupocoellia ambiguella), 유포엑실리아 암비구엘라 (Eupoecilia ambiguella), 유프록티스 크라이소로에아 (Euproctis chrysorrhoea), 육소아 메소리아 (Euxoa messoria), 갈레리아 멜로넬라 (Galleria mellonella), 그라포리타 몰레스타 (Grapholita molesta), 하리시나 아메리카나 (Harrisina americana), 헬리코베르파 서브플렉사 (Helicoverpa subflexa), 헬리코베르파 제아 (왕담배나방), 헬리오티스 비레센스 (Heliothis virescens), 헤미류카 올리비애 (Hemileuca oliviae), 호메오소마 엘렉텔룸 (Homoeosoma electellum), 하이판티아 쿠네아 (Hyphantia cunea), 케이페리아 라이코페르시셀라 (Keiferia lycopersicella), 람디나 피셀라리아 피셀라리아 (Lambdina fiscellaria fiscellaria), 람디나 피셀라리아 루구브로사 (Lambdina fiscellaria lugubrosa), 류코마 살리시스 (Leucoma salicis), 로베시아 보트라나 (Lobesia botrana), 록사그로티스 알비코스타 (서부 콩 거세미나방), 록소스테게 스틱티칼리스 (Loxostege sticticalis), 라이만트리아 디스파르 (Lymantria dispar), 마칼라 타이리살리스 (Macalla thyrisalis), 말라코소마 (Malacosoma) sp., 마메스트라 브라시캐 (Mamestra brassicae), 마메스트라 콘피구라타 (Mamestra configurata), 만두카 퀸퀘마쿨라타 (Manduca quinquemaculata), 만두카 섹스타 (Manduca sexta), 마루카 테스툴랄리스 (Maruca testulalis), 멜란크라 픽타 (Melanchra picta), 오페로프테라 브루마타 (Operophtera brumata), 오르가이이아 (Orgyia) sp., 오스트리니아 누빌랄리스 (유럽 옥수수 명나방), 팔레아크리타 베르나타 (Paleacrita vernata), 파피아페마 네브리스 (Papiapema nebris) (일반 줄기 명나방), 파필리오 크레스폰테스 (Papilio cresphontes), 펙티노포라 고시피엘라 (Pectinophora gossypiella), 프라이가니디아 칼리포르니카 (Phryganidia californica), 필로노라익테르 블란카르델라 (Phyllonorycter blancardella), 피에리스 나피 (Pieris napi), 피에리스 라패 (Pieris rapae), 플라타이페나 스카브라 (Plathypena scabra), 플라타이노타 플로우엔다나 (Platynota flouendana), 플라타이노타 스툴타나 (Platynota stultana), 플라타입틸리아 카르두이닥타일라 (Platyptilia carduidactyla), 플로디아 인테르푼크텔라 (Plodia interpunctella), 플루텔라 자일로스텔라 (배추좀나방), 폰티아 프로토디세 (Pontia protodice), 슈달레티아 우니푼크타 (Pseudaletia unipuncta) (거염벌레), 슈도플라시아 인클루덴스 (Pseudoplasia includens), 사불로데스 아에그로타타 (Sabulodes aegrotata), 쉬주라 콘신나 (Schizura concinna), 시토트로가 세레알렐라 (Sitotroga cerealella), 스피론타 오셀라나 (Spilonta ocellana), 스포도프테라 프루기페르다 (밤나방), 스포도프테라 엑시구아 (파밤나방), 타우른스토포에아 피타이오캄파 (Thaurnstopoea pityocampa), 엔솔라 비셀리엘라 (Ensola bisselliella), 트리코플루시아 니, 우데아 루비갈리스 (Udea rubigalis), 자일로마이게스 쿠리아일스 (Xylomyges curiails), 및 이포노메우타 파델라 (Yponomeuta padella).

DIG-109 독소 및 DIG-152 독소, 및 그의 변이체를 사용하여 작물 식물의 초시목 해충을 방제하는 것이 또한 고려된다. 일부 실시양태에서, Cry 단백질은 예를 들어 뿌리벌레, 예컨대 디아브로티카 운데심푼크타타 호와르디 (Diabrotica undecimpunctata howardi) (남부 옥수수 뿌리벌레), 디아브로티카 롱기코르니스 바르베리 (Diabrotica longicornis barberi) (북부 옥수수 뿌리벌레), 및 디아브로티카 비르기페라 (Diabrotica virgifera) (서양 옥수수 뿌리벌레) 및 땅벌레, 예컨대 사이클로세팔라 보레알리스 (Cyclocephala borealis) (북부 마스크 풍뎅이 (northern masked chafer)), 사이클로세팔라 임마쿨라테 (Cyclocephala immaculate) (남부 마스크 풍뎅이), 및 포필리아 자포니카 (Popillia japonica) (일본 딱정벌레)를 포함하지만 이에 한정되는 것은 아닌 곤충 해충의 방제에 경제적으로 효율적으로 활용될 수 있다.

DIG -109 및 DIG -152 독소의 항체 검출

항-독소 항체. 본원에 개시된 B.t. 독소에 대한 또는 등가의 독소에 대한, 또는 이들 독소의 단편에 대한 항체는 예를 들어 문헌[Coligan et al., 2007] 및 그의 최신판에 교시된 바와 같이 당업계의 표준 절차를 이용하여 쉽게 제조될 수 있다. 그러한 항체는 DIG-109 독소, DIG-152 독소 및 그의 변이체의 존재의 검출에 유용하다.

일단 B.t. 살곤충 독소가 단리되었으면, 그 독소에 특이적인 항체가 당업계에 공지된 통상적인 방법에 의해 발생될 수 있다. 수주 또는 수개월의 기간에 걸친 선택된 숙주 내로의 반복 주입은 면역 반응을 야기하여 유의한 항-B.t. 독소의 혈청 역가를 생성한다. 바람직한 숙주는 포유류 종이며, 더 고도로 바람직한 종은 토끼, 염소, 양 및 마우스이다. 그러한 면역화 동물로부터 채혈된 혈액은 B.t. 살곤충 독소와 반응성인 항혈청 (폴리클로날 항체)을 수득하기 위하여 확립된 방법에 의해 프로세싱될 수 있다. 그 후 항혈청은 당업계에 공지된 기술에 따라 독소에의 흡착에 의해 친화성 정제될 수 있다. 친화성 정제된 항혈청은 당업계에 공지된 절차를 이용하여 항혈청 내의 면역글로불린 분획물을 단리함으로써 추가로 정제될 수 있다. 생성된 물질은 B.t. 살곤충 독소와 반응성인 면역글로불린의 불균질한 집단이다.

항-B.t. 독소 항체는 또한 면역원성 담체에 콘쥬게이션된 (conjugated) B.t. 살곤충 독소의 합성 펩티드 단편으로 이루어진 반합성 면역원을 제조함으로써 생성될 수 있다. 펩티드 단편의 제조에 유용한 다수의 방법 및 기기가 당업계에 공지되어 있다. 다수의 적합한 면역원성 담체, 예컨대 소 혈청 알부민 또는 키홀 림펫 헤모시아닌 (Keyhole Limpet Hemocyanin)이 또한 당업계에 공지되어 있으며, 이는 면역원 및 담체 단백질을 커플링시키는 기술이 그러한 바와 같다. 일단 반합성 면역원이 작제되었으면, B.t. 살곤충 독소 단편에 특이적인 항체의 제조 절차는 천연 B.t. 독소와 반응성인 항체의 제조에 사용되는 것과 동일하다.

항-B.t. 독소 모노클로날 항체 (MAb)는 정제된 B.t. 살곤충 독소를 사용하여 쉽게 제조된다. MAb를 제조하는 방법은 15년에 걸쳐 실행되었으며, 당업계의 숙련자에게 공지되어 있다. 아쥬반트 (adjuvant) 중 정제된 B.t. 살곤충 독소의 반복된 복강내 또는 피하 주사는 대부분의 동물에서 면역 반응을 야기한다. 과다면역화 B-림프구는 동물로부터 제거되며, 무기한으로 배양될 수 있는 적합한 융합 파트너 세포주와 융합된다. B-림프구가 과다면역화되고 MAb의 생성에 사용될 수 있는 바람직한 동물은 포유류이다. 더 바람직한 동물은 래트 및 마우스이며, 가장 바람직한 것은 BALB/c 마우스 주이다.

다수의 포유류 세포주가 하이브리도마의 생성에 적합한 융합 파트너이다. 다수의 그러한 주는 아메리칸 타입 컬쳐 콜렉션 (American Type Culture Collection; ATCC, 미국 버지니아주 매너서스) 및 상업적 공급처로부터 입수가능하다. 바람직한 융합 파트너 세포주는 마우스 골수종 및 HL-1^® 프렌들리 (Friendly) 골수종-653 세포주 (벤트렉스 (Ventrex), 미국 메인주 포틀랜드)가 가장 바람직하다. 일단 융합되면, 생성된 하이브리도마는 1 내지 2주 동안 선발 성장 배지에서 배양된다. 2가지 공지된 선발 시스템이 비융합 골수종 세포의 제거, 또는 혼합 하이브리도마 배양물로부터의 골수종 세포들 사이의 융합에 이용가능하다. 선발 시스템의 선택은 면역화된 마우스 주 및 사용되는 골수종 융합 파트너에 따라 달라진다. 문헌[Taggart and Samloff, (1983)]에 기술된 aaT 선발 시스템이 사용될 수 있지만, 문헌[Littlefield (1964)]에 기술된 HAT (하이포잔틴, 아미노프테린, 티미딘) 선발 시스템이 바람직하며, 이는 상기에 언급된 바람직한 마우스 주 및 융합 파트너와의 그의 양립가능성 때문이다. 그 후, 이미 이용한 성장 배지는 면역특이적 MAb 분비에 대하여 스크리닝된다. 효소 결합 면역흡착 분석법 (enzyme linked immunosorbent assay; ELISA) 절차가 이 목적에 최상으로 적합하지만, 큰 부피의 스크리닝용으로 수정된 방사면역분석법이 또한 허용된다. 상당한 수의 관계없는 또는 덜 요망되는 배양을 연속적으로 줄이도록 설계된 다수의 스크린이 수행될 수 있다. B.t. 살곤충 독소와 반응성인 MAb를 분비하는 배양물은 공지된 B.t. 살곤충 독소와의 교차 반응성에 대하여 스크리닝될 수 있다. 바람직한 B.t. 살곤충 독소에 우선적으로 결합하는 MAb는 구매가능한 분석물을 이용하여 이소타이핑될 수 있다. 바람직한 MAb는 IgG 부류의 것이며, 더 고도로 바람직한 MAb는 IgG₁ 및 IgG_2a 하위이소타입의 것이다.

바람직한 MAb를 분비하는 하이브리도마 배양물은 단클론성 및 안정성을 확립하기 위하여 수회 서브클로닝될 수 있다. 진핵, 비부착성 세포 배양물을 서브클로닝하는 공지된 방법은 제한 희석, 연성 아가로스 및 형광 활성화 세포 분류 기술을 포함한다. 각각의 서브클로닝 후, 생성된 배양물은 바람직하게는 항체 분비 및 이소타입에 대하여 재분석하여 안정한 바람직한 MAb 분비 배양물이 확립되었음을 보장한다.

항-B.t. 독소 항체는 본 발명의 청구된 B.t. 살곤충 독소 및 그의 변이체 또는 단편을 검출하는 다양한 방법에서 유용하다. 리포팅 (reporting) 기로 표지된 항체를 사용하여 다양한 환경에서의 항원의 존재를 확인할 수 있음이 공지되어 있다. 방사성 동위원소로 표지된 항체가 큰 정확성 및 민감성으로 다양한 생물 유체 중 항원의 존재의 확인을 위하여 방사면역분석법에서 수십년 동안 사용되었다. 더욱 최근에는, 효소 표지된 항체가 ELISA 분석법에서 방사성 표지 항체의 대용물로서 사용되었다. 또한, 본 발명의 B.t. 살곤충 독소에 대하여 면역반응성인 항체는 고정화 물질, 예컨대 폴리스티렌 웰 또는 입자에 결합시켜 면역분석법에서 사용하여 B.t. 독소가 시험 샘플에 존재하는지를 결정할 수 있다.

프로브를 이용한 검출

대상 발명의 독소 및 유전자를 확인하는 추가의 방법은 올리고뉴클레오티드 프로브의 사용을 통한 것이다. 이들 프로브는 검출가능한 뉴클레오티드 서열이다. 이들 서열은 적절한 방사능 표지체에 의해 검출가능해지게 될 수 있거나, 또는 미국 특허 제6268132호에 기술된 바와 같이 내재적으로 형광성이 되게 할 수 있다. 당업계에 공지된 바와 같이, 프로브 분자와 핵산 샘플이 두 분자 사이에 강한 염기쌍 형성 결합을 형성함으로써 혼성화될 경우, 프로브 및 샘플은 상당한 서열 상동성을 갖는 것으로 합리적으로 가정될 수 있다. 바람직하게는, 혼성화는 당업계에 공지된 기술에 의해 엄격한 조건 하에 행해지며, 이는 예를 들어 문헌[Keller and Manak (1993)]에 기술된 바와 같다. 프로브의 검출은 혼성화가 일어났는지를 공지된 방식으로 결정하는 수단을 제공한다. 그러한 프로브 분석은 대상 발명의 독소-코딩 유전자를 확인하는 빠른 방법을 제공한다. 본 발명에 따라 프로브로 사용되는 뉴클레오티드 절편은 DNA 합성기 및 표준 절차를 이용하여 합성될 수 있다. 이들 뉴클레오티드 서열은 또한 대상 발명의 유전자의 증폭을 위하여 PCR 프라이머로서 사용될 수 있다.

혼성화

분자 생물학의 숙련자에게 공지된 바와 같이, 두 핵산의 유사성은 혼성화하는 그의 경향에 의해 특성화될 수 있다. 본원에서 사용될 때, "엄격한 조건" 또는 "엄격한 혼성화 조건"이라는 용어는 프로브가 다른 서열에 혼성화하는 것보다 검출가능하게 더 큰 정도로 그의 표적 서열에 혼성화하는 (어닐링하는) (예를 들어, 배경에 비하여 2배 이상) 조건을 나타내고자 한다. 엄격한 조건은 서열의존적이며, 상이한 상황에서 상이하다. 세척 조건 및/또는 혼성화의 엄격도를 제어함으로써 프로브에 대하여 100% 상보성인 표적 서열이 확인될 수 있다 (상동적 프로빙). 대안적으로, 엄격도 조건은 더욱 낮은 정도의 유사성이 검출되도록 서열이 약간 미스매칭되도록 조정될 수 있다 (비상동적 프로빙). 일반적으로, 프로브는 길이가 약 1000개 미만의 뉴클레오티드이며, 바람직하게는 길이가 500개 미만의 뉴클레오티드이다.

전형적으로, 엄격한 조건은 염 농도가 pH 7.0 내지 pH 8.3에서 약 1.5 M 미만의 Na 이온, 전형적으로는 약 0.01 내지 1.0 M의 Na 이온 농도 (또는 다른 염)이며, 온도가 짧은 프로브 (예를 들어, 10 내지 50개 뉴클레오티드)일 경우 약 30℃ 이상, 그리고 긴 프로브 (예를 들어, 50개 초과의 뉴클레오티드)일 경우 약 60℃ 이상인 것이다. 엄격한 조건은 또한 포름아미드와 같은 불안정화제의 첨가에 의해 달성될 수 있다. 예시적인 낮은 엄격도 조건은 37℃에서 30% 내지 35%의 포름아미드, 1 M NaCl, 1% SDS (소듐 도데실 술페이트)의 완충액을 이용한 혼성화 및 50℃ 내지 55℃에서 1X 내지 2X SSC (20X SSC = 3.0 M NaCl/0.3 M 시트르산3나트륨)에서의 세척을 포함한다. 예시적인 중간 정도의 엄격도 조건은 37℃에서 40% 내지 45%의 포름아미드, 1.0 M NaCl, 1% SDS에서의 혼성화 및 55℃ 내지 60℃에서 0.5X 내지 1X SSC에서의 세척을 포함한다. 예시적인 높은 엄격도 조건은 37℃에서 50% 포름아미드, 1 M NaCl, 1% SDS에서의 혼성화 및 60℃ 내지 65℃에서 0.1X SSC에서의 세척을 포함한다. 임의로, 세척 완충액은 약 0.1% 내지 약 1%의 SDS를 포함할 수 있다. 혼성화 지속 기간은 일반적으로 약 24시간 미만, 일반적으로 약 4 내지 약 12시간이다.

특이성은 전형적으로 혼성화 후 세척의 함수이며, 가장 중요한 인자는 최종 세척 용액의 이온 강도 및 온도이다. DNA/DNA 하이브리드에 있어서, 열융점 (T_m)은 상보성 표적 서열의 50%가 완벽 매칭 프로브에 혼성화하는 온도 (정의된 이온 강도 및 pH 하에서)이다. T_m은 각각의 1%의 미스매칭에 있어서 약 1℃만큼 감소하며, 따라서, T_m, 혼성화 조건 및/또는 세척 조건은 요망되는 동일성의 서열들의 어닐링을 돕도록 조정될 수 있다. 예를 들어, 90% 초과의 동일성을 갖는 서열을 찾을 경우, T_m은 10℃ 감소될 수 있다. 일반적으로, 엄격한 조건은 정의된 이온 강도 및 pH에서 특정 서열 및 그의 상보체의 T_m보다 약 5℃ 더 낮도록 선택된다. 그러나, 고도로 엄격한 조건은 T_m보다 1℃, 2℃, 3℃, 또는 4℃ 더 낮은 온도에서의 혼성화 및/또는 세척을 이용할 수 있으며, 중간 정도로 엄격한 조건은 T_m보다 6℃, 7℃, 8℃, 9℃, 또는 10℃ 더 낮은 온도에서의 혼성화 및/또는 세척을 이용할 수 있으며, 낮은 엄격도 조건은 T_m보다 11℃, 12℃, 13℃, 14℃, 15℃, 또는 20℃ 더 낮은 온도에서의 혼성화 및/또는 세척을 이용할 수 있다.

T_m (℃)은 실험적으로 결정될 수 있거나 또는 계산에 의해 근사치로 계산될 수 있다. DNA-DNA 하이브리드에 있어서, T_m은 문헌[Meinkoth and Wahl (1984)]의 등식으로부터 근사치로 계산될 수 있다:

T_m(℃) = 81.5℃ + 16.6(log M) + 0.41(%GC) - 0.61(% 포름아미드) - 500/L

여기서, M은 1가 양이온의 몰 농도이며, %GC는 DNA 중 구아노신 및 시토신 뉴클레오티드의 백분율이고, % 포름아미드는 혼성화 용액 중 포름아미드의 백분율이며, L은 염기쌍 중 하이브리드의 길이이다.

대안적으로, T_m은 하기 식 (문헌[Beltz et al., 1983])으로 기술된다.

T_m(℃) = 81.5℃ + 16.6(log[Na+]) + 0.41(%GC) - 0.61(% 포름아미드) - 600/L

여기서, [Na+]는 나트륨 이온의 몰 농도이며, %GC는 DNA 중 구아노신 및 시토신 뉴클레오티드의 백분율이고, % 포름아미드는 혼성화 용액 중 포름아미드의 백분율이며, L은 염기쌍 중 하이브리드의 길이이다.

상기 등식, 혼성화 및 세척 조성물, 및 요망되는 Tm을 이용하면 당업자는 혼성화 및/또는 세척 용액의 엄격도의 변동이 내재적으로 기술됨을 이해할 것이다. 요망되는 정도의 미스매칭이 45℃ 미만 (수성 용액) 또는 32℃ 미만 (포름아미드 용액)의 T_m이 되게 할 경우, 더욱 높은 온도가 사용될 수 있도록 SSC 농도를 증가시키는 것이 바람직하다. 핵산의 혼성화에 대한 광범위한 가이드는 문헌[Tijssen (1993)] 및 문헌[Ausubel et al., 1995]과 그의 최신판에서 발견된다. 또한, 문헌[Sambrook et al., (1989)] 및 그의 최신판을 참조한다.

방사능 표지된 유전자-특이적 프로브를 이용한 서던 (Southern) 블롯 상에서의 고정 DNA의 혼성화는 표준 방법에 의해 수행될 수 있다 (문헌[Sambrook et al., 상기 문헌]). 폴리뉴클레오티드 프로브의 표지에 사용되는 방사능 동위원소는 32P, 33P, 14C, 또는 3H를 포함할 수 있다. 폴리뉴클레오티드 프로브 분자 내로의 방사능 동위원소의 혼입은 분자 생물학 분야의 숙련자에게 공지된 임의의 몇몇 방법에 의해 행해질 수 있다 (예를 들어, 문헌[Sambrook et al., 상기 문헌] 참조). 일반적으로, 혼성화 및 후속 세척은 청구된 독소 코딩 유전자에 대하여 상동성을 갖는 표적 서열의 검출을 허용하는 엄격한 조건 하에 실시될 수 있다. 이중 가닥 DNA 유전자 프로브에 있어서, 혼성화는 DNA 하이브리드의 T_m보다 20-25℃ 더 낮은 온도에서 6X SSPE, 5X 덴하르트 용액 (Denhardt's Solution), 0.1% SDS, 0.1 mg/mL의 변성 DNA에서 하룻밤 실시될 수 있다 [20X SSPE는 3M NaCl, 0.2 M NaHP0₄, 및 0.02M EDTA (에틸렌디아민 테트라아세트산 나트륨염)이며; 100X 덴하르트 용액은 20 gm/L의 폴리비닐피롤리돈, 20 gm/L의 피콜 (Ficoll) 타입 400 및 20 gm/L의 소 혈청 알부민 (분획물 V)임].

세척은 전형적으로 하기와 같이 실시될 수 있다:

실온에서 15분 동안 1X SSPE, 0.1% SDS (더욱 낮은 엄격도의 세척)에서 2회.

T_m - 20℃에서 15분 동안 0.2X SSPE, 0.1% SDS (더욱 높은 엄격도의 세척)에서 1회.

올리고뉴클레오티드 프로브에 있어서, 혼성화는 하이브리드의 T_m보다 10-20℃ 더 낮은 온도에서 6X SSPE, 5X 덴하르트 용액, 0.1% SDS, 0.1 mg/mL의 변성 DNA에서 하룻밤 실시될 수 있다. 올리고뉴클레오티드 프로브의 T_m은 하기 식에 의해 결정될 수 있다 (문헌[Suggs et al., 1981]).

T_m(℃ ) = 2(T/A 염기쌍의 수) + 4(G/C 염기쌍의 수)

세척은 전형적으로 하기와 같이 실시될 수 있다:

실온에서 15분 동안 1X SSPE, 0.1 % SDS (더욱 낮은 엄격도의 세척)에서 2회.

혼성화 온도에서 15분 동안 1X SSPE, 0.1% SDS (더욱 높은 엄격도의 세척)에서 1회.

염 농도 및 온도의 조합의 일부 예는 (엄격도 증가 순서대로) 하기와 같다: 2X SSPE 또는 SSC, 실온; 1X SSPE 또는 SSC, 42℃; 0.1X SSPE 또는 SSC, 42℃; 0.1X SSPE 또는 SSC, 65℃.

혼성화용 프로브 분자 및 프로브와 표적 분자 사이에 형성된 하이브리드 분자는 방사능 표지 이외의 수단에 의해 검출가능해지게 될 수 있다. 그런 다른 방법은 본 발명의 범주 이내인 것으로 의도된다.

본원에 기술된 실시예 및 실시양태는 단지 예시 목적을 위한 것이며, 그를 고려한 다양한 변형 또는 변화가 당업계의 숙련자에게 제안될 것이고 이는 본 출원의 사상 및 범위와 첨부된 특허청구범위의 범주 내에 포함됨을 이해하여야 한다.

구체적으로 지시되거나 뜻하는 것이 아니라면, 본원에서 사용될 때 단수형 ("a", "an" 및 "the") 용어는 "적어도 하나"를 나타낸다.

하기는 본 발명을 실행하는 절차를 예시하는 실시예이다. 이들 실시예는 한정하는 것으로 파악되어서는 안된다. 달리 나타내지 않으면 모든 백분율은 중량 기준이며, 모든 용매 혼합 비율은 부피 기준이다. 모든 온도는 ℃ 단위이다.

실시예 1

키메라 Cry1Ca 코어 독소 및 Cry1Ab 전독소의 설계

키메라 독소. 하나의 Cry 독소의 코어 독소 도메인이 또 다른 Cry 독소의 전독소 절편에 융합된 것을 이용하는 키메라 단백질이 예를 들어 미국 특허 제5593881호 및 미국 특허 제5932209호에서 이전에 보고되었다. Cry1Ca3 델타 내독소 단백질 서열은 CryIC(b)의 폐기된 용어 하에 젠뱅크 (GenBank) 등록 번호 AAA22343으로 기탁되어 있다.

본 발명의 Cry1Ca 키메라 단백질 변이체는 Cry1Ca3 살곤충 독소로부터 유래된 N-말단 코어 독소 절편이 상기 코어 독소 절편의 말단을 지난 어떠한 지점에서 이종 델타 내독소 전독소 절편에 융합된 것을 포함하는 독소를 포함한다. 코어 독소로부터의 이종 전독소 절편으로의 전위는 대략적으로 천연 코어 독소/전독소 접합부에서 일어날 수 있거나, 또는 대안에서는 천연 전독소의 일부분 (코어 독소 절편을 지나서 연장함)이 유지될 수 있고 이때 이종 전독소로의 전위가 하류에서 일어난다. 변이 양식에서, 코어 독소 및 전독소 절편은 정확하게 그가 유래된 천연 독소의 아미노산 서열을 포함할 수 있거나, 또는 서로에게 융합될 때 절편들의 생물학적 기능을 감소시키지 않으며 상기 기능을 향상시킬 수 있는 아미노산 부가, 결실 또는 치환을 포함할 수 있다.

예를 들어, 대상 발명의 키메라 독소는 Cry1Ca3로부터 유래된 코어 독소 절편 및 이종 전독소를 포함한다. 본 발명의 바람직한 실시양태에서, Cry1Ca3으로부터 유래되고 서열 1 (619개 아미노산)에 Cry1Ca 코어 독소 절편으로 개시된 코어 독소 절편은 Cry1Ab 델타-내독소로부터 유래된 전독소 절편을 포함하는 이종 절편에 융합시킨다. 서열 2는 본 발명의 Cry1Ca 변이체에서 유용한 그리고 Cry1Ab로부터 유래된 하나의 전독소 절편의 545개 아미노산의 서열을 개시한다. 서열 2의 이 전독소 절편의 마지막의 약 100 내지 150개 아미노산이 주의를 끌며, 이를 본 발명의 키메라 독소 내에 포함시키는 것이 중요하다. 따라서, 본 발명의 바람직한 실시양태는 서열 1에 개시된 Cry1Ca 코어 독소 절편을 서열 2에 개시된 Cry1Ab로부터 유래된 전독소 절편에 연결시킨 키메라 단백질을 포함한다. 본원에서 DIG-152로 칭하는 키메라 단백질의 1164개 아미노산의 서열은 서열 3 (pMYC2547 버전)으로 개시되어 있다. 본 발명의 두 번째의 바람직한 실시양태는 서열 1로 개시된 Cry1Ca 코어 독소 절편을 서열 4로 제시된 Cry1Ab로부터 유래된 제2의 545개 아미노산의 전독소 절편에 연결시킨 키메라 단백질을 포함한다. 이 전독소 절편의 마지막의 약 100 내지 150개 아미노산이 주의를 끌며, 이를 본 발명의 키메라 독소 내에 포함시키는 것이 중요하다. DIG-109로 칭하는 제2 키메라 단백질의 1164개 아미노산의 서열은 서열 5 (마이즈 최적화 버전)로 개시되어 있다. Cry1Ca 코어 독소 변이체 및 Cry1Ab로부터 유래된 전독소를 포함하는 다른 키메라 융합물이 본 발명의 범주 내임을 이해하여야 한다.

서열 2 및 서열 4로 제시된, Cry1Ab로부터 유래된 전독소 절편들은 단지 단일한 (첫 번째) 위치에서 서열이 상이한, 서로의 본질적 기능적 등가물임을 주목한다.

실시예 2

키메라 Cry1Ca 코어/ Cry1Ab 전독소 단백질을 코딩하는 발현 플라스미드의 작 제 및 슈도모나스에서의 발현

Cry1Ab 전독소에 융합된 Cry1Ca 코어로 이루어진 전장 키메라 단백질 (DIG-152; 서열 3)을 생성하도록 조작한 슈도모나스 플루오레센스 (Pf) 발현 작제물 pMYC2547의 작제에서 표준 클로닝법 [예를 들어, 문헌[Sambrook et al., (1989)] 및 문헌[Ausubel et al., (1995)]과 그의 최신판에 기술된 바와 같음]을 이용하였다. 단백질 생성은 미국 특허 제5169760호에 개시된 바와 같이 변형 lac 오페론을 삽입한 슈도모나스 플루오레센스 주 MB214 (주 MB101의 유도체; 피. 플루오레센스 biovar I)에서 수행하였다. 기본적인 클로닝 방법은 DIG-152를 코딩하는 DNA 단편을 플라스미드 벡터 내로 서브클로닝하는 것을 수반하였으며, 그에 의해 이것은 플라스미드 pKK223-3 (피엘 파마시아 (PL Pharmacia; 미국 위스콘신주 밀워키)) 유래의 rrnBTlT2 종결 서열 및 Ptac 프로모터의 발현 제어 하에 두어진다. 한 가지 그러한 플라스미드는 pMYC2547로 명명하였으며, 이 플라스미드를 지닌 MB214 단리체를 Dpf108로 명명하였다.

진탕 플라스크에서의 성장 및 발현 분석 곤충 생물분석 및 특성화를 위한 DIG-152 단백질의 생성은 진탕 플라스크에서 성장시킨 피. 플루오레센스 주 Dpf108에 의해 성취하였다. Ptac 프로모터에 의해 지시되는 DIG-152 단백질 생성은 미국 특허 제5527883호에 이전에 기술된 바와 같이 행하엿다. 진탕하면서 30℃에서 24시간 처음 인큐베이션한 후 이소프로필-β-D-1-티오갈락토피라노사이드 (IPTG)를 첨가함으로써 발현을 유도하였다. 유도 시점 및 유도 후 다양한 시점에서 배양물을 샘플링하였다. 세포 밀도를 600 nm에서의 광학 밀도 (OD₆₀₀)에 의해 측정하였다.

진탕 플라스크 샘플의 세포 분획화 및 SDS - PAGE 분석 각각의 샘플링 시점에서, 샘플의 세포 밀도를 OD₆₀₀ = 20으로 조정하고, 1 mL의 분취물을 14000 x g에서 5분 동안 원심분리하였다. 세포 펠렛을 -80도에서 냉동시켰다. 냉동시킨 진탕 플라스크 세포 펠렛 샘플로부터의 용해성 및 불용성 분획물을 이지라이즈 (EasyLyse)^TM 박테리아 단백질 추출 용액 (에피센터 (EPICENTRE)^® 바이오테크놀로지즈 (Biotechnologies), 미국 위스콘신주 매디슨)을 이용하여 생성하였다. 각각의 세포 펠렛을 1 mL의 이지라이즈^TM 용액에 재현탁시키고, 용해 완충액에서 1:4로 추가로 희석시키고, 실온에서 30분 동안 진탕하면서 인큐베이션하였다. 용해물을 14,000 rpm에서 20분 동안 4도에서 원심분리하고, 상청액을 용해성 분획물로서 회수하였다. 그 후 펠렛 (불용성 분획물)을 동일한 부피의 인산염 완충 염수 (PBS; 11.9 mM Na₂HPO₄, 137 mM NaCl, 2.7 mM KC1, pH7.4)에 재현탁시켰다.

샘플은 β-메르캅토에탄올을 함유하는 2X 램믈리 (Laemmli) 샘플 완충액과 1:1로 혼합하고 (문헌[Sambrook et al., 상기 문헌]), 5분 동안 비등시킨 후 크리테리온 (Criterion) XT 비스-트리스 12% 겔 (바이오-라드 인크. (Bio-Rad Inc.; 미국 캘리포니아주 허큘리스)) 상에 로딩하였다. 전기영동을 권고된 XT MOPS 완충액에서 수행하였다. 겔을 제조업자 (바이오-라드)의 프로토콜에 따라 바이오-세이프 쿠마시 스테인 (Bio-Safe Coomassie Stain)으로 염색시키고, 알파 이노테크 이미징 시스템 (Alpha Innotech Imaging system; 미국 캘리포니아주 샌리앤드로)을 이용하여 이미징하였다.

봉입체 ( inclusion body ; IB ) 제조. DIG-152 단백질 봉입체 (IB) 제조는 SDS-PAGE 및 MALDI-MS (매트릭스 보조 레이저 탈착/이온화 질량 분광법 (Matrix Assisted Laser Desorption/Ionization Mass Spectrometry))에 의해 입증되는 바와 같이 불용성 B.t. 살곤충 단백질을 생성하는 피. 플루오레센스 발효로부터의 세포에서 수행하였다. 피. 플루오레센스 발효 펠렛을 37도 수조에서 해동시켰다. 세포를 용해 완충액 [50 mM 트리스, pH 7.5, 200 mM NaCl, 20 mM EDTA 2나트륨 염 (에틸렌디아민테트라아세트산), 1% 트리톤 X-100, 및 5 mM 디티오트레이톨 (DTT); 5 mL/L의 박테리아 프로테아제 저해제 칵테일 (카탈로그 번호 P8465; 시그마-알드리치 (Sigma- Aldrich; 미국 미주리주 세인트 루이스))을 사용 직전에 첨가함]에 25% (w/v)로 재현탁하였다. 세포를 최저 설정치의 핸드헬드 (hand-held) 균질화기 (티슈 테어러 (Tissue Tearor), 바이오스펙 프로덕츠, 인크. (BioSpec Products, Inc.; 미국 오클라호마주 바틀레스 빌))를 이용하여 현탁시켰다. 라이소자임 (계란 흰자 유래의 시그마 L7651 25 mg)은 금속 스패튤라를 이용하여 혼합함으로써 세포 현탁물에 첨가하고, 상기 현탁물을 실온에서 1시간 동안 인큐베이션하였다. 현탁물을 얼음 상에서 15분 동안 냉각시키고, 그 후 브랜슨 (Branson) 초음파 장치 250 (2회의 1분의 기간, 50%의 듀티 사이클, 30%의 출력)를 이용하여 초음파 처리하였다. 세포 용해물을 현미경법으로 체크하였다. 필요할 경우 추가의 25 mg의 라이소자임을 첨가하고, 인큐베이션 및 초음파 처리를 반복하였다. 현미경법을 통한 세포 용해의 확증 후, 상기 용해물을 11,500 x g에서 25분 동안 (4도) 원심분리하여 IB 펠렛을 형성하고, 상청액을 버렸다. IB 펠렛을 100 mL 용해 완충액으로 재현탁시키고, 핸드헬드 혼합기로 균질화하고, 상기와 같이 원심분리하였다. 상청액이 무색으로 되고 IB 펠렛이 안정된 회백색으로 될 때까지 IB 펠렛을 재현탁 (50 mL의 용해 완충액 중에), 균질화, 초음파 처리 및 원심분리에 의해 반복적으로 세척하였다. 마지막 세척에 있어서, IB 펠렛을 2 mM EDTA를 함유하는 살균 여과 (0.22 ㎛) 증류수에 재현탁시키고, 원심분리하였다. 최종 펠렛을 2 mM EDTA를 함유하는 살균 여과 증류수에 재현탁시키고, 1 mL의 분취물로 -80도에서 보관하였다.

IB 제제 중 단백질의 SDS-PAGE 분석 및 정량화는 1 mL의 IB 펠렛 분취물을 해동시키고 살균 여과 증류수로 1:20으로 희석시킴으로써 행하였다. 그 후 희석 샘플을 4X 환원 샘플 완충액 [250 mM 트리스, pH 6.8, 40% 글리세롤 (v/v), 0.4%의 브로모페놀 블루 (Bromophenol Blue) (w/v), 8% SDS (w/v) 및 8% β-메르캅토에탄올 (v/v)]을 이용하여 끓이고, 노벡스 (Novex)^® 4-20% 트리스-글리신 상에 로딩하고, 12+2 웰 겔 (인비트로겐)을 1X 트리스/글리신/SDS 완충액 (바이오라드 (BioRad))으로 러닝시켰다. 겔을 60분 동안 200 V에서 러닝시키고, 그 후 쿠마시 블루 (Coomassie Blue) (10% 아세트산, 45% 메탄올 중 50% R-250/50% G-250)로 염색시키고, 증류수 중 7% 아세트산, 5% 메탄올로 탈염시켰다. 표적 밴드의 정량화는 동일 겔 상에서 러닝시킨 소 혈청 알부민 (BSA) 표준 샘플에 대하여 상기 밴드의 농도계 값들을 비교하여 표준 곡선을 생성함으로써 행하였다.

봉입체의 가용화 . Pf 클론 DPf108로부터의 DIG-152 봉입체 현탁물 6 mL을 에펜도르프 (Eppendorf) 모델 5415C 마이크로퓨지 (microfuge)의 최고 설정치에서 (대략 14,000 x g) 원심분리하여 봉입체를 펠렛화하였다. 보관 완충액 상청액을 제거하고, 50 mL 코니칼 (conical) 튜브에서 25 mL의 100 mM 탄산나트륨 완충액 (pH 11)으로 대체하였다. 봉입체를 피펫을 이용하여 재현탁시키고, 와동시켜 철저히 혼합하였다. 튜브를 4도에서 하룻밤 온화하게 흔들리는 플랫폼 상에 두어서 표적 단백질을 추출하였다. 추출물을 30,000 x g에서 4도에서 30분 동안 원심분리하고, 생성된 상청액을 아미콘 (Amicon) 울트라-15 재생 셀룰로오스 원심분리 필터 장치 (30,000의 분자량의 컷오프 (Cutoff); 밀리포어 (Millipore))를 이용하여 5배 농축시켰다. 그 후 샘플 완충액을 일회용 PD-10 컬럼 (지이 헬스케어 (GE Healthcare; 미국 뉴저지주 피스카타웨이)을 이용하여 10 mM CAPS [3-(사이클로헥사미노)1-프로판술폰산] (pH 10)로 교환하였다.

봉입체 단백질의 가용화 및 트립신 활성화. 일부 예에서, Pf 클론 DPf108로부터의 DIG-152 봉입체 현탁물을 에펜도르프 모델 5415C 마이크로퓨지의 최고 설정치에서 (대략 14,000 x g) 원심분리하여 봉입체를 펠렛화하였다. 보관 완충액 상청액을 제거하고, pH 11의 100 mM CAPS로 대체하여 대략 50 mg/mL의 단백질 농도를 제공하였다. 튜브를 실온에서 3시간 동안 흔들어서 상기 단백질을 완전히 가용화하였다. 트립신을 5% 내지 10% (w:w, IB 분말의 초기 중량 기준)인 양으로 첨가하고, 4도에서 하룻밤 흔들면서 인큐베이션함에 의해 또는 실온에서 90-120분 동안 흔들어서 소화를 성취하였다. 불용성 물질을 10,000 x g에서의 15분 동안의 원심분리에 의해 제거하고, 상청액을 모노큐 (MonoQ) 음이온 교환 컬럼 (10 mm x 10 cm)에 적용하였다. 활성화 DIG-152 단백질은 25배 컬럼 부피에 걸쳐 0% 내지 100%의 1 M NaCl 구배에 의해 용출시켰다 (이는 SDS-PAGE에 의해 결정되는 바와 같음, 하기 참조). 활성화 단백질을 함유하는 분획물을 풀링하고 (pooled), 필요할 경우 상기와 같이 아미콘 울트라-15 재생 셀룰로오스 원심분리 필터 장치를 이용하여 10 mL 미만으로 농축시켰다. 그 후 상기 물질을 100 mM NaCl. 10% 글리세롤, 0.5% 트윈 (Tween)-20 및 1 mM EDTA를 함유하는 완충액에서 수퍼덱스 (Superdex) 200 컬럼 (16 mm x 60 cm)에 통과시켰다. 활성화된 (효소에 의해 절단된) 단백질이 65 내지 70 mL에서 용출됨을 SDS-PAGE 분석에 의해 결정하였다. 활성화 단백질을 함유하는 분획물을 풀링하고, 상기와 같이 원심분리 농축기를 이용하여 농축시켰다.

겔 전기영동. 환원제로서 5 mM DTT를 함유하는 NuPAGE^® LDS 샘플 완충액 (인비트로겐) 중에 1:50으로 희석시킴으로써 농축 단백질 제제를 전기영동용으로 준비하고, 95도에서 4분 동안 가열하였다. 샘플은 0.2 ㎍ 내지 2 ㎍/레인의 범위의 5가지의 BSA 표준물 (표준 곡선 생성용)과 함께 4-12% NuPAGE^® 겔의 두 레인에 로딩하였다. 추적 염료가 겔의 하부에 도달할 때까지 MOPS SDS 러닝 완충액 (인비트로겐)을 이용하여 전압을 200 V로 인가하였다. 겔을 10% 아세트산, 45% 메탄올 중 0.2% 쿠마시 블루 G-250으로 염색시키고, 처음에 잠시 45% 메탄올, 10% 아세트산으로, 그리고 그 후 7% 아세트산, 5% 메탄올로 충분히 탈염시켰는데, 이는 배경이 제거될 때까지 그렇게 하였다. 탈염 후, 겔을 바이오라드 플루오르-S 멀티이미저 (Fluor-S Multilmager)로 스캐닝하였다. 상기 기기의 퀀티티 원 소프트웨어 (Quantity One Software) v.4.5.2를 사용하여 염색된 단백질 밴드의 배경-차감 부피를 수득하고 BSA 표준 곡선을 생성하였으며, 상기 곡선을 이용하여 원액 중 키메라 DIG-152 단백질의 농도를 계산하였다.

실시예 3

슈도모나스 플루오레센스에서 생성된 DIG -152 단백질의 살곤충 활성

유럽 옥수수 명나방 (ECB; 오스트리니아 누빌랄리스 (휘브네르 (Huebner))), Cry1F-내성 ECB (rECB), 왕담배나방 (CEW; 헬리코베르파 제아 (보디에 (Boddie))), 검거세미나방 (BCW; 아그로티스 입실론 (후프나겔 (Hufnagel))), 밤나방 (FAW, 스포도프테라 프루기페르다 (제이.이. 스미스 (J.E. Smith))), Cry1F-내성 FAW (rFAW), 및 남서부 옥수수 명나방 (SWCB, 디아트라에아 그란디오셀라)을 포함하는 인시목 종에서 DIG-152 단백질의 살곤충 활성을 입증하였다.

샘플 제조 및 생물분석. 봉입체 제제 (천연 전장 단백질 또는 트립신 활성화 단백질)를 PD-10 컬럼 또는 투석과 같은 교환 방법에 의해 10 mM CAPS (pH 1O) 완충액으로 옮겼다. 그 후 샘플을 10 mM CAPS (pH 10) 중에 적절하게 희석시켰으며, 모든 생물분석은 사망률 또는 성장 저해율에 대한 배경 체크로서의 역할을 하는 이 완충액으로 이루어진 대조 처리제를 포함하였다.

생물분석 완충액 중 단백질 농도는 겔 농도측정을 위하여 표준 곡선을 생성하기 위하여 BSA를 사용하여 겔 전기영동에 의해 개산하였는데, 이는 상기와 같이 바이오라드 이미징 시스템을 이용하여 측정하였다. 겔 매트릭스 중 단백질을 쿠마시 블루계 염색제로 염색시키고, 탈염시킨 후 판독하였다.

정제한 단백질을 인공 곤충 규정식 상에서 신생 인시목 유충을 이용하여 행하는 생물분석에서의 살곤충 활성에 대하여 시험하였다. ECB, CEW, BCW, FAW, 및 SWCB의 유충을 상업적 곤충 연구소 (벤존 리서치 인크. (Benzon Research Inc.; 미국 펜실베이니아주 칼리즐)가 유지한 콜로니로부터 수득한 알로부터 부화시켰다. rECB 및 rFAW의 유충을 독점적 콜로니 (다우 아그로사이언시즈 (Dow AgroSciences; 미국 인디애나주 인디애나폴리스))로부터 수확한 알로부터 부화시켰다.

생물분석은 곤충 생물분석용으로 특별히 설계된 128웰 플라스틱 트레이 (씨-디 인터내셔널 (C-D International; 미국 뉴저지주 피트맨))에서 행하였다. 각각의 웰은 1.0 mL의 다중-종 인시목 규정식 (사우스랜드 프로덕츠 (Southland Products; 미국 아칸소주 레이크 빌리지)을 함유하였다. 40 μL의 단백질 샘플 분취물을 각각의 웰의 1.5 cm² 규정식 표면 상에 피펫에 의해 전달하였다 (즉, 26.7 μL/cm²). 규정식 농도를 웰 중 표면적 제곱 센티미터 당 DIG-152 단백질의 양 (ng)으로 계산하였다. 처리한 트레이는 규정식 표면 상의 액체가 증발되거나 또는 규정식 내로 흡수될 때까지 흄후드에서 유지하였다.

부화한지 수시간 내에, 개개의 유충은 적신 낙타털 브러시로 골라내어 웰 당 1마리의 유충을 처리 규정식 상에 두었다. 그 후, 만연된 웰을 가스가 교환되도록 통기되는 투명 플라스틱의 접착 시트로 밀봉하였다 (씨-디 인터내셔널). 생물분석 트레이를 제어된 환경 조건 [28도, 대략 40%의 상대 습도 (Relative Humidity; RH), 16 hr:8 hr (명암 (ligh dark))] 하에 5일 동안 유지하고, 그 히간 후 각각의 단백질 샘플에 노출된 곤충의 총수, 죽은 곤충의 수 및 생존 곤충의 중량을 기록하였다. 사망률 (%) 및 성장 저해율 (%)을 각각의 처리에 대하여 계산하였다. 성장 저해율 (GI) (%)을 하기와 같이 계산하였다:

%GI = [1 - (TWIT/TNIT)/(TWIBC/TNIBC)] x 100

여기서, TWIT는 처리에 있어서의 곤충의 총 중량 (Total Weight of Insects in the Treatment)이며,

TNIT는 처리에 있어서의 곤충의 총수 (Total Number of Insects in the Treatment)이고,

TWIBC는 배경 체크 (완충액 대조구)에 있어서의 곤충의 총 중량 (Total Weight of Insects in the Background Check)이며,

TNIBC는 배경 체크 (완충액 대조구)에 있어서의 곤충의 총수 (Total Number of Insects in the Background Check)이다.

GI₅₀은 %GI 값이 50인 규정식 중 키메라 DIG-152 단백질의 농도인 것으로 결정하였다. LC₅₀ (50% 치사 농도)Lethal Concentration)은 50%의 시험 곤충을 사멸시키는 규정식 중 DIG-152 단백질의 농도로 기록하였다. 통계적 분석 (일원 분산 분석 (One-way ANOVA))을 JMP 소프트웨어 (에스에이에스 (SAS; 미국 노스캐롤라이나주 캐리))를 이용하여 행하였다.

표 3에는 7가지 유형의 시험 곤충 유충에서의 DIG-152 단백질의 섭취에 대한 생물분석의 결과를 제시하였다.

밤나방 (스포도프테라 프루기페르다) 및 남서부 옥수수 명나방 (디아트라에아 그란디오셀라)의 신생 유충의 성장을 DIG-152 단백질의 섭취 후 저해시킨다는 것이 본 발명의 DIG-152 단백질의 특징이었다. 또한, Cry1F에 의한 중독에 대하여 내성을 갖는 밤나방 유충은 야생형 밤나방 유충이 그러한 만큼 DIG-152 활성에 대하여 민감하였다.

실시예 4

슈도모나스 플루오레센스에서 생성된 DIG -152 단백질의 추가의 살곤충 활성

DIG-152 단백질 (트립신 활성화되지 않음)의 인시목 살곤충 활성을 규정식 포함 절차를 이용하여 용량-응답 실험에서 사탕수수 명나방 (SCB; 디아트라에아 사카랄리스) 및 Cry1Ab-내성 SCB (rSCB)의 신생 유충에서 추가로 입증하였다. DIG-152 봉입체는 7.5 mL의 100 mM CAPS (pH 11), 1 mM EDTA에서 4도에서 4시간 동안 온화하게 흔들어서 가용화하고, 이것에 200 μL의 박테리아 프로테아제 저해제 (시그마 P4865; 공급처의 지시에 따라 준비)를 첨가하였다. 원심분리하여 불용성 물질을 펠렛화한 후, 스톡 단백질 농도를 100 mM CAPS (pH 11) 중에서 4.0 mg/mL로 조정하였다. 곤충 생물분석에 있어서, 규정식 1 g 당 0.030 ㎍ 내지 102 ㎍의 범위의 DIG-152 단백질 농도는 적절한 부피를 메리딕 (meridic) 규정식 (바이오-서브 (Bio-Serv; 미국 뉴저지주 프렌치타운))과 혼합함으로써 준비하고, 그 직후 대략 0.7 mL의 규정식을 128셀 트레이 (바이오 (Bio)-Ba-128, 씨-디 인터내셔널)의 개개의 셀 내로 분배하였다.

트립신-활성화 Cry1Ab 단백질 (살곤충 활성에 대한 양성 대조구로서 사용)을 규정식 (동결건조 분말을 적당량의 증류수와 혼합한 후 규정식 제조를 함으로써 제조함) 1 g 당 0.03125 ㎍ 내지 32 ㎍의 범위에서 시험하였다.

단지 완충액 (100 mM CAPS (pH 11), DIG-152 시험용) 또는 증류수 (블랭크 대조구, Cry1Ab 시험용)로 제조한 규정식을 대조 처리제로서 사용하였다. 디. 사카랄리스의 하나의 신생 유충 (부화 후 24시간 미만)을 각각의 셀에서 규정식 표면 상에 방출하였다. 유충 접종 후, 셀을 통기 뚜껑 (씨-디 인터내셔널)으로 덮고, 생물분석 트레이를 28도, 50% RH, 및 16 hr:8 hr의 (명암) 광주기에서 유지한 환경실에 두었다. 유충 사망률, 유충 중량, 및 중량 증가를 보이지 않은 (유충 당 0.1 mg 미만) 생존 유충의 수를 접종 후 7일째에 기록하였다. 곤충 주/Cry 단백질 농도의 각각의 조합을 4회 반복하였으며, 각각의 반복에서 16 내지 32마리의 유충을 이용하였다.

유충 사망 기준은 "실제" 사망으로 측정하였는데, 이는 죽은 (병적) 유충 및 유의한 체중 증가를 보이지 않은 (즉, 유충 당 0.1 mg 미만) 생존 (성장을 멈추고 먹이를 먹지 않음) 유충 둘 모두를 고려하였다. 처리에 있어서의 유충의 실제 사망률을 하기 등식을 이용하여 계산하였다:

실제 사망률 (%) = [TDS/TNIT] x 100

여기서, TDS는 죽은 유충의 총수 + 성장을 멈춘 유충의 수 (Total number of Dead larvae plus the number of Stunted larvae)이며,

TNIT는 처리에 있어서의 곤충의 총수 (Total Number of Insects in the Treatment)이다.

각각의 디. 사카랄리스 주의 "실제" 사망률 (이하, 사망률로 간단히 함)은 DIG-152 처리용의 단지 완충제로 처리한 규정식 또는 Cry1Ab 처리 후 결과를 분석하기 위한 물 블랭크 대조 규정식에서 관찰한 유충 사망률에 대하여 보정하였다.

용량 응답 실험의 결과를 추가로 분석하여 GI₅₀ 값을 확립하였다 [즉, 유충 성장 저해율 (%GI) 값이 50인 규정식 중 B.t. 단백질의 농도]. Cry1Ab 단백질을 함유하는 규정식에서의 유충의 %GI 값을 하기 식을 이용하여 계산하였다:

%GI = [TWC -TWT]/TWC x 100

여기서, TWC는 물 대조 규정식을 먹인 유충의 총 체중 (Total body Weight of larvae feeding on water Control diet)이며,

TWT는 Cry1Ab 처리 규정식을 먹인 유충의 총 체중 (Total body Weight of larvae feeding on Cry1Ab Treated diet)이고,

반면에, DIG-152 단백질 섭취의 결과로서 유충 %GI를 분석함에 있어서 이것은 하기 식을 이용하여 계산하였다:

%GI = [TWB -TWT]/TWB x 100

여기서, TWB는 단지 완충제 대조구 처리 규정식을 먹인 유충의 총 체중 (Total body Weight of larvae feeding on Buffer-Only control treated diet)이며,

TWT는 DIG-152 처리 규정식을 먹인 유충의 총 체중 (Total body Weight of larvae feeding on DIG-152 Treated diet)이다.

100%의 유충 성장 저해율은, 유의한 체중 증가가 있는 유충이 전혀 없는 경우 (유충 당 0.1 mg 미만) 반복체에 할당하였다. 성장 저해 데이터는 곤충 주 및 Cry 단백질 농도를 두 주요 인자로 이용하여 이원 분산 분석 (two-way ANOVA)을 이용하여 분석하였다. LSMEANS 검정을 이용하여 α= 0.05의 수준에서의 처리 차이를 결정하였다.

디아트라에아 사카랄리스 유충에서의 규정식 포함 생물분석의 결과를 표 4에 제공하였다.

데이터 분석 그 후, 보정한 용량/사망률 데이터를 50% 사망 (LC₅₀) 값을 야기한 처리 단백질 농도 및 상응하는 95% 신뢰 구간 (confidence intervals; CI)의 결정을 위한 프로빗 (probit) 분석을 하였다. 프로빗 분석에서 이용한 처리는 0의 사망률을 생성한 최고 농도, 100% 사망률을 생성한 최저 농도, 및 상기 극단들 사이의 모든 결과를 포함하였다. 내성 비는 rSCB 주의 LC₅₀ 값을 SCB 곤충의 LC₅₀ 값으로 나누어서 계산하였다. 치사 용량 비 검정을 이용하여 α= 0.05의 수준에서 내성 비가 유의한지를 결정하였다. 또한 이원 분산 분석을 이용하여 사망률 데이터를 분석하고, 이어서 α= 0.05의 수준에서의 LSMEANS 검정에 의해 처리 차이를 결정하였다. 상기 분석들의 결과를 표 5에 제시하였다.

동일한 생물 응답을 제공하는 활성화 Cry1Ab 단백질의 것과 유사한 수준의 DIG-152 단백질의 섭취 후 신생 사탕수수 명나방 (디아트라에아 사카랄리스) 유충의 성장을 저해하거나 또는 상기 유충을 사멸시키는 것이 대상 발명의 DIG-152 단백질의 특징이었다. 그럼에도 불구하고 Cry1Ab 단백질의 독성 효과에 대하여 내성을 갖는 디아트라에아 사카랄리스 유충이 DIG-152 단백질의 독성 작용에 민감하다는 것이 DIG-152 단백질의 추가의 특징이었다.

실시예 5

키메라 Cry1Ca 단백질에 대하여 면역반응성인 토끼 폴리클로날 항체 및 마우스 모노클로날 항체의 제조

예를 들어 대상 발명의 단백질을 생성하는 트랜스제닉 식물로부터 제조한 추출물 중 키메라 Cry1Ca 단백질 및 키메라 Cry1Ca 단백질의 변이체의 검출 및 정량화를 위하여 항체를 개발하였다. 표준 면역블롯 제제/분석 방법 및 ELISA법을 이용하여 항체를 특성화하였으며, 이를 B.t. 단백질 검출에 이용하였다 (예를 들어, 문헌[Coligan et al., 2007] 및 그의 최신판에 교시된 바와 같음).

폴리클로날 항체의 제조. 다클론 면역화에 이용한 단백질 항원은 실시예 2에 교시한 바와 같이 피. 플루오레센스 세포에서 생성한 DIG-152 단백질로부터 제조한 트립신 절단 코어 독소였다. 게다가, Cry1Ca 코어 독소 절편에 특이적인 두 펩티드를 키홀 림펫 헤모시아닌에 콘쥬게이션시키고, 이를 면역원으로 사용하였다. 대상 펩티드는 서열 1의 아미노산 436-445 (VQRSGTPFLT; Cry1Ca436; 서열 6) 및 아미노산 591-600 (SEQPLFGAGS; Cry1Ca591; 서열 7)에 상응하였다. 이들 펩티드 서열은 Cry1Ca의 단백질 서열을 몇몇 다른 부류의 Cry1 B.t. 단백질의 서열과 비교할 때 Cry1Ca에 독특한 것으로 확인되었다. 또한, 상기 펩티드들은 천연 Cry1Ca 단백질의 표면 상에 노출될 것으로 예상되었다.

면역화 및 혈청 수집은 계약된 판매 회사가 표준 절차에 의해 수행하였다. 폴리클로날 항체는 코반스 (Covance; 미국 뉴저지주 프린스턴)를 통하여 획득하였다. 뉴질랜드 백색 토끼를 이용하여 트립신 활성화 DIG-152 단백질에 대한 폴리클로날 항체를 생성하였다. 14일의 사이클 시간을 면역화와 혈청 수집 사이에 이용하였다. 투약은 0.5 mg의 단백질 또는 콘쥬게이션된 펩티드를 함유하는 프로인트 완전 아쥬반트 (Freund's complete adjuvant)로 시작하였다. 후속 주사제는 불완전 프로인트 아쥬반트를 이용하여 제조하였다.

2마리의 토끼로부터의 혈청을 합하여 Cry1Ca 코어 독소 단백질과 반응성인 단일 로트의 단백질 A-정제 항체 (DIG152RPC1로 칭함)를 생성하였다. 항체 특성화 분야의 숙련자에게 공지된 바와 같이, 온전한 단백질에 대하여 생성한 폴리클로날 항체는 일반적으로 극도로 특이적인 것은 아니며 흔히 면역화 단백질과 기타 관련 단백질 상의 다수의 에피토프를 탐지한다. 따라서, 면역블롯 분석에 의하면, DIG152RPC1은 다른 Cry1-부류 B.t. 독소, 구체적으로, 트립신 활성화 Cry1Ab, Cry1Da, 및 Cry1Fa와, 키모트립신 활성화 Cry1Be 및 Cry1Ea를 탐지함이 나타났다. 상업적 세팅에서, 작물 식물은 다른 Cry1-부류 단백질을 생성할 수 있으며, 따라서 DIG152RPC1은 절단체 및 기타 형태의 단백질을 포함하는 이들 단백질의 검출에 유용한 시약을 대표함을 주목한다.

토끼 폴리클로날 항체의 콘쥬게이션 펩티드 특이적인 두 로트를 Cry1Ca용으로 개발하였다. 2마리의 뉴질랜드 백색 토끼를 각각의 펩티드에 대하여 사용하였으며, 혈청을 각각의 펩티드에 대하여 풀링하여 두 펩티드 각각에 대한 펩티드 항체의 하나의 로트를 생성하였다. 면역화 및 혈청 수집은 면역화와 혈청 수집 사이의 14일의 사이클 시간을 이용하여 표준 절차에 의해 수행하였다. 최종 로트의 혈청을 상응하는 펩티드를 이용하여 친화성 정제하였다. 둘 모두의 펩티드 특이적 항체의 직접적 ELISA 평가에 의하면, 펩티드 Cry1Ca591에 대한 항체는 다른 Cry1 부류 단백질과의 반응과 비교할 때 Cry1Ca를 특이적으로 탐지하는 것으로 보이는 반면, 펩티드 Cry1Ca436에 대한 항체는 특이적이지 않은 것으로 나타났다 (표 6).

모노클로날 항체의 제조. 모노클로날 항체는 오픈 바이오시스템즈 (Open Bio Systems)/서모 피셔 사이언티픽 (Thermo Fisher Scientific) (미국 앨라배마주 헌츠빌)이 제조하였다. 마우스 항-Cry1Ca 모노클로날 항체 개발에서는 실시예 2에 기술한 바와 같이 피. 플루오레센스 세포에서 생성한 DIG-152 단백질로부터 제조한 트립신 절단 코어 독소를 이용하였다. 면역화 및 세포주 개발은 세포 배양에 있어서의 표준 항체 개발법에 의해 수행하였으며, 복수 생성 방법에 의한 것은 아니었다. 모노클로날 세포주는 면역화 마우스 비장 세포를 양립가능한 ND4 마우스 골수종 세포주와 융합함으로써 표준 절차에 따라 개발하였다.

직접적 결합 ELISA 스크리닝에 의해 마우스 M4 혈청이 Cry1Ca 단백질에 대하여 유의한 특이성을 갖는 것으로 확인하였다 (표 7).

모든 M4 유래 모노클로날 주는 Cry1Ca, Cry1Da, Cry1Ac, Cry1Fa, Cry1Be, 및 Cry1Ab에의 결합에 대하여 직접적 결합 ELISA에 의해 시험하였다. Cry1Ca를 탐지하는 능력을 보인 [즉, 높은 광학 밀도 (OD) 판독치를 제공함], 그리고 다른 Cry1 부류 단백질은 탐지하지 못하는 [즉, 0 또는 매우 낮은 OD 판독치를 제공함] 주 M4-34 및 M4-23이 특히 흥미로웠다 (표 8). 바람직한 주 M4-34 유래의 모노클로날 항체는 항체 DIG152MabM4-34로 지칭하였다.

따라서, 절단 Cry1Ca B.t. 단백질을 특이적으로 인식하는 모노클로날 항체를 제공하는 것이 본 발명의 주제이다.

실시예 6

DIG -109 단백질을 코딩하는 마이즈 -코돈 최적화 서열의 설계

식물 분자 생물학 분야의 숙련자라면 단일 아미노산 서열을 코딩하도록 다수의 DNA 서열을 설계할 수 있음을 이해할 것이다. 관심있는 단백질에 있어서 코딩 영역의 발현을 증가시키는 일반적인 수단은 그의 코돈 조성이 당해 유전자를 발현할 운명인 숙주의 전체 코돈 조성과 닮도록 하는 그러한 방식으로 상기 코딩 영역을 테일러링 (tailoring)하는 것이다. 합성 유전자의 설계 및 생성에 관한 지침은 예를 들어 국제 특허 공개 제WO 1997/13402호 및 미국 특허 제5380831호에서 발견할 수 있다.

마이즈 코돈 바이어스를 갖는 DNA 서열은 트랜스제닉 단자엽 식물에서 DIG-109 키메라 살곤충 단백질을 생성하도록 설계 및 합성하였다. 마이즈 (제아 마이스 엘. (Zea mays L.))에 대한 코돈 사용 표를 젠뱅크 (GenBank) (www.ncbi.nlm.nih.gov)에 기탁된 서열들로부터 수득한 706개의 단백질 코딩 서열들로부터 계산하였다. 그 아미노산에 대하여 총 코돈 사용의 약 10% 미만으로 사용되는 임의의 중복 코돈을 제외한 후 가중 평균 마이즈 코돈 세트를 계산하였다. 각각의 코돈에 있어서의 가중 평균을 나타낸 것은 하기 식을 이용하여 계산하였다:

C1의 가중 평균 % = 1/(%C1 + %C2 + %C3 + 기타) x %C1 x 100

여기서, C1은 당해 코돈이며, %C2, %C3 등은 남아있는 동의 코돈들의 평균 사용 % 값을 나타낸다.

서열 5의 1164개 아미노산 DIG-109 단백질을 코딩하는 마이즈-코돈 최적화 DNA 서열을 유도하기 위하여, Cry1Ca 코어 독소 절편을 코딩하는 천연 cry1Ca DNA 서열에 대한 코돈 치환을 행하여서, 생성된 DNA 서열이 마이즈-최적화 코돈 바이어스 표의 전체 코돈 조성을 갖도록 하였다. 이와 유사한 방식으로, 서열 4의 Cry1Ab 전독소 절편을 코딩하는 천연 cry1Ab DNA 서열에 대한 코돈 치환을 행하여서, 생성된 DNA 서열이 마이즈-최적화 코돈 바이어스 표의 전체 코돈 조성을 갖도록 하였다. 바람직하지 못한 제한 효소 인식 부위, 잠재적인 식물 인트론 스플라이스 부위, A/T 또는 C/G 잔기의 긴 런 (run), 및 식물 세포에서 코딩 영역의 RNA 안정성, 전사 또는 번역을 간섭할 수 있는 다른 모티프를 제거하기 위하여 서열을 추가로 개량하였다. 다른 변화를 초래하여 요망되는 제한 효소 인식 부위를 도입하고, 긴 내부 개방 판독 프레임 (+1 이외의 프레임)을 제거하였다. 이들 변화는 모두 대략적으로 마이즈-편향된 코돈 조성을 유지하는 제약 이내에서 초래하였다. DIG-109 단백질을 코딩하는 마이즈-코돈 최적화 전 서열이 서열 8로서 개시되어 있다. 서열 8에 상응하는 DNA 단편의 합성은 상업적 판매사 (DNA2.0, 미국 캘리포니아주 멘로 파크)가 수행하였다.

실시예 7

DIG -109 단백질을 코딩하는 식물 발현가능 유전자를 함유하는 식물 형질전환 벡터의 작제

아그로박테륨 수퍼바이너리 (superbinary) 시스템 (저팬 토바코 (Japan Tobacco; 일본 도꾜)은 단자엽 식물 숙주의 형질전환에 편리하게 사용된다. 수퍼바이너리 시스템은 pSB11 셔틀 벡터 플라스미드를 이용하는데, 상기 플라스미드는 다수의 클로닝 부위로 분리된 우측 T-DNA 경계 반복체 (RB) 및 좌측 T-DNA 경계 반복체 (LB)의 서열을 포함한다. pSB11의 유도체 (pDAB7691로 불리움)를 표준 DNA 클로닝 방법에 의해 제조하였다. 플라스미드 pDAB7691은 마이즈 Per5 3' 비번역 영역 (3' UTR) (미국 특허 제7179902호) 및 인트론1과 결부된 마이즈 유비퀴틴1 프로모터 (미국 특허 제5510474호)의 전사 제어 하의 마이즈 최적화 DIG-109 코딩 서열 (CDS; 즉, 서열 8)을 포함한다. 또한, pDAB7691은 마이즈 리파아제 3' UTR (미국 특허 제7179902호) 및 인트론1과 결부된 벼 액틴1 프로모터 (미국 특허 제5641876호)의 전사 제어 하의, 다우 아그로사이언시즈 DSM2 CDS (국제 특허 공개 제WO 2008/070845 A2호)를 포함하는 식물 선발가능 마커 유전자를 포함한다. pDAB7691 T-영역의 구성요소의 물리적 배열은 하기와 같이 편리하게 예시된다:

RB>마이즈 Ubi1 프로모터:DIG-109 CDS:마이즈 Per5 3'UTR>벼 Act1 프로모터:DSM2 CDS:마이즈 Lip 3'UTR>LB

pSB11의 제2 유도체 (pDAB100276으로 불리움)를 표준 DNA 클로닝 방법으로 제조하였다. 플라스미드 pDAB100276은 마이즈 Per5 3' UTR 및 인트론1과 결부된 마이즈 유비퀴틴1 프로모터의 전사 제어 하의 마이즈 최적화 DIG-109 코딩 서열 (CDS; 즉, 서열 8)을 포함한다. 또한, pDAB100276은 마이즈 리파아제 3' UTR 및 인트론1과 결부된 마이즈 유비퀴틴1 프로모터의 전사 제어 하의, 다우 아그로사이언시즈 AAD1 CDS (미국 특허 공개 제20090093366호)를 포함하는 식물 선발가능 마커 유전자를 포함한다. pDAB100276 T-영역의 구성요소의 물리적 배열은 하기와 같이 편리하게 예시된다:

RB>마이즈 Ubi1 프로모터:DIG-109 CDS:마이즈 Per5 3' UTR>마이즈 Ubi1 프로모터:AAD-1 CDS:마이즈 Lip 3' UTR>LB

아그로박테륨 형질전환을 준비하기 위하여, 플라스미드 pDAB7691 또는 플라스미드 pDAB 100276을 지닌 에스케리키아 콜라이 클로닝 주 DH5α의 세포를 스펙티노마이신 (Spectinomycin, 100 ㎍/mL)을 함유하는 LB 한천 배지(g/L: 박토 트립톤 (Bacto Tryptone), 10; 박토 효모 추출물, 5; NaCl, 10; 한천, 15) 상에서 37도에서 하룻밤 성장시켰다. 접합 이동 플라스미드 pRK2013을 포함하는 주 DH5α 세포를 카나마이신 (Kanamycin; 50 ㎍/mL)을 함유하는 LB 한천 상에서 성장시켰다. 인큐베이션 후, 플레이트를 4도에 두어 플라스미드 pSB1을 함유하는 아그로박테륨 투메파시엔스 주 LBA4404의 이용가능성을 기다렸다.

실시예 8

수퍼바이너리 벡터의 생성을 위한 아그로박테륨의 형질전환

pSB1을 포함하는 아그로박테륨 투메파시엔스 주 LBA4404를 이용하는 아그로박테륨 수퍼바이너리 시스템을 단자엽 식물 숙주의 형질전환에 편리하게 사용하였다. 수퍼바이너리 벡터를 작제 및 인증하는 방법은 pSB1의 작동 매뉴얼 (Operating Manual for pSB1) (저팬 토바코)에 제공된 바와 같이 잘 확립되어 있다. 표준의 미생물학 및 분자 생물학적 방법을 이용하여 플라스미드 pSB1 및 pDAB7691을 포함하는 동시통합성 플라스미드인 수퍼바이너리 플라스미드 pDAS5162와, 플라스미드 pSB1 및 pDAB100276을 포함하는 동시통합성 플라스미드인 수퍼바이너리 플라스미드 pDAS5848을 생성 및 인증하였다.

실시예 9

마이즈 식물에서의 DIG -109 단백질의 생성

마이즈의 아그로박테륨 - 매개된 형질전환 Hi-II F1 잡종 (cross) (문헌[Armstrong et al., 1991]) 유래의 종자를 95% 메트로-믹스 (Metro-Mix) 360 무토양 성장 매질 (선 그로 호티컬쳐 (Sun Gro Horticulture; 미국 워싱턴주 벨레뷰))과 5% 점토/양토 (loam soil)의 혼합물을 포함하는 5갤런 화분 내에 심었다. 16시간의 광:8시간의 암의 광주기를 이용하여 고압 나트륨 램프 및 금속 할로겐화물 램프의 조합을 이용하여 온실에서 상기 식물을 성장시켰다. 제어된 형매 수분을 수행하여 형질전환용의 미성숙 F2 배아를 수득하였다. 수염이 달린 마이즈 알 (maize ear)은 미성숙 배아의 크기가 1.0 mm 내지 2.0 mm일 때 수분 후 대략 8 내지 10일에 수확하였다.

감염 및 동시 배양. 수염이 달린 마이즈 알의 껍질을 벗기고, 표면을 액체 비누로 문지르고, 20%의 상업적 표백제 (5% 차아염소산나트륨을 함유함)에 약 20분 동안 침지시키고, 그 후 살균수로 3회 헹굼으로써 살균하였다. DSM2 식물 선발가능 마커 유전자를 포함하고 DIG-109 단백질을 코딩하는 유전자를 지닌 수퍼바이너리 벡터, pDAS5162를 포함하는 아그로박테륨 투메파시엔스 세포의 현탁물은 1 또는 2 루프 (loop)의 박테리아 [100 mg/L의 스펙티노마이신, 10 mg/L의 테트라사이클린, 및 250 mg/L의 스트렙토마이신을 함유하는 YEP 고형 배지 (g/L: 박토 효모 추출물, 10; 박토 펩톤, 10; NaCl, 5; 한천, 15) 상에서 28도에서 2 내지 3일 동안 성장시킴]를 100 μM의 아세토시링곤을 함유하는 5 mL의 액체 감염 배지 [LS 기본 배지 (문헌[Linsmaier and Skoog, 1965]), N6 비타민 (문헌[Chu et al., 1975]), 1.5 mg/L의 2,4-디클로로페녹시아세트산 (2,4-D), 68.5 g/L의 수크로스, 36.0 g/L의 글루코스, 6 mM의 L-프롤린, pH 5.2] 내로 옮김으로써 제조하였다.

대안적으로, AAD-1 식물 선발가능 마커 유전자를 포함하고 DIG-109 단백질을 코딩하는 유전자를 지닌 수퍼바이너리 벡터, pDAS5848을 포함하는 아그로박테륨 투메파시엔스 세포의 현탁물은 100 내지 200 μM의 아세토시링곤을 함유하는 5 mL의 액체 감염 배지 내로 상기와 같이 성장시킨 1 또는 2 루프의 박테리아를 옮김으로써 제조하였다.

둘 모두의 경우에서, 균일한 현탁물이 달성될 때까지 용액을 와동시키고, 자주색 필터를 갖춘 클렛-서머슨 (Klett-Summerson) 비색계를 이용하여 200 클렛 단위의 최종 밀도로 (pDAS5162 형질전환의 경우), 또는 550 nm에서 1.2의 광학 밀도로 (pDAS5848 형질전환의 경우) 농도를 조정하였다. 미성숙 배아를 2 mL의 감염 배지를 함유하는 미소원심분리관 내로 직접적으로 단리하여 넣었다. 배지를 제거하고, 1 mL의 아그로박테륨 용액으로 대체하고, 아그로박테륨/배아 용액을 실온에서 5 내지 10분 동안 인큐베이션하였다. 그 후 배아는 100 μM의 아세토시링곤을 함유하거나 (pDAS5162 형질전환체의 경우) 또는 100 내지 200 μM의 아세토시링곤을 함유하는 (pDAS5848 형질전환체의 경우) 동시 배양 배지 [LS 기본 배지, N6 비타민, 1.5 mg/L의 2,4-D, 30.0 g/L의 수크로스, 6 mM의 L-프롤린, 0.85 mg/L의 AgNO₃, 2.8 g/L의 겔란 (Gellan) 검 (피토테크놀로지 래보러토리즈 (PhytoTechnology Laboratories; 미국 캔자스주 레넥사)), pH 5.8]로 옮기고, 암소에서 20도에서 3 내지 4일 동안 동시 배양하였다.

동시 배양 후, 배아를 MS 염 및 비타민, 6 mM의 L-프롤린, 100 mg/L의 미오이노시톨, 500 mg/L의 MES, 30 g/L 수크로스, 1.5 mg/L의 2,4-D, 0.85 mg/L의 AgNO₃, 250 mg/L의 세포탁심 (Cefotaxime), 2.8 g/L의 겔란 검 (pH 5.8)을 함유하는 휴지 배지로 옮겼다. 대략 7일 후, 배아는 3 mg/L의 비아라포스 (Bialaphos)를 보충하거나 (pDAS5162 형질전환체의 경우) 또는 100 nM의 할록시포프를 보충한 (pDAS5848 형질전환체의 경우) 동일 배지 (선발 배지)로 옮겼다. 대략 8주 후 형질전환 단리체를 확인하고, 이를 재생 및 분석을 위하여 2주 간격으로 신선 선발 배지로 옮김으로써 부피가 커지게 하였다.

재생 및 종자 생성. 재생을 위하여, 배양물은 3 mg/L의 비아라포스를 보충하거나 (pDAS5162 형질전환체의 경우) 또는 100 nM의 할록시포프를 보충한 (pDAS5848 형질전환체의 경우) "28" 유도 배지 (MS 염 및 비타민, 30 g/L의 수크로스, 5 mg/L의 벤질아미노퓨린, 0.25 mg/L의 2,4-D, 250 mg/L의 세포탁심, 2.5 g/L의 겔란 검, pH 5.7)로 옮겼다. 인큐베이션은 낮은 광 조건 (14 μEm^-2s^-1) 하에 1주일 동안, 그 후 높은 광 조건 (대략 89 μEm^-2s^-1) 하에 1주일 동안 하였다. 조직을 후속적으로 "36" 재생 배지 (식물 성장 조절제가 결여된 것을 제외하고는 유도 배지와 동일함)로 옮겼다. 모종 길이가 3-5 cm일 때, 이를 SHGA 배지 [(문헌[Schenk and Hildebrandt (1972)]의 염 및 비타민; 피토테크놀로지즈 래보러토리즈), 1.0 g/L의 미오이노시톨, 10 g/L의 수크로스 및 2.0 g/L의 겔란 검, pH 5.8]를 함유하는 유리 배양관으로 옮겨 새싹 및 뿌리의 추가의 성장 및 발달을 허용하였다. 식물을 이전에 기술한 동일 토양 혼합물에 이식하고, 온실에서 성장시켜 개화시켰다. 종자 생성을 위한 제어된 수분을 행하였다.

마이즈 형질전환 분야의 숙련자라면 다른 방법이 마이즈 형질전환에 이용가능하고 다른 식물 발현성 선발가능 마커 유전자 (예를 들어 제초제 내성 유전자)가 사용될 때 다른 방법이 형질전환 식물의 선발에 이용가능함을 이해할 것이다.

실시예 10

DIG -109 단백질을 생성하는 마이즈 식물의 생화학적 분석 및 곤충 생물분석

트랜스제닉 마이즈 식물에서의 DIG-109 단백질의 생성을 어린 식물 (T0 세대)의 잎으로부터 추출한 단백질에서 조사하였다. 2개의 6 mm 직경의 마이즈 잎 디스크를 깊은 웰 96 클러스터 (cluster) 튜브 박스 (코스타 (Costar) 카탈로그 번호 3957)로부터의 샘플 튜브 내에 넣고, 분석일까지 -80도에서 냉동시켰다. 이 시점에서, 각각의 (냉동) 튜브에 2개의 4.5 mm 아연 코팅 데이지 (Daisy)^TM BB를 PBS (인산염 완충 염수; 피셔 (Fisher) 카탈로그 번호 BP665-1) + 0.05% 트윈 (Tween) 20으로 이루어진 200 μL의 추출 완충액과 함께 첨가하였다. 각각의 튜브의 뚜껑을 닫고, 박스를 최대 설정치에서 비드밀 (bead mill) (켈코 (Kleco)^TM 4-96 분쇄기; 가르시아 매뉴팩츄어링 (Garcia Manufacturing; 미국 캘리포니아주 비살리아)) 내에 3분 동안 두었다. 분쇄한 샘플을 2,500 x g에서 5분 동안 원심분리하고, 용해성 단백질을 함유하는 상청액을 면역분석에서 사용하였다.

추출한 마이즈 잎 단백질의 면역블롯 분석에 의하면, DIG152RPC1 폴리클로날 항체는 비트랜스제닉 식물의 잎으로부터 추출한 단백질과 교차 반응하지 않음이 나타났다. pDAS5162로 형질전환된 식물의 추출물에 있어서, 몇몇 단백질 종이 DIG152PRC1 항체에 의해 검출되었다. 4가지 이상의 주요 면역반응 밴드가 일반적으로 검출되었다. 많은 경우, 대략 70 kDa의 단백질에 상응하는 이동성으로 이동하는 풍부한 단백질 종이 보였다. 다른 주요 단백질 종은 실시예 2)에서 Dpf108로부터 제조한 DIG-152의 트립신 제한 펩티드의 것과 동일한 65 kDa, 60 kDa, 및 55 kDa으로 개산(estimate)된 분자 크기를 가졌다. pDAS5162 트랜스제닉 마이즈 잎 추출물을 DIG-152 폴리클로날 항체를 이용하여 면역블롯에 의해 조사할 때, 일부 식물에서 60 kDa 및 55 kDa의 종이 가장 풍부하였다. 어느 하나의 항체를 이용하면, 단지 다소의 식물이 전장 DIG-109 (130 kDa) 단백질을 갖는 것으로 발견되었으며, 이것은 발견될 때 소수 종으로 존재하였다.

비록 pDAS5162를 이용한 형질전환을 통하여 마이즈 내로 도입한 트랜스진 (transgene)이 전장 DIG-109 단백질을 포함할지라도, 마이즈 세포 내의 단백질 분해 활성은 신생 단백질을 풍부한 안정한 더욱 작은 분자량의 종으로 프로세싱함이 명백하다.

pDAS5162 작제물로 형질전환시킨 독립적으로 단리시킨 트랜스제닉 마이즈 식물로부터 수확한 잎의 곤충 독성을 밤나방 (FAW, 스포도프테라 프루기페르다 (제이.이. 스미스))의 신생 유충 및 Cry1F-내성 FAW (rFAW) 유충을 이용하여 시험관내에서 시험하였다. FAW 알을 상업적 곤충 실험실 (벤존 (Benzon))으로부터 획득하였으며, rFAW 알은 독점적 집단 (다우 아그로사이언시즈)으로부터 온 것이었다. 식물을 실험실로부터 온실 내로 이식한지 대략 2주 후 온실에서 성장시킨 T0 식물로부터 잎 절편 샘플을 곤충 생물분석용으로 취하였다. 각각의 식물로부터의 2개의 잎 조각 (각각은 대략 1 제곱 인치임)을 32웰 트레이 (씨디 인터내셔널)의 별도의 웰 내에 약 3 mL의 고형화 2% 한천의 상부 상에 두었다. 알을 다중-종 인시목 규정식 (사우스랜드 프로덕츠 (Southland Products)) 상으로 부화시키고, 24시간 미만의 연령일 때 신생 유충을 선발하였다. 잎 절편 당 대략 10마리의 유충을 낙타털 페인트브러시를 사용하여 각각의 웰 내에 조심스럽게 두었다. 만연된 트레이를 트레이와 함께 공급된 천공 뚜껑으로 밀봉하고, 그 후 28도, 40% RH, 16시간의 명:8시간의 암에서 3일 동안 유지하였다. 각각의 잎 조각의 손상 % (% DAM)를 시험의 종말에 기록하였다. 손상 평점을 평균하고, 이를 사용하여 어느 식물이 각각의 유형의 시험 곤충으로부터의 손상이 가장 적었는지를 결정하였다. 시험을 모든 곤충에 대하여 수회 반복하였다.

데이터를 JMP 통계 소프트웨어 (에스에이에스, 미국 노스캐롤라이나주 캐리)를 사용하여 분석하였으며, 각각의 곤충 유형에 있어서 각각의 식물에 대하여 % DAM 스코어를 평균하였다. "fit Y by X" 모델을 일원 분산 분석에 사용하였다. 필요할 경우 투키-크레이머 (Tukey-Kramer) 평균 분리를 이용하여 각각의 처리에 있어서의 평균 %DAM 스코어들 사이에서의 유의한 차이에 대하여 분석하였다. 유사한 연령의 대조 식물로부터 획득한 %DAM 스코어와 비교하였다. 양성 대조 식물을 상업적 헤르쿨렉스 (Herculex) I^TM 하이브리드의 종자로부터 성장시켰으며, 이는 Cry1Fa B.t. 독소를 생성한다. 음성 대조구 (즉, 비형질전환 식물)는 Hi II 및 B104 주, 및 헤르쿨렉스 I^TM 이소라인 (Isoline) (헤르쿨렉스 I^TM 하이브리드의 비-Cry 함유 모 (parent))이 대표하였다.

도 1에는 그러한 곤충 생물분석 시험에서 획득한 결과가 요약되어 있다. 트랜스제닉 잎에서의 DIG-109의 생성과 %DAM 평점 사이에 양의 상관 관계가 존재한다는 것은 놀라운 발견이다. FAW의 경우, F = 35.3; d.f. = 1, 33; P < 0.0001; r² = 0.52, 그리고 rFAW의 경우, F = 25.3; d.f. = 1, 33; P < 0.0001; r² = 0.43. Cry1Fa B.t. 독소에 의한 중독에 대하여 내성을 갖는 밤나방 유충이 DIG-109 B.t. 독소를 먹임으로써 여전히 저해된다는 것은 추가의 놀라운 그리고 신규한 발견이다.

마이즈의 다른 곤충 해충을 유사한 방식으로 시험할 수 있음이 이해된다. 이들 해충은 하기를 포함하지만, 이에 한정되는 것은 아니다: 아그로마이자 파르비코르니스 (Agromyza parvicornis) (옥수수 얼룩 굴나방 (corn blot leafminer)), 아그로티스 입실론 (검거세미나방), 안티카르시아 겜마탈리스 (벨벳빈 애벌레 (velvetbean caterpillar)), 디아트라에아 그란디오셀라 (남서부 옥수수 명나방), 디아트라에아 사카랄리스 (사탕수수 명나방), 엘라스모팔푸스 리그노셀루스 (Elasmopalpus lignosellus) (낮은 옥수수 줄기 (lesser cornstalk) 명나방), 헬리코베르파 제아 (왕담배나방), 헬리오티스 비레센스 (담배 나방 (tobacco budworm)), 오스트리니아 누빌랄리스 (유럽 옥수수 명나방), Cry1F-내성 오. 누빌랄리스, 플루텔라 자일로스텔라 (배추좀나방), Cry1-내성 피. 자일로스텔라, 스포도프테라 엑시구아 (파밤나방), 및 트리코플루시아 니 (양배추 은무늬 밤나방 유충).

pDAS5848로 형질전환시킨 트랜스제닉 마이즈 식물 (T0 세대)을 곤충 생물분석에 의해 그리고 면역분석에 의해 또한 조사하였다. 잎 추출물 중 DIG-109 단백질의 양을 구매가능한 Cry1C ELISA 검출 키트 (엔바이롤로직스 (Envirologix)^TM, 미국 매사추세츠주 포틀랜드; 카탈로그 번호 AP007)를 사용하여 정량화하고, 검출된 DIG-109 단백질의 수준을 백만분율 (parts per million, ppm; 1 ppm은 추출물 중 전체 용해성 단백질 1 mg 당 1 ng의 DIG-109 단백질을 나타냄). FAW 및 rFAW에 의한 식해 (feeding damage)를 하기와 같이 체계화하였다: 0 = 손상 없음 또는 약간의 핀홀형의 먹은 표시 (feeding mark), 1= 25% 내지 50%의 잎을 먹음, 및 2 = 대부분 전부의 잎을 소비하거나 또는 잎이 남아있지 않음. 보호된 식물은 손상 스코어가 0.67 이하인 것이다.

표 9의 데이터는 T0 식물에서 ELISA에 의해 검출되는 DIG-109 단백질 종의 존재와 시험관내 생물분석에서 밤나방 유충에 의해 행해지는 식해의 제어 사이에 양의 상관관계가 있음을 보여주었다. 최고 검출 수준의 DIG-109 단백질을 갖는 식물 (식물 5848-005.4)은 잎 식해 스코어가 최저였다. 또한 190 내지 230 ppm의 범위의 더욱 낮은 수준의 검출가능한 DIG-109 단백질을 갖는 식물 유래의 잎은 1.7 및 1.8의 평균 손상 스코어를 갖는 음성 대조 식물들 (즉, 비형질전환 대조구 B104 및 Hi II) 유래의 잎에서 보이는 것보다 더 적은 식해를 입었다. 조사한 모든 pDAS5848 잎에서, 검출된 우세한 DIG-109 단백질 종은 대략적인 크기가 60 kDa 및 55 kDa인 펩티드들의 이중체를 포함하였다.

따라서, 마이즈 식물에서 생성될 때 DIG-109 단백질은 밤나방 유충 및 Cry1F-내성 밤나방 유충에 의한 식해에 대하여 상기 식물이 내성이 되도록 한다는 것이 본 발명의 특징이다.

실시예 11

DIG -109 단백질을 생성하는 마이즈 식물의 분자적 분석

조직 추출. 게놈 DNA를 pDAS5162- 및 pDAS5848-형질전환 T0 트랜스제닉 마이즈 식물의 잎으로부터 단리하였다. 조직 샘플을 96웰 수집 플레이트 (퀴아젠 (Qiagen), 카탈로그 번호 19560)에서 수집하고 2일 동안 동결건조시켰다. 조직 파괴는 본질적으로 실시예 10에 개시한 바와 같이 켈코^TM 조직 분쇄기 및 텅스텐 비드를 이용하여 수행하였다. 가수분해 프로브 (Hydrolysis Probe; HP) 분석에 있어서, 제조업자의 제안된 프로토콜에 따라 디엔이지 (DNeasy)^TM 96 식물용 키트 (퀴아젠)를 사용하여 높은 처리량 포맷으로 게놈 DNA를 단리하였다. 서던 블롯 분석에 있어서, 문헌[Murray and Thompson (1980)]의 CTAB DNA 추출 프로토콜의 변형을 사용하여 높은 처리량 포맷으로 게놈 DNA를 단리하였다. 문헌[Murray, M. G., Thompson, W. F. (1980) Rapid isolation of high molecular weight plant DNA. Nucl. Acids Res. 8:4321-4325].

어느 하나의 프로토콜로부터의 추출 DNA를 퀀트 (Quant)-IT 피코 그린 (Pico Green) DNA 분석 키트 (몰레큘러 프로브즈 (Molecular Probes), 인비트로겐 카탈로그 번호 P7589)를 이용하여 정량화하였다. 이 절차에서 비공지된 것의 88가지의 샘플을 96웰 포맷으로 분석하였으며, 이때 첫 번째 컬럼은 20 ng/μL 내지 1.25 ng/μL의 범위의 2배 희석 표준물, + 완충액 블랭크, 물 블랭크 및 빈 웰을 포함하였다. 그 후, 시험 DNA 샘플들, 5 μL의 1:5 내지 1:40의 희석물 (예상 초기 농도에 따라 달라짐)을 적절하게 희석시킨 완충 삽입 염료와 혼합하고, 암소에서 10분 동안 105 μL의 반응물 중에 인큐베이션하였다. 인큐베이션 후, 시너지2 (Synergy2) 플레이트 판독기 (바이오테크 (BioTek; 미국 버몬트주 위누스키))를 이용하여 기록하였다. 게놈 DNA 농도를 배경 형광 보정 후 계산한 표준 곡선으로부터 개산하였다.

서던 블롯 준비. 10가지의 pDAS5848-형질전환 마이즈 주 유래의 게놈 DNA 10 ㎍을 37도에서 하룻밤 제한 효소 Bsm I로 절단하였다. 절단된 DNA 샘플의 단편을 (에스에이에스, 미국 노스캐롤라이나주 캐리) 1% 아가로스 겔을 통한 겔 전기영동을 통하여 분리하고, 나일론 막 (INYC000I0 임모빌론 (IMMOBILON)-NY+, 밀리포어)으로 옮겼다. 서던 블롯은 서열 8의 염기 251 내지 630에 상응하는 디그옥시제닌-표지 (DIG PCR 프로브 합성 키트; 로슈 어플라이드 사이언스 (Roche Applied Science; 미국 인디애나주 인디애나폴리스)) PCR-증폭 프로브를 이용하여 혼성화하였다. 혼성화 및 검출을 공급처의 프로토콜에 따라 실시하였다. 단일 카피 (copy)의 DIG-109 코딩 유전자를 지니는 것으로 서던 블롯 분석에 의해 확인된 pDAS5848-형질전환 주 유래의 DNA를 정량적 PCR 카피수 분석에 있어서의 기준 대조구로 사용하였다.

가수분해 프로브 분석 가수분해 프로브 (HP) 분석에 의한 트랜스진 카피수 결정은 라이트사이클러 (LightCycler)^®480 시스템 (로슈 어플라이드 사이언스)을 이용하여 실시간 PCR에 의해 수행하였다. 라이트사이클러^® 프로브 설계 소프트웨어 v 2.0을 DSM2 및 AAD-1 선발가능 마커 유전자, GLP1 (마이즈 생식세포계-유사 단백질1 (germin-like protein1; 젠뱅크 등록 번호 AY394010)) 및 INV (마이즈 인버타아제; 젠뱅크 등록 번호 U16123) 기준 유전자, 및 DIG-109-코딩 유전자를 검출하는 분석의 설계를 위하여 사용하였다. 증폭에 있어서, 라이트사이클러^®480 프로브 마스터 믹스는 0.4 μM의 각각의 프라이머 및 0.2 μM의 각각의 프로브 (형광 표지체 및 상기 올리고뉴클레오티드들의 서열이 표 10에 열거되어 있음)를 함유하는 10 μL 부피의 다중 반응물 중에 1 x 최종 농도로 제조하였다. 형광 획득을 이용하여 56도에서의 40초 동안의 연장에 의해 2단계 증폭 반응을 수행하였다. 모든 샘플을 삼중으로 러닝하고, 평균 C_t 값을 각각의 샘플의 분류에 사용하였다.

DSM2의 HP 분석을 36가지의 pDAS5162-형질전환 주에서 완료하였다. 1-2개 카피의 유전자로서 정의되는 단순 통합 사건을 샘플의 95% (34가지의 사건)에서 검출하였다.

AAD-1 및 DIG-109의 HP 분석을 13가지의 pDAS5848-형질전환 주에서 완료하였다. AAD-1의 경우 샘플의 93% (12가지의 주)에서 그리고 DIG-109의 경우 54% (7가지의 주)에서 단순 통합 사건을 검출하였다. 54%의 주 (7가지의 주)는 둘 모두의 유전자에 대한 단순 통합 사건을 포함하였다.

실시예 12

마이즈 DIG -109 절단 종의 생화학적 특성화

더욱 상세한 분석을 pDAS5162로 형질전환시킨 T0 마이즈 식물의 잎으로부터 추출한 단백질에서 수행하였다. DIG152RPC1 폴리클로날 항체로 프로빙한 상기 단백질 추출물의 면역블롯은 5가지의 DIG-109 단백질 종의 존재를 나타냈다. 이들 펩티드의 상대적인 이동성을 기반으로 하여, 하기 동일성 (identity)을 할당하였다: 종 1은 서열 5로 표기되는 전장 DIG-109 (130 kDa) 단백질에 상응하며; 종 2는 70 kDa DIG-109 생성물에 상응하였다. 동일한 이동성의 펩티드가 전장 DIG-152 단백질을 코딩하는 유전자를 발현하는 박테리아 세포의 추출물에서 발견되었다. 대략 70 kDa의 이들 단편의 생성은 마이즈 및 박테리아 둘 모두에서 발견되는 프로테아제에 노출되는 전장 단백질 상의 우세한 절단 부위의 존재를 나타낸다. 종 3은 크기 면에서 실시예 2에서 제조한, 대략 65 kDa의 크기를 갖는 DIG-152의 트립신 제한 펩티드에 상응하며; 종 4는 대략 60 kDa의 절단 DIG-109 생성물에 상응하며; 종 5는 대략 55 kDa의 절단 DIG-109 생성물에 상응하였다. 대략 70 kDa, 60 kDa 및 55 kDa의 펩티드를 실시예 14에서 추가로 특성화하였다.

실시예 13

도메인 I α-나선의 결실 및 DIG -109의 변이체를 코딩하는 유전자의 설계

DIG-109 단백질의 살곤충 특성을 개선하기 위하여, 연속적인 단계적 결실을 행하였으며, 이들 각각은 서열 5에 개시된 DIG-109 단백질의 N-말단의 일부를 제거하였다. 결실은, α-나선 3 내지 α-나선 7의 구조적 완전성 (integrity)은 유지하면서 도메인 I의 일부 또는 전부의 α-나선 1 및 일부 또는 전부의 α-나선 2를 제거하였다. 본 발명자는 α-나선 1, α-나선 2A, α-나선 2B, α-나선 3, 및 α-나선 4의 시작과 끝 및 Cry1Ca 코어 독소의 도메인 I에서의 그들 사이의 스페이서 영역의 위치를 추론하였으며, 이는 Cry1Ca 코어 독소 아미노 서열을 구조가 공지된 Cry1Aa 단백질 [RGBS 단백질 구조 데이터베이스 번호: CRY1A(A); 문헌[GrochuLski et al., ( 1995)]]의 아미노산 서열 (젠뱅크 등록 번호 AAA22353)과 비교함에 의한 것이었다. 이들 위치는 표 1에 기술되어 있다.

N-말단 결실 변이체의 코딩 서열의 설계에 있어서, 메티오닌을 코딩하는 ATG 시작 코돈을 결실 변이체를 발현하도록 설계된 뉴클레오티드의 5' 말단에 삽입하였다. 트랜스제닉 식물에서의 사용용으로 설계한 서열에 있어서, 문헌[Varshavsky (1997)]의 "N-말단 규칙"에 충실한 것이 유익할 수 있다. 일부 아미노산은 단백질의 N-말단 잔기로서 디스플레이될 때 진핵 세포에서 단백질 불안정성 및 분해에 기여할 수 있음이 교시되었다. 예를 들어, 효모 및 포유류 세포에서의 관찰로부터 수집된 데이터는 N-말단 불안정화 아미노산이 F, L, W, Y, R, K, H, I, N, Q, D, E 및 가능하게는 P임을 나타낸다. 단백질 분해 기작의 특수성은 유기체들 사이에서 다소 상이할 수 있지만, 상기에 보이는 N-말단 불안정화 아미노산의 동일성의 보존은 유사한 기작이 식물 세포에서 기능할 수 있음을 시사한다. 예를 들어, 문헌[Worley et al., (1998)]에서는 식물에 있어서 N-말단 규칙이 염기성 및 방향족 잔기를 포함함이 발견되었다. 대상 B.t. 살곤충 단백질의 α-나선 3의 시작 근처에서의 식물 프로테아제에 의한 단백질 분해적 절단은 불안정화 N-말단 아미노산을 노출시킬 수 있다는 가능성이 있다. 그러한 프로세싱은 신속한 붕괴를 위하여 절단 단백질을 표적으로 하고 효과적인 곤충 방제에 불충분한 수준으로 B.t. 살곤충 단백질의 축적을 한정할 수 있다. 따라서, 불안정화 아미노산들 중 하나에서 시작되는 N-말단 결실 변이체에 있어서, 본 출원인은 번역 개시 메티오닌과 불안정화 아미노산 사이에 G (글리신) 아미노산을 특정하는 코돈을 부가하는 것을 선호한다.

결실을 하기와 같이 설계하였다. 본 실시예는 65가지의 특정 변이체를 이용하여 설계 원리를 예시하기 위하여 전장의 1164개 아미노산의 키메라 DIG-109 단백질 (즉, 서열 5)을 코딩하는 마이즈 코돈-최적화 전장 3492 bp DNA 서열 (즉, 서열 8)을 이용하였다. 당업계의 숙련자라면 Cry1Ca 코어 독소 절편의 전부 또는 N-말단 부분을 코딩하는 다른 DNA 서열이 요망되는 결과를 달성하도록 유사하게 조작될 수 있음을 실감할 것이다. 첫 번째의 결실 변이체 코딩 서열을 고안하기 위하여, α-나선 2A의 시작부 근처의 발린 잔기 (즉, 서열 5의 전장 DIG-109 부분의 V51)에 대한 코돈을 포함하는 α-나선 1을 코딩하는 염기들 전부를 제거하였다. 따라서, 서열 8의 염기 1 내지 153의 제거는 서열 5의 아미노산 1 내지 51의 아미노산의 코딩 서열을 제거하였다. 시작부 (즉, 전장 단백질의 아미노산 52에 상응하는 코돈의 앞)에 번역 개시 ATG (메티오닌)를 재도입하면 1114개 아미노산 (즉, 메티오닌 + 전장 DIG-109 단백질의 아미노산 52 내지 1164)을 포함하는 결실 변이체 DIG-109 단백질을 코딩하는 3342개 염기의 개방 판독 프레임을 포함하는 결실 변이체 코딩 서열이 제공되었다. 서열 5의 전장 DIG-109 단백질의 잔기 52 내지 91에 상응하는 단일 아미노산의 추가의 코돈들을 제거하는 연속적인 단계적 결실은 일부의 또는 전부의 α-나선 2A 및 α-나선 2B가 없어진 변이체를 제공하였다. 따라서, 두 번째의 설계된 결실 변이체 코딩 서열은 서열 8의 염기 1 내지 156의 제거를 필요로 하며, 이것에 의해 아미노산 1 내지 52의 코딩 서열이 제거되었다. 기능성 개방 판독 프레임의 복구는 남아있는 코딩 서열의 시작부에 번역 개시 메티오닌 코돈을 재도입함으로써 또한 성취하였으며, 그에 의해 1113개 아미노산 (즉, 메티오닌 + 전장 DIG-109 단백질의 아미노산 53 내지 1164)을 포함하는 결실 변이체 DIG-109 단백질을 코딩하는 3339개 염기의 개방 판독 프레임을 갖는 두 번째의 결실 변이체 코딩 서열이 제공되었다. 마지막의 설계된 결실 변이체 코딩 서열은 서열 8의 염기 1 내지 273의 제거를 필요로 하며, 그에 의해 아미노산 1 내지 91의 코딩 서열이 제거되었고, 번역 개시 메티오닌 코돈의 재도입 후, 1074개 아미노산 (즉, 메티오닌 + 전장 DIG-109 단백질의 아미노산 92 내지 1164)의 결실 변이체 DIG-109 단백질을 코딩하는 3222개 염기의 개방 판독 프레임을 갖는 결실 변이체 코딩 서열이 제공되었다. 예시된 바와 같이, 결실 서열의 제거 후, 메티오닌 개시 코돈을 남아있는 코딩 서열의 시작부에 부가하여 기능성 개방 판독 프레임을 복구하였다. 또한 기술된 바와 같이, 결실 서열의 제거가 상기에 제공된 불안정성 결정 아미노산들 중 하나를 전장 단백질의 남아있는 부분의 N-말단에 노출시킨 채 남겨두는 것인 경우에 불안정성 결정 아미노산의 코돈과 메티오닌 코돈 사이에 추가의 글리신 코돈을 부가하여야 한다.

표 11에는 상기에 기술된 방법에 따라 설계한 특정 변이체가 기술되어 있다.

표 11에 기술된 DIG-109 단백질 변이체를 코딩하는 추가의 핵산을 실시예 6에 교시한 바와 같이 식물에서의 발현용으로 의도된 합성 유전자에 대한 일반적인 원리에 따라 설계하였다.

실시예 14

추가의 DIG -109 단백질 변이체의 설계

실시예 12에 개시한 바와 같이, 전장 DIG-109 단백질을 포함하는 초기 번역 생성물은 식물에서 다양한 정도로 프로세싱되며, 생성물 중 하나는 크기 면에서 65 kDa의 트립신 절단 코어 독소 펩티드에 상응한다. 이 코어 독소는 곤충 중장에서 수용체에 결합하는 활성화 형태의 독소인 것으로 간주되며 이는 독성을 생성한다. 트립신은 아르기닌 (R) 또는 라이신 (K) 잔기의 C-말단 측에서 단백질을 절단하는 엔도펩티다아제이다. 따라서, 마이즈에서 보이는 65 kDa DIG-109 펩티드는 마이즈 트립신-유사 프로테아제에 의해 서열 5의 잔기 R28 및 R628 이후의 절단에 의해 생성되는 65 kDa 단편에 상응할 수 있다. 이러한 65 kDa 코어 독소 펩티드는 서열 1의 Cry1Ca 코어 독소 절편의 아미노산 28 내지 619 및 서열 4의 Cry1Ab 전독소 절편의 아미노산 1 내지 9를 포함할 수 있음을 주목한다. 그러나, 트랜스제닉 마이즈에서 관찰되는 그리고 하기에 논의되는 다른 절단 생성물의, 또는 65 kDa 절단 생성물의 정확한 C-말단은 실험적으로 결정되지 않았음을 이해하여야 한다. 따라서, 본원에 논의된 DIG-109 변이체 단백질의 설계는 예시적인 것으로 의도되며, 살곤충 활성을 유지하는 다른 DIG-109 절단 변이체 단백질은 본 발명의 범주 이내이다.

대부분의 트랜스제닉 마이즈 식물에 존재하는 DIG-109 펩티드 생성물의 농도는 대략 200 ppm인 것으로 결정되었다. 따라서, DIG-109 펩티드의 아미노산 서열을 결정하기 위하여 수중에 불충분한 재료가 식물 조직으로부터의 정제에 이용가능하다. 크기 면에서 마이즈에서 검출되는 절단 생성물과 유사한 대리 펩티드를, 상이한 프로테아제를 사용하여 전장 DIG-152 단백질을 절단함으로써 생성하였다.

70 kDa 펩티드의 동일성. 슈도모나스 플루오레센스 (Pf)에서 봉입체로서 생성된 전장 DIG-152의 SDS-PAGE 프로필에 의하면, 70 kDa의 겉보기 분자량을 갖는 그리고 트립신 처리에 대하여 비교적 안정한 유의한 양의 단백질이 나타났다. 음이온 교환 및 크기 배제 크로마토그래피의 조합에 의해 가용화 전장 DIG-152 봉입체로부터 정제한 후, 이 펩티드는 SDS-PAGE 상에서의 이동성이 트랜스제닉 마이즈 식물 유래의 추출물에서 검출되는 대략 70 kDa의 DIG-109 펩티드와 동일하였다. 둘 모두의 펩티드는 DIG-152에 대하여 유도된 폴리클로날 항체에 의해 인식되었으며, Pf-생성된 펩티드의 아미노산 서열 분석에 의해 MDNNP를 N-말단 서열로서 확인하였다 (DIG-109의 잔기 1 내지 5, 서열 5). 따라서, 70 kDa 펩티드는 전장 DIG-109 단백질의 천연 N-말단을 함유한다. 코어 독소를 생성하도록 R28에서의 트립신 절단에 의해 DIG-109 단백질로부터 특징적으로 제거되는 처음 28개의 잔기를 온전하게 남겨두면서 추정 코어 독소 C-말단 절단 부위 (R628)에서 트립신으로 절단하면 70.5 kDa의 크기 이론치를 갖는 펩티드 (DIG-109 잔기 1-628로 이루어짐)가 생성되며, 이는 트랜스제닉 마이즈 식물에서 검출되고 Pf 봉입체로부터 단리한 DIG-152 펩티드의 겉보기 분자량과 거의 동일하였다. 따라서, 70 kDa 단백질의 동일성은 아미노산 1-628로 이루어진 절단 DIG-109 펩티드에 상응하는 것으로 제안된다.

60 kDa 및 55 kDa 펩티드의 동일성. pDAS5162- 및 pDAS5848-형질전환 마이즈 식물이 60 kDa 및 55 kDa에 상응하는 이동성의 DIG-109-유래 단백질을 또한 생성하는 것으로 밝혀졌다. 이들 크기의 펩티드는 먼저 전장 DIG-152 단백질을 트립신으로 절단하고, 후속적으로 트립신-절단 생성물을 키모트립신으로 처리함으로써 실험적으로 생성하였다. [전장 DIG-152 단백질을 키모트립신 단독으로 처리하면 60 kDa보다 다소 더 큰 다수의 절단 생성물이 생성되었다.] 트립신/키모트립신 절단 생성물을 벌크로 제조하였으며, 그 후 음이온 교환 크로마토그래피, 이어서 수퍼로스 (Superose) 200 크기 배제 크로마토그래피로 정제하였다. 3개의 주요 피크가 크기 배제 크로마토그래피 단계에서 관찰되었으며, 이는 12.5 mL, 18.3 mL, 및 20 mL의 수집 부피에서 용출시켰다. 제1 주요 피크 (12.5 mL)는 DIG-152 단백질의 높은 분자량 (700 kDa 내지 1000 kDa)의 응집체를 포함하며, 제3 주요 피크 (20 mL)는 여분의 키모트립신을 포함하였다. 12.5 mL 분획물은 또한 DIG-152의 65 kDa 및 60 kDa 생성물에 상응하는 이동성을 갖는 밴드를 포함하였으며, 따라서 DIG-152-유래 펩티드의 올리고머화 또는 응집은 가역적인 것으로 보였다.

18.3 mL 피크 내의 단백질은, 단지 트립신으로 절단한 DIG-152 단백질과 함께, 환원 및 변성 조건 하에 SDS-PAGE로 분석하였다. 이들 단백질은 60 kDa 및 55 kDa에 상응하는 이동성을 갖는 주요한 두 종을 포함하였다. 14 kDa 및 9 kDa의 더욱 작은 단백질도 관찰되었으며, 이는 정제 동안 DIG-152 펩티드에 명백히 결합하는 키모트립신으로 확인되었다. 게다가, 240 kDa에 상응하는 이동성을 갖는 고분자량 밴드가 관찰되었다. 이 밴드 내의 단백질은 DIG152RPC1 항체에 의해 인식되었으며, 이는 이것이 DIG-152 절단 생성물의 올리고머 (사량체)일 가능성이 가장 큰 것임을 입증하는 것이었다.

DIG-109를 생성하는 식물 유래의 추출물 중 단백질은, 정제한, 트립신으로 절단한 DIG-152 및 트립신, 그 후 키모트립신으로 절단한 DIG-152 단백질의 샘플과 함께, SDS-PAGE로 분리하고 그 후 니트로셀룰로오스 상에 전기블로팅하였다. DIG-109 또는 DIG-152 펩티드에 상응하는 밴드를 일차 DIG152RPC1 토끼 항체 및 이차 항-토끼 서양고추냉이 퍼옥시다아제 표지 항체의 조합에 의해 야기되는 향상된 화학발광을 이용하여 가시화하였다. 트립신 처리 DIG-152 샘플은 대략 65 kDa의 이동에서 단일 밴드를 나타냈다. DIG-109 펩티드를 생성하는 식물 유래의 추출물은 하기 4개의 밴드를 나타냈다: 130 kDa (전장 DIG-109 단백질을 나타냄)에 상응하는 이동성을 갖는 하나의 밴드, 60 kDa 및 55 kDa에 상응하는 이동성의 밴드들, 및 대략 20 kDa에 상응하는 이동성의 하나의 밴드. DIG-109의 20 kDa 절단 생성물은 추가로 특성화하지 않았다. 트립신, 그 후 키모트립신으로 처리한 DIG-152 단백질은 대략 60 kDa 및 55 kDa에 상응하는 이동성을 가지며 식물 추출물에서 보이는 60 kDa 및 55 kDa 밴드와 함께 동시 이동하는 2개의 밴드를 나타냈다. 또한, 트립신, 그 후 키모트립신으로 처리한 DIG-152 단백질 샘플에서 약 240 kDa에 상응하는 이동성을 갖는 고분자량 밴드가 또한 있었다.

따라서, 마이즈에서 생성되는 DIG-109의 주요 절단 생성물은 크기 면에서 전장 DIG-152 단백질을 처음에 트립신으로 절단하고, 그 후 추가로 키모트립신으로 절단할 때 수득되는 두 생성물에 상응하였다. 효소에 의해 생성된 60 kDa 및 55 kDa 펩티드 유래의 처음 5개의 N-말단 잔기는 둘 모두 DAFLV (DIG-109 단백질의 잔기 74 내지 78에 상응함, 서열 5)인 것으로 결정되었다. 전장 DIG-109 단백질의 W73 이후의 그러한 절단은 α-나선1, α-나선2A, 및 일부의 α-나선2B를 제거함을 주목한다 (표 1).

또한, 60 kDa 및 55 kDa 펩티드 둘 모두는 동일한 N-말단 서열을 갖기 때문에, 더욱 작은 (55 kDa) 펩티드의 생성에서 제거되는 5 kDa 절편은 60 kDa 펩티드의 C-말단으로부터의 추가의 프로세싱을 나타냄이 분명함을 주목한다.

pDAS5162- 및 pDAS5848-형질전환 마이즈 식물에서 생성된 5가지의 주요 DIG-109 펩티드의 추정 아미노산 좌표가 표 12에 요약되어 있다. 이들 종의 정확한 C-말단은 결정되지 않았다. R568 이후의 60 kDa 종 4의 트립신 절단은 56 kDa (즉, 종 5의 것에 가까움)의 펩티드를 생성함을 주목한다.

DIG -109 절단 변이체의 설계. 표 1에 나타낸 바와 같이, DIG-109 코어 독소의 α-나선1 내지 α-나선4는 DIG-109 단백질의 처음 145개 아미노산 내에 있다. DIG-109 코어 독소의 N-말단 상의 첫 번째의 잠재적인 부위 (DIG-109의 R87; 코어 독소의 R59)에서의 절단은 DIG-109 코어로부터 59개의 아미노산을 제거하여, 분자량이 61.02 kDa인 단백질을 생성하며, 이때 α-나선1, α-나선2A, 및 α-나선2B는 제거되었다. Cry1Ab의 α-나선1의 제거는 상기 단백질이 카드헤린 수용체에의 처음 결합을 우회하게 하는 데 연루되어 있는데, 이는 곤충 중장 세포막 내로의 삽입 전에 올리고머 프리포어 구조가 형성되게 하고 궁극적으로는 기공이 형성되게 한다. 이러한 연구와 유사하게, α-나선1이 손실되게 하는 트립신 절단 DIG-109 코어의 N-말단 부분의 제거는 올리고머가 형성되게 하는 데 필요한 그리고 기능성 기공을 형성시키는 이차적인 아미노펩티다아제 N 수용체에의 결합에 필요한 단계인 것으로 예측된다. 따라서, 그러한 방식으로 식물에서 DIG-109 단백질을 절단하면 곤충에 의한 섭취시에 카드헤린 수용체에의 결합의 요건을 우회하는 DIG-109 독소 펩티드를 생성할 수 있다. 그러한 효과는 돌연변이 카드헤린 수용체 단백질을 갖는 곤충에 있어서 Bt 단백질 중독에 대한 내성의 극복으로 이어지는 것으로 밝혀졌다.

pDAS5162 및 pDAS5848 트랜스제닉 마이즈 식물에서 발견되는 더욱 작은 펩티드 (60 kDa 및 55 kDa)는 트립신-유사 프로테아제에 의한 추가의 절단의 생성물을 대표할 수 있다. 이들 펩티드는 65 kDa 코어 펩티드보다 단지 5 kDa 내지 10 kDa 더 작기 때문에, 그러한 추가의 절단은 상기 코어 독소의 어느 한 말단으로부터 대략적으로 총 80개 미만의 잔기를 제거한다. DIG-109 단백질의 N-말단으로부터의 처음 130개 잔기 내에서, 잠재적인 트립신 절단 부위는 R28 (코어 독소의 R-1), R87 (코어 독소의 R59), R93 (코어 독소의 R65), K115 (코어 독소의 K87), K122 (코어 독소의 K94), R127 (코어 독소의 R99), 및 R129 (코어 독소의 R101)에 위치한다. 코어 독소의 C-말단의 마지막 100개의 아미노산 내에서, 잠재적인 트립신 절단 부위는 R530 (코어 독소의 R502), R533 (코어 독소의 R505), K557 (코어 독소의 K529), R568 (코어 독소의 R540), R571 (코어 독소의 R543), R582 (코어 독소의 R554), 및 K610 (코어 독소의 K582)에 위치한다.

가이드로서 상기에 확인된 잠재적인 프로테아제 절단 부위를 이용하여, 서열 8에 개시된 마이즈 최적화 DIG-109 코딩 서열로부터 유래되는 DNA 서열을 유전자 절단형 DIG-109 단백질 변이체를 코딩하도록 설계하였다. 실시예 13에 개시한 바와 같이 절단 코딩 영역을 개시하기 위하여 5' 말단 메티오닌 및 글리신 코돈을 부가하는 것에 대한 지침을 이들 작제물에 대하여 또한 이용하였다. 첫 번째의 그러한 실시양태인 서열 27로 개시된 DIG-110은 DIG-109 단백질의 아미노산 88 내지 1164를 포함하며, 이는 메티오닌 및 글리신이 N-말단에 부가된 것이었다. DIG-110을 코딩하는 마이즈 최적화 DNA 서열이 서열 28에 개시되어 있다. 두 번째 실시양태인 서열 29로 개시된 DIG-111은 DIG-109 단백질의 아미노산 88 내지 628을 포함하며, 이는 메티오닌 및 글리신이 N-말단에 부가된 것이었다. DIG-111을 코딩하는 마이즈 최적화 DNA 서열은 서열 30에 개시되어 있다. 세 번째 실시양태인 서열 31로 개시된 DIG-112는 DIG-109 단백질의 아미노산 123 내지 1164를 포함하며, 이는 메티오닌 및 글리신이 N-말단에 부가된 것이었다. DIG-112를 코딩하는 마이즈 최적화 DNA 서열은 서열 32에 개시되어 있다. 네 번째 실시양태인 서열 33으로 개시된 DIG-113은 DIG-109 단백질의 아미노산 123 내지 628을 포함하며, 이는 메티오닌 및 글리신이 N-말단에 부가된 것이었다. DIG-113을 코딩하는 마이즈 최적화 DNA 서열은 서열 34에 개시되어 있다. 다섯 번째 실시양태인 서열 35로 개시된 DIG-114는 DIG-109 단백질의 아미노산 1 내지 582를 포함한다. DIG-114를 코딩하는 마이즈 최적화 DNA 서열은 서열 36에 개시되어 있다.

DIG-110 및 DIG-112 단백질은 서열 4에 개시된 Cry1Ab 전독소 절편을 포함함을 주목해야 한다. 이러한 C-말단 전독소 절편은 일부의 예에서 식물에서 단백질을 안정화시키거나 이것이 더 큰 용해성을 갖도록 하는 기능을 할 수 있다고 생각된다. DIG-110의 R543의 트립신 부위에서의 절단, 그에 따른 전독소 절편 대부분의 제거는 크기 이론치가 61.2 kDa인 펩티드를 생성하는데, 이 크기는 pDAS5162- 및 pDAS5848-형질전환 마이즈 식물에서 관찰되는 60 kDa DIG-109 절단 (truncated) 펩티드의 것에 매우 가까웠다. DIG-111 단백질 (이는 처음 9개 아미노산을 제외하고는 Cry1Ab 전독소 절편 전부가 결여됨)은 그러한 절단에서 생기는 DIG-110의 절편 (즉, DIG-110의 아미노산 1 내지 543; 크기의 이론치: 61.2 kDa)을 포함한다.

이와 유사하게, DIG-112의 유사 R508 부위에서의 절단은 크기 이론치가 57.2 kDa인 펩티드를 생성하는데, 이 크기는 pDAS5162- 및 pDAS5848-형질전환 마이즈 식물에서 관찰되는 55 kDa DIG-109 펩티드의 것에 매우 가까웠다. DIG-113 단백질 (이는 처음 9개 아미노산을 제외하고는 Cry1Ab 전독소 절편 전부가 결여됨)은 그러한 절단에서 생기는 DIG-112의 절편 (즉, DIG-112의 아미노산 1 내지 508; 크기의 이론치: 57.2 kDa)을 포함한다.

DIG-114 단백질은 DIG-109 단백질의 아미노산 1 내지 28 (이들 잔기는 식물 세포에서 또는 곤충 중장에서 효소에 의해 제거될 수 있음)을 유지하며, DIG-109 단백질의 R582의 잠재적인 트립신 절단 부위에서 종결된다. 따라서, 이 DIG-109 변이체는 N-말단의 28개 아미노산이 생체내에서 제거되었는지의 여부에 따라 65.7 kDa 단백질로서 또는 62.6 펩티드로서 존재할 수 있다.

본원에 개시한 원리에 의해 추가의 DIG-109 단백질 변이체를 코딩하도록 추가의 마이즈 최적화 코딩 서열을 설계할 수 있다.

실시예 15

DIG -109 및 DIG -109 변이체 단백질을 코딩하는 발현 플라스미드의 작제 및 슈도모나스에서의 발현

DIG-109 단백질 또는 DIG-110, DIG-111, DIG-112, DIG-113, 또는 DIG-114 단백질 (DIG-109 변이체 단백질로 총칭됨)을 생성하도록 조작되는 슈도모나스 플루오레센스 (Pf) 발현 작제물의 작제에서 표준 클로닝 방법 [예를 들어, 문헌[Sambrook et al., (1989)] 및 [Ausubel et al., (1995)]와, 그의 최신판에 기술된 바와 같음]을 사용하였다. 미국 특허 제5169760호에 개시된 바와 같이 변형 lac 오페론이 삽입된 슈도모나스 플루오레센스 주 MB214 (주 MB101의 유도체; 피. 플루오레센스 biovar I)에서 단백질 생성을 수행하였다. 기본 클로닝 방법은 DIG-109 또는 DIG-109 변이체 단백질을 코딩하는 DNA 단편을 플라스미드 pDOW1169 내로 서브클로닝하는 것을 수반하였으며, 그에 의해 이것은 플라스미드 pKK223-3 (피엘 파마시아 (PL Pharmacia; 미국 위스콘신주 밀워키)) 유래의 rrnBT1T2 종결서열 및 Ptac 프로모터의 발현 제어 하에 위치하게 된다. pDOW1169는 단백질 코딩 영역을 포함하는 DNA 단편이 내부에 도입될 수 있는 제한 효소 인식 부위 앞의 리보좀 결합 부위, pyrF 유전자 및 RSF1010 복제 기원을 갖는 중위 카피의 플라스미드이다 (미국 특허 공개 제20080193974호). 상기 발현 플라스미드로 전기천공에 의해 DC454 (돌연변이 ΔpyrF 및 lsc::lacI^QI를 갖는 거의 야생형의 피. 플루오레센스 주) 또는 그의 유도체를 형질전환시키고, 이를 SOC-대두 가수분해물 배지에서 회수하고, 선발 배지 (우라실이 결여된 M9 글루코스 한천, 문헌[Sambrook et al., 상기 문헌]) 상에 도말하였다. 미생물학적 조작에 대한 상세 사항은 본원에 참고로 포함된 문헌[Squires et al., (2004)], 미국 특허 공개 제20060008877호, 미국 특허 공개 제20080193974호, 및 미국 특허 공개 제20080058262호에서 입수가능하다. 먼저 콜로니를 PCR에 의해 스크리닝하고, 그 후 양성 클론을 미니프렙 (miniprep) 플라스미드 DNA의 제한효소 절단에 의해 분석하였다. 삽입체를 포함하는 선발 클론의 플라스미드 DNA를 상업적 서열결정 판매 회사, 예컨대 엠더블유지 바이오테크 (MWG Biotech; 미국 앨라배마주 헌츠빌))와의 계약에 의해 서열결정하였다. 서열 데이터를 시켄처 (Sequencher)^TM 소프트웨어 (진 코즈 코포레이션 (Gene Codes Corp.; 미국 미시건주 앤아버))를 사용하여 어셈블링 및 분석하였다.

진탕 플라스크에서의 성장 및 발현의 분석 특성화 및 곤충 생물분석을 위한 DIG-109 단백질 또는 DIG-109 변이체 단백질의 생성은 적절한 발현 플라스미드를 포함하는, 진탕 플라스크에서 성장시킨 피. 플루오레센스 주에 의해 성취하였다. DIG-109 단백질 또는 DIG-109 변이체 단백질의 생성은 Ptac 프로모터에 의해 추진되었으며, 이는 미국 특허 제5527883호에 이전에 기술된 바와 같이 행하였다. 진탕하면서 30도에서 24시간 초기 인큐베이션한 후 이소프로필-β-D-1-티오갈락토피라노시드 (IPTG)를 첨가함으로써 발현을 유도하였다. 유도시에 그리고 유도 후 다양한 시점에서 배양물을 샘플링하였다. 세포 밀도를 600 nm에서의 광학 밀도 (OD₆₀₀)로 측정하였다. 각각의 샘플링 시점에서, 샘플의 세포 밀도를 OD₆₀₀ = 20으로 조정하고, 1 mL의 분취물을 14000 x g에서 5분 동안 원심분리하였다. 세포 펠렛을 -80도에서 냉동시켰다.

실시예 16

세포 분획화 , 및 DIG -109 및 DIG -109 변이체 단백질의 슈도모나스에 의한 생성의 진탕 플라스크 샘플의 SDS - PAGE 분석

냉동 진탕 플라스크 세포 펠렛 샘플로부터의 용해성 및 불용성 분획물을 이지라이즈^TM 박테리아 단백질 추출 용액 (에피센터^® 바이오테크놀로지즈, 미국 위스콘신주 매디슨)을 이용하여 생성하였다. 실시예 2에 개시한 방법 및 지침을 이용하였다.

실시예 17

슈도모나스 플루오레센스에서 생성한 DIG -109 변이체 단백질의 살곤충 활성

유럽 옥수수 명나방 (ECB; 오스트리니아 누빌랄리스 (휘브너)), Cry1F-내성 ECB (rECB), 왕담배나방 (CEW; 헬리코베르파 제아 (보디에)), 검거세미나방 (BCW; 아그로티스 입실론 (후프나겔)), 밤나방 (FAW, 스포도프테라 프루기페르다 (제이.이. 스미스)), Cry1F-내성 FAW (rFAW), 남서부 옥수수 명나방 (SWCB, 디아트라에아 그란디오셀라), 사탕수수 명나방 (SCB; 디아트라에아 사카랄리스) 및 Cry1Ab-내성 SCB (rSCB)를 포함하는 인시목 종에서 DIG-109 변이체 단백질의 살곤충 활성을 입증하였다.

실시예 3 및 실시예 4에 개시한 방법, 지침 및 데이터 분석을 따랐다.

실시예 18

DIG -109 변이체 단백질을 코딩하는 식물 발현성 유전자를 포함하는 식물 형질전환 벡터의 작제

아그로박테륨 수퍼바이너리 시스템 (저팬 토바코, 일본 도꾜)을 단자엽 식물 숙주의 형질전환에 편리하게 이용하였다. 식물 발현 벡터의 작제, 및 수퍼바이너리 플라스미드의 생성 및 그의 인증을 실시예 7 및 실시예 8에 개시한 방법에 의해 수행하였다. pSB11 유도 플라스미드의 T-DNA 성분의 물리적 배열을 하기와 같이 편리하게 예시하였다:

RB>마이즈 Ubi1 프로모터:DIG-109 변이체 CDS:마이즈 Per5 3'UTR>벼 Act1 프로모터:DSM2 CDS:마이즈 Lip 3'UTR>LB, 또는

RB>마이즈 Ubi1 프로모터:DIG-109 변이체 CDS:마이즈 Per5 3'UTR>마이즈 Ubi1 프로모터:AAD-1 CDS:마이즈 Lip 3' UTR>LB

실시예 19

마이즈 식물에서의 DIG -109 단백질 변이체의 생성

마이즈의 아그로박테륨 -매개 형질전환 DIG 109 변이체 단백질을 생성하는 트랜스제닉 마이즈 식물을 실시예 9에 개시한 방법에 의해 생성하였다.

실시예 20

DIG -109 변이체 단백질을 코딩하는 유전자를 발현하는 트랜스제닉 마이즈 식물의 생화학적 분자적 분석 및 곤충 생물분석

DIG-109 변이체 단백질을 코딩하는 유전자를 지니고 발현하는 트랜스제닉 마이즈 식물에 의해 생성되는 DIG-109 변이체 단백질의 생화학적 특성화를 실시예 10 및 실시예 12의 방법 및 시약에 의해 행하였다. DIG-109 변이체 단백질을 코딩하는 유전자의 트랜스진 분석을 실시예 11에 개시한 방법 및 시약에 따라 수행하였다. DIG-109 변이체 단백질을 코딩하는 유전자를 지니고 발현하는 트랜스제닉 마이즈 식물로부터 유래된 잎 조각의 곤충 생물분석을 실시예 10에 개시한 방법에 의해 행하였다.

SEQUENCE LISTING <110> Dow AgroSciences Narva, Ken Hey, Tim Sheets, Joel Larrinua, Iggy Burton, Stephanie <120> Truncated Cry1Ca <130> IDM 68342 <160> 36 <170> PatentIn version 3.5 <210> 1 <211> 619 <212> PRT <213> Artificial Sequence <220> <223> Derived from Cry1Ca3 <400> 1 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr 610 615 <210> 2 <211> 545 <212> PRT <213> Artificial Sequence <220> <223> Derived from Cry1Ab <400> 2 Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala 1 5 10 15 Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp 20 25 30 Tyr His Ile Asp Arg Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu 35 40 45 Phe Cys Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala 50 55 60 Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg 65 70 75 80 Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile 85 90 95 Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu 100 105 110 Leu Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile 115 120 125 Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr 130 135 140 Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala 145 150 155 160 Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu 165 170 175 Ser Ala Pro Ser Pro Ile Gly Lys Cys Ala His His Ser His His Phe 180 185 190 Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly 195 200 205 Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu 210 215 220 Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu 225 230 235 240 Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys 245 250 255 Leu Glu Trp Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val 260 265 270 Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr 275 280 285 Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg 290 295 300 Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala 305 310 315 320 Ile Phe Glu Glu Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr 325 330 335 Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser 340 345 350 Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu Gln Asn Asn His 355 360 365 Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu 370 375 380 Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr 385 390 395 400 Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn 405 410 415 Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr 420 425 430 Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu 435 440 445 Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr 450 455 460 Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu Glu 465 470 475 480 Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Ser Asn Arg 485 490 495 Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu 500 505 510 Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu 515 520 525 Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu 530 535 540 Glu 545 <210> 3 <211> 1164 <212> PRT <213> Artificial Sequence <220> <223> DIG-152 Chimeric protein <400> 3 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser 625 630 635 640 Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Arg 645 650 655 Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu 660 665 670 Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp 675 680 685 Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile Asn Arg Gln 690 695 700 Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly 705 710 715 720 Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp 725 730 735 Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu 740 745 750 Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln 755 760 765 Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val 770 775 780 Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Pro Ser Pro 785 790 795 800 Ile Gly Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp 805 810 815 Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe 820 825 830 Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe 835 840 845 Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg 850 855 860 Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr 865 870 875 880 Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val 885 890 895 Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile 900 905 910 His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro 915 920 925 Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu 930 935 940 Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val 945 950 955 960 Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys 965 970 975 Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val 980 985 990 Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro 995 1000 1005 Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr 1010 1015 1020 Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp 1025 1030 1035 Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asn 1040 1045 1050 Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu Tyr 1055 1060 1065 Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr 1070 1075 1080 Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu 1085 1090 1095 Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Ser 1100 1105 1110 Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val 1115 1120 1125 Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile 1130 1135 1140 Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu 1145 1150 1155 Leu Leu Leu Met Glu Glu 1160 <210> 4 <211> 545 <212> PRT <213> Artificial Sequence <220> <223> Derived from Cry1Ab <400> 4 Leu Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala 1 5 10 15 Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp 20 25 30 Tyr His Ile Asp Arg Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu 35 40 45 Phe Cys Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala 50 55 60 Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg 65 70 75 80 Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile 85 90 95 Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu 100 105 110 Leu Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile 115 120 125 Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr 130 135 140 Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala 145 150 155 160 Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu 165 170 175 Ser Ala Pro Ser Pro Ile Gly Lys Cys Ala His His Ser His His Phe 180 185 190 Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly 195 200 205 Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu 210 215 220 Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu 225 230 235 240 Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys 245 250 255 Leu Glu Trp Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val 260 265 270 Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr 275 280 285 Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg 290 295 300 Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala 305 310 315 320 Ile Phe Glu Glu Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr 325 330 335 Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser 340 345 350 Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu Gln Asn Asn His 355 360 365 Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu 370 375 380 Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr 385 390 395 400 Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn 405 410 415 Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr 420 425 430 Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu 435 440 445 Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr 450 455 460 Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu Glu 465 470 475 480 Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Ser Asn Arg 485 490 495 Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu 500 505 510 Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu 515 520 525 Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu 530 535 540 Glu 545 <210> 5 <211> 1164 <212> PRT <213> Artificial Sequence <220> <223> DIG-109 chimeric protein <400> 5 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu 580 585 590 Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile 595 600 605 Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser 610 615 620 Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser 625 630 635 640 Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Arg 645 650 655 Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu 660 665 670 Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp 675 680 685 Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile Asn Arg Gln 690 695 700 Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly 705 710 715 720 Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp 725 730 735 Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu 740 745 750 Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln 755 760 765 Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val 770 775 780 Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Pro Ser Pro 785 790 795 800 Ile Gly Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp 805 810 815 Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe 820 825 830 Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe 835 840 845 Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg 850 855 860 Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr 865 870 875 880 Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val 885 890 895 Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile 900 905 910 His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro 915 920 925 Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu 930 935 940 Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val 945 950 955 960 Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys 965 970 975 Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val 980 985 990 Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro 995 1000 1005 Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr 1010 1015 1020 Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp 1025 1030 1035 Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asn 1040 1045 1050 Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu Tyr 1055 1060 1065 Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr 1070 1075 1080 Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu 1085 1090 1095 Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Ser 1100 1105 1110 Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val 1115 1120 1125 Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile 1130 1135 1140 Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu 1145 1150 1155 Leu Leu Leu Met Glu Glu 1160 <210> 6 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> immunogenic peptide <400> 6 Val Gln Arg Ser Gly Thr Pro Phe Leu Thr 1 5 10 <210> 7 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> immunogenic peptide <400> 7 Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser 1 5 10 <210> 8 <211> 3492 <212> DNA <213> Artificial Sequence <220> <223> DIG-109 maize-optimized coding region <400> 8 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180 atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240 gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300 gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360 cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540 cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600 gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660 tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780 ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900 ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020 cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380 aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500 acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740 ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800 atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctc 1860 gaggctgaat cggatcttga aagggcacag aaggcagtca acgctctctt caccagctca 1920 aatcagattg gccttaagac cgatgttact gactatcata tcgacagagt ttctaacctt 1980 gtcgagtgcc tctccgacga gttctgtctc gacgaaaaga aggaactctc cgagaaagtg 2040 aagcacgcga aacgcctctc ggatgaacgg aacttgctgc aagatccgaa cttcagaggc 2100 atcaatcgcc agttggatag aggctggagg ggatcaaccg acataaccat tcaaggtggg 2160 gatgatgtgt tcaaggaaaa ctacgtgaca ttgctgggca ccttcgacga gtgctatccc 2220 acgtatctct atcagaagat tgacgagtcc aagctcaaag cctacacacg ctatcagctc 2280 agaggctaca ttgaggactc tcaagacctc gaaatctact tgatcagata caacgccaag 2340 cacgagacgg tgaacgtccc tgggactggg tcactgtggc cactgtcggc accctcgcca 2400 atcggaaagt gcgctcacca cagccaccac ttctcccttg acatagatgt tgggtgtacg 2460 gacttgaatg aggatctggg tgtgtgggtg atctttaaga tcaagaccca agatggtcat 2520 gcgaggcttg gcaaccttga gttccttgaa gagaagcctt tggtcggaga ggcactggct 2580 cgcgtgaaga gggctgagaa gaaatggagg gacaagaggg agaaactgga gtgggagacc 2640 aacatagtgt acaaggaggc caaggagtca gtggacgcac tgtttgtcaa ttcccagtat 2700 gataggctcc aagcggacac gaacatcgcc atgatccatg cagcggacaa gagggttcac 2760 tccataaggg aggcctatct tccggagctg tcagtgattc ctggggtcaa cgcagccatc 2820 tttgaggaat tggaagggag gatcttcacc gctttctctc tgtacgacgc tcggaacgtc 2880 atcaagaatg gtgatttcaa caatggactc agctgctgga acgtgaaagg gcatgtcgat 2940 gttgaagaac agaacaatca ccgcagcgtg ctggtggttc cggagtggga agccgaggtc 3000 tcacaagaag tcagagtgtg ccctgggagg ggttacatct tgcgggtcac agcctacaag 3060 gaaggttatg gcgaaggctg tgtcacgatc catgagatcg aaaacaacac agacgagctg 3120 aagttttcca actgtgttga ggaggaggtc tatcctaaca atactgttac gtgcaacgac 3180 tacacagcca ctcaagagga gtacgagggc acttacacct ctcgcaacag aggctacgac 3240 ggtgcctacg agtcaaacag ctccgtgcca gcggactacg cctcggctta cgaagagaag 3300 gcgtacaccg acggtcggag ggataacccg tgcgagagca atagaggcta tggcgactac 3360 actcctctcc cagctggcta cgtgaccaag gagttggagt actttccgga gacagacaaa 3420 gtctggattg agattggaga gacagaaggc acgttcatcg tggactctgt tgaactcttg 3480 ctgatggagg ag 3492 <210> 9 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 9 cctgctccac taccagtaca a 21 <210> 10 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 10 gtccaagaag gtgaccttct c 21 <210> 11 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 11 agatcaccga ctttgcgctc ttt 23 <210> 12 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 12 cctccctctt tgacgcc 17 <210> 13 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 13 agccacatcc cagtaacga 19 <210> 14 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 14 cagcccaatg aggcatgagc 20 <210> 15 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 15 tgtgttgagg aggaggtc 18 <210> 16 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 16 ccttctcttc gtaagccg 18 <210> 17 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 17 tcaagaggag tacgagggca ctt 23 <210> 18 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 18 tgttcggttc cctctaccaa 20 <210> 19 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 19 caacatccat caccttgact ga 22 <210> 20 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 20 cacagaaccg tcgcttcagc aaca 24 <210> 21 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 21 tgtgttgagg aggaggtc 18 <210> 22 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 22 ccttctcttc gtaagccg 18 <210> 23 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 23 tcaagaggag tacgagggca ctt 23 <210> 24 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 24 tggcggacga cgacttgt 18 <210> 25 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 25 aaagtttgga ggctgccgt 19 <210> 26 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 26 cgagcagacc gccgtgtact tctacc 26 <210> 27 <211> 1079 <212> PRT <213> Artificial Sequence <220> <223> DIG-110 Chimeric protein <400> 27 Met Gly Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn Leu Glu 1 5 10 15 Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys Glu Trp 20 25 30 Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile Asp Arg 35 40 45 Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg 50 55 60 Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala 65 70 75 80 Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly Glu Arg 85 90 95 Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile 100 105 110 Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Asn Arg 115 120 125 Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile Thr Tyr 130 135 140 Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile Ala Ala 145 150 155 160 Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro Val Gly 165 170 175 Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe Asn Pro 180 185 190 Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Glu Asn 195 200 205 Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn Leu Thr 210 215 220 Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly 225 230 235 240 His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr Ser Pro 245 250 255 Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe 260 265 270 Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu 275 280 285 Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Glu Gly 290 295 300 Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly 305 310 315 320 Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro 325 330 335 Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln 340 345 350 Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr 355 360 365 His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg Ile Asn 370 375 380 Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val 385 390 395 400 Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr 405 410 415 Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro Ile Thr 420 425 430 Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg 435 440 445 Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly Gln Val 450 455 460 Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu Asn Leu 465 470 475 480 Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe 485 490 495 Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly 500 505 510 Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile 515 520 525 Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu Arg Ala 530 535 540 Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu 545 550 555 560 Lys Thr Asp Val Thr Asp Tyr His Ile Asp Arg Val Ser Asn Leu Val 565 570 575 Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Lys Glu Leu Ser 580 585 590 Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu 595 600 605 Gln Asp Pro Asn Phe Arg Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp 610 615 620 Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys 625 630 635 640 Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp Glu Cys Tyr Pro Thr 645 650 655 Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg 660 665 670 Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr 675 680 685 Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr 690 695 700 Gly Ser Leu Trp Pro Leu Ser Ala Pro Ser Pro Ile Gly Lys Cys Ala 705 710 715 720 His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp 725 730 735 Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln 740 745 750 Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro 755 760 765 Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp 770 775 780 Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val Tyr Lys 785 790 795 800 Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp 805 810 815 Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys 820 825 830 Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile 835 840 845 Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg Ile Phe 850 855 860 Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp 865 870 875 880 Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Asp Val 885 890 895 Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Val Pro Glu Trp Glu 900 905 910 Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile 915 920 925 Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr 930 935 940 Ile His Glu Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys 945 950 955 960 Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr 965 970 975 Thr Ala Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg 980 985 990 Gly Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr 995 1000 1005 Ala Ser Ala Tyr Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp 1010 1015 1020 Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu 1025 1030 1035 Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr 1040 1045 1050 Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile 1055 1060 1065 Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu 1070 1075 <210> 28 <211> 3237 <212> DNA <213> Artificial Sequence <220> <223> DIG-110 maize-optimized coding region <400> 28 atgggcatcg ctgagttcgc gagaaatgct gcaatcgcca accttgaagg gcttggcaac 60 aacttcaaca tctacgtgga ggcgttcaag gagtgggaag aggaccctaa gaatccagcg 120 accagaacga gggttataga tcggttccgc atcctcgatg gccttttgga gagggacatc 180 ccgagcttcc gcatttcggg atttgaggtt cctctgctct cagtctacgc tcaagctgct 240 aatctgcatc tggccatctt gagggattca gtcatctttg gcgaacgctg gggtcttacg 300 actatcaacg tgaacgagaa ctacaatcgg ttgattcggc acatagacga gtatgccgac 360 cactgtgcta acacctacaa taggggtctg aacaatctgc caaagtcaac gtatcaagac 420 tggataacct acaataggct cagacgggac ctcactctca ccgtgctgga catagctgcc 480 ttctttccga actacgacaa ccggagatat cctattcaac ccgttggtca gctcactcgc 540 gaggtctaca ccgatcccct catcaacttc aatccccagc tgcaatcggt cgcacagctg 600 cccaccttca atgtgatgga aaactcagcg atccggaatc cccatctgtt tgacatactt 660 aacaacctca ctatcttcac cgattggttt tcagttggac gcaacttcta ctggggaggg 720 cacagagtga tttcaagcct cattggagga gggaacatta catcgcctat ctatggaagg 780 gaggccaacc aagagccacc aaggtctttc accttcaacg gtccggtgtt cagaacactt 840 agcaatccca cattgcgctt gctgcaacag ccgtggccag caccaccatt caatctgagg 900 ggagtggagg gtgtggagtt ctcgacgcct acaaactcct ttacgtacag aggcagaggg 960 acagtggact cactgacaga actcccacct gaggacaact ctgttcctcc gagggagggc 1020 tactcgcacc ggctttgcca tgccaccttc gtccagaggt ctggcacgcc ttttctgacc 1080 actggggttg tctttagctg gactcaccgc tcagcgacgc tgaccaacac aatcgaccca 1140 gagaggatca atcagatccc tctggtgaag ggctttcgcg tttggggtgg cacaagcgtg 1200 atcaccggac ctggtttcac tggtggggat atcctcagac gcaatacgtt tggcgatttc 1260 gtgagccttc aagtcaacat caattcccca atcacccaga gatatcggct ccgcttcaga 1320 tacgcctcat ccagagacgc aagggtcatc gtccttactg gagcagccag caccggagtc 1380 ggaggccaag ttagcgtcaa catgccgttg cagaaaacga tggaaatcgg tgaaaacctc 1440 accagcagaa cctttcgcta tacagatttc agcaaccctt tctccttcag agccaatccg 1500 gacataatcg gcatatccga gcagcccttg ttcggtgctg ggtccatctc ttctggcgag 1560 ctgtacatcg acaagattga gatcattctc gcagatgcga ctctcgaggc tgaatcggat 1620 cttgaaaggg cacagaaggc agtcaacgct ctcttcacca gctcaaatca gattggcctt 1680 aagaccgatg ttactgacta tcatatcgac agagtttcta accttgtcga gtgcctctcc 1740 gacgagttct gtctcgacga aaagaaggaa ctctccgaga aagtgaagca cgcgaaacgc 1800 ctctcggatg aacggaactt gctgcaagat ccgaacttca gaggcatcaa tcgccagttg 1860 gatagaggct ggaggggatc aaccgacata accattcaag gtggggatga tgtgttcaag 1920 gaaaactacg tgacattgct gggcaccttc gacgagtgct atcccacgta tctctatcag 1980 aagattgacg agtccaagct caaagcctac acacgctatc agctcagagg ctacattgag 2040 gactctcaag acctcgaaat ctacttgatc agatacaacg ccaagcacga gacggtgaac 2100 gtccctggga ctgggtcact gtggccactg tcggcaccct cgccaatcgg aaagtgcgct 2160 caccacagcc accacttctc ccttgacata gatgttgggt gtacggactt gaatgaggat 2220 ctgggtgtgt gggtgatctt taagatcaag acccaagatg gtcatgcgag gcttggcaac 2280 cttgagttcc ttgaagagaa gcctttggtc ggagaggcac tggctcgcgt gaagagggct 2340 gagaagaaat ggagggacaa gagggagaaa ctggagtggg agaccaacat agtgtacaag 2400 gaggccaagg agtcagtgga cgcactgttt gtcaattccc agtatgatag gctccaagcg 2460 gacacgaaca tcgccatgat ccatgcagcg gacaagaggg ttcactccat aagggaggcc 2520 tatcttccgg agctgtcagt gattcctggg gtcaacgcag ccatctttga ggaattggaa 2580 gggaggatct tcaccgcttt ctctctgtac gacgctcgga acgtcatcaa gaatggtgat 2640 ttcaacaatg gactcagctg ctggaacgtg aaagggcatg tcgatgttga agaacagaac 2700 aatcaccgca gcgtgctggt ggttccggag tgggaagccg aggtctcaca agaagtcaga 2760 gtgtgccctg ggaggggtta catcttgcgg gtcacagcct acaaggaagg ttatggcgaa 2820 ggctgtgtca cgatccatga gatcgaaaac aacacagacg agctgaagtt ttccaactgt 2880 gttgaggagg aggtctatcc taacaatact gttacgtgca acgactacac agccactcaa 2940 gaggagtacg agggcactta cacctctcgc aacagaggct acgacggtgc ctacgagtca 3000 aacagctccg tgccagcgga ctacgcctcg gcttacgaag agaaggcgta caccgacggt 3060 cggagggata acccgtgcga gagcaataga ggctatggcg actacactcc tctcccagct 3120 ggctacgtga ccaaggagtt ggagtacttt ccggagacag acaaagtctg gattgagatt 3180 ggagagacag aaggcacgtt catcgtggac tctgttgaac tcttgctgat ggaggag 3237 <210> 29 <211> 543 <212> PRT <213> Artificial Sequence <220> <223> DIG-111 truncated protein <400> 29 Met Gly Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn Leu Glu 1 5 10 15 Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys Glu Trp 20 25 30 Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile Asp Arg 35 40 45 Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg 50 55 60 Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala 65 70 75 80 Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly Glu Arg 85 90 95 Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile 100 105 110 Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Asn Arg 115 120 125 Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile Thr Tyr 130 135 140 Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile Ala Ala 145 150 155 160 Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro Val Gly 165 170 175 Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe Asn Pro 180 185 190 Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Glu Asn 195 200 205 Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn Leu Thr 210 215 220 Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly 225 230 235 240 His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr Ser Pro 245 250 255 Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe 260 265 270 Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu 275 280 285 Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Glu Gly 290 295 300 Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly 305 310 315 320 Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro 325 330 335 Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln 340 345 350 Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr 355 360 365 His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg Ile Asn 370 375 380 Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val 385 390 395 400 Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr 405 410 415 Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro Ile Thr 420 425 430 Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg 435 440 445 Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly Gln Val 450 455 460 Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu Asn Leu 465 470 475 480 Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe 485 490 495 Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly 500 505 510 Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile 515 520 525 Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu Arg 530 535 540 <210> 30 <211> 1629 <212> DNA <213> Artificial Sequence <220> <223> DIG-111 maize-optimized coding region <400> 30 atgggcatcg ctgagttcgc gagaaatgct gcaatcgcca accttgaagg gcttggcaac 60 aacttcaaca tctacgtgga ggcgttcaag gagtgggaag aggaccctaa gaatccagcg 120 accagaacga gggttataga tcggttccgc atcctcgatg gccttttgga gagggacatc 180 ccgagcttcc gcatttcggg atttgaggtt cctctgctct cagtctacgc tcaagctgct 240 aatctgcatc tggccatctt gagggattca gtcatctttg gcgaacgctg gggtcttacg 300 actatcaacg tgaacgagaa ctacaatcgg ttgattcggc acatagacga gtatgccgac 360 cactgtgcta acacctacaa taggggtctg aacaatctgc caaagtcaac gtatcaagac 420 tggataacct acaataggct cagacgggac ctcactctca ccgtgctgga catagctgcc 480 ttctttccga actacgacaa ccggagatat cctattcaac ccgttggtca gctcactcgc 540 gaggtctaca ccgatcccct catcaacttc aatccccagc tgcaatcggt cgcacagctg 600 cccaccttca atgtgatgga aaactcagcg atccggaatc cccatctgtt tgacatactt 660 aacaacctca ctatcttcac cgattggttt tcagttggac gcaacttcta ctggggaggg 720 cacagagtga tttcaagcct cattggagga gggaacatta catcgcctat ctatggaagg 780 gaggccaacc aagagccacc aaggtctttc accttcaacg gtccggtgtt cagaacactt 840 agcaatccca cattgcgctt gctgcaacag ccgtggccag caccaccatt caatctgagg 900 ggagtggagg gtgtggagtt ctcgacgcct acaaactcct ttacgtacag aggcagaggg 960 acagtggact cactgacaga actcccacct gaggacaact ctgttcctcc gagggagggc 1020 tactcgcacc ggctttgcca tgccaccttc gtccagaggt ctggcacgcc ttttctgacc 1080 actggggttg tctttagctg gactcaccgc tcagcgacgc tgaccaacac aatcgaccca 1140 gagaggatca atcagatccc tctggtgaag ggctttcgcg tttggggtgg cacaagcgtg 1200 atcaccggac ctggtttcac tggtggggat atcctcagac gcaatacgtt tggcgatttc 1260 gtgagccttc aagtcaacat caattcccca atcacccaga gatatcggct ccgcttcaga 1320 tacgcctcat ccagagacgc aagggtcatc gtccttactg gagcagccag caccggagtc 1380 ggaggccaag ttagcgtcaa catgccgttg cagaaaacga tggaaatcgg tgaaaacctc 1440 accagcagaa cctttcgcta tacagatttc agcaaccctt tctccttcag agccaatccg 1500 gacataatcg gcatatccga gcagcccttg ttcggtgctg ggtccatctc ttctggcgag 1560 ctgtacatcg acaagattga gatcattctc gcagatgcga ctctcgaggc tgaatcggat 1620 cttgaaagg 1629 <210> 31 <211> 1044 <212> PRT <213> Artificial Sequence <220> <223> DIG-112 chimeric protein <400> 31 Met Gly Asn Pro Ala Thr Arg Thr Arg Val Ile Asp Arg Phe Arg Ile 1 5 10 15 Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg Ile Ser Gly 20 25 30 Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn Leu His 35 40 45 Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly Glu Arg Trp Gly Leu 50 55 60 Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile Arg His Ile 65 70 75 80 Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Asn Arg Gly Leu Asn 85 90 95 Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile Thr Tyr Asn Arg Leu 100 105 110 Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile Ala Ala Phe Phe Pro 115 120 125 Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro Val Gly Gln Leu Thr 130 135 140 Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe Asn Pro Gln Leu Gln 145 150 155 160 Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Glu Asn Ser Ala Ile 165 170 175 Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn Leu Thr Ile Phe Thr 180 185 190 Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly His Arg Val 195 200 205 Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr Ser Pro Ile Tyr Gly 210 215 220 Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe Asn Gly Pro 225 230 235 240 Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu Gln Gln Pro 245 250 255 Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Glu Gly Val Glu Phe 260 265 270 Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly Thr Val Asp 275 280 285 Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro Pro Arg Glu 290 295 300 Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln Arg Ser Gly 305 310 315 320 Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr His Arg Ser 325 330 335 Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro 340 345 350 Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly 355 360 365 Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp 370 375 380 Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr 385 390 395 400 Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val 405 410 415 Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn 420 425 430 Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg 435 440 445 Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn 450 455 460 Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser 465 470 475 480 Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala 485 490 495 Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala 500 505 510 Val Asn Ala Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp 515 520 525 Val Thr Asp Tyr His Ile Asp Arg Val Ser Asn Leu Val Glu Cys Leu 530 535 540 Ser Asp Glu Phe Cys Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val 545 550 555 560 Lys His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro 565 570 575 Asn Phe Arg Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser 580 585 590 Thr Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr 595 600 605 Val Thr Leu Leu Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr 610 615 620 Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu 625 630 635 640 Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg 645 650 655 Tyr Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu 660 665 670 Trp Pro Leu Ser Ala Pro Ser Pro Ile Gly Lys Cys Ala His His Ser 675 680 685 His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu 690 695 700 Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His 705 710 715 720 Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Val Gly 725 730 735 Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys 740 745 750 Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys 755 760 765 Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln 770 775 780 Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val His 785 790 795 800 Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val 805 810 815 Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg Ile Phe Thr Ala Phe 820 825 830 Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Asn 835 840 845 Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu Gln 850 855 860 Asn Asn His Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val 865 870 875 880 Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val 885 890 895 Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu 900 905 910 Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu 915 920 925 Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr 930 935 940 Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp 945 950 955 960 Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala 965 970 975 Tyr Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu 980 985 990 Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val 995 1000 1005 Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile 1010 1015 1020 Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu 1025 1030 1035 Leu Leu Leu Met Glu Glu 1040 <210> 32 <211> 3132 <212> DNA <213> Artificial Sequence <220> <223> DIG-112 maize-optimized coding region <400> 32 atgggcaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 60 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 120 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 180 cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 240 gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 300 tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 360 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 420 ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 480 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 540 ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 600 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 660 cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 720 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 780 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 840 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 900 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 960 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1020 aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1080 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1140 acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1200 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1260 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1320 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1380 ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1440 atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctc 1500 gaggctgaat cggatcttga aagggcacag aaggcagtca acgctctctt caccagctca 1560 aatcagattg gccttaagac cgatgttact gactatcata tcgacagagt ttctaacctt 1620 gtcgagtgcc tctccgacga gttctgtctc gacgaaaaga aggaactctc cgagaaagtg 1680 aagcacgcga aacgcctctc ggatgaacgg aacttgctgc aagatccgaa cttcagaggc 1740 atcaatcgcc agttggatag aggctggagg ggatcaaccg acataaccat tcaaggtggg 1800 gatgatgtgt tcaaggaaaa ctacgtgaca ttgctgggca ccttcgacga gtgctatccc 1860 acgtatctct atcagaagat tgacgagtcc aagctcaaag cctacacacg ctatcagctc 1920 agaggctaca ttgaggactc tcaagacctc gaaatctact tgatcagata caacgccaag 1980 cacgagacgg tgaacgtccc tgggactggg tcactgtggc cactgtcggc accctcgcca 2040 atcggaaagt gcgctcacca cagccaccac ttctcccttg acatagatgt tgggtgtacg 2100 gacttgaatg aggatctggg tgtgtgggtg atctttaaga tcaagaccca agatggtcat 2160 gcgaggcttg gcaaccttga gttccttgaa gagaagcctt tggtcggaga ggcactggct 2220 cgcgtgaaga gggctgagaa gaaatggagg gacaagaggg agaaactgga gtgggagacc 2280 aacatagtgt acaaggaggc caaggagtca gtggacgcac tgtttgtcaa ttcccagtat 2340 gataggctcc aagcggacac gaacatcgcc atgatccatg cagcggacaa gagggttcac 2400 tccataaggg aggcctatct tccggagctg tcagtgattc ctggggtcaa cgcagccatc 2460 tttgaggaat tggaagggag gatcttcacc gctttctctc tgtacgacgc tcggaacgtc 2520 atcaagaatg gtgatttcaa caatggactc agctgctgga acgtgaaagg gcatgtcgat 2580 gttgaagaac agaacaatca ccgcagcgtg ctggtggttc cggagtggga agccgaggtc 2640 tcacaagaag tcagagtgtg ccctgggagg ggttacatct tgcgggtcac agcctacaag 2700 gaaggttatg gcgaaggctg tgtcacgatc catgagatcg aaaacaacac agacgagctg 2760 aagttttcca actgtgttga ggaggaggtc tatcctaaca atactgttac gtgcaacgac 2820 tacacagcca ctcaagagga gtacgagggc acttacacct ctcgcaacag aggctacgac 2880 ggtgcctacg agtcaaacag ctccgtgcca gcggactacg cctcggctta cgaagagaag 2940 gcgtacaccg acggtcggag ggataacccg tgcgagagca atagaggcta tggcgactac 3000 actcctctcc cagctggcta cgtgaccaag gagttggagt actttccgga gacagacaaa 3060 gtctggattg agattggaga gacagaaggc acgttcatcg tggactctgt tgaactcttg 3120 ctgatggagg ag 3132 <210> 33 <211> 508 <212> PRT <213> Artificial Sequence <220> <223> DIG-113 truncated protein <400> 33 Met Gly Asn Pro Ala Thr Arg Thr Arg Val Ile Asp Arg Phe Arg Ile 1 5 10 15 Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg Ile Ser Gly 20 25 30 Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn Leu His 35 40 45 Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly Glu Arg Trp Gly Leu 50 55 60 Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile Arg His Ile 65 70 75 80 Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Asn Arg Gly Leu Asn 85 90 95 Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile Thr Tyr Asn Arg Leu 100 105 110 Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile Ala Ala Phe Phe Pro 115 120 125 Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro Val Gly Gln Leu Thr 130 135 140 Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe Asn Pro Gln Leu Gln 145 150 155 160 Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Glu Asn Ser Ala Ile 165 170 175 Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn Leu Thr Ile Phe Thr 180 185 190 Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly His Arg Val 195 200 205 Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr Ser Pro Ile Tyr Gly 210 215 220 Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe Asn Gly Pro 225 230 235 240 Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu Gln Gln Pro 245 250 255 Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Glu Gly Val Glu Phe 260 265 270 Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly Thr Val Asp 275 280 285 Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro Pro Arg Glu 290 295 300 Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln Arg Ser Gly 305 310 315 320 Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr His Arg Ser 325 330 335 Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro 340 345 350 Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly 355 360 365 Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp 370 375 380 Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr 385 390 395 400 Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val 405 410 415 Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn 420 425 430 Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg 435 440 445 Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn 450 455 460 Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser 465 470 475 480 Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala 485 490 495 Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu Arg 500 505 <210> 34 <211> 1524 <212> DNA <213> Artificial Sequence <220> <223> DIG-113 maize-optimized coding region <400> 34 atgggcaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 60 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 120 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 180 cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 240 gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 300 tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 360 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 420 ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 480 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 540 ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 600 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 660 cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 720 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 780 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 840 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 900 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 960 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1020 aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1080 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1140 acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1200 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1260 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1320 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1380 ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1440 atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctc 1500 gaggctgaat cggatcttga aagg 1524 <210> 35 <211> 582 <212> PRT <213> Artificial Sequence <220> <223> DIG-114 truncated protein <400> 35 Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15 Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly 20 25 30 Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser 35 40 45 Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val 50 55 60 Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80 Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala 85 90 95 Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu 100 105 110 Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr 115 120 125 Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp 130 135 140 Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val 145 150 155 160 Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val 165 170 175 Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn 180 185 190 Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala 195 200 205 Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln 210 215 220 Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val 225 230 235 240 Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro 245 250 255 Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu 260 265 270 Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe 275 280 285 Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile 290 295 300 Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly 325 330 335 Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro 340 345 350 Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro 355 360 365 Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu 370 375 380 Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr 385 390 395 400 Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu 405 410 415 Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His 420 425 430 Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val 435 440 445 Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp 450 455 460 Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp 465 470 475 480 Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile 485 490 495 Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile 500 505 510 Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser 515 520 525 Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly 530 535 540 Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu 545 550 555 560 Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser 565 570 575 Asn Pro Phe Ser Phe Arg 580 <210> 36 <211> 1746 <212> DNA <213> Artificial Sequence <220> <223> DIG-114 maize-optimized coding region <400> 36 atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60 gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120 tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180 atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240 gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300 gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360 cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420 ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480 tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540 cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600 gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660 tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720 ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780 ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840 tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900 ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960 ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020 cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080 gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140 ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200 tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260 cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320 acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380 aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440 ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500 acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560 cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620 gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680 atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740 ttcaga 1746

Claims

상응하는 야생형 Cry1Ca의 N-말단 α-나선 1, 2A, 2B 또는 그의 조합의 전부 또는 일부가 결실된, 살곤충 활성을 갖는, 서열 3 및 서열 5로 이루어진 군으로부터 선택된 서열에 대하여 99% 이상 동일한 Cry1Ca 변이체 단백질.
제1항에 있어서, 결실에 의해 도메인 I에서 전부의 α-나선 1 및 전부 또는 일부의 α-나선 2가 제거되고, α-나선 3 내지 7을 포함하는 변이체 단백질.
제1항에 있어서, 상기 결실에 의해 살곤충 단백질 DIG-109의 살곤충 활성이 향상되며, 상기 결실은 α-나선 2A 시작 전에 착수되고 α-나선 2B 말단 이후에 종결되지만 α-나선 3 내로는 연장되지 않는 변이체 단백질.
제1항에 있어서, 상기 결실에 의해 살곤충 단백질 DIG-152의 살곤충 활성이 향상되며, 상기 결실은 α-나선 2A 시작 전에 착수되고 α-나선 2B 말단 이후에 종결되지만 α-나선 3 내로는 연장되지 않는 변이체 단백질.
제1항에 있어서, N-말단 결실이 적어도 하나의 불안정화 아미노산에서 시작되고, 변이체 단백질은 번역 개시 메티오닌과 불안정화 아미노산 사이의 글리신 아미노산을 특정하는 부가된 코돈을 포함하는 변이체 단백질.
제1항에 있어서, C-말단 전독소 (protoxin) 서열이 결여된 변이체 단백질.
제1항에 있어서, 야생형 Cry1Ca 단백질에 비해 곤충에 대하여 향상된 활성을 갖는 단백질.
제7항에 있어서, 상기 곤충이 밤나방 및 사탕수수 명나방으로 이루어진 군으로부터 선택된 단백질.
제1항에 있어서, 서열 3에 대하여 99% 이상 동일한 단백질.
제1항에 있어서, 서열 5에 대하여 99% 이상 동일한 단백질.
제9항에 있어서, 서열 3을 포함하는 단백질.
제9항에 있어서, 서열 5를 포함하는 단백질.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제