KR20120076346A

KR20120076346A - 실크 도프의 제조 방법

Info

Publication number: KR20120076346A
Application number: KR1020127007759A
Authority: KR
Inventors: 타라 디 서덜랜드; 빅토리아 에스 해리토스; 알라가콘 스리스칸타; 사라 와이즈먼; 마이클 조지 허슨; 제프리 스콧 처치
Original assignee: 커먼웰쓰 사이언티픽 앤드 인더스트리얼 리서치 오가니제이션
Priority date: 2009-08-26
Filing date: 2010-08-25
Publication date: 2012-07-09
Also published as: IL218300A; WO2011022771A1; BR112012004268A2; SG178870A1; EP2475677A1; IL218300A0; BR112012004268B1; CA2771915C; EA201270304A1; CN102812036B; CA2771915A1; KR20170054542A; JP5980679B2; CL2012000500A1; US20120302734A1; ZA201202163B; AU2010286333B2; EP2475677A4; KR101932771B1; EP2475677B1

Abstract

본 발명은 꿀벌 실크 단백질과 같은 코일드 코일(coiled-coil) 구조를 갖는 실크 단백질을 포함하는 실크 도프의 제조 방법에 관한 것이다. 상기 실크 단백질은 실크 단백질을 계면활성제 또는 이온성 액체와 접촉시켜 상기 단백질을 가용화시키고 상기 단백질을 농축시켜 실크 도프를 생성함으로써 상기 실크 단백질을 생성하는 세포로부터 얻는다. 상기 단백질은 다양한 목적을 위해, 예를 들면, 개인 관리 제품, 플라스틱, 직물 및 생물의약 제품의 제조에 사용될 수 있다.

Description

실크 도프의 제조 방법{PROCESSES FOR PRODUCING SILK DOPE}

본 발명은 꿀벌 실크 단백질과 같은 코일드 코일(coiled-coil) 구조를 갖는 실크 단백질을 포함하는 실크 도프(dope)의 제조 방법에 관한 것이다. 실크 도프는 다양한 목적을 위해, 예컨대, 개인 관리 제품, 플라스틱, 직물 및 생물의약 제품의 제조에 사용될 수 있다.

실크는 넓은 범위의 곤충 및 거미 종에 의해 생성되는 단백질 섬유이다. 사육되는 누에인 누에나방(Bombyx mon)의 실크는 수세기 동안 봉합 생체물질로서 사용되어 왔다. 형질전환 시스템에서 누에 또는 거미 실크를 클로닝하고 발현하고자 하는 다수의 노력은 이것이 매우 어려운 과제임을 발견하였다. 이들 실크 유전자들의 큰 크기 및 고도로 반복적인 서열들은 상기 유전자들이 전문화된 실크선(silk gland) 외부에서 발현되기 어렵게 하고 낮은 단백질 수율을 초래한다.

누에고치 및 거미집이 가장 우수한 공지된 실크이지만, 다른 종들이 형질전환 제조에 더 적합한 실크를 제조할 수 있다. 꿀벌 유충들(아피스 멜리페라(Apis mellifera))은 실크 누에를 짓고, 이 실크 누에에서 이들은 번데기가 된다. 꿀벌 실크는 4종의 작고(각각 약 30kDa) 비반복적인 섬유 유전자들에 의해 코딩된다(Sutherland et al., 2006). 4종의 유전자들의 상동성 세트 또한 땅벌, 불독개미, 베짜기 개미, 호박벌 및 아시아 꿀벌에서 발견되었다(Sutherland et al., 2007; Sezutsu et al., 2007; Shi et al., 2008; 국제 특허공보 제WO 2007/038837호).

고전적인 x-선 섬유 회절 작업은 꿀벌 실크가 4종의 상이한 실크 단백질에 상응할 것 같은 4개의 스트랜드를 갖는 코일드 코일 구조, 가장 가능하게는 사량체 코일드 코일 구조(Atkins, 1967)로 조립된 α-나선형 단백질을 함유함을 입증하였다. 생물정보학 기법은 각각의 꿀벌 실크 단백질 서열이 60% 내지 68% 코일드 코일을 함유한다고 예측한다(Sutherland et al., 2006).

실크 실은 꿀벌 유충의 실크선으로부터 손에 의해 연신될 수 있다. 이 실은 덜 강하지만 더 연장가능하고 누에 실크 섬유보다 더 질기다(Hepburn et al., 1979).

쉬(Shi) 등(2008)은 아시아 꿀벌 실크(아피스 세라나(Apis cerana))의 재조합 제조를 최근에 보고하였다. 4종의 아피스 세라나 실크 단백질들이 발효액 1 ℓ당 10 mg 내지 60 mg의 수율로 에스케리치아 콜라이(Escherichia coli)에서 가용성 형태로 발현되었다. 저농도(0.03 중량% 내지 0.2 중량%)에서 단백질의 구조 및 상호작용을 특징규명하기 위해 다양한 실험 기법들이 이용되었다. 이들은 결론적으로 개개의 단백질 및 4종의 단백질의 혼합물 중 어느 것도 용액 중에서 단단한 삼차 팩킹을 갖지 않음을 입증하였다. 상기 단백질들은 단량체로서 존재하거나 느슨하게 결합된 이량체로서 존재하였고 α-나선형 구조를 거의 갖지 않는 랜덤-코일(random-coil) 구조를 우세하게 가졌다.

매우 다양한 제품의 제조를 위해 사용될 수 있는 재조합적으로 발현된 코일드 코일 실크 단백질로부터 실크 도프를 제조하는 추가 방법이 필요하다.

본 발명자들은 놀랍게도 계면활성제 및 이온성 액체가 코일드 코일 실크 단백질을 포함하는 실크 도프를 제조하는 공정에서 사용될 수 있음을 발견하였다.

제1 양태에서, 본 발명은

i) 하나 이상의 실크 단백질을 생성하는 세포를 용해시키는 단계,

ii) 실크 단백질을 계면활성제 또는 이온성 액체와 접촉시켜 실크 단백질을 가용화시키는 단계, 및

iii) 실크 단백질을 농축시켜 실크 도프를 생성하는 단계

를 포함하는 실크 단백질의 제조 방법으로서, 상기 하나 이상의 실크 단백질이 코일드 코일 구조를 포함하는 삼차 구조를 형성할 수 있는 것인 제조 방법을 제공한다.

한 실시양태에서, 상기 실크 단백질을

a) 계면활성제를 침전시키는 화합물을 첨가함으로써 용액 중 계면활성제의 양을 감소시키는 단계, 및

b) 단계 a)에서 형성된 침전물로부터 실크 단백질을 포함하는 용액을 분리하여 실크 도프를 생성하는 단계

에 의해 농축시킨다.

게면활성제를 침전시키는 데 사용될 수 있는 화합물은 당업계에 공지되어 있고 염 또는 탄수화물, 또는 이들의 2종 이상의 조합을 포함한다. 바람직하게는, 염은 칼륨 염 또는 나트륨 염이다. 한 실시양태에서, 탄수화물은 α-시클로덱스트린이다.

한 실시양태에서, 실크 단백질을 여과, 더욱 바람직하게는 막 여과, 훨씬 더욱 바람직하게는 접선 유동 여과에 의해 농축시킨다.

한 실시양태에서, 본 방법은 실크 도프 중 실크 단백질의 농도를 증가시키는 단계를 추가로 포함한다. 이것은 당업계에 공지된 임의의 방법에 의해 달성될 수 있다. 예를 들면, 실크 도프를 탈수(dehydrating) 용액, 예컨대, 흡습성 중합체를 포함하는 용액에 대해 투석시킨다. 흡습성 중합체의 예에는 폴리에틸렌 글리콜, 아밀라제(amylase) 및 세리신(sericin)뿐만 아니라 이들의 2종 이상의 조합도 포함하나, 이들로 한정되지 않는다.

바람직한 실시양태에서, 실크 도프는 약 0.5 중량/부피% 이상의 실크 단백질을 포함한다. 추가 실시양태에서, 실크 도프는 약 0.5% 내지 약 15%의 실크 단백질을 포함한다.

세포는 임의의 종류의 세포, 전형적으로 실크 단백질(들)을 코딩하고 생성할 수 있는 외인성(exogenous) 폴리뉴클레오티드를 포함하는 재조합 세포일 수 있다. 예에는 박테리아 세포, 효모 세포, 곤충 세포, 식물 세포 또는 동물 세포, 또는 이들의 2종 이상의 조합이 포함되나, 이들로 한정되지 않는다. 바람직한 실시양태에서, 세포는 박테리아 세포이다. 특히 바람직한 실시양태에서, 박테리아 세포는 에스케리치아 콜라이이다.

바람직한 실시양태에서, 단계 i)는 용해된 세포로부터 봉입체(inclusion body)를 단리하는 것을 추가로 포함한다.

본 방법은 단계 i) 전에 세포를 배양하는 단계를 포함할 수도 있다.

바람직한 실시양태에서, 코일드 코일 구조를 포함하는 삼차 구조를 형성할 수 있는 실크 단백질의 일부는 10개 카피 이상의 헵타드(heptad) 서열 abcdefg를 포함하고, 이때 위치 a 및 d의 아미노산의 25% 이상이 알라닌 잔기이다. 더욱 바람직하게는, 위치 a, d 및 e의 아미노산의 25% 이상이 알라닌 잔기이다.

추가의 바람직한 실시양태에서, 실크 단백질은

a) 서열 번호 1 내지 8, 17 내지 24, 33 내지 40, 49 내지 56, 65 내지 72, 81 내지 88, 97 또는 98 중 어느 하나에 제공된 아미노산 서열,

b) 서열 번호 1 내지 8, 17 내지 24, 33 내지 40, 49 내지 56, 65 내지 72, 81 내지 88, 97 또는 98 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및

c) a) 또는 b)의 생물학적 활성 단편

으로부터 선택되는 서열을 포함하고, 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 본질적으로 구성되고, 훨씬 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 구성된다.

상기 양태에서, 가능한 적은 실크 단백질이 세포로부터 분비되는 것이 바람직하다. 따라서, 실크 단백질이 N-말단 분비 서열을 포함하지 않는 것이 바람직하다. 상기 양태에 특히 유용한 실크 단백질의 예에는

a) 서열 번호 1, 3, 5, 7, 17, 19, 21, 23, 33, 35, 37, 39, 49, 51, 53, 55, 65, 67, 69, 71, 81, 83, 85, 87 또는 97 중 어느 하나에 제공된 아미노산 서열,

b) 서열 번호 1, 3, 5, 7, 17, 19, 21, 23, 33, 35, 37, 39, 49, 51, 53, 55, 65, 67, 69, 71, 81, 83, 85, 87 또는 97 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및

c) a) 또는 b)의 생물학적 활성 단편

으로부터 선택되는 서열을 포함하는, 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 구성된 실크 단백질이 포함되나, 이들로 한정되지 않는다.

한 실시양태에서, 실크 단백질은 복수의 동일한 실크 단백질 또는 2종 이상의 상이한 실크 단백질들의 조합일 수 있다. 바람직한 실시양태에서, 상이한 실크 단백질들이 사용되는 경우, 4종의 상이한 실크 단백질들이 존재한다.

추가 실시양태에서, 실크 단백질은

a) 서열 번호 1, 2, 17, 18, 33, 34, 49, 50, 65, 66, 81 또는 82 중 어느 하나에 제공된 아미노산 서열;

b) 서열 번호 1, 2, 17, 18, 33, 34, 49, 50, 65, 66, 81 또는 82 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및

c) a) 또는 b)의 생물학적 활성 단편

을 포함하는, 더욱 바람직하게는 상기 a) 내지 c)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 a) 내지 c)로 구성된 제1 실크 단백질,

d) 서열 번호 3, 4, 19, 20, 35, 36, 51, 52, 67, 68, 83 또는 84 중 어느 하나에 제공된 아미노산 서열;

e) 서열 번호 3, 4, 19, 20, 35, 36, 51, 52, 67, 68, 83 또는 84 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및

f) d) 또는 e)의 생물학적 활성 단편

을 포함하는, 더욱 바람직하게는 상기 d) 내지 f)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 d) 내지 f)로 구성된 제2 실크 단백질,

g) 서열 번호 5, 6, 21, 22, 37, 38, 53, 54, 69, 70, 85 또는 86 중 어느 하나에 제공된 아미노산 서열;

h) 서열 번호 5, 6, 21, 22, 37, 38, 53, 54, 69, 70, 85 또는 86 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및

i) g) 또는 h)의 생물학적 활성 단편

을 포함하는, 더욱 바람직하게는 상기 g) 내지 i)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 g) 내지 i)로 구성된 제3 실크 단백질, 및/또는

j) 서열 번호 7, 8, 23, 24, 39, 40, 55, 56, 71, 72, 87 또는 88 중 어느 하나에 제공된 아미노산 서열;

k) 서열 번호 7, 8, 23, 24, 39, 40, 55, 56, 71, 72, 87 또는 88 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및

l) j) 또는 k)의 생물학적 활성 단편

을 포함하는, 더욱 바람직하게는 상기 j) 내지 l)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 j) 내지 l)로 구성된 제4 실크 단백질

을 포함한다. 더욱 바람직하게는 상기 양태와 관련하여, 실크 단백질은

a) 서열 번호 1, 17, 33, 49, 65 또는 81 중 어느 하나에 제공된 아미노산 서열;

b) 서열 번호 1, 17, 33, 49, 65 또는 81 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및

c) a) 또는 b)의 생물학적 활성 단편

d) 서열 번호 3, 19, 35, 51, 67 또는 83 중 어느 하나에 제공된 아미노산 서열;

e) 서열 번호 3, 19, 35, 51, 67 또는 83 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및

f) d) 또는 e)의 생물학적 활성 단편

g) 서열 번호 5, 21, 37, 53, 69 또는 85 중 어느 하나에 제공된 아미노산 서열;

h) 서열 번호 5, 21, 37, 53, 69 또는 85 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및

i) g) 또는 h)의 생물학적 활성 단편

j) 서열 번호 7, 23, 39, 55, 71 또는 87 중 어느 하나에 제공된 아미노산 서열;

k) 서열 번호 7, 23, 39, 55, 71 또는 87 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및

l) j) 또는 k)의 생물학적 활성 단편

을 포함하거나 이 실크 단백질들로 본질적으로 구성된다.

한 실시양태에서, 제1 실크 단백질, 제2 실크 단백질, 제3 실크 단백질 및/또는 제4 실크 단백질은 동일한 세포에 의해 생성된다.

대안적 실시양태에서, 제1 실크 단백질, 제2 실크 단백질, 제3 실크 단백질 및/또는 제4 실크 단백질은 상이한 세포에 의해 생성된다. 이 실시양태에서, 단계 ii)는 대략 등몰량의 제1 실크 단백질, 제2 실크 단백질, 제3 실크 단백질 및 제4 실크 단백질을 포함하는 것이 바람직하다.

단계 iii)을 제외하고 상기 단계에 이르는 임의의 시점에서, 본 발명에 따라 가공되는 실크 단백질들은 독립적으로 제조되어 조합될 수 있다. 개별적으로 제조된 실크 단백질들은 동일하거나 상이할 수 있다. 예를 들면, 본 명세서에서 정의된 제1 실크 단백질은 제1 세포에서 발현되고 단계 i) 및 ii)에서 정의된 바와 같이 가공되고, 본 명세서에서 정의된 제2 실크 단백질은 제2 세포에서 발현되고 단계 i) 및 ii)에서 정의된 바와 같이 가공된 후, 단계 iii) 전에 2종의 용액의 조합이 수행된다.

계면활성제 및 이온성 액체는 후기 단계 동안에 코일드 코일 구조가 형성될 수 있게 하면서 침전된 단백질을 가용화시키고 실크 단백질이 용액 중에 머물러 있게 할 수 있다.

바람직한 실시양태에서, 계면활성제는 음이온성 계면활성제이다. 본 발명에 유용한 음이온성 계면활성제의 예에는 나트륨 도데실 설페이트(SDS), 암모늄 라우릴 설페이트 및 다른 알킬 설페이트 염, 나트륨 1-옥탄설포네이트 일수화물, 나트륨 라우로일 사르코시네이트, 나트륨 라우릴 에테르 설페이트(SLES), 나트륨 타우로데옥시콜레이트 수화물 및 알킬 벤젠 설포네이트; 및 이들의 2종 이상의 조합이 포함되나, 이들로 한정되지 않는다. 바람직한 실시양태에서, 음이온성 계면활성제는 SDS이다.

한 실시양태에서, 이온성 액체는

i) 클로라이드, 브로마이드, 요오다이드, 티오시아네이트, 아세테이트, C₁-C₄-알킬설페이트, 메탄설포네이트, 토실레이트, C₁-C₄-디알킬포스페이트, 하이드로젠설페이트 및 테트라클로로알루미네이트로부터 선택되는 음이온, 및

ii) 1,3-C₁-C₄-디알킬이미다졸륨, 3-클로로피리디늄, 4-디메틸아미노피리디늄, 2-에틸-4-아미노피리디늄, 2-메틸피리디늄, 2-에틸피리디늄, 2-에틸-6-메틸피리디늄, 퀴놀리늄, 이소퀴놀리늄, 피리디늄, 1-C₁-C₄-알킬이미다졸륨, 1-메틸이미다졸륨, 1,2-디메틸이미다졸륨, 1-n-부틸-이미다졸륨, 1,4,5-트리메틸이미다졸륨, 1,4-디메틸이미다졸륨, 이미다졸륨, 2-메틸이미다졸륨, 1-부틸-2-메틸이미다졸륨, 4-메틸이미다졸륨, 1-(2'-아미노에틸)이미다졸륨, 1-비닐이미다졸륨, 2-에틸이미다졸륨 및 벤조트리아졸륨으로부터 선택되는 양이온

을 포함한다.

추가의 바람직한 실시양태에서, 본 방법은 배양된 세포 1 ℓ당 약 0.1 g 이상, 더욱 바람직하게는 약 1 g 이상, 더욱 바람직하게는 약 1.5 g 이상, 더욱 바람직하게는 약 2 g 이상, 훨씬 더욱 바람직하게는 약 2.5 g 이상의 실크 단백질을 생성한다.

또 다른 양태에서, 본 발명은

i) 하나 이상의 실크 단백질을 생성하는 세포 배양물 또는 무세포 발현 시스템으로부터 상청액을 얻는 단계,

iii) 실크 단백질을 농축시켜 실크 도프를 생성하는 단계

를 포함하는 실크 도프의 제조 방법으로서, 상기 하나 이상의 실크 단백질은 코일드 코일 구조를 포함하는 삼차 구조를 형성할 수 있는 것인 제조 방법을 제공한다.

이 양태에서, 세포 내의 실크 단백질을 사용하여 실크 도프를 생성하는 대신에, 세포로부터 분비된 실크 단백질을 사용한다. 당업자가 인식할 수 있는 바와 같이, 제1 양태의 단계 i) 및 상기 양태의 단계 i)는 동시에 또는 순차적으로 수행될 수 있다. 나아가, 임의의 상응하는 단계에서 세포 및 상청액으로부터 유래된 실크 단백질들이 조합되어 함께 가공될 수 있다. 예를 들면, 제1 양태의 단계 ii) 및 상기 양태의 단계 ii)는 개별적으로 수행될 수 있고 실크 단백질들은 단계 iii) 및 iv)를 포함하는 추가 가공을 위해 조합될 수 있다.

상기 양태의 특히 바람직한 실시양태에서, 단계 i)는 상청액으로부터의 실크 단백질의 농도를 증가시키는 것을 추가로 포함한다. 이것은 당업계에 공지된 임의의 방법에 의해, 예를 들면, 실크 단백질을 침전시키는 물질, 예컨대, 황산암모늄, 트리클로로아세트산, 과염소산 및 아세톤(그러나, 이들로 한정되지 않음)을 상청액과 접촉시킴에 의해 달성될 수 있다.

상기 양태와 관련하여, 가능한 많은 실크 단백질이 세포로부터 분비되는 것이 바람직하다. 따라서, 실크 단백질은 N-말단 신호 서열을 포함하는 것이 바람직하다. 상기 양태에 특히 유용한 실크 단백질의 예에는

a) 서열 번호 2, 4, 6, 8, 18, 20, 22, 24, 34, 36, 38, 40, 50, 52, 54, 56, 66, 68, 70, 72, 82, 84, 86, 88 또는 98 중 어느 하나에 제공된 아미노산 서열,

b) 서열 번호 2, 4, 6, 8, 18, 20, 22, 24, 34, 36, 38, 40, 50, 52, 54, 56, 66, 68, 70, 72, 82, 84, 86, 88 또는 98 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및

c) a) 또는 b)의 생물학적 활성 단편

으로부터 선택되는 서열을 포함하는, 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 구성된 실크 단백질을 포함하나, 이들로 한정되지 않는다.

추가 실시양태에서, 실크 단백질은

a) 서열 번호 2, 18, 34, 50, 66 또는 82 중 어느 하나에 제공된 아미노산 서열;

b) 서열 번호 2, 18, 34, 50, 66 또는 82 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및

c) a) 또는 b)의 생물학적 활성 단편

d) 서열 번호 4, 20, 36, 52, 68 또는 84 중 어느 하나에 제공된 아미노산 서열;

e) 서열 번호 4, 20, 36, 52, 68 또는 84 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및

f) d) 또는 e)의 생물학적 활성 단편

g) 서열 번호 6, 22, 38, 54, 70 또는 86 중 어느 하나에 제공된 아미노산 서열;

h) 서열 번호 6, 22, 38, 54, 70 또는 86 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및

i) g) 또는 h)의 생물학적 활성 단편

j) 서열 번호 8, 24, 40, 56, 72 또는 88 중 어느 하나에 제공된 아미노산 서열;

k) 서열 번호 8, 24, 40, 56, 72 또는 88 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및

l) j) 또는 k)의 생물학적 활성 단편

을 포함한다.

추가 양태에서, 본 발명은 본 발명의 방법에 의해 제조된 실크 도프를 압출 및/또는 연신하는 단계를 포함하는, 실크 섬유의 제조 방법을 제공한다.

한 실시양태에서, 압출은 상기 실크 도프를 약 5 ㎛ 내지 약 500 ㎛ 모세관에 통과시키는 것을 포함한다.

특히 바람직한 실시양태에서, 상기 방법은

i) 하나 이상의 실크 단백질을 생성하는 세포를 용해시키고 상기 세포로부터 봉입체를 단리하는 단계,

ii) 상기 봉입체 내의 실크 단백질을 계면활성제 또는 이온성 액체와 접촉시켜 실크 단백질을 가용화시키는 단계,

iii) 실크 단백질을 농축시켜 실크 도프를 생성하는 단계,

iv) 실크 도프 중 실크 단백질의 농도를 약 2 중량% 내지 약 10 중량% 실크 단백질, 더욱 바람직하게는 약 3 중량% 내지 약 6 중량% 실크 단백질로 증가시키는 단계, 및

vi) 탈수 용액 중 실크 도프를 압출하는 단계

를 포함한다.

상기 실시양태와 관련하여, 탈수 용액은 바람직하게는 알코올, 예컨대, 메탄올 또는 에탄올, 또는 고농도의 염, 예컨대, MgCl₂ 또는 NaCl을 포함한다. 이러한 조건 하에 실크 섬유를 압출하는 것은 습식 방적으로서 당업계에 일반적으로 공지되어 있다.

바람직하게는, 알코올은 메탄올이고, 용액 중 메탄올의 농도는 약 40 부피/부피% 내지 약 80 부피/부피%, 더욱 바람직하게는 약 50 부피/부피% 내지 약 70 부피/부피%이다. 본 실시양태에서, 실크 도프는 본 명세서에서 정의된 단일 종류의 실크 폴리펩티드, 또는 2종 이상의 상이한, 예컨대, 4종의 상이한 실크 폴리펩티드를 포함할 수 있다.

또 다른 양태에서, 본 발명은 본 발명의 방법에 의해 제조된 실크 도프를 캐스트 성형(casting)하는 단계를 포함하는 실크 필름의 제조 방법을 제공한다.

또 다른 양태에서, 본 발명은 본 발명의 방법에 의해 제조된 실크 도프를 제공한다.

추가 양태에서, 본 발명은 본 발명의 방법에 의해 제조된 실크 섬유를 제공한다.

또한, 본 발명의 방법에 의해 제조된 실크 필름이 제공된다.

또 다른 양태에서, 본 발명은 본 발명의 실크 섬유 및/또는 실크 필름을 포함하는 제품을 제공한다.

자명할 바와 같이, 본 발명의 한 양태의 바람직한 특징 및 특성은 본 발명의 많은 다른 양태에 적용될 수 있다.

본 명세서 전체에서 용어 "포함한다", 또는 이의 변형 용어, 예컨대, "포함하는"은 기재된 요소, 정수 또는 단계, 또는 요소들, 정수들 또는 단계들의 군을 포함하는 것을 의미하는 것으로 이해될 것이나, 임의의 다른 요소, 정수 또는 단계, 또는 요소들, 정수들 또는 단계들의 군을 배제하지 않는다.

이하, 본 발명을 첨부된 도면을 참조하면서 하기 비제한적 실시예에 의해 설명할 것이다.

도 1: SDS에서 가용화된 정제된 봉입체의 SDS-PAGE. 레인들은 재조합 단백질 AmelFl-4에 상응하고; 크기는 kDa의 단백질 중량이다.
도 2: 천연 꿀벌 실크(A) 및 재조합 꿀벌 실크(B)의 적외선 스펙트럼의 아미드 I 및 II 영역의 푸리에 자가 탈회전(deconvolution). 밴드를 구조로 배정하는 것은 표 2에서 발견된다.
도 3: (A) 공기 중에서 연신된 재조합 꿀벌 실크 섬유, 및 공기 중에서 연신된 후 메탄올 중에서 다시 한번 연신된 재조합 꿀벌 실크 섬유의 교차-편광 현미경.
도 4: (A) 메탄올 배쓰(bath) 내로 압출된 재조합 꿀벌 실크 섬유, 및 (B) 공기 중에서 건조된 후 메탄올 배쓰 내에서 2배 길이로 다시 한번 연신된 재조합 꿀벌 실크 섬유 또는 (C) 공기 중에서 건조된 후 메탄올 배쓰 내에서 4배 길이로 다시 한번 연신된 재조합 꿀벌 실크 섬유의 교차-편광 현미경.

서열목록에 대한 설명

서열 번호 1 - 본 명세서에서 제노스피랄(Xenospiral)로 지칭되는 꿀벌 실크 단백질(본 명세서에서 AmelFl로도 지칭됨)(신호 펩티드 부재).

서열 번호 2 - 본 명세서에서 제노스피랄로 지칭되는 꿀벌 실크 단백질.

서열 번호 3 - 본 명세서에서 제노스피라2(Xenospira2)로 지칭되는 꿀벌 실크 단백질(본 명세서에서 AmelF2로도 지칭됨)(신호 펩티드 부재).

서열 번호 4 - 본 명세서에서 제노스피라2로 지칭되는 꿀벌 실크 단백질.

서열 번호 5 - 본 명세서에서 제노스피라3으로 지칭되는 꿀벌 실크 단백질(본 명세서에서 AmelF3으로도 지칭됨)(신호 펩티드 부재).

서열 번호 6 - 본 명세서에서 제노스피라3으로 지칭되는 꿀벌 실크 단백질.

서열 번호 7 - 본 명세서에서 제노스피라4로 지칭되는 꿀벌 실크 단백질(본 명세서에서 AmelF4로도 지칭됨)(신호 펩티드 부재).

서열 번호 8 - 본 명세서에서 제노스피라4로 지칭되는 꿀벌 실크 단백질.

서열 번호 9 - 꿀벌 실크 단백질 제노스피랄을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 10 - 꿀벌 실크 단백질 제노스피랄을 코딩하는 뉴클레오티드 서열.

서열 번호 11 - 꿀벌 실크 단백질 제노스피라2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 12 - 꿀벌 실크 단백질 제노스피라2를 코딩하는 뉴클레오티드 서열.

서열 번호 13 - 꿀벌 실크 단백질 제노스피라3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 14 - 꿀벌 실크 단백질 제노스피라3을 코딩하는 뉴클레오티드 서열.

서열 번호 15 - 꿀벌 실크 단백질 제노스피라4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 16 - 꿀벌 실크 단백질 제노스피라4를 코딩하는 뉴클레오티드 서열.

서열 번호 17 - 본 명세서에서 BBF1로 지칭되는 땅벌 실크 단백질(신호 펩티드 부재).

서열 번호 18 - 본 명세서에서 BBF1로 지칭되는 땅벌 실크 단백질.

서열 번호 19 - 본 명세서에서 BBF2로 지칭되는 땅벌 실크 단백질(신호 펩티드 부재).

서열 번호 20 - 본 명세서에서 BBF2로 지칭되는 땅벌 실크 단백질.

서열 번호 21 - 본 명세서에서 BBF3으로 지칭되는 땅벌 실크 단백질(신호 펩티드 부재).

서열 번호 22 - 본 명세서에서 BBF3으로 지칭되는 땅벌 실크 단백질.

서열 번호 23 - 본 명세서에서 BBF4로 지칭되는 땅벌 실크 단백질(신호 펩티드 부재).

서열 번호 24 - 본 명세서에서 BBF4로 지칭되는 땅벌 실크 단백질.

서열 번호 25 - 땅벌 실크 단백질 BBF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 26 - 땅벌 실크 단백질 BBF1을 코딩하는 뉴클레오티드 서열.

서열 번호 27 - 땅벌 실크 단백질 BBF2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 28 - 땅벌 실크 단백질 BBF2를 코딩하는 뉴클레오티드 서열.

서열 번호 29 - 땅벌 실크 단백질 BBF3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 30 - 땅벌 실크 단백질 BBF3을 코딩하는 뉴클레오티드 서열.

서열 번호 31 - 땅벌 실크 단백질 BBF4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 32 - 땅벌 실크 단백질 BBF4를 코딩하는 뉴클레오티드 서열.

서열 번호 33 - 본 명세서에서 BAF1로 지칭되는 불독개미 실크 단백질(신호 펩티드 부재).

서열 번호 34 - 본 명세서에서 BAF1로 지칭되는 불독개미 실크 단백질.

서열 번호 35 - 본 명세서에서 BAF2로 지칭되는 불독개미 실크 단백질(신호 펩티드 부재).

서열 번호 36 - 본 명세서에서 BAF2로 지칭되는 불독개미 실크 단백질.

서열 번호 37 - 본 명세서에서 BAF3으로 지칭되는 불독개미 실크 단백질(신호 펩티드 부재).

서열 번호 38 - 본 명세서에서 BAF3으로 지칭되는 불독개미 실크 단백질.

서열 번호 39 - 본 명세서에서 BAF4로 지칭되는 불독개미 실크 단백질(신호 펩티드 부재).

서열 번호 40 - 본 명세서에서 BAF4로 지칭되는 불독개미 실크 단백질.

서열 번호 41 - 불독개미 실크 단백질 BAF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 42 - 불독개미 실크 단백질 BAF1을 코딩하는 뉴클레오티드 서열.

서열 번호 43 - 불독개미 실크 단백질 BAF2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 44 - 불독개미 실크 단백질 BAF2를 코딩하는 뉴클레오티드 서열.

서열 번호 45 - 불독개미 실크 단백질 BAF3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 46 - 불독개미 실크 단백질 BAF3을 코딩하는 뉴클레오티드 서열.

서열 번호 47 - 불독개미 실크 단백질 BAF4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 48 - 불독개미 실크 단백질 BAF4를 코딩하는 뉴클레오티드 서열.

서열 번호 49 - 본 명세서에서 GAF1로 지칭되는 베짜기 개미 실크 단백질(신호 펩티드 부재).

서열 번호 50 - 본 명세서에서 GAF1로 지칭되는 베짜기 개미 실크 단백질.

서열 번호 51 - 본 명세서에서 GAF2로 지칭되는 베짜기 개미 실크 단백질(신호 펩티드 부재).

서열 번호 52 - 본 명세서에서 GAF2로 지칭되는 베짜기 개미 실크 단백질.

서열 번호 53 - 본 명세서에서 GAF3으로 지칭되는 베짜기 개미 실크 단백질(신호 펩티드 부재).

서열 번호 54 - 본 명세서에서 GAF3으로 지칭되는 베짜기 개미 실크 단백질.

서열 번호 55 - 본 명세서에서 GAF4로 지칭되는 베짜기 개미 실크 단백질(신호 펩티드 부재).

서열 번호 56 - 본 명세서에서 GAF4로 지칭되는 베짜기 개미 실크 단백질.

서열 번호 57 - 베짜기 개미 실크 단백질 GAF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 58 - 베짜기 개미 실크 단백질 GAF1을 코딩하는 뉴클레오티드 서열.

서열 번호 59 - 베짜기 개미 실크 단백질 GAF2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 60 - 베짜기 개미 실크 단백질 GAF2를 코딩하는 뉴클레오티드 서열.

서열 번호 61 - 베짜기 개미 실크 단백질 GAF3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 62 - 베짜기 개미 실크 단백질 GAF3을 코딩하는 뉴클레오티드 서열.

서열 번호 63 - 베짜기 개미 실크 단백질 GAF4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 64 - 베짜기 개미 실크 단백질 GAF4를 코딩하는 뉴클레오티드 서열,

서열 번호 65 - 본 명세서에서 Vssilk3으로 지칭되는 호박벌 실크 단백질(신호 펩티드 부재).

서열 번호 66 - 본 명세서에서 Vssilk3으로 지칭되는 호박벌 실크 단백질.

서열 번호 67 - 본 명세서에서 Vssilk4로 지칭되는 호박벌 실크 단백질(신호 펩티드 부재).

서열 번호 68 - 본 명세서에서 Vssilk4로 지칭되는 호박벌 실크 단백질.

서열 번호 69 - 본 명세서에서 Vssilk2로 지칭되는 호박벌 실크 단백질(신호 펩티드 부재).

서열 번호 70 - 본 명세서에서 Vssilk2로 지칭되는 호박벌 실크 단백질.

서열 번호 71 - 본 명세서에서 Vssilk1로 지칭되는 호박벌 실크 단백질(신호 펩티드 부재).

서열 번호 72 - 본 명세서에서 Vssilk1로 지칭되는 호박벌 실크 단백질.

서열 번호 73 - 호박벌 실크 단백질 Vssilk3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 74 - 호박벌 실크 단백질 Vssilk3을 코딩하는 뉴클레오티드 서열.

서열 번호 75 - 호박벌 실크 단백질 Vssilk4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 76 - 호박벌 실크 단백질 Vssilk4를 코딩하는 뉴클레오티드 서열.

서열 번호 77 - 호박벌 실크 단백질 Vssilk2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 78 - 호박벌 실크 단백질 Vssilk2를 코딩하는 뉴클레오티드 서열.

서열 번호 79 - 호박벌 실크 단백질 Vssilk1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 80 - 호박벌 실크 단백질 Vssilk1을 코딩하는 뉴클레오티드 서열.

서열 번호 81 - 실크 단백질 1로 지칭되는 아시아 꿀벌 실크 단백질(ABS1로도 지칭됨)(신호 펩티드 부재).

서열 번호 82 - 실크 단백질 1로 지칭되는 아시아 꿀벌 실크 단백질(ABS1로도 지칭됨).

서열 번호 83 - 실크 단백질 2로 지칭되는 아시아 꿀벌 실크 단백질(ABS2로도 지칭됨)(신호 펩티드 부재).

서열 번호 84 - 실크 단백질 2로 지칭되는 아시아 꿀벌 실크 단백질(ABS2로도 지칭됨).

서열 번호 85 - 실크 단백질 3으로 지칭되는 아시아 꿀벌 실크 단백질(ABS3으로도 지칭됨)(신호 펩티드 부재).

서열 번호 86 - 실크 단백질 3으로 지칭되는 아시아 꿀벌 실크 단백질(ABS3으로도 지칭됨).

서열 번호 87 - 실크 단백질 4로 지칭되는 아시아 꿀벌 실크 단백질(ABS4로도 지칭됨)(신호 펩티드 부재).

서열 번호 88 - 실크 단백질 4로 지칭되는 아시아 꿀벌 실크 단백질(ABS4로도 지칭됨).

서열 번호 89 - 아시아 꿀벌 실크 단백질 ABS1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 90 - 아시아 꿀벌 실크 단백질 ABS1을 코딩하는 뉴클레오티드 서열.

서열 번호 91 - 아시아 꿀벌 실크 단백질 ABS2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 92 - 아시아 꿀벌 실크 단백질 ABS2를 코딩하는 뉴클레오티드 서열.

서열 번호 93 - 아시아 꿀벌 실크 단백질 ABS3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 94 - 아시아 꿀벌 실크 단백질 ABS3을 코딩하는 뉴클레오티드 서열.

서열 번호 95 - 아시아 꿀벌 실크 단백질 ABS4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 96 - 아시아 꿀벌 실크 단백질 ABS4를 코딩하는 뉴클레오티드 서열.

서열 번호 97 - 본 명세서에서 MalF1로 지칭되는 풀잠자리 실크 단백질(신호 펩티드 부재).

서열 번호 98 - 본 명세서에서 MalF1로 지칭되는 풀잠자리 실크 단백질.

서열 번호 99 - 풀잠자리 실크 단백질 MalF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).

서열 번호 100 - 풀잠자리 실크 단백질 MalF1을 코딩하는 뉴클레오티드 서열.

서열 번호 101 내지 108 - 올리고뉴클레오티드 프라이머.

발명의 상세한 설명

일반적인 기법 및 정의

달리 구체적으로 정의되지 않은 한, 본 명세서에서 사용된 모든 기술적 용어 및 과학적 용어는 당업계(예를 들면, 세포 배양, 분자 유전학, 실크 가공, 면역학, 면역조직화학, 단백질 화학 및 생화학)에서 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는 것으로 인식될 것이다.

달리 명시되지 않은 한, 본 발명에서 사용된 재조합 단백질, 세포 배양 및 면역학적 기법은 당업자에게 잘 공지된 표준 절차이다. 이러한 기법들은 문헌, 예컨대, 문헌[J. Perbal, A Practical Guide to Molecular Cloning, John Wiley and Sons (1984), J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbour Laboratory Press (1989), T. A. Brown (editor), Essential Molecular Biology: A Practical Approach, Volumes 1 and 2, IRL Press (1991), D. M. Glover and B. D. Hames (editors), DNA Cloning: A Practical Approach, Volumes 1-4, IRL Press (1995 and 1996), and F, M, Ausubel et al, (editors), Current Protocols in Molecular Biology, Greene Pub, Associates and Wiley-Interscience (1988, including all updates until present), Ed Harlow and David Lane (editors) Antibodies: A Laboratory Manual, Cold Spring Harbour Laboratory, (1988), and J. E. Coligan et al. (editors) Current Protocols in Immunology, John Wiley & Sons (현재까지 모든 업데이트를 포함함)] 전체에 기재되어 있고 설명되어 있다.

용어 "및/또는", 예를 들면, "X 및/또는 Y"는 "X 및 Y" 또는 "X 또는 Y"를 의미하는 것으로 이해될 것이고 상기 의미 둘 다에 대한 또는 상기 의미 각각에 대한 명확한 지지를 제공하는 것으로 인식될 것이다.

본 명세서에서 사용된 바와 같이, 용어 "실크 단백질" 및 "실크 폴리펩티드"는 실크 섬유 및/또는 섬유성 단백질 복합체(complex)를 생성하는 데 사용될 수 있는 섬유성 단백질/폴리펩티드를 의미한다.

본 명세서에서 사용된 바와 같이, 용어 "1종 이상의 실크 단백질"은 가능하게는 2종 이상의 상이한 실크 단백질들, 예컨대, 본 명세서에서 정의된 바와 같은 제1 실크 단백질, 제2 실크 단백질 등을 사용하는 공정을 지칭한다. 따라서, 본 내용에서, 1종의 실크 단백질은 실크 도프를 생성하기에 충분한 동일한 실크 단백질 분자들의 집단을 의미한다.

본 명세서에서 사용된 바와 같이, 용어 "코일드 코일 구조를 포함하는 삼차 구조를 형성할 수 있는"은 적절한 조건 하에 상기 구조를 형성하는 단백질의 능력을 의미한다. 예를 들면, 단백질은 실크 섬유를 생성하도록 가공되는 경우 상기 구조를 형성한다. 나아가, 이 용어는 전체 단백질이 코일드 코일 구조를 형성할 수 있다는 것을 의미하는 것이 아니라, 단지 그의 일부가 상기 구조를 형성할 수 있다는 것을 의미한다. 한 실시양태에서, 실크 단백질의 약 45% 내지 약 90%, 더욱 바람직하게는 약 55% 내지 약 70%, 훨씬 더욱 바람직하게는 약 60% 내지 약 66%가 코일드 코일 구조를 포함하는 삼차 구조를 형성할 수 있다.

본 명세서에서 사용된 바와 같이, 용어 "실크 도프"는 실크 단백질을 포함하는 수용액을 의미한다. 바람직하게는, 실크 도프는 0.05 중량/부피% 이상, 더욱 바람직하게는 0.1 중량/부피% 이상, 훨씬 더욱 바람직하게는 0.5 중량/부피% 이상의 본 명세서에서 정의된 실크 단백질을 포함한다. 한 실시양태에서, 본 발명의 방법에 의해 제조된 실크 도프는 약 0.5 중량% 내지 약 15 중량%의 실크 단백질을 포함한다. 그러나, 실크 도프 중 실크 단백질의 농도를 증가시키는 추가 단계가 수행되지 않는 경우, 보다 전형적인 수율은 약 0.5 중량% 내지 약 4 중량%의 실크 단백질이다. 본 발명의 방법을 이용하여 제조한 실크 도프는 섬유의 형성 및/또는 필름 캐스트 성형을 위해 압출될 수 있다.

본 명세서에서 사용된 바와 같이, "실크 섬유"는 다양한 항목들, 예컨대, 직물로 직조될 수 있는, 실크 단백질을 포함하는 필라멘트를 의미한다.

본 명세서에서 사용된 바와 같이, 용어 "계면활성제 용액의 양을 감소시키는" 또는 이의 변형 용어("이온성 액체의 양을 감소시키는"을 포함함)는 계면활성제 또는 이온성 액체의 총량이 감소됨을 의미한다. 한 실시양태에서, 상기 감소 후 계면활성제 또는 이온성 액체의 농도는 용액의 추가 농축을 수반하는 임의의 단계 전에 약 10 mM 미만, 더욱 바람직하게는 5 mM 미만, 훨씬 더욱 바람직하게는 1 mM 미만이다.

본 명세서에서 사용된 바와 같이, "탈수 용액"은 농축될 실크 도프보다 낮은 용액 중 물 농도를 갖는 임의의 용액, 바람직하게는 수용액이다.

본 명세서에서 사용된 바와 같이, 계면활성제 또는 이온성 액체와 접촉되는 실크 단백질을 지칭할 때 용어 "가용화"는 상기 계면활성제 또는 이온성 액체가 실크 단백질과 결합하고 상기 실크 단백질의 응집을 방해함으로써 상기 실크 단백질이 용액 중에 유지되는 것을 의미한다. 이것은 세포, 특히 봉입체에서 관찰되는 실크 단백질과 대조적이다.

용어 "신호 펩티드", "N-말단 신호 서열" 및 이들의 변형 용어는 분비되는 성숙 단백질 앞에 존재하는 아미노 말단 단백질/펩티드를 의미한다. 신호 펩티드는 성숙 단백질로부터 절단되므로 성숙 단백질에 존재하지 않는다. 신호 펩티드는 분비되는 단백질을 세포막을 가로질러 이동시키고 전위시키는 기능을 갖는다. 신호 펩티드는 신호 서열로도 지칭되고 당업계에서 잘 공지되어 있다.

코일드 코일 실크 단백질

용어 "폴리펩티드" 및 "단백질"은 일반적으로 상호교환가능하게 사용되고 비아미노산 기의 부가에 의해 변경될 수 있거나 변경되지 않을 수 있는 단일 폴리펩티드 쇄를 의미한다. 본 명세서에서 사용된 바와 같이, 용어 "단백질" 및 "폴리펩티드"는 본 명세서에서 기재된 실크 단백질의 변이체, 돌연변이체, 변형체, 유사체 및/또는 유도체 또한 포함한다. 바람직한 실시양태에서, 본 발명에서 사용되는 실크 단백질은 천연 발생 아미노산으로만 구성된다.

단백질의 % 동일성은 갭(gap) 생성 페널티가 5이고 갭 연장 페널티가 0.3인 GAP(Needleman and Wunsch, 1970) 분석(GCG 프로그램)에 의해 측정된다. 조회(query) 서열은 길이가 15개 이상의 아미노산이고, GAP 분석은 15개 이상의 아미노산으로 구성된 영역에 걸쳐 2개의 서열들을 정렬한다. 더욱 바람직하게는, 조회 서열은 길이가 50개 이상의 아미노산이고, GAP 분석은 50개 이상의 아미노산으로 구성된 영역에 걸쳐 2개의 서열들을 정렬한다. 더욱 바람직하게는, 조회 서열은 길이가 100개 이상의 아미노산이고, GAP 분석은 100개 이상의 아미노산으로 구성된 영역에 걸쳐 2개의 서열들을 정렬한다. 훨씬 더욱 바람직하게는, 조회 서열은 길이가 250개 이상의 아미노산이고, GAP 분석은 250개 이상의 아미노산으로 구성된 영역에 걸쳐 2개의 서열들을 정렬한다. 훨씬 더욱 바람직하게는, GAP 분석은 서열의 전체 길이에 걸쳐 2개의 서열들을 정렬한다.

본 명세서에서 사용된 바와 같이, "생물학적 활성" 단편은 전장 단백질의 정의된 활성, 즉 실크를 제조하는 데 사용되는 능력을 유지하는 본 발명의 단백질의 일부이다. 생물학적 활성 단편들은 이들이 정의된 활성을 유지하는 한 임의의 크기일 수 있다.

용어 "본질적으로 구성된" 또는 이의 변형 용어는 정의된 아미노산 서열이 정의된 것에 비해 수개의, 예컨대, 1개, 2개, 3개 또는 4개의 추가 아미노산을 가질 수 있음을 의미한다. 예를 들면, N-말단 메티오닌은 정의된 서열에 부재하는 경우 첨가될 수 있다. 용어 "로 구성된다" 또는 이의 변형 용어는 정의된 서열이 상기 정의된 서열에 비해 특히 N-말단 및 C-말단에서 추가 아미노산을 갖지 않거나 아미노산을 덜 갖지 않음을 의미한다.

정의된 단백질에 대하여, 상기 제공된 숫자보다 더 높은 % 동일성 숫자는 바람직한 실시양태를 포함할 것임이 인식될 것이다. 따라서, 적용가능한 경우, 최소 % 동일성 숫자를 고려할 때, 단백질은 관련된 지정된 서열 번호와 40% 이상, 더욱 바람직하게는 45% 이상, 더욱 바람직하게는 50% 이상, 더욱 바람직하게는 55% 이상, 더욱 바람직하게는 60% 이상, 더욱 바람직하게는 65% 이상, 더욱 바람직하게는 70% 이상, 더욱 바람직하게는 75% 이상, 더욱 바람직하게는 80% 이상, 더욱 바람직하게는 85% 이상, 더욱 바람직하게는 90% 이상, 더욱 바람직하게는 91% 이상, 더욱 바람직하게는 92% 이상, 더욱 바람직하게는 93% 이상, 더욱 바람직하게는 94% 이상, 더욱 바람직하게는 95% 이상, 더욱 바람직하게는 96% 이상, 더욱 바람직하게는 97% 이상, 더욱 바람직하게는 98% 이상, 더욱 바람직하게는 99% 이상, 더욱 바람직하게는 99.1% 이상, 더욱 바람직하게는 99.2% 이상, 더욱 바람직하게는 99.3% 이상, 더욱 바람직하게는 99.4% 이상, 더욱 바람직하게는 99.5% 이상, 더욱 바람직하게는 99.6% 이상, 더욱 바람직하게는 99.7% 이상, 더욱 바람직하게는 99.8% 이상, 더욱 바람직하게는 99.9% 이상 동일한 아미노산 서열을 포함하는 것이 바람직하다.

본 명세서에서 기재된 천연 발생 실크 단백질의 아미노산 서열 돌연변이체는 적절한 뉴클레오티드 변화를 실크 단백질을 코딩하는 핵산 내로 도입함에 의해, 또는 원하는 단백질의 시험관내 합성에 의해 제조될 수 있다. 이러한 돌연변이체는 예를 들면, 아미노산 서열 내의 잔기의 결실, 삽입 또는 치환을 포함한다. 최종 단백질 생성물이 원하는 특성을 보유하는 한, 최종 구성체(construct)에 도달하도록 결실, 삽입 및 치환의 조합이 만들어질 수 있다.

돌연변이체 (변경된) 단백질은 당업계에 공지된 임의의 기법을 이용하여 제조할 수 있다. 예를 들면, 본 발명의 폴리뉴클레오티드를 시험관내 돌연변이유발로 처리할 수 있다. 이러한 시험관내 돌연변이유발 기법은 폴리뉴클레오티드를 적합한 벡터 내로 서브클로닝하고, 상기 벡터를 "돌연변이유발자(mutator)" 균주, 예컨대, 이. 콜라이 XL-1 레드(스트라타진) 내로 형질전환하고 형질전환된 박테리아를 적절한 수의 세대 동안에 증식시키는 것을 포함한다. 또 다른 예에서, 본 발명의 폴리뉴클레오티드는 하라야마(Harayama)(1998)에 의해 넓게 기재된 DNA 셔플링(shuffling) 기법으로 처리한다. 이 DNA 셔플링 기법은 본 발명의 유전자와 관련된 유전자, 예컨대, 본 명세서에서 특징규명된 특정 종들 이외의 막시목(Hymenopteran) 또는 맥시목(Neuroptean) 종으로부터의 실크 유전자 이외에 가능하게는 본 발명의 유전자를 포함할 수 있다. 돌연변이된/변경된 DNA로부터 유래된 생성물들이 실크 단백질로서 사용될 수 있는지를 결정하기 위해 상기 생성물들을 본 명세서에서 기재된 기법을 이용하여 용이하게 스크리닝할 수 있다.

아미노산 서열 돌연변이체의 디자인에 있어서, 돌연변이 부위의 위치 및 돌연변이의 성질은 변형될 특성(들)에 의해 좌우될 것이다. 돌연변이를 위한 부위는 예를 들면, (1) 먼저 선택된 보존적 아미노산으로 치환한 후 달성되는 결과에 따라 선택된 보다 많은 라디칼로 치환하는 것, (2) 표적 잔기를 결실하는 것, 또는 (3) 위치된 부위에 인접한 위치에 다른 잔기를 삽입하는 것에 의해 개별적으로 또는 연속적으로 변경될 수 있다.

아미노산 서열 결실 또는 삽입은 일반적으로 약 1 내지 15개 잔기, 더욱 바람직하게는 약 1 내지 10개 잔기, 전형적으로 약 1 내지 5개의 연속적인 잔기이다.

치환 돌연변이체는 단백질 분자 내에 제거된 1개 이상의 아미노산 잔기 및 그 자리에 삽입된 상이한 잔기를 갖는다. 치환 돌연변이유발의 경우 가장 높은 관심을 받는 부위는 기능을 위해 중요한 것으로 확인된 부위를 포함한다. 관심 있는 다른 부위는 다양한 균주 또는 종으로부터 얻은 특정 잔기들이 동일한 부위이다. 이 위치들은 생물학적 활성을 위해 중요할 수 있다. 이 부위들, 특히 3개 이상의 다른 동일하게 보존된 부위들의 서열 내에 포함되는 부위는 바람직하게는 상대적으로 보존적인 방식으로 치환된다. 이러한 보존적 치환은 "예시적 치환"이라는 표제 하에 표 1에 기재되어 있다.

예시적 치환
원래의 잔기	예시적 치환
Ala(A)	val; leu; ile; gly; cys; ser; thr
Arg(R)	lys
Asn(N)	gln; his
Asp(D)	glu
Cys(C)	ser; thr; ala; gly; val
Gln(Q)	asn; his
Glu(E)	asp
Gly(G)	pro; ala; ser; val; thr; cyc
His(H)	asn; gln
Ile(I)	leu; val; ala; met
Leu(L)	ile; val; met; ala; phe
Lys(K)	arg
Met(M)	leu; phe
Phe(F)	leu; val; ala
Pro(P)	gly
Ser(S)	thr; ala; gly; val; gln; cys
Thr(T)	ser; gln; ala; cys
Trp(W)	tyr
Tyr(Y)	trp; phe
Val(V)	ile; leu; met; phe; ala; ser; thr

실크 단백질의 코일드 코일 구조는 컨센서스 서열(abcdefg) _n 로 표시되는 헵타드 반복부(repeat)를 특징으로 한다. 바람직한 실시양태에서, 코일드 코일 구조를 갖는 단백질의 부분은 10개 카피 이상의 헵타드 서열 abcdefg를 포함하고, 위치 a 및 d의 아미노산의 25% 이상이 알라닌 잔기이다.

바람직한 실시양태에서, 코일드 코일 구조를 갖는 단백질은 12개 연속적 카피 이상의, 더욱 바람직하게는 15개 연속적 카피 이상의, 훨씬 더욱 바람직하게는 18개 연속적 카피 이상의 헵타드를 포함한다. 추가 실시양태에서, 코일드 코일 구조를 갖는 단백질은 최대 28개 카피 이상의 헵타드를 가질 수 있다. 전형적으로, 헵타드의 카피들은 도립적으로(tandemly) 반복될 것이다. 그러나, 이들은 반드시 완벽한 도립 반복부일 필요는 없고, 예를 들면, 국제 특허공보 제WO 2007/038837호의 도 5 및 6에서 도시된 바와 같이, 몇몇 아미노산들이 2개의 헵타드 사이에서 발견될 수 있거나, 몇몇 절두된(truncated) 헵타드가 발견될 수 있다(예를 들면, 국제 특허공보 제WO 2007/038837호의 도 5에서 제노스피랄 참조).

코일드 코일 구조를 갖는 실크 단백질에 가해질 수 있는 아미노산 치환에 대한 지침은 국제 특허공보 제WO 2007/038837호의 도 5 및 6 및 표 6 내지 10에 제공되어 있다. 본 명세서에 제공된 실험 데이터를 기초로 한 예측된 유용한 아미노산 치환이 국제 특허공보 제WO 2007/038837호의 표 1에 제공된 예시적 치환과 어떠한 방식으로든 불일치하는 경우, 실험 데이터를 기초로 한 치환을 사용하는 것이 바람직하다.

실크 단백질의 코일드 코일 구조는 특히 상기 헵타드의 아미노산 위치 a, d 및 e에서 높은 함량의 알라닌 잔기를 갖는다. 그러나, 위치 b, c, f 및 g 또한 높은 빈도의 알라닌 잔기를 갖는다. 바람직한 실시양태에서, 상기 헵타드의 위치 a, d 및/또는 e의 아미노산의 15% 이상, 더욱 바람직하게는 25% 이상, 더욱 바람직하게는 30% 이상, 더욱 바람직하게는 40% 이상, 훨씬 더욱 바람직하게는 50% 이상이 알라닌 잔기이다. 추가의 바람직한 실시양태에서, 상기 헵타드의 위치 a 및 d 둘 다의 아미노산의 25% 이상, 더욱 바람직하게는 30% 이상, 더욱 바람직하게는 40% 이상, 훨씬 더욱 바람직하게는 50% 이상이 알라닌 잔기이다. 나아가, 상기 헵타드의 위치 b, c, f 및 g의 아미노산의 15% 이상, 더욱 바람직하게는 20% 이상, 훨씬 더욱 바람직하게는 25% 이상이 알라닌 잔기이다.

전형적으로, 상기 헵타드는 임의의 프롤린 또는 히스티딘 잔기를 포함하지 않을 것이다. 더욱이, 상기 헵타드는 존재하는 경우 극소수(1 또는 2개의) 페닐알라닌, 메티오닌, 티로신, 시스테인, 글리신 또는 트립토판 잔기를 포함할 것이다. 알라닌 이외에, 상기 헵타드에서 공통된 (예를 들면, 5% 초과의, 더욱 바람직하게는 10% 초과의) 아미노산은 (특히, 위치 b 및 d에서) 류신, (특히, 위치 b, e 및 f에서) 세린, (특히, 위치 c, e 및 f에서) 글루탐산, (특히, 위치 b, c, d, f 및 g)에서 라이신, 및 위치 g에서 아르기닌을 포함한다.

바람직한 실시양태에서, 헵타드는 패턴 인식 프로그램 MARCOIL(Delorenzi and Speed. 2002)을 이용하여 확인한다.

본 발명의 방법에 유용한 단백질(및 폴리뉴클레오티드)은 매우 다양한 막시목 및 맥시목 종으로부터 정제(단리)될 수 있다. 막시목의 예에는 하기 곤충과를 포함하는 아포크리타(Apocrita) 아목(벌, 개미 및 말벌)의 임의의 종이 포함되나, 이들로 한정되지 않는다: 크리시디대(Chrysididae)(청벌), 포르미시대(Formicidae)(개미), 무틸리대(Mutillidae)(개미벌), 폼필리대(Pompilidae)(거미벌), 스콜리이대(Scoliidae), 베스피대(Vespidae)(종이벌, 도자기벌, 호박벌), 아가오니대(Agaonidae)(무화과벌), 칼시디대(Chalcididae)(칼시디드), 유카리티대(Eucharitidae)(유카리티드), 유펠미대(Eupelmidae)(유펠미드), 프테로말리대(Pteromalidae)(프테로말리드), 에바니이대(Evaniidae)(호리벌), 브라코니대(Braconidae), 이크뉴모니대(Ichneumomdae)(이크뉴몬스), 메가칠리대(Megachilidae), 아피대(Apidae), 콜레티대(Colletidae), 할릭티대(Halictidae), 및 멜리티대(Melittidae)(오일 수집 벌). 맥시목의 예에는 하기 곤충과로부터의 종들이 포함된다: 만티스피대(Mantispidae), 크리소피대(Chrysopidae)(풀잠자리), 미르멜레온티대(Myrmeleontidae)(명주잠자리) 및 아스칼라피대(Ascalaphidae)(뿔잠자리). 이러한 추가 단백질(및 폴리뉴클레오티드)은 봄부스 테레스트리스(Bombus terrestris), 미르멕시아 포르피카타(Myrmecia forficata), 오에코필라 스마라그디나(Oecophylla smaragdina) 및 말라다 시그나타(Mallada signata)로부터의 실크에 대해 본 명세서에서 기재된 절차와 동일한 절차를 이용하여 특징규명할 수 있다.

합성 동안에 또는 합성 후에 예를 들면, 바이오티닐화, 벤질화, 글리코실화, 아세틸화, 포스포릴화, 아미드화, 공지된 보호/차단 기에 의한 유도체화, 단백질분해성 절단, 항체 분자 또는 다른 세포 리간드에의 결합 등에 의해 차등적으로 변형된 단백질도 본 발명의 범위 내에 포함된다. 이 변형들은 단백질의 안정성 및/또는 생체활성을 증가시키도록 작용할 수 있다.

폴리뉴클레오티드

용어 "폴리뉴클레오티드"는 본 명세서에서 용어 "핵산"과 상호교환적으로 사용된다.

폴리뉴클레오티드의 내용에서 용어 "외인성"은 그의 천연 상태에 비해 변경된 양으로 세포 또는 무세포 발현 시스템에 존재하는 폴리뉴클레오티드를 의미한다. 한 실시양태에서, 상기 세포는 상기 폴리뉴클레오티드를 천연적으로 포함하지 않는 세포이다. 그러나, 상기 세포는 변경된, 바람직하게는 증가된 양의 코딩된 단백질의 생성을 야기하는 비내인성 폴리뉴클레오티드를 포함하는 세포일 수 있다. 본 발명의 외인성 폴리뉴클레오티드는 이 폴리뉴클레오티드가 존재하는 형질전환(재조합) 세포 또는 무세포 발현 시스템의 다른 성분들로부터 분리되지 않은 폴리뉴클레오티드, 및 적어도 몇몇 다른 성분들로부터 추후에 정제되는, 상기 세포 또는 무세포 시스템에서 생성된 폴리뉴클레오티드를 포함한다.

폴리뉴클레오티드의 % 동일성은 갭 생성 페널티가 5이고 갭 연장 페널티가 0.3인 GAP(Needleman and Wunsch, 1970) 분석(GCG 프로그램)에 의해 측정된다. 달리 명시되지 않은 한, 조회 서열은 길이가 45개 이상의 뉴클레오티드이고, GAP 분석은 45개 이상의 뉴클레오티드의 영역에 걸쳐 2개의 서열들을 정렬한다. 바람직하게는, 조회 서열은 길이가 150개 이상의 뉴클레오티드이고, GAP 분석은 150개 이상의 뉴클레오티드의 영역에 걸쳐 2개의 서열들을 정렬한다. 보다 바람직하게는, 조회 서열은 길이가 300개 이상의 뉴클레오티드이고, GAP 분석은 300개 이상의 뉴클레오티드의 영역에 걸쳐 2개의 서열들을 정렬한다. 훨씬 더욱 바람직하게는, GAP 분석은 서열의 전체 길이에 걸쳐 2개의 서열들을 정렬한다.

정의된 폴리뉴클레오티드에 대하여, 상기 제공된 숫자보다 더 높은 % 동일성 숫자는 바람직한 실시양태를 포함할 것임이 인식될 것이다. 따라서, 적용가능한 경우, 최소 % 동일성 숫자를 고려할 때, 본 발명의 폴리뉴클레오티드는 관련된 지정된 서열 번호와 40% 이상, 더욱 바람직하게는 45% 이상, 더욱 바람직하게는 50% 이상, 더욱 바람직하게는 55% 이상, 더욱 바람직하게는 60% 이상, 더욱 바람직하게는 65% 이상, 더욱 바람직하게는 70% 이상, 더욱 바람직하게는 75% 이상, 더욱 바람직하게는 80% 이상, 더욱 바람직하게는 85% 이상, 더욱 바람직하게는 90% 이상, 더욱 바람직하게는 91% 이상, 더욱 바람직하게는 92% 이상, 더욱 바람직하게는 93% 이상, 더욱 바람직하게는 94% 이상, 더욱 바람직하게는 95% 이상, 더욱 바람직하게는 96% 이상, 더욱 바람직하게는 97% 이상, 더욱 바람직하게는 98% 이상, 더욱 바람직하게는 99% 이상, 더욱 바람직하게는 99.1% 이상, 더욱 바람직하게는 99.2% 이상, 더욱 바람직하게는 99.3% 이상, 더욱 바람직하게는 99.4% 이상, 더욱 바람직하게는 99.5% 이상, 더욱 바람직하게는 99.6% 이상, 더욱 바람직하게는 99.7% 이상, 더욱 바람직하게는 99.8% 이상, 더욱 바람직하게는 99.9% 이상 동일한 서열을 포함하는 것이 바람직하다.

한 실시양태에서, 본 발명에 유용한 실크 단백질을 코딩하는 폴리뉴클레오티드는

a) 서열 번호 9 내지 16, 25 내지 32, 41 내지 48, 57 내지 64, 73 내지 80, 89 내지 96, 99 또는 100 중 어느 하나에 제공된 뉴클레오티드 서열,

b) 서열 번호 9 내지 16, 25 내지 32, 41 내지 48, 57 내지 64, 73 내지 80, 89 내지 96, 99 또는 100 중 어느 하나 이상과 30% 이상 동일한 뉴클레오티드 서열, 및

c) a) 또는 b)의 일부를 코딩하는 생물학적 활성 단편

가능한 적은 실크 단백질이 세포로부터 분비되는 것이 바람직한 경우, 코딩된 실크 단백질은 N-말단 신호 서열을 포함하지 않는다. 이러한 실크 단백질을 코딩하는 폴리뉴클레오티드의 예에는

a) 서열 번호 9, 11, 13, 15, 25, 27, 29, 31, 41, 43, 45, 47, 57, 59, 61, 63, 73, 75, 77, 79, 89, 91, 93, 95 또는 97 중 어느 하나에 제공된 뉴클레오티드 서열,

b) 서열 번호 9, 11, 13, 15, 25, 27, 29, 31, 41, 43, 45, 47, 57, 59, 61, 63, 73, 75, 77, 79, 89, 91, 93, 95 또는 97 중 어느 하나 이상과 30% 이상 동일한 뉴클레오티드 서열, 및

c) a) 또는 b)의 생물학적 활성 단편

으로부터 선택되는 서열을 포함하는, 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 구성된 실크 단백질이 포함된다.

본 발명의 다른 실시양태는 N-말단 신호 서열을 갖는 실크 단백질의 발현, 및/또는 본 명세서에서 정의된 제1 실크 단백질, 제2 실크 단백질, 제3 실크 단백질 및/또는 제4 실크 단백질의 동시생성(동일하거나 상이한 세포에서)에 의존한다. 서열목록에 제공된 서열 정보를 기초로 할 때, 당업자는 본 발명의 각각의 실시양태에 대한 발현을 위한 대표적인 폴리뉴클레오티드를 용이하게 확인할 수 있다.

본 발명의 방법에서 사용될 폴리뉴클레오티드는 천연 발생 분자와 비교할 때 뉴클레오티드 잔기의 결실, 삽입 또는 치환인 하나 이상의 돌연변이를 보유할 수 있다. 돌연변이체는 천연 발생일 수 있거나(즉, 천연 공급원으로부터 단리됨) 합성일 수 있다(예를 들면, 핵산에 대한 부위 지정 돌연변이유발을 수행함에 의해 합성됨).

또한, 본 발명에서 사용될 폴리뉴클레오티드는 엄격한 조건 하에 본 명세서에 제공된 실크 단백질 코딩 뉴클레오티드 서열, 예컨대, 서열 번호 9 내지 16, 25 내지 32, 41 내지 48, 57 내지 64, 73 내지 80, 89 내지 96, 99 및 100 중 하나 이상과 혼성화할 수 있다. 본 명세서에서 사용된 바와 같이, 용어 "엄격한 혼성화 조건" 등은 올리고뉴클레오티드의 길이와 함께 혼성화 온도의 변경을 포함하는, 당업자에게 친숙한 파라미터를 의미한다. 핵산 혼성화 파라미터는 이러한 방법을 정리해 놓은 참고문헌[샘브룩(Sambrook) 등의 문헌(상기) 및 아우수벨(Ausubel) 등의 문헌(상기)]에서 찾을 수 있다. 예를 들면, 본 명세서에서 사용된 바와 같이, 엄격한 조건은 혼성화 완충제(3.5xSSC. 0.02% 피콜, 0.02% 폴리비닐 피롤리돈, 0.02% 소 혈청 알부민(BSA), 2.5 mM NaH₂PO₄(pH 7), 0.5% SDS, 2 mM EDTA) 중에서 65℃에서 혼성화한 후 50℃에서 0.2xSSC, 0.01% BSA에서 1회 이상 세척하는 것을 의미할 수 있다.

핵산 구성체

본 발명의 방법에서 사용될 세포는 전형적으로 실크 단백질(들)을 코딩하는 핵산 구성체(들)를 포함할 것이다. 상기 구성체는 세포의 게놈 내로 삽입될 수 있거나 염색체외 구성체, 예컨대, 재조합 벡터일 수 있다. 이러한 벡터는 실크 단백질을 코딩하는 폴리뉴클레오티드 분자 근처에서 천연적으로 발견되지 않는 폴리뉴클레오티드 서열이고 바람직하게는 상기 폴리뉴클레오티드 분자가 유래된 종 이외의 다른 종으로부터 유래된 이종 폴리뉴클레오티드 서열을 함유한다. 상기 벡터는 RNA 또는 DNA 벡터일 수 있고, 원핵 또는 진핵 벡터일 수 있고, 전형적으로 트랜스포존(transposon)(예컨대, 미국 특허 제5,792,294호에 기재됨), 바이러스 또는 플라스미드이다.

한 종류의 재조합 벡터는 발현 벡터에 작동가능하게 연결된 실크 단백질을 코딩하는 폴리뉴클레오티드 분자를 포함한다. 어구 "작동가능하게 연결된"은 폴리뉴클레오티드 분자가 숙주 세포 내로 형질전환될 때 발현될 수 있는 방식으로 상기 폴리뉴클레오티드 분자가 발현 벡터 내로 삽입되는 것을 의미한다. 본 명세서에서 사용된 바와 같이, 발현 벡터는 숙주 세포를 형질전환할 수 있고 특정된 폴리뉴클레오티드 분자의 발현을 수행할 수 있는 DNA 또는 RNA 벡터이다. 바람직하게는, 발현 벡터는 숙주 세포 내에서 복제할 수도 있다. 발현 벡터는 원핵 또는 진핵 벡터일 수 있고, 전형적으로 바이러스 또는 플라스미드이다. 본 발명의 발현 벡터는 박테리아, 진균, 내부기생충, 절지동물, 곤충, 동물 및 식물 세포를 포함하는 본 발명의 재조합 세포에서 작용하는 임의의 벡터를 포함한다. 본 발명의 특히 바람직한 발현 벡터는 식물 세포에서 유전자 발현을 지시할 수 있다. 또한, 본 발명의 벡터는 무세포 발현 시스템에서 단백질을 생성하는 데 사용될 수 있고, 상기 시스템은 당업계에 잘 공지되어 있다.

구체적으로, 핵산 구성체는 조절 서열, 예컨대, 전사 조절 서열, 번역 조절 서열, 복제 기점, 및 재조합 세포와 상용가능하고 폴리뉴클레오티드 분자의 발현을 조절하는 다른 조절 서열을 함유한다. 전사 조절 서열은 전사의 개시, 연장 및 종결을 조절하는 서열이다. 특히 중요한 전사 조절 서열은 전사의 개시를 조절하는 서열, 예컨대, 프로모터, 인핸서(enhancer), 작동자(operator) 및 억제자(repressor) 서열이다. 적합한 전사 조절 서열은 본 발명의 재조합 세포 중 하나 이상에서 작용할 수 있는 임의의 전사 조절 서열을 포함한다. 다양한 이러한 전사 조절 서열이 당업자에게 공지되어 있다. 바람직한 전사 조절 서열은 박테리아, 효모, 절지동물, 식물 또는 포유동물 세포에서 작용하는 전사 조절 서열, 예컨대, tac, lac, trp, trc, oxy-pro, omp/lpp, rrnB, 박테리오파지 람다, 박테리오파지 T7, T71ac, 박테리오파지 T3, 박테리오파지 SP6, 박테리오파지 SP01, 메탈로티오네인, 알파-교배(mating) 인자, 피키아(Pichia) 알코올 옥시다제, 알파바이러스 서브게놈 프로모터(예컨대, 신드비스 바이러스 서브게놈 프로모터), 항생제 내성 유전자, 바큘로바이러스, 옥수수밤나방(Heliothis zea) 곤충 바이러스, 백시니아 바이러스, 헤르페스(herpes)바이러스, 미국너구리 폭스바이러스, 다른 폭스바이러스, 아데노바이러스, 사이토메갈로바이러스(예컨대, 중간 초기 바이러스), 원숭이 바이러스 40, 레트로바이러스, 액틴, 레트로바이러스 긴 말단 반복부, 라우스 육종 바이러스, 열충격, 포스페이트 및 니트레이트 전사 조절 서열, 및 원핵세포 또는 진핵세포에서 유전자 발현을 조절할 수 있는 다른 서열(그러나, 이들로 한정되지 않음)을 포함한다.

전술된 바와 같이, 본 발명의 한 양태는 전형적으로 N-말단 신호 서열의 존재로 인해 세포로부터 분비되는 실크 단백질에 의존한다. 적합한 신호 분절(segment)의 예에는 조직 플라스미노겐 활성화제(t-PA), 인터페론, 인터루킨, 성장 호르몬, 바이러스 외피 당단백질 신호 분절, 니코티아나 네크타린(Nicotiana nectarin) 신호 펩티드(미국 특허 제5,939,288호), 담배 엑스텐신(extensin) 신호, 대두 올레오신(oleosin) 오일 바디 결합 단백질 신호, 아라비돕시스 탈리아나(Arabidopsis thaliana) 액포 염기성 키티나제(chitinase) 신호 펩티드, 및 본 명세서에서 정의된 실크 폴리펩티드의 천연 신호 서열이 포함되나, 이들로 한정되지 않는다.

세포

본 발명의 방법의 대다수는 본 명세서에서 정의된 하나 이상의 실크 단백질을 생성하는 세포의 사용에 의존한다. 세포 내로의 폴리뉴클레오티드 분자의 형질전환은 폴리뉴클레오티드 분자를 세포 내로 삽입하는 임의의 방법에 의해 달성될 수 있다. 형질전환 기법은 형질감염, 전기천공, 미세주입, 리포펙션, 흡착 및 원형질체 융합을 포함하나, 이들로 한정되지 않는다. 재조합 세포는 단세포로 남아있을 수 있거나 조직, 기관 또는 다세포 유기체로 성장할 수 있다. 형질전환된 폴리뉴클레오티드 분자는 염색체외 분자로 남아 있을 수 있거나 그의 발현 능력이 보유되는 방식으로 형질전환된(즉, 재조합) 세포의 염색체 내부의 하나 이상의 부위로 삽입될 수 있다.

형질전환시키기에 적합한 숙주 세포는 본 명세서에서 정의된 실크 폴리펩티드를 코딩하는 폴리뉴클레오티드로 형질전환될 수 있는 임의의 세포를 포함한다. 숙주 세포는 상기 실크 폴리펩티드를 내인적으로(즉, 천연적으로) 생성할 수 있거나 본 명세서에서 정의된 하나 이상의 폴리뉴클레오티드 분자로 형질전환된 후 상기 폴리펩티드를 생성할 수 있다. 숙주 세포는 본 명세서에서 정의된 하나 이상의 실크 단백질을 생성할 수 있는 임의의 세포일 수 있고 박테리아, 진균(효모를 포함함), 기생충, 절지동물, 동물 및 식물 세포를 포함한다. 숙주 세포의 예에는 살모넬라(Salmonella), 에스케리치아(Escherichia), 바실러스(Bacillus), 리스테리아(Listeria), 사카로마이세스(Saccharomyces), 스포도프테라(Spodoptera), 마이코박테리아(Mycobacteria), 트리코플루시아(Trichoplusia), BHK(새끼 햄스터 신장) 세포, MDCK 세포, CRFK 세포, CV-1 세포, COS(예를 들면, COS-7) 세포 및 베로 세포가 포함된다. 숙주 세포의 추가 예는 이. 콜라이(E. coli) K-12 유도체를 포함하는 이. 콜라이; 살모넬라 티피이(Salmonella typhi); 약독화된 균주를 포함하는 살모넬라 티피뮤륨(Salmonella typhimurium); 스포도프테라 프루기페르다(Spodoptera frugiperda); 트리코플루시아 니(Trichoplusia ni); 및 비종양발생성 마우스 근모세포 G8 세포(예를 들면, ATCC CRL 1246)이다. 추가 적절한 포유동물 세포 숙주는 다른 신장 세포주, 다른 섬유모세포주(예를 들면, 인간, 뮤린 또는 닭 배아 섬유모세포주), 골수종 세포주, 중국 햄스터 난소 세포, 마우스 NIH/3T3 세포, LMTK 세포 및/또는 HeLa 세포를 포함한다. 특히 바람직한 숙주 세포는 박테리아 세포이다.

당업자는 특정한 종류의 세포에 적합한 배양 조건, 예컨대, 배지, 온도 및 시간을 용이하게 결정할 수 있다. 예를 들면, 한 실시양태에서, 세포는 약 30℃ 내지 약 37℃에서 약 24시간 내지 약 48시간 동안 배양된 에스케리치아 콜라이이다.

재조합 DNA 기술은 예를 들면, 숙주 세포 내의 폴리뉴클레오티드 분자의 카피수, 상기 폴리뉴클레오티드 분자가 전사되는 효율, 생성된 전사체가 번역되는 효율, 및 번역 후 변형 효율을 조작함으로써 형질전환된 폴리뉴클레오티드 분자의 발현을 개선시키는 데 사용될 수 있다. 폴리뉴클레오티드 분자의 발현을 증가시키는 데 유용한 재조합 기법은 폴리뉴클레오티드 분자를 고-카피수 플라스미드에 작동가능하게 연결하는 것, 상기 폴리뉴클레오티드 분자를 하나 이상의 숙주 세포 염색체 내로 삽입하는 것, 벡터 안정성 서열을 플라스미드에 부가하는 것, 전사 조절 신호(예를 들면, 프로모터, 작동자, 인핸서)를 치환하거나 변형하는 것, 번역 조절 신호(예를 들면, 리보좀 결합 부위, 샤인-달가노 서열)를 치환하거나 변형하는 것, 숙주 세포의 코돈 사용에 상응하도록 폴리뉴클레오티드 분자를 변형하는 것, 및 전사체를 불안정화시키는 서열을 결실시키는 것을 포함하나, 이들로 한정되지 않는다.

실크 도프의 제조

본 발명은 매우 다양한 적용을 위해 사용될 수 있는 실크 도프의 제조 방법에 관한 것이다.

본 발명의 한 양태의 한 단계는 세포를 용해하여 세포 내에서 생성되고 함유된 실크 단백질을 유리시키는 것에 관한 것이다. 이 단계는 당업계에 공지된 임의의 수단에 의해 수행될 수 있다. 예를 들면, 세포 현탁액을 전형적으로 원심분리하여 세포를 펠렛화하고, 상기 세포를 용해를 위해 준비된 보다 농축된 용액 내로 재현탁시킨다. 세포를 예를 들면, 프렌치 프레스에 통과시켜 용해시킬 수 있고 폴리트론(브린크만 인스트루먼츠(Brinkman Instruments))을 이용하여 균질화시키거나 얼음 상에서 초음파처리할 수 있다. 세포, 예컨대, 박테리아 세포를 용해시키는 대안적 방법은 당업자에게 잘 공지되어 있다(예를 들면, 상기 샘브룩 등의 문헌 참조). 다양한 키트, 예를 들면, 버그버스터(Bugbuster) 키트(노바겐(Novagen)) 및 프로테아프렙(ProteaPrep) 키트(프로테아 바이오사이언시스 인코포레이티드(Protea Biosciences, Inc.))가 세포 용해를 위해 사용될 수 있고 당업계에 잘 공지되어 있다.

본 발명자들은 박테리아에서 발현된 본 명세서에서 정의된 실크 단백질이 불용성 응집체("봉입체")를 형성함을 확인하였다. 바람직한 실시양태에서, 본 방법은 이 봉입체의 단리를 포함한다. 여러 프로토콜이 단백질 봉입체의 정제에 적합하다. 예를 들면, 봉입체의 정제는 전형적으로 전술된 방법에 의한 박테리아 세포의 파괴에 의한 봉입체의 추출, 분리 및/또는 정제를 수반한다. 한 실시양태에서, 세포를 용해시키고, 세포막을 가용화시키고, 봉입체를 포함하는 불용성 분획을 추가 가공을 위해 단리한다.

본 발명의 한 양태는 상청액으로부터의 실크 단백질의 농도를 증가시키는 것에 의존한다. 또한, 이것은 당업계에 공지된 임의의 방법에 의해 달성될 수 있다. 한 실시양태에서, 이것은 상청액을 실크 단백질을 침전시키는 물질, 예컨대, 황산암모늄, 트리클로로아세트산, 과염소산 및 아세톤, 또는 상업적인 침전물 칵테일, 예컨대, 플러스온(PlusOne)(아머샴 바이오사이언시스(Amersham Biosciences)) 또는 퍼펙트-포커스(Perfect-Focus)(게노 테크놀로지 인코포레이티드(Geno Technology Inc.))(그러나, 이들로 한정되지 않음)와 접촉시킴에 의해 달성된다.

실크 도프를 제조하기 위한 본 발명의 한 임의적 단계(임의적 단계일지라도, 실크 단백질의 수율이 충분히 높지 않은 경우에 바람직함)는 실크 도프 중 실크 단백질의 농도를 증가시키는 것을 포함한다. 또한, 이것은 수용액 중 단백질의 농도를 증가시키기 위한 당업계에 공지된 임의의 방법에 의해 달성될 수 있다. 특히 유용한 실시양태에서, 실크 도프는 탈수 용액, 예컨대, 흡습성 중합체를 포함하는 용액에 대해 투석함에 의해 농축된다. 적합한 흡습성 중합체의 예에는 폴리에틸렌 글리콜(PEG), 아밀라제 및 세리신, 또는 이들의 2종 이상의 조합이 포함되나, 이들로 한정되지 않는다. PEG 분자는 분자 크기 범위에서 사용가능하고, PEG의 선택은 투석을 위해 선택된 막 및 요구되는 농축율에 의해 결정될 것이다. 바람직하게는, PEG는 약 8,000 g/mol 내지 약 10,000 g/mol의 분자량을 갖고 약 25% 내지 약 50%의 농도를 갖는다.

계면활성제

한 실시양태에서, 본 명에서에 정의된 실크 도프를 생성하는 단계는 계면활성제의 사용을 수반한다. 본 발명자들은 놀랍게도 계면활성제, 예컨대, SDS가 그의의 농도가 낮아질 때 코일드 코일 구조의 형성을 허용하면서 본 명세서에서 정의된 실크 단백질이 용액 중에서 머물러 있을 수 있게 함을 발견하였다.

한 실시양태에서, 계면활성제는 음이온성 계면활성제이다. 본 발명에 유용한 음이온성 계면활성제의 예에는 나트륨 도데실 설페이트(SDS), 암모늄 라우릴 설페이트 및 다른 알킬 설페이트 염, 나트륨 1-옥탄설포네이트 일수화물, 나트륨 라우로일 사르코시네이트, 나트륨 라우릴 에테르 설페이트(SLES), 나트륨 타우로데옥시콜레이트 수화물 및 알킬 벤젠 설포네이트, 또는 이들의 2종 이상의 조합이 포함되나, 이들로 한정되지 않는다. 바람직한 실시양태에서, 음이온성 계면활성제는 SDS이다.

실크 단백질의 가용성을 증가시키는 임의의 농도의 계면활성제가 사용될 수 있다. 예를 들면, 약 0.1 부피/부피% 이상의 계면활성제가 사용된다. 한 실시양태에서, 약 0.1 부피/부피% 내지 약 10 부피/부피%, 더욱 바람직하게는, 약 0.5 부피/부피% 내지 약 2 부피/부피% 또는 약 0.5 부피/부피% 내지 약 5 부피/부피%의 계면활성제가 사용된다.

실크 도프의 제조를 위한 본 발명의 방법의 추가 단계는 계면활성제를 침전시켜 실크 단백질의 정확한 폴딩을 보조하는 화합물을 첨가함으로써 용액 중 계면활성제의 양을 감소시키는 것을 포함한다. 게면활성제에 결합하여 계면활성제의 가용성을 감소시키는 임의의 화합물이 사용될 수 있다. 예에는 염 또는 탄수화물, 예컨대, α-시클로덱스트린, 또는 이들의 2종 이상의 조합이 포함되나, 이들로 한정되지 않는다. 바람직하게는, 염은 칼륨 염 또는 나트륨 염이다. 바람직하게는, 칼륨 염은 염화칼륨이고, 나트륨 염은 아세트산나트륨이다. 용액 중 계면활성제의 양을 감소시키는 임의의 농도의 화합물이 사용될 수 있다. 예를 들면, 상기 화합물은 약 1 mM 내지 약 1 M, 더욱 바람직하게는 약 40 mM 내지 약 100 mM 또는 약 40 mM 내지 400 mM의 최종 농도로 첨가된다.

실크 도프의 제조를 위한 본 발명의 방법의 추가 단계는 상기 화합물을 첨가한 후 형성된 침전물로부터 용액을 분리하는 것을 포함한다. 이것은 당업계에 공지된 임의의 방법에 의해, 예컨대, 16000g에서 5분 동안 원심분리를 이용하고 실크 도프를 포함하는(실크 도프인) 상청액(용액)을 제거함에 의해 달성될 수 있다. 바람직하게는, 이 단계 후, 실크 단백질은 용액 중 단백질의 75% 이상, 더욱 바람직하게는 80% 이상, 더욱 바람직하게는 85% 이상, 더욱 바람직하게는 90% 이상, 더욱 바람직하게는 95% 이상, 더욱 바람직하게는 97% 이상, 더욱 바람직하게는 99% 이상, 훨씬 더욱 바람직하게는 100% 이상을 차지한다.

이온성 액체

일반적으로, 이온성 액체는 이온으로만 구성되고 약 100℃ 미만, 바람직하게는 약 85℃ 미만의 온도에서 액체인 화합물로서 정의될 수 있다. 본 발명에서 사용된 바와 같이, 이온성 액체는 일반적으로 하나 이상의 음이온 및 하나 이상의 양이온을 포함한다. 바람직한 실시양태에서, 이온성 액체는 치환기, 예컨대, 알킬, 알켄일, 알킨일, 알콕시, 알켄옥시, 알킨옥시, 다양한 방향족, 예컨대, (치환된 또는 비치환된) 페닐, (치환된 또는 비치환된) 벤질, (치환된 또는 비치환된) 펜옥시 및 (치환된 또는 비치환된) 벤즈옥시, 및 그의 고리 부분 내에 1개, 2개 또는 3개의 헤테로원자를 갖는 치환된 또는 비치환된 다양한 헤테로환 방향족을 포함하도록 하나 이상의 화합물을 유도체화함에 의해 생성된 유기 양이온을 포함한다. 유도체화된 화합물은 이미다졸, 피라졸, 티아졸, 이소티아졸, 아자티오졸, 옥소티아졸, 옥사진, 옥사졸린, 옥사자보롤, 디티오졸, 트리아졸, 델레노졸, 옥사포스폴, 피롤, 보롤, 푸란, 티오펜, 포스폴, 펜타졸, 인돌, 인돌린, 옥사졸, 이속사졸, 이소테트라졸, 테트라졸, 벤조푸란, 디벤조푸란, 벤조티오펜, 디벤조티오펜, 티아디아졸, 피리딘, 피리미딘, 피라진, 피리다진, 피페라진, 피페리딘, 모르폴론, 피란, 아놀린, 프탈라진, 퀴나졸린, 구아니디늄, 퀴녹살린, 콜린계 유사체, 및 이들의 조합을 포함하나, 이들로 한정되지 않는다. 염기성 양이온 구조는 단일 또는 다중 치환될 수 있거나 비치환될 수 있다.

이온성 액체의 음이온성 부분은 무기 부분, 유기 부분 또는 이들의 조합을 포함할 수 있다. 바람직한 실시양태에서, 상기 음이온성 부분은 할로겐, 포스페이트, 알킬포스페이트, 알켄일포스페이트, 비스(트리플루오로메틸설포닐)이미드(NTf₂), BF₄ ^-, PF₆ ^-, AsF₆ ^-, NO₃ ^-, N(CN)₂ ^-, N(SO₃CF₃)₂ ^-, 아미노산, 치환된 또는 비치환된 카르보란, 퍼클로레이트, 슈도할로겐, 예컨대, 티오시아네이트 및 시아네이트, 염화금속계 루이스산(예를 들면, 염화아연 및 염화알루미늄), 및 C_1-6 카르복실레이트로부터 선택되는 하나 이상의 부분을 포함한다. 슈도할라이드(pseudohalide)는 일가이고 할리드와 유사한 성질을 갖는다. 본 발명에 따라 유용한 슈도할라이드의 예에는 시아나이드, 이소시아네이트, 시아네이트, 풀미네이트 및 아지드가 포함된다. 1 내지 6개의 탄소 원자를 함유하는 예시적 카르복실레이트는 포르메이트, 아세테이트, 프로피오네이트, 부티레이트, 헥사노에이트, 말레에이트, 푸마레이트, 옥살레이트, 락테이트, 피루베이트 등이다.

다양한 이온성 액체가 제조되어 본 발명에 따라 사용될 수 있다. 구체적으로, 전술된 양이온과 음이온의 임의의 조합이 사용될 수 있다. 하나 이상의 양이온(예컨대, 전술된 양이온)을 하나 이상의 음이온(예컨대, 전술된 음이온)과 조합하여 본 명세서에서 기재된 조건 하에 액체인 물질을 형성하는 것이 필요할 뿐이다. 예를 들면, 양이온성 이미다졸륨 부분을 음이온성 할로겐 부분과 조합하여 요구되는 조건 하에 액체이고(예를 들면, 1-부틸-3-메틸-이미다졸륨 클로라이드) 실질적으로 완전히 이온성 부분으로 형성되는 물질을 형성할 수 있다. 따라서, 본 발명은 매우 다양한 이온성 액체의 사용을 포함하는 것임이 분명하다. 본 발명에 따라 사용될 이온성 액체의 구체적인 비제한적 예에는 1-부틸-3-메틸-이미다졸륨 클로라이드("BmimCl"); 1-알릴-3-메틸-이미다졸륨 클로라이드("AmimCl"); 1-에틸-3-메틸-이미다졸륨 클로라이드; 1-수소-3-메틸-이미다졸륨 클로라이드; 1-벤질-3-메틸-이미다졸륨 클로라이드("벤질mimC1"); 1-이소프로필-3-메틸-이미다졸륨 클로라이드; 1-m-메톡시벤질-3-메틸-이미다졸륨 클로라이드("메톡시벤질mimCl"); 1-m-메틸벤질-3-메틸-이미다졸륨 클로라이드("메틸벤질mimCl"); 1-벤질-3-메틸-이미다졸륨 클로라이드; 및 1-메틸-3-벤질-이미다졸륨 디시안아미드("벤질mimDca")가 포함된다.

또한, 본 발명은 이온성 액체의 다양한 혼합물의 사용을 포함한다. 실제로, 이온성 액체 혼합물은 맞추어진 성질, 예컨대, 점도를 갖는 이온성 액체를 제공하는 데 있어서 유용할 수 있다. 예를 들면, 벤질mimC1은 상대적으로 점성을 나타내는 이온성 액체이나, 그의 점도는 AmimC1과의 혼합에 의해 상당히 감소될 수 있다. 따라서, 이온성 액체 혼합물의 점도는 점도가 보다 높은 성분과 점도가 보다 낮은 성분의 비율을 변경시킴에 의해 조절될 수 있다.

본 발명에 따라 사용될 이온성 액체는 문헌에 따라 합성될 수 있다. 바람직하게는, 이온성 액체는 사용 전에 진공 오븐 내에서 일정한 시간, 예컨대, 약 48시간 동안 (예를 들면, 100℃에서) 건조된다. 한 실시양태에서, 이온성 액체는 주위 조건에서 고체(예를 들면, 결정)이지만 증가된 온도(예컨대, 약 30℃ 초과, 약 50℃ 초과, 약 75℃ 또는 약 100℃ 초과)에서 액체인 물질로 형성된다. 일반적으로, 결정성 물질을 적절한 용기 내에 배치하고 가열하여 용해시킬 수 있다(예를 들면, 문헌(Ionic Liquids in Synthesis, Wasserscheid, P. and Weldon, T. (Eds.), Wiley Pub.) 참조). 물론, 이온성 액체는 주위 조건에서(예를 들면, 약 20 내지 25℃의 온도에서) 액체인 물질을 포함할 수도 있다.

여과 및/또는 크로마토그래피

가용화된 실크 단백질을 농축시킬 수 있고, 전하, 친수성, 친화성, 가용성 또는 안정성, 또는 크기를 기초로 하여 불순물, 예컨대, 계면활성제, 이온성 액체 및 다른 세포 성분들로부터 분리할 수 있다. 분리 기법의 비제한적 예에는 황산암모늄 침전, 크로마토그래피 및 막 여과(접선 유동 막 여과를 포함함)가 포함된다. 분리를 위해 크로마토그래피를 사용하는 실시양태에서, 예시적 방법은 이온 교환(양이온성 또는 음이온성), 친화성 크로마토그래피, 친수성-상호작용, 소수성-상호작용, 크기 배제 및 겔-투과를 포함한다(미국 특허 제6,248,570호 참조).

일부 실시양태들에서, 분리는 단일 통과, 데드-엔드(dead-end), 직접 유동 여과(DFF), 및 교차유동 또는 접선 유동 여과(TFF)와 같은 방법을 포함하나 이들로 한정되지 않는 막 여과에 의해 수행될 수 있다. 본 발명에 따르면, 여과는 정의된 범위의 공극 크기를 갖는 반투과성 막을 사용하여 크기에 따라 분자를 분리하는 원리를 기초로 한다. 여과 방법과 막 종류의 조합이 분리에서 사용될 수 있음이 당업자에게 공지되어 있다.

본 발명에 따르면, 막 여과는 중합체 또는 무기 막에 의해 수행되는 세포 성분의 분리이다. 당업계에는 담체 액체로부터 제거될 물질의 크기에 의해 정의된 4개의 통상적으로 허용되는 카테고리의 막이 존재한다. 가장 작은 공극 크기부터 가장 큰 공극 크기까지 막을 통해 순차적으로 여과하는 방법은 역삼투(RO), 나노여과(NF), 한외여과(UF) 및 미세여과(MF)이다.

전술된 막을 사용하는 여과는 특정 공극 크기를 갖는 막을 사용하여 분자들을 그들의 분자량에 따라 분리한다. 예를 들면, 공극 크기가 0.001 ㎛ 미만인 RO 막을 사용하는 분리는 분자량이 200 달톤 미만인 분자들을 분리하기 위한 것이다. 공극 크기가 0.001 ㎛ 내지 0.008 ㎛인 NF 막을 사용하는 여과는 분자량이 200 달톤 내지 15 킬로달톤(kDa)인 분자들을 분리하기 위한 것이다. 공극 크기가 0.005 ㎛ 내지 0.1 ㎛인 UF 막을 사용하는 여과는 분자량이 5 kDa 내지 300 kDa인 분자들을 분리하기 위한 것이다. 공극 크기가 0.05 ㎛ 내지 3.0 ㎛인 미세여과 막을 사용하는 여과는 분자량이 100 kDa 내지 3000 kDa 이상인 분자들을 분리하기 위한 것이다.

본 발명에 따르면, 막 여과는 막의 공극 크기에 의해 결정되는 특정 분자량 컷-오프(MQWCO)를 갖는 막을 사용함으로써 크기 배제를 기초로 하여 다른 성분들로부터 가용화된 실크 단백질을 분리할 수 있다. 공칭 분자량 한계(NMWL) 또는 공칭 분자량 컷-오프(NMWCO)로도 지칭되는 MWCO는 막에 의해 여과를 위한 킬로달톤 크기 명칭이다. MWCO는 막에 의해 90% 보유되는 분자의 분자량으로서 정의된다. 예를 들면, 동일한 분자량의 분자들이 상당히 상이한 형태를 가질 수 있기 때문에, MWCO는 정확한 측정치가 아니지만 그럼에도 불구하고 유용한 측정치이고 필터 제조자에 의해 통상적으로 사용된다. 소수성 막 및 친수성 막 둘 다가 본 발명에서 사용될 수 있다. 이러한 막들은 평평한 시트로서 사용될 수 있거나 나선형으로 감긴 구조로 사용될 수 있다. 중공(hollow) 섬유도 사용될 수 있다. UF 막의 조성과 관련하여, 재생된 셀룰로스, (그의 고유 소수성을 변경시키도록 변형될 수 있거나 변형되지 않을 수 있는) 폴리에테르 설폰, 폴리비닐리덴 플루오라이드, 및 세라믹 및 금속 산화물 응집체를 포함하나 이들로 한정되지 않는 임의의 수의 잠재적 막 물질들이 사용될 수 있다. 많은 폴리에테르 설폰 UF 막들이 0.5 내지 13의 pH 범위 및 85℃ 이하의 온도를 견딜 수 있다. MF 막을 위한 물질은 UF 막을 위해 사용되는 모든 것들뿐만 아니라 폴리카르보네이트, 폴리프로필렌, 폴리에틸렌 및 PTFE(TEFLON™)를 포함한다.

일부 실시양태들에서, 큰 세포 데브리스를 보다 작은 세포 성분들로부터 분리하여 상기 세포 데브리스가 막 또는 크로마토그래피의 사용을 수반하는 속행되는 분리 및 정제 단계를 방해하지 않도록 가용화된 실크 단백질을 여과할 수 있다. 이 실시양태들에서, 투과물은 실크 단백질을 포함하고 회수된다.

일부 실시양태들에서, 막은 적절한 MWCO를 갖는 분리 단계에서 사용될 수 있다. 예를 들면, 본 발명의 방법에서 사용되는 전형적인 실크 단백질의 MW는 약 30 kDa이다. 이 실시양태들에서, 보유물은 실크 단백질을 포함하고 회수될 수 있다.

바람직한 실시양태에서, 접선 유동 여과는 실크 단백질을 정용투석하고 농축하도록 작용한다. TFF에서, 전형적으로, 용액은 여과 막에 평행하게 유동한다. 막을 가로지르는 압력 차이는 유체 및 여과가능한 용질(이의 분자량은 막의 분자량보다 적거나 막의 분자량보다 적은 것처럼, 예컨대, 구형 단백질처럼 거동함)이 필터를 통과하여 유동하게 한다. HPTFF(고성능 접선 유동 여과)에서, 막은 하전되어 있으므로 오염물질을 분리하기 위해 분자의 크기 및 전하 둘 다를 사용한다(미국 특허공보 제2003022921호 참조). 본 발명에 따르면, 정용여과는 불연속적 또는 연속적 정용여과일 수 있다. 불연속적 정용여과에서, 용액은 농축되고, 손실된 부피는 새로운 완충제로 교체된다. 연속적 정용여과에서, 오래된 완충제 용액이 제거되면서, 용액 부피는 새로운 완충제 용액의 유입 유동에 의해 유지된다. 일부 실시양태들에서, 실크 단백질의 분리 및 정제는 한외여과 막을 사용하는 접선 유동 여과 방법에 의해 수행될 수 있다.

용도

본 발명의 방법을 이용하여 제조한 실크 도프는 넓고 다양한 다수의 의료적, 군사적, 산업적 및 상업적 적용을 위해 사용될 수 있다. 예를 들면, 상기 실크 도프는 의료 장치, 예컨대, 봉합사, 피부 이식편, 세포 성장 매트릭스, 교체 인대 및 수술 메쉬; 및 광범위한 산업적 및 상업적 제품, 예를 들면, 케이블, 로프, 그물, 낚시줄, 의류 직물, 방탄 조끼 라이닝(lining), 용기 직물, 배낭, 바랑, 가방 또는 지갑 끈, 부착 결합재, 비부착 결합재, 끈 재료, 텐트 직물, 방수천, 풀(pool) 덮개, 차량 덮개, 울타리 재료, 밀봉제, 건축 재료, 내후 재료, 가요성 분획 재료, 스포츠 장비; 및 높은 인장 강도 및 탄성이 원하는 특성인 거의 임의의 용도의 섬유 또는 직물의 제조에서 사용될 수 있는 실크 섬유를 제조하는 데 사용된다. 또한, 실크 도프는 개인 관리 제품, 예컨대, 화장품, 피부 관리, 모발 관리 및 모발 염색을 위한 조성물의 제조; 및 입자, 예컨대, 안료의 코팅에서 사용된다.

실크는 그의 천연 형태로 사용될 수 있거나 보다 유리한 효과를 제공하는 유도체를 형성하도록 변형될 수 있다. 예를 들면, 실크는 미국 특허 제5,981,718호 및 미국 특허 제5,856,451호에 기재된 바와 같이 알레르겐성을 감소시키기 위해 중합체에 접합시킴에 의해 변형될 수 있다. 적절한 변형 중합체는 폴리알킬렌 옥사이드, 폴리비닐 알코올, 폴리-카르복실레이트, 폴리(비닐피롤리돈) 및 덱스트란을 포함하나, 이들로 한정되지 않는다. 또 다른 예에서, 실크는 다른 단백질 변형제의 선택적 분해 및 스플라이싱(splicing)에 의해 변형될 수 있다. 예를 들면, 실크 단백질은 약 60℃의 승온에서 산을 사용한 처리에 의해 보다 작은 펩티드 단위체로 절단될 수 있다. 유용한 산은 묽은 염산, 황산 또는 인산을 포함하나, 이들로 한정되지 않는다. 대안적으로, 실크 단백질의 분해는 염기, 예컨대, 수산화나트륨을 사용한 처리에 의해 수행될 수 있거나, 또는 적절한 프로테아제를 사용한 효소적 분해가 사용될 수 있다.

상기 단백질은 개인 관리 제품을 위한 특정 적용에서 유리한 성능 특성을 제공하도록 추가로 변형될 수 있다. 개인 관리 제품에서 사용되기 위한 단백질의 변형은 당업계에 잘 공지되어 있다. 예를 들면, 통상적으로 사용되는 방법은 미국 특허 제6,303,752호, 미국 특허 제6,284,246호 및 미국 특허 제6,358,501호에 기재되어 있다. 변형의 예에는 수-유 에멀션 증강을 촉진하기 위한 에톡실화, 친유적 상용가능성을 제공하기 위한 실옥실화, 및 비누 및 세제 조성물과의 상용가능성에서 도움을 주기 위한 에스테르화가 포함되나, 이들로 한정되지 않는다. 또한, 실크 단백질은 아민, 옥시란, 시아네이트, 카르복실산 에스테르, 실리콘 공폴리올, 실록산 에스테르, 사급화된 아민 지방족, 우레탄, 폴리아크릴아미드, 디카르복실산 에스테르 및 할로겐화된 에스테르를 포함하나 이들로 한정되지 않는 작용기로 유도체화될 수 있다. 또한, 실크 단백질은 디이민과의 반응 및 금속 염의 형성에 의해 유도체화될 수 있다.

"폴리펩티드"(및 "단백질")의 상기 정의와 일치하여, 이러한 유도체화된 및/또는 변형된 분자는 넓게 "폴리펩티드" 및 "단백질"로도 지칭된다.

실크 도프는 다른 종류의 섬유와 함께 방적될 수 있고/있거나 묶여질 수 있거나 편직될 수 있다. 예에는 중합체 섬유(예를 들면, 폴리프로필렌, 나일론, 폴리에스테르), 다른 식물 및 동물 공급원의 섬유 및 실크(예를 들면, 면, 울, 누에나방 또는 거미 실크), 및 유리 섬유가 포함되나, 이들로 한정되지 않는다. 바람직한 실시양태는 10% 폴리프로필렌 섬유와 함께 편직된 실크 섬유이다. 본 발명은 의료적, 산업적 또는 상업적 적용을 위한 섬유의 제조 및 생산에서 일반적으로 추구될 수 있는 임의의 원하는 특성, 예를 들면, 외관, 연성, 중량, 내구성, 방수성, 개선된 제조 비용을 향상시키기 위해 이러한 섬유 조합물의 제조가 용이하게 실시될 수 있음을 고려한다.

개인 관리 제품

화장품 및 피부 관리 조성물은 미용학적으로 허용가능한 매질 중에 유효량의 실크를 포함하는 무수 조성물일 수 있다. 이 조성물들의 용도는 피부 관리, 피부 세정, 메이크-업 및 주름방지 제품들을 포함하나, 이들로 한정되지 않는다. 화장품 및 피부 관리 조성물을 위한 실크의 유효량은 본 명세서에서 상기 조성물의 총 중량을 기준으로 약 10^-4 중량% 내지 약 30 중량%, 바람직하게는 약 10^-3 중량% 내지 15 중량%의 비율로서 정의된다. 이 비율은 화장품 또는 피부 관리 조성물의 종류의 함수로서 변경될 수 있다. 미용학적으로 허용가능한 매질용으로 적합한 조성물은 미국 특허 제6,280,747호에 기재되어 있다. 예를 들면, 미용학적으로 허용가능한 매질은 조성물의 총 중량을 기준으로 일반적으로 약 10 중량% 내지 약 90 중량%의 비율로 지방 물질을 함유할 수 있고, 이때 지방 층(phase)은 1종 이상의 액체, 고체 또는 반고체 지방 물질을 함유한다. 상기 지방 물질은 오일, 왁스, 검(gum) 및 소위 반죽(pasty) 지방 물질을 포함하나, 이들로 한정되지 않는다. 대안적으로, 상기 조성물은 안정한 분산액, 예컨대, 유중수 또는 수중유 에멀션의 형태일 수 있다. 또한, 상기 조성물은 항산화제, 보존제, 충전제, 계면활성제, UVA 및/또는 UVB 자외선차단제, 방향제, 비후제, 습윤화제 및 음이온성, 비이온성 또는 양쪽성 중합체, 및 염료 또는 안료를 포함하나 이들로 한정되지 않는 1종 이상의 보편적인 미용학적 또는 피부학적 첨가제 또는 보조제를 함유할 수 있다.

본 발명의 방법에 의해 제조된 실크를 포함하는 에멀션화된 물질을 사용하여 에멀션화된 화장품 및 유사 약물, 예를 들면, 세정 화장품(미용 비누, 안면 세척제, 샴푸, 린스 등), 모발 관리 제품(모발 염료, 모발 화장품 등), 기초 화장품(일반적인 크림, 에멀션, 면도 크림, 컨디셔너, 화장수, 면도 로션, 화장품 오일, 안면 마스크 등), 메이크-업 화장품(파운데이션, 눈썹 펜슬, 아이 크림, 아이 쉐도우, 마스카라 등), 방향성 화장품(향수 등), 탠닝 및 자외선차단 화장품(탠닝 및 자외선차단 크림, 탠닝 및 자외선차단 로션, 탠닝 및 자외선차단 오일 등), 손발톱 화장품(손발톱 크림 등), 아이라이너 화장품(아이라이너 등), 입술 화장품(립스틱, 립 크림 등), 구강 관리 제품(치약 등), 목욕 화장품(목욕 제품 등) 등을 제조할 수 있다.

화장품 조성물은 손발톱 관리용 제품, 예컨대, 손발톱 광택제(varnish)의 형태일 수도 있다. 손발톱 광택제는 본 명세서에서 미용학적으로 허용가능한 매질 중에 유효량의 실크를 포함하는, 손발톱의 치료 및 착색을 위한 조성물로서 정의된다. 손발톱 광택제 조성물에서 사용될 실크의 유효량은 본 명세서에서 상기 광택제의 총 중량을 기준으로 약 10^-4 중량% 내지 약 30 중량%의 비율로서 정의된다. 손발톱 광택제를 위한 미용학적으로 허용가능한 매질의 성분들은 미국 특허 제6,280,747호에 기재되어 있다. 손발톱 광택제는 전형적으로 용매 및 필름 형성 물질, 예컨대, 셀룰로스 유도체, 폴리비닐 유도체, 아크릴산 중합체 또는 공중합체, 비닐 공중합체 및 폴리에스테르 공중합체를 함유한다. 상기 조성물은 유기 또는 무기 안료도 함유할 수 있다.

모발 관리 조성물은 본 명세서에서 미용학적으로 허용가능한 매질 중에 유효량의 실크를 포함하는, 샴푸, 컨디셔너, 로션, 에어로졸, 겔 및 무스를 포함하나 이들로 한정되지 않는 모발 치료용 조성물로서 정의된다. 모발 관리 조성물에서 사용될 실크의 유효량은 본 명세서에서 상기 조성물의 총 중량을 기준으로 약 10^-2 중량% 내지 약 90 중량%의 비율로서 정의된다. 모발 관리 조성물을 위한 미용학적으로 허용가능한 매질의 성분들은 미국 특허공보 제2004/0170590호, 미국 특허 제6,280,747호, 미국 특허 제6,139,851호 및 미국 특허 제6,013,250호에 기재되어 있다. 예를 들면, 이 모발 관리 조성물은 수성, 알코올성 또는 수성-알코올성 용액일 수 있고, 수성-알코올성 용액의 경우 알코올은 바람직하게는 총 중량을 기준으로 약 1 중량% 내지 약 75 중량%의 비율로 존재하는 에탄올 또는 이소프로판올이다. 또한, 모발 관리 조성물은 전술된 바와 같이 1종 이상의 보편적인 미용학적 또는 피부학적 첨가제 또는 보조제를 함유할 수 있다.

모발 착색 조성물은 본 명세서에서 미용학적으로 허용가능한 매질 중에 유효량의 실크를 포함하는, 모발의 착색, 염색 또는 표백을 위한 조성물로서 정의된다. 모발 착색 조성물에서 사용될 실크의 유효량은 본 명세서에서 상기 조성물의 총 중량을 기준으로 약 10^-4 중량% 내지 약 60 중량%의 비율로서 정의된다. 모발 착색 조성물을 위한 미용학적으로 허용가능한 매질의 성분들은 미국 특허공보 제2004/0170590호, 미국 특허 제6,398,821호 및 미국 특허 제6,129,770호에 기재되어 있다. 예를 들면, 모발 착색 조성물은 일반적으로 무기 퍼옥시젠계(peroxygen-based) 염료 산화제와 산화가능한 착색제의 혼합물을 함유한다. 퍼옥시젠계 염료 산화제는 가장 통상적으로 과산화수소이다. 산화적 모말 착색제는 일차 중간체(예를 들면, p-페닐렌디아민, p-아미노페놀, p-디아미노피리딘, 하이드록시인돌, 아미노인돌, 아미노티미딘 또는 시아노페놀)와 이차 중간체(예를 들면, 페놀, 레소르시놀, m-아미노페놀, m-페닐렌디아민, 나프톨, 피라졸론, 하이드록시인돌, 카테콜 또는 피라졸)의 산화적 커플링에 의해 형성된다. 또한, 모발 착색 조성물은 산화 산, 격리제, 안정화제, 비후제, 완충제 담체, 계면활성제, 용매, 항산화제, 중합체, 비산화적 염료 및 컨디셔너를 함유할 수 있다.

또한, 실크는 화장품 및 코팅 조성물에서 사용될 입자의 분산성을 개선시키기 위해 안료 및 화장품 입자를 코팅하는 데 사용될 수 있다. 화장품 입자는 본 명세서에서 화장품 조성물에서 사용되는 미립자 물질, 예컨대, 안료 또는 불활성 입자로서 정의된다. 적합한 안료 및 화장품 입자는 무기 색상 안료, 유기 안료 및 불활성 입자를 포함하나, 이들로 한정되지 않는다. 무기 색상 안료는 이산화티탄, 산화아연, 및 철, 마그네슘, 코발트 및 알루미늄의 산화물을 포함하나 이들로 한정되지 않는다. 유기 안료는 D&C 레드 제36번, D&C 오랜지 제17번, D&C 레드 제7번, 제11번, 제31번 및 제34번의 칼슘 레이크, D&C 레드 제12번의 바륨 레이크, D&C 레드 제13번의 스트론튬 레이크, FD&C 옐로우 제5번의 알루미늄 레이크 및 카본블랙 입자를 포함하나, 이들로 한정되지 않는다. 불활성 입자는 탄산칼슘, 규산알루미늄, 규산칼슘, 규산마그네슘, 운모, 탈크, 황산바륨, 황산칼슘, 분말화된 나일론™, 과불소화된 알칸 및 다른 불활성 플라스틱을 포함하나, 이들로 한정되지 않는다.

실크는 치실에서도 사용될 수 있다(예를 들면, 미국 특허공보 제2005/0161058호 참조). 상기 치실은 단일필라멘트 방적사 또는 다중필라멘트 방적사일 수 있고, 섬유는 비틀려질 수 있거나 비틀려지지 않을 수 있다. 치실은 개개의 조각으로서 포장될 수 있거나, 조각을 임의의 원하는 길이로 절단하기 위한 절단기와 함께 롤 형태로 포장될 수 있다. 치실은 필라멘트 이외의 다양한 형태, 예컨대, 스트립 및 시트 등(그러나, 이들로 한정되지 않음)으로 제공될 수 있다. 치실은 다양한 물질, 예컨대, 왁스, 치실용 폴리테트라플루오로에틸렌 단일필라멘트 방적사(그러나, 이들로 한정되지 않음)로 코팅될 수 있다.

실크는 비누에서도 사용될 수 있다(예를 들면, 미국 특허공보 제2005/0130857호 참조).

안료 및 화장품 입자 코팅

안료 및 화장품 입자 코팅에서 사용될 실크의 유효량은 본 명세서에서 입자의 건조 중량을 기준으로 약 10^-4 중량% 내지 약 50 중량%, 바람직하게는 약 0.25 중량% 내지 약 15 중량%의 비율로서 정의된다. 사용될 실크의 최적양은 코팅될 안료 또는 화장품 입자의 종류에 의해 좌우된다. 예를 들면, 무기 색상 안료와 함께 사용될 실크의 양은 바람직하게는 약 0.01 중량% 내지 20 중량%이다. 유기 안료의 경우, 실크의 바람직한 양은 약 1 중량% 내지 약 15 중량%이지만, 불활성 입자의 경우 바람직한 양은 약 0.25 중량% 내지 약 3 중량%이다. 코팅된 안료 및 입자의 제조 방법들은 미국 특허 제5,643,672호에 기재되어 있다. 이 방법들은 텀블링하거나 혼합하면서 실크 수용액을 입자에 첨가하는 단계, 실크와 입자의 슬러리를 형성하는 단계, 및 실크 용액을 입자 상으로 건조하거나 분무 건조하거나 실크와 입자의 슬러리를 동결건조하는 단계를 포함한다. 이 코팅된 안료 및 화장품 입자는 화장품 제제, 페인트, 잉크 등에서 사용될 수 있다.

생체의학

실크는 상처 치유를 촉진하기 위한 붕대 상의 코팅물로서 사용될 수 있다. 이 적용의 경우, 붕대 물질을 유효량의 실크로 코팅한다. 상처 치유 붕대를 목적으로 하는 경우, 실크의 유효량은 본 명세서에서 붕대 물질의 중량을 기준으로 약 10^-4 중량% 내지 약 30 중량%의 비율로서 정의된다. 코팅될 물질은 임의의 연성, 생물학적 불활성 및 다공성 천 또는 섬유일 수 있다. 예에는 면, 실크, 레이온, 아세테이트, 아크릴, 폴리에틸렌, 폴리에스테르 및 이들의 조합이 포함되나, 이들로 한정되지 않는다. 천 또는 섬유의 코팅은 당업계에 공지된 다수의 방법에 의해 달성될 수 있다. 예를 들면, 코팅될 물질을, 실크를 함유하는 수용액 내로 침지시킬 수 있다. 대안적으로, 실크를 함유하는 용액을 분무 총을 이용하여 코팅될 물질의 표면 상에 분무할 수 있다. 또한, 롤러 코트 프린팅 공정을 이용하여 실크를 함유하는 용액을 표면 상에 코팅할 수 있다. 상처 붕대는 소독제, 예컨대, 요오딘, 요오드화칼륨, 포비돈 요오딘, 아크리놀, 과산화수소, 염화벤즈알코늄 및 클로로헥시딘; 경화 가속화제, 예컨대, 알란토인, 디부카인 하이드로클로라이드 및 클로로페닐아민 말레이트; 혈관수축제, 예컨대, 나파졸린 하이드로클로라이드; 수렴제, 예컨대, 산화아연; 및 딱지 생성제, 예컨대, 붕산을 포함하나 이들로 한정되지 않는 다른 첨가제를 포함할 수 있다.

실크 도프는 상처 드레싱 물질로서 필름의 형태로 사용될 수도 있다. 상처 드레싱 물질로서 비정질 필름 형태의 실크의 사용은 미국 특허 제6,175,053호에 기재되어 있다. 비정질 필름은 유효량의 실크를 함유하는, 결정도 10% 미만의 조밀한 비다공성 필름을 포함한다. 상처 관리용 필름의 경우, 실크의 유효량은 본 명세서에서 약 1 중량% 내지 99 중량%로서 정의된다. 또한, 상기 필름은 전술된 바와 같이 다른 단백질, 예컨대, 세리신, 및 소독제, 경화 가속화제, 혈관수축제, 수렴제, 및 딱지 생성제를 포함하나 이들로 한정되지 않는 다른 성분들을 함유할 수 있다. 세리신과 같은 다른 단백질은 조성물의 1 중량% 내지 99 중량%를 차지할 수 있다. 나열된 다른 성분들의 양은 바람직하게는 조성물의 중량을 기준으로 총 약 30 중량% 미만, 더욱 바람직하게는 약 0.5 중량% 내지 20 중량%이다. 상처 드레싱 필름은 전술된 물질들을 수용액에 용해시키고 불용성 물질들을 여과 또는 원심분리로 제거하고 상기 용액을 매끄러운 고체 표면, 예컨대, 아크릴판 상에 캐스트 성형한 후 건조함에 의해 제조될 수 있다.

실크 도프는 봉합사를 제조하는 데에도 사용될 수 있다(예를 들면, 미국 특허공보 제2005/0055051호 참조). 이러한 봉합사는 초고 분자량 섬유 및 실크 섬유로 만들어진 편직된 재킷의 특징이 될 수 있다. 폴리에틸렌은 강도를 제공한다. 폴리에스테르 섬유는 고분자량 폴리에틸렌과 직조되어 개선된 매듭 성질을 제공할 수 있다. 실크는 개선된 봉합사 인식 및 식별을 위한 흔적을 제공하도록 상반된 색상으로 제공될 수 있다. 또한, 실크는 다른 섬유보다 더욱 조직 순응적이어서 봉합사의 말단과 주변 조직 사이의 유해한 상호작용에 대한 우려 없이 말단이 매듭에 가깝게 절단될 수 있게 한다. 고강도 봉합사의 취급성 또한 봉합사를 코팅하는 다양한 물질을 사용하여 향상시킬 수 있다. 봉합사는 유리하게는 에티본드(Ethibond) 제5번 봉합사의 강도를 갖지만, 제2번 봉합사의 직경, 감촉 및 매듭-능력을 갖는다. 그 결과, 봉합사는 대부분의 정형외과 수술, 예컨대, 회전근개 복구, 아킬레스건 복구, 무릎힘줄 복구, ACL/PCL 재구성, 둔부 및 어깨 재구축 수술, 및 봉합사 나사못(anchor)에서 또는 봉합사 나사못과 함께 사용되는 봉합사용 대체물을 위해 이상적이다. 봉합사는 비코팅될 수 있거나, 또는 예를 들면, 노끈의 윤활성, 매듭 안전성 또는 마찰 내성을 개선하기 위해 왁스(밀랍, 석유 왁스, 폴리에틸렌 왁스 등), 실리콘(다우 코닝 실리콘 유체 202A 등), 실리콘 고무, PBA(폴리부틸레이트 산), 에틸 셀룰로스(필로델) 또는 다른 코팅물로 코팅될 수 있다.

실크 도프는 스텐트의 제조를 위해서도 사용될 수 있다(예를 들면, 미국 특허공보 제2004/0199241호 참조). 예를 들면, 관내 스텐트 및 이식편을 포함하는 스텐트 이식편이 제공되고, 이때 상기 스텐트 이식편은 실크를 포함한다. 실크는 스텐트 이식편을 수용하는 숙주에서 반응을 유도하고, 이때 상기 반응은 실크 스텐트 이식편과 이 실크 스텐트 이식편의 실크에 인접한 숙주 조직 사이의 향상된 접착을 야기할 수 있다. 임의의 다양한 수단으로, 예를 들면, 실크를 이식편 내로 섞어 직조하거나 (예를 들면, 접착제 또는 봉합사로) 실크를 이식편에 접착시킴으로써 실크를 이식편에 부착시킬 수 있다. 실크는 실, 노끈, 시트, 파우더 등의 형태로 존재할 수 있다. 스텐트 이식편 상의 실크의 위치에 대하여, 실크는 스텐트의 외부에만 부착될 수 있고/있거나, 실크는 스텐트 이식편의 원거리 영역에 부착됨으로써 숙주에서 상기 원거리 영역을 이웃하는 조직에 고착시키는 것을 보조할 수 있다. 원하는 치료 부위 및 성질에 따라 매우 다양한 스텐트 이식편이 본 발명의 내용 내에서 사용될 수 있다. 스텐트 이식편은 예를 들면, 이분된 또는 튜브 이식편, 실린더형 또는 점점 가늘어지는 이식편, 자가 팽창가능한 또는 풍선 팽창가능한 이식편, 단일체 또는 모듈형 이식편 등일 수 있다.

실크 이외에, 스텐트 이식편은 실크의 일부 또는 전부 상에 코팅물을 함유할 수 있고, 이때 코팅물은 스텐트 이식편의 삽입시 숙주 내로 분해되고, 이에 따라 코팅물은 실크와 숙주 사이의 접촉을 지연시킨다. 적합한 코팅물은 젤라틴, 분해가능한 폴리에스테르(예를 들면, PLGA, PLA, MePEG-PLGA, PLGA-PEG-PLGA, 및 이들의 공중합체 및 블렌드), 셀룰로스 및 셀룰로스 유도체(예를 들면, 하이드록시프로필 셀룰로스), 폴리사카라이드(예를 들면, 히알루론산, 덱스트란, 덱스트란 설페이트, 키토산), 지질, 지방산, 당 에스테르, 핵산 에스테르, 폴리무수물, 폴리오르토에스테르 및 폴리비닐알코올(PVA)을 포함하나, 이들로 한정되지 않는다. 실크 함유 스텐트 이식편은 생물학적 활성제(약물)를 함유할 수 있고, 이때 상기 활성제는 스텐트 이식편으로부터 방출된 후 스텐트 이식편이 삽입된 숙주에서 향상된 세포 반응(예를 들면, 세포 또는 세포외 매트릭스 침착) 및/또는 섬유형성 반응을 유도한다.

또한, 실크 도프는 생체외에서 인대 및 힘줄을 생성하기 위한 매트릭스를 제조하는 데 사용될 수 있다(예를 들면, 미국 특허공보 제2005/0089552호 참조). 실크-섬유계 매트릭스는 다능성 세포, 예컨대, 골수간질세포(BMSC)로 시딩될 수 있다. 생체공학 인대 또는 힘줄은 유리하게는 인가된 기계적 힘의 방향으로의 세포 배향 및/또는 매트릭스 주름 패턴을 특징으로 하고, 또한 기계적 힘 또는 자극이 인가되는 경우 이러한 힘 또는 자극에 의해 생성된 기계적 부하의 축을 따라 콜라겐 타입 I, 콜라겐 타입 III 및 피브로넥틴 단백질을 포함하는 인대 및 힘줄 특이적 마커의 생성을 특징으로 한다. 바람직한 실시양태에서, 인대 또는 힘줄은 나선형 구조로 정렬되는 섬유 다발의 존재를 특징으로 한다. 생성될 수 있는 인대 또는 힘줄의 일부 예에는 전방십자인대, 후방십자인대, 회전근개힘줄, 팔꿈치 및 무릎의 안쪽곁인대, 손의 굽힘힘줄, 발목의 외측인대, 및 턱 또는 턱관절의 힘줄 및 인대가 포함된다. 본 발명의 방법에 의해 제조될 수 있는 다른 조직은 연골(관절 및 반월), 골, 근육, 피부 및 혈관을 포함한다.

실크 도프는 하이드로겔의 제조에도 사용될 수 있다(예를 들면, 미국 특허공보 제2005/0266992호 참조). 실크 피브로인 하이드로겔은 이것이 조직 공학 스카폴드(scaffold), 세포 배양용 기질, 상처 및 화상 드레싱, 연질 조직 대체물, 골 충전제, 및 약학적 또는 생물학적 활성 화합물용 지지체로서 사용될 수 있게 하는 개방된 공극 구조를 특징으로 할 수 있다.

또한, 실크 도프는 피부학적 조성물의 제조에 사용될 수 있다(예를 들면, 미국 특허공보 제2005/0019297호 참조). 나아가, 상기 도프는 지속 방출 조성물의 제조에도 사용될 수 있다(예를 들면, 미국 특허공보 제2004/0005363호 참조).

직물(textile)

실크 도프는 직물에서의 추후 사용을 위한 섬유 표면용 코팅물의 제조에도 사용될 수 있다. 이것은 섬유 상의 단백질 필름 단층을 제공하여 매끄러운 마감을 발생시킨다. 미국 특허 제6,416,558호 및 제5,232,611호에는 마감처리 코트를 섬유에 부가하는 것이 기재되어 있다. 이 문헌들에 개시된 방법들은 우수한 감촉 및 매끄러운 표면을 제공하도록 섬유를 마감처리하는 다능성의 예를 제공한다. 이 적용의 경우, 섬유는 유효량의 실크로 코팅된다. 직물에서 사용될 섬유 코팅을 목적으로 하는 경우, 실크의 유효량은 본 명세서에서 섬유 물질의 중량을 기준으로 약 1 중량% 내지 약 99 중량%의 비율로서 정의된다. 섬유 물질은 면의 직물 섬유, 폴리에스테르, 예컨대, 레이온 및 라이크라™, 나일론, 울, 및 천연 실크를 포함하는 다른 천연 섬유를 포함하나, 이들로 한정되지 않는다. 실크를 섬유 상에 도포하기에 적합한 조성물은 보조용매, 예컨대, 에탄올, 이소프로판올, 헥사플루오란올, 이소티오시아노우라네이트, 및 물과 혼합되어 용액 또는 미세에멀션을 형성할 수 있는 다른 극성 용매를 포함할 수 있다. 실크 함유 용액을 섬유 상으로 분무할 수 있거나, 또는 섬유를 상기 용액 내에 침지시킬 수 있다. 필요한 것은 아니지만, 코팅된 물질의 순간(flash) 건조가 바람직하다. 대안적인 프로토콜은 실크 조성물을 직조된 섬유 상에 도포하는 것이다. 이 도포의 이상적인 실시양태는 신장될 수 있는 직물, 예컨대, 스타킹용으로 사용되는 직물을 코팅하기 위한 실크의 사용이다.

복합 재료

실크 섬유는 패널 보드 및 다른 건축 재료를 제조하기 위해 또는 목재 또는 입자 보드를 대체하는 성형된 가구 및 벤치탑을 제조하기 위해 폴리우레탄, 다른 수지 또는 열가소성 섬유에 첨가될 수 있다. 이 복합물들은 빌딩 및 자동차 구축, 특히 지붕 및 문 패널에서도 사용될 수 있다. 실크 섬유는 수지를 강화시켜 상기 물질을 더 강하게 만들고 다른 입자 보드 및 복합 재료와 동등한 또는 보다 우수한 강도를 갖는 보다 가벼운 중량의 구축을 가능하게 한다. 실크 섬유는 단리되어 합성 복합물-형성 수지에 첨가될 수 있거나, 또는 식물-유래된 단백질, 전분 및 오일과 조합되어 사용됨으로써 생물학적 복합 재료를 제조할 수 있다. 이러한 재료의 제조 공정은 일본 특허공보 제200428424호, 미국 특허공보 제2005175825호, 미국 특허 제4,515,737호, 일본 특허 제47020312호 및 국제 특허공보 제WO 2005/017004호에 기재되어 있다.

종이 첨가제

실크의 섬유 성질은 제지에 강도 질 감촉을 부가할 수 있다. 실크 종이는 면 펄프에서 실크 실 반점을 형성하여 선물 포장재, 공책 커버, 운반 가방용으로 사용되는 고도로 매끄러운 수제 종이를 제조함에 의해 제조된다. 실크 도프로부터 종이 제품을 제조하는 공정은 일본 특허공보 제2000139755호에 일반적으로 기재되어 있다.

진보된 재료

본 발명의 실크 도프로부터 제조된 실크는 상당한 인성(toughness)을 갖고 젖었을 때 이 성질을 유지함에 있어서 다른 실크보다 뛰어나다(Hepburn et al., 1979).

의류 직물 산업에서 실제적인 성장 영역은 기술적 및 기능적인 직물이다. 건강하고 고도로 기능적이고 환경 친화적이고 개성 있는 직물 제품에 대한 요구가 증가하고 있다. 젖었을 때 성질을 변화시키지 않고 특히 그의 강도 및 연신성을 유지하는 섬유, 예컨대, 본 발명의 섬유는 스포츠 및 레저 의복뿐만 아니라 작업복을 위한 기능성 의류 및 보호 의류용으로 유용하다.

무기 및 감시 기술에서의 발달은 개개의 보호 장치 및 전투-분야와 관련된 시스템 및 구조물에서 신속한 혁신이다. 보편적인 요건, 예컨대, 연장된 노출에 대한 물질 내구성, 두터운 착용 및 외부 환경으로부터의 보호 이외에, 본 발명의 실크 도프로부터 제조된 실크 직물은 탄도-발사체, 불 및 화학물질에 대한 내성을 갖도록 가공될 수 있다. 이러한 물질들의 제조를 위한 공정은 국제 특허공보 제WO 2005/045122호 및 미국 특허공보 제2005268443호에 기재되어 있다.

실시예

실시예 1 - 꿀벌 실크 단백질의 재조합 생성 및 정제

재조합 발현 구성체를 생성하기 위해, 신호 펩티드를 갖지 않는 4종의 꿀벌 실크 유전자 서열들(진뱅크 검색 번호: FJ235088. FJ235089, FJ235090, FJ235091)을, 하기 올리고뉴클레오티드 프라이머 세트를 사용하여 수터랜드(Sutherland) 등의 문헌(2006)에 기재된 cDNA 클론으로부터 PCR로 증폭하였다:

AmelFl : GGAATT C TC ATG A GT TTG GAG GGG CCG GGC AAC TCG (서열 번호 101) 및 CGGC GGATCC TTA TTA AAA TAC GTT GCT CTT CAA GT (서열 번호 102);

AmelF2: GGAATT C TC ATG A GC CGC GTG ATT AAT CAC GAG TCC CTG (서열 번호 103) 및 CGGC GGATCC TTA TTA TTC CAA CTT TGC TAC ATG TAT TTT C (서열 번호 104);

AmelF3: GGAATT C CC ATG G GC GTC GAG GAA TTC AAG TCC TCG (서열 번호 105) 및 CGGC AGATCT TTA TTA AAA TTT TTT ATC CTC AAT A (서열 번호 106); 및

AmelF4: GGAATT C CC ATG G CA AGG GAA GAG GTG GAG ACA CGG (서열 번호 107) 및 CGGC GGATCC TTA TTA CTT CAC CTC CCA TTC TTC ATT C (서열 번호 108) (클로닝 제한 효소 부위는 밑줄친 굵은 글씨체로 표시되어 있고, cDNA 서열에 일치하는 서열은 이탤릭체로 표시되어 있음).

PCR 앰플리콘(amplicon)을 pET14b 발현 벡터(노바겐)의 제한 효소 부위(AmelF1 및 AmelF2: BspH1 및 Bam HI; AmelF3: Nco1 및 Bgl II; AmelF4: Nco1 및 Bam HI) 내로 클로닝하고 서열들을 발현 전에 DNA 서열분석으로 검증하였다.

구성체를 로세타(Rosetta) 2(DE3) 전능 세포(노바겐) 내로 형질전환시키고, 실크 단백질을 진탕 플라스크 내의 50 ㎖ 밤새 발현 즉석 TB 배지(노바겐) 중에서 먼저 발현시켰다. 4종의 꿀벌 실크 단백질 AmelF1-F4를 20℃에서 이. 콜라이 세포 내에서 가용성 형태로 합성하고 30℃ 및 37℃에서 불용성 형태로 합성하였다. SDS-PAGE(도 1) 후 비교 단백질 밴드 강도에 의해 판단될 때 단백질의 최대 수율은 단백질을 봉입체로부터 회수하면서 30℃ 이상의 온도에서 연장된 기간(24시간 내지 36시간) 동안 발현을 수행하였을 때 얻어졌다. 질량 분광법으로 단백질의 종류를 확인하면서 정량적 겔 밴드 강도 분석을 수행하였을 때, 봉입체로부터 회수된 단백질은 본질적으로 순수한(>95%) 실크 단백질임이 확인되었다. 후속 분석은 봉입체로부터 가용화된 단백질이 천연 유사 구조로 자가 조립됨을 보였다. 따라서, 모든 후속 발현은 재조합 단백질이 봉입체로부터 회수되도록 하는 조건 하에 수행되었다.

단백질 수율을 증가시키기 위해, 대규모 유가 발효 공정을 개발하였고 AmelF3에 대해 최적화시켰다. 최소 배지(부피 1.6 ℓ로부터 출발함)를 사용하여 2 ℓ 바이오스타트(Biostat) B 배양 용기(사르토리우스 스테딤(Sartorius Stedim), 독일 멜순겐 소재) 내에서 발효를 수행하였다. 글루코스를 초기 탄소 공급원으로서 사용하였고 IPTG로 실크 단백질 발현을 유도한 후 탄소 공급원을 글리세롤 공급물로 교체하였다. 초기 배지는 하기 성분들을 함유하였다(1 ℓ당): KH₂PO₄, 13.3 g; (NH₄)₂HPO₄, 4 g 및 시트르산 1.7 g. 배지의 pH를 2 M NaOH를 사용하여 7.0의 최종 값으로 조절하였다. 하기 성분들을 개별적으로 멸균한 후 첨가하였다(최종 배지 1 ℓ당): 40 ㎖의 50 중량/부피% 글루코스, 5 ㎖의 1 M MgSO₄; 130 ㎕의 0.1 M 티아민 하이드로클로라이드; 1 ㎖의 100 mg/㎖ 앰피실린 및 5 ㎖의 비타민/미량 금속 함유 용액(용액 1 ℓ당): 바이오틴, 0.2 g; CuSO₄.5H₂O, 2.0 g; NaI, 0.08 g; MnSO₄.H₂O, 3.0 g; Na₂MoO₄.2H₂O, 0.2 g; 붕산 0.02 g; CoCl₂.6H₂O, 0.5 g; ZnCl₂, 7.0 g; FeSO₄.7H₂O, 22.0 g; CaSO₄.2H₂O, 0.5 g 및 H₂SO₄, 1 ㎖.

4종의 균주를 위한 발효 접종물을 발효기에서 사용된 배지와 동일한 배지 중에서 37℃에서 20시간 동안 배양하였다. 접종물이 발효 용기로 전달되면, 상기 배지의 pH를 조절하고 10 중량/부피% NH₄OH 또는 10% 중량/부피% H₃PO₄를 첨가하여 7.0으로 조절하였다. 온도를 37℃로 조절하고, 교반 속도를 1100 rpm까지 조작하고 필요한 경우 순수한 산소가 공기 공급물 중에 풍부하게 함으로써 용해된 산소(DO) 농도를 40% 대기 포화도 이상으로 유지하였다.

배양물이 약 20의 600 nm(OD_600nm) 값의 흡광도로 성장되었을 때(접종 후 약 10시간), IPTG를 최종 농도 1 mM까지 첨가하였다. DO의 급격한 상승(접종 후 약 12시간)에 의해 표시되는 바와 같이 글루코스의 전부가 소모될 때까지 발효기를 회분 방식으로 작동시켰다. 글리세롤 첨가 단계에서 400 ㎖의 62 부피/부피% 글리세롤 용액을 50 ㎖/h의 속도로 발효기 내로 공급하였다. 배양물을 24시간 동안 성장시킨 후, 세포를 원심분리로 수거하여 -80℃에서 저장하였다. 이 조건 하에, 발효물의 OD_600nm 값은 34이었고, 가용화 후 정제된 재조합 AmelF3의 수율은 발효물 1 ℓ당 약 2.5 g이었다. 동일한 발효 조건을 이용하여 다른 꿀벌 실크 단백질을 발현시켰다. 실크 단백질 AmelF1, AmelF2 및 AmelF4를 발현하는 균주들을 각각 30, 67 및 57의 OD_600nm 값까지 성장시켰다. 가용화 후 정제된 재조합 단백질 AmelF1, AmelF2 및 AmelF4의 수율은 발효물 1 ℓ당 각각 약 0.2, 1.5 및 1.9 g이었다.

최적화된 유가 발효 시스템으로부터 2.5 g/ℓ의 정제된 단백질이라는 수율은 임의의 재조합 실크 단백질에 대한 보고된 발현 수준 중에서 단연 최대의 발현 수준이다. 이러한 높은 수율에 기여하는 인자는 꿀벌 피브로인 유전자의 크기 및 성질 및 실크 단백질의 구조적 성질을 포함한다. 거미의 잘-연구된 드래그라인(dragline) 실크 및 누에의 고치 실크를 코딩하는 유전자들의 큰 크기(>10 kbp) 및 고도로 반복적인 성질과 대조적으로, 꿀벌 실크 유전자들은 그들의 DNA 서열들에서 훨씬 적은 반복을 가지면서 작다(약 1 kbp)(Sutherland et al., 2006). 보다 작은 크기 및 감소된 수준의 반복은 꿀벌 유전자들이 고도로 반복적인 뉴클레오티드 서열의 형질전환 발현으로부터 비롯된 조기 번역 종결 및 절두를 포함하는 유전적 불안정성에 민감하지 않음을 의미한다.

가용성 또는 봉입체 제조를 위한 제조자의 프로토콜에 따라 버그버스터 마스터 믹스(노바겐)로 반복적으로 처리한 후 봉입체 내의 실크 단백질을 이. 콜라이 세포로부터 정제하였다. 단백질 용액을 4% 내지 12% 구배(인비트로겐)를 사용하는 SDS 폴리아크릴아미드 겔 전기영동(SDS-PAGE)으로 분석하였다. 재조합 실크 단백질 확인은 이미 보고된 바와 같이 도립 질량 분광법으로 검증하였다(Sutherland et al., 2006).

봉입체 내의 실크 단백질을 60℃에서 2시간 동안 항온처리하여 3% 나트륨 도데실 설페이트(SDS) 중에서 가용화시켰다. 용액 중 단백질 농도를 콴티프로(QuantiPro) BCA 분석 키트(시그마)를 사용하여 측정하였다. 요구되는 경우, 4종의 재조합 꿀벌 실크 단백질 각각의 용액을 등몰 비율로 혼합하였다. KDS 침전을 야기하는 5 g/ℓ KCl 용액에 대한 투석으로 과량의 SDS를 단백질 용액으로부터 제거하였다. 침전물을 16000 g에서 5분 동안 원심분리하여 제거하였다.

실시예 2 - 푸리에 변환 적외선 분광법( FTIR )

푸리에 변환 적외선 분광법을 이용하여 천연 꿀벌 실크의 단백질 구조와 재조합 꿀벌 실크의 단백질 구조를 비교하였다. 천연 꿀벌 실크 시트를 상업용 꿀벌통으로부터 수득하여 클로로포름 중에서 광범위하게 세척하여 왁스를 제거하고 온수 중에서 광범위하게 세척하여 수용성 오염물질들을 제거하였다. 4종의 재조합 꿀벌 실크 단백질 각각의 용액을 등몰 비율로 혼합하고, 필름으로 캐스트 성형하고 건조하였다. 이 샘플들로부터의 적외선 스펙트럼을, i-시리즈 이미징 적외선 현미경 부속품이 장착된 퍼킨-엘머 시스템 2000 푸리에 변환 분광계를 이용하여 전달 모드로 얻었다. 스펙트럼은 스펙트럼 소프트웨어(버젼 5.3.1)의 이용에 의해 수집되었고 4 cm^-1의 해상도로 수집된 256개 스캔의 평균을 나타내었다. 수집 후 데이터 조작 및 분석을 그램스(Grams)/AI 소프트웨어 v5.05를 이용하여 수행하였다. 각각의 실크 스펙트럼에 대한 아미드 I 영역의 탈회전은 도 2에 도시되어 있다. 결과 및 구성 이차 구조 배정의 요약은 표 2에 제시되어 있다.

FTIR 곡선 피팅 요약
천연 꿀벌 실크		재조합 실크
주파수(cm^-1)	아미드 I 영역(%)	주파수(cm^-1)	아미드 I 영역(%)	배정
1717		1710		COOH
1693		1693		측쇄
1670	25	1673	30	β-시트 및 측쇄
1651	23	1655	26	코일드 코일
1642	13	1643	7	코일드 코일
1628	29	1632	26	코일드 코일
1604	10	1610	11	β-시트

FTIR 결과는 천연 꿀벌 실크가 이전의 서열에 기초한 예측과 일치하는 약 65% 코일드 코일 구조를 함유함을 암시한다(Sutherland et al., 2006). 재조합 실크 스펙트럼은 천연 실크 스펙트럼과 매우 유사하고, 재조합 실크는 59% 코일드 코일 구조를 함유하는 것으로 평가된다.

실시예 3 - 건식 방적

봉입체를 3% SDS 중에서 가용화시켜 일반적으로 0.5 중량% 내지 2 중량%의 단백질 및 3 중량% 이하의 단백질로 구성된 가용성 꿀벌 피브로인 용액을 얻었다. KCl 침전으로 과량의 SDS를 실크 단백질 용액으로부터 제거하였다. 칼륨 침전은 (침전물의 중량을 측정하였을 때) SDS의 95% 이하, 예컨대, 70% 내지 80%를 제거하였으나 (용액 중 단백질 농도를 측정하였을 때) 10% 미만의 단백질을 제거하였다. 꿀 유사 점도(약 10 중량% 내지 15 중량% 단백질)가 얻어질 때까지 실크 용액을 20 중량% 폴리에틸렌 글리콜(PEG, MW 8000, 시그마) 또는 슬라이드-A-라이저(Slide-A-Lyzer) 농축 용액에 대한 연장된 투석으로 농축하였다. 공기 중에서 한 방울의 농축된 실크 도프를 한 쌍의 족집게의 뾰족한 말단 사이에 매달리게 하고 상기 족집게를 개방하여 미세한 실을 형성하였다(도 3A). 이러한 단회 연신 실은 공기 중에서 안정하였지만 물에 용해되었다. 그 다음, 섬유를 90% 메탄올 및 10% 물이 함유된 배쓰(bath) 내에 담구고 약 2배 길이로 다시 한번 연신하고 공기 건조하였다(도 3B). 이중 연신 실은 물에서 가용성을 나타내지 않았다. 단회 연신 섬유 및 이중 연신 섬유를 편광 렌즈를 갖는 광학 현미경 및 제이스(Zeiss) EVO LS15 환경 스캐닝 전자 현미경으로 조사하였다.

ESEM에 의해 이미지화된 재조합 실크 실(도시되지 않음)은 횡단면에서 원형이었고 그의 길이를 따라 직경에서 꽤 균일하였다. 단회 연신 섬유는 염 결정일 수 있는 그의 표면에 부착하는 작은 본체를 가졌으나, 이중 연신 섬유는 매끄러운 표면을 가졌다. 편광 광학 현미경은 단회 연신 섬유가 복굴절을 나타내지 않으나, 이중 연신된 섬유가 강한 복굴절을 나타냄을 보여주었다(도 3).

단회 연신 섬유, 이중 연신 섬유 및 재조합 실크 필름을 호주 신크로트론(Synchrotron)의 SAXS/WAXS 광선에서 광시야각 x-선 산란으로 분석하였다. 0.886 Å의 파장 및 0.558 m의 카메라 길이는 약 0.07 Å^-1 내지 1.4 Å^-1의 q-범위를 제공하였고, 상기 q-범위를 은 베헤네이트 표준물을 사용하여 보정하였다. 상기 필름 및 단회 연신 섬유에 대한 WAXS 패턴은 SDS 결정으로부터의 강한 신호에 의해 지배되었으나, 이것은 이중 연신 섬유에서는 검출될 수 없었다. 따라서, 본 발명자들은 이중 연신된 실이 단회 연신 실에서 발견된 단위 길이당 0.1% 미만의 SDS 결정을 함유한다고 계산하였다. 재조합 실크로부터의 단백질 산란 패턴은 기법의 강한 SDS 회절 제한 민감성으로 인해, 또는 매우 미세한 이중 연신된 섬유의 경우 낮은 신호-대-노이즈(noise) 비율로 인해 분석될 수 없었다.

재조합 꿀벌 실크 실의 강도 및 연신성을 인스트론 인장성 시험기 모델 4501 상에서 2.5 mm/분의 속도로 측정하였다. 시험을 21℃ 및 65% 상대 습도에서 공기 중에서 수행하였다. 시험 전에, 각각의 섬유를 플라스틱 틀 내에 3 mm 홈을 가로질러 배치하고 에폭시 아교(glue)로 고정시켰다. 각각의 섬유의 게이지 길이(L_o) 및 직경을 광학 현미경 상에서 측정하였다. 표 3은 재조합 실크 섬유의 기계적 성질을 꿀벌 실크선으로부터 연신된 천연 섬유의 기계적 성질과 비교한다.

천연 섬유와 비교된 재조합 꿀벌 실크 섬유의 인장성
	직경(㎛)	파단 응력(MPa)	파단 변형률(%)	실제 파단 응력(MPa)
단회 연신 섬유	30±5	15±3	225±10	50±12
이중 연신 섬유	13±7	150±39	47±26	213±63
천연 섬유 (Hepburn, 1979)	9	132	204	400

실시예 4 - 습식 방적

실크 단백질을 일반적으로 실시예 1에 기재된 바와 같이 제조하였다. 일반적으로, SDS 가용화 후 단백질 농도는 약 3% 실크 단백질이었다. 단백질 용액이 보다 낮은 농도를 갖는 경우, 상기 단백질 용액은 이 용액이 3% 내지 6% 실크 단백질을 함유할 때까지 20 중량% 폴리에틸렌 글리콜(PEG, MW 8000, 시그마) 또는 슬라이드-A-라이저 농축 용액(피어스)에 대한 연장된 투석에 의해 농축되었다.

AmelF1-4의 등몰 혼합물들 각각 또는 AmelF3 단독의 농축된 단백질 용액들을 10 cm x 100 ㎛ 모세관 튜빙을 통해 10 m/분의 속도로 메탄올 용액(50% 내지 90% 메탄올) 내로 압출하여 미세하고 연속적인 실이 형성되게 하였다. 상기 실을 공기 중에서 건조하고 편광 렌즈를 갖는 광학 현미경으로 조사하였다. 상기 실은 이 실 내의 단백질들이 지향적으로 정렬되어 있음을 표시하는 상당한 복굴절을 보였다(도 4A). 공기 건조된 섬유를 90% 메탄올 및 10% 물이 함유된 배쓰 내에 담구고 약 2배 길이(도 4B) 또는 4배 길이(도 4C)로 다시 한번 연신시키고 공기 건조하였다. 재조합 꿀벌 실크 실의 강도 및 연신성을 인스트론 인장성 시험기 모델 4501 상에서 2.5 mm/분의 속도로 측정하였다. 시험을 21℃ 및 65% 상대 습도에서 공기 중에서 수행하였다. 시험 전에, 각각의 섬유를 플라스틱 틀 내의 3 mm 홈을 가로질러 배치하고 에폭시 아교로 고정시켰다. 각각의 섬유의 게이지 길이(L_o) 및 직경을 광학 현미경 상에서 측정하였다.

표 4 및 5는 연신되지 않은 재조합 실크 섬유의 기계적 성질을 보여준다. 연신은 물에서 더 강하고 불용성을 나타내며 높은 복굴절을 갖는 실을 생성하였다.

연신하거나 연신하지 않으면서 농축된 실크 단백질 도프를 메탄올 내로 압출한 후 재조합 꿀벌 실크 섬유의 인장성
	직경(㎛)	파단 응력(MPa)	파단 변형률(%)
연신되지 않은 섬유 (4종의 단백질의 등몰 혼합물)	22-39	70-78	200-250
2배 길이로 연신된 섬유 (4종의 단백질의 등몰 혼합물)	17-22	50-92	80-160
4배 길이로 연신된 섬유 (4종의 단백질의 등몰 혼합물)	19-21	150-161	38-91
연신되지 않은 섬유(AmelF3)	39-41	39-53	256-275
2배 길이로 연신된 섬유(AmelF3)	32-42	68-80	88-211
4배 길이로 연신된 섬유(AmelF3)	28-30	99-117	131-154

꿀벌 실크 섬유의 기계적 성질
제작 방법	구성 단백질	직경(㎛)	파단 응력(MPa)	파단 변형률(%)	인성(MPa)
70% MeOH 내로 압출됨	AmeF1-4 AmeF3	31±2 45±2	70±4 50±3	190±11 243±10	91±7 105±6
70% MeOH 내로 압출된 후 90% MeOH에서 약 100% 연신됨	AmeF1-4 AmeF3	21±1 34±2	133±11 97±7	94±11 129±15	85±9 97±10
70% MeOH 내로 압출된 후 90% MeOH에서 약 300% 연신됨	AmeF1-4 AmeF3	17±1 23±1	203±10 178±20	51±5 68±9	70±8 85±18
천연³	천연	9	132	204	NG
¹d₀ 및 d¹이 초기 섬유의 직경 및 연신된 섬유의 직경인 경우 (d₀/d₁)²로서 계산된다.

실시예 5- 원형 이색성( CD )

AmelF3 꿀벌 실크 단백질을 이. 콜라이의 봉입체 내로 발현시켰다. 등가 건조 중량의 세제 나트륨 도데실 설페이트(SDS)를 사용하여 AmelF3 봉입체를 언폴딩(unfolding)시켜 2% 내지 4%의 단량체 단백질 용액을 생성하였다. 동적 광 산란(DLS)은 100 mM NaCl 중에 10배 희석된 단백질-세제 용액 중 입자의 수력학적 직경을 9.2 +/- 0.1 nm(98.2%의 입자 부피를 함유하는 피크)로서 측정하였다. 동일한 실험 조건 하에 단백질을 갖지 않은 3% SDS 용액 중 SDS 마이셀(micelle)의 직경은 5.5 +/- 0.2 nm에서 단일 피크였다. SDS-단백질 용액에서 SDS 마이셀이 전혀 검출되지 않았는데, 이것은 SDS의 대다수가 단백질에 결합됨을 확인시켜준다.

KCl을 사용하여 SDS를 제거함으로써 단백질을 리폴딩(refolding)시켰다. 칼륨 도데실 설페이트는 SDS보다 상당히 더 낮은 가용성을 갖고 용액으로부터 침전되고, 원심분리에 의해 제거될 수 있다. 단백질 용액을 물에 대해 투석하여 염 농도를 감소시킨 후 PEG8000에 대한 투석으로 농축시켜 3% 내지 4% 단백질 및 0.2% 내지 0.4% SDS 농도를 발생시켰다. AmelF3 용액이 (생리학적 염 농도와 유사한) 100 mM NaCl 중에서 10배 희석되었을 경우, 입자 직경은 AmelF3 코일드 코일에 대해 계산된 대략적인 입자 직경과 일치하는 20.3 +/- 0.7 nm(86.8%의 입자 부피를 함유하는 피크)까지 증가되었다.

0.01 mm 경로 길이 샌드위치 석영 셀(노바 바이오테크, 미국 캘리포니아주 엘 카존 소재) 내에 보유된 꿀벌 AmelF3 용액(0.12%)의 CD 스펙트럼을, 온도 조절기를 갖는 아비브(AVIV) 모델 410 분광계(아비브 바이오메디칼 인코포레이티드, 미국 뉴저지주 레이크우드 소재)를 이용하여 수집하였다. 모든 샘플들을 260 nm부터 180 nm까지 1 nm 밴드폭으로 25℃에서 스캐닝하고, 결과의 평균을 4회 반복된 실험으로부터 산출하였다. AmelF3 용액의 CD 스펙트럼은 220 nm 및 209 nm에서 강한 스펙트럼 최소치를 보였고 코일드 코일 구조를 지지하는 1.02의 220 nm/209 nm 비율을 보였다. 1 이상의 220 nm/209 nm 비율은 코일드 코일을 표시하는 반면, 0.86 미만의 비율은 단리된 나선을 표시한다. DLS 측정은 SDS를 AmelF3 용액에 다시 첨가한 후에 수력학적 입자 직경이 원래의 단량체 용액에서 관찰된 크기로 감소함을 표시하였는데, 이것은 단백질이 천연 유사 실크 단백질 구조로 폴딩됨에 있어서 대부분의 SDS의 제거가 필요조건임을 확인시켜준다. AmelF3 단백질과 대조적으로, 아피스 세라나(Apis cerana)로부터의 상동성 단백질의 His-태깅된 재조합 형태들(versions)은 유사한 농도에서 단량체 상태 및 우세하게 랜덤 코일 상태로 남아 있었다(Shi et al., 2008). 이 결과는 낮은 수준의 SDS의 존재 하에 제조된 경우 AmelF3만이 천연 유사 실크 분자 구조를 채택하도록 폴딩됨을 보여준다.

넓게 기재된 본 발명의 사상 또는 범위로부터 벗어나지 않으면서 특정 실시양태들에서 나타낸 본 발명에 다수의 변경 및/또는 변형을 가할 수 있음이 당업자에 의해 인식될 것이다. 따라서, 본 실시양태들은 모든 면에서 예시적이지만 제한적이지 않은 것으로 간주되어야 한다.

본원은 2009년 8월 26일자로 출원된 미국 특허출원 제61/237,156호 및 2010년 3월 19일자로 출원된 미국 특허출원 제61/315,812호로부터 우선권을 주장하고, 상기 특허출원 둘 다의 전체 내용은 본원에 참고로 도입된다.

본 명세서에서 논의되고/되거나 참조된 모든 문헌들은 전체로서 본원에 참고로 도입된다.

본 명세서에 포함된 문헌, 행위, 물질, 장치, 논문 등의 임의의 논의는 본 발명에 대한 내용을 제공하기 위한 것일 뿐이다. 상기 논의는 임의의 또는 모든 이들 사항들이 본원의 우선일 전에 존재하기 때문에 선행기술 기초의 일부를 형성하거나 본 발명과 관련된 분야에서 공통된 일반적인 지식임 인정하는 것으로서 해석되어서는 안 된다.

SEQUENCE LISTING <110> Commonwealth Scientific and Industrial Research Organization <120> Processes for producing silk dope <130> 509839 <150> 61/237,156 <151> 2009-08-26 <150> 61/315,812 <151> 2010-03-19 <160> 108 <170> PatentIn version 3.5 <210> 1 <211> 314 <212> PRT <213> Apis mellifera <400> 1 Gly Leu Glu Gly Pro Gly Asn Ser Leu Pro Glu Leu Val Lys Gly Ser 1 5 10 15 Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg 20 25 30 Ala Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val Leu Gln Ala 35 40 45 Gln Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala Ala Asp Leu 50 55 60 Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser Gln Ala Ala 65 70 75 80 Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln Ala Arg Ala 85 90 95 Gly Leu Glu Ser Val Ser Met Ala Ala Ser Ala Thr Ser Ala Ala Lys 100 105 110 Glu Ala Ser Thr Ala Ala Lys Ala Ala Ala Ser Ala Leu Ser Thr Ala 115 120 125 Val Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala Glu Ala Val 130 135 140 Ala Ser Asp Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala Asn Leu Ala 145 150 155 160 Ala Glu Ala Ser Val Ala Ala Glu Ala Ala Leu Lys Ala Glu Lys Val 165 170 175 Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala Ala Ala Arg 180 185 190 Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala Thr Ala Ser 195 200 205 Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val Ala Val Leu 210 215 220 Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala Ala Ser Ser 225 230 235 240 Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn Val Glu Thr 245 250 255 Ala Thr Ile Gly Ala Asn Ile Asn Ser Ser Lys Gln Val Val Ser Ile 260 265 270 Pro Val Glu Ile Lys Lys Phe Ser Glu Pro Glu Val Ser Thr Ser Trp 275 280 285 Arg Glu Asp Glu Glu Val Thr Lys Glu Lys Lys Glu His Ile Asn Leu 290 295 300 Asn Asp Phe Asp Leu Lys Ser Asn Val Phe 305 310 <210> 2 <211> 333 <212> PRT <213> Apis mellifera <400> 2 Met Lys Ile Pro Val Leu Leu Ala Thr Cys Leu Tyr Leu Cys Gly Phe 1 5 10 15 Ala Ser Ala Gly Leu Glu Gly Pro Gly Asn Ser Leu Pro Glu Leu Val 20 25 30 Lys Gly Ser Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser 35 40 45 Gly Leu Arg Ala Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val 50 55 60 Leu Gln Ala Gln Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala 65 70 75 80 Ala Asp Leu Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser 85 90 95 Gln Ala Ala Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln 100 105 110 Ala Arg Ala Gly Leu Glu Ser Val Ser Met Ala Ala Ser Ala Thr Ser 115 120 125 Ala Ala Lys Glu Ala Ser Thr Ala Ala Lys Ala Ala Ala Ser Ala Leu 130 135 140 Ser Thr Ala Val Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala 145 150 155 160 Glu Ala Val Ala Ser Asp Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala 165 170 175 Asn Leu Ala Ala Glu Ala Ser Val Ala Ala Glu Ala Ala Leu Lys Ala 180 185 190 Glu Lys Val Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala 195 200 205 Ala Ala Arg Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala 210 215 220 Thr Ala Ser Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val 225 230 235 240 Ala Val Leu Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala 245 250 255 Ala Ser Ser Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn 260 265 270 Val Glu Thr Ala Thr Ile Gly Ala Asn Ile Asn Ser Ser Lys Gln Val 275 280 285 Val Ser Ile Pro Val Glu Ile Lys Lys Phe Ser Glu Pro Glu Val Ser 290 295 300 Thr Ser Trp Arg Glu Asp Glu Glu Val Thr Lys Glu Lys Lys Glu His 305 310 315 320 Ile Asn Leu Asn Asp Phe Asp Leu Lys Ser Asn Val Phe 325 330 <210> 3 <211> 290 <212> PRT <213> Apis mellifera <400> 3 Arg Val Ile Asn His Glu Ser Leu Lys Thr Ser Glu Asp Ile Gln Gly 1 5 10 15 Gly Tyr Ser Ala Gly Ile Val Gly Asp Gly Ser Asp Ala Leu Gly Ser 20 25 30 Ser Ile Glu Asn Ala Gln Lys Val Ala Arg Ala Ala Glu Asn Val Gly 35 40 45 Leu Asn Leu Glu Leu Gly Ala Gly Ala Arg Ala Ala Ser Val Ala Ala 50 55 60 Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Ala Gly Ala Asn Ala 65 70 75 80 Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser 85 90 95 Glu Ile Ala Asn Gln Leu Leu Thr Asn Ala Ala Lys Ala Ala Glu Ala 100 105 110 Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala Ala Ala Lys 115 120 125 Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala Thr Glu Ala 130 135 140 Gln Val Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg Ala Ala Ile 145 150 155 160 Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala Ala Ile Ala 165 170 175 Arg Lys Ser Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile Ala Ala Ala 180 185 190 Ala Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Val Val Ala Leu 195 200 205 Thr Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala Gln Ala Asn 210 215 220 Ala Ser Thr Gln Ala Ser Met Ala Val Arg Val Asp Ser Gln Ala Ala 225 230 235 240 Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr 245 250 255 Ala Glu Ala Val Ala Ala Ala Glu Ala Glu Val Ala Asn Lys Ala Ala 260 265 270 Thr Phe Ala Lys Gln Ile Val Asn Glu Lys Lys Ile His Val Ala Lys 275 280 285 Leu Glu 290 <210> 4 <211> 309 <212> PRT <213> Apis mellifera <400> 4 Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Val Trp Gly Leu 1 5 10 15 Ala Glu Gly Arg Val Ile Asn His Glu Ser Leu Lys Thr Ser Glu Asp 20 25 30 Ile Gln Gly Gly Tyr Ser Ala Gly Ile Val Gly Asp Gly Ser Asp Ala 35 40 45 Leu Gly Ser Ser Ile Glu Asn Ala Gln Lys Val Ala Arg Ala Ala Glu 50 55 60 Asn Val Gly Leu Asn Leu Glu Leu Gly Ala Gly Ala Arg Ala Ala Ser 65 70 75 80 Val Ala Ala Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Ala Gly 85 90 95 Ala Asn Ala Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile 100 105 110 Lys Ala Ser Glu Ile Ala Asn Gln Leu Leu Thr Asn Ala Ala Lys Ala 115 120 125 Ala Glu Ala Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala 130 135 140 Ala Ala Lys Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala 145 150 155 160 Thr Glu Ala Gln Val Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg 165 170 175 Ala Ala Ile Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala 180 185 190 Ala Ile Ala Arg Lys Ser Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile 195 200 205 Ala Ala Ala Ala Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Val 210 215 220 Val Ala Leu Thr Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala 225 230 235 240 Gln Ala Asn Ala Ser Thr Gln Ala Ser Met Ala Val Arg Val Asp Ser 245 250 255 Gln Ala Ala Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu 260 265 270 Leu Val Thr Ala Glu Ala Val Ala Ala Ala Glu Ala Glu Val Ala Asn 275 280 285 Lys Ala Ala Thr Phe Ala Lys Gln Ile Val Asn Glu Lys Lys Ile His 290 295 300 Val Ala Lys Leu Glu 305 <210> 5 <211> 316 <212> PRT <213> Apis mellifera <400> 5 Gly Val Glu Glu Phe Lys Ser Ser Ala Thr Glu Glu Val Ile Ser Lys 1 5 10 15 Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser Ala Lys Arg 20 25 30 Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Thr Leu Gln Ser Leu 35 40 45 Glu Lys Ile Lys Thr Ser Ala Ser Val Asn Ala Lys Ala Ala Ala Val 50 55 60 Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu Arg Ala Ser 65 70 75 80 Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Leu Lys Asn 85 90 95 Ala Gln Gln Ala Gln Leu Asn Ala Gln Glu Lys Ser Leu Ala Ala Leu 100 105 110 Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala Asn Ala Ala 115 120 125 Thr Ala Ala Thr Gln Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg 130 135 140 Leu Ala Thr Val Ala Gln Asn Val Ala Ser Asp Leu Gln Lys Arg Thr 145 150 155 160 Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg Gln Leu Gln 165 170 175 Asp Ala Glu Arg Thr Lys Trp Ser Ala Asn Ala Ala Leu Glu Val Ser 180 185 190 Ala Ala Ala Ala Ala Ala Glu Thr Lys Thr Thr Ala Ser Ser Glu Ala 195 200 205 Ala Asn Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser Asp Ala Asp 210 215 220 Gly Ala Glu Arg Ser Ala Ser Thr Glu Ala Gln Ser Ala Ala Lys Ile 225 230 235 240 Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala Ser Glu Asp 245 250 255 Ser Arg Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg Ala Asn Val 260 265 270 Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Gly Glu Glu Ala 275 280 285 Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu Ala Glu Val 290 295 300 Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe 305 310 315 <210> 6 <211> 335 <212> PRT <213> Apis mellifera <400> 6 Met Gln Ile Pro Thr Phe Val Ala Ile Cys Leu Leu Thr Ser Gly Leu 1 5 10 15 Val His Ala Gly Val Glu Glu Phe Lys Ser Ser Ala Thr Glu Glu Val 20 25 30 Ile Ser Lys Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser 35 40 45 Ala Lys Arg Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Thr Leu 50 55 60 Gln Ser Leu Glu Lys Ile Lys Thr Ser Ala Ser Val Asn Ala Lys Ala 65 70 75 80 Ala Ala Val Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu 85 90 95 Arg Ala Ser Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala 100 105 110 Leu Lys Asn Ala Gln Gln Ala Gln Leu Asn Ala Gln Glu Lys Ser Leu 115 120 125 Ala Ala Leu Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala 130 135 140 Asn Ala Ala Thr Ala Ala Thr Gln Ser Ala Leu Glu Arg Ala Gln Ala 145 150 155 160 Ser Ser Arg Leu Ala Thr Val Ala Gln Asn Val Ala Ser Asp Leu Gln 165 170 175 Lys Arg Thr Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg 180 185 190 Gln Leu Gln Asp Ala Glu Arg Thr Lys Trp Ser Ala Asn Ala Ala Leu 195 200 205 Glu Val Ser Ala Ala Ala Ala Ala Ala Glu Thr Lys Thr Thr Ala Ser 210 215 220 Ser Glu Ala Ala Asn Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser 225 230 235 240 Asp Ala Asp Gly Ala Glu Arg Ser Ala Ser Thr Glu Ala Gln Ser Ala 245 250 255 Ala Lys Ile Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala 260 265 270 Ser Glu Asp Ser Arg Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg 275 280 285 Ala Asn Val Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Gly 290 295 300 Glu Glu Ala Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu 305 310 315 320 Ala Glu Val Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe 325 330 335 <210> 7 <211> 323 <212> PRT <213> Apis mellifera <400> 7 Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr Ser Thr Val 1 5 10 15 Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys Asp Glu Leu 20 25 30 Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly Thr Gly Ala 35 40 45 Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile Ser Leu Gly 50 55 60 Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala Ser Gln Ser 65 70 75 80 Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu Thr Asn Lys 85 90 95 Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala Arg Ala Thr 100 105 110 Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr Glu Glu Ala 115 120 125 Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala Ala Ala Glu 130 135 140 Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser Ala Arg Ala 145 150 155 160 Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala Glu Ser Ala 165 170 175 Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys Ala Ala 180 185 190 Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu Ala Asp 195 200 205 Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val Ala Asp 210 215 220 Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys Ala Glu 225 230 235 240 Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val Leu Gln Ala 245 250 255 Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala Ala Ala 260 265 270 Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala Gly Glu Met 275 280 285 Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys Lys Glu Glu 290 295 300 Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu Trp 305 310 315 320 Glu Val Lys <210> 8 <211> 342 <212> PRT <213> Apis mellifera <400> 8 Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Ile Trp Gly Leu 1 5 10 15 Ala Ser Gly Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr 20 25 30 Ser Thr Val Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys 35 40 45 Asp Glu Leu Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly 50 55 60 Thr Gly Ala Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile 65 70 75 80 Ser Leu Gly Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala 85 90 95 Ser Gln Ser Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu 100 105 110 Thr Asn Lys Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala 115 120 125 Arg Ala Thr Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr 130 135 140 Glu Glu Ala Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala 145 150 155 160 Ala Ala Glu Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser 165 170 175 Ala Arg Ala Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala 180 185 190 Glu Ser Ala Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala 195 200 205 Lys Ala Ala Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala 210 215 220 Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala 225 230 235 240 Val Ala Asp Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala 245 250 255 Lys Ala Glu Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val 260 265 270 Leu Gln Ala Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala 275 280 285 Ala Ala Ala Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala 290 295 300 Gly Glu Met Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys 305 310 315 320 Lys Glu Glu Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn 325 330 335 Glu Glu Trp Glu Val Lys 340 <210> 9 <211> 942 <212> DNA <213> Apis mellifera <400> 9 ggtttggagg ggccgggcaa ctcgttgccc gagctcgtga aaggtagcgc atcggccacc 60 gcgtcgaccg ctgtgaccgc tagatcagga cttagagccg gacaagtagc tttagcttcg 120 cagaaggatg ccgtactcca agctcaagct gctgcatccg ccgcgtcaga ggcgcgcgct 180 gctgccgatc tgacggctaa acttagccaa gaatcggcat cagtgcaatc gcaggctgcc 240 gccaaaggga aggaaacgga ggaggcagct gttggtcaag ctagggctgg cctcgagtcg 300 gtgtccatgg ccgcatcagc cacatctgct gccaaagaag catcgaccgc cgccaaagcc 360 gcagcatccg cactatccac agccgtggtg caagcgaaaa tagctgagag ggcagccaaa 420 gctgaagctg ttgcctcgga cgaagccaag gccaaggcga ttgcagcagc caacttggcg 480 gctgaggcca gtgtagccgc agaagcagct ctcaaggccg agaaagtggc cgaagaagcc 540 atcgcaagag cggcctctgc aaaggctgcc gcaagagctg ctgctgccgc tctagcctcc 600 tcgaaggaag cagccacggc cagcgcaaga aacgccgcgg aatccgaggc caggaacgaa 660 gtagctgtat tgatcgccga gattgataaa aagagtaggg aaatcgacgc agccagttcg 720 cttaatgcgc gtgccgctgc caaggcaagc tccaggaacg tagaaacggc gacaatcggg 780 gccaacatca actcttcgaa acaagtcgtg tcaattccag tggaaataaa gaaattctcg 840 gagccggaag tgtcaacatc atggagagaa gatgaagagg ttacgaaaga gaagaaggag 900 cacataaatc tgaacgactt cgacttgaag agcaacgtat tt 942 <210> 10 <211> 999 <212> DNA <213> Apis mellifera <400> 10 atgaagattc cagtattgct tgcaacgtgc ctctaccttt gcggatttgc gtccgccggt 60 ttggaggggc cgggcaactc gttgcccgag ctcgtgaaag gtagcgcatc ggccaccgcg 120 tcgaccgctg tgaccgctag atcaggactt agagccggac aagtagcttt agcttcgcag 180 aaggatgccg tactccaagc tcaagctgct gcatccgccg cgtcagaggc gcgcgctgct 240 gccgatctga cggctaaact tagccaagaa tcggcatcag tgcaatcgca ggctgccgcc 300 aaagggaagg aaacggagga ggcagctgtt ggtcaagcta gggctggcct cgagtcggtg 360 tccatggccg catcagccac atctgctgcc aaagaagcat cgaccgccgc caaagccgca 420 gcatccgcac tatccacagc cgtggtgcaa gcgaaaatag ctgagagggc agccaaagct 480 gaagctgttg cctcggacga agccaaggcc aaggcgattg cagcagccaa cttggcggct 540 gaggccagtg tagccgcaga agcagctctc aaggccgaga aagtggccga agaagccatc 600 gcaagagcgg cctctgcaaa ggctgccgca agagctgctg ctgccgctct agcctcctcg 660 aaggaagcag ccacggccag cgcaagaaac gccgcggaat ccgaggccag gaacgaagta 720 gctgtattga tcgccgagat tgataaaaag agtagggaaa tcgacgcagc cagttcgctt 780 aatgcgcgtg ccgctgccaa ggcaagctcc aggaacgtag aaacggcgac aatcggggcc 840 aacatcaact cttcgaaaca agtcgtgtca attccagtgg aaataaagaa attctcggag 900 ccggaagtgt caacatcatg gagagaagat gaagaggtta cgaaagagaa gaaggagcac 960 ataaatctga acgacttcga cttgaagagc aacgtattt 999 <210> 11 <211> 870 <212> DNA <213> Apis mellifera <400> 11 cgcgtgatta atcacgagtc cctgaagacg agcgaggata ttcaaggagg atattcagca 60 ggaatagtcg gtgatggatc tgacgcgctt ggctcctcca tagaaaacgc ccaaaaagtc 120 gctcgagcgg ctgaaaacgt gggcttgaat ctggaattgg gcgcaggcgc gcgtgctgcc 180 agtgttgccg ctgctgccca ggccaaaaac acagaggctg cggaagcagg agcaaacgcc 240 gctctggccg ccgccattgc caaacgggag gaagcgatta aagccagcga gatagcaaac 300 caattgttga ccaatgcagc aaaagcggca gaagcgactg tatcggcaac gaagagggca 360 gcacaattga cggctgcagc gaaagaagca accagagctt ctgcagccgc tgctgaagct 420 gctacggagg cccaggtaaa ggctaacgcc gattcaatca tcacgaagag ggctgcgatt 480 gccgaggctc aagctgcggc ggaagctcaa gttaaggcgg caatcgccag aaaatcggca 540 gcgaattttt tggctaaggc tcaaatagcg gctgccgcgg aatccgaggc cacgaaactc 600 gcggccgaag ctgtagtggc actaacaaac gccgaagtcg ccgtgaacca ggctagaaac 660 gcacaggcaa acgcctcgac tcaagcttcc atggctgtta gggtagattc tcaagcagcg 720 aacgctgaag cagccgctgt agcgcaagcc gaaactctct tggttacggc agaagctgtc 780 gcagctgcgg aggctgaggt tgcgaacaaa gccgccacat ttgcaaaaca gatcgtcaac 840 gagaagaaaa tacatgtagc aaagttggaa 870 <210> 12 <211> 927 <212> DNA <213> Apis mellifera <400> 12 atgaagattc cagcaatatt cgtcacgtct ctgctggtct ggggattggc cgagggccgc 60 gtgattaatc acgagtccct gaagacgagc gaggatattc aaggaggata ttcagcagga 120 atagtcggtg atggatctga cgcgcttggc tcctccatag aaaacgccca aaaagtcgct 180 cgagcggctg aaaacgtggg cttgaatctg gaattgggcg caggcgcgcg tgctgccagt 240 gttgccgctg ctgcccaggc caaaaacaca gaggctgcgg aagcaggagc aaacgccgct 300 ctggccgccg ccattgccaa acgggaggaa gcgattaaag ccagcgagat agcaaaccaa 360 ttgttgacca atgcagcaaa agcggcagaa gcgactgtat cggcaacgaa gagggcagca 420 caattgacgg ctgcagcgaa agaagcaacc agagcttctg cagccgctgc tgaagctgct 480 acggaggccc aggtaaaggc taacgccgat tcaatcatca cgaagagggc tgcgattgcc 540 gaggctcaag ctgcggcgga agctcaagtt aaggcggcaa tcgccagaaa atcggcagcg 600 aattttttgg ctaaggctca aatagcggct gccgcggaat ccgaggccac gaaactcgcg 660 gccgaagctg tagtggcact aacaaacgcc gaagtcgccg tgaaccaggc tagaaacgca 720 caggcaaacg cctcgactca agcttccatg gctgttaggg tagattctca agcagcgaac 780 gctgaagcag ccgctgtagc gcaagccgaa actctcttgg ttacggcaga agctgtcgca 840 gctgcggagg ctgaggttgc gaacaaagcc gccacatttg caaaacagat cgtcaacgag 900 aagaaaatac atgtagcaaa gttggaa 927 <210> 13 <211> 949 <212> DNA <213> Apis mellifera <400> 13 ggcgtcgagg aattcaagtc ctcggcaacc gaggaggtga tcagcaaaaa cttagaagtc 60 gacctgttga aaaatgtgga cactagcgcg aaacgaagag agaacggcgc cccggtgctc 120 ggcaagaaca cacttcaatc cctggagaag atcaagacgt cggcgagcgt gaatgccaaa 180 gcagcagccg tggtgaaagc gtccgctctg gctcttgcag aggcctattt gcgagcgtcc 240 gcattgtcag ccgccgcttc agccaaggca gccgccgccc tgaaaaatgc tcaacaagcg 300 caattaaacg cccaggaaaa gtctttggcc gcgttgaaag ctcagtccga ggaagaggca 360 gcttctgctc gtgcaaacgc agcaaccgcc gcgacacagt cggcactgga acgcgctcaa 420 gcctcctcca ggttagcaac ggtcgcccaa aacgtagcca gcgacttgca gaaacggacc 480 agcaccaagg ccgcggctga agccgctgcc accctcagac aattacagga cgcggaacga 540 acgaaatgga gtgccaacgc tgccttagaa gtctccgccg ctgcagctgc cgcagaaacc 600 aagaccactg cctcctcgga ggccgccaac gccgccgcca aaaaggcggc cgcgatagct 660 tctgacgcgg acggcgcgga aaggtcggca tctaccgagg cacaatcagc tgcgaagatc 720 gagagtgtgg cagccgccga gggatccgcc aactcggcct ctgaggattc ccgggccgct 780 caattggaag cctccaccgc ggcgagagcc aacgtggccg cagctgtcgg ggatggagcg 840 attataggac ttggagagga agcgggtgcc gcggctcagt tgcttgcaca ggcgaaggca 900 ttggccgaag ttagctcgaa atccgaaaat attgaggata aaaaatttt 949 <210> 14 <211> 1006 <212> DNA <213> Apis mellifera <400> 14 atgcagatcc caacgtttgt cgccatatgc ttgctcacat cgggcttggt gcacgcaggc 60 gtcgaggaat tcaagtcctc ggcaaccgag gaggtgatca gcaaaaactt agaagtcgac 120 ctgttgaaaa atgtggacac tagcgcgaaa cgaagagaga acggcgcccc ggtgctcggc 180 aagaacacac ttcaatccct ggagaagatc aagacgtcgg cgagcgtgaa tgccaaagca 240 gcagccgtgg tgaaagcgtc cgctctggct cttgcagagg cctatttgcg agcgtccgca 300 ttgtcagccg ccgcttcagc caaggcagcc gccgccctga aaaatgctca acaagcgcaa 360 ttaaacgccc aggaaaagtc tttggccgcg ttgaaagctc agtccgagga agaggcagct 420 tctgctcgtg caaacgcagc aaccgccgcg acacagtcgg cactggaacg cgctcaagcc 480 tcctccaggt tagcaacggt cgcccaaaac gtagccagcg acttgcagaa acggaccagc 540 accaaggccg cggctgaagc cgctgccacc ctcagacaat tacaggacgc ggaacgaacg 600 aaatggagtg ccaacgctgc cttagaagtc tccgccgctg cagctgccgc agaaaccaag 660 accactgcct cctcggaggc cgccaacgcc gccgccaaaa aggcggccgc gatagcttct 720 gacgcggacg gcgcggaaag gtcggcatct accgaggcac aatcagctgc gaagatcgag 780 agtgtggcag ccgccgaggg atccgccaac tcggcctctg aggattcccg ggccgctcaa 840 ttggaagcct ccaccgcggc gagagccaac gtggccgcag ctgtcgggga tggagcgatt 900 ataggacttg gagaggaagc gggtgccgcg gctcagttgc ttgcacaggc gaaggcattg 960 gccgaagtta gctcgaaatc cgaaaatatt gaggataaaa aatttt 1006 <210> 15 <211> 969 <212> DNA <213> Apis mellifera <400> 15 gcaagggaag aggtggagac acgggacaag accaagacct cgacagtggt gaaaagcgag 60 aaagtggaag tcgttgctcc cgctaaggat gaacttaaat taacgagcga gcctatcttt 120 ggaagaagag tgggaactgg agcatccgag gtggcatcta gcagcggtga agccatcgcg 180 ataagtcttg gagcagggca gtcagcggca gagtctcagg ccttggccgc ctcgcaatcc 240 aaaacggcag cgaacgccgc cataggcgcg agcgagctta ccaacaaagt tgctgctcta 300 gttgctggcg cgactggtgc gcaggcgaga gctacggccg cctcctcgag cgcgttgaag 360 gccagcttgg cgaccgaaga agcggcggaa gaggccgagg cggccgtggc tgacgccaag 420 gctgccgcgg aaaaggccga atccctggcg aaaaatctcg cgtcggcgag cgctcgcgcg 480 gccctctcct ccgaaagggc gaacgaattg gctcaagctg agagcgctgc agcggccgag 540 gcgcaggcca agacagcagc cgccgccaaa gcagcggaaa tcgcccttaa ggtcgctgag 600 atagcggtga aggcggaagc ggacgcagca gctgccgccg tggcagctgc aaaggcaaga 660 gccgtggcag acgcggccgc tgcccgtgcc gcagccgtga acgccatcgc caaggcggaa 720 gaggaggcct cggcccaagc agagaacgcc gccggtgttt tgcaagcagc cgcctccgcc 780 gcggcggaat cgcgagccgc tgcagctgcc gccgctgcta cctcggaggc agcggctgaa 840 gctggcccgt tggcaggtga gatgaaacca ccgcactgga aatgggaacg gattcctgtg 900 aagaaggagg agtggaaaac gtcaacgaag gaagaatgga aaacgacgaa tgaagaatgg 960 gaggtgaag 969 <210> 16 <211> 1026 <212> DNA <213> Apis mellifera <400> 16 atgaagatcc catccatact cgcggtttcc ctgctgatct ggggtttggc aagcggcgca 60 agggaagagg tggagacacg ggacaagacc aagacctcga cagtggtgaa aagcgagaaa 120 gtggaagtcg ttgctcccgc taaggatgaa cttaaattaa cgagcgagcc tatctttgga 180 agaagagtgg gaactggagc atccgaggtg gcatctagca gcggtgaagc catcgcgata 240 agtcttggag cagggcagtc agcggcagag tctcaggcct tggccgcctc gcaatccaaa 300 acggcagcga acgccgccat aggcgcgagc gagcttacca acaaagttgc tgctctagtt 360 gctggcgcga ctggtgcgca ggcgagagct acggccgcct cctcgagcgc gttgaaggcc 420 agcttggcga ccgaagaagc ggcggaagag gccgaggcgg ccgtggctga cgccaaggct 480 gccgcggaaa aggccgaatc cctggcgaaa aatctcgcgt cggcgagcgc tcgcgcggcc 540 ctctcctccg aaagggcgaa cgaattggct caagctgaga gcgctgcagc ggccgaggcg 600 caggccaaga cagcagccgc cgccaaagca gcggaaatcg cccttaaggt cgctgagata 660 gcggtgaagg cggaagcgga cgcagcagct gccgccgtgg cagctgcaaa ggcaagagcc 720 gtggcagacg cggccgctgc ccgtgccgca gccgtgaacg ccatcgccaa ggcggaagag 780 gaggcctcgg cccaagcaga gaacgccgcc ggtgttttgc aagcagccgc ctccgccgcg 840 gcggaatcgc gagccgctgc agctgccgcc gctgctacct cggaggcagc ggctgaagct 900 ggcccgttgg caggtgagat gaaaccaccg cactggaaat gggaacggat tcctgtgaag 960 aaggaggagt ggaaaacgtc aacgaaggaa gaatggaaaa cgacgaatga agaatgggag 1020 gtgaag 1026 <210> 17 <211> 308 <212> PRT <213> Bombus terrestris <400> 17 Gly Gln Ser Ser Pro Leu Leu Glu Ile Val Gln Gly Ser Ala Ser Ala 1 5 10 15 Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg Ala Gly Gln 20 25 30 Val Ala Val Ala Ser Gln Lys Asp Ala Thr Leu Gln Ala Asp Ala Ser 35 40 45 Ala Ala Ala Ala Ala Ala Ala Arg Ala Ser Ala Asp Gln Ser Ala Ser 50 55 60 Leu Ala Gln Gln Ser Ala Ser Leu Gln Ser Lys Ala Ala Ala Arg Ala 65 70 75 80 Lys Ser Ala Glu Glu Ser Ala Ala Ala Thr Ala Lys Ala Glu Leu Gln 85 90 95 Ala Glu Ser Ile Ala Ala Ser Ala Ser Ser Asn Ala Arg Glu Ala Ala 100 105 110 Ala Ser Ala Lys Ala Ser Ala Ser Ala Met Ser Ser Ala Ala Val Gln 115 120 125 Ala Lys Leu Ala Glu Lys Thr Ala Lys Asn Gln Ala Leu Ala Ser Glu 130 135 140 Glu Ala Lys Leu Lys Ala Ala Ala Ala Ala Ser Ala Ala Ala Ala Ala 145 150 155 160 Ser Ala Ala Ala Glu Ala Ala Leu Lys Ala Glu Arg Ile Ala Glu Glu 165 170 175 Ala Ile Ala Lys Ala Ala Ala Ala Lys Ala Ala Ala Arg Ala Ala Ala 180 185 190 Ala Ala Leu Asn Ser Ala Lys Glu Ala Ala Thr Ser Ser Ala Arg Ser 195 200 205 Ala Ala Glu Ala Glu Ala Lys Ser Glu Val Ala Ile Leu Ile Ser Glu 210 215 220 Leu Asp Lys Lys Ser Arg Glu Val Ala Ala Ser Ala Ser Ala Lys Ala 225 230 235 240 Arg Ala Ala Ala Ala Ala Ser Ser Arg Asn Ala Glu Thr Ala Val Ile 245 250 255 Gly Ala Asn Ile Asn Val Ala Lys Glu Val Leu Ala Ile Pro Ile Glu 260 265 270 Pro Lys Lys Leu Pro Glu Pro Glu Leu Ala Leu Lys Glu Glu Asn Val 275 280 285 Ala Val Ala Ser Ser Glu Ser Glu Val Lys Val Glu Thr Ser Ser Glu 290 295 300 Ala Trp Ser Ile 305 <210> 18 <211> 327 <212> PRT <213> Bombus terrestris <400> 18 Met Lys Ile Pro Ala Leu Leu Val Thr Cys Leu Tyr Leu Trp Gly Phe 1 5 10 15 Ala Ser Ala Gly Gln Ser Ser Pro Leu Leu Glu Ile Val Gln Gly Ser 20 25 30 Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg 35 40 45 Ala Gly Gln Val Ala Val Ala Ser Gln Lys Asp Ala Thr Leu Gln Ala 50 55 60 Asp Ala Ser Ala Ala Ala Ala Ala Ala Ala Arg Ala Ser Ala Asp Gln 65 70 75 80 Ser Ala Ser Leu Ala Gln Gln Ser Ala Ser Leu Gln Ser Lys Ala Ala 85 90 95 Ala Arg Ala Lys Ser Ala Glu Glu Ser Ala Ala Ala Thr Ala Lys Ala 100 105 110 Glu Leu Gln Ala Glu Ser Ile Ala Ala Ser Ala Ser Ser Asn Ala Arg 115 120 125 Glu Ala Ala Ala Ser Ala Lys Ala Ser Ala Ser Ala Met Ser Ser Ala 130 135 140 Ala Val Gln Ala Lys Leu Ala Glu Lys Thr Ala Lys Asn Gln Ala Leu 145 150 155 160 Ala Ser Glu Glu Ala Lys Leu Lys Ala Ala Ala Ala Ala Ser Ala Ala 165 170 175 Ala Ala Ala Ser Ala Ala Ala Glu Ala Ala Leu Lys Ala Glu Arg Ile 180 185 190 Ala Glu Glu Ala Ile Ala Lys Ala Ala Ala Ala Lys Ala Ala Ala Arg 195 200 205 Ala Ala Ala Ala Ala Leu Asn Ser Ala Lys Glu Ala Ala Thr Ser Ser 210 215 220 Ala Arg Ser Ala Ala Glu Ala Glu Ala Lys Ser Glu Val Ala Ile Leu 225 230 235 240 Ile Ser Glu Leu Asp Lys Lys Ser Arg Glu Val Ala Ala Ser Ala Ser 245 250 255 Ala Lys Ala Arg Ala Ala Ala Ala Ala Ser Ser Arg Asn Ala Glu Thr 260 265 270 Ala Val Ile Gly Ala Asn Ile Asn Val Ala Lys Glu Val Leu Ala Ile 275 280 285 Pro Ile Glu Pro Lys Lys Leu Pro Glu Pro Glu Leu Ala Leu Lys Glu 290 295 300 Glu Asn Val Ala Val Ala Ser Ser Glu Ser Glu Val Lys Val Glu Thr 305 310 315 320 Ser Ser Glu Ala Trp Ser Ile 325 <210> 19 <211> 293 <212> PRT <213> Bombus terrestris <400> 19 His Val Val Lys Arg Asp Lys Glu Leu Lys Ala Pro Ala Leu Pro Glu 1 5 10 15 Leu Leu Gly Asp Gly Ser Asp Thr Leu Gly Ala Ser Met Glu Asn Gly 20 25 30 Ile Lys Val Ala Arg Ala Ser Gln Asn Val Gly Leu Arg Thr Glu Leu 35 40 45 Asn Ala Ala Ala Arg Ala Ala Ala Ala Ala Ala Thr Lys Gln Ala Lys 50 55 60 Asp Thr Glu Ala Ala Glu Ala Gly Ala Ala Ala Ala Ile Ala Ile Ala 65 70 75 80 Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu Leu Ala Ser Lys 85 90 95 Leu Leu Thr Ala Ala Ala Gly Ser Ser Glu Ala Ala Val Ser Ala Thr 100 105 110 Val Arg Ala Ala Gln Leu Thr Ala Ala Ala Ser Ala Ala Ala Lys Ala 115 120 125 Ser Ala Ser Ala Ser Glu Ala Ser Ala Glu Ala Gln Val Arg Ala Asn 130 135 140 Ala Glu Ala Asn Ile Ala Lys Lys Ala Ser Ala Ala Glu Ala Lys Ala 145 150 155 160 Ala Ala Glu Ala Gln Val Lys Ala Glu Leu Ala Lys Lys Ala Ala Ala 165 170 175 Gly Phe Leu Ala Lys Ala Arg Leu Ala Ala Ser Ala Glu Ser Glu Ala 180 185 190 Thr Lys Leu Ala Ala Glu Ala Glu Val Ala Leu Ala Lys Ala Arg Val 195 200 205 Ala Val Asp Gln Ser Gln Ser Ala Gln Ala Thr Ala Thr Ala Gln Ala 210 215 220 Ala Thr Ala Val Gln Leu Gln Ser Gln Ala Ala Asn Ala Glu Ala Ser 225 230 235 240 Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala Glu Ala Val Ser 245 250 255 Ala Ala Glu Ala Glu Ala Ala Thr Lys Ala Thr Ser Trp Gly Glu Glu 260 265 270 Cys His Gln Arg Glu Lys Val Thr Phe Ser Glu Asp Arg Leu Asn Glu 275 280 285 Arg Gln Asp Asn Trp 290 <210> 20 <211> 313 <212> PRT <213> Bombus terrestris <400> 20 Met Lys Ile Pro Ala Ile Leu Val Thr Ser Leu Leu Val Trp Gly Gly 1 5 10 15 Leu Ala Glu Gly His Val Val Lys Arg Asp Lys Glu Leu Lys Ala Pro 20 25 30 Ala Leu Pro Glu Leu Leu Gly Asp Gly Ser Asp Thr Leu Gly Ala Ser 35 40 45 Met Glu Asn Gly Ile Lys Val Ala Arg Ala Ser Gln Asn Val Gly Leu 50 55 60 Arg Thr Glu Leu Asn Ala Ala Ala Arg Ala Ala Ala Ala Ala Ala Thr 65 70 75 80 Lys Gln Ala Lys Asp Thr Glu Ala Ala Glu Ala Gly Ala Ala Ala Ala 85 90 95 Ile Ala Ile Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu 100 105 110 Leu Ala Ser Lys Leu Leu Thr Ala Ala Ala Gly Ser Ser Glu Ala Ala 115 120 125 Val Ser Ala Thr Val Arg Ala Ala Gln Leu Thr Ala Ala Ala Ser Ala 130 135 140 Ala Ala Lys Ala Ser Ala Ser Ala Ser Glu Ala Ser Ala Glu Ala Gln 145 150 155 160 Val Arg Ala Asn Ala Glu Ala Asn Ile Ala Lys Lys Ala Ser Ala Ala 165 170 175 Glu Ala Lys Ala Ala Ala Glu Ala Gln Val Lys Ala Glu Leu Ala Lys 180 185 190 Lys Ala Ala Ala Gly Phe Leu Ala Lys Ala Arg Leu Ala Ala Ser Ala 195 200 205 Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Glu Val Ala Leu Ala 210 215 220 Lys Ala Arg Val Ala Val Asp Gln Ser Gln Ser Ala Gln Ala Thr Ala 225 230 235 240 Thr Ala Gln Ala Ala Thr Ala Val Gln Leu Gln Ser Gln Ala Ala Asn 245 250 255 Ala Glu Ala Ser Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala 260 265 270 Glu Ala Val Ser Ala Ala Glu Ala Glu Ala Ala Thr Lys Ala Thr Ser 275 280 285 Trp Gly Glu Glu Cys His Gln Arg Glu Lys Val Thr Phe Ser Glu Asp 290 295 300 Arg Leu Asn Glu Arg Gln Asp Asn Trp 305 310 <210> 21 <211> 313 <212> PRT <213> Bombus terrestris <400> 21 Gly Ser Val Glu Leu Gly Ala Pro Lys Gln Glu Ser Val Leu Val Glu 1 5 10 15 Gln Leu Leu Leu Lys Asn Val Glu Thr Ser Ala Lys Arg Lys Glu Asn 20 25 30 Gly Ala Pro Lys Leu Gly Glu Ser Thr Ala Ala Ala Leu Ala Ser Thr 35 40 45 Lys Ala Thr Ala Ala Ala Glu Ala Lys Ala Ser Ala Lys Val Lys Ala 50 55 60 Ser Ala Leu Ala Leu Ala Glu Ala Phe Leu Arg Ala Ser Ala Ala Phe 65 70 75 80 Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Val Lys Glu Ala Thr Gln 85 90 95 Ala Gln Leu Leu Ala Gln Glu Lys Ala Leu Ile Ala Leu Lys Thr Gln 100 105 110 Ser Glu Gln Gln Ala Ala Ser Ala Arg Ala Asp Ala Ala Ala Ala Ala 115 120 125 Ala Val Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg Ala Ala Thr 130 135 140 Thr Ala Gln Asp Ile Ser Ser Asp Leu Glu Lys Arg Val Ala Thr Ser 145 150 155 160 Ala Ala Ala Glu Ala Gly Ala Thr Leu Arg Ala Glu Gln Ser Ala Ala 165 170 175 Gln Ser Lys Trp Ser Ala Ala Leu Ala Ala Gln Thr Ala Ala Ala Ala 180 185 190 Ala Ala Ile Glu Ala Lys Ala Thr Ala Ser Ser Glu Ser Thr Ala Ala 195 200 205 Ala Thr Ser Lys Ala Ala Val Leu Thr Ala Asp Thr Ser Ser Ala Glu 210 215 220 Ala Ala Ala Ala Ala Glu Ala Gln Ser Ala Ser Arg Ile Ala Gly Thr 225 230 235 240 Ala Ala Thr Glu Gly Ser Ala Asn Trp Ala Ser Glu Asn Ser Arg Thr 245 250 255 Ala Gln Leu Glu Ala Ser Ala Ser Ala Lys Ala Thr Ala Ala Ala Ala 260 265 270 Val Gly Asp Gly Ala Ile Ile Gly Leu Ala Arg Asp Ala Ser Ala Ala 275 280 285 Ala Gln Ala Ala Ala Glu Val Lys Ala Leu Ala Glu Ala Ser Ala Ser 290 295 300 Leu Gly Ala Ser Glu Lys Asp Lys Lys 305 310 <210> 22 <211> 332 <212> PRT <213> Bombus terrestris <400> 22 Met Gln Ile Pro Ala Ile Phe Val Thr Cys Leu Leu Thr Trp Gly Leu 1 5 10 15 Val His Ala Gly Ser Val Glu Leu Gly Ala Pro Lys Gln Glu Ser Val 20 25 30 Leu Val Glu Gln Leu Leu Leu Lys Asn Val Glu Thr Ser Ala Lys Arg 35 40 45 Lys Glu Asn Gly Ala Pro Lys Leu Gly Glu Ser Thr Ala Ala Ala Leu 50 55 60 Ala Ser Thr Lys Ala Thr Ala Ala Ala Glu Ala Lys Ala Ser Ala Lys 65 70 75 80 Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Phe Leu Arg Ala Ser 85 90 95 Ala Ala Phe Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Val Lys Glu 100 105 110 Ala Thr Gln Ala Gln Leu Leu Ala Gln Glu Lys Ala Leu Ile Ala Leu 115 120 125 Lys Thr Gln Ser Glu Gln Gln Ala Ala Ser Ala Arg Ala Asp Ala Ala 130 135 140 Ala Ala Ala Ala Val Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg 145 150 155 160 Ala Ala Thr Thr Ala Gln Asp Ile Ser Ser Asp Leu Glu Lys Arg Val 165 170 175 Ala Thr Ser Ala Ala Ala Glu Ala Gly Ala Thr Leu Arg Ala Glu Gln 180 185 190 Ser Ala Ala Gln Ser Lys Trp Ser Ala Ala Leu Ala Ala Gln Thr Ala 195 200 205 Ala Ala Ala Ala Ala Ile Glu Ala Lys Ala Thr Ala Ser Ser Glu Ser 210 215 220 Thr Ala Ala Ala Thr Ser Lys Ala Ala Val Leu Thr Ala Asp Thr Ser 225 230 235 240 Ser Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ser Ala Ser Arg Ile 245 250 255 Ala Gly Thr Ala Ala Thr Glu Gly Ser Ala Asn Trp Ala Ser Glu Asn 260 265 270 Ser Arg Thr Ala Gln Leu Glu Ala Ser Ala Ser Ala Lys Ala Thr Ala 275 280 285 Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Ala Arg Asp Ala 290 295 300 Ser Ala Ala Ala Gln Ala Ala Ala Glu Val Lys Ala Leu Ala Glu Ala 305 310 315 320 Ser Ala Ser Leu Gly Ala Ser Glu Lys Asp Lys Lys 325 330 <210> 23 <211> 338 <212> PRT <213> Bombus terrestris <400> 23 Gly Lys Pro Leu Ile Ala Asn Ala Gln Ile Gly Lys Val Lys Thr Glu 1 5 10 15 Thr Ser Ser Ser Ser Glu Ile Glu Thr Leu Val Ser Gly Ser Gln Thr 20 25 30 Leu Val Ala Gly Ser Glu Thr Leu Ala Ser Glu Ser Glu Ala Leu Ala 35 40 45 Ser Lys Ser Glu Ala Leu Thr Ser Glu Ala Glu Ile Ala Ser Val Thr 50 55 60 Thr Lys Asp Glu Leu Ile Leu Lys Gly Glu Ala Ile Thr Gly Lys Lys 65 70 75 80 Leu Gly Thr Gly Ala Ser Glu Val Ala Ala Ala Ser Gly Glu Ala Ile 85 90 95 Ala Thr Thr Leu Gly Ala Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala 100 105 110 Ala Ala Ala Gln Ala Lys Ser Ala Ala Ala Ala Ala Ala Asn Ala Gly 115 120 125 Glu Ser Ser Asn Ser Ala Ala Ala Leu Val Ala Ala Ala Ala Ala Ala 130 135 140 Gln Gly Lys Ala Ala Ala Ala Ala Ala Ala Ala Thr Lys Ala Ser Leu 145 150 155 160 Glu Ala Ala Asp Ala Ala Glu Glu Ala Glu Ser Ala Val Ala Leu Ala 165 170 175 Arg Ala Ala Ser Ala Lys Ala Glu Ala Leu Ala Ser Thr Ala Ala Ala 180 185 190 Ala Asn Thr Arg Ala Ala Leu Gln Ala Glu Lys Ser Asn Glu Leu Ala 195 200 205 Gln Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ala Lys Ala Ala Ala 210 215 220 Ala Ala Lys Ala Thr Gln Leu Ala Leu Lys Val Ala Glu Thr Ala Val 225 230 235 240 Lys Thr Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala 245 250 255 Arg Ala Val Ala Asp Ala Ala Ala Ser Arg Ala Thr Ala Val Asn Ala 260 265 270 Ile Ala Glu Ala Glu Glu Arg Asp Ser Ala Gln Ala Glu Asn Thr Ala 275 280 285 Gly Val Ala Gln Ala Ala Leu Ala Ala Ala Glu Ala Gln Asp Ser Cys 290 295 300 Ile Gly Ala Ala Ala Thr Pro Arg His Ser Ser Ser Tyr Ala Trp Trp 305 310 315 320 Lys Leu Arg Ile Thr Ser Leu Ile Val Ile Leu Ser Pro Arg Asn Arg 325 330 335 Arg Thr <210> 24 <211> 357 <212> PRT <213> Bombus terrestris <400> 24 Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Val Trp Gly Leu 1 5 10 15 Ala Ser Ala Gly Lys Pro Leu Ile Ala Asn Ala Gln Ile Gly Lys Val 20 25 30 Lys Thr Glu Thr Ser Ser Ser Ser Glu Ile Glu Thr Leu Val Ser Gly 35 40 45 Ser Gln Thr Leu Val Ala Gly Ser Glu Thr Leu Ala Ser Glu Ser Glu 50 55 60 Ala Leu Ala Ser Lys Ser Glu Ala Leu Thr Ser Glu Ala Glu Ile Ala 65 70 75 80 Ser Val Thr Thr Lys Asp Glu Leu Ile Leu Lys Gly Glu Ala Ile Thr 85 90 95 Gly Lys Lys Leu Gly Thr Gly Ala Ser Glu Val Ala Ala Ala Ser Gly 100 105 110 Glu Ala Ile Ala Thr Thr Leu Gly Ala Gly Gln Ala Ala Ala Glu Ala 115 120 125 Gln Ala Ala Ala Ala Ala Gln Ala Lys Ser Ala Ala Ala Ala Ala Ala 130 135 140 Asn Ala Gly Glu Ser Ser Asn Ser Ala Ala Ala Leu Val Ala Ala Ala 145 150 155 160 Ala Ala Ala Gln Gly Lys Ala Ala Ala Ala Ala Ala Ala Ala Thr Lys 165 170 175 Ala Ser Leu Glu Ala Ala Asp Ala Ala Glu Glu Ala Glu Ser Ala Val 180 185 190 Ala Leu Ala Arg Ala Ala Ser Ala Lys Ala Glu Ala Leu Ala Ser Thr 195 200 205 Ala Ala Ala Ala Asn Thr Arg Ala Ala Leu Gln Ala Glu Lys Ser Asn 210 215 220 Glu Leu Ala Gln Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ala Lys 225 230 235 240 Ala Ala Ala Ala Ala Lys Ala Thr Gln Leu Ala Leu Lys Val Ala Glu 245 250 255 Thr Ala Val Lys Thr Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala 260 265 270 Ala Lys Ala Arg Ala Val Ala Asp Ala Ala Ala Ser Arg Ala Thr Ala 275 280 285 Val Asn Ala Ile Ala Glu Ala Glu Glu Arg Asp Ser Ala Gln Ala Glu 290 295 300 Asn Thr Ala Gly Val Ala Gln Ala Ala Leu Ala Ala Ala Glu Ala Gln 305 310 315 320 Asp Ser Cys Ile Gly Ala Ala Ala Thr Pro Arg His Ser Ser Ser Tyr 325 330 335 Ala Trp Trp Lys Leu Arg Ile Thr Ser Leu Ile Val Ile Leu Ser Pro 340 345 350 Arg Asn Arg Arg Thr 355 <210> 25 <211> 927 <212> DNA <213> Bombus terrestris <400> 25 ggccagagct cacctctgct cgagatcgtg cagggtagcg cgtcggccac cgcatccacc 60 gctgtgaccg ctagatccgg acttcgtgcc ggtcaggtag ccgtggcctc gcagaaggat 120 gccacacttc aggcagatgc ctcagcggcc gccgcggccg ctgcacgcgc ttccgccgac 180 cagtcggcca gtctagccca acagtcggcg tctttgcagt ccaaagctgc cgccagagca 240 aaatcagccg aggagtcagc ggcagctacg gccaaagccg agttgcaggc agaatccatt 300 gctgcatctg ccagttccaa tgccagagag gctgcagcgt ccgcaaaagc ctccgcatcc 360 gcgatgtcat cggctgccgt gcaggcgaaa ctcgctgaaa agacggccaa gaatcaagct 420 ctggcttccg aagaagccaa actcaaggct gccgccgctg ccagcgcagc agcagcagcc 480 agcgccgccg ccgaggcagc cctgaaagct gagagaatag cggaagaagc catcgccaag 540 gcggccgctg ccaaagcagc cgccagagcc gctgcagccg cgttaaactc cgcgaaggaa 600 gccgccacga gcagcgcaag gagcgccgcc gaagccgaag ctaagagcga agtcgctata 660 ctgatcagcg aactcgacaa gaagagcagg gaagtcgccg cttccgcgtc cgccaaggca 720 cgcgctgctg ctgcggctag ctccagaaac gcagaaacgg ctgttatcgg agctaacatc 780 aatgtggcca aagaggtctt ggcgattccc atcgagccaa agaaacttcc ggagccagag 840 ctggcgttga aagaagagaa tgtcgcggtc gcgagctcag agagtgaagt gaaggtagaa 900 acgagcagcg aagcatggtc aatttaa 927 <210> 26 <211> 984 <212> DNA <213> Bombus terrestris <400> 26 atgaagattc cagcactgct cgtaacgtgc ctctaccttt ggggcttcgc gtccgccggc 60 cagagctcac ctctgctcga gatcgtgcag ggtagcgcgt cggccaccgc atccaccgct 120 gtgaccgcta gatccggact tcgtgccggt caggtagccg tggcctcgca gaaggatgcc 180 acacttcagg cagatgcctc agcggccgcc gcggccgctg cacgcgcttc cgccgaccag 240 tcggccagtc tagcccaaca gtcggcgtct ttgcagtcca aagctgccgc cagagcaaaa 300 tcagccgagg agtcagcggc agctacggcc aaagccgagt tgcaggcaga atccattgct 360 gcatctgcca gttccaatgc cagagaggct gcagcgtccg caaaagcctc cgcatccgcg 420 atgtcatcgg ctgccgtgca ggcgaaactc gctgaaaaga cggccaagaa tcaagctctg 480 gcttccgaag aagccaaact caaggctgcc gccgctgcca gcgcagcagc agcagccagc 540 gccgccgccg aggcagccct gaaagctgag agaatagcgg aagaagccat cgccaaggcg 600 gccgctgcca aagcagccgc cagagccgct gcagccgcgt taaactccgc gaaggaagcc 660 gccacgagca gcgcaaggag cgccgccgaa gccgaagcta agagcgaagt cgctatactg 720 atcagcgaac tcgacaagaa gagcagggaa gtcgccgctt ccgcgtccgc caaggcacgc 780 gctgctgctg cggctagctc cagaaacgca gaaacggctg ttatcggagc taacatcaat 840 gtggccaaag aggtcttggc gattcccatc gagccaaaga aacttccgga gccagagctg 900 gcgttgaaag aagagaatgt cgcggtcgcg agctcagaga gtgaagtgaa ggtagaaacg 960 agcagcgaag catggtcaat ttaa 984 <210> 27 <211> 882 <212> DNA <213> Bombus terrestris <400> 27 cacgtggtga agcgcgacaa ggagctcaag gccccggctt taccggaact actcggtgat 60 gggtctgaca cgctcggtgc ctcgatggag aacgggatca aagtcgccag agcatcgcag 120 aatgtgggtc tgagaacaga gttgaatgca gccgcgcggg ctgcagccgc tgctgcgacc 180 aagcaggcca aagacacaga ggccgcggaa gctggagcgg ccgctgcgat tgccatcgct 240 atcgccaagc gtgaagaagc tatcaaagca agcgaattag ccagcaagtt gttgacagcc 300 gcggctgggt ccagcgaagc tgccgtgtca gcgacggtga gggcggcgca attgacggcc 360 gcagctagcg cagctgccaa agcttctgca tccgcctctg aggcttctgc cgaagcccag 420 gtgagggcca acgccgaagc aaacatcgcc aagaaagctt cggcagctga agcaaaagcc 480 gcagccgaag cccaggttaa ggcggaactc gccaagaaag cggccgccgg tttcttagct 540 aaggctagac tagcggccag cgccgaatcc gaggccacta aactcgcagc cgaagctgaa 600 gtagcactgg ctaaggccag agtcgccgtc gaccagtcgc agagcgcaca ggcaaccgct 660 accgctcaag ctgccacagc cgttcagctg cagtctcaag cagctaacgc ggaagcctcc 720 gctgtagcac aggctgaaac tctgctggtc acggcggaag ccgtctctgc cgcggaagcc 780 gaagccgcga ccaaagctac cagttggggc gaagaatgtc atcaacgaga aaaagttacg 840 tttagcgaag atcgattaaa cgagagacaa gacaattggt ag 882 <210> 28 <211> 942 <212> DNA <213> Bombus terrestris <400> 28 atgaagattc cagcaatact ggttacgtct ctgctggtct ggggtggtct ggccgagggc 60 cacgtggtga agcgcgacaa ggagctcaag gccccggctt taccggaact actcggtgat 120 gggtctgaca cgctcggtgc ctcgatggag aacgggatca aagtcgccag agcatcgcag 180 aatgtgggtc tgagaacaga gttgaatgca gccgcgcggg ctgcagccgc tgctgcgacc 240 aagcaggcca aagacacaga ggccgcggaa gctggagcgg ccgctgcgat tgccatcgct 300 atcgccaagc gtgaagaagc tatcaaagca agcgaattag ccagcaagtt gttgacagcc 360 gcggctgggt ccagcgaagc tgccgtgtca gcgacggtga gggcggcgca attgacggcc 420 gcagctagcg cagctgccaa agcttctgca tccgcctctg aggcttctgc cgaagcccag 480 gtgagggcca acgccgaagc aaacatcgcc aagaaagctt cggcagctga agcaaaagcc 540 gcagccgaag cccaggttaa ggcggaactc gccaagaaag cggccgccgg tttcttagct 600 aaggctagac tagcggccag cgccgaatcc gaggccacta aactcgcagc cgaagctgaa 660 gtagcactgg ctaaggccag agtcgccgtc gaccagtcgc agagcgcaca ggcaaccgct 720 accgctcaag ctgccacagc cgttcagctg cagtctcaag cagctaacgc ggaagcctcc 780 gctgtagcac aggctgaaac tctgctggtc acggcggaag ccgtctctgc cgcggaagcc 840 gaagccgcga ccaaagctac cagttggggc gaagaatgtc atcaacgaga aaaagttacg 900 tttagcgaag atcgattaaa cgagagacaa gacaattggt ag 942 <210> 29 <211> 942 <212> DNA <213> Bombus terrestris <400> 29 ggtagcgtgg aactcggtgc ccccaagcag gagtctgtcc tcgtggagca gctcctattg 60 aagaacgtgg agactagtgc gaagcgaaag gagaacggcg caccgaaact cggcgagagc 120 acagctgcgg ctctggctag taccaaggca actgcagccg cagaggctaa ggcatccgcc 180 aaagtgaaag cttctgcctt ggccctcgct gaggctttct tgcgtgcgtc ggcagcgttt 240 gctgctgctt cagccaaagc tgctgccgct gtaaaggaag caacgcaggc acagttgctg 300 gcacaggaga aggctttgat agcgttgaaa actcaatctg agcaacaagc tgcctctgct 360 cgcgcggacg ccgcggctgc cgcagccgta tccgcgctag aacgcgccca ggcctcctcc 420 agagcagcca cgaccgccca agacatctcc agcgatctgg agaaacgtgt cgccacctca 480 gccgctgctg aagcaggtgc caccctcaga gcggaacaat ccgccgcgca atcgaaatgg 540 tccgccgcac tggccgccca aaccgccgct gctgcagccg ctatagaagc aaaggccacc 600 gcttcctcag aaagcaccgc tgccgctact agtaaggccg ccgtgttgac cgctgacact 660 agcagcgcag aagctgccgc tgcagcggag gcacaatccg cttcgcggat cgcaggtaca 720 gcagccaccg agggatccgc caactgggct agcgagaact cgcgtaccgc acaactggaa 780 gcttccgcct cagcgaaggc caccgcagcc gcagctgtcg gagatggagc tattatagga 840 cttgcacggg acgctagtgc cgcagctcag gcagccgcag aagttaaagc cttagctgaa 900 gctagtgcca gcttaggtgc ttcagaaaag gacaagaaat ga 942 <210> 30 <211> 999 <212> DNA <213> Bombus terrestris <400> 30 atgcagatcc cagcgatttt cgtcacgtgc ctgctcacat ggggcctggt gcacgcaggt 60 agcgtggaac tcggtgcccc caagcaggag tctgtcctcg tggagcagct cctattgaag 120 aacgtggaga ctagtgcgaa gcgaaaggag aacggcgcac cgaaactcgg cgagagcaca 180 gctgcggctc tggctagtac caaggcaact gcagccgcag aggctaaggc atccgccaaa 240 gtgaaagctt ctgccttggc cctcgctgag gctttcttgc gtgcgtcggc agcgtttgct 300 gctgcttcag ccaaagctgc tgccgctgta aaggaagcaa cgcaggcaca gttgctggca 360 caggagaagg ctttgatagc gttgaaaact caatctgagc aacaagctgc ctctgctcgc 420 gcggacgccg cggctgccgc agccgtatcc gcgctagaac gcgcccaggc ctcctccaga 480 gcagccacga ccgcccaaga catctccagc gatctggaga aacgtgtcgc cacctcagcc 540 gctgctgaag caggtgccac cctcagagcg gaacaatccg ccgcgcaatc gaaatggtcc 600 gccgcactgg ccgcccaaac cgccgctgct gcagccgcta tagaagcaaa ggccaccgct 660 tcctcagaaa gcaccgctgc cgctactagt aaggccgccg tgttgaccgc tgacactagc 720 agcgcagaag ctgccgctgc agcggaggca caatccgctt cgcggatcgc aggtacagca 780 gccaccgagg gatccgccaa ctgggctagc gagaactcgc gtaccgcaca actggaagct 840 tccgcctcag cgaaggccac cgcagccgca gctgtcggag atggagctat tataggactt 900 gcacgggacg ctagtgccgc agctcaggca gccgcagaag ttaaagcctt agctgaagct 960 agtgccagct taggtgcttc agaaaaggac aagaaatga 999 <210> 31 <211> 1017 <212> DNA <213> Bombus terrestris <400> 31 ggcaaaccac tcattgccaa tgcgcaaata gggaaggtca agaccgaaac gtcatcgtct 60 tcagagattg agacgttggt atcaggaagc cagacattgg tggcaggaag tgagacattg 120 gcttcagaaa gcgaggcatt ggcgtcaaaa agcgaggcat tgacgtcaga agccgagata 180 gcgagcgtga caacgaagga cgagctcata ctaaagggcg aagctatcac tggaaagaaa 240 ctaggaaccg gggcgtcgga agtagcggcg gcctctgggg aggctatcgc aactaccctt 300 ggcgcgggac aagctgcagc agaggcacaa gcagccgccg ccgcgcaagc aaaatcagca 360 gcggcagctg ccgcgaatgc aggtgaatcc agcaacagtg ctgctgcgtt ggttgctgct 420 gcagctgcag cacaaggaaa agcggctgcc gccgcagcag ccgcgacgaa ggctagctta 480 gaggccgcag acgctgctga ggaagctgag tcggccgtgg ccttggctag ggctgcctcc 540 gcaaaggcgg aagcgctcgc atcgaccgcc gctgctgcga atacccgtgc tgctctccaa 600 gcggaaaaat cgaacgagct ggcgcaagct gaggctgcag ccgccgccga agcccaggct 660 aaagccgccg ctgctgccaa ggcaacacaa ctcgccctta aagttgccga aactgcggtg 720 aaaacggaag cagatgcagc agctgccgcc gttgcggccg caaaagccag agcagtcgca 780 gacgcagccg cgtctcgtgc gaccgcagtg aacgccattg ctgaagcgga agaaagagac 840 tctgcacagg cggagaacac cgctggtgta gcacaagcag cgctcgctgc tgcggaagca 900 caagactcct gcatcggcgc tgccgcgact cctaggcatt cgtcgagcta tgcatggtgg 960 aagcttagga taacatcctt gatcgtcatt ctatcgccac gcaatcgacg tacttaa 1017 <210> 32 <211> 1074 <212> DNA <213> Bombus terrestris <400> 32 atgaagattc catcgatact cgcggtgtcc ctgctggttt ggggtctggc cagcgcaggc 60 aaaccactca ttgccaatgc gcaaataggg aaggtcaaga ccgaaacgtc atcgtcttca 120 gagattgaga cgttggtatc aggaagccag acattggtgg caggaagtga gacattggct 180 tcagaaagcg aggcattggc gtcaaaaagc gaggcattga cgtcagaagc cgagatagcg 240 agcgtgacaa cgaaggacga gctcatacta aagggcgaag ctatcactgg aaagaaacta 300 ggaaccgggg cgtcggaagt agcggcggcc tctggggagg ctatcgcaac tacccttggc 360 gcgggacaag ctgcagcaga ggcacaagca gccgccgccg cgcaagcaaa atcagcagcg 420 gcagctgccg cgaatgcagg tgaatccagc aacagtgctg ctgcgttggt tgctgctgca 480 gctgcagcac aaggaaaagc ggctgccgcc gcagcagccg cgacgaaggc tagcttagag 540 gccgcagacg ctgctgagga agctgagtcg gccgtggcct tggctagggc tgcctccgca 600 aaggcggaag cgctcgcatc gaccgccgct gctgcgaata cccgtgctgc tctccaagcg 660 gaaaaatcga acgagctggc gcaagctgag gctgcagccg ccgccgaagc ccaggctaaa 720 gccgccgctg ctgccaaggc aacacaactc gcccttaaag ttgccgaaac tgcggtgaaa 780 acggaagcag atgcagcagc tgccgccgtt gcggccgcaa aagccagagc agtcgcagac 840 gcagccgcgt ctcgtgcgac cgcagtgaac gccattgctg aagcggaaga aagagactct 900 gcacaggcgg agaacaccgc tggtgtagca caagcagcgc tcgctgctgc ggaagcacaa 960 gactcctgca tcggcgctgc cgcgactcct aggcattcgt cgagctatgc atggtggaag 1020 cttaggataa catccttgat cgtcattcta tcgccacgca atcgacgtac ttaa 1074 <210> 33 <211> 403 <212> PRT <213> Myrmecia forficata <400> 33 Ser Gly Pro Arg Leu Leu Gly Gly Arg Ser Ala Ala Ser Ala Ser Ala 1 5 10 15 Ser Ala Ser Ala Glu Ala Ser Ala Gly Gly Trp Arg Lys Ser Gly Ala 20 25 30 Ser Ala Ser Ala Ser Ala Lys Ala Gly Ser Ser Asn Ile Leu Ser Arg 35 40 45 Val Gly Ala Ser Arg Ala Ala Ala Thr Leu Val Ala Ser Ala Ala Val 50 55 60 Glu Ala Lys Ala Gly Leu Arg Ala Gly Lys Ala Thr Ala Glu Glu Gln 65 70 75 80 Arg Glu Ala Leu Glu Met Leu Thr Leu Ser Ala Asp Lys Asn Ala Glu 85 90 95 Ala Arg Ile Leu Ala Asp Asp Thr Ala Val Leu Val Gln Gly Ser Ala 100 105 110 Glu Ala Gln Ser Val Ala Ala Ala Lys Thr Val Ala Val Glu Glu Glu 115 120 125 Ser Ala Ser Leu Asp Ala Ala Ala Val Glu Ala Glu Val Ala Ala Ala 130 135 140 Thr Ser Lys Ser Ser Ala Gly Gln Ala Leu Gln Ser Ala Gln Thr Ala 145 150 155 160 Ala Ser Ala Leu Arg Thr Ser Ala Arg Ser Ala Leu Thr Ala Leu Lys 165 170 175 Leu Ala Arg Leu Gln Gly Ala Ala Ser Ser Asn Ala Ala Arg Met Met 180 185 190 Glu Lys Ala Leu Ala Ala Thr Gln Asp Ala Asn Ala Ala Ala Gln Gln 195 200 205 Ala Met Ala Ala Glu Ser Ala Ala Ala Glu Ala Ala Ala Ile Ala Ala 210 215 220 Ala Lys Gln Ser Glu Ala Arg Asp Ala Gly Ala Glu Ala Lys Ala Ala 225 230 235 240 Met Ala Ala Leu Ile Thr Ala Gln Arg Asn Leu Val Gln Ala Asn Ala 245 250 255 Arg Ala Glu Met Ala Ser Glu Glu Ala Glu Leu Asp Ser Lys Ser Arg 260 265 270 Ala Ser Asp Ala Lys Val Asn Ala Val Ala Arg Ala Ala Ser Lys Ser 275 280 285 Ser Ile Arg Arg Asp Glu Leu Ile Glu Ile Gly Ala Glu Phe Gly Lys 290 295 300 Ala Ser Gly Glu Val Ile Ser Thr Gly Thr Arg Ser Asn Gly Gly Gln 305 310 315 320 Asp Ala Ile Ala Thr Ala Glu Ala Ser Ser Ser Ala Ser Ala Val Gly 325 330 335 Ile Lys Lys Thr Ser Gly His Trp Gly Ser Gly Lys Trp Ser Arg Val 340 345 350 Ser Lys Gly Lys Gly Trp Ala Ser Ser Asn Ala Asp Ala Asp Ala Ser 355 360 365 Ser Ser Ser Ile Ile Ile Gly Gly Leu Lys Arg Gly Gly Leu Gly Ser 370 375 380 Glu Ala Ser Ala Ala Ala Ser Ala Glu Ala Glu Ala Ser Ala Gly Thr 385 390 395 400 Leu Leu Leu <210> 34 <211> 422 <212> PRT <213> Myrmecia forficata <400> 34 Met Lys Ile Pro Ala Ile Ile Ala Thr Ser Leu Leu Leu Trp Gly Phe 1 5 10 15 Ala Ser Ala Ser Gly Pro Arg Leu Leu Gly Gly Arg Ser Ala Ala Ser 20 25 30 Ala Ser Ala Ser Ala Ser Ala Glu Ala Ser Ala Gly Gly Trp Arg Lys 35 40 45 Ser Gly Ala Ser Ala Ser Ala Ser Ala Lys Ala Gly Ser Ser Asn Ile 50 55 60 Leu Ser Arg Val Gly Ala Ser Arg Ala Ala Ala Thr Leu Val Ala Ser 65 70 75 80 Ala Ala Val Glu Ala Lys Ala Gly Leu Arg Ala Gly Lys Ala Thr Ala 85 90 95 Glu Glu Gln Arg Glu Ala Leu Glu Met Leu Thr Leu Ser Ala Asp Lys 100 105 110 Asn Ala Glu Ala Arg Ile Leu Ala Asp Asp Thr Ala Val Leu Val Gln 115 120 125 Gly Ser Ala Glu Ala Gln Ser Val Ala Ala Ala Lys Thr Val Ala Val 130 135 140 Glu Glu Glu Ser Ala Ser Leu Asp Ala Ala Ala Val Glu Ala Glu Val 145 150 155 160 Ala Ala Ala Thr Ser Lys Ser Ser Ala Gly Gln Ala Leu Gln Ser Ala 165 170 175 Gln Thr Ala Ala Ser Ala Leu Arg Thr Ser Ala Arg Ser Ala Leu Thr 180 185 190 Ala Leu Lys Leu Ala Arg Leu Gln Gly Ala Ala Ser Ser Asn Ala Ala 195 200 205 Arg Met Met Glu Lys Ala Leu Ala Ala Thr Gln Asp Ala Asn Ala Ala 210 215 220 Ala Gln Gln Ala Met Ala Ala Glu Ser Ala Ala Ala Glu Ala Ala Ala 225 230 235 240 Ile Ala Ala Ala Lys Gln Ser Glu Ala Arg Asp Ala Gly Ala Glu Ala 245 250 255 Lys Ala Ala Met Ala Ala Leu Ile Thr Ala Gln Arg Asn Leu Val Gln 260 265 270 Ala Asn Ala Arg Ala Glu Met Ala Ser Glu Glu Ala Glu Leu Asp Ser 275 280 285 Lys Ser Arg Ala Ser Asp Ala Lys Val Asn Ala Val Ala Arg Ala Ala 290 295 300 Ser Lys Ser Ser Ile Arg Arg Asp Glu Leu Ile Glu Ile Gly Ala Glu 305 310 315 320 Phe Gly Lys Ala Ser Gly Glu Val Ile Ser Thr Gly Thr Arg Ser Asn 325 330 335 Gly Gly Gln Asp Ala Ile Ala Thr Ala Glu Ala Ser Ser Ser Ala Ser 340 345 350 Ala Val Gly Ile Lys Lys Thr Ser Gly His Trp Gly Ser Gly Lys Trp 355 360 365 Ser Arg Val Ser Lys Gly Lys Gly Trp Ala Ser Ser Asn Ala Asp Ala 370 375 380 Asp Ala Ser Ser Ser Ser Ile Ile Ile Gly Gly Leu Lys Arg Gly Gly 385 390 395 400 Leu Gly Ser Glu Ala Ser Ala Ala Ala Ser Ala Glu Ala Glu Ala Ser 405 410 415 Ala Gly Thr Leu Leu Leu 420 <210> 35 <211> 392 <212> PRT <213> Myrmecia forficata <400> 35 Arg Val Ile Glu Ser Ser Ser Ser Ala Ser Ala Gln Ala Ser Ala Ser 1 5 10 15 Ala Gly Ser Arg Gly Leu Leu Gly Lys Arg Pro Ile Gly Lys Leu Glu 20 25 30 Trp Gly Lys Glu Glu Lys Lys Leu Glu Glu Leu Asp Glu Glu Ser Leu 35 40 45 Asn Glu Ala Ala Leu Lys Val Gly Ile Lys Asn Gly Gly Leu Asp Val 50 55 60 Ala Lys Gly Ala Ala Val Leu Glu Ala Ala Met Ser Asp Val Ala Thr 65 70 75 80 Leu Thr Asp Gln Arg Ser Leu Val Asp Leu Gly Leu Gly Pro Val Ala 85 90 95 Asn Glu Ala Glu Ile Leu Ala Glu Ala Gln Ala Ala Thr Ser Ala Gln 100 105 110 Ala Gly Ala Val Ala Asn Ser Ala Ala Glu Arg Ala Ile Ala Ala Met 115 120 125 Glu Met Ala Asp Arg Thr Glu Tyr Ile Ala Ala Leu Val Thr Thr Lys 130 135 140 Ala Ala Lys Ala Ala Glu Ala Thr Met Ala Ala Thr Ala Arg Ala Thr 145 150 155 160 Ala Ala Ala Ser Ala Ser Lys Ile Ser Ser Gln Glu Ser Ala Ala Ser 165 170 175 Ala Ala Asn Ala Ala Asn Ala Glu Ala Lys Ala Asn Ala Ala Ser Ile 180 185 190 Ile Ala Asn Lys Ala Asn Ala Val Leu Ala Glu Ala Ala Ala Val Leu 195 200 205 Ala Ala Thr Ala Ala Lys Ala Lys Glu Ser Ala Met Lys Ser Leu Ser 210 215 220 Ala Ala Gln Ala Ala Ala Lys Ala Gln Ala Arg Asn Ala Glu Ala Ser 225 230 235 240 Ala Glu Ala Gln Ile Lys Leu Ser Gln Ala Arg Ala Ala Val Ala Arg 245 250 255 Ala Ala Ala Asp Gln Ala Val Cys Ser Ser Gln Ala Gln Ala Ala Ser 260 265 270 Gln Ile Gln Ser Arg Ala Ser Ala Ser Glu Ser Ala Ala Ser Ala Gln 275 280 285 Ser Glu Thr Asn Thr Ala Ala Ala Glu Ala Val Ala Thr Ala Asp Ala 290 295 300 Glu Ala Ala Ala Gln Ala Glu Ala Trp Val Met Ser Leu Lys Asn Asp 305 310 315 320 Leu Trp Leu His Leu Asn Met Lys Gly Glu Ala Lys Ala Glu Gly Glu 325 330 335 Ala Val Ser Ile Ser Lys Gly His Arg Gly Gly Ile Arg Ser Gly Ser 340 345 350 Ile Ser Glu Ala Ser Ala Glu Ala Ser Ser Asn Val Ser Met Gly Gly 355 360 365 Arg His Gly Arg Lys Asp Leu Val Ser Glu Ala Leu Ala Gly Ala Ser 370 375 380 Ala Gly Ser Ser Ala Asp Ser Leu 385 390 <210> 36 <211> 411 <212> PRT <213> Myrmecia forficata <400> 36 Met Lys Ile Pro Ala Ile Leu Val Thr Ser Leu Leu Ala Trp Gly Leu 1 5 10 15 Ala Ser Gly Arg Val Ile Glu Ser Ser Ser Ser Ala Ser Ala Gln Ala 20 25 30 Ser Ala Ser Ala Gly Ser Arg Gly Leu Leu Gly Lys Arg Pro Ile Gly 35 40 45 Lys Leu Glu Trp Gly Lys Glu Glu Lys Lys Leu Glu Glu Leu Asp Glu 50 55 60 Glu Ser Leu Asn Glu Ala Ala Leu Lys Val Gly Ile Lys Asn Gly Gly 65 70 75 80 Leu Asp Val Ala Lys Gly Ala Ala Val Leu Glu Ala Ala Met Ser Asp 85 90 95 Val Ala Thr Leu Thr Asp Gln Arg Ser Leu Val Asp Leu Gly Leu Gly 100 105 110 Pro Val Ala Asn Glu Ala Glu Ile Leu Ala Glu Ala Gln Ala Ala Thr 115 120 125 Ser Ala Gln Ala Gly Ala Val Ala Asn Ser Ala Ala Glu Arg Ala Ile 130 135 140 Ala Ala Met Glu Met Ala Asp Arg Thr Glu Tyr Ile Ala Ala Leu Val 145 150 155 160 Thr Thr Lys Ala Ala Lys Ala Ala Glu Ala Thr Met Ala Ala Thr Ala 165 170 175 Arg Ala Thr Ala Ala Ala Ser Ala Ser Lys Ile Ser Ser Gln Glu Ser 180 185 190 Ala Ala Ser Ala Ala Asn Ala Ala Asn Ala Glu Ala Lys Ala Asn Ala 195 200 205 Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala Val Leu Ala Glu Ala Ala 210 215 220 Ala Val Leu Ala Ala Thr Ala Ala Lys Ala Lys Glu Ser Ala Met Lys 225 230 235 240 Ser Leu Ser Ala Ala Gln Ala Ala Ala Lys Ala Gln Ala Arg Asn Ala 245 250 255 Glu Ala Ser Ala Glu Ala Gln Ile Lys Leu Ser Gln Ala Arg Ala Ala 260 265 270 Val Ala Arg Ala Ala Ala Asp Gln Ala Val Cys Ser Ser Gln Ala Gln 275 280 285 Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser Ala Ser Glu Ser Ala Ala 290 295 300 Ser Ala Gln Ser Glu Thr Asn Thr Ala Ala Ala Glu Ala Val Ala Thr 305 310 315 320 Ala Asp Ala Glu Ala Ala Ala Gln Ala Glu Ala Trp Val Met Ser Leu 325 330 335 Lys Asn Asp Leu Trp Leu His Leu Asn Met Lys Gly Glu Ala Lys Ala 340 345 350 Glu Gly Glu Ala Val Ser Ile Ser Lys Gly His Arg Gly Gly Ile Arg 355 360 365 Ser Gly Ser Ile Ser Glu Ala Ser Ala Glu Ala Ser Ser Asn Val Ser 370 375 380 Met Gly Gly Arg His Gly Arg Lys Asp Leu Val Ser Glu Ala Leu Ala 385 390 395 400 Gly Ala Ser Ala Gly Ser Ser Ala Asp Ser Leu 405 410 <210> 37 <211> 375 <212> PRT <213> Myrmecia forficata <400> 37 Asn Leu Leu Lys Glu Ser Lys Ala Ser Ala Ser Ala Ser Ala Ser Ala 1 5 10 15 Ser Ala Arg Ala Ser Gly Lys Lys Asn Leu His Val Leu Pro Leu Pro 20 25 30 Lys Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser Val Phe Asp Ile 35 40 45 Lys Asp Val Val Leu Ser Ala Val Asp Glu Ile Asn Gly Ala Pro Lys 50 55 60 Leu Gly Leu Gly Trp Lys Lys Val Ser Met Gly Val Glu Arg Ala Glu 65 70 75 80 Ala Asn Ala Ala Ala Ala Ala Glu Ala Leu Ala Met Ile Lys Lys Ile 85 90 95 Ala Met Ala Arg Ser Ser Ala Tyr Val Gln Ala Ala Trp Ala Ser Ala 100 105 110 Gln Ala Ser Ala Asp Ala Leu Ala Ser Ala Arg Val Ala Gln Ala Ser 115 120 125 Gln Glu Ala Ala Glu Ala Lys Gly Arg Ala Ala Ser Glu Ala Leu Ser 130 135 140 Arg Ala Ile Glu Ala Ser Ser Arg Ala Asp Ala Ala Ala Ala Ala Thr 145 150 155 160 Leu Asp Ala Met Asp Arg Thr Met Glu Asn Ala Arg Ala Ala Asn Ala 165 170 175 Ala Gln Thr Gln Ala Ser Gly Gln Ala Glu Asn Ala Asn Arg Ser Ala 180 185 190 Ala Ala Ile Leu Ala Ala Leu Leu Arg Ile Ala Glu Ala Ser Ala Leu 195 200 205 Asn Asn Glu Ala Ala Val Asn Ala Ala Ala Ala Ala Ala Ala Ala Ser 210 215 220 Ala Leu Gln Ala Lys Ala Asn Ala Ala Ser Gln Ala Thr Ala Arg Ala 225 230 235 240 Ala Gly Gln Ala Ser Thr Ala Ala Glu Glu Ala Gln Ser Ala Gln Glu 245 250 255 Ala Ala Asp Lys Asn Ala Glu Leu Thr Thr Val Met Leu Glu Lys Ala 260 265 270 Ser Ala Asp Gln Gln Ala Ala Ser Ala Arg Ala Asp Tyr Tyr Thr Ala 275 280 285 Ser Thr Glu Ala Glu Ala Ala Ala Gln Ala Ser Ala Ile Asn Ala Leu 290 295 300 Arg Asp Gly Ile Val Val Gly Met Gly Asn Asp Ala Gly Ala Ser Ala 305 310 315 320 Gln Ala Met Ala Gln Val Glu Ala Leu Ala Arg Ala Ser Glu His Lys 325 330 335 Ala Leu Gly Glu Lys Lys Lys Gly Leu Val Trp Gly Tyr Gly Ser Lys 340 345 350 Gly Ser Ser Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Glu Ala Ser 355 360 365 Ser Arg Leu Gly Lys Asp Trp 370 375 <210> 38 <211> 394 <212> PRT <213> Myrmecia forficata <400> 38 Met Lys Ile Pro Ala Ile Leu Val Thr Ser Phe Leu Ala Trp Gly Leu 1 5 10 15 Ala Ser Gly Asn Leu Leu Lys Glu Ser Lys Ala Ser Ala Ser Ala Ser 20 25 30 Ala Ser Ala Ser Ala Arg Ala Ser Gly Lys Lys Asn Leu His Val Leu 35 40 45 Pro Leu Pro Lys Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser Val 50 55 60 Phe Asp Ile Lys Asp Val Val Leu Ser Ala Val Asp Glu Ile Asn Gly 65 70 75 80 Ala Pro Lys Leu Gly Leu Gly Trp Lys Lys Val Ser Met Gly Val Glu 85 90 95 Arg Ala Glu Ala Asn Ala Ala Ala Ala Ala Glu Ala Leu Ala Met Ile 100 105 110 Lys Lys Ile Ala Met Ala Arg Ser Ser Ala Tyr Val Gln Ala Ala Trp 115 120 125 Ala Ser Ala Gln Ala Ser Ala Asp Ala Leu Ala Ser Ala Arg Val Ala 130 135 140 Gln Ala Ser Gln Glu Ala Ala Glu Ala Lys Gly Arg Ala Ala Ser Glu 145 150 155 160 Ala Leu Ser Arg Ala Ile Glu Ala Ser Ser Arg Ala Asp Ala Ala Ala 165 170 175 Ala Ala Thr Leu Asp Ala Met Asp Arg Thr Met Glu Asn Ala Arg Ala 180 185 190 Ala Asn Ala Ala Gln Thr Gln Ala Ser Gly Gln Ala Glu Asn Ala Asn 195 200 205 Arg Ser Ala Ala Ala Ile Leu Ala Ala Leu Leu Arg Ile Ala Glu Ala 210 215 220 Ser Ala Leu Asn Asn Glu Ala Ala Val Asn Ala Ala Ala Ala Ala Ala 225 230 235 240 Ala Ala Ser Ala Leu Gln Ala Lys Ala Asn Ala Ala Ser Gln Ala Thr 245 250 255 Ala Arg Ala Ala Gly Gln Ala Ser Thr Ala Ala Glu Glu Ala Gln Ser 260 265 270 Ala Gln Glu Ala Ala Asp Lys Asn Ala Glu Leu Thr Thr Val Met Leu 275 280 285 Glu Lys Ala Ser Ala Asp Gln Gln Ala Ala Ser Ala Arg Ala Asp Tyr 290 295 300 Tyr Thr Ala Ser Thr Glu Ala Glu Ala Ala Ala Gln Ala Ser Ala Ile 305 310 315 320 Asn Ala Leu Arg Asp Gly Ile Val Val Gly Met Gly Asn Asp Ala Gly 325 330 335 Ala Ser Ala Gln Ala Met Ala Gln Val Glu Ala Leu Ala Arg Ala Ser 340 345 350 Glu His Lys Ala Leu Gly Glu Lys Lys Lys Gly Leu Val Trp Gly Tyr 355 360 365 Gly Ser Lys Gly Ser Ser Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala 370 375 380 Glu Ala Ser Ser Arg Leu Gly Lys Asp Trp 385 390 <210> 39 <211> 422 <212> PRT <213> Myrmecia forficata <400> 39 Ser Glu Leu Glu Ser Glu Ala Ser Ala Ala Ala Ser Ala Gln Ala Glu 1 5 10 15 Ala Ser Ser Ser Gly Arg Ser Gly Lys Leu Ser Ala Ser Gln Ala Ser 20 25 30 Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Ser Arg Gly Gly Ser Lys 35 40 45 Gly Gly Trp Gly Gln Leu Arg Arg Gly Asp Val Lys Ser Glu Ala Lys 50 55 60 Ser Ala Ala Ala Ile Ala Val Glu Gly Ala Lys Ile Gly Thr Gly Ile 65 70 75 80 Gly Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg Gly Leu Gly 85 90 95 Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala Gly Gln Ala 100 105 110 Glu Val Ala Ala Lys Ser Cys Glu Leu Ala Asp Lys Thr Thr Ala Lys 115 120 125 Ala Val Ala Met Val Glu Ala Ala Ala Glu Ala Glu Ile Glu Val Ala 130 135 140 Asn Gln Glu Val Ala Ala Val Lys Leu Ser Thr Trp Ala Ala Lys Ala 145 150 155 160 Ala Arg Ile Val Glu Glu Asp Ser Ala Ala Val Arg Ala Ala Ala Gly 165 170 175 Lys Leu Leu Leu Ala Ala Arg Ala Ala Ala Ala Ala Glu Arg Arg Ala 180 185 190 Asn Glu Glu Ser Glu Ala Ala Asn Glu Leu Ala Gln Ala Ser Ser Ala 195 200 205 Ala Ala Ala Glu Ala Glu Ala Lys Ala Asn Ala Gly Arg Glu Ala Ala 210 215 220 Ala Ala Ala Leu Ala Ile Ala Glu Ala Ala Val Ala Ile Glu Gln Glu 225 230 235 240 Ala Val Ile Leu Ala Arg Lys Ala Gln Asp Ala Arg Leu Asn Ala Glu 245 250 255 Ala Ala Ala Ala Ala Ala Met Asn Ala Arg Val Ile Ala Ser Ala Glu 260 265 270 Ser Glu Ala Ser Glu Asp Leu Glu Asn Arg Ala Ser Val Ala Arg Ala 275 280 285 Ser Ala Ala Gly Ala Ala Glu Ala Lys Ala Ile Ala Thr Asp Ala Gly 290 295 300 Ala Thr Ala Glu Ile Ala Ala Tyr Ser Trp Ala Lys Lys Gly Glu Leu 305 310 315 320 Ile Asn Pro Gly Pro Leu Pro Lys Ile Ile Ser Val Asn Ala Asp Leu 325 330 335 Ser Lys Ser Glu Val Glu Ala Met Lys Ile Thr Arg Gly Gln Val Gln 340 345 350 Glu Val Lys Lys Ile Ser Thr His Lys Gly Gly Trp Gly Trp Gly Lys 355 360 365 Glu Gly Arg Ser Lys Val Ser Ser Asn Ala Ser Ala Arg Ala Ser Ala 370 375 380 Ser Ala Asn Ala Ala Ala Gly Ser Leu Gly Ser Lys Trp Gly Arg Gln 385 390 395 400 Leu Ser Ala Ser Ser Ala Ser Ala Asp Ala Asn Ala Glu Ala Asp Ser 405 410 415 Gln Leu Leu Lys Val Trp 420 <210> 40 <211> 441 <212> PRT <213> Myrmecia forficata <400> 40 Met Lys Ile Pro Ala Ile Leu Ala Thr Ser Leu Leu Ile Trp Gly Leu 1 5 10 15 Val Gly Ala Ser Glu Leu Glu Ser Glu Ala Ser Ala Ala Ala Ser Ala 20 25 30 Gln Ala Glu Ala Ser Ser Ser Gly Arg Ser Gly Lys Leu Ser Ala Ser 35 40 45 Gln Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Ser Arg Gly 50 55 60 Gly Ser Lys Gly Gly Trp Gly Gln Leu Arg Arg Gly Asp Val Lys Ser 65 70 75 80 Glu Ala Lys Ser Ala Ala Ala Ile Ala Val Glu Gly Ala Lys Ile Gly 85 90 95 Thr Gly Ile Gly Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg 100 105 110 Gly Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala 115 120 125 Gly Gln Ala Glu Val Ala Ala Lys Ser Cys Glu Leu Ala Asp Lys Thr 130 135 140 Thr Ala Lys Ala Val Ala Met Val Glu Ala Ala Ala Glu Ala Glu Ile 145 150 155 160 Glu Val Ala Asn Gln Glu Val Ala Ala Val Lys Leu Ser Thr Trp Ala 165 170 175 Ala Lys Ala Ala Arg Ile Val Glu Glu Asp Ser Ala Ala Val Arg Ala 180 185 190 Ala Ala Gly Lys Leu Leu Leu Ala Ala Arg Ala Ala Ala Ala Ala Glu 195 200 205 Arg Arg Ala Asn Glu Glu Ser Glu Ala Ala Asn Glu Leu Ala Gln Ala 210 215 220 Ser Ser Ala Ala Ala Ala Glu Ala Glu Ala Lys Ala Asn Ala Gly Arg 225 230 235 240 Glu Ala Ala Ala Ala Ala Leu Ala Ile Ala Glu Ala Ala Val Ala Ile 245 250 255 Glu Gln Glu Ala Val Ile Leu Ala Arg Lys Ala Gln Asp Ala Arg Leu 260 265 270 Asn Ala Glu Ala Ala Ala Ala Ala Ala Met Asn Ala Arg Val Ile Ala 275 280 285 Ser Ala Glu Ser Glu Ala Ser Glu Asp Leu Glu Asn Arg Ala Ser Val 290 295 300 Ala Arg Ala Ser Ala Ala Gly Ala Ala Glu Ala Lys Ala Ile Ala Thr 305 310 315 320 Asp Ala Gly Ala Thr Ala Glu Ile Ala Ala Tyr Ser Trp Ala Lys Lys 325 330 335 Gly Glu Leu Ile Asn Pro Gly Pro Leu Pro Lys Ile Ile Ser Val Asn 340 345 350 Ala Asp Leu Ser Lys Ser Glu Val Glu Ala Met Lys Ile Thr Arg Gly 355 360 365 Gln Val Gln Glu Val Lys Lys Ile Ser Thr His Lys Gly Gly Trp Gly 370 375 380 Trp Gly Lys Glu Gly Arg Ser Lys Val Ser Ser Asn Ala Ser Ala Arg 385 390 395 400 Ala Ser Ala Ser Ala Asn Ala Ala Ala Gly Ser Leu Gly Ser Lys Trp 405 410 415 Gly Arg Gln Leu Ser Ala Ser Ser Ala Ser Ala Asp Ala Asn Ala Glu 420 425 430 Ala Asp Ser Gln Leu Leu Lys Val Trp 435 440 <210> 41 <211> 1212 <212> DNA <213> Myrmecia forficata <400> 41 agcgggccgc gcttactcgg cggcagatcg gccgcgtccg cgtcggcttc cgcttcggct 60 gaggcgtcgg cgggcggttg gaggaaaagc ggcgcatccg cttccgcttc cgctaaggct 120 ggtagcagca acatcctcag ccgcgtggga gcttcgaggg cggccgcgac gttggtcgct 180 tccgccgcgg tggaggccaa ggcgggtctc cgtgccggca aggcaaccgc cgaggagcag 240 agggaggctt tggaaatgct caccttgtcc gccgacaaga atgccgaggc gcgtatcctg 300 gccgacgaca cggccgttct ggttcaaggc agcgccgagg cacagtcggt cgccgccgcg 360 aagaccgtcg cggtcgagga agagtccgct tccttggatg cggccgcagt tgaagcggag 420 gtcgcagccg ccacgtcgaa atcgtcggct ggccaagcac tccagtccgc acagaccgcc 480 gcatctgctc tcagaacttc cgccaggagc gccttgacgg ccctcaagct ggcacgcctc 540 caaggcgcgg cttctagcaa cgctgccagg atgatggaaa aggcgctggc cgccacccag 600 gacgcaaatg ccgccgccca gcaagctatg gcggccgaga gtgcagccgc agaagcagcg 660 gctatcgcgg cagcgaaaca atcggaggcg agagacgccg gcgccgaggc caaggccgcc 720 atggcagcac tcatcaccgc ccagaggaat ctcgtgcagg ccaatgccag ggcggaaatg 780 gcaagcgagg aagccgaatt ggattcgaag tctagagcgt ccgacgccaa ggtgaacgcc 840 gttgctcgtg cggcctccaa gtccagcata cgcagagatg aacttatcga gatcggcgct 900 gagttcggca aggccagcgg cgaggtgatt tccaccggca cgcgttccaa cggcggtcaa 960 gacgccatcg ccaccgccga ggcatcgagt agcgcgtccg ccgtcggcat caagaaaaca 1020 agcggacact gggggagcgg aaaatggagt cgtgtctcca agggtaaagg atgggcttcc 1080 tcgaatgcgg acgctgacgc cagcagcagc agcatcatca tcggcggtct caaacgcggc 1140 ggcctcggtt cggaagcctc tgcggcagct tccgcagaag cggaagcttc cgccggcaca 1200 ctcctgctgt aa 1212 <210> 42 <211> 1269 <212> DNA <213> Myrmecia forficata <400> 42 atgaagatcc cagcgataat cgcaacgtcc cttctcctct ggggtttcgc cagcgccagc 60 gggccgcgct tactcggcgg cagatcggcc gcgtccgcgt cggcttccgc ttcggctgag 120 gcgtcggcgg gcggttggag gaaaagcggc gcatccgctt ccgcttccgc taaggctggt 180 agcagcaaca tcctcagccg cgtgggagct tcgagggcgg ccgcgacgtt ggtcgcttcc 240 gccgcggtgg aggccaaggc gggtctccgt gccggcaagg caaccgccga ggagcagagg 300 gaggctttgg aaatgctcac cttgtccgcc gacaagaatg ccgaggcgcg tatcctggcc 360 gacgacacgg ccgttctggt tcaaggcagc gccgaggcac agtcggtcgc cgccgcgaag 420 accgtcgcgg tcgaggaaga gtccgcttcc ttggatgcgg ccgcagttga agcggaggtc 480 gcagccgcca cgtcgaaatc gtcggctggc caagcactcc agtccgcaca gaccgccgca 540 tctgctctca gaacttccgc caggagcgcc ttgacggccc tcaagctggc acgcctccaa 600 ggcgcggctt ctagcaacgc tgccaggatg atggaaaagg cgctggccgc cacccaggac 660 gcaaatgccg ccgcccagca agctatggcg gccgagagtg cagccgcaga agcagcggct 720 atcgcggcag cgaaacaatc ggaggcgaga gacgccggcg ccgaggccaa ggccgccatg 780 gcagcactca tcaccgccca gaggaatctc gtgcaggcca atgccagggc ggaaatggca 840 agcgaggaag ccgaattgga ttcgaagtct agagcgtccg acgccaaggt gaacgccgtt 900 gctcgtgcgg cctccaagtc cagcatacgc agagatgaac ttatcgagat cggcgctgag 960 ttcggcaagg ccagcggcga ggtgatttcc accggcacgc gttccaacgg cggtcaagac 1020 gccatcgcca ccgccgaggc atcgagtagc gcgtccgccg tcggcatcaa gaaaacaagc 1080 ggacactggg ggagcggaaa atggagtcgt gtctccaagg gtaaaggatg ggcttcctcg 1140 aatgcggacg ctgacgccag cagcagcagc atcatcatcg gcggtctcaa acgcggcggc 1200 ctcggttcgg aagcctctgc ggcagcttcc gcagaagcgg aagcttccgc cggcacactc 1260 ctgctgtaa 1269 <210> 43 <211> 1179 <212> DNA <213> Myrmecia forficata <400> 43 cgggtcatcg agtccagctc gtcggcttcc gcacaggcgt cggcatcggc cggctcgaga 60 ggcctgctcg gtaaacggcc gattggcaag ctcgagtggg gcaaggagga gaagaaactc 120 gaagaactcg acgaggaatc gctcaatgag gccgctctga aggtcggcat caagaacggc 180 ggattggatg tcgcgaaggg cgcggcagtc ctcgaggcag cgatgagcga cgtcgcgacc 240 cttacggatc agcgttctct tgtggatctc ggtctcggcc cggtcgcgaa cgaggccgag 300 atcctggcgg aggcgcaggc cgccacgagc gcccaagctg gcgctgtcgc taatagcgcc 360 gcggagcgtg cgatcgcggc gatggagatg gccgacagaa ccgaatatat tgcggcactt 420 gtcaccacca aagccgccaa agctgccgag gccactatgg ccgctactgc ccgtgccacc 480 gccgccgcct cagcctccaa gatatccagt caggaatcag ccgcatcggc cgctaacgcc 540 gccaacgccg aagccaaggc caacgccgct tccataatcg ctaacaaggc gaacgccgtc 600 ctggctgagg ccgccgccgt actcgcagcc actgctgcca aggccaagga atcggcgatg 660 aaatcgctta gcgccgctca ggccgccgcc aaggcacaag ccaggaacgc cgaggcctcc 720 gccgaagctc agatcaaact ttcccaggcc agggccgccg tggcacgcgc tgcagccgat 780 caggccgtct gttcctccca ggctcaggcc gcaagtcaga tacaatcgag ggcatccgca 840 tccgaatccg cggcatcggc acaatcagag accaacaccg ccgcggccga agcggtcgcc 900 accgctgacg ccgaagcggc cgcgcaagct gaagcgtggg tcatgtcgct gaagaacgat 960 ctgtggctgc atctcaacat gaagggtgag gccaaggccg aaggcgaggc cgtttcgatc 1020 agcaaaggac atcgcggcgg tatcaggtcg ggcagcatct cggaagccag cgccgaggca 1080 agcagcaacg tttccatggg cggacgtcat ggacggaagg acctcgtctc tgaagcgtta 1140 gcgggagcat cagcgggcag cagtgccgac tccctttga 1179 <210> 44 <211> 1236 <212> DNA <213> Myrmecia forficata <400> 44 atgaagattc cagcgatact cgtgacgtct ctcctcgcct ggggattagc cagcggccgg 60 gtcatcgagt ccagctcgtc ggcttccgca caggcgtcgg catcggccgg ctcgagaggc 120 ctgctcggta aacggccgat tggcaagctc gagtggggca aggaggagaa gaaactcgaa 180 gaactcgacg aggaatcgct caatgaggcc gctctgaagg tcggcatcaa gaacggcgga 240 ttggatgtcg cgaagggcgc ggcagtcctc gaggcagcga tgagcgacgt cgcgaccctt 300 acggatcagc gttctcttgt ggatctcggt ctcggcccgg tcgcgaacga ggccgagatc 360 ctggcggagg cgcaggccgc cacgagcgcc caagctggcg ctgtcgctaa tagcgccgcg 420 gagcgtgcga tcgcggcgat ggagatggcc gacagaaccg aatatattgc ggcacttgtc 480 accaccaaag ccgccaaagc tgccgaggcc actatggccg ctactgcccg tgccaccgcc 540 gccgcctcag cctccaagat atccagtcag gaatcagccg catcggccgc taacgccgcc 600 aacgccgaag ccaaggccaa cgccgcttcc ataatcgcta acaaggcgaa cgccgtcctg 660 gctgaggccg ccgccgtact cgcagccact gctgccaagg ccaaggaatc ggcgatgaaa 720 tcgcttagcg ccgctcaggc cgccgccaag gcacaagcca ggaacgccga ggcctccgcc 780 gaagctcaga tcaaactttc ccaggccagg gccgccgtgg cacgcgctgc agccgatcag 840 gccgtctgtt cctcccaggc tcaggccgca agtcagatac aatcgagggc atccgcatcc 900 gaatccgcgg catcggcaca atcagagacc aacaccgccg cggccgaagc ggtcgccacc 960 gctgacgccg aagcggccgc gcaagctgaa gcgtgggtca tgtcgctgaa gaacgatctg 1020 tggctgcatc tcaacatgaa gggtgaggcc aaggccgaag gcgaggccgt ttcgatcagc 1080 aaaggacatc gcggcggtat caggtcgggc agcatctcgg aagccagcgc cgaggcaagc 1140 agcaacgttt ccatgggcgg acgtcatgga cggaaggacc tcgtctctga agcgttagcg 1200 ggagcatcag cgggcagcag tgccgactcc ctttga 1236 <210> 45 <211> 1128 <212> DNA <213> Myrmecia forficata <400> 45 aatctcctta aggagtcgaa agcttccgcg tccgcgtccg cgtccgcttc cgcgagggcc 60 agcggcaaga agaatcttca cgtgttgcca ttaccgaaga aaagcgagca tggcatcgtg 120 atcgacaagt cggtgttcga catcaaggat gtagtgctga gcgcggtcga cgagatcaac 180 ggcgccccga aactcggcct gggatggaag aaggtcagca tgggggtgga gcgcgccgag 240 gcgaacgcag ccgctgccgc cgaggcattg gcgatgatca agaagattgc catggcccgc 300 agcagtgcat acgtccaggc ggcctgggca tcggcccagg catcagctga cgcattggct 360 agcgccaggg tggcacaggc gtctcaggag gctgcggagg caaagggtag agcggcttcc 420 gaggcgctct ccagagccat cgaagcatcc tcgcgagccg atgcggcagc cgctgcgacg 480 ctggacgcga tggaccgcac catggagaac gcgagggcgg caaatgccgc gcaaacgcag 540 gccagcggcc aagctgagaa cgcaaatcgc agcgctgctg ccatcctcgc agctctgcta 600 cgtatcgcgg aggcatccgc gttgaacaac gaggccgcgg tcaacgcggc cgcggccgca 660 gccgcagcgt ctgcccttca ggccaaggct aacgcggctt ctcaagcaac cgccagagcc 720 gcaggacagg cgtcgacggc cgccgaagag gcgcaatccg cccaagaagc cgccgataag 780 aacgcggagc tgaccacggt catgctcgaa aaggctagtg ctgatcaaca ggcggcatcc 840 gctagggctg actactacac cgcctcaacc gaggccgaag ccgctgcaca ggcgtctgct 900 atcaacgcac tcagggacgg aatagttgtc ggaatgggaa atgacgctgg cgcatcggcc 960 caagcgatgg cacaggtaga agctctcgct cgcgccagcg agcacaaggc gttaggcgag 1020 aagaagaagg gcctggtttg gggctacgga agcaagggca gtagctccgc cagcgcatcc 1080 gccagcgcct ccgccgaagc atcctcgaga ctcggaaagg actggtag 1128 <210> 46 <211> 1185 <212> DNA <213> Myrmecia forficata <400> 46 atgaagatac cagcgatact cgtgacgtcc ttcctcgcct ggggactggc cagcgggaat 60 ctccttaagg agtcgaaagc ttccgcgtcc gcgtccgcgt ccgcttccgc gagggccagc 120 ggcaagaaga atcttcacgt gttgccatta ccgaagaaaa gcgagcatgg catcgtgatc 180 gacaagtcgg tgttcgacat caaggatgta gtgctgagcg cggtcgacga gatcaacggc 240 gccccgaaac tcggcctggg atggaagaag gtcagcatgg gggtggagcg cgccgaggcg 300 aacgcagccg ctgccgccga ggcattggcg atgatcaaga agattgccat ggcccgcagc 360 agtgcatacg tccaggcggc ctgggcatcg gcccaggcat cagctgacgc attggctagc 420 gccagggtgg cacaggcgtc tcaggaggct gcggaggcaa agggtagagc ggcttccgag 480 gcgctctcca gagccatcga agcatcctcg cgagccgatg cggcagccgc tgcgacgctg 540 gacgcgatgg accgcaccat ggagaacgcg agggcggcaa atgccgcgca aacgcaggcc 600 agcggccaag ctgagaacgc aaatcgcagc gctgctgcca tcctcgcagc tctgctacgt 660 atcgcggagg catccgcgtt gaacaacgag gccgcggtca acgcggccgc ggccgcagcc 720 gcagcgtctg cccttcaggc caaggctaac gcggcttctc aagcaaccgc cagagccgca 780 ggacaggcgt cgacggccgc cgaagaggcg caatccgccc aagaagccgc cgataagaac 840 gcggagctga ccacggtcat gctcgaaaag gctagtgctg atcaacaggc ggcatccgct 900 agggctgact actacaccgc ctcaaccgag gccgaagccg ctgcacaggc gtctgctatc 960 aacgcactca gggacggaat agttgtcgga atgggaaatg acgctggcgc atcggcccaa 1020 gcgatggcac aggtagaagc tctcgctcgc gccagcgagc acaaggcgtt aggcgagaag 1080 aagaagggcc tggtttgggg ctacggaagc aagggcagta gctccgccag cgcatccgcc 1140 agcgcctccg ccgaagcatc ctcgagactc ggaaaggact ggtag 1185 <210> 47 <211> 1269 <212> DNA <213> Myrmecia forficata <400> 47 agcgagctcg aatcggaagc gagtgcggcg gcgtctgcgc aagcggaagc gtcctcgtct 60 ggtcgctccg gcaaactgtc cgcgtctcag gcttccgcca gcgcgtccgc cagcgcgtca 120 gccggcagca gaggtggcag caaaggtggc tggggccagc tccgccgtgg tgatgttaag 180 agcgaggcga agagcgccgc cgcgatcgcg gtcgaaggag ctaaaatcgg caccggaatc 240 ggaaataccg cgtccgcatc cgcggaggcg ctctcacgag gactcggcat cggacaggcg 300 gccgcggagg cgcaagccgc agccgcaggt caggcagagg tcgccgcgaa atcgtgcgaa 360 cttgccgaca agaccaccgc caaagcggtc gccatggtcg aagcggcagc cgaggccgaa 420 atcgaggtgg ccaatcagga ggtcgcagcc gtcaaattat cgacttgggc cgctaaagca 480 gcaaggatag tcgaggaaga cagcgccgcc gtgagggcgg ctgccggcaa attgcttttg 540 gccgcgagag ctgccgccgc cgccgagaga cgcgccaacg aggaatccga ggcggccaac 600 gaacttgctc aagcgtcatc tgccgctgcc gccgaggccg aagccaaagc gaacgccggc 660 cgtgaggccg ctgccgctgc cttggctatc gccgaggccg ccgtcgccat cgaacaagaa 720 gccgtcattt tggctcgcaa ggcacaagat gcccgtttga atgctgaagc cgcagccgcc 780 gctgcgatga acgcccgtgt catcgcttcc gccgaatccg aggccagtga agatctggag 840 aatcgcgcta gtgtggcgcg tgccagtgcg gccggtgccg ctgaggcaaa ggctatcgcc 900 accgatgccg gcgccactgc cgagatcgcg gcctacagtt gggccaagaa gggcgaactg 960 atcaaccccg gcccgttgcc gaagatcatc agcgtcaacg ccgatctgtc caagagcgag 1020 gtcgaggcca tgaagatcac ccggggtcaa gtacaggaag tcaagaaaat cagcactcac 1080 aaaggtggct ggggatgggg aaaggaagga aggtcgaagg tatcttccaa cgctagtgcc 1140 agagctagtg ccagcgccaa tgcagccgcc ggtagcctcg gcagcaaatg gggaagacaa 1200 ctatccgcat catccgcgtc ggctgacgcc aacgccgaag ccgacagcca gttgctgaaa 1260 gtgtggtga 1269 <210> 48 <211> 1326 <212> DNA <213> Myrmecia forficata <400> 48 atgaagattc cagcgatact tgcgacgtcc ctcctcatct ggggtcttgt cggcgccagc 60 gagctcgaat cggaagcgag tgcggcggcg tctgcgcaag cggaagcgtc ctcgtctggt 120 cgctccggca aactgtccgc gtctcaggct tccgccagcg cgtccgccag cgcgtcagcc 180 ggcagcagag gtggcagcaa aggtggctgg ggccagctcc gccgtggtga tgttaagagc 240 gaggcgaaga gcgccgccgc gatcgcggtc gaaggagcta aaatcggcac cggaatcgga 300 aataccgcgt ccgcatccgc ggaggcgctc tcacgaggac tcggcatcgg acaggcggcc 360 gcggaggcgc aagccgcagc cgcaggtcag gcagaggtcg ccgcgaaatc gtgcgaactt 420 gccgacaaga ccaccgccaa agcggtcgcc atggtcgaag cggcagccga ggccgaaatc 480 gaggtggcca atcaggaggt cgcagccgtc aaattatcga cttgggccgc taaagcagca 540 aggatagtcg aggaagacag cgccgccgtg agggcggctg ccggcaaatt gcttttggcc 600 gcgagagctg ccgccgccgc cgagagacgc gccaacgagg aatccgaggc ggccaacgaa 660 cttgctcaag cgtcatctgc cgctgccgcc gaggccgaag ccaaagcgaa cgccggccgt 720 gaggccgctg ccgctgcctt ggctatcgcc gaggccgccg tcgccatcga acaagaagcc 780 gtcattttgg ctcgcaaggc acaagatgcc cgtttgaatg ctgaagccgc agccgccgct 840 gcgatgaacg cccgtgtcat cgcttccgcc gaatccgagg ccagtgaaga tctggagaat 900 cgcgctagtg tggcgcgtgc cagtgcggcc ggtgccgctg aggcaaaggc tatcgccacc 960 gatgccggcg ccactgccga gatcgcggcc tacagttggg ccaagaaggg cgaactgatc 1020 aaccccggcc cgttgccgaa gatcatcagc gtcaacgccg atctgtccaa gagcgaggtc 1080 gaggccatga agatcacccg gggtcaagta caggaagtca agaaaatcag cactcacaaa 1140 ggtggctggg gatggggaaa ggaaggaagg tcgaaggtat cttccaacgc tagtgccaga 1200 gctagtgcca gcgccaatgc agccgccggt agcctcggca gcaaatgggg aagacaacta 1260 tccgcatcat ccgcgtcggc tgacgccaac gccgaagccg acagccagtt gctgaaagtg 1320 tggtga 1326 <210> 49 <211> 372 <212> PRT <213> Oecophylla smaragdina <400> 49 Ser Lys Ser Tyr Leu Leu Gly Ser Ser Ala Ser Ala Ser Ala Ser Ala 1 5 10 15 Ser Ala Ser Ala Ser Ala Gly Gly Ser Thr Gly Gly Val Gly Val Gly 20 25 30 Ser Val Ile Ser Gly Gly Asn Asn Ile Ile Arg Gly Ala Ser Thr Thr 35 40 45 Ser Val Thr Leu Ala Ala Ala Ala Ala Glu Ala Lys Ala Ala Leu Asn 50 55 60 Ala Gly Lys Ala Thr Val Glu Glu Gln Arg Glu Ala Leu Gln Leu Leu 65 70 75 80 Thr Ala Ser Ala Glu Lys Asn Ala Glu Ala Arg Ser Leu Ala Asp Asp 85 90 95 Ala Ala Val Leu Val Gln Gly Ala Ala Glu Ala Gln Ser Val Ala Ala 100 105 110 Ala Lys Thr Val Ala Val Glu Gln Gly Ser Asn Ser Leu Asp Ala Ala 115 120 125 Ala Ala Glu Ala Glu Ala Ala Ala Ala Ala Ser Arg Val Ser Ala Gln 130 135 140 Gln Ala Leu Gln Ala Ala Gln Thr Ser Ala Ala Ala Ile Gln Thr Ala 145 150 155 160 Ala Gly Ser Ala Leu Thr Ala Leu Lys Leu Ala Arg Lys Gln Glu Ala 165 170 175 Glu Ser Asn Asn Ala Ala Glu Gln Ala Asn Lys Ala Leu Ala Leu Ser 180 185 190 Arg Ala Ala Ser Ala Ala Thr Gln Arg Ala Val Ala Ala Gln Asn Ala 195 200 205 Ala Ala Ala Ser Ala Ala Ser Ala Gly Ala Ala Gln Ala Glu Ala Arg 210 215 220 Asn Ala Tyr Ala Lys Ala Lys Ala Ala Ile Ala Ala Leu Thr Ala Ala 225 230 235 240 Gln Arg Asn Tyr Ala Ala Ala Lys Ala Ser Ala Ser Ala Gly Ser Val 245 250 255 Val Ala Glu Gln Asp Ala Gln Ser Arg Ala Ala Asp Ala Glu Val Asn 260 265 270 Ala Val Ala Gln Ala Ala Ala Arg Ala Ser Val Arg Asn Gln Glu Ile 275 280 285 Val Glu Ile Gly Ala Glu Phe Gly Asn Ala Ser Gly Gly Val Ile Ser 290 295 300 Thr Gly Thr Arg Ser Ser Gly Gly Lys Gly Val Ser Val Thr Ala Gly 305 310 315 320 Ala Gln Ala Ser Ala Ser Ala Ser Ala Thr Ser Ser Ser Ser Ser Ser 325 330 335 Ser Gly Ile Asn Lys Gly His Pro Arg Trp Gly His Asn Trp Gly Leu 340 345 350 Gly Ser Ser Glu Ala Ser Ala Asn Ala Glu Ala Glu Ser Ser Ala Ser 355 360 365 Ser Tyr Ser Ser 370 <210> 50 <211> 391 <212> PRT <213> Oecophylla smaragdina <400> 50 Met Lys Ile Pro Ala Ile Ile Ala Thr Thr Leu Leu Leu Trp Gly Phe 1 5 10 15 Ala Asp Ala Ser Lys Ser Tyr Leu Leu Gly Ser Ser Ala Ser Ala Ser 20 25 30 Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Gly Ser Thr Gly Gly Val 35 40 45 Gly Val Gly Ser Val Ile Ser Gly Gly Asn Asn Ile Ile Arg Gly Ala 50 55 60 Ser Thr Thr Ser Val Thr Leu Ala Ala Ala Ala Ala Glu Ala Lys Ala 65 70 75 80 Ala Leu Asn Ala Gly Lys Ala Thr Val Glu Glu Gln Arg Glu Ala Leu 85 90 95 Gln Leu Leu Thr Ala Ser Ala Glu Lys Asn Ala Glu Ala Arg Ser Leu 100 105 110 Ala Asp Asp Ala Ala Val Leu Val Gln Gly Ala Ala Glu Ala Gln Ser 115 120 125 Val Ala Ala Ala Lys Thr Val Ala Val Glu Gln Gly Ser Asn Ser Leu 130 135 140 Asp Ala Ala Ala Ala Glu Ala Glu Ala Ala Ala Ala Ala Ser Arg Val 145 150 155 160 Ser Ala Gln Gln Ala Leu Gln Ala Ala Gln Thr Ser Ala Ala Ala Ile 165 170 175 Gln Thr Ala Ala Gly Ser Ala Leu Thr Ala Leu Lys Leu Ala Arg Lys 180 185 190 Gln Glu Ala Glu Ser Asn Asn Ala Ala Glu Gln Ala Asn Lys Ala Leu 195 200 205 Ala Leu Ser Arg Ala Ala Ser Ala Ala Thr Gln Arg Ala Val Ala Ala 210 215 220 Gln Asn Ala Ala Ala Ala Ser Ala Ala Ser Ala Gly Ala Ala Gln Ala 225 230 235 240 Glu Ala Arg Asn Ala Tyr Ala Lys Ala Lys Ala Ala Ile Ala Ala Leu 245 250 255 Thr Ala Ala Gln Arg Asn Tyr Ala Ala Ala Lys Ala Ser Ala Ser Ala 260 265 270 Gly Ser Val Val Ala Glu Gln Asp Ala Gln Ser Arg Ala Ala Asp Ala 275 280 285 Glu Val Asn Ala Val Ala Gln Ala Ala Ala Arg Ala Ser Val Arg Asn 290 295 300 Gln Glu Ile Val Glu Ile Gly Ala Glu Phe Gly Asn Ala Ser Gly Gly 305 310 315 320 Val Ile Ser Thr Gly Thr Arg Ser Ser Gly Gly Lys Gly Val Ser Val 325 330 335 Thr Ala Gly Ala Gln Ala Ser Ala Ser Ala Ser Ala Thr Ser Ser Ser 340 345 350 Ser Ser Ser Ser Gly Ile Asn Lys Gly His Pro Arg Trp Gly His Asn 355 360 365 Trp Gly Leu Gly Ser Ser Glu Ala Ser Ala Asn Ala Glu Ala Glu Ser 370 375 380 Ser Ala Ser Ser Tyr Ser Ser 385 390 <210> 51 <211> 381 <212> PRT <213> Oecophylla smaragdina <400> 51 Gly Val Ile Gly Pro Asp Thr Ser Ser Ser Ser Gln Ala Ser Ala Ser 1 5 10 15 Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Ser Ala Ser Ile Gly 20 25 30 Tyr Asn Glu Leu His Lys Ser Ile Asn Ala Pro Ala Leu Ala Val Gly 35 40 45 Val Lys Asn Gly Gly Val Asp Val Ala Lys Gly Ala Ala Val Val Glu 50 55 60 Ser Ala Ile Ser Asp Val Ser Thr Leu Thr Asp Asp Arg Thr Leu Asn 65 70 75 80 Gly Leu Ala Ile Ile Gly Asn Ser Ala Glu Ser Leu Ala Arg Ala Gln 85 90 95 Ala Ser Ser Ser Ala Ser Ala Gly Ala Lys Ala Asn Ala Leu Ile Lys 100 105 110 Gln Ser Ile Ala Ala Ile Glu Ile Thr Glu Lys Ala Glu Tyr Leu Ala 115 120 125 Ser Ile Val Ala Thr Lys Ala Ala Lys Ala Ala Glu Ala Thr Ala Ala 130 135 140 Ala Thr Ala Arg Ala Thr Ala Val Ala Glu Ala Ala Lys Val Ser Ser 145 150 155 160 Glu Gln Phe Ala Ala Glu Ala Arg Ala Ala Ala Asp Ala Glu Ala Lys 165 170 175 Ala Asn Ala Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala Val Leu Ala 180 185 190 Glu Ala Ala Thr Gly Leu Ser Ala Ser Ala Gly Lys Ala Gln Gln Ser 195 200 205 Ala Thr Arg Ala Leu Gln Ala Ala Arg Ala Ala Ala Lys Ala Gln Ala 210 215 220 Glu Leu Thr Gln Lys Ala Ala Gln Ile Leu Val Leu Ile Ala Glu Ala 225 230 235 240 Lys Ala Ala Val Ser Arg Ala Ser Ala Asp Gln Ser Val Cys Thr Ser 245 250 255 Gln Ala Gln Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser Ala Ala Glu 260 265 270 Ser Ala Ala Ser Ala Gln Ser Glu Ala Asn Thr Ile Ala Ala Glu Ala 275 280 285 Val Ala Arg Ala Asp Ala Glu Ala Ala Ser Gln Ala Gln Ala Trp Ala 290 295 300 Glu Ser Phe Lys Arg Glu Leu Ser Ser Val Val Leu Glu Ala Glu Ala 305 310 315 320 Asn Ala Ser Ala Ser Ala Ser Ala Gly Ala Leu Ala Ser Gly Ser Ser 325 330 335 Ser Ser Gly Ala Ser Ser Ser Ala Asp Ala Ser Ala Gly Ala Ser Ser 340 345 350 Tyr Gly Ser Leu Gly Gly Tyr Arg His Gly Gly Ser Phe Ser Glu Ala 355 360 365 Ser Ala Ala Ala Ser Ala Ala Ser Arg Ala Glu Ala Ala 370 375 380 <210> 52 <211> 400 <212> PRT <213> Oecophylla smaragdina <400> 52 Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Ala Trp Gly Leu 1 5 10 15 Ala Ser Gly Gly Val Ile Gly Pro Asp Thr Ser Ser Ser Ser Gln Ala 20 25 30 Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Ser Ala 35 40 45 Ser Ile Gly Tyr Asn Glu Leu His Lys Ser Ile Asn Ala Pro Ala Leu 50 55 60 Ala Val Gly Val Lys Asn Gly Gly Val Asp Val Ala Lys Gly Ala Ala 65 70 75 80 Val Val Glu Ser Ala Ile Ser Asp Val Ser Thr Leu Thr Asp Asp Arg 85 90 95 Thr Leu Asn Gly Leu Ala Ile Ile Gly Asn Ser Ala Glu Ser Leu Ala 100 105 110 Arg Ala Gln Ala Ser Ser Ser Ala Ser Ala Gly Ala Lys Ala Asn Ala 115 120 125 Leu Ile Lys Gln Ser Ile Ala Ala Ile Glu Ile Thr Glu Lys Ala Glu 130 135 140 Tyr Leu Ala Ser Ile Val Ala Thr Lys Ala Ala Lys Ala Ala Glu Ala 145 150 155 160 Thr Ala Ala Ala Thr Ala Arg Ala Thr Ala Val Ala Glu Ala Ala Lys 165 170 175 Val Ser Ser Glu Gln Phe Ala Ala Glu Ala Arg Ala Ala Ala Asp Ala 180 185 190 Glu Ala Lys Ala Asn Ala Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala 195 200 205 Val Leu Ala Glu Ala Ala Thr Gly Leu Ser Ala Ser Ala Gly Lys Ala 210 215 220 Gln Gln Ser Ala Thr Arg Ala Leu Gln Ala Ala Arg Ala Ala Ala Lys 225 230 235 240 Ala Gln Ala Glu Leu Thr Gln Lys Ala Ala Gln Ile Leu Val Leu Ile 245 250 255 Ala Glu Ala Lys Ala Ala Val Ser Arg Ala Ser Ala Asp Gln Ser Val 260 265 270 Cys Thr Ser Gln Ala Gln Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser 275 280 285 Ala Ala Glu Ser Ala Ala Ser Ala Gln Ser Glu Ala Asn Thr Ile Ala 290 295 300 Ala Glu Ala Val Ala Arg Ala Asp Ala Glu Ala Ala Ser Gln Ala Gln 305 310 315 320 Ala Trp Ala Glu Ser Phe Lys Arg Glu Leu Ser Ser Val Val Leu Glu 325 330 335 Ala Glu Ala Asn Ala Ser Ala Ser Ala Ser Ala Gly Ala Leu Ala Ser 340 345 350 Gly Ser Ser Ser Ser Gly Ala Ser Ser Ser Ala Asp Ala Ser Ala Gly 355 360 365 Ala Ser Ser Tyr Gly Ser Leu Gly Gly Tyr Arg His Gly Gly Ser Phe 370 375 380 Ser Glu Ala Ser Ala Ala Ala Ser Ala Ala Ser Arg Ala Glu Ala Ala 385 390 395 400 <210> 53 <211> 376 <212> PRT <213> Oecophylla smaragdina <400> 53 Gly Val Pro Lys Glu Leu Gly Thr Ser Ile Ser Ser Ala Ser Ala Ser 1 5 10 15 Ala Ser Ala Ser Ala Ser Ala Thr Ala Ser Ser Ser Ser Lys Asn Val 20 25 30 His Leu Leu Pro Leu Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser 35 40 45 Lys Phe Asn Ile Arg Lys Val Val Leu Ser Ala Ile Asp Glu Ile Asn 50 55 60 Gly Ala Pro Asn Ile Gly Leu Gly Leu Lys Gln Val Ser Leu Ala Leu 65 70 75 80 Ala Lys Ala Gln Ala Ser Ala Gln Ser Ser Ala Glu Ala Leu Ala Ile 85 90 95 Ile Lys Lys Ile Val Ala Leu Leu Ile Ser Ala Tyr Val Arg Ala Ala 100 105 110 Glu Ala Ala Ala Arg Ala Ser Ala Glu Ala Leu Ala Thr Val Arg Ala 115 120 125 Ala Glu Gln Ala Gln Lys Ile Ala Glu Ala Lys Gly Arg Ala Ala Ala 130 135 140 Glu Ala Leu Ser Glu Leu Val Glu Ala Ser Gln Lys Ala Asp Ala Ala 145 150 155 160 Ala Ala Gly Thr Thr Asp Ala Ile Glu Arg Thr Tyr Gln Asp Ala Arg 165 170 175 Ala Ala Thr Ser Ala Gln Thr Lys Ala Ser Gly Glu Ala Glu Asn Ala 180 185 190 Asn Arg Asn Ala Ala Ala Thr Leu Ala Ala Val Leu Ser Ile Ala Lys 195 200 205 Ala Ala Ser Gly Gln Gly Gly Thr Arg Ala Ala Val Asp Ala Ala Ala 210 215 220 Ala Ala Ala Ala Ala Ala Ala Leu His Ala Lys Ala Asn Ala Val Ser 225 230 235 240 Gln Ala Thr Ser Lys Ala Ala Ala Glu Ala Arg Val Ala Ala Glu Glu 245 250 255 Ala Ala Ser Ala Gln Ala Ser Ala Ser Ala Ser Ala Gln Leu Thr Ala 260 265 270 Gln Leu Glu Glu Lys Val Ser Ala Asp Gln Gln Ala Ala Ser Ala Ser 275 280 285 Thr Asp Thr Ser Ala Ala Ile Ala Glu Ala Glu Ala Ala Ala Leu Ala 290 295 300 Ser Thr Val Asn Ala Ile Asn Asp Gly Val Val Ile Gly Leu Gly Asn 305 310 315 320 Thr Ala Ser Ser Ser Ala Gln Ala Ser Ala Gln Ala Ser Ala Leu Ala 325 330 335 Arg Ala Lys Asn Ala Arg Pro Lys Ile Lys Gly Trp Tyr Lys Ile Gly 340 345 350 Gly Ala Thr Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Gln 355 360 365 Ser Ser Ser Gln Gly Leu Val Tyr 370 375 <210> 54 <211> 395 <212> PRT <213> Oecophylla smaragdina <400> 54 Met Lys Ile Pro Ala Ile Leu Val Thr Ser Phe Leu Ala Trp Gly Leu 1 5 10 15 Ala Ser Gly Gly Val Pro Lys Glu Leu Gly Thr Ser Ile Ser Ser Ala 20 25 30 Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Thr Ala Ser Ser Ser Ser 35 40 45 Lys Asn Val His Leu Leu Pro Leu Lys Ser Glu His Gly Ile Val Ile 50 55 60 Asp Lys Ser Lys Phe Asn Ile Arg Lys Val Val Leu Ser Ala Ile Asp 65 70 75 80 Glu Ile Asn Gly Ala Pro Asn Ile Gly Leu Gly Leu Lys Gln Val Ser 85 90 95 Leu Ala Leu Ala Lys Ala Gln Ala Ser Ala Gln Ser Ser Ala Glu Ala 100 105 110 Leu Ala Ile Ile Lys Lys Ile Val Ala Leu Leu Ile Ser Ala Tyr Val 115 120 125 Arg Ala Ala Glu Ala Ala Ala Arg Ala Ser Ala Glu Ala Leu Ala Thr 130 135 140 Val Arg Ala Ala Glu Gln Ala Gln Lys Ile Ala Glu Ala Lys Gly Arg 145 150 155 160 Ala Ala Ala Glu Ala Leu Ser Glu Leu Val Glu Ala Ser Gln Lys Ala 165 170 175 Asp Ala Ala Ala Ala Gly Thr Thr Asp Ala Ile Glu Arg Thr Tyr Gln 180 185 190 Asp Ala Arg Ala Ala Thr Ser Ala Gln Thr Lys Ala Ser Gly Glu Ala 195 200 205 Glu Asn Ala Asn Arg Asn Ala Ala Ala Thr Leu Ala Ala Val Leu Ser 210 215 220 Ile Ala Lys Ala Ala Ser Gly Gln Gly Gly Thr Arg Ala Ala Val Asp 225 230 235 240 Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Leu His Ala Lys Ala Asn 245 250 255 Ala Val Ser Gln Ala Thr Ser Lys Ala Ala Ala Glu Ala Arg Val Ala 260 265 270 Ala Glu Glu Ala Ala Ser Ala Gln Ala Ser Ala Ser Ala Ser Ala Gln 275 280 285 Leu Thr Ala Gln Leu Glu Glu Lys Val Ser Ala Asp Gln Gln Ala Ala 290 295 300 Ser Ala Ser Thr Asp Thr Ser Ala Ala Ile Ala Glu Ala Glu Ala Ala 305 310 315 320 Ala Leu Ala Ser Thr Val Asn Ala Ile Asn Asp Gly Val Val Ile Gly 325 330 335 Leu Gly Asn Thr Ala Ser Ser Ser Ala Gln Ala Ser Ala Gln Ala Ser 340 345 350 Ala Leu Ala Arg Ala Lys Asn Ala Arg Pro Lys Ile Lys Gly Trp Tyr 355 360 365 Lys Ile Gly Gly Ala Thr Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala 370 375 380 Ser Ala Gln Ser Ser Ser Gln Gly Leu Val Tyr 385 390 395 <210> 55 <211> 424 <212> PRT <213> Oecophylla smaragdina <400> 55 Ser Glu Leu Val Gly Ser Asp Ala Ser Ala Thr Ala Ser Ala Glu Ala 1 5 10 15 Ser Ala Ser Ser Ser Ala Tyr Gly Ser Lys Tyr Gly Ile Gly Ser Gly 20 25 30 Ala Val Ser Gly Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser 35 40 45 Ala Ser Ala Ser Ser Ala Pro Ala Ile Glu Gly Val Asn Val Gly Thr 50 55 60 Gly Val Ser Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg Gly 65 70 75 80 Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala Gly 85 90 95 Gln Ala Ala Ile Ala Ala Lys Ser Cys Ala Leu Ala Ala Lys Ser Thr 100 105 110 Ala Gln Ala Val Ala Leu Val Glu Lys Val Ala Arg Ala Glu Val Asp 115 120 125 Leu Ala Glu Ser Ala Arg Lys Ala Thr Arg Leu Ser Ala Glu Ala Ala 130 135 140 Lys Ala Ala Ala Glu Val Glu Lys Asp Leu Val Gly Leu Arg Gly Ala 145 150 155 160 Ala Gly Lys Leu Asn Leu Ala Ala Arg Ala Gly Ser Lys Ala Gln Glu 165 170 175 Arg Ala Asn Glu Asp Ser Ile Glu Ala Asn Glu Leu Ala Gln Ala Thr 180 185 190 Ala Ala Ala Gly Ala Glu Ala Glu Ala Lys Ala Asn Ala Ala Gln Glu 195 200 205 Ala Gly Ala Ser Ala Leu Ala Ile Ala Gln Ala Ala Leu Asn Ile Glu 210 215 220 Gln Glu Thr Val Lys Leu Thr Arg Gln Ala Gln Asn Thr Arg Leu Arg 225 230 235 240 Ser Glu Asn Ile Leu Ala Ala Ala Ser Asn Ala Arg Ala Ile Ala Ser 245 250 255 Ala Glu Ala Glu Ala Ser Ser Asp Leu Asn Asn Arg Ala Asn Ala Ala 260 265 270 Arg Ser Asn Ala Arg Ala Ala Ala Glu Thr Arg Ala Val Ala Thr Glu 275 280 285 Ala Ala Ser Thr Ala Glu Ile Ala Ala Tyr Ser Ser Ser Glu Lys Gly 290 295 300 Glu Ile Thr Asn Pro Gly Pro Leu Pro Lys Ile Val Ser Val Thr Ala 305 310 315 320 Gly Leu Thr Gln Asn Glu Ile Ala Gly Ser Gly Ala Ala Ala Ser Ala 325 330 335 Ser Ala Ser Ala Leu Ala Ser Ala Ser Ala Gly Ala Gly Ala Gly Ala 340 345 350 Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Ala Val Ala Gly Ala 355 360 365 Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Ser Ala Gly Ala 370 375 380 Asn Ala Gly Ala Gly Ala Ser Ser Leu Leu Leu Pro Gln Ser Lys Leu 385 390 395 400 His Pro Ile Ser Arg Ser Ser Ala Ser Ala Ser Ala Ser Ala Glu Ala 405 410 415 Glu Ala Asn Ser Ser Ala Tyr Ala 420 <210> 56 <211> 443 <212> PRT <213> Oecophylla smaragdina <400> 56 Met Lys Ile Pro Ala Ile Leu Ala Thr Ser Leu Phe Val Trp Gly Leu 1 5 10 15 Val Gly Ala Ser Glu Leu Val Gly Ser Asp Ala Ser Ala Thr Ala Ser 20 25 30 Ala Glu Ala Ser Ala Ser Ser Ser Ala Tyr Gly Ser Lys Tyr Gly Ile 35 40 45 Gly Ser Gly Ala Val Ser Gly Ala Ser Ala Ser Ala Ser Ala Ser Ala 50 55 60 Ser Ala Ser Ala Ser Ala Ser Ser Ala Pro Ala Ile Glu Gly Val Asn 65 70 75 80 Val Gly Thr Gly Val Ser Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu 85 90 95 Ser Arg Gly Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala 100 105 110 Ala Ala Gly Gln Ala Ala Ile Ala Ala Lys Ser Cys Ala Leu Ala Ala 115 120 125 Lys Ser Thr Ala Gln Ala Val Ala Leu Val Glu Lys Val Ala Arg Ala 130 135 140 Glu Val Asp Leu Ala Glu Ser Ala Arg Lys Ala Thr Arg Leu Ser Ala 145 150 155 160 Glu Ala Ala Lys Ala Ala Ala Glu Val Glu Lys Asp Leu Val Gly Leu 165 170 175 Arg Gly Ala Ala Gly Lys Leu Asn Leu Ala Ala Arg Ala Gly Ser Lys 180 185 190 Ala Gln Glu Arg Ala Asn Glu Asp Ser Ile Glu Ala Asn Glu Leu Ala 195 200 205 Gln Ala Thr Ala Ala Ala Gly Ala Glu Ala Glu Ala Lys Ala Asn Ala 210 215 220 Ala Gln Glu Ala Gly Ala Ser Ala Leu Ala Ile Ala Gln Ala Ala Leu 225 230 235 240 Asn Ile Glu Gln Glu Thr Val Lys Leu Thr Arg Gln Ala Gln Asn Thr 245 250 255 Arg Leu Arg Ser Glu Asn Ile Leu Ala Ala Ala Ser Asn Ala Arg Ala 260 265 270 Ile Ala Ser Ala Glu Ala Glu Ala Ser Ser Asp Leu Asn Asn Arg Ala 275 280 285 Asn Ala Ala Arg Ser Asn Ala Arg Ala Ala Ala Glu Thr Arg Ala Val 290 295 300 Ala Thr Glu Ala Ala Ser Thr Ala Glu Ile Ala Ala Tyr Ser Ser Ser 305 310 315 320 Glu Lys Gly Glu Ile Thr Asn Pro Gly Pro Leu Pro Lys Ile Val Ser 325 330 335 Val Thr Ala Gly Leu Thr Gln Asn Glu Ile Ala Gly Ser Gly Ala Ala 340 345 350 Ala Ser Ala Ser Ala Ser Ala Leu Ala Ser Ala Ser Ala Gly Ala Gly 355 360 365 Ala Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Ala Val 370 375 380 Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Ser 385 390 395 400 Ala Gly Ala Asn Ala Gly Ala Gly Ala Ser Ser Leu Leu Leu Pro Gln 405 410 415 Ser Lys Leu His Pro Ile Ser Arg Ser Ser Ala Ser Ala Ser Ala Ser 420 425 430 Ala Glu Ala Glu Ala Asn Ser Ser Ala Tyr Ala 435 440 <210> 57 <211> 1119 <212> DNA <213> Oecophylla smaragdina <400> 57 agcaagtcgt acctcttagg ctcatccgcg tctgcttccg cttccgcttc cgcctcggca 60 tcagcgggag gaagcaccgg cggcgtcggc gtcggatctg taatatccgg tggcaacaac 120 atcatcagag gagcttcgac cacatccgtg acattggcag ccgccgcagc ggaggccaag 180 gcagctctga atgctggaaa agcgactgtc gaagagcaaa gggaagcgtt acagttgctc 240 accgcgtccg ctgaaaaaaa cgccgaggcg cgttccttgg ccgacgatgc ggccgttcta 300 gttcagggtg ccgctgaggc gcaatcggtc gccgccgcga agacggtcgc ggtcgagcaa 360 ggatccaact ctctggatgc agctgcagcc gaagcggaag ccgccgccgc cgcatccagg 420 gtatcggccc agcaggcact ccaggccgcg cagacctccg ccgccgctat tcaaaccgct 480 gccggtagcg ccctgacggc tctcaaattg gcacgcaaac aggaagcgga atccaataat 540 gccgccgaac aggcaaataa agcattggcc ttaagtcgcg cagccagcgc tgccactcaa 600 cgagccgtgg cagctcagaa cgcggctgcc gcatcagcgg cttcggctgg agccgcacaa 660 gctgaggcaa ggaacgccta cgccaaagcc aaagcagcga tagctgctct tacggccgcc 720 caaagaaatt acgccgcggc caaggctagc gcaagcgcgg gtagcgtggt ggccgaacaa 780 gatgctcaat ctagagcggc cgatgccgag gtgaacgccg ttgcccaagc cgctgcccga 840 gccagcgttc gcaatcagga gatcgttgaa atcggcgcgg aattcggcaa cgccagcggc 900 ggagtgatct cgaccggcac acgttcttcc ggaggcaagg gtgtctccgt taccgctgga 960 gctcaggcta gcgcgtccgc ttccgcgacc tcctcctcct cctcctcctc cggcatcaac 1020 aaaggacatc ccagatgggg gcacaattgg ggtttaggtt cttcggaagc gtcagcaaac 1080 gctgaagccg aaagcagcgc ttcctcttat tcatcttaa 1119 <210> 58 <211> 1176 <212> DNA <213> Oecophylla smaragdina <400> 58 atgaagatcc cagcgataat cgcaacgacc ctccttctct ggggtttcgc cgacgccagc 60 aagtcgtacc tcttaggctc atccgcgtct gcttccgctt ccgcttccgc ctcggcatca 120 gcgggaggaa gcaccggcgg cgtcggcgtc ggatctgtaa tatccggtgg caacaacatc 180 atcagaggag cttcgaccac atccgtgaca ttggcagccg ccgcagcgga ggccaaggca 240 gctctgaatg ctggaaaagc gactgtcgaa gagcaaaggg aagcgttaca gttgctcacc 300 gcgtccgctg aaaaaaacgc cgaggcgcgt tccttggccg acgatgcggc cgttctagtt 360 cagggtgccg ctgaggcgca atcggtcgcc gccgcgaaga cggtcgcggt cgagcaagga 420 tccaactctc tggatgcagc tgcagccgaa gcggaagccg ccgccgccgc atccagggta 480 tcggcccagc aggcactcca ggccgcgcag acctccgccg ccgctattca aaccgctgcc 540 ggtagcgccc tgacggctct caaattggca cgcaaacagg aagcggaatc caataatgcc 600 gccgaacagg caaataaagc attggcctta agtcgcgcag ccagcgctgc cactcaacga 660 gccgtggcag ctcagaacgc ggctgccgca tcagcggctt cggctggagc cgcacaagct 720 gaggcaagga acgcctacgc caaagccaaa gcagcgatag ctgctcttac ggccgcccaa 780 agaaattacg ccgcggccaa ggctagcgca agcgcgggta gcgtggtggc cgaacaagat 840 gctcaatcta gagcggccga tgccgaggtg aacgccgttg cccaagccgc tgcccgagcc 900 agcgttcgca atcaggagat cgttgaaatc ggcgcggaat tcggcaacgc cagcggcgga 960 gtgatctcga ccggcacacg ttcttccgga ggcaagggtg tctccgttac cgctggagct 1020 caggctagcg cgtccgcttc cgcgacctcc tcctcctcct cctcctccgg catcaacaaa 1080 ggacatccca gatgggggca caattggggt ttaggttctt cggaagcgtc agcaaacgct 1140 gaagccgaaa gcagcgcttc ctcttattca tcttaa 1176 <210> 59 <211> 1146 <212> DNA <213> Oecophylla smaragdina <400> 59 ggagtcatag gtcccgacac gtcctcatcg tcccaggcat cggcatcggc atcggcgtca 60 gcatcggcgt cggcatcatc gtcggcatcg atcggttaca acgaactcca taaatcgatc 120 aatgcgcccg ccttggcggt cggcgtcaag aacggcggag tggatgtcgc caagggcgcg 180 gccgttgtcg aatcagcgat atccgacgta tcgactctaa ccgatgatcg tacgttgaac 240 ggtctcgcta tcatcgggaa tagcgccgag agtctggcaa gagcacaggc ttcctcgagc 300 gccagcgccg gcgcaaaagc caatgctctc atcaaacaat cgatagcggc tatagagatc 360 accgaaaagg cagagtacct tgcgtcgatc gtcgccacca aggcagcgaa ggccgccgag 420 gccacagcgg ccgcgaccgc tcgcgccact gccgtcgccg aggctgccaa ggtttccagc 480 gagcaattcg cggccgaggc acgcgcggcc gccgacgccg aagccaaggc caacgccgct 540 tccatcatcg ccaacaaagc gaacgccgtc ctcgcggagg cagccaccgg acttagcgcc 600 agcgctggca aagcccaaca atcggcgacc agggcgttgc aagccgcacg agctgccgct 660 aaggctcaag ccgaacttac ccagaaagcc gctcaaatct tagtcctcat tgctgaagcc 720 aaagccgccg tgagccgagc aagcgccgat caatccgtct gtacgtccca ggcacaagcc 780 gccagtcaga ttcaatcgag agcctccgcg gccgaatccg cggcatcggc tcaatcggaa 840 gccaacacca ttgcggccga ggcggtcgct agagctgacg ccgaggcggc cagtcaagct 900 caagcgtggg ccgaatcctt caaacgcgaa ctctcgagtg tcgttttgga ggccgaggcc 960 aatgcctcgg ctagtgcctc ggctggtgcc ctggccagtg gtagcagcag ctcgggcgcg 1020 agttccagcg cggatgccag cgccggagcg agcagctatg gatccttggg cggatatcga 1080 cacggcggaa gcttcagcga ggcatcggca gccgcgtcag cggccagtcg cgccgaggct 1140 gcgtaa 1146 <210> 60 <211> 1203 <212> DNA <213> Oecophylla smaragdina <400> 60 atgaagattc cagcgatatt cgtgacgtct ctgctcgcct ggggactcgc cagcggcgga 60 gtcataggtc ccgacacgtc ctcatcgtcc caggcatcgg catcggcatc ggcgtcagca 120 tcggcgtcgg catcatcgtc ggcatcgatc ggttacaacg aactccataa atcgatcaat 180 gcgcccgcct tggcggtcgg cgtcaagaac ggcggagtgg atgtcgccaa gggcgcggcc 240 gttgtcgaat cagcgatatc cgacgtatcg actctaaccg atgatcgtac gttgaacggt 300 ctcgctatca tcgggaatag cgccgagagt ctggcaagag cacaggcttc ctcgagcgcc 360 agcgccggcg caaaagccaa tgctctcatc aaacaatcga tagcggctat agagatcacc 420 gaaaaggcag agtaccttgc gtcgatcgtc gccaccaagg cagcgaaggc cgccgaggcc 480 acagcggccg cgaccgctcg cgccactgcc gtcgccgagg ctgccaaggt ttccagcgag 540 caattcgcgg ccgaggcacg cgcggccgcc gacgccgaag ccaaggccaa cgccgcttcc 600 atcatcgcca acaaagcgaa cgccgtcctc gcggaggcag ccaccggact tagcgccagc 660 gctggcaaag cccaacaatc ggcgaccagg gcgttgcaag ccgcacgagc tgccgctaag 720 gctcaagccg aacttaccca gaaagccgct caaatcttag tcctcattgc tgaagccaaa 780 gccgccgtga gccgagcaag cgccgatcaa tccgtctgta cgtcccaggc acaagccgcc 840 agtcagattc aatcgagagc ctccgcggcc gaatccgcgg catcggctca atcggaagcc 900 aacaccattg cggccgaggc ggtcgctaga gctgacgccg aggcggccag tcaagctcaa 960 gcgtgggccg aatccttcaa acgcgaactc tcgagtgtcg ttttggaggc cgaggccaat 1020 gcctcggcta gtgcctcggc tggtgccctg gccagtggta gcagcagctc gggcgcgagt 1080 tccagcgcgg atgccagcgc cggagcgagc agctatggat ccttgggcgg atatcgacac 1140 ggcggaagct tcagcgaggc atcggcagcc gcgtcagcgg ccagtcgcgc cgaggctgcg 1200 taa 1203 <210> 61 <211> 1131 <212> DNA <213> Oecophylla smargdina <400> 61 ggtgtcccta aagagttggg aacttccatt tcttccgcgt ccgcatccgc atccgcatcc 60 gcatccgcga ccgcgtcctc cagtagcaag aatgttcact tattaccatt gaaaagcgag 120 catggcatcg taattgacaa gtcaaaattc aacatcagaa aggtagtgtt gagcgcaatc 180 gatgagatca acggcgcgcc caacatcggt ctgggattga aacaggtcag tttggcgctc 240 gcaaaagccc aggctagtgc tcaatcgagc gccgaggcat tggcaatcat caagaaaatc 300 gtcgcgctcc tcatctcggc ctacgtcaga gcagccgagg ccgcggctcg agcatccgcc 360 gaagctttag ctaccgttag ggctgcggaa caagcgcaaa aaattgctga agcgaagggt 420 agagcggctg ctgaggcgct ctccgagtta gtcgaggcgt cccagaaggc cgatgcggcg 480 gccgcgggaa cgacggacgc gatcgaacgc acctaccagg atgccagagc ggccacttcc 540 gcacagacca aggccagcgg cgaagccgag aatgctaatc gcaatgctgc cgccaccctc 600 gcggcggtct tgagcatcgc taaggccgcc tccggtcaag gaggcactcg agccgctgtc 660 gatgcagctg ctgccgctgc cgccgcagcc gctctgcatg ctaaagctaa cgcggtttcg 720 caagctacca gcaaagcagc cgctgaagct agagtcgcgg ctgaggaggc agcatccgcc 780 caggcatccg cctcagcaag cgcacagctg accgcacaat tagaggagaa agtcagcgcc 840 gatcaacaag cagcctccgc cagtactgat acctccgctg ctatagccga ggctgaagct 900 gccgcgttag cgtccaccgt caacgcgatc aacgacggag tggtcatcgg attaggaaat 960 accgccagtt cttctgccca agcttccgca caggccagtg ctctcgctcg cgcaaaaaat 1020 gcgcgcccta aaataaaggg ctggtacaaa atcggaggcg cgacttccgc ttctgcaagc 1080 gcatcggcca gcgcttccgc ccagtcatcc tcgcaaggac tggtatacta g 1131 <210> 62 <211> 1188 <212> DNA <213> Oecophylla smaragdina <400> 62 atgaagattc cagcgatact cgtgacgtcc ttcctcgcct ggggactggc cagcgggggt 60 gtccctaaag agttgggaac ttccatttct tccgcgtccg catccgcatc cgcatccgca 120 tccgcgaccg cgtcctccag tagcaagaat gttcacttat taccattgaa aagcgagcat 180 ggcatcgtaa ttgacaagtc aaaattcaac atcagaaagg tagtgttgag cgcaatcgat 240 gagatcaacg gcgcgcccaa catcggtctg ggattgaaac aggtcagttt ggcgctcgca 300 aaagcccagg ctagtgctca atcgagcgcc gaggcattgg caatcatcaa gaaaatcgtc 360 gcgctcctca tctcggccta cgtcagagca gccgaggccg cggctcgagc atccgccgaa 420 gctttagcta ccgttagggc tgcggaacaa gcgcaaaaaa ttgctgaagc gaagggtaga 480 gcggctgctg aggcgctctc cgagttagtc gaggcgtccc agaaggccga tgcggcggcc 540 gcgggaacga cggacgcgat cgaacgcacc taccaggatg ccagagcggc cacttccgca 600 cagaccaagg ccagcggcga agccgagaat gctaatcgca atgctgccgc caccctcgcg 660 gcggtcttga gcatcgctaa ggccgcctcc ggtcaaggag gcactcgagc cgctgtcgat 720 gcagctgctg ccgctgccgc cgcagccgct ctgcatgcta aagctaacgc ggtttcgcaa 780 gctaccagca aagcagccgc tgaagctaga gtcgcggctg aggaggcagc atccgcccag 840 gcatccgcct cagcaagcgc acagctgacc gcacaattag aggagaaagt cagcgccgat 900 caacaagcag cctccgccag tactgatacc tccgctgcta tagccgaggc tgaagctgcc 960 gcgttagcgt ccaccgtcaa cgcgatcaac gacggagtgg tcatcggatt aggaaatacc 1020 gccagttctt ctgcccaagc ttccgcacag gccagtgctc tcgctcgcgc aaaaaatgcg 1080 cgccctaaaa taaagggctg gtacaaaatc ggaggcgcga cttccgcttc tgcaagcgca 1140 tcggccagcg cttccgccca gtcatcctcg caaggactgg tatactag 1188 <210> 63 <211> 1275 <212> DNA <213> Oecophylla smaragdina <400> 63 agcgaactcg tcggatcgga cgcgagcgcg acggcatctg ctgaagcgtc agcatcgtca 60 tccgcatacg gtagcaagta tggtattggt agtggtgctg tctccggtgc atcagccagc 120 gcctctgcca gcgcgtctgc tagcgcatca gccagcagtg ctcccgcgat cgaaggagta 180 aacgttggca ccggagtcag taacaccgct tccgcgtccg cagaagctct ctcccgtgga 240 ctcggcatcg gacaagcggc tgccgaagcg caagccgctg ccgctggcca agcggcgatc 300 gctgcgaaat cgtgcgcgct agcggccaag agcaccgctc aagcggttgc cctggttgag 360 aaagtggccc gcgccgaggt agatctggcc gaaagcgcga gaaaggctac aagattatcg 420 gcagaagcag ccaaggcagc ggcggaagtc gagaaggacc tcgtcggtct gagaggggct 480 gccggtaaac tgaatctggc tgcgagagcc ggttctaaag cccaagaacg cgccaacgaa 540 gactctatag aggctaacga acttgcccaa gcaacggccg ccgccggtgc cgaggctgaa 600 gccaaggcga atgccgccca ggaggcaggc gcctccgctt tggccatcgc ccaagccgcc 660 cttaacatcg agcaagagac tgttaaattg acccgccagg cccagaatac tcgtctcaga 720 tctgaaaata ttctcgccgc ggccagcaat gcccgcgcca tcgcttccgc tgaggccgag 780 gccagtagtg atttgaataa tcgtgcgaat gcagcgcgtt ccaatgcccg agctgctgcc 840 gagaccagag ccgtagctac cgaagccgct tctaccgccg agatcgcagc ttatagttca 900 tccgagaaag gcgagatcac caatcccggt cctctgccca agatcgtcag tgttaccgca 960 ggtctgaccc agaacgaaat agcgggatca ggagcggccg ctagtgctag tgccagtgct 1020 cttgccagtg ccagtgccgg tgccggtgcc ggtgcaggtg caggagccgg tgcaagtgca 1080 ggagccggtg cagttgcagg tgcaggagcc ggtgcaggag ccggtgctag tgccggagcg 1140 agtgccggag cgaatgccgg tgccggtgcc agcagtttac tcttgccgca gagtaaactc 1200 catccaatct ccaggtcttc cgcctctgcc tccgcttccg ccgaggccga agctaacagt 1260 tcggcgtatg cgtaa 1275 <210> 64 <211> 1332 <212> DNA <213> Oecophylla smaragdina <400> 64 atgaagattc cagcgatact tgcgacgtcc cttttcgtct ggggtcttgt cggcgccagc 60 gaactcgtcg gatcggacgc gagcgcgacg gcatctgctg aagcgtcagc atcgtcatcc 120 gcatacggta gcaagtatgg tattggtagt ggtgctgtct ccggtgcatc agccagcgcc 180 tctgccagcg cgtctgctag cgcatcagcc agcagtgctc ccgcgatcga aggagtaaac 240 gttggcaccg gagtcagtaa caccgcttcc gcgtccgcag aagctctctc ccgtggactc 300 ggcatcggac aagcggctgc cgaagcgcaa gccgctgccg ctggccaagc ggcgatcgct 360 gcgaaatcgt gcgcgctagc ggccaagagc accgctcaag cggttgccct ggttgagaaa 420 gtggcccgcg ccgaggtaga tctggccgaa agcgcgagaa aggctacaag attatcggca 480 gaagcagcca aggcagcggc ggaagtcgag aaggacctcg tcggtctgag aggggctgcc 540 ggtaaactga atctggctgc gagagccggt tctaaagccc aagaacgcgc caacgaagac 600 tctatagagg ctaacgaact tgcccaagca acggccgccg ccggtgccga ggctgaagcc 660 aaggcgaatg ccgcccagga ggcaggcgcc tccgctttgg ccatcgccca agccgccctt 720 aacatcgagc aagagactgt taaattgacc cgccaggccc agaatactcg tctcagatct 780 gaaaatattc tcgccgcggc cagcaatgcc cgcgccatcg cttccgctga ggccgaggcc 840 agtagtgatt tgaataatcg tgcgaatgca gcgcgttcca atgcccgagc tgctgccgag 900 accagagccg tagctaccga agccgcttct accgccgaga tcgcagctta tagttcatcc 960 gagaaaggcg agatcaccaa tcccggtcct ctgcccaaga tcgtcagtgt taccgcaggt 1020 ctgacccaga acgaaatagc gggatcagga gcggccgcta gtgctagtgc cagtgctctt 1080 gccagtgcca gtgccggtgc cggtgccggt gcaggtgcag gagccggtgc aagtgcagga 1140 gccggtgcag ttgcaggtgc aggagccggt gcaggagccg gtgctagtgc cggagcgagt 1200 gccggagcga atgccggtgc cggtgccagc agtttactct tgccgcagag taaactccat 1260 ccaatctcca ggtcttccgc ctctgcctcc gcttccgccg aggccgaagc taacagttcg 1320 gcgtatgcgt aa 1332 <210> 65 <211> 461 <212> PRT <213> Vespa simillima xanthoptera <400> 65 Phe Ala Thr Ala Ala Glu Ser Ser Ser Ser Ser Ser Ala Ala Ser Ser 1 5 10 15 Ala Ser Ser Ser Ser Ser Glu Ser Arg Gly Gln Leu Leu Leu Pro Leu 20 25 30 Glu Arg Ser Ser Thr Arg Ser Leu Leu Asp Leu Val Ser Ser Ala Arg 35 40 45 Ser Asn Thr Ala Ile Thr Ala Ser Ser Ala Ala Ala Ala Lys Ala Thr 50 55 60 Leu Arg Ala Ile Lys Ala Ala Asn Ser Ala Gln Gly Glu Ala Leu Ala 65 70 75 80 Gln Ala Thr Ala Ser Ala Ala Ser Asn Ala Lys Ala Arg Ala Thr Ala 85 90 95 Ala Ala Ala Ala Gln Ala Thr Asn Ala Ala Val Asn Ala Gln Gly Lys 100 105 110 Ala Ser Ala Gln Ala Ile Ala Thr Ala Glu Ala Ala Glu Ala Leu Thr 115 120 125 Lys Ser Ala Leu Gln Ala Gln Ser Ala Ala Ser Ser Ser Lys Ser Glu 130 135 140 Ala Ala Gln Ala Ser Thr Ser Ala Asn Ala Gly Ala Gly Ala Leu Ala 145 150 155 160 Thr Ala Ser Ala Gln Ala Leu Ser Ala Lys Lys Ala Ala Leu Ala Tyr 165 170 175 Ala Ser Ala Ala Ala Asp Ala Ser Thr Ala Ala Ala Lys Ala Arg Ala 180 185 190 Ala Val Ala Ala Ala Glu Ala Ala Thr Arg Thr Ala Val Gln Ala Glu 195 200 205 Arg Asp Ser Thr Asn Ala Ala Ser Leu Ala Ala Lys Ala Gln Ala Glu 210 215 220 Ala Arg Ala Ala Ala Ala Ala Ala Ala Ala Ala Arg Leu Ala Ala Ser 225 230 235 240 Ala Ala Ala Asp Ala Ser Ala Gln Ala Asp Ala Arg Val Arg Thr Ala 245 250 255 Ser Ile Glu Ala Ala Ala Ser Ala Arg Thr Lys Ala Ser Asn Ala Gln 260 265 270 Ala Thr Ala Glu Ala Ala Ala Ile Ala Arg Ser Ser Ser Arg Asp Ala 275 280 285 Gln Ala Asn Trp Val Asp Asn Arg Ser Ser Ala Ser Ser Ser Ser Ala 290 295 300 Ser Ala Ser Ala Ser Val Ser Ala Ser Ala Ser Gly Glu Ala Asp Ser 305 310 315 320 Glu Ala Asp Ser Asp Ala Ser Ala Ser Ala Arg Ser Ala Ala Asp Ser 325 330 335 Asn Ala Gly Ser Ser Ser Gly Leu Ala Ala Asp Ser Ala Ala Asp Thr 340 345 350 Ala Ala Gly Ser Thr Ala Gly Ser Ala Ala Arg Leu Ser Ala Gly Ser 355 360 365 Ala Ala Gly Ser Ile Ala Arg Ser Ala Ala Gly Ser Thr Ala Gly Ser 370 375 380 Ser Thr Gly Ser Gly Ala Gly Ala Ser Ala Glu Gly Ser Ser Asn Ala 385 390 395 400 Ser Ser Gly Thr Ser Ala Gly Ala Ser Ser Gly Ala Ser Thr Gly Ala 405 410 415 Ser Ala Gly Ala Ser Ala Thr Ala Ser Ala Asp Asn Ser Ala Asp Asn 420 425 430 Ser Ala Glu Ala Leu Ser Ser Ser Ser Ala Glu Ser Ser Ser Ser Ser 435 440 445 Trp Ser Ser Ser Ser Gln Asn Ile Trp Ser Gln Asp Trp 450 455 460 <210> 66 <211> 476 <212> PRT <213> Vespa simillima xanthoptera <400> 66 Met Asn Ile Leu Thr Ile Leu Ala Thr Thr Leu Leu Leu Ser Gly Phe 1 5 10 15 Ala Thr Ala Ala Glu Ser Ser Ser Ser Ser Ser Ala Ala Ser Ser Ala 20 25 30 Ser Ser Ser Ser Ser Glu Ser Arg Gly Gln Leu Leu Leu Pro Leu Glu 35 40 45 Arg Ser Ser Thr Arg Ser Leu Leu Asp Leu Val Ser Ser Ala Arg Ser 50 55 60 Asn Thr Ala Ile Thr Ala Ser Ser Ala Ala Ala Ala Lys Ala Thr Leu 65 70 75 80 Arg Ala Ile Lys Ala Ala Asn Ser Ala Gln Gly Glu Ala Leu Ala Gln 85 90 95 Ala Thr Ala Ser Ala Ala Ser Asn Ala Lys Ala Arg Ala Thr Ala Ala 100 105 110 Ala Ala Ala Gln Ala Thr Asn Ala Ala Val Asn Ala Gln Gly Lys Ala 115 120 125 Ser Ala Gln Ala Ile Ala Thr Ala Glu Ala Ala Glu Ala Leu Thr Lys 130 135 140 Ser Ala Leu Gln Ala Gln Ser Ala Ala Ser Ser Ser Lys Ser Glu Ala 145 150 155 160 Ala Gln Ala Ser Thr Ser Ala Asn Ala Gly Ala Gly Ala Leu Ala Thr 165 170 175 Ala Ser Ala Gln Ala Leu Ser Ala Lys Lys Ala Ala Leu Ala Tyr Ala 180 185 190 Ser Ala Ala Ala Asp Ala Ser Thr Ala Ala Ala Lys Ala Arg Ala Ala 195 200 205 Val Ala Ala Ala Glu Ala Ala Thr Arg Thr Ala Val Gln Ala Glu Arg 210 215 220 Asp Ser Thr Asn Ala Ala Ser Leu Ala Ala Lys Ala Gln Ala Glu Ala 225 230 235 240 Arg Ala Ala Ala Ala Ala Ala Ala Ala Ala Arg Leu Ala Ala Ser Ala 245 250 255 Ala Ala Asp Ala Ser Ala Gln Ala Asp Ala Arg Val Arg Thr Ala Ser 260 265 270 Ile Glu Ala Ala Ala Ser Ala Arg Thr Lys Ala Ser Asn Ala Gln Ala 275 280 285 Thr Ala Glu Ala Ala Ala Ile Ala Arg Ser Ser Ser Arg Asp Ala Gln 290 295 300 Ala Asn Trp Val Asp Asn Arg Ser Ser Ala Ser Ser Ser Ser Ala Ser 305 310 315 320 Ala Ser Ala Ser Val Ser Ala Ser Ala Ser Gly Glu Ala Asp Ser Glu 325 330 335 Ala Asp Ser Asp Ala Ser Ala Ser Ala Arg Ser Ala Ala Asp Ser Asn 340 345 350 Ala Gly Ser Ser Ser Gly Leu Ala Ala Asp Ser Ala Ala Asp Thr Ala 355 360 365 Ala Gly Ser Thr Ala Gly Ser Ala Ala Arg Leu Ser Ala Gly Ser Ala 370 375 380 Ala Gly Ser Ile Ala Arg Ser Ala Ala Gly Ser Thr Ala Gly Ser Ser 385 390 395 400 Thr Gly Ser Gly Ala Gly Ala Ser Ala Glu Gly Ser Ser Asn Ala Ser 405 410 415 Ser Gly Thr Ser Ala Gly Ala Ser Ser Gly Ala Ser Thr Gly Ala Ser 420 425 430 Ala Gly Ala Ser Ala Thr Ala Ser Ala Asp Asn Ser Ala Asp Asn Ser 435 440 445 Ala Glu Ala Leu Ser Ser Ser Ser Ala Glu Ser Ser Ser Ser Ser Trp 450 455 460 Ser Ser Ser Ser Gln Asn Ile Trp Ser Gln Asp Trp 465 470 475 <210> 67 <211> 486 <212> PRT <213> Vespa simillima xanthoptera <400> 67 Asp Arg Ser Trp Ala Ala Ser Asp Ala Asn Ala Glu Ala Ser Ala Ala 1 5 10 15 Val Glu Ser Pro Ser Leu Trp Glu Asp Ser Ser Ser Ala Ser Ala Gly 20 25 30 Ala Ser Asn Ala Ala Glu Ser Ser Ser Leu Trp Glu Asp Ser Ser Ser 35 40 45 Glu Asn Thr Gly Ala Ser Thr Ala Ala Glu Ser Ser Ser Leu Trp Glu 50 55 60 Asp Ser Ser Ser Ala Ser Ala Arg Ala Ser Thr Ala Ala Gly Ser Ser 65 70 75 80 Ser Ala Trp Glu Asp Ser Ser Ile Thr Asn Ala Arg Glu Ser Gly Ala 85 90 95 Ser Gly Ser Leu Ser Ser Trp Glu Asp Ser Ser Ser Ala Ser Ala Ser 100 105 110 Ser Ser Thr Ser Ala Ser Ala Ser Ser Ser Ser Ser Ser Ser Ser Ser 115 120 125 Ile Ser Ser Ser Ala Ser Ser Ser Ser Ser Ala Ser Ala Ser Ala Ser 130 135 140 Thr Glu Ala Ser Asn Glu Ser Arg Arg Gly Ile Ala Ile Glu Gly Ala 145 150 155 160 Leu Val Gly Thr Gly Ala Ala Ser Thr Ala Ala Ala Ser Ala Glu Met 165 170 175 Leu Ser Asp Thr Leu Gly Leu Gly Gln Ser Ala Leu Gln Ala Gln Thr 180 185 190 Ala Ser Val Thr Gln Ala Asn Ile Ala Ser Asp Ala Ser Asn Gln Ala 195 200 205 Asn Arg Leu Ala Ala Ala Ala Ala Ala Ala Met Ser Ala Ala Ala Ser 210 215 220 Ala Gln Glu Asn Ala Ala Ser Leu Ala Arg Ala Ser Ala Ser Ala Ser 225 230 235 240 Glu Ser Ala Ala Ser Ala Ser Ser Lys Ala Glu Ala Ser Ala Glu Ala 245 250 255 Ala Lys Ser Ser Ala Glu Lys Cys Leu Leu Leu Ala Gln Asn Ser Ala 260 265 270 Gln Ala Gln Ala Arg Ala Thr Glu Gln Ser Glu Ser Ser Asn Arg Asp 275 280 285 Ser Ala Ala Asn Ala Ala Ala Ala Ala Glu Ala Glu Arg Lys Ala Thr 290 295 300 Leu Ala Leu Lys Ala Ile Ala Asp Ala Lys Ala Lys Ala Gly Val Ala 305 310 315 320 Val Ala Ala Gln Ser Glu Ala Ala Ala Ala Ala Ala Ala Ala Ala Lys 325 330 335 Ala Arg Ala Asp Ala Glu Ala Gly Ala Asn Leu Ala Ala Ala Ala Arg 340 345 350 Ala Val Ala Ala Ala Glu Ala Ala Ala Ser Arg Arg Asn Asp Arg Gln 355 360 365 Ala Gly Ile Ala Gln Ala Gly Ala Ser Ala Ala Ala Glu Thr Arg Ala 370 375 380 Leu Ala Ser Ser Ala Ala Ala Thr Ala Lys Ala Ala Ala Tyr Ala Asn 385 390 395 400 Ala Asp Ile Arg Ala Leu Ser Ala Ala Ala Leu Glu Ser Ser Ile Ser 405 410 415 Ser Ser Ser Ser Thr Ser Ala Ser Ser Ala Ser Ser Ser Ala Ser Ser 420 425 430 Gly Ala Ser Ser Asp Ser Ser Ser Gly Ala Ser Ser Gly Ala Ser Ser 435 440 445 Asp Ser Ser Ser Asn Ser Ser Ser Asp Ser Ser Ser Leu Leu Gly Asp 450 455 460 Asp Ala Ser Thr Ser Ala Ser Ser Thr Ala Glu Ala Glu Ser Arg Thr 465 470 475 480 Ser Ser Leu Ile Leu Asn 485 <210> 68 <211> 508 <212> PRT <213> Vespa simillima xanthoptera <400> 68 Met Lys Ser Leu Ser Thr Leu Val Ser Ser Leu Leu Leu Gly Ala Cys 1 5 10 15 Val Leu Ser Val His Ala Asp Arg Ser Trp Ala Ala Ser Asp Ala Asn 20 25 30 Ala Glu Ala Ser Ala Ala Val Glu Ser Pro Ser Leu Trp Glu Asp Ser 35 40 45 Ser Ser Ala Ser Ala Gly Ala Ser Asn Ala Ala Glu Ser Ser Ser Leu 50 55 60 Trp Glu Asp Ser Ser Ser Glu Asn Thr Gly Ala Ser Thr Ala Ala Glu 65 70 75 80 Ser Ser Ser Leu Trp Glu Asp Ser Ser Ser Ala Ser Ala Arg Ala Ser 85 90 95 Thr Ala Ala Gly Ser Ser Ser Ala Trp Glu Asp Ser Ser Ile Thr Asn 100 105 110 Ala Arg Glu Ser Gly Ala Ser Gly Ser Leu Ser Ser Trp Glu Asp Ser 115 120 125 Ser Ser Ala Ser Ala Ser Ser Ser Thr Ser Ala Ser Ala Ser Ser Ser 130 135 140 Ser Ser Ser Ser Ser Ser Ile Ser Ser Ser Ala Ser Ser Ser Ser Ser 145 150 155 160 Ala Ser Ala Ser Ala Ser Thr Glu Ala Ser Asn Glu Ser Arg Arg Gly 165 170 175 Ile Ala Ile Glu Gly Ala Leu Val Gly Thr Gly Ala Ala Ser Thr Ala 180 185 190 Ala Ala Ser Ala Glu Met Leu Ser Asp Thr Leu Gly Leu Gly Gln Ser 195 200 205 Ala Leu Gln Ala Gln Thr Ala Ser Val Thr Gln Ala Asn Ile Ala Ser 210 215 220 Asp Ala Ser Asn Gln Ala Asn Arg Leu Ala Ala Ala Ala Ala Ala Ala 225 230 235 240 Met Ser Ala Ala Ala Ser Ala Gln Glu Asn Ala Ala Ser Leu Ala Arg 245 250 255 Ala Ser Ala Ser Ala Ser Glu Ser Ala Ala Ser Ala Ser Ser Lys Ala 260 265 270 Glu Ala Ser Ala Glu Ala Ala Lys Ser Ser Ala Glu Lys Cys Leu Leu 275 280 285 Leu Ala Gln Asn Ser Ala Gln Ala Gln Ala Arg Ala Thr Glu Gln Ser 290 295 300 Glu Ser Ser Asn Arg Asp Ser Ala Ala Asn Ala Ala Ala Ala Ala Glu 305 310 315 320 Ala Glu Arg Lys Ala Thr Leu Ala Leu Lys Ala Ile Ala Asp Ala Lys 325 330 335 Ala Lys Ala Gly Val Ala Val Ala Ala Gln Ser Glu Ala Ala Ala Ala 340 345 350 Ala Ala Ala Ala Ala Lys Ala Arg Ala Asp Ala Glu Ala Gly Ala Asn 355 360 365 Leu Ala Ala Ala Ala Arg Ala Val Ala Ala Ala Glu Ala Ala Ala Ser 370 375 380 Arg Arg Asn Asp Arg Gln Ala Gly Ile Ala Gln Ala Gly Ala Ser Ala 385 390 395 400 Ala Ala Glu Thr Arg Ala Leu Ala Ser Ser Ala Ala Ala Thr Ala Lys 405 410 415 Ala Ala Ala Tyr Ala Asn Ala Asp Ile Arg Ala Leu Ser Ala Ala Ala 420 425 430 Leu Glu Ser Ser Ile Ser Ser Ser Ser Ser Thr Ser Ala Ser Ser Ala 435 440 445 Ser Ser Ser Ala Ser Ser Gly Ala Ser Ser Asp Ser Ser Ser Gly Ala 450 455 460 Ser Ser Gly Ala Ser Ser Asp Ser Ser Ser Asn Ser Ser Ser Asp Ser 465 470 475 480 Ser Ser Leu Leu Gly Asp Asp Ala Ser Thr Ser Ala Ser Ser Thr Ala 485 490 495 Glu Ala Glu Ser Arg Thr Ser Ser Leu Ile Leu Asn 500 505 <210> 69 <211> 359 <212> PRT <213> Vespa simillima xanthoptera <400> 69 Leu Ala Ala Gly Ser Ser Ser Ser Ser Ala Glu Ser Ser Ala Ser Ala 1 5 10 15 Thr Ala Ser Ser Asp Ala Ser Trp Ser Ala Ser Ser Arg Ser Ser Ala 20 25 30 Thr Gly Arg Ala Pro Asn Val Ile Leu Asn Arg Ala Pro Gln Leu Gly 35 40 45 Ala Ser Ala Ala Ala Ile Ala Ser Ala Arg Ala Ser Thr Ser Ala Asn 50 55 60 Ala Ala Ser Asp Glu Lys Ser Ala Arg Glu Thr Arg Ala Thr Ala Leu 65 70 75 80 Ala Arg Ser Arg Ala Ala Val Thr Ala Ala Ala Arg Ala Ala Ala Arg 85 90 95 Thr Gln Glu Ala Val Ala Ala Ala Lys Ala Ala Ser Arg Ala Gln Ala 100 105 110 Leu Ala Ala Ala Lys Ser Ser Ala Ala Ile Ser Ala Leu Ala Ala Gly 115 120 125 Glu Ala Ala Ala Gln Lys Ala Asp Ala Ala Ala Leu Ala Ala Leu Ala 130 135 140 Ala Asn Gln Arg Ser Val Lys Ala Ala Glu Asn Gly Leu Ala Val Gln 145 150 155 160 Asn Arg Ala Asn Gly Glu Ala Glu Gln Ala Ser Arg Ala Ala Ala Ala 165 170 175 Asn Leu Ala Ala Ala Ile Arg Thr Arg Asp Asn Ala Leu Glu Thr Arg 180 185 190 Arg Glu Ala Ala Arg Leu Lys Ala Leu Ala Thr Ala Ala Ala Asn Ala 195 200 205 Asn Asn Lys Ala Thr Ser Leu Ala Glu Ala Ser Ala Asn Gln Ala Ala 210 215 220 Glu Ala Ser Ser Ala Ala Glu Asp Thr Ser Ser Ala Gln Ser Ala Ala 225 230 235 240 Val Ala Gln Ala Glu Ala Ala Glu Thr Leu Asn Val Asn Leu Ala Ile 245 250 255 Leu Glu Ser Thr Gln Ser Ser Arg Gln Asp Ser Asn Val Ala Lys Ala 260 265 270 Glu Ala Ser Ala Ala Ala Lys Ala Ser Pro Gly Thr Ala Thr Arg Asp 275 280 285 Gly Val Asn Leu Gly Leu Ala Ser Asp Ala Gly Ala Ala Ala Gln Leu 290 295 300 Lys Ala Gln Ala Ala Ala Leu Ala Arg Ala Ser Ser Arg Ile Ser Ser 305 310 315 320 Gly Pro Ala Leu Ser Ala Trp Lys Trp Arg Asn Glu Asp Ser Ser Glu 325 330 335 Ser Ser Thr Ser Ala Ile Ala Ser Ser Ser Ala Ser Ser Ser Ser Ser 340 345 350 Ser Arg Ser Ala Ser Gly Asn 355 <210> 70 <211> 374 <212> PRT <213> Vespa simillima xanthoptera <400> 70 Met Lys Ile Pro Ser Ile Leu Val Thr Cys Leu Phe Thr Trp Gly Leu 1 5 10 15 Ala Ala Gly Ser Ser Ser Ser Ser Ala Glu Ser Ser Ala Ser Ala Thr 20 25 30 Ala Ser Ser Asp Ala Ser Trp Ser Ala Ser Ser Arg Ser Ser Ala Thr 35 40 45 Gly Arg Ala Pro Asn Val Ile Leu Asn Arg Ala Pro Gln Leu Gly Ala 50 55 60 Ser Ala Ala Ala Ile Ala Ser Ala Arg Ala Ser Thr Ser Ala Asn Ala 65 70 75 80 Ala Ser Asp Glu Lys Ser Ala Arg Glu Thr Arg Ala Thr Ala Leu Ala 85 90 95 Arg Ser Arg Ala Ala Val Thr Ala Ala Ala Arg Ala Ala Ala Arg Thr 100 105 110 Gln Glu Ala Val Ala Ala Ala Lys Ala Ala Ser Arg Ala Gln Ala Leu 115 120 125 Ala Ala Ala Lys Ser Ser Ala Ala Ile Ser Ala Leu Ala Ala Gly Glu 130 135 140 Ala Ala Ala Gln Lys Ala Asp Ala Ala Ala Leu Ala Ala Leu Ala Ala 145 150 155 160 Asn Gln Arg Ser Val Lys Ala Ala Glu Asn Gly Leu Ala Val Gln Asn 165 170 175 Arg Ala Asn Gly Glu Ala Glu Gln Ala Ser Arg Ala Ala Ala Ala Asn 180 185 190 Leu Ala Ala Ala Ile Arg Thr Arg Asp Asn Ala Leu Glu Thr Arg Arg 195 200 205 Glu Ala Ala Arg Leu Lys Ala Leu Ala Thr Ala Ala Ala Asn Ala Asn 210 215 220 Asn Lys Ala Thr Ser Leu Ala Glu Ala Ser Ala Asn Gln Ala Ala Glu 225 230 235 240 Ala Ser Ser Ala Ala Glu Asp Thr Ser Ser Ala Gln Ser Ala Ala Val 245 250 255 Ala Gln Ala Glu Ala Ala Glu Thr Leu Asn Val Asn Leu Ala Ile Leu 260 265 270 Glu Ser Thr Gln Ser Ser Arg Gln Asp Ser Asn Val Ala Lys Ala Glu 275 280 285 Ala Ser Ala Ala Ala Lys Ala Ser Pro Gly Thr Ala Thr Arg Asp Gly 290 295 300 Val Asn Leu Gly Leu Ala Ser Asp Ala Gly Ala Ala Ala Gln Leu Lys 305 310 315 320 Ala Gln Ala Ala Ala Leu Ala Arg Ala Ser Ser Arg Ile Ser Ser Gly 325 330 335 Pro Ala Leu Ser Ala Trp Lys Trp Arg Asn Glu Asp Ser Ser Glu Ser 340 345 350 Ser Thr Ser Ala Ile Ala Ser Ser Ser Ala Ser Ser Ser Ser Ser Ser 355 360 365 Arg Ser Ala Ser Gly Asn 370 <210> 71 <211> 359 <212> PRT <213> Vespa simillima xanthoptera <400> 71 Ser Val Ala Gln Gly Gly Pro Ser Arg Leu Ser Glu Thr Ser Asp Ser 1 5 10 15 Ser Ala Ala Ser Trp Ser Ser Ser Ser Ser Ser Ser Ser Ser Leu Ser 20 25 30 Ser Ser Leu Ala Ser Asp Ser Ala Ser Ser Ser Ala Ser Gly Ser Ala 35 40 45 Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Arg Asn 50 55 60 Asp Asn Ser Arg Val Lys Ala Trp Lys Lys Gly Arg Gly Gly Ser Asp 65 70 75 80 Ser Leu Val Leu Ser Ser Asp Ser Ser Glu Asp Ser Lys Ala Arg Glu 85 90 95 Leu Leu Glu Thr Asp Ala Gly Leu Gly Ala Ala Ala Ala Leu Ala Arg 100 105 110 Ala Thr Ala Asp Ala Gln Ala Arg Thr Ala Ala Ser Ala Asp Ala Thr 115 120 125 Ala Asn Lys Ala Thr Ala Lys Ala Leu Val Leu Ala Glu Ala Ala Val 130 135 140 Arg Ala Glu Asn Ala Ala Ile Val Arg Ile Arg Arg Ala Leu Ser Ala 145 150 155 160 Ala Gln Ala Leu Val Ser Ala Ser Asn Arg Ala Lys Ala Ala Ala Arg 165 170 175 Ala Ala Arg Glu Ala Ala Ala Asn Ser Ala Ala Ala Ala Ala Lys Ala 180 185 190 Ser Thr Asn Gln Val Lys Ala Asn Ala Asp Ser Leu Val Ala Asn Arg 195 200 205 Ala Ala Ala Ala Leu Leu Ala Ala Ala Glu Glu Ala Leu Gln Lys Ala 210 215 220 Ser Ala Ser Gln Asn Ala Ala Ala Glu Ala Ala Ala Lys Ala Arg Ala 225 230 235 240 Ala Ala Asn Ala Asn Ala Ala Thr Thr Arg Ala Ala Ala Ser Ala Ile 245 250 255 Leu Ala Glu Ala Arg Ala Arg Thr Ala Ile Thr Lys Ala Leu Ala Ala 260 265 270 Gln Ser Thr Ala Ser Ala Gln Ala Ser Ser Ala Ser Gln Val Gln Asn 275 280 285 Arg Ala Asn Asn Leu Gln Ala Glu Thr Ala Ser Leu Ala Gln Ser Arg 290 295 300 Ala Glu Ala Ala Ile Ala Ala Ala Ala Ala Gln Ala Ala Ala Leu Ala 305 310 315 320 Glu Ala Asn Ala Gln Leu Ala Arg Leu Ser Lys Ala Ser Ala Gly Ala 325 330 335 Ser Ser Glu Gly Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala 340 345 350 Ser Ser Ser Ser Ser Ser Ala 355 <210> 72 <211> 375 <212> PRT <213> Vespa simillima xanthoptera <400> 72 Met Asn Val Gln Ala Thr Leu Val Leu Cys Leu Leu Ala Leu Phe Gly 1 5 10 15 Ser Val Ala Gln Gly Gly Pro Ser Arg Leu Ser Glu Thr Ser Asp Ser 20 25 30 Ser Ala Ala Ser Trp Ser Ser Ser Ser Ser Ser Ser Ser Ser Leu Ser 35 40 45 Ser Ser Leu Ala Ser Asp Ser Ala Ser Ser Ser Ala Ser Gly Ser Ala 50 55 60 Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Arg Asn 65 70 75 80 Asp Asn Ser Arg Val Lys Ala Trp Lys Lys Gly Arg Gly Gly Ser Asp 85 90 95 Ser Leu Val Leu Ser Ser Asp Ser Ser Glu Asp Ser Lys Ala Arg Glu 100 105 110 Leu Leu Glu Thr Asp Ala Gly Leu Gly Ala Ala Ala Ala Leu Ala Arg 115 120 125 Ala Thr Ala Asp Ala Gln Ala Arg Thr Ala Ala Ser Ala Asp Ala Thr 130 135 140 Ala Asn Lys Ala Thr Ala Lys Ala Leu Val Leu Ala Glu Ala Ala Val 145 150 155 160 Arg Ala Glu Asn Ala Ala Ile Val Arg Ile Arg Arg Ala Leu Ser Ala 165 170 175 Ala Gln Ala Leu Val Ser Ala Ser Asn Arg Ala Lys Ala Ala Ala Arg 180 185 190 Ala Ala Arg Glu Ala Ala Ala Asn Ser Ala Ala Ala Ala Ala Lys Ala 195 200 205 Ser Thr Asn Gln Val Lys Ala Asn Ala Asp Ser Leu Val Ala Asn Arg 210 215 220 Ala Ala Ala Ala Leu Leu Ala Ala Ala Glu Glu Ala Leu Gln Lys Ala 225 230 235 240 Ser Ala Ser Gln Asn Ala Ala Ala Glu Ala Ala Ala Lys Ala Arg Ala 245 250 255 Ala Ala Asn Ala Asn Ala Ala Thr Thr Arg Ala Ala Ala Ser Ala Ile 260 265 270 Leu Ala Glu Ala Arg Ala Arg Thr Ala Ile Thr Lys Ala Leu Ala Ala 275 280 285 Gln Ser Thr Ala Ser Ala Gln Ala Ser Ser Ala Ser Gln Val Gln Asn 290 295 300 Arg Ala Asn Asn Leu Gln Ala Glu Thr Ala Ser Leu Ala Gln Ser Arg 305 310 315 320 Ala Glu Ala Ala Ile Ala Ala Ala Ala Ala Gln Ala Ala Ala Leu Ala 325 330 335 Glu Ala Asn Ala Gln Leu Ala Arg Leu Ser Lys Ala Ser Ala Gly Ala 340 345 350 Ser Ser Glu Gly Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala 355 360 365 Ser Ser Ser Ser Ser Ser Ala 370 375 <210> 73 <211> 1386 <212> DNA <213> Vespa simillima xanthoptera <400> 73 ttcgccacgg cagcagaaag ctcaagctca agctccgcgg catcttcggc ttcatcatca 60 tcctcagaga gtagaggaca gttgttgctt ccgttagaaa ggagttctac cagaagctta 120 ctggatttgg tgagcagtgc taggagcaat actgcgataa ccgcatcgtc cgcagccgct 180 gcaaaggcaa ctcttcgagc gattaaagct gcgaattccg ctcaaggaga agctttggca 240 caggcgactg cttctgcggc ttcgaatgca aaggcacgcg caaccgcggc cgctgcagcg 300 caagccacta acgcagccgt taacgcgcaa gggaaggctt ccgcgcaagc tattgcaacg 360 gcagaagcag cagaagcttt gactaaatcg gcactccaag cccagtccgc tgcgagcagc 420 tctaaatcag aggcagccca agcttcaacc tcagctaatg ccggagccgg tgctcttgcg 480 actgcttctg ctcaggcctt atccgcgaag aaggcagcct tagcctacgc ctccgctgcc 540 gctgacgcaa gcaccgcagc ggccaaggct cgtgccgcag ttgctgctgc agaagcagcc 600 actcgtacag ccgtacaagc cgaaagagac tccacaaacg cagcctctct cgcagctaaa 660 gcccaagctg aagccagagc tgctgcagcc gctgctgcag cagcgagact cgccgcatca 720 gctgccgccg atgccagcgc tcaagccgat gcaagagtca gaaccgcttc tattgaagct 780 gccgccagcg ctcgtaccaa agcatccaat gctcaagcca cagccgaggc tgcagccata 840 gccaggagca gctccaggga cgcacaagca aactgggttg acaacaggtc ttctgcgtca 900 tcgtccagtg catcggccag tgcatcggtt agtgcatcag ccagtggaga agccgattca 960 gaagccgatt cagatgctag tgcatcagct cgttcagcag ccgattctaa tgctggttca 1020 tcttccggtt tagccgccga ttcagcggcc gatacagccg ccggttcaac cgccggttca 1080 gctgcccgtt taagtgctgg ttctgcagcc ggttcaatag cacgttcagc tgccggttct 1140 acagccggct catcaactgg ttcaggagcc ggtgcatcag ctgaaggttc ctccaatgcc 1200 tcctccggta cctccgccgg tgcatcctcc ggtgcctcca ccggagcttc tgctggtgcc 1260 tccgccactg cttctgccga taattccgcc gataattctg ccgaagctct ttctagctcc 1320 tccgccgagt cttcgtcgtc ctcctggtct tcttccagcc agaatatctg gtcccaggat 1380 tggtag 1386 <210> 74 <211> 1431 <212> DNA <213> Vespa simillima xanthoptera <400> 74 atgaacatcc taacgatact cgcgacaaca cttcttctga gtggcttcgc cacggcagca 60 gaaagctcaa gctcaagctc cgcggcatct tcggcttcat catcatcctc agagagtaga 120 ggacagttgt tgcttccgtt agaaaggagt tctaccagaa gcttactgga tttggtgagc 180 agtgctagga gcaatactgc gataaccgca tcgtccgcag ccgctgcaaa ggcaactctt 240 cgagcgatta aagctgcgaa ttccgctcaa ggagaagctt tggcacaggc gactgcttct 300 gcggcttcga atgcaaaggc acgcgcaacc gcggccgctg cagcgcaagc cactaacgca 360 gccgttaacg cgcaagggaa ggcttccgcg caagctattg caacggcaga agcagcagaa 420 gctttgacta aatcggcact ccaagcccag tccgctgcga gcagctctaa atcagaggca 480 gcccaagctt caacctcagc taatgccgga gccggtgctc ttgcgactgc ttctgctcag 540 gccttatccg cgaagaaggc agccttagcc tacgcctccg ctgccgctga cgcaagcacc 600 gcagcggcca aggctcgtgc cgcagttgct gctgcagaag cagccactcg tacagccgta 660 caagccgaaa gagactccac aaacgcagcc tctctcgcag ctaaagccca agctgaagcc 720 agagctgctg cagccgctgc tgcagcagcg agactcgccg catcagctgc cgccgatgcc 780 agcgctcaag ccgatgcaag agtcagaacc gcttctattg aagctgccgc cagcgctcgt 840 accaaagcat ccaatgctca agccacagcc gaggctgcag ccatagccag gagcagctcc 900 agggacgcac aagcaaactg ggttgacaac aggtcttctg cgtcatcgtc cagtgcatcg 960 gccagtgcat cggttagtgc atcagccagt ggagaagccg attcagaagc cgattcagat 1020 gctagtgcat cagctcgttc agcagccgat tctaatgctg gttcatcttc cggtttagcc 1080 gccgattcag cggccgatac agccgccggt tcaaccgccg gttcagctgc ccgtttaagt 1140 gctggttctg cagccggttc aatagcacgt tcagctgccg gttctacagc cggctcatca 1200 actggttcag gagccggtgc atcagctgaa ggttcctcca atgcctcctc cggtacctcc 1260 gccggtgcat cctccggtgc ctccaccgga gcttctgctg gtgcctccgc cactgcttct 1320 gccgataatt ccgccgataa ttctgccgaa gctctttcta gctcctccgc cgagtcttcg 1380 tcgtcctcct ggtcttcttc cagccagaat atctggtccc aggattggta g 1431 <210> 75 <211> 1461 <212> DNA <213> Vespa simillima xanthoptera <400> 75 gacagatcgt gggcagcatc ggatgcaaat gctgaagcgt cagccgcagt ggaatcgcct 60 tctctttggg aagattcatc cagtgcaagc gcgggagcgt caaacgcagc ggaatcgtca 120 tctctttggg aagattcatc cagtgaaaac acgggagcgt caaccgcagc ggaatcgtca 180 tctctttggg aagattcatc cagtgcaagc gcgagagcgt caaccgcagc gggatcttca 240 tctgcttggg aagattcatc catcacaaac gcgagagaat caggggcatc gggatcgtta 300 tctagctggg aagattcatc cagtgcaagc gctagctcta gcacaagcgc aagcgctagc 360 tctagctcaa gttctagctc tagcattagc tccagcgcta gctctagctc tagtgctagt 420 gccagcgcta gtacagaagc atctaacgaa tcaagaaggg gtatcgccat tgagggagcc 480 cttgtaggta cgggggctgc aagtacggct gcggcatccg cagaaatgct ttcggacacc 540 ttgggattgg gtcaatctgc tcttcaagca caaacagcat ccgtaacgca ggctaacatt 600 gccagcgatg ccagcaacca agctaatcga ttggcggctg ccgcagcagc agcgatgtca 660 gccgcagctt ccgctcaaga gaacgccgcg tcgttagctc gagcttcggc cagtgcgtct 720 gaaagtgcgg ctagtgcctc atcgaaggcc gaggcgagcg ccgaagcggc caaatcgtct 780 gcggaaaaat gtttattgct cgcgcaaaac tccgcacaag cgcaagctcg cgcgactgaa 840 caatcagagt cctcgaacag agactcggct gccaacgcgg ccgccgccgc ggaagccgaa 900 aggaaggcca ctttggctct aaaagctata gctgatgcca aggccaaggc cggtgtagcc 960 gttgccgctc agtcggaggc tgctgcggca gccgcagccg ctgcaaaagc acgcgccgat 1020 gccgaagcag gtgctaattt ggccgcagca gcgcgtgccg tcgccgcagc cgaagctgct 1080 gcttccagac gaaatgatcg tcaagctggt atagctcaag ccggagcatc cgccgcagcc 1140 gagaccagag cgcttgcatc ctccgccgca gccaccgcta aagcagccgc ttacgctaat 1200 gccgatatcc gagcactttc cgcagctgct ctagaatcct ccatatcttc gtcctctagc 1260 actagtgctt ccagtgcatc ctcatccgcc agcagcggtg ccagcagcga ttccagcagc 1320 ggtgccagca gcggtgccag cagcgattct agcagcaatt ccagcagcga ttccagtagc 1380 ctcctaggag atgatgcttc aaccagtgcc agcagcacag ctgaagccga gagtagaact 1440 agctcgctga tcttaaacta a 1461 <210> 76 <211> 1527 <212> DNA <213> Vespa simillima xanthoptera <400> 76 atgaagtctc tctcaacgct cgtgtcgtcg ctcttgttgg gagcctgtgt gctcagtgtc 60 catgccgaca gatcgtgggc agcatcggat gcaaatgctg aagcgtcagc cgcagtggaa 120 tcgccttctc tttgggaaga ttcatccagt gcaagcgcgg gagcgtcaaa cgcagcggaa 180 tcgtcatctc tttgggaaga ttcatccagt gaaaacacgg gagcgtcaac cgcagcggaa 240 tcgtcatctc tttgggaaga ttcatccagt gcaagcgcga gagcgtcaac cgcagcggga 300 tcttcatctg cttgggaaga ttcatccatc acaaacgcga gagaatcagg ggcatcggga 360 tcgttatcta gctgggaaga ttcatccagt gcaagcgcta gctctagcac aagcgcaagc 420 gctagctcta gctcaagttc tagctctagc attagctcca gcgctagctc tagctctagt 480 gctagtgcca gcgctagtac agaagcatct aacgaatcaa gaaggggtat cgccattgag 540 ggagcccttg taggtacggg ggctgcaagt acggctgcgg catccgcaga aatgctttcg 600 gacaccttgg gattgggtca atctgctctt caagcacaaa cagcatccgt aacgcaggct 660 aacattgcca gcgatgccag caaccaagct aatcgattgg cggctgccgc agcagcagcg 720 atgtcagccg cagcttccgc tcaagagaac gccgcgtcgt tagctcgagc ttcggccagt 780 gcgtctgaaa gtgcggctag tgcctcatcg aaggccgagg cgagcgccga agcggccaaa 840 tcgtctgcgg aaaaatgttt attgctcgcg caaaactccg cacaagcgca agctcgcgcg 900 actgaacaat cagagtcctc gaacagagac tcggctgcca acgcggccgc cgccgcggaa 960 gccgaaagga aggccacttt ggctctaaaa gctatagctg atgccaaggc caaggccggt 1020 gtagccgttg ccgctcagtc ggaggctgct gcggcagccg cagccgctgc aaaagcacgc 1080 gccgatgccg aagcaggtgc taatttggcc gcagcagcgc gtgccgtcgc cgcagccgaa 1140 gctgctgctt ccagacgaaa tgatcgtcaa gctggtatag ctcaagccgg agcatccgcc 1200 gcagccgaga ccagagcgct tgcatcctcc gccgcagcca ccgctaaagc agccgcttac 1260 gctaatgccg atatccgagc actttccgca gctgctctag aatcctccat atcttcgtcc 1320 tctagcacta gtgcttccag tgcatcctca tccgccagca gcggtgccag cagcgattcc 1380 agcagcggtg ccagcagcgg tgccagcagc gattctagca gcaattccag cagcgattcc 1440 agtagcctcc taggagatga tgcttcaacc agtgccagca gcacagctga agccgagagt 1500 agaactagct cgctgatctt aaactaa 1527 <210> 77 <211> 1080 <212> DNA <213> Vespa simillima xanthoptera <400> 77 ttggctgccg ggagtagcag ctcgtccgcg gaatcttcgg catcggcgac agcgtcttca 60 gatgcgtcct ggagcgcgtc ctcgagatcg tcagctaccg gtagagcacc gaacgtgatt 120 ttgaataggg cacctcaatt aggagctagc gcggcagcga tcgcatcggc tcgagccagt 180 acctcagcaa atgctgcatc agacgaaaaa tctgcccgag aaacgcgagc gaccgctttg 240 gcccgatcaa gagctgctgt tacggcggca gcacgagcag ccgcaaggac gcaagaagcc 300 gtcgcggcag caaaagccgc aagtagggcc caagcgcttg ctgctgctaa atcttcggcg 360 gcaatttctg cattggccgc tggagaggct gccgcccaaa aggcggacgc cgcagctctc 420 gccgcattag ctgctaatca gagatctgtc aaagccgcag aaaatggtct agcagtgcag 480 aatcgtgcga atggagaagc ggaacaggca agtcgtgcgg ctgctgctaa ccttgccgcg 540 gccatccgta cccgagacaa tgctctcgaa acgagaagag aagcagctcg attgaaggca 600 ctagccacag ctgccgctaa cgctaataac aaagcgacca gtcttgccga agcttctgcg 660 aaccaagcag ctgaagcaag ctccgctgcc gaggatactt cttccgctca atctgctgcg 720 gtcgctcaag ctgaggccgc tgaaacgctc aacgtaaatc tcgctatact cgaaagtacc 780 caatcctcca gacaggactc caacgtggcc aaagctgagg cttccgccgc agccaaggcc 840 tcgcctggca ctgccacaag agacggagtc aaccttggtc tcgcctctga tgctggtgca 900 gctgctcaac taaaagccca agccgcagca ttggcacgag caagtagcag aattagttcc 960 ggccctgcgt tatccgcatg gaaatggagg aacgaagatt cttcagaatc gtcaacctct 1020 gcaatcgcca gctctagcgc cagttccagc tccagttctc gcagcgcatc cggaaactaa 1080 <210> 78 <211> 1125 <212> DNA <213> Vespa simillima xanthoptera <400> 78 atgaagatcc cctcgattct cgtaacgtgc ctttttacct ggggcttggc tgccgggagt 60 agcagctcgt ccgcggaatc ttcggcatcg gcgacagcgt cttcagatgc gtcctggagc 120 gcgtcctcga gatcgtcagc taccggtaga gcaccgaacg tgattttgaa tagggcacct 180 caattaggag ctagcgcggc agcgatcgca tcggctcgag ccagtacctc agcaaatgct 240 gcatcagacg aaaaatctgc ccgagaaacg cgagcgaccg ctttggcccg atcaagagct 300 gctgttacgg cggcagcacg agcagccgca aggacgcaag aagccgtcgc ggcagcaaaa 360 gccgcaagta gggcccaagc gcttgctgct gctaaatctt cggcggcaat ttctgcattg 420 gccgctggag aggctgccgc ccaaaaggcg gacgccgcag ctctcgccgc attagctgct 480 aatcagagat ctgtcaaagc cgcagaaaat ggtctagcag tgcagaatcg tgcgaatgga 540 gaagcggaac aggcaagtcg tgcggctgct gctaaccttg ccgcggccat ccgtacccga 600 gacaatgctc tcgaaacgag aagagaagca gctcgattga aggcactagc cacagctgcc 660 gctaacgcta ataacaaagc gaccagtctt gccgaagctt ctgcgaacca agcagctgaa 720 gcaagctccg ctgccgagga tacttcttcc gctcaatctg ctgcggtcgc tcaagctgag 780 gccgctgaaa cgctcaacgt aaatctcgct atactcgaaa gtacccaatc ctccagacag 840 gactccaacg tggccaaagc tgaggcttcc gccgcagcca aggcctcgcc tggcactgcc 900 acaagagacg gagtcaacct tggtctcgcc tctgatgctg gtgcagctgc tcaactaaaa 960 gcccaagccg cagcattggc acgagcaagt agcagaatta gttccggccc tgcgttatcc 1020 gcatggaaat ggaggaacga agattcttca gaatcgtcaa cctctgcaat cgccagctct 1080 agcgccagtt ccagctccag ttctcgcagc gcatccggaa actaa 1125 <210> 79 <211> 1080 <212> DNA <213> Vespa simillima xanthoptera <400> 79 agcgtggccc aaggtgggcc atcaaggttg tctgaaacca gtgattcgtc cgcagcatct 60 tggtcctcga gttcgtcttc aagctcgtcc ttgtcctcat ctctggcttc ggattctgct 120 tcttcttctg cttcgggttc ggcttcggct tcggcttcgg cttcggcttc ggcttcagca 180 agttcgagaa acgataacag tagagttaag gcatggaaga agggtagagg aggtagcgac 240 agcttggtac tgtcgagtga ttcatcagaa gattcaaaag ccagggagct cctcgagaca 300 gacgccggat taggtgcggc cgctgcgtta gcaagagcta ccgcggatgc ccaagctaga 360 acagcagcaa gcgccgatgc tacggctaat aaggcaactg caaaggctct tgtattagcc 420 gaggctgctg taagggcgga aaatgcagcg attgtaagga tccgtagggc tttatcggca 480 gcgcaagctc tcgtctcggc atccaatcgt gcaaaggccg cagctagagc tgcgagggaa 540 gctgctgcga actctgccgc tgctgccgca aaagcttcca ctaatcaagt gaaagccaac 600 gctgactcgc ttgtcgccaa cagagctgca gccgcccttc ttgctgctgc cgaggaagcc 660 ctccagaaag ccagtgcttc gcagaatgca gcagctgaag ctgctgcgaa agctcgtgcc 720 gcagctaacg cgaatgccgc aaccaccaga gccgcggcct cggccatact cgccgaagct 780 cgtgccagaa cagctatcac gaaagcactt gccgctcaat caacggcctc cgctcaggct 840 tcttccgcct ctcaagtaca aaatcgtgca aataacctac aagccgaaac cgcttcttta 900 gcccaatcca gggcagaagc cgcaatagct gcagctgcgg cacaagctgc cgctctcgca 960 gaagctaacg ctcaactcgc tcgtctcagc aaagcatctg caggtgcttc cagcgagggt 1020 tcggcttcag cctcggcatc agcctcggca tcagcctctt cgagtagtag cagcgcctaa 1080 <210> 80 <211> 1128 <212> DNA <213> Vespa simillima xanthoptera <400> 80 atgaacgtac aagcgacact cgtgctttgc ctgctcgcat tgttcggcag cgtggcccaa 60 ggtgggccat caaggttgtc tgaaaccagt gattcgtccg cagcatcttg gtcctcgagt 120 tcgtcttcaa gctcgtcctt gtcctcatct ctggcttcgg attctgcttc ttcttctgct 180 tcgggttcgg cttcggcttc ggcttcggct tcggcttcgg cttcagcaag ttcgagaaac 240 gataacagta gagttaaggc atggaagaag ggtagaggag gtagcgacag cttggtactg 300 tcgagtgatt catcagaaga ttcaaaagcc agggagctcc tcgagacaga cgccggatta 360 ggtgcggccg ctgcgttagc aagagctacc gcggatgccc aagctagaac agcagcaagc 420 gccgatgcta cggctaataa ggcaactgca aaggctcttg tattagccga ggctgctgta 480 agggcggaaa atgcagcgat tgtaaggatc cgtagggctt tatcggcagc gcaagctctc 540 gtctcggcat ccaatcgtgc aaaggccgca gctagagctg cgagggaagc tgctgcgaac 600 tctgccgctg ctgccgcaaa agcttccact aatcaagtga aagccaacgc tgactcgctt 660 gtcgccaaca gagctgcagc cgcccttctt gctgctgccg aggaagccct ccagaaagcc 720 agtgcttcgc agaatgcagc agctgaagct gctgcgaaag ctcgtgccgc agctaacgcg 780 aatgccgcaa ccaccagagc cgcggcctcg gccatactcg ccgaagctcg tgccagaaca 840 gctatcacga aagcacttgc cgctcaatca acggcctccg ctcaggcttc ttccgcctct 900 caagtacaaa atcgtgcaaa taacctacaa gccgaaaccg cttctttagc ccaatccagg 960 gcagaagccg caatagctgc agctgcggca caagctgccg ctctcgcaga agctaacgct 1020 caactcgctc gtctcagcaa agcatctgca ggtgcttcca gcgagggttc ggcttcagcc 1080 tcggcatcag cctcggcatc agcctcttcg agtagtagca gcgcctaa 1128 <210> 81 <211> 314 <212> PRT <213> Apis cerana <400> 81 Gly Leu Glu Gly Ser Gly Asn Pro Leu Pro Glu Leu Val Lys Gly Ser 1 5 10 15 Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg 20 25 30 Val Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val Leu Gln Ala 35 40 45 Glu Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala Ala Asp Leu 50 55 60 Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser Gln Ala Ala 65 70 75 80 Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln Ala Arg Ala 85 90 95 Gly Leu Glu Ser Val Ser Ile Ala Ala Ser Ala Thr Ser Ala Ala Lys 100 105 110 Glu Ala Ser Thr Ala Ala Arg Ala Ala Ala Ser Ala Leu Ser Thr Ala 115 120 125 Thr Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala Glu Ala Val 130 135 140 Ala Ser Glu Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala Asn Leu Ala 145 150 155 160 Ala Ala Ala Ser Glu Ala Ala Glu Thr Ala Leu Lys Ala Glu Lys Val 165 170 175 Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala Ala Ala Arg 180 185 190 Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala Thr Ala Ser 195 200 205 Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val Ala Val Leu 210 215 220 Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala Ala Thr Ser 225 230 235 240 Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn Val Glu Thr 245 250 255 Ala Thr Ile Gly Ala Asn Ile Asp Ser Ser Lys Gln Val Val Ser Ile 260 265 270 Pro Val Glu Ile Lys Lys Phe Pro Glu Pro Glu Leu Ser Thr Ser Trp 275 280 285 Arg Glu Asp Glu Glu Val Thr Lys Gly Lys Lys Glu Asp Ile Asn Leu 290 295 300 Asn Ser Phe Glu Leu Lys Ser Asn Val Phe 305 310 <210> 82 <211> 333 <212> PRT <213> Apis cerana <400> 82 Met Lys Ile Pro Val Leu Leu Ala Thr Cys Leu Tyr Leu Cys Gly Phe 1 5 10 15 Ala Ser Ala Gly Leu Glu Gly Ser Gly Asn Pro Leu Pro Glu Leu Val 20 25 30 Lys Gly Ser Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser 35 40 45 Gly Leu Arg Val Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val 50 55 60 Leu Gln Ala Glu Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala 65 70 75 80 Ala Asp Leu Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser 85 90 95 Gln Ala Ala Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln 100 105 110 Ala Arg Ala Gly Leu Glu Ser Val Ser Ile Ala Ala Ser Ala Thr Ser 115 120 125 Ala Ala Lys Glu Ala Ser Thr Ala Ala Arg Ala Ala Ala Ser Ala Leu 130 135 140 Ser Thr Ala Thr Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala 145 150 155 160 Glu Ala Val Ala Ser Glu Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala 165 170 175 Asn Leu Ala Ala Ala Ala Ser Glu Ala Ala Glu Thr Ala Leu Lys Ala 180 185 190 Glu Lys Val Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala 195 200 205 Ala Ala Arg Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala 210 215 220 Thr Ala Ser Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val 225 230 235 240 Ala Val Leu Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala 245 250 255 Ala Thr Ser Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn 260 265 270 Val Glu Thr Ala Thr Ile Gly Ala Asn Ile Asp Ser Ser Lys Gln Val 275 280 285 Val Ser Ile Pro Val Glu Ile Lys Lys Phe Pro Glu Pro Glu Leu Ser 290 295 300 Thr Ser Trp Arg Glu Asp Glu Glu Val Thr Lys Gly Lys Lys Glu Asp 305 310 315 320 Ile Asn Leu Asn Ser Phe Glu Leu Lys Ser Asn Val Phe 325 330 <210> 83 <211> 288 <212> PRT <213> Apis cerana <400> 83 Arg Val Ile Asn His Glu Ser Leu Lys Thr Asn Val Asp Ile Gln Val 1 5 10 15 Thr Pro Gly Gln Val Gly Asp Gly Ser Asp Ala Thr Ser Ser Ser Ile 20 25 30 Glu Asn Ala Leu Lys Val Ala Arg Ala Ser Glu Asn Val Gly Leu Asn 35 40 45 Leu Glu Leu Asn Ala Gly Ala His Ala Ala Ser Val Ala Ala Ala Ala 50 55 60 Gln Ala Lys Asn Thr Glu Ala Ala Glu Val Gly Ala Asn Ala Ala Leu 65 70 75 80 Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu Ile 85 90 95 Ala Ser Gln Leu Leu Thr Asn Ala Ala Lys Ala Ala Glu Ala Thr Val 100 105 110 Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala Ala Ala Lys Glu Ala 115 120 125 Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala Thr Glu Ala Gln Val 130 135 140 Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg Thr Ala Ile Ala Glu 145 150 155 160 Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala Ala Ile Ala Arg Lys 165 170 175 Ala Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile Ala Ala Ala Ala Glu 180 185 190 Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Thr Val Ala Leu Ser Asn 195 200 205 Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala Gln Ala Thr Ala Ser 210 215 220 Thr Gln Ala Ser Ala Ala Val Arg Val Asp Ser Gln Ala Ala Asn Ala 225 230 235 240 Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala Glu 245 250 255 Ala Ile Ala Ala Ala Glu Ala Glu Ala Ala Ser Lys Ala Ala Ser Phe 260 265 270 Ala Lys Lys Ile Val Asp Glu Lys Lys Ile His Val Glu Lys Leu Glu 275 280 285 <210> 84 <211> 307 <212> PRT <213> Apis cerana <400> 84 Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Val Trp Gly Leu 1 5 10 15 Ala Glu Gly Arg Val Ile Asn His Glu Ser Leu Lys Thr Asn Val Asp 20 25 30 Ile Gln Val Thr Pro Gly Gln Val Gly Asp Gly Ser Asp Ala Thr Ser 35 40 45 Ser Ser Ile Glu Asn Ala Leu Lys Val Ala Arg Ala Ser Glu Asn Val 50 55 60 Gly Leu Asn Leu Glu Leu Asn Ala Gly Ala His Ala Ala Ser Val Ala 65 70 75 80 Ala Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Val Gly Ala Asn 85 90 95 Ala Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala 100 105 110 Ser Glu Ile Ala Ser Gln Leu Leu Thr Asn Ala Ala Lys Ala Ala Glu 115 120 125 Ala Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala Ala Ala 130 135 140 Lys Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala Thr Glu 145 150 155 160 Ala Gln Val Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg Thr Ala 165 170 175 Ile Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala Ala Ile 180 185 190 Ala Arg Lys Ala Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile Ala Ala 195 200 205 Ala Ala Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Thr Val Ala 210 215 220 Leu Ser Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala Gln Ala 225 230 235 240 Thr Ala Ser Thr Gln Ala Ser Ala Ala Val Arg Val Asp Ser Gln Ala 245 250 255 Ala Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu Leu Val 260 265 270 Thr Ala Glu Ala Ile Ala Ala Ala Glu Ala Glu Ala Ala Ser Lys Ala 275 280 285 Ala Ser Phe Ala Lys Lys Ile Val Asp Glu Lys Lys Ile His Val Glu 290 295 300 Lys Leu Glu 305 <210> 85 <211> 316 <212> PRT <213> Apis cerana <400> 85 Gly Val Glu Glu Phe Lys Ser Ser Thr Thr Glu Glu Val Ile Gly Lys 1 5 10 15 Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser Ala Lys Arg 20 25 30 Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Val Phe Lys Ser Leu 35 40 45 Glu Asn Ile Lys Ala Ser Ala Gly Ala Asp Ala Lys Ala Ser Ala Val 50 55 60 Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu Arg Ala Ser 65 70 75 80 Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Leu Lys Asn 85 90 95 Ala Gln Gln Ala Gln Leu Ile Ala Gln Glu Lys Ala Leu Ala Ala Leu 100 105 110 Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala Asn Ala Ala 115 120 125 Ala Ala Ala Thr Gln Ser Ala Val Glu Arg Ala Gln Ala Ser Ser Arg 130 135 140 Thr Ala Thr Ala Ala Gln Asn Val Ala Ser Asn Leu Gln Lys Arg Thr 145 150 155 160 Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg Gln Leu Gln 165 170 175 Asp Ala Glu Gln Thr Lys Trp Ser Ala Asn Ala Ala Leu Glu Val Ser 180 185 190 Ala Ala Ala Thr Ala Ala Glu Thr Lys Thr Thr Ala Ser Ser Glu Ala 195 200 205 Ala Ser Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser Asp Ala Asp 210 215 220 Gly Ala Glu Lys Ser Ala Ser Thr Glu Ala Gln Ser Ala Ala Lys Ile 225 230 235 240 Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala Ser Glu Asp 245 250 255 Ser Gln Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg Ala Asn Val 260 265 270 Ala Thr Ala Ile Gly Asp Gly Ala Ile Leu Gly Leu Gly Gln Asp Val 275 280 285 Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu Ala Glu Val 290 295 300 Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe 305 310 315 <210> 86 <211> 335 <212> PRT <213> Apis cerana <400> 86 Met Gln Ile Pro Thr Phe Val Val Val Cys Leu Leu Thr Ser Gly Leu 1 5 10 15 Val His Ala Gly Val Glu Glu Phe Lys Ser Ser Thr Thr Glu Glu Val 20 25 30 Ile Gly Lys Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser 35 40 45 Ala Lys Arg Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Val Phe 50 55 60 Lys Ser Leu Glu Asn Ile Lys Ala Ser Ala Gly Ala Asp Ala Lys Ala 65 70 75 80 Ser Ala Val Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu 85 90 95 Arg Ala Ser Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala 100 105 110 Leu Lys Asn Ala Gln Gln Ala Gln Leu Ile Ala Gln Glu Lys Ala Leu 115 120 125 Ala Ala Leu Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala 130 135 140 Asn Ala Ala Ala Ala Ala Thr Gln Ser Ala Val Glu Arg Ala Gln Ala 145 150 155 160 Ser Ser Arg Thr Ala Thr Ala Ala Gln Asn Val Ala Ser Asn Leu Gln 165 170 175 Lys Arg Thr Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg 180 185 190 Gln Leu Gln Asp Ala Glu Gln Thr Lys Trp Ser Ala Asn Ala Ala Leu 195 200 205 Glu Val Ser Ala Ala Ala Thr Ala Ala Glu Thr Lys Thr Thr Ala Ser 210 215 220 Ser Glu Ala Ala Ser Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser 225 230 235 240 Asp Ala Asp Gly Ala Glu Lys Ser Ala Ser Thr Glu Ala Gln Ser Ala 245 250 255 Ala Lys Ile Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala 260 265 270 Ser Glu Asp Ser Gln Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg 275 280 285 Ala Asn Val Ala Thr Ala Ile Gly Asp Gly Ala Ile Leu Gly Leu Gly 290 295 300 Gln Asp Val Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu 305 310 315 320 Ala Glu Val Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe 325 330 335 <210> 87 <211> 320 <212> PRT <213> Apis cerana <400> 87 Ala Ser Glu Glu Val Glu Thr Arg Gly Lys Thr Lys Thr Ser Thr Val 1 5 10 15 Val Lys Ser Glu Lys Val Glu Val Val Pro Ala Lys Asp Glu Leu Lys 20 25 30 Leu Thr Ser Glu Pro Ile Leu Gly Arg Arg Val Gly Thr Gly Ala Ser 35 40 45 Glu Val Ala Ser Ser Ser Gly Glu Ile Ile Ala Ile Ser Leu Gly Thr 50 55 60 Gly Gln Ala Ala Ala Glu Ser Gln Ala Val Ala Ala Ser Gln Ser Lys 65 70 75 80 Ser Ala Ala Ser Ala Ala Ile Ser Ala Ser Glu Leu Ala Asn Lys Val 85 90 95 Ala Ala Leu Val Val Gly Ala Thr Ala Ala Gln Ala Arg Ala Ala Ala 100 105 110 Ala Ser Ser Gly Ala Leu Lys Ala Ser Leu Ala Thr Glu Glu Ser Ala 115 120 125 Glu Glu Ala Glu Ala Ala Val Ala Val Ala Lys Ala Ala Ala Glu Lys 130 135 140 Ala Glu Ser Leu Ala Arg Asn Leu Ala Ser Ala Ser Ala Arg Ala Ala 145 150 155 160 Ile Ser Ser Glu Ser Ala Asn Glu Leu Ala Gln Ala Glu Ser Ala Ala 165 170 175 Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys Ala Ala Glu 180 185 190 Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu Ala Asp Ala 195 200 205 Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val Ala Asp Ala 210 215 220 Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys Ala Glu Glu 225 230 235 240 Glu Ala Ser Ala Gln Ala Glu Asn Thr Ala Gly Val Ser Gln Ala Ala 245 250 255 Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala Ala Ala Ala 260 265 270 Thr Ser Glu Thr Ala Ala Glu Ala Gly Pro Leu Ala Gly Glu Leu Lys 275 280 285 Pro Pro Gln Trp Lys Arg Ile Pro Val Lys Lys Glu Glu Trp Lys Thr 290 295 300 Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu Trp Glu Val Lys 305 310 315 320 <210> 88 <211> 339 <212> PRT <213> Apis cerana <400> 88 Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Ile Trp Gly Leu 1 5 10 15 Ala Ser Gly Ala Ser Glu Glu Val Glu Thr Arg Gly Lys Thr Lys Thr 20 25 30 Ser Thr Val Val Lys Ser Glu Lys Val Glu Val Val Pro Ala Lys Asp 35 40 45 Glu Leu Lys Leu Thr Ser Glu Pro Ile Leu Gly Arg Arg Val Gly Thr 50 55 60 Gly Ala Ser Glu Val Ala Ser Ser Ser Gly Glu Ile Ile Ala Ile Ser 65 70 75 80 Leu Gly Thr Gly Gln Ala Ala Ala Glu Ser Gln Ala Val Ala Ala Ser 85 90 95 Gln Ser Lys Ser Ala Ala Ser Ala Ala Ile Ser Ala Ser Glu Leu Ala 100 105 110 Asn Lys Val Ala Ala Leu Val Val Gly Ala Thr Ala Ala Gln Ala Arg 115 120 125 Ala Ala Ala Ala Ser Ser Gly Ala Leu Lys Ala Ser Leu Ala Thr Glu 130 135 140 Glu Ser Ala Glu Glu Ala Glu Ala Ala Val Ala Val Ala Lys Ala Ala 145 150 155 160 Ala Glu Lys Ala Glu Ser Leu Ala Arg Asn Leu Ala Ser Ala Ser Ala 165 170 175 Arg Ala Ala Ile Ser Ser Glu Ser Ala Asn Glu Leu Ala Gln Ala Glu 180 185 190 Ser Ala Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys 195 200 205 Ala Ala Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu 210 215 220 Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val 225 230 235 240 Ala Asp Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys 245 250 255 Ala Glu Glu Glu Ala Ser Ala Gln Ala Glu Asn Thr Ala Gly Val Ser 260 265 270 Gln Ala Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala 275 280 285 Ala Ala Ala Thr Ser Glu Thr Ala Ala Glu Ala Gly Pro Leu Ala Gly 290 295 300 Glu Leu Lys Pro Pro Gln Trp Lys Arg Ile Pro Val Lys Lys Glu Glu 305 310 315 320 Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu Trp 325 330 335 Glu Val Lys <210> 89 <211> 945 <212> DNA <213> Apis cerana <400> 89 ggtttggaag ggtcgggtaa cccattgccc gagctcgtga aaggtagcgc atcggccacc 60 gcgtcgactg ctgtgactgc tagatcgggg cttagagtcg gacaagtagc tttagcttcg 120 cagaaggatg ccgtactcca agctgaagct gctgcatccg ccgcgtcaga ggcacgcgcc 180 gctgccgatc tgacggctaa acttagccaa gaatcggcat cagtgcaatc acaggccgcc 240 gccaaaggga aggaaacgga ggaggcagcg gttggtcaag ctagagctgg tctcgagtcg 300 gtatccatcg ccgcatcggc cacttctgct gccaaagaag catcaaccgc cgccagagcc 360 gcagcatccg cactatccac agccacggtg caagcgaaaa tagccgagag agcagccaag 420 gctgaagctg ttgcctcaga ggaagccaag gccaaggcga ttgcagcagc caacttggcg 480 gctgcggcta gtgaagccgc ggaaacagcc ctcaaggctg agaaagtggc cgaagaagct 540 atcgcaagag cggcctctgc aaaggctgct gcaagagctg ctgcggccgc tctagcctcc 600 tcgaaggaag cagccacggc cagcgcgaga aacgccgcgg aatccgaggc caggaacgaa 660 gtagctgtat tgatcgccga gattgataaa aagagtaggg aaatcgacgc agccacttcg 720 cttaatgcgc gtgccgctgc caaagcaagc tccaggaacg tagaaacggc gacaatcggg 780 gctaacatcg actcttcgaa acaagtcgta tcaattccag tggaaataaa gaaattcccg 840 gagccagaac tgtcaacatc atggagagaa gatgaagagg ttacgaaagg aaaaaaggag 900 gatataaatc tgaatagctt cgaattgaag agcaatgtat tttag 945 <210> 90 <211> 1002 <212> DNA <213> Apis cerana <400> 90 atgaagattc cagtattgct tgcaacgtgc ctctaccttt gcggatttgc gtccgccggt 60 ttggaagggt cgggtaaccc attgcccgag ctcgtgaaag gtagcgcatc ggccaccgcg 120 tcgactgctg tgactgctag atcggggctt agagtcggac aagtagcttt agcttcgcag 180 aaggatgccg tactccaagc tgaagctgct gcatccgccg cgtcagaggc acgcgccgct 240 gccgatctga cggctaaact tagccaagaa tcggcatcag tgcaatcaca ggccgccgcc 300 aaagggaagg aaacggagga ggcagcggtt ggtcaagcta gagctggtct cgagtcggta 360 tccatcgccg catcggccac ttctgctgcc aaagaagcat caaccgccgc cagagccgca 420 gcatccgcac tatccacagc cacggtgcaa gcgaaaatag ccgagagagc agccaaggct 480 gaagctgttg cctcagagga agccaaggcc aaggcgattg cagcagccaa cttggcggct 540 gcggctagtg aagccgcgga aacagccctc aaggctgaga aagtggccga agaagctatc 600 gcaagagcgg cctctgcaaa ggctgctgca agagctgctg cggccgctct agcctcctcg 660 aaggaagcag ccacggccag cgcgagaaac gccgcggaat ccgaggccag gaacgaagta 720 gctgtattga tcgccgagat tgataaaaag agtagggaaa tcgacgcagc cacttcgctt 780 aatgcgcgtg ccgctgccaa agcaagctcc aggaacgtag aaacggcgac aatcggggct 840 aacatcgact cttcgaaaca agtcgtatca attccagtgg aaataaagaa attcccggag 900 ccagaactgt caacatcatg gagagaagat gaagaggtta cgaaaggaaa aaaggaggat 960 ataaatctga atagcttcga attgaagagc aatgtatttt ag 1002 <210> 91 <211> 867 <212> DNA <213> Apis cerana <400> 91 cgtgtgatta atcacgaatc cctgaagacg aacgtggata ttcaagtaac accaggacaa 60 gtcggtgatg gatctgacgc gactagctcc tccatagaaa acgccctaaa agtcgctcga 120 gcgtctgaga acgtgggcct gaatctggaa ttgaacgcag gcgcgcatgc tgccagtgtt 180 gccgctgctg cccaggccaa aaatacagag gctgcggaag taggagcaaa cgccgctctg 240 gccgccgcca ttgccaaacg agaggaagcg attaaagcca gcgagatagc aagccagtta 300 ttgaccaatg cagcaaaggc agcagaagcg actgtatcgg caacgaagag ggcagcacaa 360 ttgacggctg cagcgaaaga agcaaccaga gcttctgcag ccgctgctga agctgctacg 420 gaggcccagg taaaggctaa tgctgattcg attatcacga agaggactgc gattgctgag 480 gctcaagctg cggcagaagc tcaagttaag gcggcaatcg ctagaaaggc ggcagcgaat 540 tttttggcta aggctcaaat agcggctgcc gcggaatccg aggccacgaa actcgcggcc 600 gaagccacag tggcattaag taacgccgaa gtcgccgtga accaggctag aaacgcacag 660 gcaaccgcct cgactcaagc ttccgcagct gttagggtag attctcaagc agcgaacgct 720 gaagcagccg ctgtagcaca agccgaaact ctcttggtta cggcagaagc catcgcagct 780 gcagaggctg aggctgcgag caaagccgcc tcatttgcaa aaaagatcgt cgatgagaag 840 aaaatacatg tagaaaagtt ggaataa 867 <210> 92 <211> 924 <212> DNA <213> Apis cerana <400> 92 atgaagattc cagcaatatt cgtcacatct ctgctggtct ggggattggc cgagggccgt 60 gtgattaatc acgaatccct gaagacgaac gtggatattc aagtaacacc aggacaagtc 120 ggtgatggat ctgacgcgac tagctcctcc atagaaaacg ccctaaaagt cgctcgagcg 180 tctgagaacg tgggcctgaa tctggaattg aacgcaggcg cgcatgctgc cagtgttgcc 240 gctgctgccc aggccaaaaa tacagaggct gcggaagtag gagcaaacgc cgctctggcc 300 gccgccattg ccaaacgaga ggaagcgatt aaagccagcg agatagcaag ccagttattg 360 accaatgcag caaaggcagc agaagcgact gtatcggcaa cgaagagggc agcacaattg 420 acggctgcag cgaaagaagc aaccagagct tctgcagccg ctgctgaagc tgctacggag 480 gcccaggtaa aggctaatgc tgattcgatt atcacgaaga ggactgcgat tgctgaggct 540 caagctgcgg cagaagctca agttaaggcg gcaatcgcta gaaaggcggc agcgaatttt 600 ttggctaagg ctcaaatagc ggctgccgcg gaatccgagg ccacgaaact cgcggccgaa 660 gccacagtgg cattaagtaa cgccgaagtc gccgtgaacc aggctagaaa cgcacaggca 720 accgcctcga ctcaagcttc cgcagctgtt agggtagatt ctcaagcagc gaacgctgaa 780 gcagccgctg tagcacaagc cgaaactctc ttggttacgg cagaagccat cgcagctgca 840 gaggctgagg ctgcgagcaa agccgcctca tttgcaaaaa agatcgtcga tgagaagaaa 900 atacatgtag aaaagttgga ataa 924 <210> 93 <211> 951 <212> DNA <213> Apis cerana <400> 93 ggcgtcgagg aattcaagtc ctcgacaacc gaggaggtga tcggcaaaaa cttagaagtc 60 gacctattga aaaatgtgga tactagcgcg aaacgaagag agaatggcgc cccagtgctc 120 ggcaagaacg tattcaaatc cctggagaac atcaaggcgt cggcgggcgc ggatgccaaa 180 gcatcagccg tggtgaaagc gtccgctctg gctcttgcag aagcctattt gcgagcgtct 240 gcattgtctg ccgccgcttc agccaaggca gccgctgccc tgaagaatgc gcaacaagcg 300 caattaatcg cccaggaaaa ggctttggcc gcgttgaaag ctcagtccga ggaagaggca 360 gcttctgctc gtgcgaacgc agcagccgct gcaacacagt cagcagtgga acgcgctcaa 420 gcctcctcca gaacagcaac ggccgcccaa aacgtagcca gcaacttgca gaaacggacc 480 agcaccaagg ccgcggctga agccgctgct accctcagac aattacagga tgcggaacaa 540 accaaatgga gtgccaacgc tgctttggaa gtctccgctg ctgcaactgc cgcagaaacg 600 aagaccactg cctcctcgga ggccgctagc gccgccgcca aaaaggcggc cgcgatagct 660 tctgacgcgg atggcgcaga aaagtcggca tctaccgaag cacaatcagc tgcgaagatc 720 gaaagtgtgg cagccgccga aggatccgcc aactcggcct ccgaggactc ccaggccgcg 780 caattggaag cttccaccgc ggcgagagcc aacgtggcca cagctatcgg ggatggagcg 840 attttaggac ttggacagga cgtgggtgcc gcggctcagt tgcttgcaca ggcgaaggca 900 ttggccgaag ttagctcgaa atccgaaaat attgaggata aaaaattttg a 951 <210> 94 <211> 1008 <212> DNA <213> Apis cerana <400> 94 atgcagatcc caacgtttgt cgtcgtatgc ttgctcacat cgggcttggt gcacgcaggc 60 gtcgaggaat tcaagtcctc gacaaccgag gaggtgatcg gcaaaaactt agaagtcgac 120 ctattgaaaa atgtggatac tagcgcgaaa cgaagagaga atggcgcccc agtgctcggc 180 aagaacgtat tcaaatccct ggagaacatc aaggcgtcgg cgggcgcgga tgccaaagca 240 tcagccgtgg tgaaagcgtc cgctctggct cttgcagaag cctatttgcg agcgtctgca 300 ttgtctgccg ccgcttcagc caaggcagcc gctgccctga agaatgcgca acaagcgcaa 360 ttaatcgccc aggaaaaggc tttggccgcg ttgaaagctc agtccgagga agaggcagct 420 tctgctcgtg cgaacgcagc agccgctgca acacagtcag cagtggaacg cgctcaagcc 480 tcctccagaa cagcaacggc cgcccaaaac gtagccagca acttgcagaa acggaccagc 540 accaaggccg cggctgaagc cgctgctacc ctcagacaat tacaggatgc ggaacaaacc 600 aaatggagtg ccaacgctgc tttggaagtc tccgctgctg caactgccgc agaaacgaag 660 accactgcct cctcggaggc cgctagcgcc gccgccaaaa aggcggccgc gatagcttct 720 gacgcggatg gcgcagaaaa gtcggcatct accgaagcac aatcagctgc gaagatcgaa 780 agtgtggcag ccgccgaagg atccgccaac tcggcctccg aggactccca ggccgcgcaa 840 ttggaagctt ccaccgcggc gagagccaac gtggccacag ctatcgggga tggagcgatt 900 ttaggacttg gacaggacgt gggtgccgcg gctcagttgc ttgcacaggc gaaggcattg 960 gccgaagtta gctcgaaatc cgaaaatatt gaggataaaa aattttga 1008 <210> 95 <211> 963 <212> DNA <213> Apis cerana <400> 95 gcaagcgaag aggtggagac acggggcaag accaagacct cgacagtggt gaaaagcgag 60 aaagtggaag tcgttcccgc taaggatgaa cttaaattaa cgagcgagcc catccttgga 120 agaagagtgg gaactggagc atccgaggtg gcatctagca gcggtgaaat catcgcaata 180 agtcttggaa cagggcaggc agcggcagaa tctcaggccg tggccgcctc gcaatccaaa 240 tcggcagcga gcgccgccat aagcgcaagc gagcttgcca acaaagttgc tgctctagtt 300 gttggcgcga ctgcggcgca ggcgagagcg gccgccgcct cctcaggcgc gttgaaggcc 360 agcttggcga ccgaagaatc ggcggaagag gccgaggcgg ccgtggctgt cgccaaggct 420 gccgcggaaa aggccgaatc cctggcgaga aatctcgcgt cggcgagcgc tcgtgcggct 480 atctcgtcgg aaagtgcgaa cgaattggct caagctgaga gcgcggcagc ggccgaagcg 540 caggccaaga cagccgccgc cgccaaagca gcggaaatcg cccttaaggt cgctgagata 600 gcggtgaaag cggaagcaga cgcggcagct gccgccgtgg cagctgcaaa ggcaagggcc 660 gtagcagacg cggccgctgc ccgtgctgca gccgtgaacg ccatcgccaa ggcggaagag 720 gaggcctcgg cccaagcaga gaacaccgcc ggtgtttcgc aagctgccgc ctccgccgcg 780 gcggaatcgc gagccgctgc agcagccgcc gctgctactt cggagacagc ggctgaagct 840 ggcccgttag caggggagct gaaaccacca caatggaaac ggattcctgt taagaaggaa 900 gagtggaaaa catcaacgaa ggaagaatgg aaaacgacga atgaagaatg ggaggtgaag 960 taa 963 <210> 96 <211> 1020 <212> DNA <213> Apis cerana <400> 96 atgaagatcc catccatact cgcggtttcc ctgctgatct ggggtttggc aagcggcgca 60 agcgaagagg tggagacacg gggcaagacc aagacctcga cagtggtgaa aagcgagaaa 120 gtggaagtcg ttcccgctaa ggatgaactt aaattaacga gcgagcccat ccttggaaga 180 agagtgggaa ctggagcatc cgaggtggca tctagcagcg gtgaaatcat cgcaataagt 240 cttggaacag ggcaggcagc ggcagaatct caggccgtgg ccgcctcgca atccaaatcg 300 gcagcgagcg ccgccataag cgcaagcgag cttgccaaca aagttgctgc tctagttgtt 360 ggcgcgactg cggcgcaggc gagagcggcc gccgcctcct caggcgcgtt gaaggccagc 420 ttggcgaccg aagaatcggc ggaagaggcc gaggcggccg tggctgtcgc caaggctgcc 480 gcggaaaagg ccgaatccct ggcgagaaat ctcgcgtcgg cgagcgctcg tgcggctatc 540 tcgtcggaaa gtgcgaacga attggctcaa gctgagagcg cggcagcggc cgaagcgcag 600 gccaagacag ccgccgccgc caaagcagcg gaaatcgccc ttaaggtcgc tgagatagcg 660 gtgaaagcgg aagcagacgc ggcagctgcc gccgtggcag ctgcaaaggc aagggccgta 720 gcagacgcgg ccgctgcccg tgctgcagcc gtgaacgcca tcgccaaggc ggaagaggag 780 gcctcggccc aagcagagaa caccgccggt gtttcgcaag ctgccgcctc cgccgcggcg 840 gaatcgcgag ccgctgcagc agccgccgct gctacttcgg agacagcggc tgaagctggc 900 ccgttagcag gggagctgaa accaccacaa tggaaacgga ttcctgttaa gaaggaagag 960 tggaaaacat caacgaagga agaatggaaa acgacgaatg aagaatggga ggtgaagtaa 1020 <210> 97 <211> 562 <212> PRT <213> Mallada signata <400> 97 Ala Val Leu Ile Ser Gly Ser Ala Ala Gly Ala Ser Ser His Asn Ala 1 5 10 15 Ala Gly Ala Ala Ala Ala Ala Arg Ala Ala Leu Gly Ala Ser Gly Ala 20 25 30 Ala Gly Leu Gly Ala Ala Ser Gly Ala Ala Arg Arg Asn Val Ala Val 35 40 45 Gly Ala Asn Gly Ala Ala Ala Ala Ser Ala Ala Ala Ala Ala Ala Arg 50 55 60 Arg Ala Gly Ala Ile Gly Leu Asn Gly Ala Ala Gly Ala Asn Val Ala 65 70 75 80 Val Ala Gly Gly Lys Lys Gly Gly Ala Ala Gly Leu Asn Ala Gly Ala 85 90 95 Gly Ala Ser Leu Val Ser Ala Ala Ala Arg Arg Asn Gly Ala Leu Gly 100 105 110 Leu Asn Gly Ala Ala Gly Ala Asn Leu Ala Ala Ala Gly Gly Lys Lys 115 120 125 Gly Gly Ala Ile Gly Leu Asn Ala Gly Ala Ser Ala Asn Val Gly Ala 130 135 140 Ala Ala Ala Lys Lys Asn Gly Ala Ile Gly Leu Asn Ser Ala Ala Ser 145 150 155 160 Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Gly Gly Ala Ile Gly Leu 165 170 175 Asn Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser 180 185 190 Gly Ala Val Gly Leu Asn Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala 195 200 205 Ala Ala Lys Lys Ser Gly Ala Val Ala Ala Asn Ser Ala Ala Ser Ala 210 215 220 Asn Ala Ala Ala Ala Ala Gln Lys Lys Ala Ala Ala Asp Ala Ala Asn 225 230 235 240 Ala Ala Ala Ser Glu Ser Ala Ala Ala Ala Ala Ala Lys Lys Ala Ala 245 250 255 Ala Val Ala Glu Asn Ala Ala Ala Thr Ala Asn Ala Ala Ser Ala Leu 260 265 270 Arg Lys Asn Ala Leu Ala Ile Ala Ser Asp Ala Ala Ala Val Arg Ala 275 280 285 Asp Ala Ala Ala Ala Ala Ala Asp Asp Ala Ala Lys Ala Asn Asn Ala 290 295 300 Ala Ser Arg Gly Ser Asp Gly Leu Thr Ala Arg Ala Asn Ala Ala Thr 305 310 315 320 Leu Ala Ser Asp Ala Ala Arg Arg Ala Ser Asn Ala Ala Thr Ala Ala 325 330 335 Ser Asp Ala Ala Thr Asp Arg Leu Asn Ala Ala Thr Ala Ala Ser Asn 340 345 350 Ala Ala Thr Ala Arg Ala Asn Ala Ala Thr Arg Ala Asp Asp Ala Ala 355 360 365 Thr Asp Ala Asp Asn Ala Ala Ser Lys Ala Ser Asp Val Ser Ala Ile 370 375 380 Glu Ala Asp Asn Ala Ala Arg Ala Ala Asp Ala Asp Ala Ile Ala Thr 385 390 395 400 Asn Arg Ala Ala Glu Ala Ser Asp Ala Ala Ala Ile Ala Ala Asp Ala 405 410 415 Ala Ala Asn Ala Ala Asp Ala Ala Ala Gln Cys Asn Asn Lys Val Ala 420 425 430 Arg Val Ser Asp Ala Leu Ala Leu Ala Ala Asn Ala Ala Ala Arg Gly 435 440 445 Ser Asp Ala Ala Ala Glu Ala Gln Asp Ala Val Ala Arg Ala Ser Asp 450 455 460 Ala Ala Ala Ala Gln Ala Asp Gly Val Ala Ile Ala Val Asn Gly Ala 465 470 475 480 Thr Ala Arg Asp Ser Ala Ile Glu Ala Ala Ala Thr Ala Gly Ala Ala 485 490 495 Gln Ala Lys Ala Ala Gly Arg Ala Gly Ala Ala Ala Ala Gly Leu Arg 500 505 510 Ala Gly Ala Ala Arg Gly Ala Ala Ala Gly Ser Ala Arg Gly Leu Ala 515 520 525 Gly Gly Leu Ala Ala Gly Ser Asn Ala Gly Ile Ala Ala Gly Ala Ala 530 535 540 Ser Gly Leu Ala Arg Gly Ala Ala Ala Glu Val Cys Ala Ala Arg Ile 545 550 555 560 Ala Leu <210> 98 <211> 588 <212> PRT <213> Mallada signata <400> 98 Met Ala Ala Ser Asn Lys Ile Ile Phe Ser Phe Leu Ala Ile Val Leu 1 5 10 15 Leu Gln Leu Ala Thr His Cys Ser Ser Thr Ala Val Leu Ile Ser Gly 20 25 30 Ser Ala Ala Gly Ala Ser Ser His Asn Ala Ala Gly Ala Ala Ala Ala 35 40 45 Ala Arg Ala Ala Leu Gly Ala Ser Gly Ala Ala Gly Leu Gly Ala Ala 50 55 60 Ser Gly Ala Ala Arg Arg Asn Val Ala Val Gly Ala Asn Gly Ala Ala 65 70 75 80 Ala Ala Ser Ala Ala Ala Ala Ala Ala Arg Arg Ala Gly Ala Ile Gly 85 90 95 Leu Asn Gly Ala Ala Gly Ala Asn Val Ala Val Ala Gly Gly Lys Lys 100 105 110 Gly Gly Ala Ala Gly Leu Asn Ala Gly Ala Gly Ala Ser Leu Val Ser 115 120 125 Ala Ala Ala Arg Arg Asn Gly Ala Leu Gly Leu Asn Gly Ala Ala Gly 130 135 140 Ala Asn Leu Ala Ala Ala Gly Gly Lys Lys Gly Gly Ala Ile Gly Leu 145 150 155 160 Asn Ala Gly Ala Ser Ala Asn Val Gly Ala Ala Ala Ala Lys Lys Asn 165 170 175 Gly Ala Ile Gly Leu Asn Ser Ala Ala Ser Ala Asn Ala Ala Ala Ala 180 185 190 Ala Ala Lys Lys Gly Gly Ala Ile Gly Leu Asn Ala Gly Ala Ser Ala 195 200 205 Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser Gly Ala Val Gly Leu Asn 210 215 220 Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser Gly 225 230 235 240 Ala Val Ala Ala Asn Ser Ala Ala Ser Ala Asn Ala Ala Ala Ala Ala 245 250 255 Gln Lys Lys Ala Ala Ala Asp Ala Ala Asn Ala Ala Ala Ser Glu Ser 260 265 270 Ala Ala Ala Ala Ala Ala Lys Lys Ala Ala Ala Val Ala Glu Asn Ala 275 280 285 Ala Ala Thr Ala Asn Ala Ala Ser Ala Leu Arg Lys Asn Ala Leu Ala 290 295 300 Ile Ala Ser Asp Ala Ala Ala Val Arg Ala Asp Ala Ala Ala Ala Ala 305 310 315 320 Ala Asp Asp Ala Ala Lys Ala Asn Asn Ala Ala Ser Arg Gly Ser Asp 325 330 335 Gly Leu Thr Ala Arg Ala Asn Ala Ala Thr Leu Ala Ser Asp Ala Ala 340 345 350 Arg Arg Ala Ser Asn Ala Ala Thr Ala Ala Ser Asp Ala Ala Thr Asp 355 360 365 Arg Leu Asn Ala Ala Thr Ala Ala Ser Asn Ala Ala Thr Ala Arg Ala 370 375 380 Asn Ala Ala Thr Arg Ala Asp Asp Ala Ala Thr Asp Ala Asp Asn Ala 385 390 395 400 Ala Ser Lys Ala Ser Asp Val Ser Ala Ile Glu Ala Asp Asn Ala Ala 405 410 415 Arg Ala Ala Asp Ala Asp Ala Ile Ala Thr Asn Arg Ala Ala Glu Ala 420 425 430 Ser Asp Ala Ala Ala Ile Ala Ala Asp Ala Ala Ala Asn Ala Ala Asp 435 440 445 Ala Ala Ala Gln Cys Asn Asn Lys Val Ala Arg Val Ser Asp Ala Leu 450 455 460 Ala Leu Ala Ala Asn Ala Ala Ala Arg Gly Ser Asp Ala Ala Ala Glu 465 470 475 480 Ala Gln Asp Ala Val Ala Arg Ala Ser Asp Ala Ala Ala Ala Gln Ala 485 490 495 Asp Gly Val Ala Ile Ala Val Asn Gly Ala Thr Ala Arg Asp Ser Ala 500 505 510 Ile Glu Ala Ala Ala Thr Ala Gly Ala Ala Gln Ala Lys Ala Ala Gly 515 520 525 Arg Ala Gly Ala Ala Ala Ala Gly Leu Arg Ala Gly Ala Ala Arg Gly 530 535 540 Ala Ala Ala Gly Ser Ala Arg Gly Leu Ala Gly Gly Leu Ala Ala Gly 545 550 555 560 Ser Asn Ala Gly Ile Ala Ala Gly Ala Ala Ser Gly Leu Ala Arg Gly 565 570 575 Ala Ala Ala Glu Val Cys Ala Ala Arg Ile Ala Leu 580 585 <210> 99 <211> 1689 <212> DNA <213> Mallada signata <400> 99 gctgtattga tttctggttc ggctgctggt gcttcctcac acaatgctgc tggtgcagct 60 gcagcagcca gagctgcctt aggcgcttct ggggctgcag gtttaggtgc tgcatctggt 120 gctgcaagaa gaaacgtagc agttggtgct aacggtgccg ccgccgctag tgctgcagct 180 gcagctgcca gacgagctgg cgctattggc ctaaatggag cagctggagc taatgtagct 240 gtcgctggtg gcaaaaaagg aggtgctgct ggattaaatg ctggcgctgg tgcttcttta 300 gtatctgcag ctgcaagacg aaatggagcc cttggactta acggtgcagc tggagcaaat 360 ctcgcagcag ctggtggcaa aaaaggaggt gctattggat taaacgctgg agcatcagcc 420 aatgttggtg ccgctgctgc caagaaaaat ggagccatag gacttaactc agctgcttca 480 gctaatgctg ccgctgccgc tgctaaaaaa ggtggagcca ttggattgaa tgctggagct 540 tcagcaaatg ctgctgctgc cgctgccaag aagagtggag ctgttggatt aaatgctgga 600 gcttctgcta acgctgctgc tgctgctgcc aagaaaagtg gagctgttgc tgccaattcc 660 gctgcttcag caaatgcagc tgctgctgca caaaagaaag ccgctgctga tgccgcaaat 720 gctgctgctt ctgaaagtgc tgctgctgct gcagccaaga aagccgccgc tgttgctgaa 780 aatgcagctg ccaccgccaa tgccgcttca gctttacgta aaaatgcatt agccattgcc 840 agtgatgcag cagctgtccg tgctgatgcc gctgccgccg ccgctgacga tgctgctaaa 900 gctaacaacg ctgcttcccg tggaagtgat ggtttaactg cccgcgccaa tgccgccact 960 ttagccagtg atgctgcccg tagagctagc aatgcagcaa cagctgccag cgatgctgcc 1020 actgaccgat tgaacgccgc caccgctgct agcaacgctg ccactgctcg tgcaaatgcc 1080 gccacacgtg ccgatgatgc cgccactgat gccgacaatg ctgcttcaaa ggccagtgat 1140 gtatcagcta ttgaagccga caacgctgca cgagctgctg atgctgatgc tatcgctacc 1200 aaccgtgccg ctgaagcaag cgatgctgct gctattgccg ctgatgccgc tgccaatgct 1260 gctgatgccg ctgcccaatg taataacaaa gttgcccgag taagtgatgc cttagctctc 1320 gccgctaatg ctgctgcccg aggatctgat gccgccgctg aagctcaaga tgctgttgcc 1380 agagcaagtg acgctgccgc tgcccaagct gatggtgttg ccattgccgt aaatggagct 1440 actgcgagag actcagcaat tgaagccgct gctactgctg gagctgccca agctaaagcc 1500 gctggacgtg ctggagctgc tgcagctggt ttaagagctg gtgccgctag aggtgctgcc 1560 gctggtagtg cccgcggtct agctggagga ttagctgcag gttccaatgc tggaatcgcg 1620 gctggtgcag cttctggatt agcaagaggc gcagctgctg aagtttgcgc agctagaata 1680 gcattgtaa 1689 <210> 100 <211> 1767 <212> DNA <213> Mallada signata <400> 100 atggcagcgt cgaacaaaat catcttcagc tttttagcta ttgttctatt acaacttgcc 60 acacactgtt catcaacagc tgtattgatt tctggttcgg ctgctggtgc ttcctcacac 120 aatgctgctg gtgcagctgc agcagccaga gctgccttag gcgcttctgg ggctgcaggt 180 ttaggtgctg catctggtgc tgcaagaaga aacgtagcag ttggtgctaa cggtgccgcc 240 gccgctagtg ctgcagctgc agctgccaga cgagctggcg ctattggcct aaatggagca 300 gctggagcta atgtagctgt cgctggtggc aaaaaaggag gtgctgctgg attaaatgct 360 ggcgctggtg cttctttagt atctgcagct gcaagacgaa atggagccct tggacttaac 420 ggtgcagctg gagcaaatct cgcagcagct ggtggcaaaa aaggaggtgc tattggatta 480 aacgctggag catcagccaa tgttggtgcc gctgctgcca agaaaaatgg agccatagga 540 cttaactcag ctgcttcagc taatgctgcc gctgccgctg ctaaaaaagg tggagccatt 600 ggattgaatg ctggagcttc agcaaatgct gctgctgccg ctgccaagaa gagtggagct 660 gttggattaa atgctggagc ttctgctaac gctgctgctg ctgctgccaa gaaaagtgga 720 gctgttgctg ccaattccgc tgcttcagca aatgcagctg ctgctgcaca aaagaaagcc 780 gctgctgatg ccgcaaatgc tgctgcttct gaaagtgctg ctgctgctgc agccaagaaa 840 gccgccgctg ttgctgaaaa tgcagctgcc accgccaatg ccgcttcagc tttacgtaaa 900 aatgcattag ccattgccag tgatgcagca gctgtccgtg ctgatgccgc tgccgccgcc 960 gctgacgatg ctgctaaagc taacaacgct gcttcccgtg gaagtgatgg tttaactgcc 1020 cgcgccaatg ccgccacttt agccagtgat gctgcccgta gagctagcaa tgcagcaaca 1080 gctgccagcg atgctgccac tgaccgattg aacgccgcca ccgctgctag caacgctgcc 1140 actgctcgtg caaatgccgc cacacgtgcc gatgatgccg ccactgatgc cgacaatgct 1200 gcttcaaagg ccagtgatgt atcagctatt gaagccgaca acgctgcacg agctgctgat 1260 gctgatgcta tcgctaccaa ccgtgccgct gaagcaagcg atgctgctgc tattgccgct 1320 gatgccgctg ccaatgctgc tgatgccgct gcccaatgta ataacaaagt tgcccgagta 1380 agtgatgcct tagctctcgc cgctaatgct gctgcccgag gatctgatgc cgccgctgaa 1440 gctcaagatg ctgttgccag agcaagtgac gctgccgctg cccaagctga tggtgttgcc 1500 attgccgtaa atggagctac tgcgagagac tcagcaattg aagccgctgc tactgctgga 1560 gctgcccaag ctaaagccgc tggacgtgct ggagctgctg cagctggttt aagagctggt 1620 gccgctagag gtgctgccgc tggtagtgcc cgcggtctag ctggaggatt agctgcaggt 1680 tccaatgctg gaatcgcggc tggtgcagct tctggattag caagaggcgc agctgctgaa 1740 gtttgcgcag ctagaatagc attgtaa 1767 <210> 101 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 101 ggaattctca tgagtttgga ggggccgggc aactcg 36 <210> 102 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 102 cggcggatcc ttattaaaat acgttgctct tcaagt 36 <210> 103 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 103 ggaattctca tgagccgcgt gattaatcac gagtccctg 39 <210> 104 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 104 cggcggatcc ttattattcc aactttgcta catgtatttt c 41 <210> 105 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 105 ggaattccca tgggcgtcga ggaattcaag tcctcg 36 <210> 106 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 106 cggcagatct ttattaaaat tttttatcct caata 35 <210> 107 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 107 ggaattccca tggcaaggga agaggtggag acacgg 36 <210> 108 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 108 cggcggatcc ttattacttc acctcccatt cttcattc 38

Claims

i) 하나 이상의 실크 단백질을 생성하는 세포를 용해시키는 단계,
ii) 실크 단백질을 계면활성제 또는 이온성 액체와 접촉시켜 실크 단백질을 가용화시키는 단계, 및
iii) 실크 단백질을 농축시켜 실크 도프(dope)를 생성하는 단계
를 포함하는 실크 도프의 제조 방법으로서, 상기 하나 이상의 실크 단백질은 코일드 코일(coiled-coil) 구조를 포함하는 삼차 구조를 형성할 수 있는 것인 제조 방법.
제1항에 있어서, 실크 단백질을
a) 계면활성제를 침전시키는 화합물을 첨가함으로써 용액 중 계면활성제의 양을 감소시키는 단계, 및
b) 단계 a)에서 형성된 침전물로부터 실크 단백질을 포함하는 용액을 분리하여 실크 도프를 생성하는 단계
에 의해 농축시키는 것인 제조 방법.
제1항에 있어서, 계면활성제를 침전시키는 화합물이 염 또는 탄수화물, 또는 이들의 2종 이상의 조합인 제조 방법.
제3항에 있어서, 염이 칼륨 염 또는 나트륨 염인 제조 방법.
제1항에 있어서, 실크 단백질을 여과에 의해 농축시키는 것인 제조 방법.
제5항에 있어서, 실크 단백질을 막 여과에 의해 농축시키는 것인 제조 방법.
제6항에 있어서, 막 여과가 접선 유동 여과인 제조 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 실크 도프 중 실크 단백질의 농도를 증가시키는 단계를 추가로 포함하는 제조 방법.
제8항에 있어서, 실크 도프를 탈수(dehydrating) 용액에 대해 투석하는 단계를 포함하는 제조 방법.
제9항에 있어서, 탈수 용액이 흡습성 중합체를 포함하는 것인 제조 방법.
제10항에 있어서, 흡습성 중합체가 폴리에틸렌 글리콜, 아밀라제(amylase) 및 세리신(sericin), 또는 이들의 2종 이상의 조합으로 구성된 군으로부터 선택되는 것인 제조 방법.
제1항 내지 제11항 중 어느 한 항에 있어서, 실크 도프가 약 0.5 중량/부피% 이상의 실크 단백질을 포함하는 것인 제조 방법.
제12항에 있어서, 실크 도프가 약 0.5 중량/부피% 내지 약 15 중량/부피%의 실크 단백질을 포함하는 것인 제조 방법.
제1항 내지 제13항 중 어느 한 항에 있어서, 세포가 박테리아 세포, 효모 세포, 곤충 세포, 식물 세포 또는 동물 세포, 또는 이들의 2종 이상의 조합인 제조 방법.
제14항에 있어서, 세포가 박테리아 세포인 제조 방법.
제1항 내지 제15항 중 어느 한 항에 있어서, 단계 i)이 용해된 세포로부터 봉입체를 단리하는 것을 추가로 포함하는 것인 제조 방법.
제1항 내지 제16항 중 어느 한 항에 있어서, 단계 i) 전에 세포를 배양하는 단계를 추가로 포함하는 제조 방법.
제1항 내지 제17항 중 어느 한 항에 있어서, 코일드 코일 구조를 포함하는 삼차 구조를 형성할 수 있는 실크 단백질의 일부가 10개 카피 이상의 헵타드(heptad) 서열 abcdefg를 포함하고, 이때 위치 a 및 d의 아미노산의 25% 이상이 알라닌 잔기인 제조 방법.
제1항 내지 제18항 중 어느 한 항에 있어서, 실크 단백질이
a) 서열 번호 1, 3, 5, 7, 17, 19, 21, 23, 33, 35, 37, 39, 49, 51, 53, 55, 65, 67, 69, 71, 81, 83, 85, 87 또는 97 중 어느 하나에 제공된 아미노산 서열,
b) 서열 번호 1, 3, 5, 7, 17, 19, 21, 23, 33, 35, 37, 39, 49, 51, 53, 55, 65, 67, 69, 71, 81, 83, 85, 87 또는 97 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및
c) a) 또는 b)의 생물학적 활성 단편
으로부터 선택되는 서열을 포함하는 것인 제조 방법.
제1항 내지 제19항 중 어느 한 항에 있어서, 실크 단백질이
a) 서열 번호 1, 17, 33, 49, 65 또는 81 중 어느 하나에 제공된 아미노산 서열,
b) 서열 번호 1, 17, 33, 49, 65 또는 81 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및
c) a) 또는 b)의 생물학적 활성 단편
을 포함하는 제1 실크 단백질;
d) 서열 번호 3, 19, 35, 51, 67 또는 83 중 어느 하나에 제공된 아미노산 서열,
e) 서열 번호 3, 19, 35, 51, 67 또는 83 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및
f) d) 또는 e)의 생물학적 활성 단편
을 포함하는 제2 실크 단백질;
g) 서열 번호 5, 21, 37, 53, 69 또는 85 중 어느 하나에 제공된 아미노산 서열,
h) 서열 번호 5, 21, 37, 53, 69 또는 85 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및
i) g) 또는 h)의 생물학적 활성 단편
을 포함하는 제3 실크 단백질; 및/또는
j) 서열 번호 7, 23, 39, 55, 71 또는 87 중 어느 하나에 제공된 아미노산 서열,
k) 서열 번호 7, 23, 39, 55, 71 또는 87 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및
l) j) 또는 k)의 생물학적 활성 단편
을 포함하는 제4 실크 단백질을 포함하는 것인 제조 방법.
제20항에 있어서, 제1 실크 단백질, 제2 실크 단백질, 제3 실크 단백질 및/또는 제4 실크 단백질이 동일한 세포에 의해 생성되는 것인 제조 방법.
제20항에 있어서, 제1 실크 단백질, 제2 실크 단백질, 제3 실크 단백질 및/또는 제4 실크 단백질이 상이한 세포에 의해 생성되는 것인 제조 방법.
제20항 내지 제22항 중 어느 한 항에 있어서, 단계 ii)가 대략 등몰량의 제1 실크 단백질, 제2 실크 단백질, 제3 실크 단백질 및 제4 실크 단백질을 포함하는 것인 제조 방법.
제1항 내지 제23항 중 어느 한 항에 있어서, 계면활성제가 음이온성 계면활성제인 제조 방법.
제24항에 있어서, 음이온성 계면활성제가 나트륨 도데실 설페이트(SDS), 암모늄 라우릴 설페이트 또는 다른 알킬 설페이트 염, 나트륨 1-옥탄설포네이트 일수화물, 나트륨 라우로일 사르코시네이트, 나트륨 라우릴 에테르 설페이트(SLES), 나트륨 타우로데옥시콜레이트 수화물, 알킬 벤젠 설포네이트, 또는 이들의 2종 이상의 조합인 제조 방법.
제1항 내지 제23항 중 어느 한 항에 있어서, 이온성 액체가
i) 클로라이드, 브로마이드, 요오다이드, 티오시아네이트, 아세테이트, C₁-C₄-알킬설페이트, 메탄설포네이트, 토실레이트, C₁-C₄-디알킬포스페이트, 하이드로젠설페이트 및 테트라클로로알루미네이트로부터 선택되는 음이온, 및
ii) 1,3-C₁-C₄-디알킬이미다졸륨, 3-클로로피리디늄, 4-디메틸아미노피리디늄, 2-에틸-4-아미노피리디늄, 2-메틸피리디늄, 2-에틸피리디늄, 2-에틸-6-메틸피리디늄, 퀴놀리늄, 이소퀴놀리늄, 피리디늄, 1-C₁-C₄-알킬이미다졸륨, 1-메틸이미다졸륨, 1,2-디메틸이미다졸륨, 1-n-부틸-이미다졸륨, 1,4,5-트리메틸이미다졸륨, 1,4-디메틸이미다졸륨, 이미다졸륨, 2-메틸이미다졸륨, 1-부틸-2-메틸이미다졸륨, 4-메틸이미다졸륨, 1-(2'-아미노에틸)이미다졸륨, 1-비닐이미다졸륨, 2-에틸이미다졸륨 및 벤조트리아졸륨으로부터 선택되는 양이온
을 포함하는 것인 제조 방법.
i) 하나 이상의 실크 단백질을 생성하는 세포 배양물 또는 무세포 발현 시스템으로부터 상청액을 얻는 단계,
ii) 실크 단백질을 계면활성제 또는 이온성 액체와 접촉시켜 실크 단백질을 가용화시키는 단계, 및
iii) 실크 단백질을 농축시켜 실크 도프를 생성하는 단계
를 포함하는 실크 도프의 제조 방법으로서, 상기 하나 이상의 실크 단백질은 코일드 코일 구조를 포함하는 삼차 구조를 형성할 수 있는 것인 제조 방법.
제27항에 있어서, 단계 i)이 상청액으로부터의 실크 단백질의 농도를 증가시키는 것을 추가로 포함하는 것인 제조 방법.
제28항에 있어서, 실크 단백질의 농도를, 상기 상청액을 상기 실크 단백질을 침전시키는 물질과 접촉시킴으로써 증가시키는 것인 제조 방법.
제1항 내지 제29항 중 어느 한 항의 제조 방법에 의해 제조된 실크 도프를 압출 및/또는 연신하는 단계를 포함하는, 실크 섬유의 제조 방법.
제30항에 있어서, 압출이 실크 도프를 약 5 ㎛ 내지 약 500 ㎛의 모세관에 통과시키는 것을 포함하는 것인 제조 방법.
제30항 또는 제31항에 있어서, 실크 도프를 알코올을 포함하는 용액 내로 압출하는 것인 제조 방법.
제32항에 있어서, 알코올이 메탄올이고, 용액 중 메탄올의 농도가 약 40 부피/부피% 내지 약 80 부피/부피%인 제조 방법.
제1항 내지 제29항 중 어느 한 항의 제조 방법에 의해 제조된 실크 도프를 캐스트 성형(casting)하는 단계를 포함하는, 실크 필름의 제조 방법.
제1항 내지 제29항 중 어느 한 항의 제조 방법에 의해 제조된 실크 도프.
제30항 내지 제33항 중 어느 한 항의 제조 방법에 의해 제조된 실크 섬유.
제34항의 제조 방법에 의해 제조된 실크 필름.
제36항의 실크 섬유 및/또는 제37항의 실크 필름을 포함하는 제품.