KR20120076346A - 실크 도프의 제조 방법 - Google Patents
실크 도프의 제조 방법 Download PDFInfo
- Publication number
- KR20120076346A KR20120076346A KR1020127007759A KR20127007759A KR20120076346A KR 20120076346 A KR20120076346 A KR 20120076346A KR 1020127007759 A KR1020127007759 A KR 1020127007759A KR 20127007759 A KR20127007759 A KR 20127007759A KR 20120076346 A KR20120076346 A KR 20120076346A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- ser
- glu
- leu
- lys
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/14—Extraction; Separation; Purification
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43563—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
- C07K14/43572—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from bees
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/14—Extraction; Separation; Purification
- C07K1/16—Extraction; Separation; Purification by chromatography
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/14—Extraction; Separation; Purification
- C07K1/30—Extraction; Separation; Purification by precipitation
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/14—Extraction; Separation; Purification
- C07K1/34—Extraction; Separation; Purification by filtration, ultrafiltration or reverse osmosis
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Insects & Arthropods (AREA)
- Tropical Medicine & Parasitology (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Engineering & Computer Science (AREA)
- Water Supply & Treatment (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Processes Of Treating Macromolecular Substances (AREA)
- Compositions Of Macromolecular Compounds (AREA)
Abstract
본 발명은 꿀벌 실크 단백질과 같은 코일드 코일(coiled-coil) 구조를 갖는 실크 단백질을 포함하는 실크 도프의 제조 방법에 관한 것이다. 상기 실크 단백질은 실크 단백질을 계면활성제 또는 이온성 액체와 접촉시켜 상기 단백질을 가용화시키고 상기 단백질을 농축시켜 실크 도프를 생성함으로써 상기 실크 단백질을 생성하는 세포로부터 얻는다. 상기 단백질은 다양한 목적을 위해, 예를 들면, 개인 관리 제품, 플라스틱, 직물 및 생물의약 제품의 제조에 사용될 수 있다.
Description
본 발명은 꿀벌 실크 단백질과 같은 코일드 코일(coiled-coil) 구조를 갖는 실크 단백질을 포함하는 실크 도프(dope)의 제조 방법에 관한 것이다. 실크 도프는 다양한 목적을 위해, 예컨대, 개인 관리 제품, 플라스틱, 직물 및 생물의약 제품의 제조에 사용될 수 있다.
실크는 넓은 범위의 곤충 및 거미 종에 의해 생성되는 단백질 섬유이다. 사육되는 누에인 누에나방(Bombyx mon)의 실크는 수세기 동안 봉합 생체물질로서 사용되어 왔다. 형질전환 시스템에서 누에 또는 거미 실크를 클로닝하고 발현하고자 하는 다수의 노력은 이것이 매우 어려운 과제임을 발견하였다. 이들 실크 유전자들의 큰 크기 및 고도로 반복적인 서열들은 상기 유전자들이 전문화된 실크선(silk gland) 외부에서 발현되기 어렵게 하고 낮은 단백질 수율을 초래한다.
누에고치 및 거미집이 가장 우수한 공지된 실크이지만, 다른 종들이 형질전환 제조에 더 적합한 실크를 제조할 수 있다. 꿀벌 유충들(아피스 멜리페라(Apis mellifera))은 실크 누에를 짓고, 이 실크 누에에서 이들은 번데기가 된다. 꿀벌 실크는 4종의 작고(각각 약 30kDa) 비반복적인 섬유 유전자들에 의해 코딩된다(Sutherland et al., 2006). 4종의 유전자들의 상동성 세트 또한 땅벌, 불독개미, 베짜기 개미, 호박벌 및 아시아 꿀벌에서 발견되었다(Sutherland et al., 2007; Sezutsu et al., 2007; Shi et al., 2008; 국제 특허공보 제WO 2007/038837호).
고전적인 x-선 섬유 회절 작업은 꿀벌 실크가 4종의 상이한 실크 단백질에 상응할 것 같은 4개의 스트랜드를 갖는 코일드 코일 구조, 가장 가능하게는 사량체 코일드 코일 구조(Atkins, 1967)로 조립된 α-나선형 단백질을 함유함을 입증하였다. 생물정보학 기법은 각각의 꿀벌 실크 단백질 서열이 60% 내지 68% 코일드 코일을 함유한다고 예측한다(Sutherland et al., 2006).
실크 실은 꿀벌 유충의 실크선으로부터 손에 의해 연신될 수 있다. 이 실은 덜 강하지만 더 연장가능하고 누에 실크 섬유보다 더 질기다(Hepburn et al., 1979).
쉬(Shi) 등(2008)은 아시아 꿀벌 실크(아피스 세라나(Apis cerana))의 재조합 제조를 최근에 보고하였다. 4종의 아피스 세라나 실크 단백질들이 발효액 1 ℓ당 10 mg 내지 60 mg의 수율로 에스케리치아 콜라이(Escherichia coli)에서 가용성 형태로 발현되었다. 저농도(0.03 중량% 내지 0.2 중량%)에서 단백질의 구조 및 상호작용을 특징규명하기 위해 다양한 실험 기법들이 이용되었다. 이들은 결론적으로 개개의 단백질 및 4종의 단백질의 혼합물 중 어느 것도 용액 중에서 단단한 삼차 팩킹을 갖지 않음을 입증하였다. 상기 단백질들은 단량체로서 존재하거나 느슨하게 결합된 이량체로서 존재하였고 α-나선형 구조를 거의 갖지 않는 랜덤-코일(random-coil) 구조를 우세하게 가졌다.
매우 다양한 제품의 제조를 위해 사용될 수 있는 재조합적으로 발현된 코일드 코일 실크 단백질로부터 실크 도프를 제조하는 추가 방법이 필요하다.
본 발명자들은 놀랍게도 계면활성제 및 이온성 액체가 코일드 코일 실크 단백질을 포함하는 실크 도프를 제조하는 공정에서 사용될 수 있음을 발견하였다.
제1 양태에서, 본 발명은
i) 하나 이상의 실크 단백질을 생성하는 세포를 용해시키는 단계,
ii) 실크 단백질을 계면활성제 또는 이온성 액체와 접촉시켜 실크 단백질을 가용화시키는 단계, 및
iii) 실크 단백질을 농축시켜 실크 도프를 생성하는 단계
를 포함하는 실크 단백질의 제조 방법으로서, 상기 하나 이상의 실크 단백질이 코일드 코일 구조를 포함하는 삼차 구조를 형성할 수 있는 것인 제조 방법을 제공한다.
한 실시양태에서, 상기 실크 단백질을
a) 계면활성제를 침전시키는 화합물을 첨가함으로써 용액 중 계면활성제의 양을 감소시키는 단계, 및
b) 단계 a)에서 형성된 침전물로부터 실크 단백질을 포함하는 용액을 분리하여 실크 도프를 생성하는 단계
에 의해 농축시킨다.
게면활성제를 침전시키는 데 사용될 수 있는 화합물은 당업계에 공지되어 있고 염 또는 탄수화물, 또는 이들의 2종 이상의 조합을 포함한다. 바람직하게는, 염은 칼륨 염 또는 나트륨 염이다. 한 실시양태에서, 탄수화물은 α-시클로덱스트린이다.
한 실시양태에서, 실크 단백질을 여과, 더욱 바람직하게는 막 여과, 훨씬 더욱 바람직하게는 접선 유동 여과에 의해 농축시킨다.
한 실시양태에서, 본 방법은 실크 도프 중 실크 단백질의 농도를 증가시키는 단계를 추가로 포함한다. 이것은 당업계에 공지된 임의의 방법에 의해 달성될 수 있다. 예를 들면, 실크 도프를 탈수(dehydrating) 용액, 예컨대, 흡습성 중합체를 포함하는 용액에 대해 투석시킨다. 흡습성 중합체의 예에는 폴리에틸렌 글리콜, 아밀라제(amylase) 및 세리신(sericin)뿐만 아니라 이들의 2종 이상의 조합도 포함하나, 이들로 한정되지 않는다.
바람직한 실시양태에서, 실크 도프는 약 0.5 중량/부피% 이상의 실크 단백질을 포함한다. 추가 실시양태에서, 실크 도프는 약 0.5% 내지 약 15%의 실크 단백질을 포함한다.
세포는 임의의 종류의 세포, 전형적으로 실크 단백질(들)을 코딩하고 생성할 수 있는 외인성(exogenous) 폴리뉴클레오티드를 포함하는 재조합 세포일 수 있다. 예에는 박테리아 세포, 효모 세포, 곤충 세포, 식물 세포 또는 동물 세포, 또는 이들의 2종 이상의 조합이 포함되나, 이들로 한정되지 않는다. 바람직한 실시양태에서, 세포는 박테리아 세포이다. 특히 바람직한 실시양태에서, 박테리아 세포는 에스케리치아 콜라이이다.
바람직한 실시양태에서, 단계 i)는 용해된 세포로부터 봉입체(inclusion body)를 단리하는 것을 추가로 포함한다.
본 방법은 단계 i) 전에 세포를 배양하는 단계를 포함할 수도 있다.
바람직한 실시양태에서, 코일드 코일 구조를 포함하는 삼차 구조를 형성할 수 있는 실크 단백질의 일부는 10개 카피 이상의 헵타드(heptad) 서열 abcdefg를 포함하고, 이때 위치 a 및 d의 아미노산의 25% 이상이 알라닌 잔기이다. 더욱 바람직하게는, 위치 a, d 및 e의 아미노산의 25% 이상이 알라닌 잔기이다.
추가의 바람직한 실시양태에서, 실크 단백질은
a) 서열 번호 1 내지 8, 17 내지 24, 33 내지 40, 49 내지 56, 65 내지 72, 81 내지 88, 97 또는 98 중 어느 하나에 제공된 아미노산 서열,
b) 서열 번호 1 내지 8, 17 내지 24, 33 내지 40, 49 내지 56, 65 내지 72, 81 내지 88, 97 또는 98 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및
c) a) 또는 b)의 생물학적 활성 단편
으로부터 선택되는 서열을 포함하고, 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 본질적으로 구성되고, 훨씬 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 구성된다.
상기 양태에서, 가능한 적은 실크 단백질이 세포로부터 분비되는 것이 바람직하다. 따라서, 실크 단백질이 N-말단 분비 서열을 포함하지 않는 것이 바람직하다. 상기 양태에 특히 유용한 실크 단백질의 예에는
a) 서열 번호 1, 3, 5, 7, 17, 19, 21, 23, 33, 35, 37, 39, 49, 51, 53, 55, 65, 67, 69, 71, 81, 83, 85, 87 또는 97 중 어느 하나에 제공된 아미노산 서열,
b) 서열 번호 1, 3, 5, 7, 17, 19, 21, 23, 33, 35, 37, 39, 49, 51, 53, 55, 65, 67, 69, 71, 81, 83, 85, 87 또는 97 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및
c) a) 또는 b)의 생물학적 활성 단편
으로부터 선택되는 서열을 포함하는, 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 구성된 실크 단백질이 포함되나, 이들로 한정되지 않는다.
한 실시양태에서, 실크 단백질은 복수의 동일한 실크 단백질 또는 2종 이상의 상이한 실크 단백질들의 조합일 수 있다. 바람직한 실시양태에서, 상이한 실크 단백질들이 사용되는 경우, 4종의 상이한 실크 단백질들이 존재한다.
추가 실시양태에서, 실크 단백질은
a) 서열 번호 1, 2, 17, 18, 33, 34, 49, 50, 65, 66, 81 또는 82 중 어느 하나에 제공된 아미노산 서열;
b) 서열 번호 1, 2, 17, 18, 33, 34, 49, 50, 65, 66, 81 또는 82 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및
c) a) 또는 b)의 생물학적 활성 단편
을 포함하는, 더욱 바람직하게는 상기 a) 내지 c)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 a) 내지 c)로 구성된 제1 실크 단백질,
d) 서열 번호 3, 4, 19, 20, 35, 36, 51, 52, 67, 68, 83 또는 84 중 어느 하나에 제공된 아미노산 서열;
e) 서열 번호 3, 4, 19, 20, 35, 36, 51, 52, 67, 68, 83 또는 84 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및
f) d) 또는 e)의 생물학적 활성 단편
을 포함하는, 더욱 바람직하게는 상기 d) 내지 f)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 d) 내지 f)로 구성된 제2 실크 단백질,
g) 서열 번호 5, 6, 21, 22, 37, 38, 53, 54, 69, 70, 85 또는 86 중 어느 하나에 제공된 아미노산 서열;
h) 서열 번호 5, 6, 21, 22, 37, 38, 53, 54, 69, 70, 85 또는 86 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및
i) g) 또는 h)의 생물학적 활성 단편
을 포함하는, 더욱 바람직하게는 상기 g) 내지 i)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 g) 내지 i)로 구성된 제3 실크 단백질, 및/또는
j) 서열 번호 7, 8, 23, 24, 39, 40, 55, 56, 71, 72, 87 또는 88 중 어느 하나에 제공된 아미노산 서열;
k) 서열 번호 7, 8, 23, 24, 39, 40, 55, 56, 71, 72, 87 또는 88 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및
l) j) 또는 k)의 생물학적 활성 단편
을 포함하는, 더욱 바람직하게는 상기 j) 내지 l)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 j) 내지 l)로 구성된 제4 실크 단백질
을 포함한다. 더욱 바람직하게는 상기 양태와 관련하여, 실크 단백질은
a) 서열 번호 1, 17, 33, 49, 65 또는 81 중 어느 하나에 제공된 아미노산 서열;
b) 서열 번호 1, 17, 33, 49, 65 또는 81 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및
c) a) 또는 b)의 생물학적 활성 단편
을 포함하는, 더욱 바람직하게는 상기 a) 내지 c)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 a) 내지 c)로 구성된 제1 실크 단백질,
d) 서열 번호 3, 19, 35, 51, 67 또는 83 중 어느 하나에 제공된 아미노산 서열;
e) 서열 번호 3, 19, 35, 51, 67 또는 83 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및
f) d) 또는 e)의 생물학적 활성 단편
을 포함하는, 더욱 바람직하게는 상기 d) 내지 f)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 d) 내지 f)로 구성된 제2 실크 단백질,
g) 서열 번호 5, 21, 37, 53, 69 또는 85 중 어느 하나에 제공된 아미노산 서열;
h) 서열 번호 5, 21, 37, 53, 69 또는 85 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및
i) g) 또는 h)의 생물학적 활성 단편
을 포함하는, 더욱 바람직하게는 상기 g) 내지 i)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 g) 내지 i)로 구성된 제3 실크 단백질, 및/또는
j) 서열 번호 7, 23, 39, 55, 71 또는 87 중 어느 하나에 제공된 아미노산 서열;
k) 서열 번호 7, 23, 39, 55, 71 또는 87 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및
l) j) 또는 k)의 생물학적 활성 단편
을 포함하는, 더욱 바람직하게는 상기 j) 내지 l)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 j) 내지 l)로 구성된 제4 실크 단백질
을 포함하거나 이 실크 단백질들로 본질적으로 구성된다.
한 실시양태에서, 제1 실크 단백질, 제2 실크 단백질, 제3 실크 단백질 및/또는 제4 실크 단백질은 동일한 세포에 의해 생성된다.
대안적 실시양태에서, 제1 실크 단백질, 제2 실크 단백질, 제3 실크 단백질 및/또는 제4 실크 단백질은 상이한 세포에 의해 생성된다. 이 실시양태에서, 단계 ii)는 대략 등몰량의 제1 실크 단백질, 제2 실크 단백질, 제3 실크 단백질 및 제4 실크 단백질을 포함하는 것이 바람직하다.
단계 iii)을 제외하고 상기 단계에 이르는 임의의 시점에서, 본 발명에 따라 가공되는 실크 단백질들은 독립적으로 제조되어 조합될 수 있다. 개별적으로 제조된 실크 단백질들은 동일하거나 상이할 수 있다. 예를 들면, 본 명세서에서 정의된 제1 실크 단백질은 제1 세포에서 발현되고 단계 i) 및 ii)에서 정의된 바와 같이 가공되고, 본 명세서에서 정의된 제2 실크 단백질은 제2 세포에서 발현되고 단계 i) 및 ii)에서 정의된 바와 같이 가공된 후, 단계 iii) 전에 2종의 용액의 조합이 수행된다.
계면활성제 및 이온성 액체는 후기 단계 동안에 코일드 코일 구조가 형성될 수 있게 하면서 침전된 단백질을 가용화시키고 실크 단백질이 용액 중에 머물러 있게 할 수 있다.
바람직한 실시양태에서, 계면활성제는 음이온성 계면활성제이다. 본 발명에 유용한 음이온성 계면활성제의 예에는 나트륨 도데실 설페이트(SDS), 암모늄 라우릴 설페이트 및 다른 알킬 설페이트 염, 나트륨 1-옥탄설포네이트 일수화물, 나트륨 라우로일 사르코시네이트, 나트륨 라우릴 에테르 설페이트(SLES), 나트륨 타우로데옥시콜레이트 수화물 및 알킬 벤젠 설포네이트; 및 이들의 2종 이상의 조합이 포함되나, 이들로 한정되지 않는다. 바람직한 실시양태에서, 음이온성 계면활성제는 SDS이다.
한 실시양태에서, 이온성 액체는
i) 클로라이드, 브로마이드, 요오다이드, 티오시아네이트, 아세테이트, C1-C4-알킬설페이트, 메탄설포네이트, 토실레이트, C1-C4-디알킬포스페이트, 하이드로젠설페이트 및 테트라클로로알루미네이트로부터 선택되는 음이온, 및
ii) 1,3-C1-C4-디알킬이미다졸륨, 3-클로로피리디늄, 4-디메틸아미노피리디늄, 2-에틸-4-아미노피리디늄, 2-메틸피리디늄, 2-에틸피리디늄, 2-에틸-6-메틸피리디늄, 퀴놀리늄, 이소퀴놀리늄, 피리디늄, 1-C1-C4-알킬이미다졸륨, 1-메틸이미다졸륨, 1,2-디메틸이미다졸륨, 1-n-부틸-이미다졸륨, 1,4,5-트리메틸이미다졸륨, 1,4-디메틸이미다졸륨, 이미다졸륨, 2-메틸이미다졸륨, 1-부틸-2-메틸이미다졸륨, 4-메틸이미다졸륨, 1-(2'-아미노에틸)이미다졸륨, 1-비닐이미다졸륨, 2-에틸이미다졸륨 및 벤조트리아졸륨으로부터 선택되는 양이온
을 포함한다.
추가의 바람직한 실시양태에서, 본 방법은 배양된 세포 1 ℓ당 약 0.1 g 이상, 더욱 바람직하게는 약 1 g 이상, 더욱 바람직하게는 약 1.5 g 이상, 더욱 바람직하게는 약 2 g 이상, 훨씬 더욱 바람직하게는 약 2.5 g 이상의 실크 단백질을 생성한다.
또 다른 양태에서, 본 발명은
i) 하나 이상의 실크 단백질을 생성하는 세포 배양물 또는 무세포 발현 시스템으로부터 상청액을 얻는 단계,
ii) 실크 단백질을 계면활성제 또는 이온성 액체와 접촉시켜 실크 단백질을 가용화시키는 단계, 및
iii) 실크 단백질을 농축시켜 실크 도프를 생성하는 단계
를 포함하는 실크 도프의 제조 방법으로서, 상기 하나 이상의 실크 단백질은 코일드 코일 구조를 포함하는 삼차 구조를 형성할 수 있는 것인 제조 방법을 제공한다.
이 양태에서, 세포 내의 실크 단백질을 사용하여 실크 도프를 생성하는 대신에, 세포로부터 분비된 실크 단백질을 사용한다. 당업자가 인식할 수 있는 바와 같이, 제1 양태의 단계 i) 및 상기 양태의 단계 i)는 동시에 또는 순차적으로 수행될 수 있다. 나아가, 임의의 상응하는 단계에서 세포 및 상청액으로부터 유래된 실크 단백질들이 조합되어 함께 가공될 수 있다. 예를 들면, 제1 양태의 단계 ii) 및 상기 양태의 단계 ii)는 개별적으로 수행될 수 있고 실크 단백질들은 단계 iii) 및 iv)를 포함하는 추가 가공을 위해 조합될 수 있다.
상기 양태의 특히 바람직한 실시양태에서, 단계 i)는 상청액으로부터의 실크 단백질의 농도를 증가시키는 것을 추가로 포함한다. 이것은 당업계에 공지된 임의의 방법에 의해, 예를 들면, 실크 단백질을 침전시키는 물질, 예컨대, 황산암모늄, 트리클로로아세트산, 과염소산 및 아세톤(그러나, 이들로 한정되지 않음)을 상청액과 접촉시킴에 의해 달성될 수 있다.
상기 양태와 관련하여, 가능한 많은 실크 단백질이 세포로부터 분비되는 것이 바람직하다. 따라서, 실크 단백질은 N-말단 신호 서열을 포함하는 것이 바람직하다. 상기 양태에 특히 유용한 실크 단백질의 예에는
a) 서열 번호 2, 4, 6, 8, 18, 20, 22, 24, 34, 36, 38, 40, 50, 52, 54, 56, 66, 68, 70, 72, 82, 84, 86, 88 또는 98 중 어느 하나에 제공된 아미노산 서열,
b) 서열 번호 2, 4, 6, 8, 18, 20, 22, 24, 34, 36, 38, 40, 50, 52, 54, 56, 66, 68, 70, 72, 82, 84, 86, 88 또는 98 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및
c) a) 또는 b)의 생물학적 활성 단편
으로부터 선택되는 서열을 포함하는, 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 구성된 실크 단백질을 포함하나, 이들로 한정되지 않는다.
추가 실시양태에서, 실크 단백질은
a) 서열 번호 2, 18, 34, 50, 66 또는 82 중 어느 하나에 제공된 아미노산 서열;
b) 서열 번호 2, 18, 34, 50, 66 또는 82 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및
c) a) 또는 b)의 생물학적 활성 단편
을 포함하는, 더욱 바람직하게는 상기 a) 내지 c)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 a) 내지 c)로 구성된 제1 실크 단백질,
d) 서열 번호 4, 20, 36, 52, 68 또는 84 중 어느 하나에 제공된 아미노산 서열;
e) 서열 번호 4, 20, 36, 52, 68 또는 84 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및
f) d) 또는 e)의 생물학적 활성 단편
을 포함하는, 더욱 바람직하게는 상기 d) 내지 f)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 d) 내지 f)로 구성된 제2 실크 단백질,
g) 서열 번호 6, 22, 38, 54, 70 또는 86 중 어느 하나에 제공된 아미노산 서열;
h) 서열 번호 6, 22, 38, 54, 70 또는 86 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및
i) g) 또는 h)의 생물학적 활성 단편
을 포함하는, 더욱 바람직하게는 상기 g) 내지 i)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 g) 내지 i)로 구성된 제3 실크 단백질, 및/또는
j) 서열 번호 8, 24, 40, 56, 72 또는 88 중 어느 하나에 제공된 아미노산 서열;
k) 서열 번호 8, 24, 40, 56, 72 또는 88 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열; 및
l) j) 또는 k)의 생물학적 활성 단편
을 포함하는, 더욱 바람직하게는 상기 j) 내지 l)로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 j) 내지 l)로 구성된 제4 실크 단백질
을 포함한다.
추가 양태에서, 본 발명은 본 발명의 방법에 의해 제조된 실크 도프를 압출 및/또는 연신하는 단계를 포함하는, 실크 섬유의 제조 방법을 제공한다.
한 실시양태에서, 압출은 상기 실크 도프를 약 5 ㎛ 내지 약 500 ㎛ 모세관에 통과시키는 것을 포함한다.
특히 바람직한 실시양태에서, 상기 방법은
i) 하나 이상의 실크 단백질을 생성하는 세포를 용해시키고 상기 세포로부터 봉입체를 단리하는 단계,
ii) 상기 봉입체 내의 실크 단백질을 계면활성제 또는 이온성 액체와 접촉시켜 실크 단백질을 가용화시키는 단계,
iii) 실크 단백질을 농축시켜 실크 도프를 생성하는 단계,
iv) 실크 도프 중 실크 단백질의 농도를 약 2 중량% 내지 약 10 중량% 실크 단백질, 더욱 바람직하게는 약 3 중량% 내지 약 6 중량% 실크 단백질로 증가시키는 단계, 및
vi) 탈수 용액 중 실크 도프를 압출하는 단계
를 포함한다.
상기 실시양태와 관련하여, 탈수 용액은 바람직하게는 알코올, 예컨대, 메탄올 또는 에탄올, 또는 고농도의 염, 예컨대, MgCl2 또는 NaCl을 포함한다. 이러한 조건 하에 실크 섬유를 압출하는 것은 습식 방적으로서 당업계에 일반적으로 공지되어 있다.
바람직하게는, 알코올은 메탄올이고, 용액 중 메탄올의 농도는 약 40 부피/부피% 내지 약 80 부피/부피%, 더욱 바람직하게는 약 50 부피/부피% 내지 약 70 부피/부피%이다. 본 실시양태에서, 실크 도프는 본 명세서에서 정의된 단일 종류의 실크 폴리펩티드, 또는 2종 이상의 상이한, 예컨대, 4종의 상이한 실크 폴리펩티드를 포함할 수 있다.
또 다른 양태에서, 본 발명은 본 발명의 방법에 의해 제조된 실크 도프를 캐스트 성형(casting)하는 단계를 포함하는 실크 필름의 제조 방법을 제공한다.
또 다른 양태에서, 본 발명은 본 발명의 방법에 의해 제조된 실크 도프를 제공한다.
추가 양태에서, 본 발명은 본 발명의 방법에 의해 제조된 실크 섬유를 제공한다.
또한, 본 발명의 방법에 의해 제조된 실크 필름이 제공된다.
또 다른 양태에서, 본 발명은 본 발명의 실크 섬유 및/또는 실크 필름을 포함하는 제품을 제공한다.
자명할 바와 같이, 본 발명의 한 양태의 바람직한 특징 및 특성은 본 발명의 많은 다른 양태에 적용될 수 있다.
본 명세서 전체에서 용어 "포함한다", 또는 이의 변형 용어, 예컨대, "포함하는"은 기재된 요소, 정수 또는 단계, 또는 요소들, 정수들 또는 단계들의 군을 포함하는 것을 의미하는 것으로 이해될 것이나, 임의의 다른 요소, 정수 또는 단계, 또는 요소들, 정수들 또는 단계들의 군을 배제하지 않는다.
이하, 본 발명을 첨부된 도면을 참조하면서 하기 비제한적 실시예에 의해 설명할 것이다.
도 1: SDS에서 가용화된 정제된 봉입체의 SDS-PAGE. 레인들은 재조합 단백질 AmelFl-4에 상응하고; 크기는 kDa의 단백질 중량이다.
도 2: 천연 꿀벌 실크(A) 및 재조합 꿀벌 실크(B)의 적외선 스펙트럼의 아미드 I 및 II 영역의 푸리에 자가 탈회전(deconvolution). 밴드를 구조로 배정하는 것은 표 2에서 발견된다.
도 3: (A) 공기 중에서 연신된 재조합 꿀벌 실크 섬유, 및 공기 중에서 연신된 후 메탄올 중에서 다시 한번 연신된 재조합 꿀벌 실크 섬유의 교차-편광 현미경.
도 4: (A) 메탄올 배쓰(bath) 내로 압출된 재조합 꿀벌 실크 섬유, 및 (B) 공기 중에서 건조된 후 메탄올 배쓰 내에서 2배 길이로 다시 한번 연신된 재조합 꿀벌 실크 섬유 또는 (C) 공기 중에서 건조된 후 메탄올 배쓰 내에서 4배 길이로 다시 한번 연신된 재조합 꿀벌 실크 섬유의 교차-편광 현미경.
도 2: 천연 꿀벌 실크(A) 및 재조합 꿀벌 실크(B)의 적외선 스펙트럼의 아미드 I 및 II 영역의 푸리에 자가 탈회전(deconvolution). 밴드를 구조로 배정하는 것은 표 2에서 발견된다.
도 3: (A) 공기 중에서 연신된 재조합 꿀벌 실크 섬유, 및 공기 중에서 연신된 후 메탄올 중에서 다시 한번 연신된 재조합 꿀벌 실크 섬유의 교차-편광 현미경.
도 4: (A) 메탄올 배쓰(bath) 내로 압출된 재조합 꿀벌 실크 섬유, 및 (B) 공기 중에서 건조된 후 메탄올 배쓰 내에서 2배 길이로 다시 한번 연신된 재조합 꿀벌 실크 섬유 또는 (C) 공기 중에서 건조된 후 메탄올 배쓰 내에서 4배 길이로 다시 한번 연신된 재조합 꿀벌 실크 섬유의 교차-편광 현미경.
서열목록에 대한 설명
서열 번호 1 - 본 명세서에서 제노스피랄(Xenospiral)로 지칭되는 꿀벌 실크 단백질(본 명세서에서 AmelFl로도 지칭됨)(신호 펩티드 부재).
서열 번호 2 - 본 명세서에서 제노스피랄로 지칭되는 꿀벌 실크 단백질.
서열 번호 3 - 본 명세서에서 제노스피라2(Xenospira2)로 지칭되는 꿀벌 실크 단백질(본 명세서에서 AmelF2로도 지칭됨)(신호 펩티드 부재).
서열 번호 4 - 본 명세서에서 제노스피라2로 지칭되는 꿀벌 실크 단백질.
서열 번호 5 - 본 명세서에서 제노스피라3으로 지칭되는 꿀벌 실크 단백질(본 명세서에서 AmelF3으로도 지칭됨)(신호 펩티드 부재).
서열 번호 6 - 본 명세서에서 제노스피라3으로 지칭되는 꿀벌 실크 단백질.
서열 번호 7 - 본 명세서에서 제노스피라4로 지칭되는 꿀벌 실크 단백질(본 명세서에서 AmelF4로도 지칭됨)(신호 펩티드 부재).
서열 번호 8 - 본 명세서에서 제노스피라4로 지칭되는 꿀벌 실크 단백질.
서열 번호 9 - 꿀벌 실크 단백질 제노스피랄을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 10 - 꿀벌 실크 단백질 제노스피랄을 코딩하는 뉴클레오티드 서열.
서열 번호 11 - 꿀벌 실크 단백질 제노스피라2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 12 - 꿀벌 실크 단백질 제노스피라2를 코딩하는 뉴클레오티드 서열.
서열 번호 13 - 꿀벌 실크 단백질 제노스피라3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 14 - 꿀벌 실크 단백질 제노스피라3을 코딩하는 뉴클레오티드 서열.
서열 번호 15 - 꿀벌 실크 단백질 제노스피라4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 16 - 꿀벌 실크 단백질 제노스피라4를 코딩하는 뉴클레오티드 서열.
서열 번호 17 - 본 명세서에서 BBF1로 지칭되는 땅벌 실크 단백질(신호 펩티드 부재).
서열 번호 18 - 본 명세서에서 BBF1로 지칭되는 땅벌 실크 단백질.
서열 번호 19 - 본 명세서에서 BBF2로 지칭되는 땅벌 실크 단백질(신호 펩티드 부재).
서열 번호 20 - 본 명세서에서 BBF2로 지칭되는 땅벌 실크 단백질.
서열 번호 21 - 본 명세서에서 BBF3으로 지칭되는 땅벌 실크 단백질(신호 펩티드 부재).
서열 번호 22 - 본 명세서에서 BBF3으로 지칭되는 땅벌 실크 단백질.
서열 번호 23 - 본 명세서에서 BBF4로 지칭되는 땅벌 실크 단백질(신호 펩티드 부재).
서열 번호 24 - 본 명세서에서 BBF4로 지칭되는 땅벌 실크 단백질.
서열 번호 25 - 땅벌 실크 단백질 BBF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 26 - 땅벌 실크 단백질 BBF1을 코딩하는 뉴클레오티드 서열.
서열 번호 27 - 땅벌 실크 단백질 BBF2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 28 - 땅벌 실크 단백질 BBF2를 코딩하는 뉴클레오티드 서열.
서열 번호 29 - 땅벌 실크 단백질 BBF3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 30 - 땅벌 실크 단백질 BBF3을 코딩하는 뉴클레오티드 서열.
서열 번호 31 - 땅벌 실크 단백질 BBF4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 32 - 땅벌 실크 단백질 BBF4를 코딩하는 뉴클레오티드 서열.
서열 번호 33 - 본 명세서에서 BAF1로 지칭되는 불독개미 실크 단백질(신호 펩티드 부재).
서열 번호 34 - 본 명세서에서 BAF1로 지칭되는 불독개미 실크 단백질.
서열 번호 35 - 본 명세서에서 BAF2로 지칭되는 불독개미 실크 단백질(신호 펩티드 부재).
서열 번호 36 - 본 명세서에서 BAF2로 지칭되는 불독개미 실크 단백질.
서열 번호 37 - 본 명세서에서 BAF3으로 지칭되는 불독개미 실크 단백질(신호 펩티드 부재).
서열 번호 38 - 본 명세서에서 BAF3으로 지칭되는 불독개미 실크 단백질.
서열 번호 39 - 본 명세서에서 BAF4로 지칭되는 불독개미 실크 단백질(신호 펩티드 부재).
서열 번호 40 - 본 명세서에서 BAF4로 지칭되는 불독개미 실크 단백질.
서열 번호 41 - 불독개미 실크 단백질 BAF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 42 - 불독개미 실크 단백질 BAF1을 코딩하는 뉴클레오티드 서열.
서열 번호 43 - 불독개미 실크 단백질 BAF2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 44 - 불독개미 실크 단백질 BAF2를 코딩하는 뉴클레오티드 서열.
서열 번호 45 - 불독개미 실크 단백질 BAF3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 46 - 불독개미 실크 단백질 BAF3을 코딩하는 뉴클레오티드 서열.
서열 번호 47 - 불독개미 실크 단백질 BAF4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 48 - 불독개미 실크 단백질 BAF4를 코딩하는 뉴클레오티드 서열.
서열 번호 49 - 본 명세서에서 GAF1로 지칭되는 베짜기 개미 실크 단백질(신호 펩티드 부재).
서열 번호 50 - 본 명세서에서 GAF1로 지칭되는 베짜기 개미 실크 단백질.
서열 번호 51 - 본 명세서에서 GAF2로 지칭되는 베짜기 개미 실크 단백질(신호 펩티드 부재).
서열 번호 52 - 본 명세서에서 GAF2로 지칭되는 베짜기 개미 실크 단백질.
서열 번호 53 - 본 명세서에서 GAF3으로 지칭되는 베짜기 개미 실크 단백질(신호 펩티드 부재).
서열 번호 54 - 본 명세서에서 GAF3으로 지칭되는 베짜기 개미 실크 단백질.
서열 번호 55 - 본 명세서에서 GAF4로 지칭되는 베짜기 개미 실크 단백질(신호 펩티드 부재).
서열 번호 56 - 본 명세서에서 GAF4로 지칭되는 베짜기 개미 실크 단백질.
서열 번호 57 - 베짜기 개미 실크 단백질 GAF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 58 - 베짜기 개미 실크 단백질 GAF1을 코딩하는 뉴클레오티드 서열.
서열 번호 59 - 베짜기 개미 실크 단백질 GAF2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 60 - 베짜기 개미 실크 단백질 GAF2를 코딩하는 뉴클레오티드 서열.
서열 번호 61 - 베짜기 개미 실크 단백질 GAF3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 62 - 베짜기 개미 실크 단백질 GAF3을 코딩하는 뉴클레오티드 서열.
서열 번호 63 - 베짜기 개미 실크 단백질 GAF4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 64 - 베짜기 개미 실크 단백질 GAF4를 코딩하는 뉴클레오티드 서열,
서열 번호 65 - 본 명세서에서 Vssilk3으로 지칭되는 호박벌 실크 단백질(신호 펩티드 부재).
서열 번호 66 - 본 명세서에서 Vssilk3으로 지칭되는 호박벌 실크 단백질.
서열 번호 67 - 본 명세서에서 Vssilk4로 지칭되는 호박벌 실크 단백질(신호 펩티드 부재).
서열 번호 68 - 본 명세서에서 Vssilk4로 지칭되는 호박벌 실크 단백질.
서열 번호 69 - 본 명세서에서 Vssilk2로 지칭되는 호박벌 실크 단백질(신호 펩티드 부재).
서열 번호 70 - 본 명세서에서 Vssilk2로 지칭되는 호박벌 실크 단백질.
서열 번호 71 - 본 명세서에서 Vssilk1로 지칭되는 호박벌 실크 단백질(신호 펩티드 부재).
서열 번호 72 - 본 명세서에서 Vssilk1로 지칭되는 호박벌 실크 단백질.
서열 번호 73 - 호박벌 실크 단백질 Vssilk3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 74 - 호박벌 실크 단백질 Vssilk3을 코딩하는 뉴클레오티드 서열.
서열 번호 75 - 호박벌 실크 단백질 Vssilk4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 76 - 호박벌 실크 단백질 Vssilk4를 코딩하는 뉴클레오티드 서열.
서열 번호 77 - 호박벌 실크 단백질 Vssilk2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 78 - 호박벌 실크 단백질 Vssilk2를 코딩하는 뉴클레오티드 서열.
서열 번호 79 - 호박벌 실크 단백질 Vssilk1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 80 - 호박벌 실크 단백질 Vssilk1을 코딩하는 뉴클레오티드 서열.
서열 번호 81 - 실크 단백질 1로 지칭되는 아시아 꿀벌 실크 단백질(ABS1로도 지칭됨)(신호 펩티드 부재).
서열 번호 82 - 실크 단백질 1로 지칭되는 아시아 꿀벌 실크 단백질(ABS1로도 지칭됨).
서열 번호 83 - 실크 단백질 2로 지칭되는 아시아 꿀벌 실크 단백질(ABS2로도 지칭됨)(신호 펩티드 부재).
서열 번호 84 - 실크 단백질 2로 지칭되는 아시아 꿀벌 실크 단백질(ABS2로도 지칭됨).
서열 번호 85 - 실크 단백질 3으로 지칭되는 아시아 꿀벌 실크 단백질(ABS3으로도 지칭됨)(신호 펩티드 부재).
서열 번호 86 - 실크 단백질 3으로 지칭되는 아시아 꿀벌 실크 단백질(ABS3으로도 지칭됨).
서열 번호 87 - 실크 단백질 4로 지칭되는 아시아 꿀벌 실크 단백질(ABS4로도 지칭됨)(신호 펩티드 부재).
서열 번호 88 - 실크 단백질 4로 지칭되는 아시아 꿀벌 실크 단백질(ABS4로도 지칭됨).
서열 번호 89 - 아시아 꿀벌 실크 단백질 ABS1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 90 - 아시아 꿀벌 실크 단백질 ABS1을 코딩하는 뉴클레오티드 서열.
서열 번호 91 - 아시아 꿀벌 실크 단백질 ABS2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 92 - 아시아 꿀벌 실크 단백질 ABS2를 코딩하는 뉴클레오티드 서열.
서열 번호 93 - 아시아 꿀벌 실크 단백질 ABS3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 94 - 아시아 꿀벌 실크 단백질 ABS3을 코딩하는 뉴클레오티드 서열.
서열 번호 95 - 아시아 꿀벌 실크 단백질 ABS4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 96 - 아시아 꿀벌 실크 단백질 ABS4를 코딩하는 뉴클레오티드 서열.
서열 번호 97 - 본 명세서에서 MalF1로 지칭되는 풀잠자리 실크 단백질(신호 펩티드 부재).
서열 번호 98 - 본 명세서에서 MalF1로 지칭되는 풀잠자리 실크 단백질.
서열 번호 99 - 풀잠자리 실크 단백질 MalF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 영역 부재).
서열 번호 100 - 풀잠자리 실크 단백질 MalF1을 코딩하는 뉴클레오티드 서열.
서열 번호 101 내지 108 - 올리고뉴클레오티드 프라이머.
발명의 상세한 설명
일반적인 기법 및 정의
달리 구체적으로 정의되지 않은 한, 본 명세서에서 사용된 모든 기술적 용어 및 과학적 용어는 당업계(예를 들면, 세포 배양, 분자 유전학, 실크 가공, 면역학, 면역조직화학, 단백질 화학 및 생화학)에서 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는 것으로 인식될 것이다.
달리 명시되지 않은 한, 본 발명에서 사용된 재조합 단백질, 세포 배양 및 면역학적 기법은 당업자에게 잘 공지된 표준 절차이다. 이러한 기법들은 문헌, 예컨대, 문헌[J. Perbal, A Practical Guide to Molecular Cloning, John Wiley and Sons (1984), J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbour Laboratory Press (1989), T. A. Brown (editor), Essential Molecular Biology: A Practical Approach, Volumes 1 and 2, IRL Press (1991), D. M. Glover and B. D. Hames (editors), DNA Cloning: A Practical Approach, Volumes 1-4, IRL Press (1995 and 1996), and F, M, Ausubel et al, (editors), Current Protocols in Molecular Biology, Greene Pub, Associates and Wiley-Interscience (1988, including all updates until present), Ed Harlow and David Lane (editors) Antibodies: A Laboratory Manual, Cold Spring Harbour Laboratory, (1988), and J. E. Coligan et al. (editors) Current Protocols in Immunology, John Wiley & Sons (현재까지 모든 업데이트를 포함함)] 전체에 기재되어 있고 설명되어 있다.
용어 "및/또는", 예를 들면, "X 및/또는 Y"는 "X 및 Y" 또는 "X 또는 Y"를 의미하는 것으로 이해될 것이고 상기 의미 둘 다에 대한 또는 상기 의미 각각에 대한 명확한 지지를 제공하는 것으로 인식될 것이다.
본 명세서에서 사용된 바와 같이, 용어 "실크 단백질" 및 "실크 폴리펩티드"는 실크 섬유 및/또는 섬유성 단백질 복합체(complex)를 생성하는 데 사용될 수 있는 섬유성 단백질/폴리펩티드를 의미한다.
본 명세서에서 사용된 바와 같이, 용어 "1종 이상의 실크 단백질"은 가능하게는 2종 이상의 상이한 실크 단백질들, 예컨대, 본 명세서에서 정의된 바와 같은 제1 실크 단백질, 제2 실크 단백질 등을 사용하는 공정을 지칭한다. 따라서, 본 내용에서, 1종의 실크 단백질은 실크 도프를 생성하기에 충분한 동일한 실크 단백질 분자들의 집단을 의미한다.
본 명세서에서 사용된 바와 같이, 용어 "코일드 코일 구조를 포함하는 삼차 구조를 형성할 수 있는"은 적절한 조건 하에 상기 구조를 형성하는 단백질의 능력을 의미한다. 예를 들면, 단백질은 실크 섬유를 생성하도록 가공되는 경우 상기 구조를 형성한다. 나아가, 이 용어는 전체 단백질이 코일드 코일 구조를 형성할 수 있다는 것을 의미하는 것이 아니라, 단지 그의 일부가 상기 구조를 형성할 수 있다는 것을 의미한다. 한 실시양태에서, 실크 단백질의 약 45% 내지 약 90%, 더욱 바람직하게는 약 55% 내지 약 70%, 훨씬 더욱 바람직하게는 약 60% 내지 약 66%가 코일드 코일 구조를 포함하는 삼차 구조를 형성할 수 있다.
본 명세서에서 사용된 바와 같이, 용어 "실크 도프"는 실크 단백질을 포함하는 수용액을 의미한다. 바람직하게는, 실크 도프는 0.05 중량/부피% 이상, 더욱 바람직하게는 0.1 중량/부피% 이상, 훨씬 더욱 바람직하게는 0.5 중량/부피% 이상의 본 명세서에서 정의된 실크 단백질을 포함한다. 한 실시양태에서, 본 발명의 방법에 의해 제조된 실크 도프는 약 0.5 중량% 내지 약 15 중량%의 실크 단백질을 포함한다. 그러나, 실크 도프 중 실크 단백질의 농도를 증가시키는 추가 단계가 수행되지 않는 경우, 보다 전형적인 수율은 약 0.5 중량% 내지 약 4 중량%의 실크 단백질이다. 본 발명의 방법을 이용하여 제조한 실크 도프는 섬유의 형성 및/또는 필름 캐스트 성형을 위해 압출될 수 있다.
본 명세서에서 사용된 바와 같이, "실크 섬유"는 다양한 항목들, 예컨대, 직물로 직조될 수 있는, 실크 단백질을 포함하는 필라멘트를 의미한다.
본 명세서에서 사용된 바와 같이, 용어 "계면활성제 용액의 양을 감소시키는" 또는 이의 변형 용어("이온성 액체의 양을 감소시키는"을 포함함)는 계면활성제 또는 이온성 액체의 총량이 감소됨을 의미한다. 한 실시양태에서, 상기 감소 후 계면활성제 또는 이온성 액체의 농도는 용액의 추가 농축을 수반하는 임의의 단계 전에 약 10 mM 미만, 더욱 바람직하게는 5 mM 미만, 훨씬 더욱 바람직하게는 1 mM 미만이다.
본 명세서에서 사용된 바와 같이, "탈수 용액"은 농축될 실크 도프보다 낮은 용액 중 물 농도를 갖는 임의의 용액, 바람직하게는 수용액이다.
본 명세서에서 사용된 바와 같이, 계면활성제 또는 이온성 액체와 접촉되는 실크 단백질을 지칭할 때 용어 "가용화"는 상기 계면활성제 또는 이온성 액체가 실크 단백질과 결합하고 상기 실크 단백질의 응집을 방해함으로써 상기 실크 단백질이 용액 중에 유지되는 것을 의미한다. 이것은 세포, 특히 봉입체에서 관찰되는 실크 단백질과 대조적이다.
용어 "신호 펩티드", "N-말단 신호 서열" 및 이들의 변형 용어는 분비되는 성숙 단백질 앞에 존재하는 아미노 말단 단백질/펩티드를 의미한다. 신호 펩티드는 성숙 단백질로부터 절단되므로 성숙 단백질에 존재하지 않는다. 신호 펩티드는 분비되는 단백질을 세포막을 가로질러 이동시키고 전위시키는 기능을 갖는다. 신호 펩티드는 신호 서열로도 지칭되고 당업계에서 잘 공지되어 있다.
코일드
코일
실크
단백질
용어 "폴리펩티드" 및 "단백질"은 일반적으로 상호교환가능하게 사용되고 비아미노산 기의 부가에 의해 변경될 수 있거나 변경되지 않을 수 있는 단일 폴리펩티드 쇄를 의미한다. 본 명세서에서 사용된 바와 같이, 용어 "단백질" 및 "폴리펩티드"는 본 명세서에서 기재된 실크 단백질의 변이체, 돌연변이체, 변형체, 유사체 및/또는 유도체 또한 포함한다. 바람직한 실시양태에서, 본 발명에서 사용되는 실크 단백질은 천연 발생 아미노산으로만 구성된다.
단백질의 % 동일성은 갭(gap) 생성 페널티가 5이고 갭 연장 페널티가 0.3인 GAP(Needleman and Wunsch, 1970) 분석(GCG 프로그램)에 의해 측정된다. 조회(query) 서열은 길이가 15개 이상의 아미노산이고, GAP 분석은 15개 이상의 아미노산으로 구성된 영역에 걸쳐 2개의 서열들을 정렬한다. 더욱 바람직하게는, 조회 서열은 길이가 50개 이상의 아미노산이고, GAP 분석은 50개 이상의 아미노산으로 구성된 영역에 걸쳐 2개의 서열들을 정렬한다. 더욱 바람직하게는, 조회 서열은 길이가 100개 이상의 아미노산이고, GAP 분석은 100개 이상의 아미노산으로 구성된 영역에 걸쳐 2개의 서열들을 정렬한다. 훨씬 더욱 바람직하게는, 조회 서열은 길이가 250개 이상의 아미노산이고, GAP 분석은 250개 이상의 아미노산으로 구성된 영역에 걸쳐 2개의 서열들을 정렬한다. 훨씬 더욱 바람직하게는, GAP 분석은 서열의 전체 길이에 걸쳐 2개의 서열들을 정렬한다.
본 명세서에서 사용된 바와 같이, "생물학적 활성" 단편은 전장 단백질의 정의된 활성, 즉 실크를 제조하는 데 사용되는 능력을 유지하는 본 발명의 단백질의 일부이다. 생물학적 활성 단편들은 이들이 정의된 활성을 유지하는 한 임의의 크기일 수 있다.
용어 "본질적으로 구성된" 또는 이의 변형 용어는 정의된 아미노산 서열이 정의된 것에 비해 수개의, 예컨대, 1개, 2개, 3개 또는 4개의 추가 아미노산을 가질 수 있음을 의미한다. 예를 들면, N-말단 메티오닌은 정의된 서열에 부재하는 경우 첨가될 수 있다. 용어 "로 구성된다" 또는 이의 변형 용어는 정의된 서열이 상기 정의된 서열에 비해 특히 N-말단 및 C-말단에서 추가 아미노산을 갖지 않거나 아미노산을 덜 갖지 않음을 의미한다.
정의된 단백질에 대하여, 상기 제공된 숫자보다 더 높은 % 동일성 숫자는 바람직한 실시양태를 포함할 것임이 인식될 것이다. 따라서, 적용가능한 경우, 최소 % 동일성 숫자를 고려할 때, 단백질은 관련된 지정된 서열 번호와 40% 이상, 더욱 바람직하게는 45% 이상, 더욱 바람직하게는 50% 이상, 더욱 바람직하게는 55% 이상, 더욱 바람직하게는 60% 이상, 더욱 바람직하게는 65% 이상, 더욱 바람직하게는 70% 이상, 더욱 바람직하게는 75% 이상, 더욱 바람직하게는 80% 이상, 더욱 바람직하게는 85% 이상, 더욱 바람직하게는 90% 이상, 더욱 바람직하게는 91% 이상, 더욱 바람직하게는 92% 이상, 더욱 바람직하게는 93% 이상, 더욱 바람직하게는 94% 이상, 더욱 바람직하게는 95% 이상, 더욱 바람직하게는 96% 이상, 더욱 바람직하게는 97% 이상, 더욱 바람직하게는 98% 이상, 더욱 바람직하게는 99% 이상, 더욱 바람직하게는 99.1% 이상, 더욱 바람직하게는 99.2% 이상, 더욱 바람직하게는 99.3% 이상, 더욱 바람직하게는 99.4% 이상, 더욱 바람직하게는 99.5% 이상, 더욱 바람직하게는 99.6% 이상, 더욱 바람직하게는 99.7% 이상, 더욱 바람직하게는 99.8% 이상, 더욱 바람직하게는 99.9% 이상 동일한 아미노산 서열을 포함하는 것이 바람직하다.
본 명세서에서 기재된 천연 발생 실크 단백질의 아미노산 서열 돌연변이체는 적절한 뉴클레오티드 변화를 실크 단백질을 코딩하는 핵산 내로 도입함에 의해, 또는 원하는 단백질의 시험관내 합성에 의해 제조될 수 있다. 이러한 돌연변이체는 예를 들면, 아미노산 서열 내의 잔기의 결실, 삽입 또는 치환을 포함한다. 최종 단백질 생성물이 원하는 특성을 보유하는 한, 최종 구성체(construct)에 도달하도록 결실, 삽입 및 치환의 조합이 만들어질 수 있다.
돌연변이체 (변경된) 단백질은 당업계에 공지된 임의의 기법을 이용하여 제조할 수 있다. 예를 들면, 본 발명의 폴리뉴클레오티드를 시험관내 돌연변이유발로 처리할 수 있다. 이러한 시험관내 돌연변이유발 기법은 폴리뉴클레오티드를 적합한 벡터 내로 서브클로닝하고, 상기 벡터를 "돌연변이유발자(mutator)" 균주, 예컨대, 이. 콜라이 XL-1 레드(스트라타진) 내로 형질전환하고 형질전환된 박테리아를 적절한 수의 세대 동안에 증식시키는 것을 포함한다. 또 다른 예에서, 본 발명의 폴리뉴클레오티드는 하라야마(Harayama)(1998)에 의해 넓게 기재된 DNA 셔플링(shuffling) 기법으로 처리한다. 이 DNA 셔플링 기법은 본 발명의 유전자와 관련된 유전자, 예컨대, 본 명세서에서 특징규명된 특정 종들 이외의 막시목(Hymenopteran) 또는 맥시목(Neuroptean) 종으로부터의 실크 유전자 이외에 가능하게는 본 발명의 유전자를 포함할 수 있다. 돌연변이된/변경된 DNA로부터 유래된 생성물들이 실크 단백질로서 사용될 수 있는지를 결정하기 위해 상기 생성물들을 본 명세서에서 기재된 기법을 이용하여 용이하게 스크리닝할 수 있다.
아미노산 서열 돌연변이체의 디자인에 있어서, 돌연변이 부위의 위치 및 돌연변이의 성질은 변형될 특성(들)에 의해 좌우될 것이다. 돌연변이를 위한 부위는 예를 들면, (1) 먼저 선택된 보존적 아미노산으로 치환한 후 달성되는 결과에 따라 선택된 보다 많은 라디칼로 치환하는 것, (2) 표적 잔기를 결실하는 것, 또는 (3) 위치된 부위에 인접한 위치에 다른 잔기를 삽입하는 것에 의해 개별적으로 또는 연속적으로 변경될 수 있다.
아미노산 서열 결실 또는 삽입은 일반적으로 약 1 내지 15개 잔기, 더욱 바람직하게는 약 1 내지 10개 잔기, 전형적으로 약 1 내지 5개의 연속적인 잔기이다.
치환 돌연변이체는 단백질 분자 내에 제거된 1개 이상의 아미노산 잔기 및 그 자리에 삽입된 상이한 잔기를 갖는다. 치환 돌연변이유발의 경우 가장 높은 관심을 받는 부위는 기능을 위해 중요한 것으로 확인된 부위를 포함한다. 관심 있는 다른 부위는 다양한 균주 또는 종으로부터 얻은 특정 잔기들이 동일한 부위이다. 이 위치들은 생물학적 활성을 위해 중요할 수 있다. 이 부위들, 특히 3개 이상의 다른 동일하게 보존된 부위들의 서열 내에 포함되는 부위는 바람직하게는 상대적으로 보존적인 방식으로 치환된다. 이러한 보존적 치환은 "예시적 치환"이라는 표제 하에 표 1에 기재되어 있다.
예시적 치환 | |
원래의 잔기 | 예시적 치환 |
Ala(A) | val; leu; ile; gly; cys; ser; thr |
Arg(R) | lys |
Asn(N) | gln; his |
Asp(D) | glu |
Cys(C) | ser; thr; ala; gly; val |
Gln(Q) | asn; his |
Glu(E) | asp |
Gly(G) | pro; ala; ser; val; thr; cyc |
His(H) | asn; gln |
Ile(I) | leu; val; ala; met |
Leu(L) | ile; val; met; ala; phe |
Lys(K) | arg |
Met(M) | leu; phe |
Phe(F) | leu; val; ala |
Pro(P) | gly |
Ser(S) | thr; ala; gly; val; gln; cys |
Thr(T) | ser; gln; ala; cys |
Trp(W) | tyr |
Tyr(Y) | trp; phe |
Val(V) | ile; leu; met; phe; ala; ser; thr |
실크 단백질의 코일드 코일 구조는 컨센서스 서열(abcdefg) n 로 표시되는 헵타드 반복부(repeat)를 특징으로 한다. 바람직한 실시양태에서, 코일드 코일 구조를 갖는 단백질의 부분은 10개 카피 이상의 헵타드 서열 abcdefg를 포함하고, 위치 a 및 d의 아미노산의 25% 이상이 알라닌 잔기이다.
바람직한 실시양태에서, 코일드 코일 구조를 갖는 단백질은 12개 연속적 카피 이상의, 더욱 바람직하게는 15개 연속적 카피 이상의, 훨씬 더욱 바람직하게는 18개 연속적 카피 이상의 헵타드를 포함한다. 추가 실시양태에서, 코일드 코일 구조를 갖는 단백질은 최대 28개 카피 이상의 헵타드를 가질 수 있다. 전형적으로, 헵타드의 카피들은 도립적으로(tandemly) 반복될 것이다. 그러나, 이들은 반드시 완벽한 도립 반복부일 필요는 없고, 예를 들면, 국제 특허공보 제WO 2007/038837호의 도 5 및 6에서 도시된 바와 같이, 몇몇 아미노산들이 2개의 헵타드 사이에서 발견될 수 있거나, 몇몇 절두된(truncated) 헵타드가 발견될 수 있다(예를 들면, 국제 특허공보 제WO 2007/038837호의 도 5에서 제노스피랄 참조).
코일드 코일 구조를 갖는 실크 단백질에 가해질 수 있는 아미노산 치환에 대한 지침은 국제 특허공보 제WO 2007/038837호의 도 5 및 6 및 표 6 내지 10에 제공되어 있다. 본 명세서에 제공된 실험 데이터를 기초로 한 예측된 유용한 아미노산 치환이 국제 특허공보 제WO 2007/038837호의 표 1에 제공된 예시적 치환과 어떠한 방식으로든 불일치하는 경우, 실험 데이터를 기초로 한 치환을 사용하는 것이 바람직하다.
실크 단백질의 코일드 코일 구조는 특히 상기 헵타드의 아미노산 위치 a, d 및 e에서 높은 함량의 알라닌 잔기를 갖는다. 그러나, 위치 b, c, f 및 g 또한 높은 빈도의 알라닌 잔기를 갖는다. 바람직한 실시양태에서, 상기 헵타드의 위치 a, d 및/또는 e의 아미노산의 15% 이상, 더욱 바람직하게는 25% 이상, 더욱 바람직하게는 30% 이상, 더욱 바람직하게는 40% 이상, 훨씬 더욱 바람직하게는 50% 이상이 알라닌 잔기이다. 추가의 바람직한 실시양태에서, 상기 헵타드의 위치 a 및 d 둘 다의 아미노산의 25% 이상, 더욱 바람직하게는 30% 이상, 더욱 바람직하게는 40% 이상, 훨씬 더욱 바람직하게는 50% 이상이 알라닌 잔기이다. 나아가, 상기 헵타드의 위치 b, c, f 및 g의 아미노산의 15% 이상, 더욱 바람직하게는 20% 이상, 훨씬 더욱 바람직하게는 25% 이상이 알라닌 잔기이다.
전형적으로, 상기 헵타드는 임의의 프롤린 또는 히스티딘 잔기를 포함하지 않을 것이다. 더욱이, 상기 헵타드는 존재하는 경우 극소수(1 또는 2개의) 페닐알라닌, 메티오닌, 티로신, 시스테인, 글리신 또는 트립토판 잔기를 포함할 것이다. 알라닌 이외에, 상기 헵타드에서 공통된 (예를 들면, 5% 초과의, 더욱 바람직하게는 10% 초과의) 아미노산은 (특히, 위치 b 및 d에서) 류신, (특히, 위치 b, e 및 f에서) 세린, (특히, 위치 c, e 및 f에서) 글루탐산, (특히, 위치 b, c, d, f 및 g)에서 라이신, 및 위치 g에서 아르기닌을 포함한다.
바람직한 실시양태에서, 헵타드는 패턴 인식 프로그램 MARCOIL(Delorenzi and Speed. 2002)을 이용하여 확인한다.
본 발명의 방법에 유용한 단백질(및 폴리뉴클레오티드)은 매우 다양한 막시목 및 맥시목 종으로부터 정제(단리)될 수 있다. 막시목의 예에는 하기 곤충과를 포함하는 아포크리타(Apocrita) 아목(벌, 개미 및 말벌)의 임의의 종이 포함되나, 이들로 한정되지 않는다: 크리시디대(Chrysididae)(청벌), 포르미시대(Formicidae)(개미), 무틸리대(Mutillidae)(개미벌), 폼필리대(Pompilidae)(거미벌), 스콜리이대(Scoliidae), 베스피대(Vespidae)(종이벌, 도자기벌, 호박벌), 아가오니대(Agaonidae)(무화과벌), 칼시디대(Chalcididae)(칼시디드), 유카리티대(Eucharitidae)(유카리티드), 유펠미대(Eupelmidae)(유펠미드), 프테로말리대(Pteromalidae)(프테로말리드), 에바니이대(Evaniidae)(호리벌), 브라코니대(Braconidae), 이크뉴모니대(Ichneumomdae)(이크뉴몬스), 메가칠리대(Megachilidae), 아피대(Apidae), 콜레티대(Colletidae), 할릭티대(Halictidae), 및 멜리티대(Melittidae)(오일 수집 벌). 맥시목의 예에는 하기 곤충과로부터의 종들이 포함된다: 만티스피대(Mantispidae), 크리소피대(Chrysopidae)(풀잠자리), 미르멜레온티대(Myrmeleontidae)(명주잠자리) 및 아스칼라피대(Ascalaphidae)(뿔잠자리). 이러한 추가 단백질(및 폴리뉴클레오티드)은 봄부스 테레스트리스(Bombus terrestris), 미르멕시아 포르피카타(Myrmecia forficata), 오에코필라 스마라그디나(Oecophylla smaragdina) 및 말라다 시그나타(Mallada signata)로부터의 실크에 대해 본 명세서에서 기재된 절차와 동일한 절차를 이용하여 특징규명할 수 있다.
합성 동안에 또는 합성 후에 예를 들면, 바이오티닐화, 벤질화, 글리코실화, 아세틸화, 포스포릴화, 아미드화, 공지된 보호/차단 기에 의한 유도체화, 단백질분해성 절단, 항체 분자 또는 다른 세포 리간드에의 결합 등에 의해 차등적으로 변형된 단백질도 본 발명의 범위 내에 포함된다. 이 변형들은 단백질의 안정성 및/또는 생체활성을 증가시키도록 작용할 수 있다.
폴리뉴클레오티드
용어 "폴리뉴클레오티드"는 본 명세서에서 용어 "핵산"과 상호교환적으로 사용된다.
폴리뉴클레오티드의 내용에서 용어 "외인성"은 그의 천연 상태에 비해 변경된 양으로 세포 또는 무세포 발현 시스템에 존재하는 폴리뉴클레오티드를 의미한다. 한 실시양태에서, 상기 세포는 상기 폴리뉴클레오티드를 천연적으로 포함하지 않는 세포이다. 그러나, 상기 세포는 변경된, 바람직하게는 증가된 양의 코딩된 단백질의 생성을 야기하는 비내인성 폴리뉴클레오티드를 포함하는 세포일 수 있다. 본 발명의 외인성 폴리뉴클레오티드는 이 폴리뉴클레오티드가 존재하는 형질전환(재조합) 세포 또는 무세포 발현 시스템의 다른 성분들로부터 분리되지 않은 폴리뉴클레오티드, 및 적어도 몇몇 다른 성분들로부터 추후에 정제되는, 상기 세포 또는 무세포 시스템에서 생성된 폴리뉴클레오티드를 포함한다.
폴리뉴클레오티드의 % 동일성은 갭 생성 페널티가 5이고 갭 연장 페널티가 0.3인 GAP(Needleman and Wunsch, 1970) 분석(GCG 프로그램)에 의해 측정된다. 달리 명시되지 않은 한, 조회 서열은 길이가 45개 이상의 뉴클레오티드이고, GAP 분석은 45개 이상의 뉴클레오티드의 영역에 걸쳐 2개의 서열들을 정렬한다. 바람직하게는, 조회 서열은 길이가 150개 이상의 뉴클레오티드이고, GAP 분석은 150개 이상의 뉴클레오티드의 영역에 걸쳐 2개의 서열들을 정렬한다. 보다 바람직하게는, 조회 서열은 길이가 300개 이상의 뉴클레오티드이고, GAP 분석은 300개 이상의 뉴클레오티드의 영역에 걸쳐 2개의 서열들을 정렬한다. 훨씬 더욱 바람직하게는, GAP 분석은 서열의 전체 길이에 걸쳐 2개의 서열들을 정렬한다.
정의된 폴리뉴클레오티드에 대하여, 상기 제공된 숫자보다 더 높은 % 동일성 숫자는 바람직한 실시양태를 포함할 것임이 인식될 것이다. 따라서, 적용가능한 경우, 최소 % 동일성 숫자를 고려할 때, 본 발명의 폴리뉴클레오티드는 관련된 지정된 서열 번호와 40% 이상, 더욱 바람직하게는 45% 이상, 더욱 바람직하게는 50% 이상, 더욱 바람직하게는 55% 이상, 더욱 바람직하게는 60% 이상, 더욱 바람직하게는 65% 이상, 더욱 바람직하게는 70% 이상, 더욱 바람직하게는 75% 이상, 더욱 바람직하게는 80% 이상, 더욱 바람직하게는 85% 이상, 더욱 바람직하게는 90% 이상, 더욱 바람직하게는 91% 이상, 더욱 바람직하게는 92% 이상, 더욱 바람직하게는 93% 이상, 더욱 바람직하게는 94% 이상, 더욱 바람직하게는 95% 이상, 더욱 바람직하게는 96% 이상, 더욱 바람직하게는 97% 이상, 더욱 바람직하게는 98% 이상, 더욱 바람직하게는 99% 이상, 더욱 바람직하게는 99.1% 이상, 더욱 바람직하게는 99.2% 이상, 더욱 바람직하게는 99.3% 이상, 더욱 바람직하게는 99.4% 이상, 더욱 바람직하게는 99.5% 이상, 더욱 바람직하게는 99.6% 이상, 더욱 바람직하게는 99.7% 이상, 더욱 바람직하게는 99.8% 이상, 더욱 바람직하게는 99.9% 이상 동일한 서열을 포함하는 것이 바람직하다.
한 실시양태에서, 본 발명에 유용한 실크 단백질을 코딩하는 폴리뉴클레오티드는
a) 서열 번호 9 내지 16, 25 내지 32, 41 내지 48, 57 내지 64, 73 내지 80, 89 내지 96, 99 또는 100 중 어느 하나에 제공된 뉴클레오티드 서열,
b) 서열 번호 9 내지 16, 25 내지 32, 41 내지 48, 57 내지 64, 73 내지 80, 89 내지 96, 99 또는 100 중 어느 하나 이상과 30% 이상 동일한 뉴클레오티드 서열, 및
c) a) 또는 b)의 일부를 코딩하는 생물학적 활성 단편
으로부터 선택되는 서열을 포함하고, 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 본질적으로 구성되고, 훨씬 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 구성된다.
가능한 적은 실크 단백질이 세포로부터 분비되는 것이 바람직한 경우, 코딩된 실크 단백질은 N-말단 신호 서열을 포함하지 않는다. 이러한 실크 단백질을 코딩하는 폴리뉴클레오티드의 예에는
a) 서열 번호 9, 11, 13, 15, 25, 27, 29, 31, 41, 43, 45, 47, 57, 59, 61, 63, 73, 75, 77, 79, 89, 91, 93, 95 또는 97 중 어느 하나에 제공된 뉴클레오티드 서열,
b) 서열 번호 9, 11, 13, 15, 25, 27, 29, 31, 41, 43, 45, 47, 57, 59, 61, 63, 73, 75, 77, 79, 89, 91, 93, 95 또는 97 중 어느 하나 이상과 30% 이상 동일한 뉴클레오티드 서열, 및
c) a) 또는 b)의 생물학적 활성 단편
으로부터 선택되는 서열을 포함하는, 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 본질적으로 구성된, 훨씬 더욱 바람직하게는 상기 a) 내지 c)로부터 선택되는 서열로 구성된 실크 단백질이 포함된다.
본 발명의 다른 실시양태는 N-말단 신호 서열을 갖는 실크 단백질의 발현, 및/또는 본 명세서에서 정의된 제1 실크 단백질, 제2 실크 단백질, 제3 실크 단백질 및/또는 제4 실크 단백질의 동시생성(동일하거나 상이한 세포에서)에 의존한다. 서열목록에 제공된 서열 정보를 기초로 할 때, 당업자는 본 발명의 각각의 실시양태에 대한 발현을 위한 대표적인 폴리뉴클레오티드를 용이하게 확인할 수 있다.
본 발명의 방법에서 사용될 폴리뉴클레오티드는 천연 발생 분자와 비교할 때 뉴클레오티드 잔기의 결실, 삽입 또는 치환인 하나 이상의 돌연변이를 보유할 수 있다. 돌연변이체는 천연 발생일 수 있거나(즉, 천연 공급원으로부터 단리됨) 합성일 수 있다(예를 들면, 핵산에 대한 부위 지정 돌연변이유발을 수행함에 의해 합성됨).
또한, 본 발명에서 사용될 폴리뉴클레오티드는 엄격한 조건 하에 본 명세서에 제공된 실크 단백질 코딩 뉴클레오티드 서열, 예컨대, 서열 번호 9 내지 16, 25 내지 32, 41 내지 48, 57 내지 64, 73 내지 80, 89 내지 96, 99 및 100 중 하나 이상과 혼성화할 수 있다. 본 명세서에서 사용된 바와 같이, 용어 "엄격한 혼성화 조건" 등은 올리고뉴클레오티드의 길이와 함께 혼성화 온도의 변경을 포함하는, 당업자에게 친숙한 파라미터를 의미한다. 핵산 혼성화 파라미터는 이러한 방법을 정리해 놓은 참고문헌[샘브룩(Sambrook) 등의 문헌(상기) 및 아우수벨(Ausubel) 등의 문헌(상기)]에서 찾을 수 있다. 예를 들면, 본 명세서에서 사용된 바와 같이, 엄격한 조건은 혼성화 완충제(3.5xSSC. 0.02% 피콜, 0.02% 폴리비닐 피롤리돈, 0.02% 소 혈청 알부민(BSA), 2.5 mM NaH2PO4(pH 7), 0.5% SDS, 2 mM EDTA) 중에서 65℃에서 혼성화한 후 50℃에서 0.2xSSC, 0.01% BSA에서 1회 이상 세척하는 것을 의미할 수 있다.
핵산 구성체
본 발명의 방법에서 사용될 세포는 전형적으로 실크 단백질(들)을 코딩하는 핵산 구성체(들)를 포함할 것이다. 상기 구성체는 세포의 게놈 내로 삽입될 수 있거나 염색체외 구성체, 예컨대, 재조합 벡터일 수 있다. 이러한 벡터는 실크 단백질을 코딩하는 폴리뉴클레오티드 분자 근처에서 천연적으로 발견되지 않는 폴리뉴클레오티드 서열이고 바람직하게는 상기 폴리뉴클레오티드 분자가 유래된 종 이외의 다른 종으로부터 유래된 이종 폴리뉴클레오티드 서열을 함유한다. 상기 벡터는 RNA 또는 DNA 벡터일 수 있고, 원핵 또는 진핵 벡터일 수 있고, 전형적으로 트랜스포존(transposon)(예컨대, 미국 특허 제5,792,294호에 기재됨), 바이러스 또는 플라스미드이다.
한 종류의 재조합 벡터는 발현 벡터에 작동가능하게 연결된 실크 단백질을 코딩하는 폴리뉴클레오티드 분자를 포함한다. 어구 "작동가능하게 연결된"은 폴리뉴클레오티드 분자가 숙주 세포 내로 형질전환될 때 발현될 수 있는 방식으로 상기 폴리뉴클레오티드 분자가 발현 벡터 내로 삽입되는 것을 의미한다. 본 명세서에서 사용된 바와 같이, 발현 벡터는 숙주 세포를 형질전환할 수 있고 특정된 폴리뉴클레오티드 분자의 발현을 수행할 수 있는 DNA 또는 RNA 벡터이다. 바람직하게는, 발현 벡터는 숙주 세포 내에서 복제할 수도 있다. 발현 벡터는 원핵 또는 진핵 벡터일 수 있고, 전형적으로 바이러스 또는 플라스미드이다. 본 발명의 발현 벡터는 박테리아, 진균, 내부기생충, 절지동물, 곤충, 동물 및 식물 세포를 포함하는 본 발명의 재조합 세포에서 작용하는 임의의 벡터를 포함한다. 본 발명의 특히 바람직한 발현 벡터는 식물 세포에서 유전자 발현을 지시할 수 있다. 또한, 본 발명의 벡터는 무세포 발현 시스템에서 단백질을 생성하는 데 사용될 수 있고, 상기 시스템은 당업계에 잘 공지되어 있다.
구체적으로, 핵산 구성체는 조절 서열, 예컨대, 전사 조절 서열, 번역 조절 서열, 복제 기점, 및 재조합 세포와 상용가능하고 폴리뉴클레오티드 분자의 발현을 조절하는 다른 조절 서열을 함유한다. 전사 조절 서열은 전사의 개시, 연장 및 종결을 조절하는 서열이다. 특히 중요한 전사 조절 서열은 전사의 개시를 조절하는 서열, 예컨대, 프로모터, 인핸서(enhancer), 작동자(operator) 및 억제자(repressor) 서열이다. 적합한 전사 조절 서열은 본 발명의 재조합 세포 중 하나 이상에서 작용할 수 있는 임의의 전사 조절 서열을 포함한다. 다양한 이러한 전사 조절 서열이 당업자에게 공지되어 있다. 바람직한 전사 조절 서열은 박테리아, 효모, 절지동물, 식물 또는 포유동물 세포에서 작용하는 전사 조절 서열, 예컨대, tac, lac, trp, trc, oxy-pro, omp/lpp, rrnB, 박테리오파지 람다, 박테리오파지 T7, T71ac, 박테리오파지 T3, 박테리오파지 SP6, 박테리오파지 SP01, 메탈로티오네인, 알파-교배(mating) 인자, 피키아(Pichia) 알코올 옥시다제, 알파바이러스 서브게놈 프로모터(예컨대, 신드비스 바이러스 서브게놈 프로모터), 항생제 내성 유전자, 바큘로바이러스, 옥수수밤나방(Heliothis zea) 곤충 바이러스, 백시니아 바이러스, 헤르페스(herpes)바이러스, 미국너구리 폭스바이러스, 다른 폭스바이러스, 아데노바이러스, 사이토메갈로바이러스(예컨대, 중간 초기 바이러스), 원숭이 바이러스 40, 레트로바이러스, 액틴, 레트로바이러스 긴 말단 반복부, 라우스 육종 바이러스, 열충격, 포스페이트 및 니트레이트 전사 조절 서열, 및 원핵세포 또는 진핵세포에서 유전자 발현을 조절할 수 있는 다른 서열(그러나, 이들로 한정되지 않음)을 포함한다.
전술된 바와 같이, 본 발명의 한 양태는 전형적으로 N-말단 신호 서열의 존재로 인해 세포로부터 분비되는 실크 단백질에 의존한다. 적합한 신호 분절(segment)의 예에는 조직 플라스미노겐 활성화제(t-PA), 인터페론, 인터루킨, 성장 호르몬, 바이러스 외피 당단백질 신호 분절, 니코티아나 네크타린(Nicotiana nectarin) 신호 펩티드(미국 특허 제5,939,288호), 담배 엑스텐신(extensin) 신호, 대두 올레오신(oleosin) 오일 바디 결합 단백질 신호, 아라비돕시스 탈리아나(Arabidopsis thaliana) 액포 염기성 키티나제(chitinase) 신호 펩티드, 및 본 명세서에서 정의된 실크 폴리펩티드의 천연 신호 서열이 포함되나, 이들로 한정되지 않는다.
세포
본 발명의 방법의 대다수는 본 명세서에서 정의된 하나 이상의 실크 단백질을 생성하는 세포의 사용에 의존한다. 세포 내로의 폴리뉴클레오티드 분자의 형질전환은 폴리뉴클레오티드 분자를 세포 내로 삽입하는 임의의 방법에 의해 달성될 수 있다. 형질전환 기법은 형질감염, 전기천공, 미세주입, 리포펙션, 흡착 및 원형질체 융합을 포함하나, 이들로 한정되지 않는다. 재조합 세포는 단세포로 남아있을 수 있거나 조직, 기관 또는 다세포 유기체로 성장할 수 있다. 형질전환된 폴리뉴클레오티드 분자는 염색체외 분자로 남아 있을 수 있거나 그의 발현 능력이 보유되는 방식으로 형질전환된(즉, 재조합) 세포의 염색체 내부의 하나 이상의 부위로 삽입될 수 있다.
형질전환시키기에 적합한 숙주 세포는 본 명세서에서 정의된 실크 폴리펩티드를 코딩하는 폴리뉴클레오티드로 형질전환될 수 있는 임의의 세포를 포함한다. 숙주 세포는 상기 실크 폴리펩티드를 내인적으로(즉, 천연적으로) 생성할 수 있거나 본 명세서에서 정의된 하나 이상의 폴리뉴클레오티드 분자로 형질전환된 후 상기 폴리펩티드를 생성할 수 있다. 숙주 세포는 본 명세서에서 정의된 하나 이상의 실크 단백질을 생성할 수 있는 임의의 세포일 수 있고 박테리아, 진균(효모를 포함함), 기생충, 절지동물, 동물 및 식물 세포를 포함한다. 숙주 세포의 예에는 살모넬라(Salmonella), 에스케리치아(Escherichia), 바실러스(Bacillus), 리스테리아(Listeria), 사카로마이세스(Saccharomyces), 스포도프테라(Spodoptera), 마이코박테리아(Mycobacteria), 트리코플루시아(Trichoplusia), BHK(새끼 햄스터 신장) 세포, MDCK 세포, CRFK 세포, CV-1 세포, COS(예를 들면, COS-7) 세포 및 베로 세포가 포함된다. 숙주 세포의 추가 예는 이. 콜라이(E. coli) K-12 유도체를 포함하는 이. 콜라이; 살모넬라 티피이(Salmonella typhi); 약독화된 균주를 포함하는 살모넬라 티피뮤륨(Salmonella typhimurium); 스포도프테라 프루기페르다(Spodoptera frugiperda); 트리코플루시아 니(Trichoplusia ni); 및 비종양발생성 마우스 근모세포 G8 세포(예를 들면, ATCC CRL 1246)이다. 추가 적절한 포유동물 세포 숙주는 다른 신장 세포주, 다른 섬유모세포주(예를 들면, 인간, 뮤린 또는 닭 배아 섬유모세포주), 골수종 세포주, 중국 햄스터 난소 세포, 마우스 NIH/3T3 세포, LMTK 세포 및/또는 HeLa 세포를 포함한다. 특히 바람직한 숙주 세포는 박테리아 세포이다.
당업자는 특정한 종류의 세포에 적합한 배양 조건, 예컨대, 배지, 온도 및 시간을 용이하게 결정할 수 있다. 예를 들면, 한 실시양태에서, 세포는 약 30℃ 내지 약 37℃에서 약 24시간 내지 약 48시간 동안 배양된 에스케리치아 콜라이이다.
재조합 DNA 기술은 예를 들면, 숙주 세포 내의 폴리뉴클레오티드 분자의 카피수, 상기 폴리뉴클레오티드 분자가 전사되는 효율, 생성된 전사체가 번역되는 효율, 및 번역 후 변형 효율을 조작함으로써 형질전환된 폴리뉴클레오티드 분자의 발현을 개선시키는 데 사용될 수 있다. 폴리뉴클레오티드 분자의 발현을 증가시키는 데 유용한 재조합 기법은 폴리뉴클레오티드 분자를 고-카피수 플라스미드에 작동가능하게 연결하는 것, 상기 폴리뉴클레오티드 분자를 하나 이상의 숙주 세포 염색체 내로 삽입하는 것, 벡터 안정성 서열을 플라스미드에 부가하는 것, 전사 조절 신호(예를 들면, 프로모터, 작동자, 인핸서)를 치환하거나 변형하는 것, 번역 조절 신호(예를 들면, 리보좀 결합 부위, 샤인-달가노 서열)를 치환하거나 변형하는 것, 숙주 세포의 코돈 사용에 상응하도록 폴리뉴클레오티드 분자를 변형하는 것, 및 전사체를 불안정화시키는 서열을 결실시키는 것을 포함하나, 이들로 한정되지 않는다.
실크 도프의 제조
본 발명은 매우 다양한 적용을 위해 사용될 수 있는 실크 도프의 제조 방법에 관한 것이다.
본 발명의 한 양태의 한 단계는 세포를 용해하여 세포 내에서 생성되고 함유된 실크 단백질을 유리시키는 것에 관한 것이다. 이 단계는 당업계에 공지된 임의의 수단에 의해 수행될 수 있다. 예를 들면, 세포 현탁액을 전형적으로 원심분리하여 세포를 펠렛화하고, 상기 세포를 용해를 위해 준비된 보다 농축된 용액 내로 재현탁시킨다. 세포를 예를 들면, 프렌치 프레스에 통과시켜 용해시킬 수 있고 폴리트론(브린크만 인스트루먼츠(Brinkman Instruments))을 이용하여 균질화시키거나 얼음 상에서 초음파처리할 수 있다. 세포, 예컨대, 박테리아 세포를 용해시키는 대안적 방법은 당업자에게 잘 공지되어 있다(예를 들면, 상기 샘브룩 등의 문헌 참조). 다양한 키트, 예를 들면, 버그버스터(Bugbuster) 키트(노바겐(Novagen)) 및 프로테아프렙(ProteaPrep) 키트(프로테아 바이오사이언시스 인코포레이티드(Protea Biosciences, Inc.))가 세포 용해를 위해 사용될 수 있고 당업계에 잘 공지되어 있다.
본 발명자들은 박테리아에서 발현된 본 명세서에서 정의된 실크 단백질이 불용성 응집체("봉입체")를 형성함을 확인하였다. 바람직한 실시양태에서, 본 방법은 이 봉입체의 단리를 포함한다. 여러 프로토콜이 단백질 봉입체의 정제에 적합하다. 예를 들면, 봉입체의 정제는 전형적으로 전술된 방법에 의한 박테리아 세포의 파괴에 의한 봉입체의 추출, 분리 및/또는 정제를 수반한다. 한 실시양태에서, 세포를 용해시키고, 세포막을 가용화시키고, 봉입체를 포함하는 불용성 분획을 추가 가공을 위해 단리한다.
본 발명의 한 양태는 상청액으로부터의 실크 단백질의 농도를 증가시키는 것에 의존한다. 또한, 이것은 당업계에 공지된 임의의 방법에 의해 달성될 수 있다. 한 실시양태에서, 이것은 상청액을 실크 단백질을 침전시키는 물질, 예컨대, 황산암모늄, 트리클로로아세트산, 과염소산 및 아세톤, 또는 상업적인 침전물 칵테일, 예컨대, 플러스온(PlusOne)(아머샴 바이오사이언시스(Amersham Biosciences)) 또는 퍼펙트-포커스(Perfect-Focus)(게노 테크놀로지 인코포레이티드(Geno Technology Inc.))(그러나, 이들로 한정되지 않음)와 접촉시킴에 의해 달성된다.
실크 도프를 제조하기 위한 본 발명의 한 임의적 단계(임의적 단계일지라도, 실크 단백질의 수율이 충분히 높지 않은 경우에 바람직함)는 실크 도프 중 실크 단백질의 농도를 증가시키는 것을 포함한다. 또한, 이것은 수용액 중 단백질의 농도를 증가시키기 위한 당업계에 공지된 임의의 방법에 의해 달성될 수 있다. 특히 유용한 실시양태에서, 실크 도프는 탈수 용액, 예컨대, 흡습성 중합체를 포함하는 용액에 대해 투석함에 의해 농축된다. 적합한 흡습성 중합체의 예에는 폴리에틸렌 글리콜(PEG), 아밀라제 및 세리신, 또는 이들의 2종 이상의 조합이 포함되나, 이들로 한정되지 않는다. PEG 분자는 분자 크기 범위에서 사용가능하고, PEG의 선택은 투석을 위해 선택된 막 및 요구되는 농축율에 의해 결정될 것이다. 바람직하게는, PEG는 약 8,000 g/mol 내지 약 10,000 g/mol의 분자량을 갖고 약 25% 내지 약 50%의 농도를 갖는다.
계면활성제
한 실시양태에서, 본 명에서에 정의된 실크 도프를 생성하는 단계는 계면활성제의 사용을 수반한다. 본 발명자들은 놀랍게도 계면활성제, 예컨대, SDS가 그의의 농도가 낮아질 때 코일드 코일 구조의 형성을 허용하면서 본 명세서에서 정의된 실크 단백질이 용액 중에서 머물러 있을 수 있게 함을 발견하였다.
한 실시양태에서, 계면활성제는 음이온성 계면활성제이다. 본 발명에 유용한 음이온성 계면활성제의 예에는 나트륨 도데실 설페이트(SDS), 암모늄 라우릴 설페이트 및 다른 알킬 설페이트 염, 나트륨 1-옥탄설포네이트 일수화물, 나트륨 라우로일 사르코시네이트, 나트륨 라우릴 에테르 설페이트(SLES), 나트륨 타우로데옥시콜레이트 수화물 및 알킬 벤젠 설포네이트, 또는 이들의 2종 이상의 조합이 포함되나, 이들로 한정되지 않는다. 바람직한 실시양태에서, 음이온성 계면활성제는 SDS이다.
실크 단백질의 가용성을 증가시키는 임의의 농도의 계면활성제가 사용될 수 있다. 예를 들면, 약 0.1 부피/부피% 이상의 계면활성제가 사용된다. 한 실시양태에서, 약 0.1 부피/부피% 내지 약 10 부피/부피%, 더욱 바람직하게는, 약 0.5 부피/부피% 내지 약 2 부피/부피% 또는 약 0.5 부피/부피% 내지 약 5 부피/부피%의 계면활성제가 사용된다.
실크 도프의 제조를 위한 본 발명의 방법의 추가 단계는 계면활성제를 침전시켜 실크 단백질의 정확한 폴딩을 보조하는 화합물을 첨가함으로써 용액 중 계면활성제의 양을 감소시키는 것을 포함한다. 게면활성제에 결합하여 계면활성제의 가용성을 감소시키는 임의의 화합물이 사용될 수 있다. 예에는 염 또는 탄수화물, 예컨대, α-시클로덱스트린, 또는 이들의 2종 이상의 조합이 포함되나, 이들로 한정되지 않는다. 바람직하게는, 염은 칼륨 염 또는 나트륨 염이다. 바람직하게는, 칼륨 염은 염화칼륨이고, 나트륨 염은 아세트산나트륨이다. 용액 중 계면활성제의 양을 감소시키는 임의의 농도의 화합물이 사용될 수 있다. 예를 들면, 상기 화합물은 약 1 mM 내지 약 1 M, 더욱 바람직하게는 약 40 mM 내지 약 100 mM 또는 약 40 mM 내지 400 mM의 최종 농도로 첨가된다.
실크 도프의 제조를 위한 본 발명의 방법의 추가 단계는 상기 화합물을 첨가한 후 형성된 침전물로부터 용액을 분리하는 것을 포함한다. 이것은 당업계에 공지된 임의의 방법에 의해, 예컨대, 16000g에서 5분 동안 원심분리를 이용하고 실크 도프를 포함하는(실크 도프인) 상청액(용액)을 제거함에 의해 달성될 수 있다. 바람직하게는, 이 단계 후, 실크 단백질은 용액 중 단백질의 75% 이상, 더욱 바람직하게는 80% 이상, 더욱 바람직하게는 85% 이상, 더욱 바람직하게는 90% 이상, 더욱 바람직하게는 95% 이상, 더욱 바람직하게는 97% 이상, 더욱 바람직하게는 99% 이상, 훨씬 더욱 바람직하게는 100% 이상을 차지한다.
이온성 액체
일반적으로, 이온성 액체는 이온으로만 구성되고 약 100℃ 미만, 바람직하게는 약 85℃ 미만의 온도에서 액체인 화합물로서 정의될 수 있다. 본 발명에서 사용된 바와 같이, 이온성 액체는 일반적으로 하나 이상의 음이온 및 하나 이상의 양이온을 포함한다. 바람직한 실시양태에서, 이온성 액체는 치환기, 예컨대, 알킬, 알켄일, 알킨일, 알콕시, 알켄옥시, 알킨옥시, 다양한 방향족, 예컨대, (치환된 또는 비치환된) 페닐, (치환된 또는 비치환된) 벤질, (치환된 또는 비치환된) 펜옥시 및 (치환된 또는 비치환된) 벤즈옥시, 및 그의 고리 부분 내에 1개, 2개 또는 3개의 헤테로원자를 갖는 치환된 또는 비치환된 다양한 헤테로환 방향족을 포함하도록 하나 이상의 화합물을 유도체화함에 의해 생성된 유기 양이온을 포함한다. 유도체화된 화합물은 이미다졸, 피라졸, 티아졸, 이소티아졸, 아자티오졸, 옥소티아졸, 옥사진, 옥사졸린, 옥사자보롤, 디티오졸, 트리아졸, 델레노졸, 옥사포스폴, 피롤, 보롤, 푸란, 티오펜, 포스폴, 펜타졸, 인돌, 인돌린, 옥사졸, 이속사졸, 이소테트라졸, 테트라졸, 벤조푸란, 디벤조푸란, 벤조티오펜, 디벤조티오펜, 티아디아졸, 피리딘, 피리미딘, 피라진, 피리다진, 피페라진, 피페리딘, 모르폴론, 피란, 아놀린, 프탈라진, 퀴나졸린, 구아니디늄, 퀴녹살린, 콜린계 유사체, 및 이들의 조합을 포함하나, 이들로 한정되지 않는다. 염기성 양이온 구조는 단일 또는 다중 치환될 수 있거나 비치환될 수 있다.
이온성 액체의 음이온성 부분은 무기 부분, 유기 부분 또는 이들의 조합을 포함할 수 있다. 바람직한 실시양태에서, 상기 음이온성 부분은 할로겐, 포스페이트, 알킬포스페이트, 알켄일포스페이트, 비스(트리플루오로메틸설포닐)이미드(NTf2), BF4 -, PF6 -, AsF6 -, NO3 -, N(CN)2 -, N(SO3CF3)2 -, 아미노산, 치환된 또는 비치환된 카르보란, 퍼클로레이트, 슈도할로겐, 예컨대, 티오시아네이트 및 시아네이트, 염화금속계 루이스산(예를 들면, 염화아연 및 염화알루미늄), 및 C1-6 카르복실레이트로부터 선택되는 하나 이상의 부분을 포함한다. 슈도할라이드(pseudohalide)는 일가이고 할리드와 유사한 성질을 갖는다. 본 발명에 따라 유용한 슈도할라이드의 예에는 시아나이드, 이소시아네이트, 시아네이트, 풀미네이트 및 아지드가 포함된다. 1 내지 6개의 탄소 원자를 함유하는 예시적 카르복실레이트는 포르메이트, 아세테이트, 프로피오네이트, 부티레이트, 헥사노에이트, 말레에이트, 푸마레이트, 옥살레이트, 락테이트, 피루베이트 등이다.
다양한 이온성 액체가 제조되어 본 발명에 따라 사용될 수 있다. 구체적으로, 전술된 양이온과 음이온의 임의의 조합이 사용될 수 있다. 하나 이상의 양이온(예컨대, 전술된 양이온)을 하나 이상의 음이온(예컨대, 전술된 음이온)과 조합하여 본 명세서에서 기재된 조건 하에 액체인 물질을 형성하는 것이 필요할 뿐이다. 예를 들면, 양이온성 이미다졸륨 부분을 음이온성 할로겐 부분과 조합하여 요구되는 조건 하에 액체이고(예를 들면, 1-부틸-3-메틸-이미다졸륨 클로라이드) 실질적으로 완전히 이온성 부분으로 형성되는 물질을 형성할 수 있다. 따라서, 본 발명은 매우 다양한 이온성 액체의 사용을 포함하는 것임이 분명하다. 본 발명에 따라 사용될 이온성 액체의 구체적인 비제한적 예에는 1-부틸-3-메틸-이미다졸륨 클로라이드("BmimCl"); 1-알릴-3-메틸-이미다졸륨 클로라이드("AmimCl"); 1-에틸-3-메틸-이미다졸륨 클로라이드; 1-수소-3-메틸-이미다졸륨 클로라이드; 1-벤질-3-메틸-이미다졸륨 클로라이드("벤질mimC1"); 1-이소프로필-3-메틸-이미다졸륨 클로라이드; 1-m-메톡시벤질-3-메틸-이미다졸륨 클로라이드("메톡시벤질mimCl"); 1-m-메틸벤질-3-메틸-이미다졸륨 클로라이드("메틸벤질mimCl"); 1-벤질-3-메틸-이미다졸륨 클로라이드; 및 1-메틸-3-벤질-이미다졸륨 디시안아미드("벤질mimDca")가 포함된다.
또한, 본 발명은 이온성 액체의 다양한 혼합물의 사용을 포함한다. 실제로, 이온성 액체 혼합물은 맞추어진 성질, 예컨대, 점도를 갖는 이온성 액체를 제공하는 데 있어서 유용할 수 있다. 예를 들면, 벤질mimC1은 상대적으로 점성을 나타내는 이온성 액체이나, 그의 점도는 AmimC1과의 혼합에 의해 상당히 감소될 수 있다. 따라서, 이온성 액체 혼합물의 점도는 점도가 보다 높은 성분과 점도가 보다 낮은 성분의 비율을 변경시킴에 의해 조절될 수 있다.
본 발명에 따라 사용될 이온성 액체는 문헌에 따라 합성될 수 있다. 바람직하게는, 이온성 액체는 사용 전에 진공 오븐 내에서 일정한 시간, 예컨대, 약 48시간 동안 (예를 들면, 100℃에서) 건조된다. 한 실시양태에서, 이온성 액체는 주위 조건에서 고체(예를 들면, 결정)이지만 증가된 온도(예컨대, 약 30℃ 초과, 약 50℃ 초과, 약 75℃ 또는 약 100℃ 초과)에서 액체인 물질로 형성된다. 일반적으로, 결정성 물질을 적절한 용기 내에 배치하고 가열하여 용해시킬 수 있다(예를 들면, 문헌(Ionic Liquids in Synthesis, Wasserscheid, P. and Weldon, T. (Eds.), Wiley Pub.) 참조). 물론, 이온성 액체는 주위 조건에서(예를 들면, 약 20 내지 25℃의 온도에서) 액체인 물질을 포함할 수도 있다.
여과 및/또는 크로마토그래피
가용화된 실크 단백질을 농축시킬 수 있고, 전하, 친수성, 친화성, 가용성 또는 안정성, 또는 크기를 기초로 하여 불순물, 예컨대, 계면활성제, 이온성 액체 및 다른 세포 성분들로부터 분리할 수 있다. 분리 기법의 비제한적 예에는 황산암모늄 침전, 크로마토그래피 및 막 여과(접선 유동 막 여과를 포함함)가 포함된다. 분리를 위해 크로마토그래피를 사용하는 실시양태에서, 예시적 방법은 이온 교환(양이온성 또는 음이온성), 친화성 크로마토그래피, 친수성-상호작용, 소수성-상호작용, 크기 배제 및 겔-투과를 포함한다(미국 특허 제6,248,570호 참조).
일부 실시양태들에서, 분리는 단일 통과, 데드-엔드(dead-end), 직접 유동 여과(DFF), 및 교차유동 또는 접선 유동 여과(TFF)와 같은 방법을 포함하나 이들로 한정되지 않는 막 여과에 의해 수행될 수 있다. 본 발명에 따르면, 여과는 정의된 범위의 공극 크기를 갖는 반투과성 막을 사용하여 크기에 따라 분자를 분리하는 원리를 기초로 한다. 여과 방법과 막 종류의 조합이 분리에서 사용될 수 있음이 당업자에게 공지되어 있다.
본 발명에 따르면, 막 여과는 중합체 또는 무기 막에 의해 수행되는 세포 성분의 분리이다. 당업계에는 담체 액체로부터 제거될 물질의 크기에 의해 정의된 4개의 통상적으로 허용되는 카테고리의 막이 존재한다. 가장 작은 공극 크기부터 가장 큰 공극 크기까지 막을 통해 순차적으로 여과하는 방법은 역삼투(RO), 나노여과(NF), 한외여과(UF) 및 미세여과(MF)이다.
전술된 막을 사용하는 여과는 특정 공극 크기를 갖는 막을 사용하여 분자들을 그들의 분자량에 따라 분리한다. 예를 들면, 공극 크기가 0.001 ㎛ 미만인 RO 막을 사용하는 분리는 분자량이 200 달톤 미만인 분자들을 분리하기 위한 것이다. 공극 크기가 0.001 ㎛ 내지 0.008 ㎛인 NF 막을 사용하는 여과는 분자량이 200 달톤 내지 15 킬로달톤(kDa)인 분자들을 분리하기 위한 것이다. 공극 크기가 0.005 ㎛ 내지 0.1 ㎛인 UF 막을 사용하는 여과는 분자량이 5 kDa 내지 300 kDa인 분자들을 분리하기 위한 것이다. 공극 크기가 0.05 ㎛ 내지 3.0 ㎛인 미세여과 막을 사용하는 여과는 분자량이 100 kDa 내지 3000 kDa 이상인 분자들을 분리하기 위한 것이다.
본 발명에 따르면, 막 여과는 막의 공극 크기에 의해 결정되는 특정 분자량 컷-오프(MQWCO)를 갖는 막을 사용함으로써 크기 배제를 기초로 하여 다른 성분들로부터 가용화된 실크 단백질을 분리할 수 있다. 공칭 분자량 한계(NMWL) 또는 공칭 분자량 컷-오프(NMWCO)로도 지칭되는 MWCO는 막에 의해 여과를 위한 킬로달톤 크기 명칭이다. MWCO는 막에 의해 90% 보유되는 분자의 분자량으로서 정의된다. 예를 들면, 동일한 분자량의 분자들이 상당히 상이한 형태를 가질 수 있기 때문에, MWCO는 정확한 측정치가 아니지만 그럼에도 불구하고 유용한 측정치이고 필터 제조자에 의해 통상적으로 사용된다. 소수성 막 및 친수성 막 둘 다가 본 발명에서 사용될 수 있다. 이러한 막들은 평평한 시트로서 사용될 수 있거나 나선형으로 감긴 구조로 사용될 수 있다. 중공(hollow) 섬유도 사용될 수 있다. UF 막의 조성과 관련하여, 재생된 셀룰로스, (그의 고유 소수성을 변경시키도록 변형될 수 있거나 변형되지 않을 수 있는) 폴리에테르 설폰, 폴리비닐리덴 플루오라이드, 및 세라믹 및 금속 산화물 응집체를 포함하나 이들로 한정되지 않는 임의의 수의 잠재적 막 물질들이 사용될 수 있다. 많은 폴리에테르 설폰 UF 막들이 0.5 내지 13의 pH 범위 및 85℃ 이하의 온도를 견딜 수 있다. MF 막을 위한 물질은 UF 막을 위해 사용되는 모든 것들뿐만 아니라 폴리카르보네이트, 폴리프로필렌, 폴리에틸렌 및 PTFE(TEFLON™)를 포함한다.
일부 실시양태들에서, 큰 세포 데브리스를 보다 작은 세포 성분들로부터 분리하여 상기 세포 데브리스가 막 또는 크로마토그래피의 사용을 수반하는 속행되는 분리 및 정제 단계를 방해하지 않도록 가용화된 실크 단백질을 여과할 수 있다. 이 실시양태들에서, 투과물은 실크 단백질을 포함하고 회수된다.
일부 실시양태들에서, 막은 적절한 MWCO를 갖는 분리 단계에서 사용될 수 있다. 예를 들면, 본 발명의 방법에서 사용되는 전형적인 실크 단백질의 MW는 약 30 kDa이다. 이 실시양태들에서, 보유물은 실크 단백질을 포함하고 회수될 수 있다.
바람직한 실시양태에서, 접선 유동 여과는 실크 단백질을 정용투석하고 농축하도록 작용한다. TFF에서, 전형적으로, 용액은 여과 막에 평행하게 유동한다. 막을 가로지르는 압력 차이는 유체 및 여과가능한 용질(이의 분자량은 막의 분자량보다 적거나 막의 분자량보다 적은 것처럼, 예컨대, 구형 단백질처럼 거동함)이 필터를 통과하여 유동하게 한다. HPTFF(고성능 접선 유동 여과)에서, 막은 하전되어 있으므로 오염물질을 분리하기 위해 분자의 크기 및 전하 둘 다를 사용한다(미국 특허공보 제2003022921호 참조). 본 발명에 따르면, 정용여과는 불연속적 또는 연속적 정용여과일 수 있다. 불연속적 정용여과에서, 용액은 농축되고, 손실된 부피는 새로운 완충제로 교체된다. 연속적 정용여과에서, 오래된 완충제 용액이 제거되면서, 용액 부피는 새로운 완충제 용액의 유입 유동에 의해 유지된다. 일부 실시양태들에서, 실크 단백질의 분리 및 정제는 한외여과 막을 사용하는 접선 유동 여과 방법에 의해 수행될 수 있다.
용도
본 발명의 방법을 이용하여 제조한 실크 도프는 넓고 다양한 다수의 의료적, 군사적, 산업적 및 상업적 적용을 위해 사용될 수 있다. 예를 들면, 상기 실크 도프는 의료 장치, 예컨대, 봉합사, 피부 이식편, 세포 성장 매트릭스, 교체 인대 및 수술 메쉬; 및 광범위한 산업적 및 상업적 제품, 예를 들면, 케이블, 로프, 그물, 낚시줄, 의류 직물, 방탄 조끼 라이닝(lining), 용기 직물, 배낭, 바랑, 가방 또는 지갑 끈, 부착 결합재, 비부착 결합재, 끈 재료, 텐트 직물, 방수천, 풀(pool) 덮개, 차량 덮개, 울타리 재료, 밀봉제, 건축 재료, 내후 재료, 가요성 분획 재료, 스포츠 장비; 및 높은 인장 강도 및 탄성이 원하는 특성인 거의 임의의 용도의 섬유 또는 직물의 제조에서 사용될 수 있는 실크 섬유를 제조하는 데 사용된다. 또한, 실크 도프는 개인 관리 제품, 예컨대, 화장품, 피부 관리, 모발 관리 및 모발 염색을 위한 조성물의 제조; 및 입자, 예컨대, 안료의 코팅에서 사용된다.
실크는 그의 천연 형태로 사용될 수 있거나 보다 유리한 효과를 제공하는 유도체를 형성하도록 변형될 수 있다. 예를 들면, 실크는 미국 특허 제5,981,718호 및 미국 특허 제5,856,451호에 기재된 바와 같이 알레르겐성을 감소시키기 위해 중합체에 접합시킴에 의해 변형될 수 있다. 적절한 변형 중합체는 폴리알킬렌 옥사이드, 폴리비닐 알코올, 폴리-카르복실레이트, 폴리(비닐피롤리돈) 및 덱스트란을 포함하나, 이들로 한정되지 않는다. 또 다른 예에서, 실크는 다른 단백질 변형제의 선택적 분해 및 스플라이싱(splicing)에 의해 변형될 수 있다. 예를 들면, 실크 단백질은 약 60℃의 승온에서 산을 사용한 처리에 의해 보다 작은 펩티드 단위체로 절단될 수 있다. 유용한 산은 묽은 염산, 황산 또는 인산을 포함하나, 이들로 한정되지 않는다. 대안적으로, 실크 단백질의 분해는 염기, 예컨대, 수산화나트륨을 사용한 처리에 의해 수행될 수 있거나, 또는 적절한 프로테아제를 사용한 효소적 분해가 사용될 수 있다.
상기 단백질은 개인 관리 제품을 위한 특정 적용에서 유리한 성능 특성을 제공하도록 추가로 변형될 수 있다. 개인 관리 제품에서 사용되기 위한 단백질의 변형은 당업계에 잘 공지되어 있다. 예를 들면, 통상적으로 사용되는 방법은 미국 특허 제6,303,752호, 미국 특허 제6,284,246호 및 미국 특허 제6,358,501호에 기재되어 있다. 변형의 예에는 수-유 에멀션 증강을 촉진하기 위한 에톡실화, 친유적 상용가능성을 제공하기 위한 실옥실화, 및 비누 및 세제 조성물과의 상용가능성에서 도움을 주기 위한 에스테르화가 포함되나, 이들로 한정되지 않는다. 또한, 실크 단백질은 아민, 옥시란, 시아네이트, 카르복실산 에스테르, 실리콘 공폴리올, 실록산 에스테르, 사급화된 아민 지방족, 우레탄, 폴리아크릴아미드, 디카르복실산 에스테르 및 할로겐화된 에스테르를 포함하나 이들로 한정되지 않는 작용기로 유도체화될 수 있다. 또한, 실크 단백질은 디이민과의 반응 및 금속 염의 형성에 의해 유도체화될 수 있다.
"폴리펩티드"(및 "단백질")의 상기 정의와 일치하여, 이러한 유도체화된 및/또는 변형된 분자는 넓게 "폴리펩티드" 및 "단백질"로도 지칭된다.
실크 도프는 다른 종류의 섬유와 함께 방적될 수 있고/있거나 묶여질 수 있거나 편직될 수 있다. 예에는 중합체 섬유(예를 들면, 폴리프로필렌, 나일론, 폴리에스테르), 다른 식물 및 동물 공급원의 섬유 및 실크(예를 들면, 면, 울, 누에나방 또는 거미 실크), 및 유리 섬유가 포함되나, 이들로 한정되지 않는다. 바람직한 실시양태는 10% 폴리프로필렌 섬유와 함께 편직된 실크 섬유이다. 본 발명은 의료적, 산업적 또는 상업적 적용을 위한 섬유의 제조 및 생산에서 일반적으로 추구될 수 있는 임의의 원하는 특성, 예를 들면, 외관, 연성, 중량, 내구성, 방수성, 개선된 제조 비용을 향상시키기 위해 이러한 섬유 조합물의 제조가 용이하게 실시될 수 있음을 고려한다.
개인 관리 제품
화장품 및 피부 관리 조성물은 미용학적으로 허용가능한 매질 중에 유효량의 실크를 포함하는 무수 조성물일 수 있다. 이 조성물들의 용도는 피부 관리, 피부 세정, 메이크-업 및 주름방지 제품들을 포함하나, 이들로 한정되지 않는다. 화장품 및 피부 관리 조성물을 위한 실크의 유효량은 본 명세서에서 상기 조성물의 총 중량을 기준으로 약 10-4 중량% 내지 약 30 중량%, 바람직하게는 약 10-3 중량% 내지 15 중량%의 비율로서 정의된다. 이 비율은 화장품 또는 피부 관리 조성물의 종류의 함수로서 변경될 수 있다. 미용학적으로 허용가능한 매질용으로 적합한 조성물은 미국 특허 제6,280,747호에 기재되어 있다. 예를 들면, 미용학적으로 허용가능한 매질은 조성물의 총 중량을 기준으로 일반적으로 약 10 중량% 내지 약 90 중량%의 비율로 지방 물질을 함유할 수 있고, 이때 지방 층(phase)은 1종 이상의 액체, 고체 또는 반고체 지방 물질을 함유한다. 상기 지방 물질은 오일, 왁스, 검(gum) 및 소위 반죽(pasty) 지방 물질을 포함하나, 이들로 한정되지 않는다. 대안적으로, 상기 조성물은 안정한 분산액, 예컨대, 유중수 또는 수중유 에멀션의 형태일 수 있다. 또한, 상기 조성물은 항산화제, 보존제, 충전제, 계면활성제, UVA 및/또는 UVB 자외선차단제, 방향제, 비후제, 습윤화제 및 음이온성, 비이온성 또는 양쪽성 중합체, 및 염료 또는 안료를 포함하나 이들로 한정되지 않는 1종 이상의 보편적인 미용학적 또는 피부학적 첨가제 또는 보조제를 함유할 수 있다.
본 발명의 방법에 의해 제조된 실크를 포함하는 에멀션화된 물질을 사용하여 에멀션화된 화장품 및 유사 약물, 예를 들면, 세정 화장품(미용 비누, 안면 세척제, 샴푸, 린스 등), 모발 관리 제품(모발 염료, 모발 화장품 등), 기초 화장품(일반적인 크림, 에멀션, 면도 크림, 컨디셔너, 화장수, 면도 로션, 화장품 오일, 안면 마스크 등), 메이크-업 화장품(파운데이션, 눈썹 펜슬, 아이 크림, 아이 쉐도우, 마스카라 등), 방향성 화장품(향수 등), 탠닝 및 자외선차단 화장품(탠닝 및 자외선차단 크림, 탠닝 및 자외선차단 로션, 탠닝 및 자외선차단 오일 등), 손발톱 화장품(손발톱 크림 등), 아이라이너 화장품(아이라이너 등), 입술 화장품(립스틱, 립 크림 등), 구강 관리 제품(치약 등), 목욕 화장품(목욕 제품 등) 등을 제조할 수 있다.
화장품 조성물은 손발톱 관리용 제품, 예컨대, 손발톱 광택제(varnish)의 형태일 수도 있다. 손발톱 광택제는 본 명세서에서 미용학적으로 허용가능한 매질 중에 유효량의 실크를 포함하는, 손발톱의 치료 및 착색을 위한 조성물로서 정의된다. 손발톱 광택제 조성물에서 사용될 실크의 유효량은 본 명세서에서 상기 광택제의 총 중량을 기준으로 약 10-4 중량% 내지 약 30 중량%의 비율로서 정의된다. 손발톱 광택제를 위한 미용학적으로 허용가능한 매질의 성분들은 미국 특허 제6,280,747호에 기재되어 있다. 손발톱 광택제는 전형적으로 용매 및 필름 형성 물질, 예컨대, 셀룰로스 유도체, 폴리비닐 유도체, 아크릴산 중합체 또는 공중합체, 비닐 공중합체 및 폴리에스테르 공중합체를 함유한다. 상기 조성물은 유기 또는 무기 안료도 함유할 수 있다.
모발 관리 조성물은 본 명세서에서 미용학적으로 허용가능한 매질 중에 유효량의 실크를 포함하는, 샴푸, 컨디셔너, 로션, 에어로졸, 겔 및 무스를 포함하나 이들로 한정되지 않는 모발 치료용 조성물로서 정의된다. 모발 관리 조성물에서 사용될 실크의 유효량은 본 명세서에서 상기 조성물의 총 중량을 기준으로 약 10-2 중량% 내지 약 90 중량%의 비율로서 정의된다. 모발 관리 조성물을 위한 미용학적으로 허용가능한 매질의 성분들은 미국 특허공보 제2004/0170590호, 미국 특허 제6,280,747호, 미국 특허 제6,139,851호 및 미국 특허 제6,013,250호에 기재되어 있다. 예를 들면, 이 모발 관리 조성물은 수성, 알코올성 또는 수성-알코올성 용액일 수 있고, 수성-알코올성 용액의 경우 알코올은 바람직하게는 총 중량을 기준으로 약 1 중량% 내지 약 75 중량%의 비율로 존재하는 에탄올 또는 이소프로판올이다. 또한, 모발 관리 조성물은 전술된 바와 같이 1종 이상의 보편적인 미용학적 또는 피부학적 첨가제 또는 보조제를 함유할 수 있다.
모발 착색 조성물은 본 명세서에서 미용학적으로 허용가능한 매질 중에 유효량의 실크를 포함하는, 모발의 착색, 염색 또는 표백을 위한 조성물로서 정의된다. 모발 착색 조성물에서 사용될 실크의 유효량은 본 명세서에서 상기 조성물의 총 중량을 기준으로 약 10-4 중량% 내지 약 60 중량%의 비율로서 정의된다. 모발 착색 조성물을 위한 미용학적으로 허용가능한 매질의 성분들은 미국 특허공보 제2004/0170590호, 미국 특허 제6,398,821호 및 미국 특허 제6,129,770호에 기재되어 있다. 예를 들면, 모발 착색 조성물은 일반적으로 무기 퍼옥시젠계(peroxygen-based) 염료 산화제와 산화가능한 착색제의 혼합물을 함유한다. 퍼옥시젠계 염료 산화제는 가장 통상적으로 과산화수소이다. 산화적 모말 착색제는 일차 중간체(예를 들면, p-페닐렌디아민, p-아미노페놀, p-디아미노피리딘, 하이드록시인돌, 아미노인돌, 아미노티미딘 또는 시아노페놀)와 이차 중간체(예를 들면, 페놀, 레소르시놀, m-아미노페놀, m-페닐렌디아민, 나프톨, 피라졸론, 하이드록시인돌, 카테콜 또는 피라졸)의 산화적 커플링에 의해 형성된다. 또한, 모발 착색 조성물은 산화 산, 격리제, 안정화제, 비후제, 완충제 담체, 계면활성제, 용매, 항산화제, 중합체, 비산화적 염료 및 컨디셔너를 함유할 수 있다.
또한, 실크는 화장품 및 코팅 조성물에서 사용될 입자의 분산성을 개선시키기 위해 안료 및 화장품 입자를 코팅하는 데 사용될 수 있다. 화장품 입자는 본 명세서에서 화장품 조성물에서 사용되는 미립자 물질, 예컨대, 안료 또는 불활성 입자로서 정의된다. 적합한 안료 및 화장품 입자는 무기 색상 안료, 유기 안료 및 불활성 입자를 포함하나, 이들로 한정되지 않는다. 무기 색상 안료는 이산화티탄, 산화아연, 및 철, 마그네슘, 코발트 및 알루미늄의 산화물을 포함하나 이들로 한정되지 않는다. 유기 안료는 D&C 레드 제36번, D&C 오랜지 제17번, D&C 레드 제7번, 제11번, 제31번 및 제34번의 칼슘 레이크, D&C 레드 제12번의 바륨 레이크, D&C 레드 제13번의 스트론튬 레이크, FD&C 옐로우 제5번의 알루미늄 레이크 및 카본블랙 입자를 포함하나, 이들로 한정되지 않는다. 불활성 입자는 탄산칼슘, 규산알루미늄, 규산칼슘, 규산마그네슘, 운모, 탈크, 황산바륨, 황산칼슘, 분말화된 나일론™, 과불소화된 알칸 및 다른 불활성 플라스틱을 포함하나, 이들로 한정되지 않는다.
실크는 치실에서도 사용될 수 있다(예를 들면, 미국 특허공보 제2005/0161058호 참조). 상기 치실은 단일필라멘트 방적사 또는 다중필라멘트 방적사일 수 있고, 섬유는 비틀려질 수 있거나 비틀려지지 않을 수 있다. 치실은 개개의 조각으로서 포장될 수 있거나, 조각을 임의의 원하는 길이로 절단하기 위한 절단기와 함께 롤 형태로 포장될 수 있다. 치실은 필라멘트 이외의 다양한 형태, 예컨대, 스트립 및 시트 등(그러나, 이들로 한정되지 않음)으로 제공될 수 있다. 치실은 다양한 물질, 예컨대, 왁스, 치실용 폴리테트라플루오로에틸렌 단일필라멘트 방적사(그러나, 이들로 한정되지 않음)로 코팅될 수 있다.
실크는 비누에서도 사용될 수 있다(예를 들면, 미국 특허공보 제2005/0130857호 참조).
안료 및 화장품 입자 코팅
안료 및 화장품 입자 코팅에서 사용될 실크의 유효량은 본 명세서에서 입자의 건조 중량을 기준으로 약 10-4 중량% 내지 약 50 중량%, 바람직하게는 약 0.25 중량% 내지 약 15 중량%의 비율로서 정의된다. 사용될 실크의 최적양은 코팅될 안료 또는 화장품 입자의 종류에 의해 좌우된다. 예를 들면, 무기 색상 안료와 함께 사용될 실크의 양은 바람직하게는 약 0.01 중량% 내지 20 중량%이다. 유기 안료의 경우, 실크의 바람직한 양은 약 1 중량% 내지 약 15 중량%이지만, 불활성 입자의 경우 바람직한 양은 약 0.25 중량% 내지 약 3 중량%이다. 코팅된 안료 및 입자의 제조 방법들은 미국 특허 제5,643,672호에 기재되어 있다. 이 방법들은 텀블링하거나 혼합하면서 실크 수용액을 입자에 첨가하는 단계, 실크와 입자의 슬러리를 형성하는 단계, 및 실크 용액을 입자 상으로 건조하거나 분무 건조하거나 실크와 입자의 슬러리를 동결건조하는 단계를 포함한다. 이 코팅된 안료 및 화장품 입자는 화장품 제제, 페인트, 잉크 등에서 사용될 수 있다.
생체의학
실크는 상처 치유를 촉진하기 위한 붕대 상의 코팅물로서 사용될 수 있다. 이 적용의 경우, 붕대 물질을 유효량의 실크로 코팅한다. 상처 치유 붕대를 목적으로 하는 경우, 실크의 유효량은 본 명세서에서 붕대 물질의 중량을 기준으로 약 10-4 중량% 내지 약 30 중량%의 비율로서 정의된다. 코팅될 물질은 임의의 연성, 생물학적 불활성 및 다공성 천 또는 섬유일 수 있다. 예에는 면, 실크, 레이온, 아세테이트, 아크릴, 폴리에틸렌, 폴리에스테르 및 이들의 조합이 포함되나, 이들로 한정되지 않는다. 천 또는 섬유의 코팅은 당업계에 공지된 다수의 방법에 의해 달성될 수 있다. 예를 들면, 코팅될 물질을, 실크를 함유하는 수용액 내로 침지시킬 수 있다. 대안적으로, 실크를 함유하는 용액을 분무 총을 이용하여 코팅될 물질의 표면 상에 분무할 수 있다. 또한, 롤러 코트 프린팅 공정을 이용하여 실크를 함유하는 용액을 표면 상에 코팅할 수 있다. 상처 붕대는 소독제, 예컨대, 요오딘, 요오드화칼륨, 포비돈 요오딘, 아크리놀, 과산화수소, 염화벤즈알코늄 및 클로로헥시딘; 경화 가속화제, 예컨대, 알란토인, 디부카인 하이드로클로라이드 및 클로로페닐아민 말레이트; 혈관수축제, 예컨대, 나파졸린 하이드로클로라이드; 수렴제, 예컨대, 산화아연; 및 딱지 생성제, 예컨대, 붕산을 포함하나 이들로 한정되지 않는 다른 첨가제를 포함할 수 있다.
실크 도프는 상처 드레싱 물질로서 필름의 형태로 사용될 수도 있다. 상처 드레싱 물질로서 비정질 필름 형태의 실크의 사용은 미국 특허 제6,175,053호에 기재되어 있다. 비정질 필름은 유효량의 실크를 함유하는, 결정도 10% 미만의 조밀한 비다공성 필름을 포함한다. 상처 관리용 필름의 경우, 실크의 유효량은 본 명세서에서 약 1 중량% 내지 99 중량%로서 정의된다. 또한, 상기 필름은 전술된 바와 같이 다른 단백질, 예컨대, 세리신, 및 소독제, 경화 가속화제, 혈관수축제, 수렴제, 및 딱지 생성제를 포함하나 이들로 한정되지 않는 다른 성분들을 함유할 수 있다. 세리신과 같은 다른 단백질은 조성물의 1 중량% 내지 99 중량%를 차지할 수 있다. 나열된 다른 성분들의 양은 바람직하게는 조성물의 중량을 기준으로 총 약 30 중량% 미만, 더욱 바람직하게는 약 0.5 중량% 내지 20 중량%이다. 상처 드레싱 필름은 전술된 물질들을 수용액에 용해시키고 불용성 물질들을 여과 또는 원심분리로 제거하고 상기 용액을 매끄러운 고체 표면, 예컨대, 아크릴판 상에 캐스트 성형한 후 건조함에 의해 제조될 수 있다.
실크 도프는 봉합사를 제조하는 데에도 사용될 수 있다(예를 들면, 미국 특허공보 제2005/0055051호 참조). 이러한 봉합사는 초고 분자량 섬유 및 실크 섬유로 만들어진 편직된 재킷의 특징이 될 수 있다. 폴리에틸렌은 강도를 제공한다. 폴리에스테르 섬유는 고분자량 폴리에틸렌과 직조되어 개선된 매듭 성질을 제공할 수 있다. 실크는 개선된 봉합사 인식 및 식별을 위한 흔적을 제공하도록 상반된 색상으로 제공될 수 있다. 또한, 실크는 다른 섬유보다 더욱 조직 순응적이어서 봉합사의 말단과 주변 조직 사이의 유해한 상호작용에 대한 우려 없이 말단이 매듭에 가깝게 절단될 수 있게 한다. 고강도 봉합사의 취급성 또한 봉합사를 코팅하는 다양한 물질을 사용하여 향상시킬 수 있다. 봉합사는 유리하게는 에티본드(Ethibond) 제5번 봉합사의 강도를 갖지만, 제2번 봉합사의 직경, 감촉 및 매듭-능력을 갖는다. 그 결과, 봉합사는 대부분의 정형외과 수술, 예컨대, 회전근개 복구, 아킬레스건 복구, 무릎힘줄 복구, ACL/PCL 재구성, 둔부 및 어깨 재구축 수술, 및 봉합사 나사못(anchor)에서 또는 봉합사 나사못과 함께 사용되는 봉합사용 대체물을 위해 이상적이다. 봉합사는 비코팅될 수 있거나, 또는 예를 들면, 노끈의 윤활성, 매듭 안전성 또는 마찰 내성을 개선하기 위해 왁스(밀랍, 석유 왁스, 폴리에틸렌 왁스 등), 실리콘(다우 코닝 실리콘 유체 202A 등), 실리콘 고무, PBA(폴리부틸레이트 산), 에틸 셀룰로스(필로델) 또는 다른 코팅물로 코팅될 수 있다.
실크 도프는 스텐트의 제조를 위해서도 사용될 수 있다(예를 들면, 미국 특허공보 제2004/0199241호 참조). 예를 들면, 관내 스텐트 및 이식편을 포함하는 스텐트 이식편이 제공되고, 이때 상기 스텐트 이식편은 실크를 포함한다. 실크는 스텐트 이식편을 수용하는 숙주에서 반응을 유도하고, 이때 상기 반응은 실크 스텐트 이식편과 이 실크 스텐트 이식편의 실크에 인접한 숙주 조직 사이의 향상된 접착을 야기할 수 있다. 임의의 다양한 수단으로, 예를 들면, 실크를 이식편 내로 섞어 직조하거나 (예를 들면, 접착제 또는 봉합사로) 실크를 이식편에 접착시킴으로써 실크를 이식편에 부착시킬 수 있다. 실크는 실, 노끈, 시트, 파우더 등의 형태로 존재할 수 있다. 스텐트 이식편 상의 실크의 위치에 대하여, 실크는 스텐트의 외부에만 부착될 수 있고/있거나, 실크는 스텐트 이식편의 원거리 영역에 부착됨으로써 숙주에서 상기 원거리 영역을 이웃하는 조직에 고착시키는 것을 보조할 수 있다. 원하는 치료 부위 및 성질에 따라 매우 다양한 스텐트 이식편이 본 발명의 내용 내에서 사용될 수 있다. 스텐트 이식편은 예를 들면, 이분된 또는 튜브 이식편, 실린더형 또는 점점 가늘어지는 이식편, 자가 팽창가능한 또는 풍선 팽창가능한 이식편, 단일체 또는 모듈형 이식편 등일 수 있다.
실크 이외에, 스텐트 이식편은 실크의 일부 또는 전부 상에 코팅물을 함유할 수 있고, 이때 코팅물은 스텐트 이식편의 삽입시 숙주 내로 분해되고, 이에 따라 코팅물은 실크와 숙주 사이의 접촉을 지연시킨다. 적합한 코팅물은 젤라틴, 분해가능한 폴리에스테르(예를 들면, PLGA, PLA, MePEG-PLGA, PLGA-PEG-PLGA, 및 이들의 공중합체 및 블렌드), 셀룰로스 및 셀룰로스 유도체(예를 들면, 하이드록시프로필 셀룰로스), 폴리사카라이드(예를 들면, 히알루론산, 덱스트란, 덱스트란 설페이트, 키토산), 지질, 지방산, 당 에스테르, 핵산 에스테르, 폴리무수물, 폴리오르토에스테르 및 폴리비닐알코올(PVA)을 포함하나, 이들로 한정되지 않는다. 실크 함유 스텐트 이식편은 생물학적 활성제(약물)를 함유할 수 있고, 이때 상기 활성제는 스텐트 이식편으로부터 방출된 후 스텐트 이식편이 삽입된 숙주에서 향상된 세포 반응(예를 들면, 세포 또는 세포외 매트릭스 침착) 및/또는 섬유형성 반응을 유도한다.
또한, 실크 도프는 생체외에서 인대 및 힘줄을 생성하기 위한 매트릭스를 제조하는 데 사용될 수 있다(예를 들면, 미국 특허공보 제2005/0089552호 참조). 실크-섬유계 매트릭스는 다능성 세포, 예컨대, 골수간질세포(BMSC)로 시딩될 수 있다. 생체공학 인대 또는 힘줄은 유리하게는 인가된 기계적 힘의 방향으로의 세포 배향 및/또는 매트릭스 주름 패턴을 특징으로 하고, 또한 기계적 힘 또는 자극이 인가되는 경우 이러한 힘 또는 자극에 의해 생성된 기계적 부하의 축을 따라 콜라겐 타입 I, 콜라겐 타입 III 및 피브로넥틴 단백질을 포함하는 인대 및 힘줄 특이적 마커의 생성을 특징으로 한다. 바람직한 실시양태에서, 인대 또는 힘줄은 나선형 구조로 정렬되는 섬유 다발의 존재를 특징으로 한다. 생성될 수 있는 인대 또는 힘줄의 일부 예에는 전방십자인대, 후방십자인대, 회전근개힘줄, 팔꿈치 및 무릎의 안쪽곁인대, 손의 굽힘힘줄, 발목의 외측인대, 및 턱 또는 턱관절의 힘줄 및 인대가 포함된다. 본 발명의 방법에 의해 제조될 수 있는 다른 조직은 연골(관절 및 반월), 골, 근육, 피부 및 혈관을 포함한다.
실크 도프는 하이드로겔의 제조에도 사용될 수 있다(예를 들면, 미국 특허공보 제2005/0266992호 참조). 실크 피브로인 하이드로겔은 이것이 조직 공학 스카폴드(scaffold), 세포 배양용 기질, 상처 및 화상 드레싱, 연질 조직 대체물, 골 충전제, 및 약학적 또는 생물학적 활성 화합물용 지지체로서 사용될 수 있게 하는 개방된 공극 구조를 특징으로 할 수 있다.
또한, 실크 도프는 피부학적 조성물의 제조에 사용될 수 있다(예를 들면, 미국 특허공보 제2005/0019297호 참조). 나아가, 상기 도프는 지속 방출 조성물의 제조에도 사용될 수 있다(예를 들면, 미국 특허공보 제2004/0005363호 참조).
직물(textile)
실크 도프는 직물에서의 추후 사용을 위한 섬유 표면용 코팅물의 제조에도 사용될 수 있다. 이것은 섬유 상의 단백질 필름 단층을 제공하여 매끄러운 마감을 발생시킨다. 미국 특허 제6,416,558호 및 제5,232,611호에는 마감처리 코트를 섬유에 부가하는 것이 기재되어 있다. 이 문헌들에 개시된 방법들은 우수한 감촉 및 매끄러운 표면을 제공하도록 섬유를 마감처리하는 다능성의 예를 제공한다. 이 적용의 경우, 섬유는 유효량의 실크로 코팅된다. 직물에서 사용될 섬유 코팅을 목적으로 하는 경우, 실크의 유효량은 본 명세서에서 섬유 물질의 중량을 기준으로 약 1 중량% 내지 약 99 중량%의 비율로서 정의된다. 섬유 물질은 면의 직물 섬유, 폴리에스테르, 예컨대, 레이온 및 라이크라™, 나일론, 울, 및 천연 실크를 포함하는 다른 천연 섬유를 포함하나, 이들로 한정되지 않는다. 실크를 섬유 상에 도포하기에 적합한 조성물은 보조용매, 예컨대, 에탄올, 이소프로판올, 헥사플루오란올, 이소티오시아노우라네이트, 및 물과 혼합되어 용액 또는 미세에멀션을 형성할 수 있는 다른 극성 용매를 포함할 수 있다. 실크 함유 용액을 섬유 상으로 분무할 수 있거나, 또는 섬유를 상기 용액 내에 침지시킬 수 있다. 필요한 것은 아니지만, 코팅된 물질의 순간(flash) 건조가 바람직하다. 대안적인 프로토콜은 실크 조성물을 직조된 섬유 상에 도포하는 것이다. 이 도포의 이상적인 실시양태는 신장될 수 있는 직물, 예컨대, 스타킹용으로 사용되는 직물을 코팅하기 위한 실크의 사용이다.
복합 재료
실크 섬유는 패널 보드 및 다른 건축 재료를 제조하기 위해 또는 목재 또는 입자 보드를 대체하는 성형된 가구 및 벤치탑을 제조하기 위해 폴리우레탄, 다른 수지 또는 열가소성 섬유에 첨가될 수 있다. 이 복합물들은 빌딩 및 자동차 구축, 특히 지붕 및 문 패널에서도 사용될 수 있다. 실크 섬유는 수지를 강화시켜 상기 물질을 더 강하게 만들고 다른 입자 보드 및 복합 재료와 동등한 또는 보다 우수한 강도를 갖는 보다 가벼운 중량의 구축을 가능하게 한다. 실크 섬유는 단리되어 합성 복합물-형성 수지에 첨가될 수 있거나, 또는 식물-유래된 단백질, 전분 및 오일과 조합되어 사용됨으로써 생물학적 복합 재료를 제조할 수 있다. 이러한 재료의 제조 공정은 일본 특허공보 제200428424호, 미국 특허공보 제2005175825호, 미국 특허 제4,515,737호, 일본 특허 제47020312호 및 국제 특허공보 제WO 2005/017004호에 기재되어 있다.
종이 첨가제
실크의 섬유 성질은 제지에 강도 질 감촉을 부가할 수 있다. 실크 종이는 면 펄프에서 실크 실 반점을 형성하여 선물 포장재, 공책 커버, 운반 가방용으로 사용되는 고도로 매끄러운 수제 종이를 제조함에 의해 제조된다. 실크 도프로부터 종이 제품을 제조하는 공정은 일본 특허공보 제2000139755호에 일반적으로 기재되어 있다.
진보된 재료
본 발명의 실크 도프로부터 제조된 실크는 상당한 인성(toughness)을 갖고 젖었을 때 이 성질을 유지함에 있어서 다른 실크보다 뛰어나다(Hepburn et al., 1979).
의류 직물 산업에서 실제적인 성장 영역은 기술적 및 기능적인 직물이다. 건강하고 고도로 기능적이고 환경 친화적이고 개성 있는 직물 제품에 대한 요구가 증가하고 있다. 젖었을 때 성질을 변화시키지 않고 특히 그의 강도 및 연신성을 유지하는 섬유, 예컨대, 본 발명의 섬유는 스포츠 및 레저 의복뿐만 아니라 작업복을 위한 기능성 의류 및 보호 의류용으로 유용하다.
무기 및 감시 기술에서의 발달은 개개의 보호 장치 및 전투-분야와 관련된 시스템 및 구조물에서 신속한 혁신이다. 보편적인 요건, 예컨대, 연장된 노출에 대한 물질 내구성, 두터운 착용 및 외부 환경으로부터의 보호 이외에, 본 발명의 실크 도프로부터 제조된 실크 직물은 탄도-발사체, 불 및 화학물질에 대한 내성을 갖도록 가공될 수 있다. 이러한 물질들의 제조를 위한 공정은 국제 특허공보 제WO 2005/045122호 및 미국 특허공보 제2005268443호에 기재되어 있다.
실시예
실시예
1 - 꿀벌
실크
단백질의 재조합 생성 및 정제
재조합 발현 구성체를 생성하기 위해, 신호 펩티드를 갖지 않는 4종의 꿀벌 실크 유전자 서열들(진뱅크 검색 번호: FJ235088. FJ235089, FJ235090, FJ235091)을, 하기 올리고뉴클레오티드 프라이머 세트를 사용하여 수터랜드(Sutherland) 등의 문헌(2006)에 기재된 cDNA 클론으로부터 PCR로 증폭하였다:
AmelFl : GGAATT C TC ATG A GT TTG GAG GGG CCG GGC AAC TCG (서열 번호 101) 및 CGGC GGATCC TTA TTA AAA TAC GTT GCT CTT CAA GT (서열 번호 102);
AmelF2: GGAATT C TC ATG A GC CGC GTG ATT AAT CAC GAG TCC CTG (서열 번호 103) 및 CGGC GGATCC TTA TTA TTC CAA CTT TGC TAC ATG TAT TTT C (서열 번호 104);
AmelF3: GGAATT C CC ATG G GC GTC GAG GAA TTC AAG TCC TCG (서열 번호 105) 및 CGGC AGATCT TTA TTA AAA TTT TTT ATC CTC AAT A (서열 번호 106); 및
AmelF4: GGAATT C CC ATG G CA AGG GAA GAG GTG GAG ACA CGG (서열 번호 107) 및 CGGC GGATCC TTA TTA CTT CAC CTC CCA TTC TTC ATT C (서열 번호 108) (클로닝 제한 효소 부위는 밑줄친 굵은 글씨체로 표시되어 있고, cDNA 서열에 일치하는 서열은 이탤릭체로 표시되어 있음).
PCR 앰플리콘(amplicon)을 pET14b 발현 벡터(노바겐)의 제한 효소 부위(AmelF1 및 AmelF2: BspH1 및 Bam HI; AmelF3: Nco1 및 Bgl II; AmelF4: Nco1 및 Bam HI) 내로 클로닝하고 서열들을 발현 전에 DNA 서열분석으로 검증하였다.
구성체를 로세타(Rosetta) 2(DE3) 전능 세포(노바겐) 내로 형질전환시키고, 실크 단백질을 진탕 플라스크 내의 50 ㎖ 밤새 발현 즉석 TB 배지(노바겐) 중에서 먼저 발현시켰다. 4종의 꿀벌 실크 단백질 AmelF1-F4를 20℃에서 이. 콜라이 세포 내에서 가용성 형태로 합성하고 30℃ 및 37℃에서 불용성 형태로 합성하였다. SDS-PAGE(도 1) 후 비교 단백질 밴드 강도에 의해 판단될 때 단백질의 최대 수율은 단백질을 봉입체로부터 회수하면서 30℃ 이상의 온도에서 연장된 기간(24시간 내지 36시간) 동안 발현을 수행하였을 때 얻어졌다. 질량 분광법으로 단백질의 종류를 확인하면서 정량적 겔 밴드 강도 분석을 수행하였을 때, 봉입체로부터 회수된 단백질은 본질적으로 순수한(>95%) 실크 단백질임이 확인되었다. 후속 분석은 봉입체로부터 가용화된 단백질이 천연 유사 구조로 자가 조립됨을 보였다. 따라서, 모든 후속 발현은 재조합 단백질이 봉입체로부터 회수되도록 하는 조건 하에 수행되었다.
단백질 수율을 증가시키기 위해, 대규모 유가 발효 공정을 개발하였고 AmelF3에 대해 최적화시켰다. 최소 배지(부피 1.6 ℓ로부터 출발함)를 사용하여 2 ℓ 바이오스타트(Biostat) B 배양 용기(사르토리우스 스테딤(Sartorius Stedim), 독일 멜순겐 소재) 내에서 발효를 수행하였다. 글루코스를 초기 탄소 공급원으로서 사용하였고 IPTG로 실크 단백질 발현을 유도한 후 탄소 공급원을 글리세롤 공급물로 교체하였다. 초기 배지는 하기 성분들을 함유하였다(1 ℓ당): KH2PO4, 13.3 g; (NH4)2HPO4, 4 g 및 시트르산 1.7 g. 배지의 pH를 2 M NaOH를 사용하여 7.0의 최종 값으로 조절하였다. 하기 성분들을 개별적으로 멸균한 후 첨가하였다(최종 배지 1 ℓ당): 40 ㎖의 50 중량/부피% 글루코스, 5 ㎖의 1 M MgSO4; 130 ㎕의 0.1 M 티아민 하이드로클로라이드; 1 ㎖의 100 mg/㎖ 앰피실린 및 5 ㎖의 비타민/미량 금속 함유 용액(용액 1 ℓ당): 바이오틴, 0.2 g; CuSO4.5H2O, 2.0 g; NaI, 0.08 g; MnSO4.H2O, 3.0 g; Na2MoO4.2H2O, 0.2 g; 붕산 0.02 g; CoCl2.6H2O, 0.5 g; ZnCl2, 7.0 g; FeSO4.7H2O, 22.0 g; CaSO4.2H2O, 0.5 g 및 H2SO4, 1 ㎖.
4종의 균주를 위한 발효 접종물을 발효기에서 사용된 배지와 동일한 배지 중에서 37℃에서 20시간 동안 배양하였다. 접종물이 발효 용기로 전달되면, 상기 배지의 pH를 조절하고 10 중량/부피% NH4OH 또는 10% 중량/부피% H3PO4를 첨가하여 7.0으로 조절하였다. 온도를 37℃로 조절하고, 교반 속도를 1100 rpm까지 조작하고 필요한 경우 순수한 산소가 공기 공급물 중에 풍부하게 함으로써 용해된 산소(DO) 농도를 40% 대기 포화도 이상으로 유지하였다.
배양물이 약 20의 600 nm(OD600nm) 값의 흡광도로 성장되었을 때(접종 후 약 10시간), IPTG를 최종 농도 1 mM까지 첨가하였다. DO의 급격한 상승(접종 후 약 12시간)에 의해 표시되는 바와 같이 글루코스의 전부가 소모될 때까지 발효기를 회분 방식으로 작동시켰다. 글리세롤 첨가 단계에서 400 ㎖의 62 부피/부피% 글리세롤 용액을 50 ㎖/h의 속도로 발효기 내로 공급하였다. 배양물을 24시간 동안 성장시킨 후, 세포를 원심분리로 수거하여 -80℃에서 저장하였다. 이 조건 하에, 발효물의 OD600nm 값은 34이었고, 가용화 후 정제된 재조합 AmelF3의 수율은 발효물 1 ℓ당 약 2.5 g이었다. 동일한 발효 조건을 이용하여 다른 꿀벌 실크 단백질을 발현시켰다. 실크 단백질 AmelF1, AmelF2 및 AmelF4를 발현하는 균주들을 각각 30, 67 및 57의 OD600nm 값까지 성장시켰다. 가용화 후 정제된 재조합 단백질 AmelF1, AmelF2 및 AmelF4의 수율은 발효물 1 ℓ당 각각 약 0.2, 1.5 및 1.9 g이었다.
최적화된 유가 발효 시스템으로부터 2.5 g/ℓ의 정제된 단백질이라는 수율은 임의의 재조합 실크 단백질에 대한 보고된 발현 수준 중에서 단연 최대의 발현 수준이다. 이러한 높은 수율에 기여하는 인자는 꿀벌 피브로인 유전자의 크기 및 성질 및 실크 단백질의 구조적 성질을 포함한다. 거미의 잘-연구된 드래그라인(dragline) 실크 및 누에의 고치 실크를 코딩하는 유전자들의 큰 크기(>10 kbp) 및 고도로 반복적인 성질과 대조적으로, 꿀벌 실크 유전자들은 그들의 DNA 서열들에서 훨씬 적은 반복을 가지면서 작다(약 1 kbp)(Sutherland et al., 2006). 보다 작은 크기 및 감소된 수준의 반복은 꿀벌 유전자들이 고도로 반복적인 뉴클레오티드 서열의 형질전환 발현으로부터 비롯된 조기 번역 종결 및 절두를 포함하는 유전적 불안정성에 민감하지 않음을 의미한다.
가용성 또는 봉입체 제조를 위한 제조자의 프로토콜에 따라 버그버스터 마스터 믹스(노바겐)로 반복적으로 처리한 후 봉입체 내의 실크 단백질을 이. 콜라이 세포로부터 정제하였다. 단백질 용액을 4% 내지 12% 구배(인비트로겐)를 사용하는 SDS 폴리아크릴아미드 겔 전기영동(SDS-PAGE)으로 분석하였다. 재조합 실크 단백질 확인은 이미 보고된 바와 같이 도립 질량 분광법으로 검증하였다(Sutherland et al., 2006).
봉입체 내의 실크 단백질을 60℃에서 2시간 동안 항온처리하여 3% 나트륨 도데실 설페이트(SDS) 중에서 가용화시켰다. 용액 중 단백질 농도를 콴티프로(QuantiPro) BCA 분석 키트(시그마)를 사용하여 측정하였다. 요구되는 경우, 4종의 재조합 꿀벌 실크 단백질 각각의 용액을 등몰 비율로 혼합하였다. KDS 침전을 야기하는 5 g/ℓ KCl 용액에 대한 투석으로 과량의 SDS를 단백질 용액으로부터 제거하였다. 침전물을 16000 g에서 5분 동안 원심분리하여 제거하였다.
실시예
2 - 푸리에 변환 적외선 분광법(
FTIR
)
푸리에 변환 적외선 분광법을 이용하여 천연 꿀벌 실크의 단백질 구조와 재조합 꿀벌 실크의 단백질 구조를 비교하였다. 천연 꿀벌 실크 시트를 상업용 꿀벌통으로부터 수득하여 클로로포름 중에서 광범위하게 세척하여 왁스를 제거하고 온수 중에서 광범위하게 세척하여 수용성 오염물질들을 제거하였다. 4종의 재조합 꿀벌 실크 단백질 각각의 용액을 등몰 비율로 혼합하고, 필름으로 캐스트 성형하고 건조하였다. 이 샘플들로부터의 적외선 스펙트럼을, i-시리즈 이미징 적외선 현미경 부속품이 장착된 퍼킨-엘머 시스템 2000 푸리에 변환 분광계를 이용하여 전달 모드로 얻었다. 스펙트럼은 스펙트럼 소프트웨어(버젼 5.3.1)의 이용에 의해 수집되었고 4 cm-1의 해상도로 수집된 256개 스캔의 평균을 나타내었다. 수집 후 데이터 조작 및 분석을 그램스(Grams)/AI 소프트웨어 v5.05를 이용하여 수행하였다. 각각의 실크 스펙트럼에 대한 아미드 I 영역의 탈회전은 도 2에 도시되어 있다. 결과 및 구성 이차 구조 배정의 요약은 표 2에 제시되어 있다.
FTIR 곡선 피팅 요약 | ||||
천연 꿀벌 실크 | 재조합 실크 | |||
주파수(cm-1) | 아미드 I 영역(%) | 주파수(cm-1) | 아미드 I 영역(%) | 배정 |
1717 | 1710 | COOH | ||
1693 | 1693 | 측쇄 | ||
1670 | 25 | 1673 | 30 | β-시트 및 측쇄 |
1651 | 23 | 1655 | 26 | 코일드 코일 |
1642 | 13 | 1643 | 7 | 코일드 코일 |
1628 | 29 | 1632 | 26 | 코일드 코일 |
1604 | 10 | 1610 | 11 | β-시트 |
FTIR 결과는 천연 꿀벌 실크가 이전의 서열에 기초한 예측과 일치하는 약 65% 코일드 코일 구조를 함유함을 암시한다(Sutherland et al., 2006). 재조합 실크 스펙트럼은 천연 실크 스펙트럼과 매우 유사하고, 재조합 실크는 59% 코일드 코일 구조를 함유하는 것으로 평가된다.
실시예
3 - 건식 방적
봉입체를 3% SDS 중에서 가용화시켜 일반적으로 0.5 중량% 내지 2 중량%의 단백질 및 3 중량% 이하의 단백질로 구성된 가용성 꿀벌 피브로인 용액을 얻었다. KCl 침전으로 과량의 SDS를 실크 단백질 용액으로부터 제거하였다. 칼륨 침전은 (침전물의 중량을 측정하였을 때) SDS의 95% 이하, 예컨대, 70% 내지 80%를 제거하였으나 (용액 중 단백질 농도를 측정하였을 때) 10% 미만의 단백질을 제거하였다. 꿀 유사 점도(약 10 중량% 내지 15 중량% 단백질)가 얻어질 때까지 실크 용액을 20 중량% 폴리에틸렌 글리콜(PEG, MW 8000, 시그마) 또는 슬라이드-A-라이저(Slide-A-Lyzer) 농축 용액에 대한 연장된 투석으로 농축하였다. 공기 중에서 한 방울의 농축된 실크 도프를 한 쌍의 족집게의 뾰족한 말단 사이에 매달리게 하고 상기 족집게를 개방하여 미세한 실을 형성하였다(도 3A). 이러한 단회 연신 실은 공기 중에서 안정하였지만 물에 용해되었다. 그 다음, 섬유를 90% 메탄올 및 10% 물이 함유된 배쓰(bath) 내에 담구고 약 2배 길이로 다시 한번 연신하고 공기 건조하였다(도 3B). 이중 연신 실은 물에서 가용성을 나타내지 않았다. 단회 연신 섬유 및 이중 연신 섬유를 편광 렌즈를 갖는 광학 현미경 및 제이스(Zeiss) EVO LS15 환경 스캐닝 전자 현미경으로 조사하였다.
ESEM에 의해 이미지화된 재조합 실크 실(도시되지 않음)은 횡단면에서 원형이었고 그의 길이를 따라 직경에서 꽤 균일하였다. 단회 연신 섬유는 염 결정일 수 있는 그의 표면에 부착하는 작은 본체를 가졌으나, 이중 연신 섬유는 매끄러운 표면을 가졌다. 편광 광학 현미경은 단회 연신 섬유가 복굴절을 나타내지 않으나, 이중 연신된 섬유가 강한 복굴절을 나타냄을 보여주었다(도 3).
단회 연신 섬유, 이중 연신 섬유 및 재조합 실크 필름을 호주 신크로트론(Synchrotron)의 SAXS/WAXS 광선에서 광시야각 x-선 산란으로 분석하였다. 0.886 Å의 파장 및 0.558 m의 카메라 길이는 약 0.07 Å-1 내지 1.4 Å-1의 q-범위를 제공하였고, 상기 q-범위를 은 베헤네이트 표준물을 사용하여 보정하였다. 상기 필름 및 단회 연신 섬유에 대한 WAXS 패턴은 SDS 결정으로부터의 강한 신호에 의해 지배되었으나, 이것은 이중 연신 섬유에서는 검출될 수 없었다. 따라서, 본 발명자들은 이중 연신된 실이 단회 연신 실에서 발견된 단위 길이당 0.1% 미만의 SDS 결정을 함유한다고 계산하였다. 재조합 실크로부터의 단백질 산란 패턴은 기법의 강한 SDS 회절 제한 민감성으로 인해, 또는 매우 미세한 이중 연신된 섬유의 경우 낮은 신호-대-노이즈(noise) 비율로 인해 분석될 수 없었다.
재조합 꿀벌 실크 실의 강도 및 연신성을 인스트론 인장성 시험기 모델 4501 상에서 2.5 mm/분의 속도로 측정하였다. 시험을 21℃ 및 65% 상대 습도에서 공기 중에서 수행하였다. 시험 전에, 각각의 섬유를 플라스틱 틀 내에 3 mm 홈을 가로질러 배치하고 에폭시 아교(glue)로 고정시켰다. 각각의 섬유의 게이지 길이(Lo) 및 직경을 광학 현미경 상에서 측정하였다. 표 3은 재조합 실크 섬유의 기계적 성질을 꿀벌 실크선으로부터 연신된 천연 섬유의 기계적 성질과 비교한다.
천연 섬유와 비교된 재조합 꿀벌 실크 섬유의 인장성 | ||||
직경(㎛) | 파단 응력(MPa) | 파단 변형률(%) | 실제 파단 응력(MPa) | |
단회 연신 섬유 | 30±5 | 15±3 | 225±10 | 50±12 |
이중 연신 섬유 | 13±7 | 150±39 | 47±26 | 213±63 |
천연 섬유 (Hepburn, 1979) |
9 | 132 | 204 | 400 |
실시예
4 - 습식 방적
실크 단백질을 일반적으로 실시예 1에 기재된 바와 같이 제조하였다. 일반적으로, SDS 가용화 후 단백질 농도는 약 3% 실크 단백질이었다. 단백질 용액이 보다 낮은 농도를 갖는 경우, 상기 단백질 용액은 이 용액이 3% 내지 6% 실크 단백질을 함유할 때까지 20 중량% 폴리에틸렌 글리콜(PEG, MW 8000, 시그마) 또는 슬라이드-A-라이저 농축 용액(피어스)에 대한 연장된 투석에 의해 농축되었다.
AmelF1-4의 등몰 혼합물들 각각 또는 AmelF3 단독의 농축된 단백질 용액들을 10 cm x 100 ㎛ 모세관 튜빙을 통해 10 m/분의 속도로 메탄올 용액(50% 내지 90% 메탄올) 내로 압출하여 미세하고 연속적인 실이 형성되게 하였다. 상기 실을 공기 중에서 건조하고 편광 렌즈를 갖는 광학 현미경으로 조사하였다. 상기 실은 이 실 내의 단백질들이 지향적으로 정렬되어 있음을 표시하는 상당한 복굴절을 보였다(도 4A). 공기 건조된 섬유를 90% 메탄올 및 10% 물이 함유된 배쓰 내에 담구고 약 2배 길이(도 4B) 또는 4배 길이(도 4C)로 다시 한번 연신시키고 공기 건조하였다. 재조합 꿀벌 실크 실의 강도 및 연신성을 인스트론 인장성 시험기 모델 4501 상에서 2.5 mm/분의 속도로 측정하였다. 시험을 21℃ 및 65% 상대 습도에서 공기 중에서 수행하였다. 시험 전에, 각각의 섬유를 플라스틱 틀 내의 3 mm 홈을 가로질러 배치하고 에폭시 아교로 고정시켰다. 각각의 섬유의 게이지 길이(Lo) 및 직경을 광학 현미경 상에서 측정하였다.
표 4 및 5는 연신되지 않은 재조합 실크 섬유의 기계적 성질을 보여준다. 연신은 물에서 더 강하고 불용성을 나타내며 높은 복굴절을 갖는 실을 생성하였다.
연신하거나 연신하지 않으면서 농축된 실크 단백질 도프를 메탄올 내로 압출한 후 재조합 꿀벌 실크 섬유의 인장성 |
|||
직경(㎛) | 파단 응력(MPa) | 파단 변형률(%) | |
연신되지 않은 섬유 (4종의 단백질의 등몰 혼합물) |
22-39 | 70-78 | 200-250 |
2배 길이로 연신된 섬유 (4종의 단백질의 등몰 혼합물) |
17-22 | 50-92 | 80-160 |
4배 길이로 연신된 섬유 (4종의 단백질의 등몰 혼합물) |
19-21 | 150-161 | 38-91 |
연신되지 않은 섬유(AmelF3) | 39-41 | 39-53 | 256-275 |
2배 길이로 연신된 섬유(AmelF3) | 32-42 | 68-80 | 88-211 |
4배 길이로 연신된 섬유(AmelF3) | 28-30 | 99-117 | 131-154 |
꿀벌 실크 섬유의 기계적 성질 | |||||
제작 방법 | 구성 단백질 | 직경(㎛) | 파단 응력(MPa) | 파단 변형률(%) | 인성(MPa) |
70% MeOH 내로 압출됨 | AmeF1-4 AmeF3 |
31±2 45±2 |
70±4 50±3 |
190±11 243±10 |
91±7 105±6 |
70% MeOH 내로 압출된 후 90% MeOH에서 약 100% 연신됨 | AmeF1-4 AmeF3 |
21±1 34±2 |
133±11 97±7 |
94±11 129±15 |
85±9 97±10 |
70% MeOH 내로 압출된 후 90% MeOH에서 약 300% 연신됨 | AmeF1-4 AmeF3 |
17±1 23±1 |
203±10 178±20 |
51±5 68±9 |
70±8 85±18 |
천연3 | 천연 | 9 | 132 | 204 | NG |
1d0 및 d1이 초기 섬유의 직경 및 연신된 섬유의 직경인 경우 (d0/d1)2로서 계산된다. |
실시예
5- 원형 이색성(
CD
)
AmelF3 꿀벌 실크 단백질을 이. 콜라이의 봉입체 내로 발현시켰다. 등가 건조 중량의 세제 나트륨 도데실 설페이트(SDS)를 사용하여 AmelF3 봉입체를 언폴딩(unfolding)시켜 2% 내지 4%의 단량체 단백질 용액을 생성하였다. 동적 광 산란(DLS)은 100 mM NaCl 중에 10배 희석된 단백질-세제 용액 중 입자의 수력학적 직경을 9.2 +/- 0.1 nm(98.2%의 입자 부피를 함유하는 피크)로서 측정하였다. 동일한 실험 조건 하에 단백질을 갖지 않은 3% SDS 용액 중 SDS 마이셀(micelle)의 직경은 5.5 +/- 0.2 nm에서 단일 피크였다. SDS-단백질 용액에서 SDS 마이셀이 전혀 검출되지 않았는데, 이것은 SDS의 대다수가 단백질에 결합됨을 확인시켜준다.
KCl을 사용하여 SDS를 제거함으로써 단백질을 리폴딩(refolding)시켰다. 칼륨 도데실 설페이트는 SDS보다 상당히 더 낮은 가용성을 갖고 용액으로부터 침전되고, 원심분리에 의해 제거될 수 있다. 단백질 용액을 물에 대해 투석하여 염 농도를 감소시킨 후 PEG8000에 대한 투석으로 농축시켜 3% 내지 4% 단백질 및 0.2% 내지 0.4% SDS 농도를 발생시켰다. AmelF3 용액이 (생리학적 염 농도와 유사한) 100 mM NaCl 중에서 10배 희석되었을 경우, 입자 직경은 AmelF3 코일드 코일에 대해 계산된 대략적인 입자 직경과 일치하는 20.3 +/- 0.7 nm(86.8%의 입자 부피를 함유하는 피크)까지 증가되었다.
0.01 mm 경로 길이 샌드위치 석영 셀(노바 바이오테크, 미국 캘리포니아주 엘 카존 소재) 내에 보유된 꿀벌 AmelF3 용액(0.12%)의 CD 스펙트럼을, 온도 조절기를 갖는 아비브(AVIV) 모델 410 분광계(아비브 바이오메디칼 인코포레이티드, 미국 뉴저지주 레이크우드 소재)를 이용하여 수집하였다. 모든 샘플들을 260 nm부터 180 nm까지 1 nm 밴드폭으로 25℃에서 스캐닝하고, 결과의 평균을 4회 반복된 실험으로부터 산출하였다. AmelF3 용액의 CD 스펙트럼은 220 nm 및 209 nm에서 강한 스펙트럼 최소치를 보였고 코일드 코일 구조를 지지하는 1.02의 220 nm/209 nm 비율을 보였다. 1 이상의 220 nm/209 nm 비율은 코일드 코일을 표시하는 반면, 0.86 미만의 비율은 단리된 나선을 표시한다. DLS 측정은 SDS를 AmelF3 용액에 다시 첨가한 후에 수력학적 입자 직경이 원래의 단량체 용액에서 관찰된 크기로 감소함을 표시하였는데, 이것은 단백질이 천연 유사 실크 단백질 구조로 폴딩됨에 있어서 대부분의 SDS의 제거가 필요조건임을 확인시켜준다. AmelF3 단백질과 대조적으로, 아피스 세라나(Apis cerana)로부터의 상동성 단백질의 His-태깅된 재조합 형태들(versions)은 유사한 농도에서 단량체 상태 및 우세하게 랜덤 코일 상태로 남아 있었다(Shi et al., 2008). 이 결과는 낮은 수준의 SDS의 존재 하에 제조된 경우 AmelF3만이 천연 유사 실크 분자 구조를 채택하도록 폴딩됨을 보여준다.
넓게 기재된 본 발명의 사상 또는 범위로부터 벗어나지 않으면서 특정 실시양태들에서 나타낸 본 발명에 다수의 변경 및/또는 변형을 가할 수 있음이 당업자에 의해 인식될 것이다. 따라서, 본 실시양태들은 모든 면에서 예시적이지만 제한적이지 않은 것으로 간주되어야 한다.
본원은 2009년 8월 26일자로 출원된 미국 특허출원 제61/237,156호 및 2010년 3월 19일자로 출원된 미국 특허출원 제61/315,812호로부터 우선권을 주장하고, 상기 특허출원 둘 다의 전체 내용은 본원에 참고로 도입된다.
본 명세서에서 논의되고/되거나 참조된 모든 문헌들은 전체로서 본원에 참고로 도입된다.
본 명세서에 포함된 문헌, 행위, 물질, 장치, 논문 등의 임의의 논의는 본 발명에 대한 내용을 제공하기 위한 것일 뿐이다. 상기 논의는 임의의 또는 모든 이들 사항들이 본원의 우선일 전에 존재하기 때문에 선행기술 기초의 일부를 형성하거나 본 발명과 관련된 분야에서 공통된 일반적인 지식임 인정하는 것으로서 해석되어서는 안 된다.
SEQUENCE LISTING
<110> Commonwealth Scientific and Industrial Research
Organization
<120> Processes for producing silk dope
<130> 509839
<150> 61/237,156
<151> 2009-08-26
<150> 61/315,812
<151> 2010-03-19
<160> 108
<170> PatentIn version 3.5
<210> 1
<211> 314
<212> PRT
<213> Apis mellifera
<400> 1
Gly Leu Glu Gly Pro Gly Asn Ser Leu Pro Glu Leu Val Lys Gly Ser
1 5 10 15
Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg
20 25 30
Ala Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val Leu Gln Ala
35 40 45
Gln Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala Ala Asp Leu
50 55 60
Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser Gln Ala Ala
65 70 75 80
Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln Ala Arg Ala
85 90 95
Gly Leu Glu Ser Val Ser Met Ala Ala Ser Ala Thr Ser Ala Ala Lys
100 105 110
Glu Ala Ser Thr Ala Ala Lys Ala Ala Ala Ser Ala Leu Ser Thr Ala
115 120 125
Val Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala Glu Ala Val
130 135 140
Ala Ser Asp Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala Asn Leu Ala
145 150 155 160
Ala Glu Ala Ser Val Ala Ala Glu Ala Ala Leu Lys Ala Glu Lys Val
165 170 175
Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala Ala Ala Arg
180 185 190
Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala Thr Ala Ser
195 200 205
Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val Ala Val Leu
210 215 220
Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala Ala Ser Ser
225 230 235 240
Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn Val Glu Thr
245 250 255
Ala Thr Ile Gly Ala Asn Ile Asn Ser Ser Lys Gln Val Val Ser Ile
260 265 270
Pro Val Glu Ile Lys Lys Phe Ser Glu Pro Glu Val Ser Thr Ser Trp
275 280 285
Arg Glu Asp Glu Glu Val Thr Lys Glu Lys Lys Glu His Ile Asn Leu
290 295 300
Asn Asp Phe Asp Leu Lys Ser Asn Val Phe
305 310
<210> 2
<211> 333
<212> PRT
<213> Apis mellifera
<400> 2
Met Lys Ile Pro Val Leu Leu Ala Thr Cys Leu Tyr Leu Cys Gly Phe
1 5 10 15
Ala Ser Ala Gly Leu Glu Gly Pro Gly Asn Ser Leu Pro Glu Leu Val
20 25 30
Lys Gly Ser Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser
35 40 45
Gly Leu Arg Ala Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val
50 55 60
Leu Gln Ala Gln Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala
65 70 75 80
Ala Asp Leu Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser
85 90 95
Gln Ala Ala Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln
100 105 110
Ala Arg Ala Gly Leu Glu Ser Val Ser Met Ala Ala Ser Ala Thr Ser
115 120 125
Ala Ala Lys Glu Ala Ser Thr Ala Ala Lys Ala Ala Ala Ser Ala Leu
130 135 140
Ser Thr Ala Val Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala
145 150 155 160
Glu Ala Val Ala Ser Asp Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala
165 170 175
Asn Leu Ala Ala Glu Ala Ser Val Ala Ala Glu Ala Ala Leu Lys Ala
180 185 190
Glu Lys Val Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala
195 200 205
Ala Ala Arg Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala
210 215 220
Thr Ala Ser Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val
225 230 235 240
Ala Val Leu Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala
245 250 255
Ala Ser Ser Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn
260 265 270
Val Glu Thr Ala Thr Ile Gly Ala Asn Ile Asn Ser Ser Lys Gln Val
275 280 285
Val Ser Ile Pro Val Glu Ile Lys Lys Phe Ser Glu Pro Glu Val Ser
290 295 300
Thr Ser Trp Arg Glu Asp Glu Glu Val Thr Lys Glu Lys Lys Glu His
305 310 315 320
Ile Asn Leu Asn Asp Phe Asp Leu Lys Ser Asn Val Phe
325 330
<210> 3
<211> 290
<212> PRT
<213> Apis mellifera
<400> 3
Arg Val Ile Asn His Glu Ser Leu Lys Thr Ser Glu Asp Ile Gln Gly
1 5 10 15
Gly Tyr Ser Ala Gly Ile Val Gly Asp Gly Ser Asp Ala Leu Gly Ser
20 25 30
Ser Ile Glu Asn Ala Gln Lys Val Ala Arg Ala Ala Glu Asn Val Gly
35 40 45
Leu Asn Leu Glu Leu Gly Ala Gly Ala Arg Ala Ala Ser Val Ala Ala
50 55 60
Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Ala Gly Ala Asn Ala
65 70 75 80
Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser
85 90 95
Glu Ile Ala Asn Gln Leu Leu Thr Asn Ala Ala Lys Ala Ala Glu Ala
100 105 110
Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala Ala Ala Lys
115 120 125
Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala Thr Glu Ala
130 135 140
Gln Val Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg Ala Ala Ile
145 150 155 160
Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala Ala Ile Ala
165 170 175
Arg Lys Ser Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile Ala Ala Ala
180 185 190
Ala Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Val Val Ala Leu
195 200 205
Thr Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala Gln Ala Asn
210 215 220
Ala Ser Thr Gln Ala Ser Met Ala Val Arg Val Asp Ser Gln Ala Ala
225 230 235 240
Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr
245 250 255
Ala Glu Ala Val Ala Ala Ala Glu Ala Glu Val Ala Asn Lys Ala Ala
260 265 270
Thr Phe Ala Lys Gln Ile Val Asn Glu Lys Lys Ile His Val Ala Lys
275 280 285
Leu Glu
290
<210> 4
<211> 309
<212> PRT
<213> Apis mellifera
<400> 4
Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Val Trp Gly Leu
1 5 10 15
Ala Glu Gly Arg Val Ile Asn His Glu Ser Leu Lys Thr Ser Glu Asp
20 25 30
Ile Gln Gly Gly Tyr Ser Ala Gly Ile Val Gly Asp Gly Ser Asp Ala
35 40 45
Leu Gly Ser Ser Ile Glu Asn Ala Gln Lys Val Ala Arg Ala Ala Glu
50 55 60
Asn Val Gly Leu Asn Leu Glu Leu Gly Ala Gly Ala Arg Ala Ala Ser
65 70 75 80
Val Ala Ala Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Ala Gly
85 90 95
Ala Asn Ala Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile
100 105 110
Lys Ala Ser Glu Ile Ala Asn Gln Leu Leu Thr Asn Ala Ala Lys Ala
115 120 125
Ala Glu Ala Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala
130 135 140
Ala Ala Lys Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala
145 150 155 160
Thr Glu Ala Gln Val Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg
165 170 175
Ala Ala Ile Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala
180 185 190
Ala Ile Ala Arg Lys Ser Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile
195 200 205
Ala Ala Ala Ala Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Val
210 215 220
Val Ala Leu Thr Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala
225 230 235 240
Gln Ala Asn Ala Ser Thr Gln Ala Ser Met Ala Val Arg Val Asp Ser
245 250 255
Gln Ala Ala Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu
260 265 270
Leu Val Thr Ala Glu Ala Val Ala Ala Ala Glu Ala Glu Val Ala Asn
275 280 285
Lys Ala Ala Thr Phe Ala Lys Gln Ile Val Asn Glu Lys Lys Ile His
290 295 300
Val Ala Lys Leu Glu
305
<210> 5
<211> 316
<212> PRT
<213> Apis mellifera
<400> 5
Gly Val Glu Glu Phe Lys Ser Ser Ala Thr Glu Glu Val Ile Ser Lys
1 5 10 15
Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser Ala Lys Arg
20 25 30
Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Thr Leu Gln Ser Leu
35 40 45
Glu Lys Ile Lys Thr Ser Ala Ser Val Asn Ala Lys Ala Ala Ala Val
50 55 60
Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu Arg Ala Ser
65 70 75 80
Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Leu Lys Asn
85 90 95
Ala Gln Gln Ala Gln Leu Asn Ala Gln Glu Lys Ser Leu Ala Ala Leu
100 105 110
Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala Asn Ala Ala
115 120 125
Thr Ala Ala Thr Gln Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg
130 135 140
Leu Ala Thr Val Ala Gln Asn Val Ala Ser Asp Leu Gln Lys Arg Thr
145 150 155 160
Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg Gln Leu Gln
165 170 175
Asp Ala Glu Arg Thr Lys Trp Ser Ala Asn Ala Ala Leu Glu Val Ser
180 185 190
Ala Ala Ala Ala Ala Ala Glu Thr Lys Thr Thr Ala Ser Ser Glu Ala
195 200 205
Ala Asn Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser Asp Ala Asp
210 215 220
Gly Ala Glu Arg Ser Ala Ser Thr Glu Ala Gln Ser Ala Ala Lys Ile
225 230 235 240
Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala Ser Glu Asp
245 250 255
Ser Arg Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg Ala Asn Val
260 265 270
Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Gly Glu Glu Ala
275 280 285
Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu Ala Glu Val
290 295 300
Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe
305 310 315
<210> 6
<211> 335
<212> PRT
<213> Apis mellifera
<400> 6
Met Gln Ile Pro Thr Phe Val Ala Ile Cys Leu Leu Thr Ser Gly Leu
1 5 10 15
Val His Ala Gly Val Glu Glu Phe Lys Ser Ser Ala Thr Glu Glu Val
20 25 30
Ile Ser Lys Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser
35 40 45
Ala Lys Arg Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Thr Leu
50 55 60
Gln Ser Leu Glu Lys Ile Lys Thr Ser Ala Ser Val Asn Ala Lys Ala
65 70 75 80
Ala Ala Val Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu
85 90 95
Arg Ala Ser Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala
100 105 110
Leu Lys Asn Ala Gln Gln Ala Gln Leu Asn Ala Gln Glu Lys Ser Leu
115 120 125
Ala Ala Leu Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala
130 135 140
Asn Ala Ala Thr Ala Ala Thr Gln Ser Ala Leu Glu Arg Ala Gln Ala
145 150 155 160
Ser Ser Arg Leu Ala Thr Val Ala Gln Asn Val Ala Ser Asp Leu Gln
165 170 175
Lys Arg Thr Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg
180 185 190
Gln Leu Gln Asp Ala Glu Arg Thr Lys Trp Ser Ala Asn Ala Ala Leu
195 200 205
Glu Val Ser Ala Ala Ala Ala Ala Ala Glu Thr Lys Thr Thr Ala Ser
210 215 220
Ser Glu Ala Ala Asn Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser
225 230 235 240
Asp Ala Asp Gly Ala Glu Arg Ser Ala Ser Thr Glu Ala Gln Ser Ala
245 250 255
Ala Lys Ile Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala
260 265 270
Ser Glu Asp Ser Arg Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg
275 280 285
Ala Asn Val Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Gly
290 295 300
Glu Glu Ala Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu
305 310 315 320
Ala Glu Val Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe
325 330 335
<210> 7
<211> 323
<212> PRT
<213> Apis mellifera
<400> 7
Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr Ser Thr Val
1 5 10 15
Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys Asp Glu Leu
20 25 30
Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly Thr Gly Ala
35 40 45
Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile Ser Leu Gly
50 55 60
Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala Ser Gln Ser
65 70 75 80
Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu Thr Asn Lys
85 90 95
Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala Arg Ala Thr
100 105 110
Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr Glu Glu Ala
115 120 125
Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala Ala Ala Glu
130 135 140
Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser Ala Arg Ala
145 150 155 160
Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala Glu Ser Ala
165 170 175
Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys Ala Ala
180 185 190
Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu Ala Asp
195 200 205
Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val Ala Asp
210 215 220
Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys Ala Glu
225 230 235 240
Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val Leu Gln Ala
245 250 255
Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala Ala Ala
260 265 270
Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala Gly Glu Met
275 280 285
Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys Lys Glu Glu
290 295 300
Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu Trp
305 310 315 320
Glu Val Lys
<210> 8
<211> 342
<212> PRT
<213> Apis mellifera
<400> 8
Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Ile Trp Gly Leu
1 5 10 15
Ala Ser Gly Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr
20 25 30
Ser Thr Val Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys
35 40 45
Asp Glu Leu Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly
50 55 60
Thr Gly Ala Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile
65 70 75 80
Ser Leu Gly Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala
85 90 95
Ser Gln Ser Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu
100 105 110
Thr Asn Lys Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala
115 120 125
Arg Ala Thr Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr
130 135 140
Glu Glu Ala Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala
145 150 155 160
Ala Ala Glu Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser
165 170 175
Ala Arg Ala Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala
180 185 190
Glu Ser Ala Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala
195 200 205
Lys Ala Ala Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala
210 215 220
Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala
225 230 235 240
Val Ala Asp Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala
245 250 255
Lys Ala Glu Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val
260 265 270
Leu Gln Ala Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala
275 280 285
Ala Ala Ala Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala
290 295 300
Gly Glu Met Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys
305 310 315 320
Lys Glu Glu Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn
325 330 335
Glu Glu Trp Glu Val Lys
340
<210> 9
<211> 942
<212> DNA
<213> Apis mellifera
<400> 9
ggtttggagg ggccgggcaa ctcgttgccc gagctcgtga aaggtagcgc atcggccacc 60
gcgtcgaccg ctgtgaccgc tagatcagga cttagagccg gacaagtagc tttagcttcg 120
cagaaggatg ccgtactcca agctcaagct gctgcatccg ccgcgtcaga ggcgcgcgct 180
gctgccgatc tgacggctaa acttagccaa gaatcggcat cagtgcaatc gcaggctgcc 240
gccaaaggga aggaaacgga ggaggcagct gttggtcaag ctagggctgg cctcgagtcg 300
gtgtccatgg ccgcatcagc cacatctgct gccaaagaag catcgaccgc cgccaaagcc 360
gcagcatccg cactatccac agccgtggtg caagcgaaaa tagctgagag ggcagccaaa 420
gctgaagctg ttgcctcgga cgaagccaag gccaaggcga ttgcagcagc caacttggcg 480
gctgaggcca gtgtagccgc agaagcagct ctcaaggccg agaaagtggc cgaagaagcc 540
atcgcaagag cggcctctgc aaaggctgcc gcaagagctg ctgctgccgc tctagcctcc 600
tcgaaggaag cagccacggc cagcgcaaga aacgccgcgg aatccgaggc caggaacgaa 660
gtagctgtat tgatcgccga gattgataaa aagagtaggg aaatcgacgc agccagttcg 720
cttaatgcgc gtgccgctgc caaggcaagc tccaggaacg tagaaacggc gacaatcggg 780
gccaacatca actcttcgaa acaagtcgtg tcaattccag tggaaataaa gaaattctcg 840
gagccggaag tgtcaacatc atggagagaa gatgaagagg ttacgaaaga gaagaaggag 900
cacataaatc tgaacgactt cgacttgaag agcaacgtat tt 942
<210> 10
<211> 999
<212> DNA
<213> Apis mellifera
<400> 10
atgaagattc cagtattgct tgcaacgtgc ctctaccttt gcggatttgc gtccgccggt 60
ttggaggggc cgggcaactc gttgcccgag ctcgtgaaag gtagcgcatc ggccaccgcg 120
tcgaccgctg tgaccgctag atcaggactt agagccggac aagtagcttt agcttcgcag 180
aaggatgccg tactccaagc tcaagctgct gcatccgccg cgtcagaggc gcgcgctgct 240
gccgatctga cggctaaact tagccaagaa tcggcatcag tgcaatcgca ggctgccgcc 300
aaagggaagg aaacggagga ggcagctgtt ggtcaagcta gggctggcct cgagtcggtg 360
tccatggccg catcagccac atctgctgcc aaagaagcat cgaccgccgc caaagccgca 420
gcatccgcac tatccacagc cgtggtgcaa gcgaaaatag ctgagagggc agccaaagct 480
gaagctgttg cctcggacga agccaaggcc aaggcgattg cagcagccaa cttggcggct 540
gaggccagtg tagccgcaga agcagctctc aaggccgaga aagtggccga agaagccatc 600
gcaagagcgg cctctgcaaa ggctgccgca agagctgctg ctgccgctct agcctcctcg 660
aaggaagcag ccacggccag cgcaagaaac gccgcggaat ccgaggccag gaacgaagta 720
gctgtattga tcgccgagat tgataaaaag agtagggaaa tcgacgcagc cagttcgctt 780
aatgcgcgtg ccgctgccaa ggcaagctcc aggaacgtag aaacggcgac aatcggggcc 840
aacatcaact cttcgaaaca agtcgtgtca attccagtgg aaataaagaa attctcggag 900
ccggaagtgt caacatcatg gagagaagat gaagaggtta cgaaagagaa gaaggagcac 960
ataaatctga acgacttcga cttgaagagc aacgtattt 999
<210> 11
<211> 870
<212> DNA
<213> Apis mellifera
<400> 11
cgcgtgatta atcacgagtc cctgaagacg agcgaggata ttcaaggagg atattcagca 60
ggaatagtcg gtgatggatc tgacgcgctt ggctcctcca tagaaaacgc ccaaaaagtc 120
gctcgagcgg ctgaaaacgt gggcttgaat ctggaattgg gcgcaggcgc gcgtgctgcc 180
agtgttgccg ctgctgccca ggccaaaaac acagaggctg cggaagcagg agcaaacgcc 240
gctctggccg ccgccattgc caaacgggag gaagcgatta aagccagcga gatagcaaac 300
caattgttga ccaatgcagc aaaagcggca gaagcgactg tatcggcaac gaagagggca 360
gcacaattga cggctgcagc gaaagaagca accagagctt ctgcagccgc tgctgaagct 420
gctacggagg cccaggtaaa ggctaacgcc gattcaatca tcacgaagag ggctgcgatt 480
gccgaggctc aagctgcggc ggaagctcaa gttaaggcgg caatcgccag aaaatcggca 540
gcgaattttt tggctaaggc tcaaatagcg gctgccgcgg aatccgaggc cacgaaactc 600
gcggccgaag ctgtagtggc actaacaaac gccgaagtcg ccgtgaacca ggctagaaac 660
gcacaggcaa acgcctcgac tcaagcttcc atggctgtta gggtagattc tcaagcagcg 720
aacgctgaag cagccgctgt agcgcaagcc gaaactctct tggttacggc agaagctgtc 780
gcagctgcgg aggctgaggt tgcgaacaaa gccgccacat ttgcaaaaca gatcgtcaac 840
gagaagaaaa tacatgtagc aaagttggaa 870
<210> 12
<211> 927
<212> DNA
<213> Apis mellifera
<400> 12
atgaagattc cagcaatatt cgtcacgtct ctgctggtct ggggattggc cgagggccgc 60
gtgattaatc acgagtccct gaagacgagc gaggatattc aaggaggata ttcagcagga 120
atagtcggtg atggatctga cgcgcttggc tcctccatag aaaacgccca aaaagtcgct 180
cgagcggctg aaaacgtggg cttgaatctg gaattgggcg caggcgcgcg tgctgccagt 240
gttgccgctg ctgcccaggc caaaaacaca gaggctgcgg aagcaggagc aaacgccgct 300
ctggccgccg ccattgccaa acgggaggaa gcgattaaag ccagcgagat agcaaaccaa 360
ttgttgacca atgcagcaaa agcggcagaa gcgactgtat cggcaacgaa gagggcagca 420
caattgacgg ctgcagcgaa agaagcaacc agagcttctg cagccgctgc tgaagctgct 480
acggaggccc aggtaaaggc taacgccgat tcaatcatca cgaagagggc tgcgattgcc 540
gaggctcaag ctgcggcgga agctcaagtt aaggcggcaa tcgccagaaa atcggcagcg 600
aattttttgg ctaaggctca aatagcggct gccgcggaat ccgaggccac gaaactcgcg 660
gccgaagctg tagtggcact aacaaacgcc gaagtcgccg tgaaccaggc tagaaacgca 720
caggcaaacg cctcgactca agcttccatg gctgttaggg tagattctca agcagcgaac 780
gctgaagcag ccgctgtagc gcaagccgaa actctcttgg ttacggcaga agctgtcgca 840
gctgcggagg ctgaggttgc gaacaaagcc gccacatttg caaaacagat cgtcaacgag 900
aagaaaatac atgtagcaaa gttggaa 927
<210> 13
<211> 949
<212> DNA
<213> Apis mellifera
<400> 13
ggcgtcgagg aattcaagtc ctcggcaacc gaggaggtga tcagcaaaaa cttagaagtc 60
gacctgttga aaaatgtgga cactagcgcg aaacgaagag agaacggcgc cccggtgctc 120
ggcaagaaca cacttcaatc cctggagaag atcaagacgt cggcgagcgt gaatgccaaa 180
gcagcagccg tggtgaaagc gtccgctctg gctcttgcag aggcctattt gcgagcgtcc 240
gcattgtcag ccgccgcttc agccaaggca gccgccgccc tgaaaaatgc tcaacaagcg 300
caattaaacg cccaggaaaa gtctttggcc gcgttgaaag ctcagtccga ggaagaggca 360
gcttctgctc gtgcaaacgc agcaaccgcc gcgacacagt cggcactgga acgcgctcaa 420
gcctcctcca ggttagcaac ggtcgcccaa aacgtagcca gcgacttgca gaaacggacc 480
agcaccaagg ccgcggctga agccgctgcc accctcagac aattacagga cgcggaacga 540
acgaaatgga gtgccaacgc tgccttagaa gtctccgccg ctgcagctgc cgcagaaacc 600
aagaccactg cctcctcgga ggccgccaac gccgccgcca aaaaggcggc cgcgatagct 660
tctgacgcgg acggcgcgga aaggtcggca tctaccgagg cacaatcagc tgcgaagatc 720
gagagtgtgg cagccgccga gggatccgcc aactcggcct ctgaggattc ccgggccgct 780
caattggaag cctccaccgc ggcgagagcc aacgtggccg cagctgtcgg ggatggagcg 840
attataggac ttggagagga agcgggtgcc gcggctcagt tgcttgcaca ggcgaaggca 900
ttggccgaag ttagctcgaa atccgaaaat attgaggata aaaaatttt 949
<210> 14
<211> 1006
<212> DNA
<213> Apis mellifera
<400> 14
atgcagatcc caacgtttgt cgccatatgc ttgctcacat cgggcttggt gcacgcaggc 60
gtcgaggaat tcaagtcctc ggcaaccgag gaggtgatca gcaaaaactt agaagtcgac 120
ctgttgaaaa atgtggacac tagcgcgaaa cgaagagaga acggcgcccc ggtgctcggc 180
aagaacacac ttcaatccct ggagaagatc aagacgtcgg cgagcgtgaa tgccaaagca 240
gcagccgtgg tgaaagcgtc cgctctggct cttgcagagg cctatttgcg agcgtccgca 300
ttgtcagccg ccgcttcagc caaggcagcc gccgccctga aaaatgctca acaagcgcaa 360
ttaaacgccc aggaaaagtc tttggccgcg ttgaaagctc agtccgagga agaggcagct 420
tctgctcgtg caaacgcagc aaccgccgcg acacagtcgg cactggaacg cgctcaagcc 480
tcctccaggt tagcaacggt cgcccaaaac gtagccagcg acttgcagaa acggaccagc 540
accaaggccg cggctgaagc cgctgccacc ctcagacaat tacaggacgc ggaacgaacg 600
aaatggagtg ccaacgctgc cttagaagtc tccgccgctg cagctgccgc agaaaccaag 660
accactgcct cctcggaggc cgccaacgcc gccgccaaaa aggcggccgc gatagcttct 720
gacgcggacg gcgcggaaag gtcggcatct accgaggcac aatcagctgc gaagatcgag 780
agtgtggcag ccgccgaggg atccgccaac tcggcctctg aggattcccg ggccgctcaa 840
ttggaagcct ccaccgcggc gagagccaac gtggccgcag ctgtcgggga tggagcgatt 900
ataggacttg gagaggaagc gggtgccgcg gctcagttgc ttgcacaggc gaaggcattg 960
gccgaagtta gctcgaaatc cgaaaatatt gaggataaaa aatttt 1006
<210> 15
<211> 969
<212> DNA
<213> Apis mellifera
<400> 15
gcaagggaag aggtggagac acgggacaag accaagacct cgacagtggt gaaaagcgag 60
aaagtggaag tcgttgctcc cgctaaggat gaacttaaat taacgagcga gcctatcttt 120
ggaagaagag tgggaactgg agcatccgag gtggcatcta gcagcggtga agccatcgcg 180
ataagtcttg gagcagggca gtcagcggca gagtctcagg ccttggccgc ctcgcaatcc 240
aaaacggcag cgaacgccgc cataggcgcg agcgagctta ccaacaaagt tgctgctcta 300
gttgctggcg cgactggtgc gcaggcgaga gctacggccg cctcctcgag cgcgttgaag 360
gccagcttgg cgaccgaaga agcggcggaa gaggccgagg cggccgtggc tgacgccaag 420
gctgccgcgg aaaaggccga atccctggcg aaaaatctcg cgtcggcgag cgctcgcgcg 480
gccctctcct ccgaaagggc gaacgaattg gctcaagctg agagcgctgc agcggccgag 540
gcgcaggcca agacagcagc cgccgccaaa gcagcggaaa tcgcccttaa ggtcgctgag 600
atagcggtga aggcggaagc ggacgcagca gctgccgccg tggcagctgc aaaggcaaga 660
gccgtggcag acgcggccgc tgcccgtgcc gcagccgtga acgccatcgc caaggcggaa 720
gaggaggcct cggcccaagc agagaacgcc gccggtgttt tgcaagcagc cgcctccgcc 780
gcggcggaat cgcgagccgc tgcagctgcc gccgctgcta cctcggaggc agcggctgaa 840
gctggcccgt tggcaggtga gatgaaacca ccgcactgga aatgggaacg gattcctgtg 900
aagaaggagg agtggaaaac gtcaacgaag gaagaatgga aaacgacgaa tgaagaatgg 960
gaggtgaag 969
<210> 16
<211> 1026
<212> DNA
<213> Apis mellifera
<400> 16
atgaagatcc catccatact cgcggtttcc ctgctgatct ggggtttggc aagcggcgca 60
agggaagagg tggagacacg ggacaagacc aagacctcga cagtggtgaa aagcgagaaa 120
gtggaagtcg ttgctcccgc taaggatgaa cttaaattaa cgagcgagcc tatctttgga 180
agaagagtgg gaactggagc atccgaggtg gcatctagca gcggtgaagc catcgcgata 240
agtcttggag cagggcagtc agcggcagag tctcaggcct tggccgcctc gcaatccaaa 300
acggcagcga acgccgccat aggcgcgagc gagcttacca acaaagttgc tgctctagtt 360
gctggcgcga ctggtgcgca ggcgagagct acggccgcct cctcgagcgc gttgaaggcc 420
agcttggcga ccgaagaagc ggcggaagag gccgaggcgg ccgtggctga cgccaaggct 480
gccgcggaaa aggccgaatc cctggcgaaa aatctcgcgt cggcgagcgc tcgcgcggcc 540
ctctcctccg aaagggcgaa cgaattggct caagctgaga gcgctgcagc ggccgaggcg 600
caggccaaga cagcagccgc cgccaaagca gcggaaatcg cccttaaggt cgctgagata 660
gcggtgaagg cggaagcgga cgcagcagct gccgccgtgg cagctgcaaa ggcaagagcc 720
gtggcagacg cggccgctgc ccgtgccgca gccgtgaacg ccatcgccaa ggcggaagag 780
gaggcctcgg cccaagcaga gaacgccgcc ggtgttttgc aagcagccgc ctccgccgcg 840
gcggaatcgc gagccgctgc agctgccgcc gctgctacct cggaggcagc ggctgaagct 900
ggcccgttgg caggtgagat gaaaccaccg cactggaaat gggaacggat tcctgtgaag 960
aaggaggagt ggaaaacgtc aacgaaggaa gaatggaaaa cgacgaatga agaatgggag 1020
gtgaag 1026
<210> 17
<211> 308
<212> PRT
<213> Bombus terrestris
<400> 17
Gly Gln Ser Ser Pro Leu Leu Glu Ile Val Gln Gly Ser Ala Ser Ala
1 5 10 15
Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg Ala Gly Gln
20 25 30
Val Ala Val Ala Ser Gln Lys Asp Ala Thr Leu Gln Ala Asp Ala Ser
35 40 45
Ala Ala Ala Ala Ala Ala Ala Arg Ala Ser Ala Asp Gln Ser Ala Ser
50 55 60
Leu Ala Gln Gln Ser Ala Ser Leu Gln Ser Lys Ala Ala Ala Arg Ala
65 70 75 80
Lys Ser Ala Glu Glu Ser Ala Ala Ala Thr Ala Lys Ala Glu Leu Gln
85 90 95
Ala Glu Ser Ile Ala Ala Ser Ala Ser Ser Asn Ala Arg Glu Ala Ala
100 105 110
Ala Ser Ala Lys Ala Ser Ala Ser Ala Met Ser Ser Ala Ala Val Gln
115 120 125
Ala Lys Leu Ala Glu Lys Thr Ala Lys Asn Gln Ala Leu Ala Ser Glu
130 135 140
Glu Ala Lys Leu Lys Ala Ala Ala Ala Ala Ser Ala Ala Ala Ala Ala
145 150 155 160
Ser Ala Ala Ala Glu Ala Ala Leu Lys Ala Glu Arg Ile Ala Glu Glu
165 170 175
Ala Ile Ala Lys Ala Ala Ala Ala Lys Ala Ala Ala Arg Ala Ala Ala
180 185 190
Ala Ala Leu Asn Ser Ala Lys Glu Ala Ala Thr Ser Ser Ala Arg Ser
195 200 205
Ala Ala Glu Ala Glu Ala Lys Ser Glu Val Ala Ile Leu Ile Ser Glu
210 215 220
Leu Asp Lys Lys Ser Arg Glu Val Ala Ala Ser Ala Ser Ala Lys Ala
225 230 235 240
Arg Ala Ala Ala Ala Ala Ser Ser Arg Asn Ala Glu Thr Ala Val Ile
245 250 255
Gly Ala Asn Ile Asn Val Ala Lys Glu Val Leu Ala Ile Pro Ile Glu
260 265 270
Pro Lys Lys Leu Pro Glu Pro Glu Leu Ala Leu Lys Glu Glu Asn Val
275 280 285
Ala Val Ala Ser Ser Glu Ser Glu Val Lys Val Glu Thr Ser Ser Glu
290 295 300
Ala Trp Ser Ile
305
<210> 18
<211> 327
<212> PRT
<213> Bombus terrestris
<400> 18
Met Lys Ile Pro Ala Leu Leu Val Thr Cys Leu Tyr Leu Trp Gly Phe
1 5 10 15
Ala Ser Ala Gly Gln Ser Ser Pro Leu Leu Glu Ile Val Gln Gly Ser
20 25 30
Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg
35 40 45
Ala Gly Gln Val Ala Val Ala Ser Gln Lys Asp Ala Thr Leu Gln Ala
50 55 60
Asp Ala Ser Ala Ala Ala Ala Ala Ala Ala Arg Ala Ser Ala Asp Gln
65 70 75 80
Ser Ala Ser Leu Ala Gln Gln Ser Ala Ser Leu Gln Ser Lys Ala Ala
85 90 95
Ala Arg Ala Lys Ser Ala Glu Glu Ser Ala Ala Ala Thr Ala Lys Ala
100 105 110
Glu Leu Gln Ala Glu Ser Ile Ala Ala Ser Ala Ser Ser Asn Ala Arg
115 120 125
Glu Ala Ala Ala Ser Ala Lys Ala Ser Ala Ser Ala Met Ser Ser Ala
130 135 140
Ala Val Gln Ala Lys Leu Ala Glu Lys Thr Ala Lys Asn Gln Ala Leu
145 150 155 160
Ala Ser Glu Glu Ala Lys Leu Lys Ala Ala Ala Ala Ala Ser Ala Ala
165 170 175
Ala Ala Ala Ser Ala Ala Ala Glu Ala Ala Leu Lys Ala Glu Arg Ile
180 185 190
Ala Glu Glu Ala Ile Ala Lys Ala Ala Ala Ala Lys Ala Ala Ala Arg
195 200 205
Ala Ala Ala Ala Ala Leu Asn Ser Ala Lys Glu Ala Ala Thr Ser Ser
210 215 220
Ala Arg Ser Ala Ala Glu Ala Glu Ala Lys Ser Glu Val Ala Ile Leu
225 230 235 240
Ile Ser Glu Leu Asp Lys Lys Ser Arg Glu Val Ala Ala Ser Ala Ser
245 250 255
Ala Lys Ala Arg Ala Ala Ala Ala Ala Ser Ser Arg Asn Ala Glu Thr
260 265 270
Ala Val Ile Gly Ala Asn Ile Asn Val Ala Lys Glu Val Leu Ala Ile
275 280 285
Pro Ile Glu Pro Lys Lys Leu Pro Glu Pro Glu Leu Ala Leu Lys Glu
290 295 300
Glu Asn Val Ala Val Ala Ser Ser Glu Ser Glu Val Lys Val Glu Thr
305 310 315 320
Ser Ser Glu Ala Trp Ser Ile
325
<210> 19
<211> 293
<212> PRT
<213> Bombus terrestris
<400> 19
His Val Val Lys Arg Asp Lys Glu Leu Lys Ala Pro Ala Leu Pro Glu
1 5 10 15
Leu Leu Gly Asp Gly Ser Asp Thr Leu Gly Ala Ser Met Glu Asn Gly
20 25 30
Ile Lys Val Ala Arg Ala Ser Gln Asn Val Gly Leu Arg Thr Glu Leu
35 40 45
Asn Ala Ala Ala Arg Ala Ala Ala Ala Ala Ala Thr Lys Gln Ala Lys
50 55 60
Asp Thr Glu Ala Ala Glu Ala Gly Ala Ala Ala Ala Ile Ala Ile Ala
65 70 75 80
Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu Leu Ala Ser Lys
85 90 95
Leu Leu Thr Ala Ala Ala Gly Ser Ser Glu Ala Ala Val Ser Ala Thr
100 105 110
Val Arg Ala Ala Gln Leu Thr Ala Ala Ala Ser Ala Ala Ala Lys Ala
115 120 125
Ser Ala Ser Ala Ser Glu Ala Ser Ala Glu Ala Gln Val Arg Ala Asn
130 135 140
Ala Glu Ala Asn Ile Ala Lys Lys Ala Ser Ala Ala Glu Ala Lys Ala
145 150 155 160
Ala Ala Glu Ala Gln Val Lys Ala Glu Leu Ala Lys Lys Ala Ala Ala
165 170 175
Gly Phe Leu Ala Lys Ala Arg Leu Ala Ala Ser Ala Glu Ser Glu Ala
180 185 190
Thr Lys Leu Ala Ala Glu Ala Glu Val Ala Leu Ala Lys Ala Arg Val
195 200 205
Ala Val Asp Gln Ser Gln Ser Ala Gln Ala Thr Ala Thr Ala Gln Ala
210 215 220
Ala Thr Ala Val Gln Leu Gln Ser Gln Ala Ala Asn Ala Glu Ala Ser
225 230 235 240
Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala Glu Ala Val Ser
245 250 255
Ala Ala Glu Ala Glu Ala Ala Thr Lys Ala Thr Ser Trp Gly Glu Glu
260 265 270
Cys His Gln Arg Glu Lys Val Thr Phe Ser Glu Asp Arg Leu Asn Glu
275 280 285
Arg Gln Asp Asn Trp
290
<210> 20
<211> 313
<212> PRT
<213> Bombus terrestris
<400> 20
Met Lys Ile Pro Ala Ile Leu Val Thr Ser Leu Leu Val Trp Gly Gly
1 5 10 15
Leu Ala Glu Gly His Val Val Lys Arg Asp Lys Glu Leu Lys Ala Pro
20 25 30
Ala Leu Pro Glu Leu Leu Gly Asp Gly Ser Asp Thr Leu Gly Ala Ser
35 40 45
Met Glu Asn Gly Ile Lys Val Ala Arg Ala Ser Gln Asn Val Gly Leu
50 55 60
Arg Thr Glu Leu Asn Ala Ala Ala Arg Ala Ala Ala Ala Ala Ala Thr
65 70 75 80
Lys Gln Ala Lys Asp Thr Glu Ala Ala Glu Ala Gly Ala Ala Ala Ala
85 90 95
Ile Ala Ile Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu
100 105 110
Leu Ala Ser Lys Leu Leu Thr Ala Ala Ala Gly Ser Ser Glu Ala Ala
115 120 125
Val Ser Ala Thr Val Arg Ala Ala Gln Leu Thr Ala Ala Ala Ser Ala
130 135 140
Ala Ala Lys Ala Ser Ala Ser Ala Ser Glu Ala Ser Ala Glu Ala Gln
145 150 155 160
Val Arg Ala Asn Ala Glu Ala Asn Ile Ala Lys Lys Ala Ser Ala Ala
165 170 175
Glu Ala Lys Ala Ala Ala Glu Ala Gln Val Lys Ala Glu Leu Ala Lys
180 185 190
Lys Ala Ala Ala Gly Phe Leu Ala Lys Ala Arg Leu Ala Ala Ser Ala
195 200 205
Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Glu Val Ala Leu Ala
210 215 220
Lys Ala Arg Val Ala Val Asp Gln Ser Gln Ser Ala Gln Ala Thr Ala
225 230 235 240
Thr Ala Gln Ala Ala Thr Ala Val Gln Leu Gln Ser Gln Ala Ala Asn
245 250 255
Ala Glu Ala Ser Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala
260 265 270
Glu Ala Val Ser Ala Ala Glu Ala Glu Ala Ala Thr Lys Ala Thr Ser
275 280 285
Trp Gly Glu Glu Cys His Gln Arg Glu Lys Val Thr Phe Ser Glu Asp
290 295 300
Arg Leu Asn Glu Arg Gln Asp Asn Trp
305 310
<210> 21
<211> 313
<212> PRT
<213> Bombus terrestris
<400> 21
Gly Ser Val Glu Leu Gly Ala Pro Lys Gln Glu Ser Val Leu Val Glu
1 5 10 15
Gln Leu Leu Leu Lys Asn Val Glu Thr Ser Ala Lys Arg Lys Glu Asn
20 25 30
Gly Ala Pro Lys Leu Gly Glu Ser Thr Ala Ala Ala Leu Ala Ser Thr
35 40 45
Lys Ala Thr Ala Ala Ala Glu Ala Lys Ala Ser Ala Lys Val Lys Ala
50 55 60
Ser Ala Leu Ala Leu Ala Glu Ala Phe Leu Arg Ala Ser Ala Ala Phe
65 70 75 80
Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Val Lys Glu Ala Thr Gln
85 90 95
Ala Gln Leu Leu Ala Gln Glu Lys Ala Leu Ile Ala Leu Lys Thr Gln
100 105 110
Ser Glu Gln Gln Ala Ala Ser Ala Arg Ala Asp Ala Ala Ala Ala Ala
115 120 125
Ala Val Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg Ala Ala Thr
130 135 140
Thr Ala Gln Asp Ile Ser Ser Asp Leu Glu Lys Arg Val Ala Thr Ser
145 150 155 160
Ala Ala Ala Glu Ala Gly Ala Thr Leu Arg Ala Glu Gln Ser Ala Ala
165 170 175
Gln Ser Lys Trp Ser Ala Ala Leu Ala Ala Gln Thr Ala Ala Ala Ala
180 185 190
Ala Ala Ile Glu Ala Lys Ala Thr Ala Ser Ser Glu Ser Thr Ala Ala
195 200 205
Ala Thr Ser Lys Ala Ala Val Leu Thr Ala Asp Thr Ser Ser Ala Glu
210 215 220
Ala Ala Ala Ala Ala Glu Ala Gln Ser Ala Ser Arg Ile Ala Gly Thr
225 230 235 240
Ala Ala Thr Glu Gly Ser Ala Asn Trp Ala Ser Glu Asn Ser Arg Thr
245 250 255
Ala Gln Leu Glu Ala Ser Ala Ser Ala Lys Ala Thr Ala Ala Ala Ala
260 265 270
Val Gly Asp Gly Ala Ile Ile Gly Leu Ala Arg Asp Ala Ser Ala Ala
275 280 285
Ala Gln Ala Ala Ala Glu Val Lys Ala Leu Ala Glu Ala Ser Ala Ser
290 295 300
Leu Gly Ala Ser Glu Lys Asp Lys Lys
305 310
<210> 22
<211> 332
<212> PRT
<213> Bombus terrestris
<400> 22
Met Gln Ile Pro Ala Ile Phe Val Thr Cys Leu Leu Thr Trp Gly Leu
1 5 10 15
Val His Ala Gly Ser Val Glu Leu Gly Ala Pro Lys Gln Glu Ser Val
20 25 30
Leu Val Glu Gln Leu Leu Leu Lys Asn Val Glu Thr Ser Ala Lys Arg
35 40 45
Lys Glu Asn Gly Ala Pro Lys Leu Gly Glu Ser Thr Ala Ala Ala Leu
50 55 60
Ala Ser Thr Lys Ala Thr Ala Ala Ala Glu Ala Lys Ala Ser Ala Lys
65 70 75 80
Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Phe Leu Arg Ala Ser
85 90 95
Ala Ala Phe Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Val Lys Glu
100 105 110
Ala Thr Gln Ala Gln Leu Leu Ala Gln Glu Lys Ala Leu Ile Ala Leu
115 120 125
Lys Thr Gln Ser Glu Gln Gln Ala Ala Ser Ala Arg Ala Asp Ala Ala
130 135 140
Ala Ala Ala Ala Val Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg
145 150 155 160
Ala Ala Thr Thr Ala Gln Asp Ile Ser Ser Asp Leu Glu Lys Arg Val
165 170 175
Ala Thr Ser Ala Ala Ala Glu Ala Gly Ala Thr Leu Arg Ala Glu Gln
180 185 190
Ser Ala Ala Gln Ser Lys Trp Ser Ala Ala Leu Ala Ala Gln Thr Ala
195 200 205
Ala Ala Ala Ala Ala Ile Glu Ala Lys Ala Thr Ala Ser Ser Glu Ser
210 215 220
Thr Ala Ala Ala Thr Ser Lys Ala Ala Val Leu Thr Ala Asp Thr Ser
225 230 235 240
Ser Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ser Ala Ser Arg Ile
245 250 255
Ala Gly Thr Ala Ala Thr Glu Gly Ser Ala Asn Trp Ala Ser Glu Asn
260 265 270
Ser Arg Thr Ala Gln Leu Glu Ala Ser Ala Ser Ala Lys Ala Thr Ala
275 280 285
Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Ala Arg Asp Ala
290 295 300
Ser Ala Ala Ala Gln Ala Ala Ala Glu Val Lys Ala Leu Ala Glu Ala
305 310 315 320
Ser Ala Ser Leu Gly Ala Ser Glu Lys Asp Lys Lys
325 330
<210> 23
<211> 338
<212> PRT
<213> Bombus terrestris
<400> 23
Gly Lys Pro Leu Ile Ala Asn Ala Gln Ile Gly Lys Val Lys Thr Glu
1 5 10 15
Thr Ser Ser Ser Ser Glu Ile Glu Thr Leu Val Ser Gly Ser Gln Thr
20 25 30
Leu Val Ala Gly Ser Glu Thr Leu Ala Ser Glu Ser Glu Ala Leu Ala
35 40 45
Ser Lys Ser Glu Ala Leu Thr Ser Glu Ala Glu Ile Ala Ser Val Thr
50 55 60
Thr Lys Asp Glu Leu Ile Leu Lys Gly Glu Ala Ile Thr Gly Lys Lys
65 70 75 80
Leu Gly Thr Gly Ala Ser Glu Val Ala Ala Ala Ser Gly Glu Ala Ile
85 90 95
Ala Thr Thr Leu Gly Ala Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala
100 105 110
Ala Ala Ala Gln Ala Lys Ser Ala Ala Ala Ala Ala Ala Asn Ala Gly
115 120 125
Glu Ser Ser Asn Ser Ala Ala Ala Leu Val Ala Ala Ala Ala Ala Ala
130 135 140
Gln Gly Lys Ala Ala Ala Ala Ala Ala Ala Ala Thr Lys Ala Ser Leu
145 150 155 160
Glu Ala Ala Asp Ala Ala Glu Glu Ala Glu Ser Ala Val Ala Leu Ala
165 170 175
Arg Ala Ala Ser Ala Lys Ala Glu Ala Leu Ala Ser Thr Ala Ala Ala
180 185 190
Ala Asn Thr Arg Ala Ala Leu Gln Ala Glu Lys Ser Asn Glu Leu Ala
195 200 205
Gln Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ala Lys Ala Ala Ala
210 215 220
Ala Ala Lys Ala Thr Gln Leu Ala Leu Lys Val Ala Glu Thr Ala Val
225 230 235 240
Lys Thr Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala
245 250 255
Arg Ala Val Ala Asp Ala Ala Ala Ser Arg Ala Thr Ala Val Asn Ala
260 265 270
Ile Ala Glu Ala Glu Glu Arg Asp Ser Ala Gln Ala Glu Asn Thr Ala
275 280 285
Gly Val Ala Gln Ala Ala Leu Ala Ala Ala Glu Ala Gln Asp Ser Cys
290 295 300
Ile Gly Ala Ala Ala Thr Pro Arg His Ser Ser Ser Tyr Ala Trp Trp
305 310 315 320
Lys Leu Arg Ile Thr Ser Leu Ile Val Ile Leu Ser Pro Arg Asn Arg
325 330 335
Arg Thr
<210> 24
<211> 357
<212> PRT
<213> Bombus terrestris
<400> 24
Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Val Trp Gly Leu
1 5 10 15
Ala Ser Ala Gly Lys Pro Leu Ile Ala Asn Ala Gln Ile Gly Lys Val
20 25 30
Lys Thr Glu Thr Ser Ser Ser Ser Glu Ile Glu Thr Leu Val Ser Gly
35 40 45
Ser Gln Thr Leu Val Ala Gly Ser Glu Thr Leu Ala Ser Glu Ser Glu
50 55 60
Ala Leu Ala Ser Lys Ser Glu Ala Leu Thr Ser Glu Ala Glu Ile Ala
65 70 75 80
Ser Val Thr Thr Lys Asp Glu Leu Ile Leu Lys Gly Glu Ala Ile Thr
85 90 95
Gly Lys Lys Leu Gly Thr Gly Ala Ser Glu Val Ala Ala Ala Ser Gly
100 105 110
Glu Ala Ile Ala Thr Thr Leu Gly Ala Gly Gln Ala Ala Ala Glu Ala
115 120 125
Gln Ala Ala Ala Ala Ala Gln Ala Lys Ser Ala Ala Ala Ala Ala Ala
130 135 140
Asn Ala Gly Glu Ser Ser Asn Ser Ala Ala Ala Leu Val Ala Ala Ala
145 150 155 160
Ala Ala Ala Gln Gly Lys Ala Ala Ala Ala Ala Ala Ala Ala Thr Lys
165 170 175
Ala Ser Leu Glu Ala Ala Asp Ala Ala Glu Glu Ala Glu Ser Ala Val
180 185 190
Ala Leu Ala Arg Ala Ala Ser Ala Lys Ala Glu Ala Leu Ala Ser Thr
195 200 205
Ala Ala Ala Ala Asn Thr Arg Ala Ala Leu Gln Ala Glu Lys Ser Asn
210 215 220
Glu Leu Ala Gln Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ala Lys
225 230 235 240
Ala Ala Ala Ala Ala Lys Ala Thr Gln Leu Ala Leu Lys Val Ala Glu
245 250 255
Thr Ala Val Lys Thr Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala
260 265 270
Ala Lys Ala Arg Ala Val Ala Asp Ala Ala Ala Ser Arg Ala Thr Ala
275 280 285
Val Asn Ala Ile Ala Glu Ala Glu Glu Arg Asp Ser Ala Gln Ala Glu
290 295 300
Asn Thr Ala Gly Val Ala Gln Ala Ala Leu Ala Ala Ala Glu Ala Gln
305 310 315 320
Asp Ser Cys Ile Gly Ala Ala Ala Thr Pro Arg His Ser Ser Ser Tyr
325 330 335
Ala Trp Trp Lys Leu Arg Ile Thr Ser Leu Ile Val Ile Leu Ser Pro
340 345 350
Arg Asn Arg Arg Thr
355
<210> 25
<211> 927
<212> DNA
<213> Bombus terrestris
<400> 25
ggccagagct cacctctgct cgagatcgtg cagggtagcg cgtcggccac cgcatccacc 60
gctgtgaccg ctagatccgg acttcgtgcc ggtcaggtag ccgtggcctc gcagaaggat 120
gccacacttc aggcagatgc ctcagcggcc gccgcggccg ctgcacgcgc ttccgccgac 180
cagtcggcca gtctagccca acagtcggcg tctttgcagt ccaaagctgc cgccagagca 240
aaatcagccg aggagtcagc ggcagctacg gccaaagccg agttgcaggc agaatccatt 300
gctgcatctg ccagttccaa tgccagagag gctgcagcgt ccgcaaaagc ctccgcatcc 360
gcgatgtcat cggctgccgt gcaggcgaaa ctcgctgaaa agacggccaa gaatcaagct 420
ctggcttccg aagaagccaa actcaaggct gccgccgctg ccagcgcagc agcagcagcc 480
agcgccgccg ccgaggcagc cctgaaagct gagagaatag cggaagaagc catcgccaag 540
gcggccgctg ccaaagcagc cgccagagcc gctgcagccg cgttaaactc cgcgaaggaa 600
gccgccacga gcagcgcaag gagcgccgcc gaagccgaag ctaagagcga agtcgctata 660
ctgatcagcg aactcgacaa gaagagcagg gaagtcgccg cttccgcgtc cgccaaggca 720
cgcgctgctg ctgcggctag ctccagaaac gcagaaacgg ctgttatcgg agctaacatc 780
aatgtggcca aagaggtctt ggcgattccc atcgagccaa agaaacttcc ggagccagag 840
ctggcgttga aagaagagaa tgtcgcggtc gcgagctcag agagtgaagt gaaggtagaa 900
acgagcagcg aagcatggtc aatttaa 927
<210> 26
<211> 984
<212> DNA
<213> Bombus terrestris
<400> 26
atgaagattc cagcactgct cgtaacgtgc ctctaccttt ggggcttcgc gtccgccggc 60
cagagctcac ctctgctcga gatcgtgcag ggtagcgcgt cggccaccgc atccaccgct 120
gtgaccgcta gatccggact tcgtgccggt caggtagccg tggcctcgca gaaggatgcc 180
acacttcagg cagatgcctc agcggccgcc gcggccgctg cacgcgcttc cgccgaccag 240
tcggccagtc tagcccaaca gtcggcgtct ttgcagtcca aagctgccgc cagagcaaaa 300
tcagccgagg agtcagcggc agctacggcc aaagccgagt tgcaggcaga atccattgct 360
gcatctgcca gttccaatgc cagagaggct gcagcgtccg caaaagcctc cgcatccgcg 420
atgtcatcgg ctgccgtgca ggcgaaactc gctgaaaaga cggccaagaa tcaagctctg 480
gcttccgaag aagccaaact caaggctgcc gccgctgcca gcgcagcagc agcagccagc 540
gccgccgccg aggcagccct gaaagctgag agaatagcgg aagaagccat cgccaaggcg 600
gccgctgcca aagcagccgc cagagccgct gcagccgcgt taaactccgc gaaggaagcc 660
gccacgagca gcgcaaggag cgccgccgaa gccgaagcta agagcgaagt cgctatactg 720
atcagcgaac tcgacaagaa gagcagggaa gtcgccgctt ccgcgtccgc caaggcacgc 780
gctgctgctg cggctagctc cagaaacgca gaaacggctg ttatcggagc taacatcaat 840
gtggccaaag aggtcttggc gattcccatc gagccaaaga aacttccgga gccagagctg 900
gcgttgaaag aagagaatgt cgcggtcgcg agctcagaga gtgaagtgaa ggtagaaacg 960
agcagcgaag catggtcaat ttaa 984
<210> 27
<211> 882
<212> DNA
<213> Bombus terrestris
<400> 27
cacgtggtga agcgcgacaa ggagctcaag gccccggctt taccggaact actcggtgat 60
gggtctgaca cgctcggtgc ctcgatggag aacgggatca aagtcgccag agcatcgcag 120
aatgtgggtc tgagaacaga gttgaatgca gccgcgcggg ctgcagccgc tgctgcgacc 180
aagcaggcca aagacacaga ggccgcggaa gctggagcgg ccgctgcgat tgccatcgct 240
atcgccaagc gtgaagaagc tatcaaagca agcgaattag ccagcaagtt gttgacagcc 300
gcggctgggt ccagcgaagc tgccgtgtca gcgacggtga gggcggcgca attgacggcc 360
gcagctagcg cagctgccaa agcttctgca tccgcctctg aggcttctgc cgaagcccag 420
gtgagggcca acgccgaagc aaacatcgcc aagaaagctt cggcagctga agcaaaagcc 480
gcagccgaag cccaggttaa ggcggaactc gccaagaaag cggccgccgg tttcttagct 540
aaggctagac tagcggccag cgccgaatcc gaggccacta aactcgcagc cgaagctgaa 600
gtagcactgg ctaaggccag agtcgccgtc gaccagtcgc agagcgcaca ggcaaccgct 660
accgctcaag ctgccacagc cgttcagctg cagtctcaag cagctaacgc ggaagcctcc 720
gctgtagcac aggctgaaac tctgctggtc acggcggaag ccgtctctgc cgcggaagcc 780
gaagccgcga ccaaagctac cagttggggc gaagaatgtc atcaacgaga aaaagttacg 840
tttagcgaag atcgattaaa cgagagacaa gacaattggt ag 882
<210> 28
<211> 942
<212> DNA
<213> Bombus terrestris
<400> 28
atgaagattc cagcaatact ggttacgtct ctgctggtct ggggtggtct ggccgagggc 60
cacgtggtga agcgcgacaa ggagctcaag gccccggctt taccggaact actcggtgat 120
gggtctgaca cgctcggtgc ctcgatggag aacgggatca aagtcgccag agcatcgcag 180
aatgtgggtc tgagaacaga gttgaatgca gccgcgcggg ctgcagccgc tgctgcgacc 240
aagcaggcca aagacacaga ggccgcggaa gctggagcgg ccgctgcgat tgccatcgct 300
atcgccaagc gtgaagaagc tatcaaagca agcgaattag ccagcaagtt gttgacagcc 360
gcggctgggt ccagcgaagc tgccgtgtca gcgacggtga gggcggcgca attgacggcc 420
gcagctagcg cagctgccaa agcttctgca tccgcctctg aggcttctgc cgaagcccag 480
gtgagggcca acgccgaagc aaacatcgcc aagaaagctt cggcagctga agcaaaagcc 540
gcagccgaag cccaggttaa ggcggaactc gccaagaaag cggccgccgg tttcttagct 600
aaggctagac tagcggccag cgccgaatcc gaggccacta aactcgcagc cgaagctgaa 660
gtagcactgg ctaaggccag agtcgccgtc gaccagtcgc agagcgcaca ggcaaccgct 720
accgctcaag ctgccacagc cgttcagctg cagtctcaag cagctaacgc ggaagcctcc 780
gctgtagcac aggctgaaac tctgctggtc acggcggaag ccgtctctgc cgcggaagcc 840
gaagccgcga ccaaagctac cagttggggc gaagaatgtc atcaacgaga aaaagttacg 900
tttagcgaag atcgattaaa cgagagacaa gacaattggt ag 942
<210> 29
<211> 942
<212> DNA
<213> Bombus terrestris
<400> 29
ggtagcgtgg aactcggtgc ccccaagcag gagtctgtcc tcgtggagca gctcctattg 60
aagaacgtgg agactagtgc gaagcgaaag gagaacggcg caccgaaact cggcgagagc 120
acagctgcgg ctctggctag taccaaggca actgcagccg cagaggctaa ggcatccgcc 180
aaagtgaaag cttctgcctt ggccctcgct gaggctttct tgcgtgcgtc ggcagcgttt 240
gctgctgctt cagccaaagc tgctgccgct gtaaaggaag caacgcaggc acagttgctg 300
gcacaggaga aggctttgat agcgttgaaa actcaatctg agcaacaagc tgcctctgct 360
cgcgcggacg ccgcggctgc cgcagccgta tccgcgctag aacgcgccca ggcctcctcc 420
agagcagcca cgaccgccca agacatctcc agcgatctgg agaaacgtgt cgccacctca 480
gccgctgctg aagcaggtgc caccctcaga gcggaacaat ccgccgcgca atcgaaatgg 540
tccgccgcac tggccgccca aaccgccgct gctgcagccg ctatagaagc aaaggccacc 600
gcttcctcag aaagcaccgc tgccgctact agtaaggccg ccgtgttgac cgctgacact 660
agcagcgcag aagctgccgc tgcagcggag gcacaatccg cttcgcggat cgcaggtaca 720
gcagccaccg agggatccgc caactgggct agcgagaact cgcgtaccgc acaactggaa 780
gcttccgcct cagcgaaggc caccgcagcc gcagctgtcg gagatggagc tattatagga 840
cttgcacggg acgctagtgc cgcagctcag gcagccgcag aagttaaagc cttagctgaa 900
gctagtgcca gcttaggtgc ttcagaaaag gacaagaaat ga 942
<210> 30
<211> 999
<212> DNA
<213> Bombus terrestris
<400> 30
atgcagatcc cagcgatttt cgtcacgtgc ctgctcacat ggggcctggt gcacgcaggt 60
agcgtggaac tcggtgcccc caagcaggag tctgtcctcg tggagcagct cctattgaag 120
aacgtggaga ctagtgcgaa gcgaaaggag aacggcgcac cgaaactcgg cgagagcaca 180
gctgcggctc tggctagtac caaggcaact gcagccgcag aggctaaggc atccgccaaa 240
gtgaaagctt ctgccttggc cctcgctgag gctttcttgc gtgcgtcggc agcgtttgct 300
gctgcttcag ccaaagctgc tgccgctgta aaggaagcaa cgcaggcaca gttgctggca 360
caggagaagg ctttgatagc gttgaaaact caatctgagc aacaagctgc ctctgctcgc 420
gcggacgccg cggctgccgc agccgtatcc gcgctagaac gcgcccaggc ctcctccaga 480
gcagccacga ccgcccaaga catctccagc gatctggaga aacgtgtcgc cacctcagcc 540
gctgctgaag caggtgccac cctcagagcg gaacaatccg ccgcgcaatc gaaatggtcc 600
gccgcactgg ccgcccaaac cgccgctgct gcagccgcta tagaagcaaa ggccaccgct 660
tcctcagaaa gcaccgctgc cgctactagt aaggccgccg tgttgaccgc tgacactagc 720
agcgcagaag ctgccgctgc agcggaggca caatccgctt cgcggatcgc aggtacagca 780
gccaccgagg gatccgccaa ctgggctagc gagaactcgc gtaccgcaca actggaagct 840
tccgcctcag cgaaggccac cgcagccgca gctgtcggag atggagctat tataggactt 900
gcacgggacg ctagtgccgc agctcaggca gccgcagaag ttaaagcctt agctgaagct 960
agtgccagct taggtgcttc agaaaaggac aagaaatga 999
<210> 31
<211> 1017
<212> DNA
<213> Bombus terrestris
<400> 31
ggcaaaccac tcattgccaa tgcgcaaata gggaaggtca agaccgaaac gtcatcgtct 60
tcagagattg agacgttggt atcaggaagc cagacattgg tggcaggaag tgagacattg 120
gcttcagaaa gcgaggcatt ggcgtcaaaa agcgaggcat tgacgtcaga agccgagata 180
gcgagcgtga caacgaagga cgagctcata ctaaagggcg aagctatcac tggaaagaaa 240
ctaggaaccg gggcgtcgga agtagcggcg gcctctgggg aggctatcgc aactaccctt 300
ggcgcgggac aagctgcagc agaggcacaa gcagccgccg ccgcgcaagc aaaatcagca 360
gcggcagctg ccgcgaatgc aggtgaatcc agcaacagtg ctgctgcgtt ggttgctgct 420
gcagctgcag cacaaggaaa agcggctgcc gccgcagcag ccgcgacgaa ggctagctta 480
gaggccgcag acgctgctga ggaagctgag tcggccgtgg ccttggctag ggctgcctcc 540
gcaaaggcgg aagcgctcgc atcgaccgcc gctgctgcga atacccgtgc tgctctccaa 600
gcggaaaaat cgaacgagct ggcgcaagct gaggctgcag ccgccgccga agcccaggct 660
aaagccgccg ctgctgccaa ggcaacacaa ctcgccctta aagttgccga aactgcggtg 720
aaaacggaag cagatgcagc agctgccgcc gttgcggccg caaaagccag agcagtcgca 780
gacgcagccg cgtctcgtgc gaccgcagtg aacgccattg ctgaagcgga agaaagagac 840
tctgcacagg cggagaacac cgctggtgta gcacaagcag cgctcgctgc tgcggaagca 900
caagactcct gcatcggcgc tgccgcgact cctaggcatt cgtcgagcta tgcatggtgg 960
aagcttagga taacatcctt gatcgtcatt ctatcgccac gcaatcgacg tacttaa 1017
<210> 32
<211> 1074
<212> DNA
<213> Bombus terrestris
<400> 32
atgaagattc catcgatact cgcggtgtcc ctgctggttt ggggtctggc cagcgcaggc 60
aaaccactca ttgccaatgc gcaaataggg aaggtcaaga ccgaaacgtc atcgtcttca 120
gagattgaga cgttggtatc aggaagccag acattggtgg caggaagtga gacattggct 180
tcagaaagcg aggcattggc gtcaaaaagc gaggcattga cgtcagaagc cgagatagcg 240
agcgtgacaa cgaaggacga gctcatacta aagggcgaag ctatcactgg aaagaaacta 300
ggaaccgggg cgtcggaagt agcggcggcc tctggggagg ctatcgcaac tacccttggc 360
gcgggacaag ctgcagcaga ggcacaagca gccgccgccg cgcaagcaaa atcagcagcg 420
gcagctgccg cgaatgcagg tgaatccagc aacagtgctg ctgcgttggt tgctgctgca 480
gctgcagcac aaggaaaagc ggctgccgcc gcagcagccg cgacgaaggc tagcttagag 540
gccgcagacg ctgctgagga agctgagtcg gccgtggcct tggctagggc tgcctccgca 600
aaggcggaag cgctcgcatc gaccgccgct gctgcgaata cccgtgctgc tctccaagcg 660
gaaaaatcga acgagctggc gcaagctgag gctgcagccg ccgccgaagc ccaggctaaa 720
gccgccgctg ctgccaaggc aacacaactc gcccttaaag ttgccgaaac tgcggtgaaa 780
acggaagcag atgcagcagc tgccgccgtt gcggccgcaa aagccagagc agtcgcagac 840
gcagccgcgt ctcgtgcgac cgcagtgaac gccattgctg aagcggaaga aagagactct 900
gcacaggcgg agaacaccgc tggtgtagca caagcagcgc tcgctgctgc ggaagcacaa 960
gactcctgca tcggcgctgc cgcgactcct aggcattcgt cgagctatgc atggtggaag 1020
cttaggataa catccttgat cgtcattcta tcgccacgca atcgacgtac ttaa 1074
<210> 33
<211> 403
<212> PRT
<213> Myrmecia forficata
<400> 33
Ser Gly Pro Arg Leu Leu Gly Gly Arg Ser Ala Ala Ser Ala Ser Ala
1 5 10 15
Ser Ala Ser Ala Glu Ala Ser Ala Gly Gly Trp Arg Lys Ser Gly Ala
20 25 30
Ser Ala Ser Ala Ser Ala Lys Ala Gly Ser Ser Asn Ile Leu Ser Arg
35 40 45
Val Gly Ala Ser Arg Ala Ala Ala Thr Leu Val Ala Ser Ala Ala Val
50 55 60
Glu Ala Lys Ala Gly Leu Arg Ala Gly Lys Ala Thr Ala Glu Glu Gln
65 70 75 80
Arg Glu Ala Leu Glu Met Leu Thr Leu Ser Ala Asp Lys Asn Ala Glu
85 90 95
Ala Arg Ile Leu Ala Asp Asp Thr Ala Val Leu Val Gln Gly Ser Ala
100 105 110
Glu Ala Gln Ser Val Ala Ala Ala Lys Thr Val Ala Val Glu Glu Glu
115 120 125
Ser Ala Ser Leu Asp Ala Ala Ala Val Glu Ala Glu Val Ala Ala Ala
130 135 140
Thr Ser Lys Ser Ser Ala Gly Gln Ala Leu Gln Ser Ala Gln Thr Ala
145 150 155 160
Ala Ser Ala Leu Arg Thr Ser Ala Arg Ser Ala Leu Thr Ala Leu Lys
165 170 175
Leu Ala Arg Leu Gln Gly Ala Ala Ser Ser Asn Ala Ala Arg Met Met
180 185 190
Glu Lys Ala Leu Ala Ala Thr Gln Asp Ala Asn Ala Ala Ala Gln Gln
195 200 205
Ala Met Ala Ala Glu Ser Ala Ala Ala Glu Ala Ala Ala Ile Ala Ala
210 215 220
Ala Lys Gln Ser Glu Ala Arg Asp Ala Gly Ala Glu Ala Lys Ala Ala
225 230 235 240
Met Ala Ala Leu Ile Thr Ala Gln Arg Asn Leu Val Gln Ala Asn Ala
245 250 255
Arg Ala Glu Met Ala Ser Glu Glu Ala Glu Leu Asp Ser Lys Ser Arg
260 265 270
Ala Ser Asp Ala Lys Val Asn Ala Val Ala Arg Ala Ala Ser Lys Ser
275 280 285
Ser Ile Arg Arg Asp Glu Leu Ile Glu Ile Gly Ala Glu Phe Gly Lys
290 295 300
Ala Ser Gly Glu Val Ile Ser Thr Gly Thr Arg Ser Asn Gly Gly Gln
305 310 315 320
Asp Ala Ile Ala Thr Ala Glu Ala Ser Ser Ser Ala Ser Ala Val Gly
325 330 335
Ile Lys Lys Thr Ser Gly His Trp Gly Ser Gly Lys Trp Ser Arg Val
340 345 350
Ser Lys Gly Lys Gly Trp Ala Ser Ser Asn Ala Asp Ala Asp Ala Ser
355 360 365
Ser Ser Ser Ile Ile Ile Gly Gly Leu Lys Arg Gly Gly Leu Gly Ser
370 375 380
Glu Ala Ser Ala Ala Ala Ser Ala Glu Ala Glu Ala Ser Ala Gly Thr
385 390 395 400
Leu Leu Leu
<210> 34
<211> 422
<212> PRT
<213> Myrmecia forficata
<400> 34
Met Lys Ile Pro Ala Ile Ile Ala Thr Ser Leu Leu Leu Trp Gly Phe
1 5 10 15
Ala Ser Ala Ser Gly Pro Arg Leu Leu Gly Gly Arg Ser Ala Ala Ser
20 25 30
Ala Ser Ala Ser Ala Ser Ala Glu Ala Ser Ala Gly Gly Trp Arg Lys
35 40 45
Ser Gly Ala Ser Ala Ser Ala Ser Ala Lys Ala Gly Ser Ser Asn Ile
50 55 60
Leu Ser Arg Val Gly Ala Ser Arg Ala Ala Ala Thr Leu Val Ala Ser
65 70 75 80
Ala Ala Val Glu Ala Lys Ala Gly Leu Arg Ala Gly Lys Ala Thr Ala
85 90 95
Glu Glu Gln Arg Glu Ala Leu Glu Met Leu Thr Leu Ser Ala Asp Lys
100 105 110
Asn Ala Glu Ala Arg Ile Leu Ala Asp Asp Thr Ala Val Leu Val Gln
115 120 125
Gly Ser Ala Glu Ala Gln Ser Val Ala Ala Ala Lys Thr Val Ala Val
130 135 140
Glu Glu Glu Ser Ala Ser Leu Asp Ala Ala Ala Val Glu Ala Glu Val
145 150 155 160
Ala Ala Ala Thr Ser Lys Ser Ser Ala Gly Gln Ala Leu Gln Ser Ala
165 170 175
Gln Thr Ala Ala Ser Ala Leu Arg Thr Ser Ala Arg Ser Ala Leu Thr
180 185 190
Ala Leu Lys Leu Ala Arg Leu Gln Gly Ala Ala Ser Ser Asn Ala Ala
195 200 205
Arg Met Met Glu Lys Ala Leu Ala Ala Thr Gln Asp Ala Asn Ala Ala
210 215 220
Ala Gln Gln Ala Met Ala Ala Glu Ser Ala Ala Ala Glu Ala Ala Ala
225 230 235 240
Ile Ala Ala Ala Lys Gln Ser Glu Ala Arg Asp Ala Gly Ala Glu Ala
245 250 255
Lys Ala Ala Met Ala Ala Leu Ile Thr Ala Gln Arg Asn Leu Val Gln
260 265 270
Ala Asn Ala Arg Ala Glu Met Ala Ser Glu Glu Ala Glu Leu Asp Ser
275 280 285
Lys Ser Arg Ala Ser Asp Ala Lys Val Asn Ala Val Ala Arg Ala Ala
290 295 300
Ser Lys Ser Ser Ile Arg Arg Asp Glu Leu Ile Glu Ile Gly Ala Glu
305 310 315 320
Phe Gly Lys Ala Ser Gly Glu Val Ile Ser Thr Gly Thr Arg Ser Asn
325 330 335
Gly Gly Gln Asp Ala Ile Ala Thr Ala Glu Ala Ser Ser Ser Ala Ser
340 345 350
Ala Val Gly Ile Lys Lys Thr Ser Gly His Trp Gly Ser Gly Lys Trp
355 360 365
Ser Arg Val Ser Lys Gly Lys Gly Trp Ala Ser Ser Asn Ala Asp Ala
370 375 380
Asp Ala Ser Ser Ser Ser Ile Ile Ile Gly Gly Leu Lys Arg Gly Gly
385 390 395 400
Leu Gly Ser Glu Ala Ser Ala Ala Ala Ser Ala Glu Ala Glu Ala Ser
405 410 415
Ala Gly Thr Leu Leu Leu
420
<210> 35
<211> 392
<212> PRT
<213> Myrmecia forficata
<400> 35
Arg Val Ile Glu Ser Ser Ser Ser Ala Ser Ala Gln Ala Ser Ala Ser
1 5 10 15
Ala Gly Ser Arg Gly Leu Leu Gly Lys Arg Pro Ile Gly Lys Leu Glu
20 25 30
Trp Gly Lys Glu Glu Lys Lys Leu Glu Glu Leu Asp Glu Glu Ser Leu
35 40 45
Asn Glu Ala Ala Leu Lys Val Gly Ile Lys Asn Gly Gly Leu Asp Val
50 55 60
Ala Lys Gly Ala Ala Val Leu Glu Ala Ala Met Ser Asp Val Ala Thr
65 70 75 80
Leu Thr Asp Gln Arg Ser Leu Val Asp Leu Gly Leu Gly Pro Val Ala
85 90 95
Asn Glu Ala Glu Ile Leu Ala Glu Ala Gln Ala Ala Thr Ser Ala Gln
100 105 110
Ala Gly Ala Val Ala Asn Ser Ala Ala Glu Arg Ala Ile Ala Ala Met
115 120 125
Glu Met Ala Asp Arg Thr Glu Tyr Ile Ala Ala Leu Val Thr Thr Lys
130 135 140
Ala Ala Lys Ala Ala Glu Ala Thr Met Ala Ala Thr Ala Arg Ala Thr
145 150 155 160
Ala Ala Ala Ser Ala Ser Lys Ile Ser Ser Gln Glu Ser Ala Ala Ser
165 170 175
Ala Ala Asn Ala Ala Asn Ala Glu Ala Lys Ala Asn Ala Ala Ser Ile
180 185 190
Ile Ala Asn Lys Ala Asn Ala Val Leu Ala Glu Ala Ala Ala Val Leu
195 200 205
Ala Ala Thr Ala Ala Lys Ala Lys Glu Ser Ala Met Lys Ser Leu Ser
210 215 220
Ala Ala Gln Ala Ala Ala Lys Ala Gln Ala Arg Asn Ala Glu Ala Ser
225 230 235 240
Ala Glu Ala Gln Ile Lys Leu Ser Gln Ala Arg Ala Ala Val Ala Arg
245 250 255
Ala Ala Ala Asp Gln Ala Val Cys Ser Ser Gln Ala Gln Ala Ala Ser
260 265 270
Gln Ile Gln Ser Arg Ala Ser Ala Ser Glu Ser Ala Ala Ser Ala Gln
275 280 285
Ser Glu Thr Asn Thr Ala Ala Ala Glu Ala Val Ala Thr Ala Asp Ala
290 295 300
Glu Ala Ala Ala Gln Ala Glu Ala Trp Val Met Ser Leu Lys Asn Asp
305 310 315 320
Leu Trp Leu His Leu Asn Met Lys Gly Glu Ala Lys Ala Glu Gly Glu
325 330 335
Ala Val Ser Ile Ser Lys Gly His Arg Gly Gly Ile Arg Ser Gly Ser
340 345 350
Ile Ser Glu Ala Ser Ala Glu Ala Ser Ser Asn Val Ser Met Gly Gly
355 360 365
Arg His Gly Arg Lys Asp Leu Val Ser Glu Ala Leu Ala Gly Ala Ser
370 375 380
Ala Gly Ser Ser Ala Asp Ser Leu
385 390
<210> 36
<211> 411
<212> PRT
<213> Myrmecia forficata
<400> 36
Met Lys Ile Pro Ala Ile Leu Val Thr Ser Leu Leu Ala Trp Gly Leu
1 5 10 15
Ala Ser Gly Arg Val Ile Glu Ser Ser Ser Ser Ala Ser Ala Gln Ala
20 25 30
Ser Ala Ser Ala Gly Ser Arg Gly Leu Leu Gly Lys Arg Pro Ile Gly
35 40 45
Lys Leu Glu Trp Gly Lys Glu Glu Lys Lys Leu Glu Glu Leu Asp Glu
50 55 60
Glu Ser Leu Asn Glu Ala Ala Leu Lys Val Gly Ile Lys Asn Gly Gly
65 70 75 80
Leu Asp Val Ala Lys Gly Ala Ala Val Leu Glu Ala Ala Met Ser Asp
85 90 95
Val Ala Thr Leu Thr Asp Gln Arg Ser Leu Val Asp Leu Gly Leu Gly
100 105 110
Pro Val Ala Asn Glu Ala Glu Ile Leu Ala Glu Ala Gln Ala Ala Thr
115 120 125
Ser Ala Gln Ala Gly Ala Val Ala Asn Ser Ala Ala Glu Arg Ala Ile
130 135 140
Ala Ala Met Glu Met Ala Asp Arg Thr Glu Tyr Ile Ala Ala Leu Val
145 150 155 160
Thr Thr Lys Ala Ala Lys Ala Ala Glu Ala Thr Met Ala Ala Thr Ala
165 170 175
Arg Ala Thr Ala Ala Ala Ser Ala Ser Lys Ile Ser Ser Gln Glu Ser
180 185 190
Ala Ala Ser Ala Ala Asn Ala Ala Asn Ala Glu Ala Lys Ala Asn Ala
195 200 205
Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala Val Leu Ala Glu Ala Ala
210 215 220
Ala Val Leu Ala Ala Thr Ala Ala Lys Ala Lys Glu Ser Ala Met Lys
225 230 235 240
Ser Leu Ser Ala Ala Gln Ala Ala Ala Lys Ala Gln Ala Arg Asn Ala
245 250 255
Glu Ala Ser Ala Glu Ala Gln Ile Lys Leu Ser Gln Ala Arg Ala Ala
260 265 270
Val Ala Arg Ala Ala Ala Asp Gln Ala Val Cys Ser Ser Gln Ala Gln
275 280 285
Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser Ala Ser Glu Ser Ala Ala
290 295 300
Ser Ala Gln Ser Glu Thr Asn Thr Ala Ala Ala Glu Ala Val Ala Thr
305 310 315 320
Ala Asp Ala Glu Ala Ala Ala Gln Ala Glu Ala Trp Val Met Ser Leu
325 330 335
Lys Asn Asp Leu Trp Leu His Leu Asn Met Lys Gly Glu Ala Lys Ala
340 345 350
Glu Gly Glu Ala Val Ser Ile Ser Lys Gly His Arg Gly Gly Ile Arg
355 360 365
Ser Gly Ser Ile Ser Glu Ala Ser Ala Glu Ala Ser Ser Asn Val Ser
370 375 380
Met Gly Gly Arg His Gly Arg Lys Asp Leu Val Ser Glu Ala Leu Ala
385 390 395 400
Gly Ala Ser Ala Gly Ser Ser Ala Asp Ser Leu
405 410
<210> 37
<211> 375
<212> PRT
<213> Myrmecia forficata
<400> 37
Asn Leu Leu Lys Glu Ser Lys Ala Ser Ala Ser Ala Ser Ala Ser Ala
1 5 10 15
Ser Ala Arg Ala Ser Gly Lys Lys Asn Leu His Val Leu Pro Leu Pro
20 25 30
Lys Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser Val Phe Asp Ile
35 40 45
Lys Asp Val Val Leu Ser Ala Val Asp Glu Ile Asn Gly Ala Pro Lys
50 55 60
Leu Gly Leu Gly Trp Lys Lys Val Ser Met Gly Val Glu Arg Ala Glu
65 70 75 80
Ala Asn Ala Ala Ala Ala Ala Glu Ala Leu Ala Met Ile Lys Lys Ile
85 90 95
Ala Met Ala Arg Ser Ser Ala Tyr Val Gln Ala Ala Trp Ala Ser Ala
100 105 110
Gln Ala Ser Ala Asp Ala Leu Ala Ser Ala Arg Val Ala Gln Ala Ser
115 120 125
Gln Glu Ala Ala Glu Ala Lys Gly Arg Ala Ala Ser Glu Ala Leu Ser
130 135 140
Arg Ala Ile Glu Ala Ser Ser Arg Ala Asp Ala Ala Ala Ala Ala Thr
145 150 155 160
Leu Asp Ala Met Asp Arg Thr Met Glu Asn Ala Arg Ala Ala Asn Ala
165 170 175
Ala Gln Thr Gln Ala Ser Gly Gln Ala Glu Asn Ala Asn Arg Ser Ala
180 185 190
Ala Ala Ile Leu Ala Ala Leu Leu Arg Ile Ala Glu Ala Ser Ala Leu
195 200 205
Asn Asn Glu Ala Ala Val Asn Ala Ala Ala Ala Ala Ala Ala Ala Ser
210 215 220
Ala Leu Gln Ala Lys Ala Asn Ala Ala Ser Gln Ala Thr Ala Arg Ala
225 230 235 240
Ala Gly Gln Ala Ser Thr Ala Ala Glu Glu Ala Gln Ser Ala Gln Glu
245 250 255
Ala Ala Asp Lys Asn Ala Glu Leu Thr Thr Val Met Leu Glu Lys Ala
260 265 270
Ser Ala Asp Gln Gln Ala Ala Ser Ala Arg Ala Asp Tyr Tyr Thr Ala
275 280 285
Ser Thr Glu Ala Glu Ala Ala Ala Gln Ala Ser Ala Ile Asn Ala Leu
290 295 300
Arg Asp Gly Ile Val Val Gly Met Gly Asn Asp Ala Gly Ala Ser Ala
305 310 315 320
Gln Ala Met Ala Gln Val Glu Ala Leu Ala Arg Ala Ser Glu His Lys
325 330 335
Ala Leu Gly Glu Lys Lys Lys Gly Leu Val Trp Gly Tyr Gly Ser Lys
340 345 350
Gly Ser Ser Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Glu Ala Ser
355 360 365
Ser Arg Leu Gly Lys Asp Trp
370 375
<210> 38
<211> 394
<212> PRT
<213> Myrmecia forficata
<400> 38
Met Lys Ile Pro Ala Ile Leu Val Thr Ser Phe Leu Ala Trp Gly Leu
1 5 10 15
Ala Ser Gly Asn Leu Leu Lys Glu Ser Lys Ala Ser Ala Ser Ala Ser
20 25 30
Ala Ser Ala Ser Ala Arg Ala Ser Gly Lys Lys Asn Leu His Val Leu
35 40 45
Pro Leu Pro Lys Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser Val
50 55 60
Phe Asp Ile Lys Asp Val Val Leu Ser Ala Val Asp Glu Ile Asn Gly
65 70 75 80
Ala Pro Lys Leu Gly Leu Gly Trp Lys Lys Val Ser Met Gly Val Glu
85 90 95
Arg Ala Glu Ala Asn Ala Ala Ala Ala Ala Glu Ala Leu Ala Met Ile
100 105 110
Lys Lys Ile Ala Met Ala Arg Ser Ser Ala Tyr Val Gln Ala Ala Trp
115 120 125
Ala Ser Ala Gln Ala Ser Ala Asp Ala Leu Ala Ser Ala Arg Val Ala
130 135 140
Gln Ala Ser Gln Glu Ala Ala Glu Ala Lys Gly Arg Ala Ala Ser Glu
145 150 155 160
Ala Leu Ser Arg Ala Ile Glu Ala Ser Ser Arg Ala Asp Ala Ala Ala
165 170 175
Ala Ala Thr Leu Asp Ala Met Asp Arg Thr Met Glu Asn Ala Arg Ala
180 185 190
Ala Asn Ala Ala Gln Thr Gln Ala Ser Gly Gln Ala Glu Asn Ala Asn
195 200 205
Arg Ser Ala Ala Ala Ile Leu Ala Ala Leu Leu Arg Ile Ala Glu Ala
210 215 220
Ser Ala Leu Asn Asn Glu Ala Ala Val Asn Ala Ala Ala Ala Ala Ala
225 230 235 240
Ala Ala Ser Ala Leu Gln Ala Lys Ala Asn Ala Ala Ser Gln Ala Thr
245 250 255
Ala Arg Ala Ala Gly Gln Ala Ser Thr Ala Ala Glu Glu Ala Gln Ser
260 265 270
Ala Gln Glu Ala Ala Asp Lys Asn Ala Glu Leu Thr Thr Val Met Leu
275 280 285
Glu Lys Ala Ser Ala Asp Gln Gln Ala Ala Ser Ala Arg Ala Asp Tyr
290 295 300
Tyr Thr Ala Ser Thr Glu Ala Glu Ala Ala Ala Gln Ala Ser Ala Ile
305 310 315 320
Asn Ala Leu Arg Asp Gly Ile Val Val Gly Met Gly Asn Asp Ala Gly
325 330 335
Ala Ser Ala Gln Ala Met Ala Gln Val Glu Ala Leu Ala Arg Ala Ser
340 345 350
Glu His Lys Ala Leu Gly Glu Lys Lys Lys Gly Leu Val Trp Gly Tyr
355 360 365
Gly Ser Lys Gly Ser Ser Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala
370 375 380
Glu Ala Ser Ser Arg Leu Gly Lys Asp Trp
385 390
<210> 39
<211> 422
<212> PRT
<213> Myrmecia forficata
<400> 39
Ser Glu Leu Glu Ser Glu Ala Ser Ala Ala Ala Ser Ala Gln Ala Glu
1 5 10 15
Ala Ser Ser Ser Gly Arg Ser Gly Lys Leu Ser Ala Ser Gln Ala Ser
20 25 30
Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Ser Arg Gly Gly Ser Lys
35 40 45
Gly Gly Trp Gly Gln Leu Arg Arg Gly Asp Val Lys Ser Glu Ala Lys
50 55 60
Ser Ala Ala Ala Ile Ala Val Glu Gly Ala Lys Ile Gly Thr Gly Ile
65 70 75 80
Gly Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg Gly Leu Gly
85 90 95
Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala Gly Gln Ala
100 105 110
Glu Val Ala Ala Lys Ser Cys Glu Leu Ala Asp Lys Thr Thr Ala Lys
115 120 125
Ala Val Ala Met Val Glu Ala Ala Ala Glu Ala Glu Ile Glu Val Ala
130 135 140
Asn Gln Glu Val Ala Ala Val Lys Leu Ser Thr Trp Ala Ala Lys Ala
145 150 155 160
Ala Arg Ile Val Glu Glu Asp Ser Ala Ala Val Arg Ala Ala Ala Gly
165 170 175
Lys Leu Leu Leu Ala Ala Arg Ala Ala Ala Ala Ala Glu Arg Arg Ala
180 185 190
Asn Glu Glu Ser Glu Ala Ala Asn Glu Leu Ala Gln Ala Ser Ser Ala
195 200 205
Ala Ala Ala Glu Ala Glu Ala Lys Ala Asn Ala Gly Arg Glu Ala Ala
210 215 220
Ala Ala Ala Leu Ala Ile Ala Glu Ala Ala Val Ala Ile Glu Gln Glu
225 230 235 240
Ala Val Ile Leu Ala Arg Lys Ala Gln Asp Ala Arg Leu Asn Ala Glu
245 250 255
Ala Ala Ala Ala Ala Ala Met Asn Ala Arg Val Ile Ala Ser Ala Glu
260 265 270
Ser Glu Ala Ser Glu Asp Leu Glu Asn Arg Ala Ser Val Ala Arg Ala
275 280 285
Ser Ala Ala Gly Ala Ala Glu Ala Lys Ala Ile Ala Thr Asp Ala Gly
290 295 300
Ala Thr Ala Glu Ile Ala Ala Tyr Ser Trp Ala Lys Lys Gly Glu Leu
305 310 315 320
Ile Asn Pro Gly Pro Leu Pro Lys Ile Ile Ser Val Asn Ala Asp Leu
325 330 335
Ser Lys Ser Glu Val Glu Ala Met Lys Ile Thr Arg Gly Gln Val Gln
340 345 350
Glu Val Lys Lys Ile Ser Thr His Lys Gly Gly Trp Gly Trp Gly Lys
355 360 365
Glu Gly Arg Ser Lys Val Ser Ser Asn Ala Ser Ala Arg Ala Ser Ala
370 375 380
Ser Ala Asn Ala Ala Ala Gly Ser Leu Gly Ser Lys Trp Gly Arg Gln
385 390 395 400
Leu Ser Ala Ser Ser Ala Ser Ala Asp Ala Asn Ala Glu Ala Asp Ser
405 410 415
Gln Leu Leu Lys Val Trp
420
<210> 40
<211> 441
<212> PRT
<213> Myrmecia forficata
<400> 40
Met Lys Ile Pro Ala Ile Leu Ala Thr Ser Leu Leu Ile Trp Gly Leu
1 5 10 15
Val Gly Ala Ser Glu Leu Glu Ser Glu Ala Ser Ala Ala Ala Ser Ala
20 25 30
Gln Ala Glu Ala Ser Ser Ser Gly Arg Ser Gly Lys Leu Ser Ala Ser
35 40 45
Gln Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Ser Arg Gly
50 55 60
Gly Ser Lys Gly Gly Trp Gly Gln Leu Arg Arg Gly Asp Val Lys Ser
65 70 75 80
Glu Ala Lys Ser Ala Ala Ala Ile Ala Val Glu Gly Ala Lys Ile Gly
85 90 95
Thr Gly Ile Gly Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg
100 105 110
Gly Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala
115 120 125
Gly Gln Ala Glu Val Ala Ala Lys Ser Cys Glu Leu Ala Asp Lys Thr
130 135 140
Thr Ala Lys Ala Val Ala Met Val Glu Ala Ala Ala Glu Ala Glu Ile
145 150 155 160
Glu Val Ala Asn Gln Glu Val Ala Ala Val Lys Leu Ser Thr Trp Ala
165 170 175
Ala Lys Ala Ala Arg Ile Val Glu Glu Asp Ser Ala Ala Val Arg Ala
180 185 190
Ala Ala Gly Lys Leu Leu Leu Ala Ala Arg Ala Ala Ala Ala Ala Glu
195 200 205
Arg Arg Ala Asn Glu Glu Ser Glu Ala Ala Asn Glu Leu Ala Gln Ala
210 215 220
Ser Ser Ala Ala Ala Ala Glu Ala Glu Ala Lys Ala Asn Ala Gly Arg
225 230 235 240
Glu Ala Ala Ala Ala Ala Leu Ala Ile Ala Glu Ala Ala Val Ala Ile
245 250 255
Glu Gln Glu Ala Val Ile Leu Ala Arg Lys Ala Gln Asp Ala Arg Leu
260 265 270
Asn Ala Glu Ala Ala Ala Ala Ala Ala Met Asn Ala Arg Val Ile Ala
275 280 285
Ser Ala Glu Ser Glu Ala Ser Glu Asp Leu Glu Asn Arg Ala Ser Val
290 295 300
Ala Arg Ala Ser Ala Ala Gly Ala Ala Glu Ala Lys Ala Ile Ala Thr
305 310 315 320
Asp Ala Gly Ala Thr Ala Glu Ile Ala Ala Tyr Ser Trp Ala Lys Lys
325 330 335
Gly Glu Leu Ile Asn Pro Gly Pro Leu Pro Lys Ile Ile Ser Val Asn
340 345 350
Ala Asp Leu Ser Lys Ser Glu Val Glu Ala Met Lys Ile Thr Arg Gly
355 360 365
Gln Val Gln Glu Val Lys Lys Ile Ser Thr His Lys Gly Gly Trp Gly
370 375 380
Trp Gly Lys Glu Gly Arg Ser Lys Val Ser Ser Asn Ala Ser Ala Arg
385 390 395 400
Ala Ser Ala Ser Ala Asn Ala Ala Ala Gly Ser Leu Gly Ser Lys Trp
405 410 415
Gly Arg Gln Leu Ser Ala Ser Ser Ala Ser Ala Asp Ala Asn Ala Glu
420 425 430
Ala Asp Ser Gln Leu Leu Lys Val Trp
435 440
<210> 41
<211> 1212
<212> DNA
<213> Myrmecia forficata
<400> 41
agcgggccgc gcttactcgg cggcagatcg gccgcgtccg cgtcggcttc cgcttcggct 60
gaggcgtcgg cgggcggttg gaggaaaagc ggcgcatccg cttccgcttc cgctaaggct 120
ggtagcagca acatcctcag ccgcgtggga gcttcgaggg cggccgcgac gttggtcgct 180
tccgccgcgg tggaggccaa ggcgggtctc cgtgccggca aggcaaccgc cgaggagcag 240
agggaggctt tggaaatgct caccttgtcc gccgacaaga atgccgaggc gcgtatcctg 300
gccgacgaca cggccgttct ggttcaaggc agcgccgagg cacagtcggt cgccgccgcg 360
aagaccgtcg cggtcgagga agagtccgct tccttggatg cggccgcagt tgaagcggag 420
gtcgcagccg ccacgtcgaa atcgtcggct ggccaagcac tccagtccgc acagaccgcc 480
gcatctgctc tcagaacttc cgccaggagc gccttgacgg ccctcaagct ggcacgcctc 540
caaggcgcgg cttctagcaa cgctgccagg atgatggaaa aggcgctggc cgccacccag 600
gacgcaaatg ccgccgccca gcaagctatg gcggccgaga gtgcagccgc agaagcagcg 660
gctatcgcgg cagcgaaaca atcggaggcg agagacgccg gcgccgaggc caaggccgcc 720
atggcagcac tcatcaccgc ccagaggaat ctcgtgcagg ccaatgccag ggcggaaatg 780
gcaagcgagg aagccgaatt ggattcgaag tctagagcgt ccgacgccaa ggtgaacgcc 840
gttgctcgtg cggcctccaa gtccagcata cgcagagatg aacttatcga gatcggcgct 900
gagttcggca aggccagcgg cgaggtgatt tccaccggca cgcgttccaa cggcggtcaa 960
gacgccatcg ccaccgccga ggcatcgagt agcgcgtccg ccgtcggcat caagaaaaca 1020
agcggacact gggggagcgg aaaatggagt cgtgtctcca agggtaaagg atgggcttcc 1080
tcgaatgcgg acgctgacgc cagcagcagc agcatcatca tcggcggtct caaacgcggc 1140
ggcctcggtt cggaagcctc tgcggcagct tccgcagaag cggaagcttc cgccggcaca 1200
ctcctgctgt aa 1212
<210> 42
<211> 1269
<212> DNA
<213> Myrmecia forficata
<400> 42
atgaagatcc cagcgataat cgcaacgtcc cttctcctct ggggtttcgc cagcgccagc 60
gggccgcgct tactcggcgg cagatcggcc gcgtccgcgt cggcttccgc ttcggctgag 120
gcgtcggcgg gcggttggag gaaaagcggc gcatccgctt ccgcttccgc taaggctggt 180
agcagcaaca tcctcagccg cgtgggagct tcgagggcgg ccgcgacgtt ggtcgcttcc 240
gccgcggtgg aggccaaggc gggtctccgt gccggcaagg caaccgccga ggagcagagg 300
gaggctttgg aaatgctcac cttgtccgcc gacaagaatg ccgaggcgcg tatcctggcc 360
gacgacacgg ccgttctggt tcaaggcagc gccgaggcac agtcggtcgc cgccgcgaag 420
accgtcgcgg tcgaggaaga gtccgcttcc ttggatgcgg ccgcagttga agcggaggtc 480
gcagccgcca cgtcgaaatc gtcggctggc caagcactcc agtccgcaca gaccgccgca 540
tctgctctca gaacttccgc caggagcgcc ttgacggccc tcaagctggc acgcctccaa 600
ggcgcggctt ctagcaacgc tgccaggatg atggaaaagg cgctggccgc cacccaggac 660
gcaaatgccg ccgcccagca agctatggcg gccgagagtg cagccgcaga agcagcggct 720
atcgcggcag cgaaacaatc ggaggcgaga gacgccggcg ccgaggccaa ggccgccatg 780
gcagcactca tcaccgccca gaggaatctc gtgcaggcca atgccagggc ggaaatggca 840
agcgaggaag ccgaattgga ttcgaagtct agagcgtccg acgccaaggt gaacgccgtt 900
gctcgtgcgg cctccaagtc cagcatacgc agagatgaac ttatcgagat cggcgctgag 960
ttcggcaagg ccagcggcga ggtgatttcc accggcacgc gttccaacgg cggtcaagac 1020
gccatcgcca ccgccgaggc atcgagtagc gcgtccgccg tcggcatcaa gaaaacaagc 1080
ggacactggg ggagcggaaa atggagtcgt gtctccaagg gtaaaggatg ggcttcctcg 1140
aatgcggacg ctgacgccag cagcagcagc atcatcatcg gcggtctcaa acgcggcggc 1200
ctcggttcgg aagcctctgc ggcagcttcc gcagaagcgg aagcttccgc cggcacactc 1260
ctgctgtaa 1269
<210> 43
<211> 1179
<212> DNA
<213> Myrmecia forficata
<400> 43
cgggtcatcg agtccagctc gtcggcttcc gcacaggcgt cggcatcggc cggctcgaga 60
ggcctgctcg gtaaacggcc gattggcaag ctcgagtggg gcaaggagga gaagaaactc 120
gaagaactcg acgaggaatc gctcaatgag gccgctctga aggtcggcat caagaacggc 180
ggattggatg tcgcgaaggg cgcggcagtc ctcgaggcag cgatgagcga cgtcgcgacc 240
cttacggatc agcgttctct tgtggatctc ggtctcggcc cggtcgcgaa cgaggccgag 300
atcctggcgg aggcgcaggc cgccacgagc gcccaagctg gcgctgtcgc taatagcgcc 360
gcggagcgtg cgatcgcggc gatggagatg gccgacagaa ccgaatatat tgcggcactt 420
gtcaccacca aagccgccaa agctgccgag gccactatgg ccgctactgc ccgtgccacc 480
gccgccgcct cagcctccaa gatatccagt caggaatcag ccgcatcggc cgctaacgcc 540
gccaacgccg aagccaaggc caacgccgct tccataatcg ctaacaaggc gaacgccgtc 600
ctggctgagg ccgccgccgt actcgcagcc actgctgcca aggccaagga atcggcgatg 660
aaatcgctta gcgccgctca ggccgccgcc aaggcacaag ccaggaacgc cgaggcctcc 720
gccgaagctc agatcaaact ttcccaggcc agggccgccg tggcacgcgc tgcagccgat 780
caggccgtct gttcctccca ggctcaggcc gcaagtcaga tacaatcgag ggcatccgca 840
tccgaatccg cggcatcggc acaatcagag accaacaccg ccgcggccga agcggtcgcc 900
accgctgacg ccgaagcggc cgcgcaagct gaagcgtggg tcatgtcgct gaagaacgat 960
ctgtggctgc atctcaacat gaagggtgag gccaaggccg aaggcgaggc cgtttcgatc 1020
agcaaaggac atcgcggcgg tatcaggtcg ggcagcatct cggaagccag cgccgaggca 1080
agcagcaacg tttccatggg cggacgtcat ggacggaagg acctcgtctc tgaagcgtta 1140
gcgggagcat cagcgggcag cagtgccgac tccctttga 1179
<210> 44
<211> 1236
<212> DNA
<213> Myrmecia forficata
<400> 44
atgaagattc cagcgatact cgtgacgtct ctcctcgcct ggggattagc cagcggccgg 60
gtcatcgagt ccagctcgtc ggcttccgca caggcgtcgg catcggccgg ctcgagaggc 120
ctgctcggta aacggccgat tggcaagctc gagtggggca aggaggagaa gaaactcgaa 180
gaactcgacg aggaatcgct caatgaggcc gctctgaagg tcggcatcaa gaacggcgga 240
ttggatgtcg cgaagggcgc ggcagtcctc gaggcagcga tgagcgacgt cgcgaccctt 300
acggatcagc gttctcttgt ggatctcggt ctcggcccgg tcgcgaacga ggccgagatc 360
ctggcggagg cgcaggccgc cacgagcgcc caagctggcg ctgtcgctaa tagcgccgcg 420
gagcgtgcga tcgcggcgat ggagatggcc gacagaaccg aatatattgc ggcacttgtc 480
accaccaaag ccgccaaagc tgccgaggcc actatggccg ctactgcccg tgccaccgcc 540
gccgcctcag cctccaagat atccagtcag gaatcagccg catcggccgc taacgccgcc 600
aacgccgaag ccaaggccaa cgccgcttcc ataatcgcta acaaggcgaa cgccgtcctg 660
gctgaggccg ccgccgtact cgcagccact gctgccaagg ccaaggaatc ggcgatgaaa 720
tcgcttagcg ccgctcaggc cgccgccaag gcacaagcca ggaacgccga ggcctccgcc 780
gaagctcaga tcaaactttc ccaggccagg gccgccgtgg cacgcgctgc agccgatcag 840
gccgtctgtt cctcccaggc tcaggccgca agtcagatac aatcgagggc atccgcatcc 900
gaatccgcgg catcggcaca atcagagacc aacaccgccg cggccgaagc ggtcgccacc 960
gctgacgccg aagcggccgc gcaagctgaa gcgtgggtca tgtcgctgaa gaacgatctg 1020
tggctgcatc tcaacatgaa gggtgaggcc aaggccgaag gcgaggccgt ttcgatcagc 1080
aaaggacatc gcggcggtat caggtcgggc agcatctcgg aagccagcgc cgaggcaagc 1140
agcaacgttt ccatgggcgg acgtcatgga cggaaggacc tcgtctctga agcgttagcg 1200
ggagcatcag cgggcagcag tgccgactcc ctttga 1236
<210> 45
<211> 1128
<212> DNA
<213> Myrmecia forficata
<400> 45
aatctcctta aggagtcgaa agcttccgcg tccgcgtccg cgtccgcttc cgcgagggcc 60
agcggcaaga agaatcttca cgtgttgcca ttaccgaaga aaagcgagca tggcatcgtg 120
atcgacaagt cggtgttcga catcaaggat gtagtgctga gcgcggtcga cgagatcaac 180
ggcgccccga aactcggcct gggatggaag aaggtcagca tgggggtgga gcgcgccgag 240
gcgaacgcag ccgctgccgc cgaggcattg gcgatgatca agaagattgc catggcccgc 300
agcagtgcat acgtccaggc ggcctgggca tcggcccagg catcagctga cgcattggct 360
agcgccaggg tggcacaggc gtctcaggag gctgcggagg caaagggtag agcggcttcc 420
gaggcgctct ccagagccat cgaagcatcc tcgcgagccg atgcggcagc cgctgcgacg 480
ctggacgcga tggaccgcac catggagaac gcgagggcgg caaatgccgc gcaaacgcag 540
gccagcggcc aagctgagaa cgcaaatcgc agcgctgctg ccatcctcgc agctctgcta 600
cgtatcgcgg aggcatccgc gttgaacaac gaggccgcgg tcaacgcggc cgcggccgca 660
gccgcagcgt ctgcccttca ggccaaggct aacgcggctt ctcaagcaac cgccagagcc 720
gcaggacagg cgtcgacggc cgccgaagag gcgcaatccg cccaagaagc cgccgataag 780
aacgcggagc tgaccacggt catgctcgaa aaggctagtg ctgatcaaca ggcggcatcc 840
gctagggctg actactacac cgcctcaacc gaggccgaag ccgctgcaca ggcgtctgct 900
atcaacgcac tcagggacgg aatagttgtc ggaatgggaa atgacgctgg cgcatcggcc 960
caagcgatgg cacaggtaga agctctcgct cgcgccagcg agcacaaggc gttaggcgag 1020
aagaagaagg gcctggtttg gggctacgga agcaagggca gtagctccgc cagcgcatcc 1080
gccagcgcct ccgccgaagc atcctcgaga ctcggaaagg actggtag 1128
<210> 46
<211> 1185
<212> DNA
<213> Myrmecia forficata
<400> 46
atgaagatac cagcgatact cgtgacgtcc ttcctcgcct ggggactggc cagcgggaat 60
ctccttaagg agtcgaaagc ttccgcgtcc gcgtccgcgt ccgcttccgc gagggccagc 120
ggcaagaaga atcttcacgt gttgccatta ccgaagaaaa gcgagcatgg catcgtgatc 180
gacaagtcgg tgttcgacat caaggatgta gtgctgagcg cggtcgacga gatcaacggc 240
gccccgaaac tcggcctggg atggaagaag gtcagcatgg gggtggagcg cgccgaggcg 300
aacgcagccg ctgccgccga ggcattggcg atgatcaaga agattgccat ggcccgcagc 360
agtgcatacg tccaggcggc ctgggcatcg gcccaggcat cagctgacgc attggctagc 420
gccagggtgg cacaggcgtc tcaggaggct gcggaggcaa agggtagagc ggcttccgag 480
gcgctctcca gagccatcga agcatcctcg cgagccgatg cggcagccgc tgcgacgctg 540
gacgcgatgg accgcaccat ggagaacgcg agggcggcaa atgccgcgca aacgcaggcc 600
agcggccaag ctgagaacgc aaatcgcagc gctgctgcca tcctcgcagc tctgctacgt 660
atcgcggagg catccgcgtt gaacaacgag gccgcggtca acgcggccgc ggccgcagcc 720
gcagcgtctg cccttcaggc caaggctaac gcggcttctc aagcaaccgc cagagccgca 780
ggacaggcgt cgacggccgc cgaagaggcg caatccgccc aagaagccgc cgataagaac 840
gcggagctga ccacggtcat gctcgaaaag gctagtgctg atcaacaggc ggcatccgct 900
agggctgact actacaccgc ctcaaccgag gccgaagccg ctgcacaggc gtctgctatc 960
aacgcactca gggacggaat agttgtcgga atgggaaatg acgctggcgc atcggcccaa 1020
gcgatggcac aggtagaagc tctcgctcgc gccagcgagc acaaggcgtt aggcgagaag 1080
aagaagggcc tggtttgggg ctacggaagc aagggcagta gctccgccag cgcatccgcc 1140
agcgcctccg ccgaagcatc ctcgagactc ggaaaggact ggtag 1185
<210> 47
<211> 1269
<212> DNA
<213> Myrmecia forficata
<400> 47
agcgagctcg aatcggaagc gagtgcggcg gcgtctgcgc aagcggaagc gtcctcgtct 60
ggtcgctccg gcaaactgtc cgcgtctcag gcttccgcca gcgcgtccgc cagcgcgtca 120
gccggcagca gaggtggcag caaaggtggc tggggccagc tccgccgtgg tgatgttaag 180
agcgaggcga agagcgccgc cgcgatcgcg gtcgaaggag ctaaaatcgg caccggaatc 240
ggaaataccg cgtccgcatc cgcggaggcg ctctcacgag gactcggcat cggacaggcg 300
gccgcggagg cgcaagccgc agccgcaggt caggcagagg tcgccgcgaa atcgtgcgaa 360
cttgccgaca agaccaccgc caaagcggtc gccatggtcg aagcggcagc cgaggccgaa 420
atcgaggtgg ccaatcagga ggtcgcagcc gtcaaattat cgacttgggc cgctaaagca 480
gcaaggatag tcgaggaaga cagcgccgcc gtgagggcgg ctgccggcaa attgcttttg 540
gccgcgagag ctgccgccgc cgccgagaga cgcgccaacg aggaatccga ggcggccaac 600
gaacttgctc aagcgtcatc tgccgctgcc gccgaggccg aagccaaagc gaacgccggc 660
cgtgaggccg ctgccgctgc cttggctatc gccgaggccg ccgtcgccat cgaacaagaa 720
gccgtcattt tggctcgcaa ggcacaagat gcccgtttga atgctgaagc cgcagccgcc 780
gctgcgatga acgcccgtgt catcgcttcc gccgaatccg aggccagtga agatctggag 840
aatcgcgcta gtgtggcgcg tgccagtgcg gccggtgccg ctgaggcaaa ggctatcgcc 900
accgatgccg gcgccactgc cgagatcgcg gcctacagtt gggccaagaa gggcgaactg 960
atcaaccccg gcccgttgcc gaagatcatc agcgtcaacg ccgatctgtc caagagcgag 1020
gtcgaggcca tgaagatcac ccggggtcaa gtacaggaag tcaagaaaat cagcactcac 1080
aaaggtggct ggggatgggg aaaggaagga aggtcgaagg tatcttccaa cgctagtgcc 1140
agagctagtg ccagcgccaa tgcagccgcc ggtagcctcg gcagcaaatg gggaagacaa 1200
ctatccgcat catccgcgtc ggctgacgcc aacgccgaag ccgacagcca gttgctgaaa 1260
gtgtggtga 1269
<210> 48
<211> 1326
<212> DNA
<213> Myrmecia forficata
<400> 48
atgaagattc cagcgatact tgcgacgtcc ctcctcatct ggggtcttgt cggcgccagc 60
gagctcgaat cggaagcgag tgcggcggcg tctgcgcaag cggaagcgtc ctcgtctggt 120
cgctccggca aactgtccgc gtctcaggct tccgccagcg cgtccgccag cgcgtcagcc 180
ggcagcagag gtggcagcaa aggtggctgg ggccagctcc gccgtggtga tgttaagagc 240
gaggcgaaga gcgccgccgc gatcgcggtc gaaggagcta aaatcggcac cggaatcgga 300
aataccgcgt ccgcatccgc ggaggcgctc tcacgaggac tcggcatcgg acaggcggcc 360
gcggaggcgc aagccgcagc cgcaggtcag gcagaggtcg ccgcgaaatc gtgcgaactt 420
gccgacaaga ccaccgccaa agcggtcgcc atggtcgaag cggcagccga ggccgaaatc 480
gaggtggcca atcaggaggt cgcagccgtc aaattatcga cttgggccgc taaagcagca 540
aggatagtcg aggaagacag cgccgccgtg agggcggctg ccggcaaatt gcttttggcc 600
gcgagagctg ccgccgccgc cgagagacgc gccaacgagg aatccgaggc ggccaacgaa 660
cttgctcaag cgtcatctgc cgctgccgcc gaggccgaag ccaaagcgaa cgccggccgt 720
gaggccgctg ccgctgcctt ggctatcgcc gaggccgccg tcgccatcga acaagaagcc 780
gtcattttgg ctcgcaaggc acaagatgcc cgtttgaatg ctgaagccgc agccgccgct 840
gcgatgaacg cccgtgtcat cgcttccgcc gaatccgagg ccagtgaaga tctggagaat 900
cgcgctagtg tggcgcgtgc cagtgcggcc ggtgccgctg aggcaaaggc tatcgccacc 960
gatgccggcg ccactgccga gatcgcggcc tacagttggg ccaagaaggg cgaactgatc 1020
aaccccggcc cgttgccgaa gatcatcagc gtcaacgccg atctgtccaa gagcgaggtc 1080
gaggccatga agatcacccg gggtcaagta caggaagtca agaaaatcag cactcacaaa 1140
ggtggctggg gatggggaaa ggaaggaagg tcgaaggtat cttccaacgc tagtgccaga 1200
gctagtgcca gcgccaatgc agccgccggt agcctcggca gcaaatgggg aagacaacta 1260
tccgcatcat ccgcgtcggc tgacgccaac gccgaagccg acagccagtt gctgaaagtg 1320
tggtga 1326
<210> 49
<211> 372
<212> PRT
<213> Oecophylla smaragdina
<400> 49
Ser Lys Ser Tyr Leu Leu Gly Ser Ser Ala Ser Ala Ser Ala Ser Ala
1 5 10 15
Ser Ala Ser Ala Ser Ala Gly Gly Ser Thr Gly Gly Val Gly Val Gly
20 25 30
Ser Val Ile Ser Gly Gly Asn Asn Ile Ile Arg Gly Ala Ser Thr Thr
35 40 45
Ser Val Thr Leu Ala Ala Ala Ala Ala Glu Ala Lys Ala Ala Leu Asn
50 55 60
Ala Gly Lys Ala Thr Val Glu Glu Gln Arg Glu Ala Leu Gln Leu Leu
65 70 75 80
Thr Ala Ser Ala Glu Lys Asn Ala Glu Ala Arg Ser Leu Ala Asp Asp
85 90 95
Ala Ala Val Leu Val Gln Gly Ala Ala Glu Ala Gln Ser Val Ala Ala
100 105 110
Ala Lys Thr Val Ala Val Glu Gln Gly Ser Asn Ser Leu Asp Ala Ala
115 120 125
Ala Ala Glu Ala Glu Ala Ala Ala Ala Ala Ser Arg Val Ser Ala Gln
130 135 140
Gln Ala Leu Gln Ala Ala Gln Thr Ser Ala Ala Ala Ile Gln Thr Ala
145 150 155 160
Ala Gly Ser Ala Leu Thr Ala Leu Lys Leu Ala Arg Lys Gln Glu Ala
165 170 175
Glu Ser Asn Asn Ala Ala Glu Gln Ala Asn Lys Ala Leu Ala Leu Ser
180 185 190
Arg Ala Ala Ser Ala Ala Thr Gln Arg Ala Val Ala Ala Gln Asn Ala
195 200 205
Ala Ala Ala Ser Ala Ala Ser Ala Gly Ala Ala Gln Ala Glu Ala Arg
210 215 220
Asn Ala Tyr Ala Lys Ala Lys Ala Ala Ile Ala Ala Leu Thr Ala Ala
225 230 235 240
Gln Arg Asn Tyr Ala Ala Ala Lys Ala Ser Ala Ser Ala Gly Ser Val
245 250 255
Val Ala Glu Gln Asp Ala Gln Ser Arg Ala Ala Asp Ala Glu Val Asn
260 265 270
Ala Val Ala Gln Ala Ala Ala Arg Ala Ser Val Arg Asn Gln Glu Ile
275 280 285
Val Glu Ile Gly Ala Glu Phe Gly Asn Ala Ser Gly Gly Val Ile Ser
290 295 300
Thr Gly Thr Arg Ser Ser Gly Gly Lys Gly Val Ser Val Thr Ala Gly
305 310 315 320
Ala Gln Ala Ser Ala Ser Ala Ser Ala Thr Ser Ser Ser Ser Ser Ser
325 330 335
Ser Gly Ile Asn Lys Gly His Pro Arg Trp Gly His Asn Trp Gly Leu
340 345 350
Gly Ser Ser Glu Ala Ser Ala Asn Ala Glu Ala Glu Ser Ser Ala Ser
355 360 365
Ser Tyr Ser Ser
370
<210> 50
<211> 391
<212> PRT
<213> Oecophylla smaragdina
<400> 50
Met Lys Ile Pro Ala Ile Ile Ala Thr Thr Leu Leu Leu Trp Gly Phe
1 5 10 15
Ala Asp Ala Ser Lys Ser Tyr Leu Leu Gly Ser Ser Ala Ser Ala Ser
20 25 30
Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Gly Ser Thr Gly Gly Val
35 40 45
Gly Val Gly Ser Val Ile Ser Gly Gly Asn Asn Ile Ile Arg Gly Ala
50 55 60
Ser Thr Thr Ser Val Thr Leu Ala Ala Ala Ala Ala Glu Ala Lys Ala
65 70 75 80
Ala Leu Asn Ala Gly Lys Ala Thr Val Glu Glu Gln Arg Glu Ala Leu
85 90 95
Gln Leu Leu Thr Ala Ser Ala Glu Lys Asn Ala Glu Ala Arg Ser Leu
100 105 110
Ala Asp Asp Ala Ala Val Leu Val Gln Gly Ala Ala Glu Ala Gln Ser
115 120 125
Val Ala Ala Ala Lys Thr Val Ala Val Glu Gln Gly Ser Asn Ser Leu
130 135 140
Asp Ala Ala Ala Ala Glu Ala Glu Ala Ala Ala Ala Ala Ser Arg Val
145 150 155 160
Ser Ala Gln Gln Ala Leu Gln Ala Ala Gln Thr Ser Ala Ala Ala Ile
165 170 175
Gln Thr Ala Ala Gly Ser Ala Leu Thr Ala Leu Lys Leu Ala Arg Lys
180 185 190
Gln Glu Ala Glu Ser Asn Asn Ala Ala Glu Gln Ala Asn Lys Ala Leu
195 200 205
Ala Leu Ser Arg Ala Ala Ser Ala Ala Thr Gln Arg Ala Val Ala Ala
210 215 220
Gln Asn Ala Ala Ala Ala Ser Ala Ala Ser Ala Gly Ala Ala Gln Ala
225 230 235 240
Glu Ala Arg Asn Ala Tyr Ala Lys Ala Lys Ala Ala Ile Ala Ala Leu
245 250 255
Thr Ala Ala Gln Arg Asn Tyr Ala Ala Ala Lys Ala Ser Ala Ser Ala
260 265 270
Gly Ser Val Val Ala Glu Gln Asp Ala Gln Ser Arg Ala Ala Asp Ala
275 280 285
Glu Val Asn Ala Val Ala Gln Ala Ala Ala Arg Ala Ser Val Arg Asn
290 295 300
Gln Glu Ile Val Glu Ile Gly Ala Glu Phe Gly Asn Ala Ser Gly Gly
305 310 315 320
Val Ile Ser Thr Gly Thr Arg Ser Ser Gly Gly Lys Gly Val Ser Val
325 330 335
Thr Ala Gly Ala Gln Ala Ser Ala Ser Ala Ser Ala Thr Ser Ser Ser
340 345 350
Ser Ser Ser Ser Gly Ile Asn Lys Gly His Pro Arg Trp Gly His Asn
355 360 365
Trp Gly Leu Gly Ser Ser Glu Ala Ser Ala Asn Ala Glu Ala Glu Ser
370 375 380
Ser Ala Ser Ser Tyr Ser Ser
385 390
<210> 51
<211> 381
<212> PRT
<213> Oecophylla smaragdina
<400> 51
Gly Val Ile Gly Pro Asp Thr Ser Ser Ser Ser Gln Ala Ser Ala Ser
1 5 10 15
Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Ser Ala Ser Ile Gly
20 25 30
Tyr Asn Glu Leu His Lys Ser Ile Asn Ala Pro Ala Leu Ala Val Gly
35 40 45
Val Lys Asn Gly Gly Val Asp Val Ala Lys Gly Ala Ala Val Val Glu
50 55 60
Ser Ala Ile Ser Asp Val Ser Thr Leu Thr Asp Asp Arg Thr Leu Asn
65 70 75 80
Gly Leu Ala Ile Ile Gly Asn Ser Ala Glu Ser Leu Ala Arg Ala Gln
85 90 95
Ala Ser Ser Ser Ala Ser Ala Gly Ala Lys Ala Asn Ala Leu Ile Lys
100 105 110
Gln Ser Ile Ala Ala Ile Glu Ile Thr Glu Lys Ala Glu Tyr Leu Ala
115 120 125
Ser Ile Val Ala Thr Lys Ala Ala Lys Ala Ala Glu Ala Thr Ala Ala
130 135 140
Ala Thr Ala Arg Ala Thr Ala Val Ala Glu Ala Ala Lys Val Ser Ser
145 150 155 160
Glu Gln Phe Ala Ala Glu Ala Arg Ala Ala Ala Asp Ala Glu Ala Lys
165 170 175
Ala Asn Ala Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala Val Leu Ala
180 185 190
Glu Ala Ala Thr Gly Leu Ser Ala Ser Ala Gly Lys Ala Gln Gln Ser
195 200 205
Ala Thr Arg Ala Leu Gln Ala Ala Arg Ala Ala Ala Lys Ala Gln Ala
210 215 220
Glu Leu Thr Gln Lys Ala Ala Gln Ile Leu Val Leu Ile Ala Glu Ala
225 230 235 240
Lys Ala Ala Val Ser Arg Ala Ser Ala Asp Gln Ser Val Cys Thr Ser
245 250 255
Gln Ala Gln Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser Ala Ala Glu
260 265 270
Ser Ala Ala Ser Ala Gln Ser Glu Ala Asn Thr Ile Ala Ala Glu Ala
275 280 285
Val Ala Arg Ala Asp Ala Glu Ala Ala Ser Gln Ala Gln Ala Trp Ala
290 295 300
Glu Ser Phe Lys Arg Glu Leu Ser Ser Val Val Leu Glu Ala Glu Ala
305 310 315 320
Asn Ala Ser Ala Ser Ala Ser Ala Gly Ala Leu Ala Ser Gly Ser Ser
325 330 335
Ser Ser Gly Ala Ser Ser Ser Ala Asp Ala Ser Ala Gly Ala Ser Ser
340 345 350
Tyr Gly Ser Leu Gly Gly Tyr Arg His Gly Gly Ser Phe Ser Glu Ala
355 360 365
Ser Ala Ala Ala Ser Ala Ala Ser Arg Ala Glu Ala Ala
370 375 380
<210> 52
<211> 400
<212> PRT
<213> Oecophylla smaragdina
<400> 52
Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Ala Trp Gly Leu
1 5 10 15
Ala Ser Gly Gly Val Ile Gly Pro Asp Thr Ser Ser Ser Ser Gln Ala
20 25 30
Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Ser Ala
35 40 45
Ser Ile Gly Tyr Asn Glu Leu His Lys Ser Ile Asn Ala Pro Ala Leu
50 55 60
Ala Val Gly Val Lys Asn Gly Gly Val Asp Val Ala Lys Gly Ala Ala
65 70 75 80
Val Val Glu Ser Ala Ile Ser Asp Val Ser Thr Leu Thr Asp Asp Arg
85 90 95
Thr Leu Asn Gly Leu Ala Ile Ile Gly Asn Ser Ala Glu Ser Leu Ala
100 105 110
Arg Ala Gln Ala Ser Ser Ser Ala Ser Ala Gly Ala Lys Ala Asn Ala
115 120 125
Leu Ile Lys Gln Ser Ile Ala Ala Ile Glu Ile Thr Glu Lys Ala Glu
130 135 140
Tyr Leu Ala Ser Ile Val Ala Thr Lys Ala Ala Lys Ala Ala Glu Ala
145 150 155 160
Thr Ala Ala Ala Thr Ala Arg Ala Thr Ala Val Ala Glu Ala Ala Lys
165 170 175
Val Ser Ser Glu Gln Phe Ala Ala Glu Ala Arg Ala Ala Ala Asp Ala
180 185 190
Glu Ala Lys Ala Asn Ala Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala
195 200 205
Val Leu Ala Glu Ala Ala Thr Gly Leu Ser Ala Ser Ala Gly Lys Ala
210 215 220
Gln Gln Ser Ala Thr Arg Ala Leu Gln Ala Ala Arg Ala Ala Ala Lys
225 230 235 240
Ala Gln Ala Glu Leu Thr Gln Lys Ala Ala Gln Ile Leu Val Leu Ile
245 250 255
Ala Glu Ala Lys Ala Ala Val Ser Arg Ala Ser Ala Asp Gln Ser Val
260 265 270
Cys Thr Ser Gln Ala Gln Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser
275 280 285
Ala Ala Glu Ser Ala Ala Ser Ala Gln Ser Glu Ala Asn Thr Ile Ala
290 295 300
Ala Glu Ala Val Ala Arg Ala Asp Ala Glu Ala Ala Ser Gln Ala Gln
305 310 315 320
Ala Trp Ala Glu Ser Phe Lys Arg Glu Leu Ser Ser Val Val Leu Glu
325 330 335
Ala Glu Ala Asn Ala Ser Ala Ser Ala Ser Ala Gly Ala Leu Ala Ser
340 345 350
Gly Ser Ser Ser Ser Gly Ala Ser Ser Ser Ala Asp Ala Ser Ala Gly
355 360 365
Ala Ser Ser Tyr Gly Ser Leu Gly Gly Tyr Arg His Gly Gly Ser Phe
370 375 380
Ser Glu Ala Ser Ala Ala Ala Ser Ala Ala Ser Arg Ala Glu Ala Ala
385 390 395 400
<210> 53
<211> 376
<212> PRT
<213> Oecophylla smaragdina
<400> 53
Gly Val Pro Lys Glu Leu Gly Thr Ser Ile Ser Ser Ala Ser Ala Ser
1 5 10 15
Ala Ser Ala Ser Ala Ser Ala Thr Ala Ser Ser Ser Ser Lys Asn Val
20 25 30
His Leu Leu Pro Leu Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser
35 40 45
Lys Phe Asn Ile Arg Lys Val Val Leu Ser Ala Ile Asp Glu Ile Asn
50 55 60
Gly Ala Pro Asn Ile Gly Leu Gly Leu Lys Gln Val Ser Leu Ala Leu
65 70 75 80
Ala Lys Ala Gln Ala Ser Ala Gln Ser Ser Ala Glu Ala Leu Ala Ile
85 90 95
Ile Lys Lys Ile Val Ala Leu Leu Ile Ser Ala Tyr Val Arg Ala Ala
100 105 110
Glu Ala Ala Ala Arg Ala Ser Ala Glu Ala Leu Ala Thr Val Arg Ala
115 120 125
Ala Glu Gln Ala Gln Lys Ile Ala Glu Ala Lys Gly Arg Ala Ala Ala
130 135 140
Glu Ala Leu Ser Glu Leu Val Glu Ala Ser Gln Lys Ala Asp Ala Ala
145 150 155 160
Ala Ala Gly Thr Thr Asp Ala Ile Glu Arg Thr Tyr Gln Asp Ala Arg
165 170 175
Ala Ala Thr Ser Ala Gln Thr Lys Ala Ser Gly Glu Ala Glu Asn Ala
180 185 190
Asn Arg Asn Ala Ala Ala Thr Leu Ala Ala Val Leu Ser Ile Ala Lys
195 200 205
Ala Ala Ser Gly Gln Gly Gly Thr Arg Ala Ala Val Asp Ala Ala Ala
210 215 220
Ala Ala Ala Ala Ala Ala Ala Leu His Ala Lys Ala Asn Ala Val Ser
225 230 235 240
Gln Ala Thr Ser Lys Ala Ala Ala Glu Ala Arg Val Ala Ala Glu Glu
245 250 255
Ala Ala Ser Ala Gln Ala Ser Ala Ser Ala Ser Ala Gln Leu Thr Ala
260 265 270
Gln Leu Glu Glu Lys Val Ser Ala Asp Gln Gln Ala Ala Ser Ala Ser
275 280 285
Thr Asp Thr Ser Ala Ala Ile Ala Glu Ala Glu Ala Ala Ala Leu Ala
290 295 300
Ser Thr Val Asn Ala Ile Asn Asp Gly Val Val Ile Gly Leu Gly Asn
305 310 315 320
Thr Ala Ser Ser Ser Ala Gln Ala Ser Ala Gln Ala Ser Ala Leu Ala
325 330 335
Arg Ala Lys Asn Ala Arg Pro Lys Ile Lys Gly Trp Tyr Lys Ile Gly
340 345 350
Gly Ala Thr Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Gln
355 360 365
Ser Ser Ser Gln Gly Leu Val Tyr
370 375
<210> 54
<211> 395
<212> PRT
<213> Oecophylla smaragdina
<400> 54
Met Lys Ile Pro Ala Ile Leu Val Thr Ser Phe Leu Ala Trp Gly Leu
1 5 10 15
Ala Ser Gly Gly Val Pro Lys Glu Leu Gly Thr Ser Ile Ser Ser Ala
20 25 30
Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Thr Ala Ser Ser Ser Ser
35 40 45
Lys Asn Val His Leu Leu Pro Leu Lys Ser Glu His Gly Ile Val Ile
50 55 60
Asp Lys Ser Lys Phe Asn Ile Arg Lys Val Val Leu Ser Ala Ile Asp
65 70 75 80
Glu Ile Asn Gly Ala Pro Asn Ile Gly Leu Gly Leu Lys Gln Val Ser
85 90 95
Leu Ala Leu Ala Lys Ala Gln Ala Ser Ala Gln Ser Ser Ala Glu Ala
100 105 110
Leu Ala Ile Ile Lys Lys Ile Val Ala Leu Leu Ile Ser Ala Tyr Val
115 120 125
Arg Ala Ala Glu Ala Ala Ala Arg Ala Ser Ala Glu Ala Leu Ala Thr
130 135 140
Val Arg Ala Ala Glu Gln Ala Gln Lys Ile Ala Glu Ala Lys Gly Arg
145 150 155 160
Ala Ala Ala Glu Ala Leu Ser Glu Leu Val Glu Ala Ser Gln Lys Ala
165 170 175
Asp Ala Ala Ala Ala Gly Thr Thr Asp Ala Ile Glu Arg Thr Tyr Gln
180 185 190
Asp Ala Arg Ala Ala Thr Ser Ala Gln Thr Lys Ala Ser Gly Glu Ala
195 200 205
Glu Asn Ala Asn Arg Asn Ala Ala Ala Thr Leu Ala Ala Val Leu Ser
210 215 220
Ile Ala Lys Ala Ala Ser Gly Gln Gly Gly Thr Arg Ala Ala Val Asp
225 230 235 240
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Leu His Ala Lys Ala Asn
245 250 255
Ala Val Ser Gln Ala Thr Ser Lys Ala Ala Ala Glu Ala Arg Val Ala
260 265 270
Ala Glu Glu Ala Ala Ser Ala Gln Ala Ser Ala Ser Ala Ser Ala Gln
275 280 285
Leu Thr Ala Gln Leu Glu Glu Lys Val Ser Ala Asp Gln Gln Ala Ala
290 295 300
Ser Ala Ser Thr Asp Thr Ser Ala Ala Ile Ala Glu Ala Glu Ala Ala
305 310 315 320
Ala Leu Ala Ser Thr Val Asn Ala Ile Asn Asp Gly Val Val Ile Gly
325 330 335
Leu Gly Asn Thr Ala Ser Ser Ser Ala Gln Ala Ser Ala Gln Ala Ser
340 345 350
Ala Leu Ala Arg Ala Lys Asn Ala Arg Pro Lys Ile Lys Gly Trp Tyr
355 360 365
Lys Ile Gly Gly Ala Thr Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala
370 375 380
Ser Ala Gln Ser Ser Ser Gln Gly Leu Val Tyr
385 390 395
<210> 55
<211> 424
<212> PRT
<213> Oecophylla smaragdina
<400> 55
Ser Glu Leu Val Gly Ser Asp Ala Ser Ala Thr Ala Ser Ala Glu Ala
1 5 10 15
Ser Ala Ser Ser Ser Ala Tyr Gly Ser Lys Tyr Gly Ile Gly Ser Gly
20 25 30
Ala Val Ser Gly Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser
35 40 45
Ala Ser Ala Ser Ser Ala Pro Ala Ile Glu Gly Val Asn Val Gly Thr
50 55 60
Gly Val Ser Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg Gly
65 70 75 80
Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala Gly
85 90 95
Gln Ala Ala Ile Ala Ala Lys Ser Cys Ala Leu Ala Ala Lys Ser Thr
100 105 110
Ala Gln Ala Val Ala Leu Val Glu Lys Val Ala Arg Ala Glu Val Asp
115 120 125
Leu Ala Glu Ser Ala Arg Lys Ala Thr Arg Leu Ser Ala Glu Ala Ala
130 135 140
Lys Ala Ala Ala Glu Val Glu Lys Asp Leu Val Gly Leu Arg Gly Ala
145 150 155 160
Ala Gly Lys Leu Asn Leu Ala Ala Arg Ala Gly Ser Lys Ala Gln Glu
165 170 175
Arg Ala Asn Glu Asp Ser Ile Glu Ala Asn Glu Leu Ala Gln Ala Thr
180 185 190
Ala Ala Ala Gly Ala Glu Ala Glu Ala Lys Ala Asn Ala Ala Gln Glu
195 200 205
Ala Gly Ala Ser Ala Leu Ala Ile Ala Gln Ala Ala Leu Asn Ile Glu
210 215 220
Gln Glu Thr Val Lys Leu Thr Arg Gln Ala Gln Asn Thr Arg Leu Arg
225 230 235 240
Ser Glu Asn Ile Leu Ala Ala Ala Ser Asn Ala Arg Ala Ile Ala Ser
245 250 255
Ala Glu Ala Glu Ala Ser Ser Asp Leu Asn Asn Arg Ala Asn Ala Ala
260 265 270
Arg Ser Asn Ala Arg Ala Ala Ala Glu Thr Arg Ala Val Ala Thr Glu
275 280 285
Ala Ala Ser Thr Ala Glu Ile Ala Ala Tyr Ser Ser Ser Glu Lys Gly
290 295 300
Glu Ile Thr Asn Pro Gly Pro Leu Pro Lys Ile Val Ser Val Thr Ala
305 310 315 320
Gly Leu Thr Gln Asn Glu Ile Ala Gly Ser Gly Ala Ala Ala Ser Ala
325 330 335
Ser Ala Ser Ala Leu Ala Ser Ala Ser Ala Gly Ala Gly Ala Gly Ala
340 345 350
Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Ala Val Ala Gly Ala
355 360 365
Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Ser Ala Gly Ala
370 375 380
Asn Ala Gly Ala Gly Ala Ser Ser Leu Leu Leu Pro Gln Ser Lys Leu
385 390 395 400
His Pro Ile Ser Arg Ser Ser Ala Ser Ala Ser Ala Ser Ala Glu Ala
405 410 415
Glu Ala Asn Ser Ser Ala Tyr Ala
420
<210> 56
<211> 443
<212> PRT
<213> Oecophylla smaragdina
<400> 56
Met Lys Ile Pro Ala Ile Leu Ala Thr Ser Leu Phe Val Trp Gly Leu
1 5 10 15
Val Gly Ala Ser Glu Leu Val Gly Ser Asp Ala Ser Ala Thr Ala Ser
20 25 30
Ala Glu Ala Ser Ala Ser Ser Ser Ala Tyr Gly Ser Lys Tyr Gly Ile
35 40 45
Gly Ser Gly Ala Val Ser Gly Ala Ser Ala Ser Ala Ser Ala Ser Ala
50 55 60
Ser Ala Ser Ala Ser Ala Ser Ser Ala Pro Ala Ile Glu Gly Val Asn
65 70 75 80
Val Gly Thr Gly Val Ser Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu
85 90 95
Ser Arg Gly Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala
100 105 110
Ala Ala Gly Gln Ala Ala Ile Ala Ala Lys Ser Cys Ala Leu Ala Ala
115 120 125
Lys Ser Thr Ala Gln Ala Val Ala Leu Val Glu Lys Val Ala Arg Ala
130 135 140
Glu Val Asp Leu Ala Glu Ser Ala Arg Lys Ala Thr Arg Leu Ser Ala
145 150 155 160
Glu Ala Ala Lys Ala Ala Ala Glu Val Glu Lys Asp Leu Val Gly Leu
165 170 175
Arg Gly Ala Ala Gly Lys Leu Asn Leu Ala Ala Arg Ala Gly Ser Lys
180 185 190
Ala Gln Glu Arg Ala Asn Glu Asp Ser Ile Glu Ala Asn Glu Leu Ala
195 200 205
Gln Ala Thr Ala Ala Ala Gly Ala Glu Ala Glu Ala Lys Ala Asn Ala
210 215 220
Ala Gln Glu Ala Gly Ala Ser Ala Leu Ala Ile Ala Gln Ala Ala Leu
225 230 235 240
Asn Ile Glu Gln Glu Thr Val Lys Leu Thr Arg Gln Ala Gln Asn Thr
245 250 255
Arg Leu Arg Ser Glu Asn Ile Leu Ala Ala Ala Ser Asn Ala Arg Ala
260 265 270
Ile Ala Ser Ala Glu Ala Glu Ala Ser Ser Asp Leu Asn Asn Arg Ala
275 280 285
Asn Ala Ala Arg Ser Asn Ala Arg Ala Ala Ala Glu Thr Arg Ala Val
290 295 300
Ala Thr Glu Ala Ala Ser Thr Ala Glu Ile Ala Ala Tyr Ser Ser Ser
305 310 315 320
Glu Lys Gly Glu Ile Thr Asn Pro Gly Pro Leu Pro Lys Ile Val Ser
325 330 335
Val Thr Ala Gly Leu Thr Gln Asn Glu Ile Ala Gly Ser Gly Ala Ala
340 345 350
Ala Ser Ala Ser Ala Ser Ala Leu Ala Ser Ala Ser Ala Gly Ala Gly
355 360 365
Ala Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Ala Val
370 375 380
Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Ser
385 390 395 400
Ala Gly Ala Asn Ala Gly Ala Gly Ala Ser Ser Leu Leu Leu Pro Gln
405 410 415
Ser Lys Leu His Pro Ile Ser Arg Ser Ser Ala Ser Ala Ser Ala Ser
420 425 430
Ala Glu Ala Glu Ala Asn Ser Ser Ala Tyr Ala
435 440
<210> 57
<211> 1119
<212> DNA
<213> Oecophylla smaragdina
<400> 57
agcaagtcgt acctcttagg ctcatccgcg tctgcttccg cttccgcttc cgcctcggca 60
tcagcgggag gaagcaccgg cggcgtcggc gtcggatctg taatatccgg tggcaacaac 120
atcatcagag gagcttcgac cacatccgtg acattggcag ccgccgcagc ggaggccaag 180
gcagctctga atgctggaaa agcgactgtc gaagagcaaa gggaagcgtt acagttgctc 240
accgcgtccg ctgaaaaaaa cgccgaggcg cgttccttgg ccgacgatgc ggccgttcta 300
gttcagggtg ccgctgaggc gcaatcggtc gccgccgcga agacggtcgc ggtcgagcaa 360
ggatccaact ctctggatgc agctgcagcc gaagcggaag ccgccgccgc cgcatccagg 420
gtatcggccc agcaggcact ccaggccgcg cagacctccg ccgccgctat tcaaaccgct 480
gccggtagcg ccctgacggc tctcaaattg gcacgcaaac aggaagcgga atccaataat 540
gccgccgaac aggcaaataa agcattggcc ttaagtcgcg cagccagcgc tgccactcaa 600
cgagccgtgg cagctcagaa cgcggctgcc gcatcagcgg cttcggctgg agccgcacaa 660
gctgaggcaa ggaacgccta cgccaaagcc aaagcagcga tagctgctct tacggccgcc 720
caaagaaatt acgccgcggc caaggctagc gcaagcgcgg gtagcgtggt ggccgaacaa 780
gatgctcaat ctagagcggc cgatgccgag gtgaacgccg ttgcccaagc cgctgcccga 840
gccagcgttc gcaatcagga gatcgttgaa atcggcgcgg aattcggcaa cgccagcggc 900
ggagtgatct cgaccggcac acgttcttcc ggaggcaagg gtgtctccgt taccgctgga 960
gctcaggcta gcgcgtccgc ttccgcgacc tcctcctcct cctcctcctc cggcatcaac 1020
aaaggacatc ccagatgggg gcacaattgg ggtttaggtt cttcggaagc gtcagcaaac 1080
gctgaagccg aaagcagcgc ttcctcttat tcatcttaa 1119
<210> 58
<211> 1176
<212> DNA
<213> Oecophylla smaragdina
<400> 58
atgaagatcc cagcgataat cgcaacgacc ctccttctct ggggtttcgc cgacgccagc 60
aagtcgtacc tcttaggctc atccgcgtct gcttccgctt ccgcttccgc ctcggcatca 120
gcgggaggaa gcaccggcgg cgtcggcgtc ggatctgtaa tatccggtgg caacaacatc 180
atcagaggag cttcgaccac atccgtgaca ttggcagccg ccgcagcgga ggccaaggca 240
gctctgaatg ctggaaaagc gactgtcgaa gagcaaaggg aagcgttaca gttgctcacc 300
gcgtccgctg aaaaaaacgc cgaggcgcgt tccttggccg acgatgcggc cgttctagtt 360
cagggtgccg ctgaggcgca atcggtcgcc gccgcgaaga cggtcgcggt cgagcaagga 420
tccaactctc tggatgcagc tgcagccgaa gcggaagccg ccgccgccgc atccagggta 480
tcggcccagc aggcactcca ggccgcgcag acctccgccg ccgctattca aaccgctgcc 540
ggtagcgccc tgacggctct caaattggca cgcaaacagg aagcggaatc caataatgcc 600
gccgaacagg caaataaagc attggcctta agtcgcgcag ccagcgctgc cactcaacga 660
gccgtggcag ctcagaacgc ggctgccgca tcagcggctt cggctggagc cgcacaagct 720
gaggcaagga acgcctacgc caaagccaaa gcagcgatag ctgctcttac ggccgcccaa 780
agaaattacg ccgcggccaa ggctagcgca agcgcgggta gcgtggtggc cgaacaagat 840
gctcaatcta gagcggccga tgccgaggtg aacgccgttg cccaagccgc tgcccgagcc 900
agcgttcgca atcaggagat cgttgaaatc ggcgcggaat tcggcaacgc cagcggcgga 960
gtgatctcga ccggcacacg ttcttccgga ggcaagggtg tctccgttac cgctggagct 1020
caggctagcg cgtccgcttc cgcgacctcc tcctcctcct cctcctccgg catcaacaaa 1080
ggacatccca gatgggggca caattggggt ttaggttctt cggaagcgtc agcaaacgct 1140
gaagccgaaa gcagcgcttc ctcttattca tcttaa 1176
<210> 59
<211> 1146
<212> DNA
<213> Oecophylla smaragdina
<400> 59
ggagtcatag gtcccgacac gtcctcatcg tcccaggcat cggcatcggc atcggcgtca 60
gcatcggcgt cggcatcatc gtcggcatcg atcggttaca acgaactcca taaatcgatc 120
aatgcgcccg ccttggcggt cggcgtcaag aacggcggag tggatgtcgc caagggcgcg 180
gccgttgtcg aatcagcgat atccgacgta tcgactctaa ccgatgatcg tacgttgaac 240
ggtctcgcta tcatcgggaa tagcgccgag agtctggcaa gagcacaggc ttcctcgagc 300
gccagcgccg gcgcaaaagc caatgctctc atcaaacaat cgatagcggc tatagagatc 360
accgaaaagg cagagtacct tgcgtcgatc gtcgccacca aggcagcgaa ggccgccgag 420
gccacagcgg ccgcgaccgc tcgcgccact gccgtcgccg aggctgccaa ggtttccagc 480
gagcaattcg cggccgaggc acgcgcggcc gccgacgccg aagccaaggc caacgccgct 540
tccatcatcg ccaacaaagc gaacgccgtc ctcgcggagg cagccaccgg acttagcgcc 600
agcgctggca aagcccaaca atcggcgacc agggcgttgc aagccgcacg agctgccgct 660
aaggctcaag ccgaacttac ccagaaagcc gctcaaatct tagtcctcat tgctgaagcc 720
aaagccgccg tgagccgagc aagcgccgat caatccgtct gtacgtccca ggcacaagcc 780
gccagtcaga ttcaatcgag agcctccgcg gccgaatccg cggcatcggc tcaatcggaa 840
gccaacacca ttgcggccga ggcggtcgct agagctgacg ccgaggcggc cagtcaagct 900
caagcgtggg ccgaatcctt caaacgcgaa ctctcgagtg tcgttttgga ggccgaggcc 960
aatgcctcgg ctagtgcctc ggctggtgcc ctggccagtg gtagcagcag ctcgggcgcg 1020
agttccagcg cggatgccag cgccggagcg agcagctatg gatccttggg cggatatcga 1080
cacggcggaa gcttcagcga ggcatcggca gccgcgtcag cggccagtcg cgccgaggct 1140
gcgtaa 1146
<210> 60
<211> 1203
<212> DNA
<213> Oecophylla smaragdina
<400> 60
atgaagattc cagcgatatt cgtgacgtct ctgctcgcct ggggactcgc cagcggcgga 60
gtcataggtc ccgacacgtc ctcatcgtcc caggcatcgg catcggcatc ggcgtcagca 120
tcggcgtcgg catcatcgtc ggcatcgatc ggttacaacg aactccataa atcgatcaat 180
gcgcccgcct tggcggtcgg cgtcaagaac ggcggagtgg atgtcgccaa gggcgcggcc 240
gttgtcgaat cagcgatatc cgacgtatcg actctaaccg atgatcgtac gttgaacggt 300
ctcgctatca tcgggaatag cgccgagagt ctggcaagag cacaggcttc ctcgagcgcc 360
agcgccggcg caaaagccaa tgctctcatc aaacaatcga tagcggctat agagatcacc 420
gaaaaggcag agtaccttgc gtcgatcgtc gccaccaagg cagcgaaggc cgccgaggcc 480
acagcggccg cgaccgctcg cgccactgcc gtcgccgagg ctgccaaggt ttccagcgag 540
caattcgcgg ccgaggcacg cgcggccgcc gacgccgaag ccaaggccaa cgccgcttcc 600
atcatcgcca acaaagcgaa cgccgtcctc gcggaggcag ccaccggact tagcgccagc 660
gctggcaaag cccaacaatc ggcgaccagg gcgttgcaag ccgcacgagc tgccgctaag 720
gctcaagccg aacttaccca gaaagccgct caaatcttag tcctcattgc tgaagccaaa 780
gccgccgtga gccgagcaag cgccgatcaa tccgtctgta cgtcccaggc acaagccgcc 840
agtcagattc aatcgagagc ctccgcggcc gaatccgcgg catcggctca atcggaagcc 900
aacaccattg cggccgaggc ggtcgctaga gctgacgccg aggcggccag tcaagctcaa 960
gcgtgggccg aatccttcaa acgcgaactc tcgagtgtcg ttttggaggc cgaggccaat 1020
gcctcggcta gtgcctcggc tggtgccctg gccagtggta gcagcagctc gggcgcgagt 1080
tccagcgcgg atgccagcgc cggagcgagc agctatggat ccttgggcgg atatcgacac 1140
ggcggaagct tcagcgaggc atcggcagcc gcgtcagcgg ccagtcgcgc cgaggctgcg 1200
taa 1203
<210> 61
<211> 1131
<212> DNA
<213> Oecophylla smargdina
<400> 61
ggtgtcccta aagagttggg aacttccatt tcttccgcgt ccgcatccgc atccgcatcc 60
gcatccgcga ccgcgtcctc cagtagcaag aatgttcact tattaccatt gaaaagcgag 120
catggcatcg taattgacaa gtcaaaattc aacatcagaa aggtagtgtt gagcgcaatc 180
gatgagatca acggcgcgcc caacatcggt ctgggattga aacaggtcag tttggcgctc 240
gcaaaagccc aggctagtgc tcaatcgagc gccgaggcat tggcaatcat caagaaaatc 300
gtcgcgctcc tcatctcggc ctacgtcaga gcagccgagg ccgcggctcg agcatccgcc 360
gaagctttag ctaccgttag ggctgcggaa caagcgcaaa aaattgctga agcgaagggt 420
agagcggctg ctgaggcgct ctccgagtta gtcgaggcgt cccagaaggc cgatgcggcg 480
gccgcgggaa cgacggacgc gatcgaacgc acctaccagg atgccagagc ggccacttcc 540
gcacagacca aggccagcgg cgaagccgag aatgctaatc gcaatgctgc cgccaccctc 600
gcggcggtct tgagcatcgc taaggccgcc tccggtcaag gaggcactcg agccgctgtc 660
gatgcagctg ctgccgctgc cgccgcagcc gctctgcatg ctaaagctaa cgcggtttcg 720
caagctacca gcaaagcagc cgctgaagct agagtcgcgg ctgaggaggc agcatccgcc 780
caggcatccg cctcagcaag cgcacagctg accgcacaat tagaggagaa agtcagcgcc 840
gatcaacaag cagcctccgc cagtactgat acctccgctg ctatagccga ggctgaagct 900
gccgcgttag cgtccaccgt caacgcgatc aacgacggag tggtcatcgg attaggaaat 960
accgccagtt cttctgccca agcttccgca caggccagtg ctctcgctcg cgcaaaaaat 1020
gcgcgcccta aaataaaggg ctggtacaaa atcggaggcg cgacttccgc ttctgcaagc 1080
gcatcggcca gcgcttccgc ccagtcatcc tcgcaaggac tggtatacta g 1131
<210> 62
<211> 1188
<212> DNA
<213> Oecophylla smaragdina
<400> 62
atgaagattc cagcgatact cgtgacgtcc ttcctcgcct ggggactggc cagcgggggt 60
gtccctaaag agttgggaac ttccatttct tccgcgtccg catccgcatc cgcatccgca 120
tccgcgaccg cgtcctccag tagcaagaat gttcacttat taccattgaa aagcgagcat 180
ggcatcgtaa ttgacaagtc aaaattcaac atcagaaagg tagtgttgag cgcaatcgat 240
gagatcaacg gcgcgcccaa catcggtctg ggattgaaac aggtcagttt ggcgctcgca 300
aaagcccagg ctagtgctca atcgagcgcc gaggcattgg caatcatcaa gaaaatcgtc 360
gcgctcctca tctcggccta cgtcagagca gccgaggccg cggctcgagc atccgccgaa 420
gctttagcta ccgttagggc tgcggaacaa gcgcaaaaaa ttgctgaagc gaagggtaga 480
gcggctgctg aggcgctctc cgagttagtc gaggcgtccc agaaggccga tgcggcggcc 540
gcgggaacga cggacgcgat cgaacgcacc taccaggatg ccagagcggc cacttccgca 600
cagaccaagg ccagcggcga agccgagaat gctaatcgca atgctgccgc caccctcgcg 660
gcggtcttga gcatcgctaa ggccgcctcc ggtcaaggag gcactcgagc cgctgtcgat 720
gcagctgctg ccgctgccgc cgcagccgct ctgcatgcta aagctaacgc ggtttcgcaa 780
gctaccagca aagcagccgc tgaagctaga gtcgcggctg aggaggcagc atccgcccag 840
gcatccgcct cagcaagcgc acagctgacc gcacaattag aggagaaagt cagcgccgat 900
caacaagcag cctccgccag tactgatacc tccgctgcta tagccgaggc tgaagctgcc 960
gcgttagcgt ccaccgtcaa cgcgatcaac gacggagtgg tcatcggatt aggaaatacc 1020
gccagttctt ctgcccaagc ttccgcacag gccagtgctc tcgctcgcgc aaaaaatgcg 1080
cgccctaaaa taaagggctg gtacaaaatc ggaggcgcga cttccgcttc tgcaagcgca 1140
tcggccagcg cttccgccca gtcatcctcg caaggactgg tatactag 1188
<210> 63
<211> 1275
<212> DNA
<213> Oecophylla smaragdina
<400> 63
agcgaactcg tcggatcgga cgcgagcgcg acggcatctg ctgaagcgtc agcatcgtca 60
tccgcatacg gtagcaagta tggtattggt agtggtgctg tctccggtgc atcagccagc 120
gcctctgcca gcgcgtctgc tagcgcatca gccagcagtg ctcccgcgat cgaaggagta 180
aacgttggca ccggagtcag taacaccgct tccgcgtccg cagaagctct ctcccgtgga 240
ctcggcatcg gacaagcggc tgccgaagcg caagccgctg ccgctggcca agcggcgatc 300
gctgcgaaat cgtgcgcgct agcggccaag agcaccgctc aagcggttgc cctggttgag 360
aaagtggccc gcgccgaggt agatctggcc gaaagcgcga gaaaggctac aagattatcg 420
gcagaagcag ccaaggcagc ggcggaagtc gagaaggacc tcgtcggtct gagaggggct 480
gccggtaaac tgaatctggc tgcgagagcc ggttctaaag cccaagaacg cgccaacgaa 540
gactctatag aggctaacga acttgcccaa gcaacggccg ccgccggtgc cgaggctgaa 600
gccaaggcga atgccgccca ggaggcaggc gcctccgctt tggccatcgc ccaagccgcc 660
cttaacatcg agcaagagac tgttaaattg acccgccagg cccagaatac tcgtctcaga 720
tctgaaaata ttctcgccgc ggccagcaat gcccgcgcca tcgcttccgc tgaggccgag 780
gccagtagtg atttgaataa tcgtgcgaat gcagcgcgtt ccaatgcccg agctgctgcc 840
gagaccagag ccgtagctac cgaagccgct tctaccgccg agatcgcagc ttatagttca 900
tccgagaaag gcgagatcac caatcccggt cctctgccca agatcgtcag tgttaccgca 960
ggtctgaccc agaacgaaat agcgggatca ggagcggccg ctagtgctag tgccagtgct 1020
cttgccagtg ccagtgccgg tgccggtgcc ggtgcaggtg caggagccgg tgcaagtgca 1080
ggagccggtg cagttgcagg tgcaggagcc ggtgcaggag ccggtgctag tgccggagcg 1140
agtgccggag cgaatgccgg tgccggtgcc agcagtttac tcttgccgca gagtaaactc 1200
catccaatct ccaggtcttc cgcctctgcc tccgcttccg ccgaggccga agctaacagt 1260
tcggcgtatg cgtaa 1275
<210> 64
<211> 1332
<212> DNA
<213> Oecophylla smaragdina
<400> 64
atgaagattc cagcgatact tgcgacgtcc cttttcgtct ggggtcttgt cggcgccagc 60
gaactcgtcg gatcggacgc gagcgcgacg gcatctgctg aagcgtcagc atcgtcatcc 120
gcatacggta gcaagtatgg tattggtagt ggtgctgtct ccggtgcatc agccagcgcc 180
tctgccagcg cgtctgctag cgcatcagcc agcagtgctc ccgcgatcga aggagtaaac 240
gttggcaccg gagtcagtaa caccgcttcc gcgtccgcag aagctctctc ccgtggactc 300
ggcatcggac aagcggctgc cgaagcgcaa gccgctgccg ctggccaagc ggcgatcgct 360
gcgaaatcgt gcgcgctagc ggccaagagc accgctcaag cggttgccct ggttgagaaa 420
gtggcccgcg ccgaggtaga tctggccgaa agcgcgagaa aggctacaag attatcggca 480
gaagcagcca aggcagcggc ggaagtcgag aaggacctcg tcggtctgag aggggctgcc 540
ggtaaactga atctggctgc gagagccggt tctaaagccc aagaacgcgc caacgaagac 600
tctatagagg ctaacgaact tgcccaagca acggccgccg ccggtgccga ggctgaagcc 660
aaggcgaatg ccgcccagga ggcaggcgcc tccgctttgg ccatcgccca agccgccctt 720
aacatcgagc aagagactgt taaattgacc cgccaggccc agaatactcg tctcagatct 780
gaaaatattc tcgccgcggc cagcaatgcc cgcgccatcg cttccgctga ggccgaggcc 840
agtagtgatt tgaataatcg tgcgaatgca gcgcgttcca atgcccgagc tgctgccgag 900
accagagccg tagctaccga agccgcttct accgccgaga tcgcagctta tagttcatcc 960
gagaaaggcg agatcaccaa tcccggtcct ctgcccaaga tcgtcagtgt taccgcaggt 1020
ctgacccaga acgaaatagc gggatcagga gcggccgcta gtgctagtgc cagtgctctt 1080
gccagtgcca gtgccggtgc cggtgccggt gcaggtgcag gagccggtgc aagtgcagga 1140
gccggtgcag ttgcaggtgc aggagccggt gcaggagccg gtgctagtgc cggagcgagt 1200
gccggagcga atgccggtgc cggtgccagc agtttactct tgccgcagag taaactccat 1260
ccaatctcca ggtcttccgc ctctgcctcc gcttccgccg aggccgaagc taacagttcg 1320
gcgtatgcgt aa 1332
<210> 65
<211> 461
<212> PRT
<213> Vespa simillima xanthoptera
<400> 65
Phe Ala Thr Ala Ala Glu Ser Ser Ser Ser Ser Ser Ala Ala Ser Ser
1 5 10 15
Ala Ser Ser Ser Ser Ser Glu Ser Arg Gly Gln Leu Leu Leu Pro Leu
20 25 30
Glu Arg Ser Ser Thr Arg Ser Leu Leu Asp Leu Val Ser Ser Ala Arg
35 40 45
Ser Asn Thr Ala Ile Thr Ala Ser Ser Ala Ala Ala Ala Lys Ala Thr
50 55 60
Leu Arg Ala Ile Lys Ala Ala Asn Ser Ala Gln Gly Glu Ala Leu Ala
65 70 75 80
Gln Ala Thr Ala Ser Ala Ala Ser Asn Ala Lys Ala Arg Ala Thr Ala
85 90 95
Ala Ala Ala Ala Gln Ala Thr Asn Ala Ala Val Asn Ala Gln Gly Lys
100 105 110
Ala Ser Ala Gln Ala Ile Ala Thr Ala Glu Ala Ala Glu Ala Leu Thr
115 120 125
Lys Ser Ala Leu Gln Ala Gln Ser Ala Ala Ser Ser Ser Lys Ser Glu
130 135 140
Ala Ala Gln Ala Ser Thr Ser Ala Asn Ala Gly Ala Gly Ala Leu Ala
145 150 155 160
Thr Ala Ser Ala Gln Ala Leu Ser Ala Lys Lys Ala Ala Leu Ala Tyr
165 170 175
Ala Ser Ala Ala Ala Asp Ala Ser Thr Ala Ala Ala Lys Ala Arg Ala
180 185 190
Ala Val Ala Ala Ala Glu Ala Ala Thr Arg Thr Ala Val Gln Ala Glu
195 200 205
Arg Asp Ser Thr Asn Ala Ala Ser Leu Ala Ala Lys Ala Gln Ala Glu
210 215 220
Ala Arg Ala Ala Ala Ala Ala Ala Ala Ala Ala Arg Leu Ala Ala Ser
225 230 235 240
Ala Ala Ala Asp Ala Ser Ala Gln Ala Asp Ala Arg Val Arg Thr Ala
245 250 255
Ser Ile Glu Ala Ala Ala Ser Ala Arg Thr Lys Ala Ser Asn Ala Gln
260 265 270
Ala Thr Ala Glu Ala Ala Ala Ile Ala Arg Ser Ser Ser Arg Asp Ala
275 280 285
Gln Ala Asn Trp Val Asp Asn Arg Ser Ser Ala Ser Ser Ser Ser Ala
290 295 300
Ser Ala Ser Ala Ser Val Ser Ala Ser Ala Ser Gly Glu Ala Asp Ser
305 310 315 320
Glu Ala Asp Ser Asp Ala Ser Ala Ser Ala Arg Ser Ala Ala Asp Ser
325 330 335
Asn Ala Gly Ser Ser Ser Gly Leu Ala Ala Asp Ser Ala Ala Asp Thr
340 345 350
Ala Ala Gly Ser Thr Ala Gly Ser Ala Ala Arg Leu Ser Ala Gly Ser
355 360 365
Ala Ala Gly Ser Ile Ala Arg Ser Ala Ala Gly Ser Thr Ala Gly Ser
370 375 380
Ser Thr Gly Ser Gly Ala Gly Ala Ser Ala Glu Gly Ser Ser Asn Ala
385 390 395 400
Ser Ser Gly Thr Ser Ala Gly Ala Ser Ser Gly Ala Ser Thr Gly Ala
405 410 415
Ser Ala Gly Ala Ser Ala Thr Ala Ser Ala Asp Asn Ser Ala Asp Asn
420 425 430
Ser Ala Glu Ala Leu Ser Ser Ser Ser Ala Glu Ser Ser Ser Ser Ser
435 440 445
Trp Ser Ser Ser Ser Gln Asn Ile Trp Ser Gln Asp Trp
450 455 460
<210> 66
<211> 476
<212> PRT
<213> Vespa simillima xanthoptera
<400> 66
Met Asn Ile Leu Thr Ile Leu Ala Thr Thr Leu Leu Leu Ser Gly Phe
1 5 10 15
Ala Thr Ala Ala Glu Ser Ser Ser Ser Ser Ser Ala Ala Ser Ser Ala
20 25 30
Ser Ser Ser Ser Ser Glu Ser Arg Gly Gln Leu Leu Leu Pro Leu Glu
35 40 45
Arg Ser Ser Thr Arg Ser Leu Leu Asp Leu Val Ser Ser Ala Arg Ser
50 55 60
Asn Thr Ala Ile Thr Ala Ser Ser Ala Ala Ala Ala Lys Ala Thr Leu
65 70 75 80
Arg Ala Ile Lys Ala Ala Asn Ser Ala Gln Gly Glu Ala Leu Ala Gln
85 90 95
Ala Thr Ala Ser Ala Ala Ser Asn Ala Lys Ala Arg Ala Thr Ala Ala
100 105 110
Ala Ala Ala Gln Ala Thr Asn Ala Ala Val Asn Ala Gln Gly Lys Ala
115 120 125
Ser Ala Gln Ala Ile Ala Thr Ala Glu Ala Ala Glu Ala Leu Thr Lys
130 135 140
Ser Ala Leu Gln Ala Gln Ser Ala Ala Ser Ser Ser Lys Ser Glu Ala
145 150 155 160
Ala Gln Ala Ser Thr Ser Ala Asn Ala Gly Ala Gly Ala Leu Ala Thr
165 170 175
Ala Ser Ala Gln Ala Leu Ser Ala Lys Lys Ala Ala Leu Ala Tyr Ala
180 185 190
Ser Ala Ala Ala Asp Ala Ser Thr Ala Ala Ala Lys Ala Arg Ala Ala
195 200 205
Val Ala Ala Ala Glu Ala Ala Thr Arg Thr Ala Val Gln Ala Glu Arg
210 215 220
Asp Ser Thr Asn Ala Ala Ser Leu Ala Ala Lys Ala Gln Ala Glu Ala
225 230 235 240
Arg Ala Ala Ala Ala Ala Ala Ala Ala Ala Arg Leu Ala Ala Ser Ala
245 250 255
Ala Ala Asp Ala Ser Ala Gln Ala Asp Ala Arg Val Arg Thr Ala Ser
260 265 270
Ile Glu Ala Ala Ala Ser Ala Arg Thr Lys Ala Ser Asn Ala Gln Ala
275 280 285
Thr Ala Glu Ala Ala Ala Ile Ala Arg Ser Ser Ser Arg Asp Ala Gln
290 295 300
Ala Asn Trp Val Asp Asn Arg Ser Ser Ala Ser Ser Ser Ser Ala Ser
305 310 315 320
Ala Ser Ala Ser Val Ser Ala Ser Ala Ser Gly Glu Ala Asp Ser Glu
325 330 335
Ala Asp Ser Asp Ala Ser Ala Ser Ala Arg Ser Ala Ala Asp Ser Asn
340 345 350
Ala Gly Ser Ser Ser Gly Leu Ala Ala Asp Ser Ala Ala Asp Thr Ala
355 360 365
Ala Gly Ser Thr Ala Gly Ser Ala Ala Arg Leu Ser Ala Gly Ser Ala
370 375 380
Ala Gly Ser Ile Ala Arg Ser Ala Ala Gly Ser Thr Ala Gly Ser Ser
385 390 395 400
Thr Gly Ser Gly Ala Gly Ala Ser Ala Glu Gly Ser Ser Asn Ala Ser
405 410 415
Ser Gly Thr Ser Ala Gly Ala Ser Ser Gly Ala Ser Thr Gly Ala Ser
420 425 430
Ala Gly Ala Ser Ala Thr Ala Ser Ala Asp Asn Ser Ala Asp Asn Ser
435 440 445
Ala Glu Ala Leu Ser Ser Ser Ser Ala Glu Ser Ser Ser Ser Ser Trp
450 455 460
Ser Ser Ser Ser Gln Asn Ile Trp Ser Gln Asp Trp
465 470 475
<210> 67
<211> 486
<212> PRT
<213> Vespa simillima xanthoptera
<400> 67
Asp Arg Ser Trp Ala Ala Ser Asp Ala Asn Ala Glu Ala Ser Ala Ala
1 5 10 15
Val Glu Ser Pro Ser Leu Trp Glu Asp Ser Ser Ser Ala Ser Ala Gly
20 25 30
Ala Ser Asn Ala Ala Glu Ser Ser Ser Leu Trp Glu Asp Ser Ser Ser
35 40 45
Glu Asn Thr Gly Ala Ser Thr Ala Ala Glu Ser Ser Ser Leu Trp Glu
50 55 60
Asp Ser Ser Ser Ala Ser Ala Arg Ala Ser Thr Ala Ala Gly Ser Ser
65 70 75 80
Ser Ala Trp Glu Asp Ser Ser Ile Thr Asn Ala Arg Glu Ser Gly Ala
85 90 95
Ser Gly Ser Leu Ser Ser Trp Glu Asp Ser Ser Ser Ala Ser Ala Ser
100 105 110
Ser Ser Thr Ser Ala Ser Ala Ser Ser Ser Ser Ser Ser Ser Ser Ser
115 120 125
Ile Ser Ser Ser Ala Ser Ser Ser Ser Ser Ala Ser Ala Ser Ala Ser
130 135 140
Thr Glu Ala Ser Asn Glu Ser Arg Arg Gly Ile Ala Ile Glu Gly Ala
145 150 155 160
Leu Val Gly Thr Gly Ala Ala Ser Thr Ala Ala Ala Ser Ala Glu Met
165 170 175
Leu Ser Asp Thr Leu Gly Leu Gly Gln Ser Ala Leu Gln Ala Gln Thr
180 185 190
Ala Ser Val Thr Gln Ala Asn Ile Ala Ser Asp Ala Ser Asn Gln Ala
195 200 205
Asn Arg Leu Ala Ala Ala Ala Ala Ala Ala Met Ser Ala Ala Ala Ser
210 215 220
Ala Gln Glu Asn Ala Ala Ser Leu Ala Arg Ala Ser Ala Ser Ala Ser
225 230 235 240
Glu Ser Ala Ala Ser Ala Ser Ser Lys Ala Glu Ala Ser Ala Glu Ala
245 250 255
Ala Lys Ser Ser Ala Glu Lys Cys Leu Leu Leu Ala Gln Asn Ser Ala
260 265 270
Gln Ala Gln Ala Arg Ala Thr Glu Gln Ser Glu Ser Ser Asn Arg Asp
275 280 285
Ser Ala Ala Asn Ala Ala Ala Ala Ala Glu Ala Glu Arg Lys Ala Thr
290 295 300
Leu Ala Leu Lys Ala Ile Ala Asp Ala Lys Ala Lys Ala Gly Val Ala
305 310 315 320
Val Ala Ala Gln Ser Glu Ala Ala Ala Ala Ala Ala Ala Ala Ala Lys
325 330 335
Ala Arg Ala Asp Ala Glu Ala Gly Ala Asn Leu Ala Ala Ala Ala Arg
340 345 350
Ala Val Ala Ala Ala Glu Ala Ala Ala Ser Arg Arg Asn Asp Arg Gln
355 360 365
Ala Gly Ile Ala Gln Ala Gly Ala Ser Ala Ala Ala Glu Thr Arg Ala
370 375 380
Leu Ala Ser Ser Ala Ala Ala Thr Ala Lys Ala Ala Ala Tyr Ala Asn
385 390 395 400
Ala Asp Ile Arg Ala Leu Ser Ala Ala Ala Leu Glu Ser Ser Ile Ser
405 410 415
Ser Ser Ser Ser Thr Ser Ala Ser Ser Ala Ser Ser Ser Ala Ser Ser
420 425 430
Gly Ala Ser Ser Asp Ser Ser Ser Gly Ala Ser Ser Gly Ala Ser Ser
435 440 445
Asp Ser Ser Ser Asn Ser Ser Ser Asp Ser Ser Ser Leu Leu Gly Asp
450 455 460
Asp Ala Ser Thr Ser Ala Ser Ser Thr Ala Glu Ala Glu Ser Arg Thr
465 470 475 480
Ser Ser Leu Ile Leu Asn
485
<210> 68
<211> 508
<212> PRT
<213> Vespa simillima xanthoptera
<400> 68
Met Lys Ser Leu Ser Thr Leu Val Ser Ser Leu Leu Leu Gly Ala Cys
1 5 10 15
Val Leu Ser Val His Ala Asp Arg Ser Trp Ala Ala Ser Asp Ala Asn
20 25 30
Ala Glu Ala Ser Ala Ala Val Glu Ser Pro Ser Leu Trp Glu Asp Ser
35 40 45
Ser Ser Ala Ser Ala Gly Ala Ser Asn Ala Ala Glu Ser Ser Ser Leu
50 55 60
Trp Glu Asp Ser Ser Ser Glu Asn Thr Gly Ala Ser Thr Ala Ala Glu
65 70 75 80
Ser Ser Ser Leu Trp Glu Asp Ser Ser Ser Ala Ser Ala Arg Ala Ser
85 90 95
Thr Ala Ala Gly Ser Ser Ser Ala Trp Glu Asp Ser Ser Ile Thr Asn
100 105 110
Ala Arg Glu Ser Gly Ala Ser Gly Ser Leu Ser Ser Trp Glu Asp Ser
115 120 125
Ser Ser Ala Ser Ala Ser Ser Ser Thr Ser Ala Ser Ala Ser Ser Ser
130 135 140
Ser Ser Ser Ser Ser Ser Ile Ser Ser Ser Ala Ser Ser Ser Ser Ser
145 150 155 160
Ala Ser Ala Ser Ala Ser Thr Glu Ala Ser Asn Glu Ser Arg Arg Gly
165 170 175
Ile Ala Ile Glu Gly Ala Leu Val Gly Thr Gly Ala Ala Ser Thr Ala
180 185 190
Ala Ala Ser Ala Glu Met Leu Ser Asp Thr Leu Gly Leu Gly Gln Ser
195 200 205
Ala Leu Gln Ala Gln Thr Ala Ser Val Thr Gln Ala Asn Ile Ala Ser
210 215 220
Asp Ala Ser Asn Gln Ala Asn Arg Leu Ala Ala Ala Ala Ala Ala Ala
225 230 235 240
Met Ser Ala Ala Ala Ser Ala Gln Glu Asn Ala Ala Ser Leu Ala Arg
245 250 255
Ala Ser Ala Ser Ala Ser Glu Ser Ala Ala Ser Ala Ser Ser Lys Ala
260 265 270
Glu Ala Ser Ala Glu Ala Ala Lys Ser Ser Ala Glu Lys Cys Leu Leu
275 280 285
Leu Ala Gln Asn Ser Ala Gln Ala Gln Ala Arg Ala Thr Glu Gln Ser
290 295 300
Glu Ser Ser Asn Arg Asp Ser Ala Ala Asn Ala Ala Ala Ala Ala Glu
305 310 315 320
Ala Glu Arg Lys Ala Thr Leu Ala Leu Lys Ala Ile Ala Asp Ala Lys
325 330 335
Ala Lys Ala Gly Val Ala Val Ala Ala Gln Ser Glu Ala Ala Ala Ala
340 345 350
Ala Ala Ala Ala Ala Lys Ala Arg Ala Asp Ala Glu Ala Gly Ala Asn
355 360 365
Leu Ala Ala Ala Ala Arg Ala Val Ala Ala Ala Glu Ala Ala Ala Ser
370 375 380
Arg Arg Asn Asp Arg Gln Ala Gly Ile Ala Gln Ala Gly Ala Ser Ala
385 390 395 400
Ala Ala Glu Thr Arg Ala Leu Ala Ser Ser Ala Ala Ala Thr Ala Lys
405 410 415
Ala Ala Ala Tyr Ala Asn Ala Asp Ile Arg Ala Leu Ser Ala Ala Ala
420 425 430
Leu Glu Ser Ser Ile Ser Ser Ser Ser Ser Thr Ser Ala Ser Ser Ala
435 440 445
Ser Ser Ser Ala Ser Ser Gly Ala Ser Ser Asp Ser Ser Ser Gly Ala
450 455 460
Ser Ser Gly Ala Ser Ser Asp Ser Ser Ser Asn Ser Ser Ser Asp Ser
465 470 475 480
Ser Ser Leu Leu Gly Asp Asp Ala Ser Thr Ser Ala Ser Ser Thr Ala
485 490 495
Glu Ala Glu Ser Arg Thr Ser Ser Leu Ile Leu Asn
500 505
<210> 69
<211> 359
<212> PRT
<213> Vespa simillima xanthoptera
<400> 69
Leu Ala Ala Gly Ser Ser Ser Ser Ser Ala Glu Ser Ser Ala Ser Ala
1 5 10 15
Thr Ala Ser Ser Asp Ala Ser Trp Ser Ala Ser Ser Arg Ser Ser Ala
20 25 30
Thr Gly Arg Ala Pro Asn Val Ile Leu Asn Arg Ala Pro Gln Leu Gly
35 40 45
Ala Ser Ala Ala Ala Ile Ala Ser Ala Arg Ala Ser Thr Ser Ala Asn
50 55 60
Ala Ala Ser Asp Glu Lys Ser Ala Arg Glu Thr Arg Ala Thr Ala Leu
65 70 75 80
Ala Arg Ser Arg Ala Ala Val Thr Ala Ala Ala Arg Ala Ala Ala Arg
85 90 95
Thr Gln Glu Ala Val Ala Ala Ala Lys Ala Ala Ser Arg Ala Gln Ala
100 105 110
Leu Ala Ala Ala Lys Ser Ser Ala Ala Ile Ser Ala Leu Ala Ala Gly
115 120 125
Glu Ala Ala Ala Gln Lys Ala Asp Ala Ala Ala Leu Ala Ala Leu Ala
130 135 140
Ala Asn Gln Arg Ser Val Lys Ala Ala Glu Asn Gly Leu Ala Val Gln
145 150 155 160
Asn Arg Ala Asn Gly Glu Ala Glu Gln Ala Ser Arg Ala Ala Ala Ala
165 170 175
Asn Leu Ala Ala Ala Ile Arg Thr Arg Asp Asn Ala Leu Glu Thr Arg
180 185 190
Arg Glu Ala Ala Arg Leu Lys Ala Leu Ala Thr Ala Ala Ala Asn Ala
195 200 205
Asn Asn Lys Ala Thr Ser Leu Ala Glu Ala Ser Ala Asn Gln Ala Ala
210 215 220
Glu Ala Ser Ser Ala Ala Glu Asp Thr Ser Ser Ala Gln Ser Ala Ala
225 230 235 240
Val Ala Gln Ala Glu Ala Ala Glu Thr Leu Asn Val Asn Leu Ala Ile
245 250 255
Leu Glu Ser Thr Gln Ser Ser Arg Gln Asp Ser Asn Val Ala Lys Ala
260 265 270
Glu Ala Ser Ala Ala Ala Lys Ala Ser Pro Gly Thr Ala Thr Arg Asp
275 280 285
Gly Val Asn Leu Gly Leu Ala Ser Asp Ala Gly Ala Ala Ala Gln Leu
290 295 300
Lys Ala Gln Ala Ala Ala Leu Ala Arg Ala Ser Ser Arg Ile Ser Ser
305 310 315 320
Gly Pro Ala Leu Ser Ala Trp Lys Trp Arg Asn Glu Asp Ser Ser Glu
325 330 335
Ser Ser Thr Ser Ala Ile Ala Ser Ser Ser Ala Ser Ser Ser Ser Ser
340 345 350
Ser Arg Ser Ala Ser Gly Asn
355
<210> 70
<211> 374
<212> PRT
<213> Vespa simillima xanthoptera
<400> 70
Met Lys Ile Pro Ser Ile Leu Val Thr Cys Leu Phe Thr Trp Gly Leu
1 5 10 15
Ala Ala Gly Ser Ser Ser Ser Ser Ala Glu Ser Ser Ala Ser Ala Thr
20 25 30
Ala Ser Ser Asp Ala Ser Trp Ser Ala Ser Ser Arg Ser Ser Ala Thr
35 40 45
Gly Arg Ala Pro Asn Val Ile Leu Asn Arg Ala Pro Gln Leu Gly Ala
50 55 60
Ser Ala Ala Ala Ile Ala Ser Ala Arg Ala Ser Thr Ser Ala Asn Ala
65 70 75 80
Ala Ser Asp Glu Lys Ser Ala Arg Glu Thr Arg Ala Thr Ala Leu Ala
85 90 95
Arg Ser Arg Ala Ala Val Thr Ala Ala Ala Arg Ala Ala Ala Arg Thr
100 105 110
Gln Glu Ala Val Ala Ala Ala Lys Ala Ala Ser Arg Ala Gln Ala Leu
115 120 125
Ala Ala Ala Lys Ser Ser Ala Ala Ile Ser Ala Leu Ala Ala Gly Glu
130 135 140
Ala Ala Ala Gln Lys Ala Asp Ala Ala Ala Leu Ala Ala Leu Ala Ala
145 150 155 160
Asn Gln Arg Ser Val Lys Ala Ala Glu Asn Gly Leu Ala Val Gln Asn
165 170 175
Arg Ala Asn Gly Glu Ala Glu Gln Ala Ser Arg Ala Ala Ala Ala Asn
180 185 190
Leu Ala Ala Ala Ile Arg Thr Arg Asp Asn Ala Leu Glu Thr Arg Arg
195 200 205
Glu Ala Ala Arg Leu Lys Ala Leu Ala Thr Ala Ala Ala Asn Ala Asn
210 215 220
Asn Lys Ala Thr Ser Leu Ala Glu Ala Ser Ala Asn Gln Ala Ala Glu
225 230 235 240
Ala Ser Ser Ala Ala Glu Asp Thr Ser Ser Ala Gln Ser Ala Ala Val
245 250 255
Ala Gln Ala Glu Ala Ala Glu Thr Leu Asn Val Asn Leu Ala Ile Leu
260 265 270
Glu Ser Thr Gln Ser Ser Arg Gln Asp Ser Asn Val Ala Lys Ala Glu
275 280 285
Ala Ser Ala Ala Ala Lys Ala Ser Pro Gly Thr Ala Thr Arg Asp Gly
290 295 300
Val Asn Leu Gly Leu Ala Ser Asp Ala Gly Ala Ala Ala Gln Leu Lys
305 310 315 320
Ala Gln Ala Ala Ala Leu Ala Arg Ala Ser Ser Arg Ile Ser Ser Gly
325 330 335
Pro Ala Leu Ser Ala Trp Lys Trp Arg Asn Glu Asp Ser Ser Glu Ser
340 345 350
Ser Thr Ser Ala Ile Ala Ser Ser Ser Ala Ser Ser Ser Ser Ser Ser
355 360 365
Arg Ser Ala Ser Gly Asn
370
<210> 71
<211> 359
<212> PRT
<213> Vespa simillima xanthoptera
<400> 71
Ser Val Ala Gln Gly Gly Pro Ser Arg Leu Ser Glu Thr Ser Asp Ser
1 5 10 15
Ser Ala Ala Ser Trp Ser Ser Ser Ser Ser Ser Ser Ser Ser Leu Ser
20 25 30
Ser Ser Leu Ala Ser Asp Ser Ala Ser Ser Ser Ala Ser Gly Ser Ala
35 40 45
Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Arg Asn
50 55 60
Asp Asn Ser Arg Val Lys Ala Trp Lys Lys Gly Arg Gly Gly Ser Asp
65 70 75 80
Ser Leu Val Leu Ser Ser Asp Ser Ser Glu Asp Ser Lys Ala Arg Glu
85 90 95
Leu Leu Glu Thr Asp Ala Gly Leu Gly Ala Ala Ala Ala Leu Ala Arg
100 105 110
Ala Thr Ala Asp Ala Gln Ala Arg Thr Ala Ala Ser Ala Asp Ala Thr
115 120 125
Ala Asn Lys Ala Thr Ala Lys Ala Leu Val Leu Ala Glu Ala Ala Val
130 135 140
Arg Ala Glu Asn Ala Ala Ile Val Arg Ile Arg Arg Ala Leu Ser Ala
145 150 155 160
Ala Gln Ala Leu Val Ser Ala Ser Asn Arg Ala Lys Ala Ala Ala Arg
165 170 175
Ala Ala Arg Glu Ala Ala Ala Asn Ser Ala Ala Ala Ala Ala Lys Ala
180 185 190
Ser Thr Asn Gln Val Lys Ala Asn Ala Asp Ser Leu Val Ala Asn Arg
195 200 205
Ala Ala Ala Ala Leu Leu Ala Ala Ala Glu Glu Ala Leu Gln Lys Ala
210 215 220
Ser Ala Ser Gln Asn Ala Ala Ala Glu Ala Ala Ala Lys Ala Arg Ala
225 230 235 240
Ala Ala Asn Ala Asn Ala Ala Thr Thr Arg Ala Ala Ala Ser Ala Ile
245 250 255
Leu Ala Glu Ala Arg Ala Arg Thr Ala Ile Thr Lys Ala Leu Ala Ala
260 265 270
Gln Ser Thr Ala Ser Ala Gln Ala Ser Ser Ala Ser Gln Val Gln Asn
275 280 285
Arg Ala Asn Asn Leu Gln Ala Glu Thr Ala Ser Leu Ala Gln Ser Arg
290 295 300
Ala Glu Ala Ala Ile Ala Ala Ala Ala Ala Gln Ala Ala Ala Leu Ala
305 310 315 320
Glu Ala Asn Ala Gln Leu Ala Arg Leu Ser Lys Ala Ser Ala Gly Ala
325 330 335
Ser Ser Glu Gly Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala
340 345 350
Ser Ser Ser Ser Ser Ser Ala
355
<210> 72
<211> 375
<212> PRT
<213> Vespa simillima xanthoptera
<400> 72
Met Asn Val Gln Ala Thr Leu Val Leu Cys Leu Leu Ala Leu Phe Gly
1 5 10 15
Ser Val Ala Gln Gly Gly Pro Ser Arg Leu Ser Glu Thr Ser Asp Ser
20 25 30
Ser Ala Ala Ser Trp Ser Ser Ser Ser Ser Ser Ser Ser Ser Leu Ser
35 40 45
Ser Ser Leu Ala Ser Asp Ser Ala Ser Ser Ser Ala Ser Gly Ser Ala
50 55 60
Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Arg Asn
65 70 75 80
Asp Asn Ser Arg Val Lys Ala Trp Lys Lys Gly Arg Gly Gly Ser Asp
85 90 95
Ser Leu Val Leu Ser Ser Asp Ser Ser Glu Asp Ser Lys Ala Arg Glu
100 105 110
Leu Leu Glu Thr Asp Ala Gly Leu Gly Ala Ala Ala Ala Leu Ala Arg
115 120 125
Ala Thr Ala Asp Ala Gln Ala Arg Thr Ala Ala Ser Ala Asp Ala Thr
130 135 140
Ala Asn Lys Ala Thr Ala Lys Ala Leu Val Leu Ala Glu Ala Ala Val
145 150 155 160
Arg Ala Glu Asn Ala Ala Ile Val Arg Ile Arg Arg Ala Leu Ser Ala
165 170 175
Ala Gln Ala Leu Val Ser Ala Ser Asn Arg Ala Lys Ala Ala Ala Arg
180 185 190
Ala Ala Arg Glu Ala Ala Ala Asn Ser Ala Ala Ala Ala Ala Lys Ala
195 200 205
Ser Thr Asn Gln Val Lys Ala Asn Ala Asp Ser Leu Val Ala Asn Arg
210 215 220
Ala Ala Ala Ala Leu Leu Ala Ala Ala Glu Glu Ala Leu Gln Lys Ala
225 230 235 240
Ser Ala Ser Gln Asn Ala Ala Ala Glu Ala Ala Ala Lys Ala Arg Ala
245 250 255
Ala Ala Asn Ala Asn Ala Ala Thr Thr Arg Ala Ala Ala Ser Ala Ile
260 265 270
Leu Ala Glu Ala Arg Ala Arg Thr Ala Ile Thr Lys Ala Leu Ala Ala
275 280 285
Gln Ser Thr Ala Ser Ala Gln Ala Ser Ser Ala Ser Gln Val Gln Asn
290 295 300
Arg Ala Asn Asn Leu Gln Ala Glu Thr Ala Ser Leu Ala Gln Ser Arg
305 310 315 320
Ala Glu Ala Ala Ile Ala Ala Ala Ala Ala Gln Ala Ala Ala Leu Ala
325 330 335
Glu Ala Asn Ala Gln Leu Ala Arg Leu Ser Lys Ala Ser Ala Gly Ala
340 345 350
Ser Ser Glu Gly Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala
355 360 365
Ser Ser Ser Ser Ser Ser Ala
370 375
<210> 73
<211> 1386
<212> DNA
<213> Vespa simillima xanthoptera
<400> 73
ttcgccacgg cagcagaaag ctcaagctca agctccgcgg catcttcggc ttcatcatca 60
tcctcagaga gtagaggaca gttgttgctt ccgttagaaa ggagttctac cagaagctta 120
ctggatttgg tgagcagtgc taggagcaat actgcgataa ccgcatcgtc cgcagccgct 180
gcaaaggcaa ctcttcgagc gattaaagct gcgaattccg ctcaaggaga agctttggca 240
caggcgactg cttctgcggc ttcgaatgca aaggcacgcg caaccgcggc cgctgcagcg 300
caagccacta acgcagccgt taacgcgcaa gggaaggctt ccgcgcaagc tattgcaacg 360
gcagaagcag cagaagcttt gactaaatcg gcactccaag cccagtccgc tgcgagcagc 420
tctaaatcag aggcagccca agcttcaacc tcagctaatg ccggagccgg tgctcttgcg 480
actgcttctg ctcaggcctt atccgcgaag aaggcagcct tagcctacgc ctccgctgcc 540
gctgacgcaa gcaccgcagc ggccaaggct cgtgccgcag ttgctgctgc agaagcagcc 600
actcgtacag ccgtacaagc cgaaagagac tccacaaacg cagcctctct cgcagctaaa 660
gcccaagctg aagccagagc tgctgcagcc gctgctgcag cagcgagact cgccgcatca 720
gctgccgccg atgccagcgc tcaagccgat gcaagagtca gaaccgcttc tattgaagct 780
gccgccagcg ctcgtaccaa agcatccaat gctcaagcca cagccgaggc tgcagccata 840
gccaggagca gctccaggga cgcacaagca aactgggttg acaacaggtc ttctgcgtca 900
tcgtccagtg catcggccag tgcatcggtt agtgcatcag ccagtggaga agccgattca 960
gaagccgatt cagatgctag tgcatcagct cgttcagcag ccgattctaa tgctggttca 1020
tcttccggtt tagccgccga ttcagcggcc gatacagccg ccggttcaac cgccggttca 1080
gctgcccgtt taagtgctgg ttctgcagcc ggttcaatag cacgttcagc tgccggttct 1140
acagccggct catcaactgg ttcaggagcc ggtgcatcag ctgaaggttc ctccaatgcc 1200
tcctccggta cctccgccgg tgcatcctcc ggtgcctcca ccggagcttc tgctggtgcc 1260
tccgccactg cttctgccga taattccgcc gataattctg ccgaagctct ttctagctcc 1320
tccgccgagt cttcgtcgtc ctcctggtct tcttccagcc agaatatctg gtcccaggat 1380
tggtag 1386
<210> 74
<211> 1431
<212> DNA
<213> Vespa simillima xanthoptera
<400> 74
atgaacatcc taacgatact cgcgacaaca cttcttctga gtggcttcgc cacggcagca 60
gaaagctcaa gctcaagctc cgcggcatct tcggcttcat catcatcctc agagagtaga 120
ggacagttgt tgcttccgtt agaaaggagt tctaccagaa gcttactgga tttggtgagc 180
agtgctagga gcaatactgc gataaccgca tcgtccgcag ccgctgcaaa ggcaactctt 240
cgagcgatta aagctgcgaa ttccgctcaa ggagaagctt tggcacaggc gactgcttct 300
gcggcttcga atgcaaaggc acgcgcaacc gcggccgctg cagcgcaagc cactaacgca 360
gccgttaacg cgcaagggaa ggcttccgcg caagctattg caacggcaga agcagcagaa 420
gctttgacta aatcggcact ccaagcccag tccgctgcga gcagctctaa atcagaggca 480
gcccaagctt caacctcagc taatgccgga gccggtgctc ttgcgactgc ttctgctcag 540
gccttatccg cgaagaaggc agccttagcc tacgcctccg ctgccgctga cgcaagcacc 600
gcagcggcca aggctcgtgc cgcagttgct gctgcagaag cagccactcg tacagccgta 660
caagccgaaa gagactccac aaacgcagcc tctctcgcag ctaaagccca agctgaagcc 720
agagctgctg cagccgctgc tgcagcagcg agactcgccg catcagctgc cgccgatgcc 780
agcgctcaag ccgatgcaag agtcagaacc gcttctattg aagctgccgc cagcgctcgt 840
accaaagcat ccaatgctca agccacagcc gaggctgcag ccatagccag gagcagctcc 900
agggacgcac aagcaaactg ggttgacaac aggtcttctg cgtcatcgtc cagtgcatcg 960
gccagtgcat cggttagtgc atcagccagt ggagaagccg attcagaagc cgattcagat 1020
gctagtgcat cagctcgttc agcagccgat tctaatgctg gttcatcttc cggtttagcc 1080
gccgattcag cggccgatac agccgccggt tcaaccgccg gttcagctgc ccgtttaagt 1140
gctggttctg cagccggttc aatagcacgt tcagctgccg gttctacagc cggctcatca 1200
actggttcag gagccggtgc atcagctgaa ggttcctcca atgcctcctc cggtacctcc 1260
gccggtgcat cctccggtgc ctccaccgga gcttctgctg gtgcctccgc cactgcttct 1320
gccgataatt ccgccgataa ttctgccgaa gctctttcta gctcctccgc cgagtcttcg 1380
tcgtcctcct ggtcttcttc cagccagaat atctggtccc aggattggta g 1431
<210> 75
<211> 1461
<212> DNA
<213> Vespa simillima xanthoptera
<400> 75
gacagatcgt gggcagcatc ggatgcaaat gctgaagcgt cagccgcagt ggaatcgcct 60
tctctttggg aagattcatc cagtgcaagc gcgggagcgt caaacgcagc ggaatcgtca 120
tctctttggg aagattcatc cagtgaaaac acgggagcgt caaccgcagc ggaatcgtca 180
tctctttggg aagattcatc cagtgcaagc gcgagagcgt caaccgcagc gggatcttca 240
tctgcttggg aagattcatc catcacaaac gcgagagaat caggggcatc gggatcgtta 300
tctagctggg aagattcatc cagtgcaagc gctagctcta gcacaagcgc aagcgctagc 360
tctagctcaa gttctagctc tagcattagc tccagcgcta gctctagctc tagtgctagt 420
gccagcgcta gtacagaagc atctaacgaa tcaagaaggg gtatcgccat tgagggagcc 480
cttgtaggta cgggggctgc aagtacggct gcggcatccg cagaaatgct ttcggacacc 540
ttgggattgg gtcaatctgc tcttcaagca caaacagcat ccgtaacgca ggctaacatt 600
gccagcgatg ccagcaacca agctaatcga ttggcggctg ccgcagcagc agcgatgtca 660
gccgcagctt ccgctcaaga gaacgccgcg tcgttagctc gagcttcggc cagtgcgtct 720
gaaagtgcgg ctagtgcctc atcgaaggcc gaggcgagcg ccgaagcggc caaatcgtct 780
gcggaaaaat gtttattgct cgcgcaaaac tccgcacaag cgcaagctcg cgcgactgaa 840
caatcagagt cctcgaacag agactcggct gccaacgcgg ccgccgccgc ggaagccgaa 900
aggaaggcca ctttggctct aaaagctata gctgatgcca aggccaaggc cggtgtagcc 960
gttgccgctc agtcggaggc tgctgcggca gccgcagccg ctgcaaaagc acgcgccgat 1020
gccgaagcag gtgctaattt ggccgcagca gcgcgtgccg tcgccgcagc cgaagctgct 1080
gcttccagac gaaatgatcg tcaagctggt atagctcaag ccggagcatc cgccgcagcc 1140
gagaccagag cgcttgcatc ctccgccgca gccaccgcta aagcagccgc ttacgctaat 1200
gccgatatcc gagcactttc cgcagctgct ctagaatcct ccatatcttc gtcctctagc 1260
actagtgctt ccagtgcatc ctcatccgcc agcagcggtg ccagcagcga ttccagcagc 1320
ggtgccagca gcggtgccag cagcgattct agcagcaatt ccagcagcga ttccagtagc 1380
ctcctaggag atgatgcttc aaccagtgcc agcagcacag ctgaagccga gagtagaact 1440
agctcgctga tcttaaacta a 1461
<210> 76
<211> 1527
<212> DNA
<213> Vespa simillima xanthoptera
<400> 76
atgaagtctc tctcaacgct cgtgtcgtcg ctcttgttgg gagcctgtgt gctcagtgtc 60
catgccgaca gatcgtgggc agcatcggat gcaaatgctg aagcgtcagc cgcagtggaa 120
tcgccttctc tttgggaaga ttcatccagt gcaagcgcgg gagcgtcaaa cgcagcggaa 180
tcgtcatctc tttgggaaga ttcatccagt gaaaacacgg gagcgtcaac cgcagcggaa 240
tcgtcatctc tttgggaaga ttcatccagt gcaagcgcga gagcgtcaac cgcagcggga 300
tcttcatctg cttgggaaga ttcatccatc acaaacgcga gagaatcagg ggcatcggga 360
tcgttatcta gctgggaaga ttcatccagt gcaagcgcta gctctagcac aagcgcaagc 420
gctagctcta gctcaagttc tagctctagc attagctcca gcgctagctc tagctctagt 480
gctagtgcca gcgctagtac agaagcatct aacgaatcaa gaaggggtat cgccattgag 540
ggagcccttg taggtacggg ggctgcaagt acggctgcgg catccgcaga aatgctttcg 600
gacaccttgg gattgggtca atctgctctt caagcacaaa cagcatccgt aacgcaggct 660
aacattgcca gcgatgccag caaccaagct aatcgattgg cggctgccgc agcagcagcg 720
atgtcagccg cagcttccgc tcaagagaac gccgcgtcgt tagctcgagc ttcggccagt 780
gcgtctgaaa gtgcggctag tgcctcatcg aaggccgagg cgagcgccga agcggccaaa 840
tcgtctgcgg aaaaatgttt attgctcgcg caaaactccg cacaagcgca agctcgcgcg 900
actgaacaat cagagtcctc gaacagagac tcggctgcca acgcggccgc cgccgcggaa 960
gccgaaagga aggccacttt ggctctaaaa gctatagctg atgccaaggc caaggccggt 1020
gtagccgttg ccgctcagtc ggaggctgct gcggcagccg cagccgctgc aaaagcacgc 1080
gccgatgccg aagcaggtgc taatttggcc gcagcagcgc gtgccgtcgc cgcagccgaa 1140
gctgctgctt ccagacgaaa tgatcgtcaa gctggtatag ctcaagccgg agcatccgcc 1200
gcagccgaga ccagagcgct tgcatcctcc gccgcagcca ccgctaaagc agccgcttac 1260
gctaatgccg atatccgagc actttccgca gctgctctag aatcctccat atcttcgtcc 1320
tctagcacta gtgcttccag tgcatcctca tccgccagca gcggtgccag cagcgattcc 1380
agcagcggtg ccagcagcgg tgccagcagc gattctagca gcaattccag cagcgattcc 1440
agtagcctcc taggagatga tgcttcaacc agtgccagca gcacagctga agccgagagt 1500
agaactagct cgctgatctt aaactaa 1527
<210> 77
<211> 1080
<212> DNA
<213> Vespa simillima xanthoptera
<400> 77
ttggctgccg ggagtagcag ctcgtccgcg gaatcttcgg catcggcgac agcgtcttca 60
gatgcgtcct ggagcgcgtc ctcgagatcg tcagctaccg gtagagcacc gaacgtgatt 120
ttgaataggg cacctcaatt aggagctagc gcggcagcga tcgcatcggc tcgagccagt 180
acctcagcaa atgctgcatc agacgaaaaa tctgcccgag aaacgcgagc gaccgctttg 240
gcccgatcaa gagctgctgt tacggcggca gcacgagcag ccgcaaggac gcaagaagcc 300
gtcgcggcag caaaagccgc aagtagggcc caagcgcttg ctgctgctaa atcttcggcg 360
gcaatttctg cattggccgc tggagaggct gccgcccaaa aggcggacgc cgcagctctc 420
gccgcattag ctgctaatca gagatctgtc aaagccgcag aaaatggtct agcagtgcag 480
aatcgtgcga atggagaagc ggaacaggca agtcgtgcgg ctgctgctaa ccttgccgcg 540
gccatccgta cccgagacaa tgctctcgaa acgagaagag aagcagctcg attgaaggca 600
ctagccacag ctgccgctaa cgctaataac aaagcgacca gtcttgccga agcttctgcg 660
aaccaagcag ctgaagcaag ctccgctgcc gaggatactt cttccgctca atctgctgcg 720
gtcgctcaag ctgaggccgc tgaaacgctc aacgtaaatc tcgctatact cgaaagtacc 780
caatcctcca gacaggactc caacgtggcc aaagctgagg cttccgccgc agccaaggcc 840
tcgcctggca ctgccacaag agacggagtc aaccttggtc tcgcctctga tgctggtgca 900
gctgctcaac taaaagccca agccgcagca ttggcacgag caagtagcag aattagttcc 960
ggccctgcgt tatccgcatg gaaatggagg aacgaagatt cttcagaatc gtcaacctct 1020
gcaatcgcca gctctagcgc cagttccagc tccagttctc gcagcgcatc cggaaactaa 1080
<210> 78
<211> 1125
<212> DNA
<213> Vespa simillima xanthoptera
<400> 78
atgaagatcc cctcgattct cgtaacgtgc ctttttacct ggggcttggc tgccgggagt 60
agcagctcgt ccgcggaatc ttcggcatcg gcgacagcgt cttcagatgc gtcctggagc 120
gcgtcctcga gatcgtcagc taccggtaga gcaccgaacg tgattttgaa tagggcacct 180
caattaggag ctagcgcggc agcgatcgca tcggctcgag ccagtacctc agcaaatgct 240
gcatcagacg aaaaatctgc ccgagaaacg cgagcgaccg ctttggcccg atcaagagct 300
gctgttacgg cggcagcacg agcagccgca aggacgcaag aagccgtcgc ggcagcaaaa 360
gccgcaagta gggcccaagc gcttgctgct gctaaatctt cggcggcaat ttctgcattg 420
gccgctggag aggctgccgc ccaaaaggcg gacgccgcag ctctcgccgc attagctgct 480
aatcagagat ctgtcaaagc cgcagaaaat ggtctagcag tgcagaatcg tgcgaatgga 540
gaagcggaac aggcaagtcg tgcggctgct gctaaccttg ccgcggccat ccgtacccga 600
gacaatgctc tcgaaacgag aagagaagca gctcgattga aggcactagc cacagctgcc 660
gctaacgcta ataacaaagc gaccagtctt gccgaagctt ctgcgaacca agcagctgaa 720
gcaagctccg ctgccgagga tacttcttcc gctcaatctg ctgcggtcgc tcaagctgag 780
gccgctgaaa cgctcaacgt aaatctcgct atactcgaaa gtacccaatc ctccagacag 840
gactccaacg tggccaaagc tgaggcttcc gccgcagcca aggcctcgcc tggcactgcc 900
acaagagacg gagtcaacct tggtctcgcc tctgatgctg gtgcagctgc tcaactaaaa 960
gcccaagccg cagcattggc acgagcaagt agcagaatta gttccggccc tgcgttatcc 1020
gcatggaaat ggaggaacga agattcttca gaatcgtcaa cctctgcaat cgccagctct 1080
agcgccagtt ccagctccag ttctcgcagc gcatccggaa actaa 1125
<210> 79
<211> 1080
<212> DNA
<213> Vespa simillima xanthoptera
<400> 79
agcgtggccc aaggtgggcc atcaaggttg tctgaaacca gtgattcgtc cgcagcatct 60
tggtcctcga gttcgtcttc aagctcgtcc ttgtcctcat ctctggcttc ggattctgct 120
tcttcttctg cttcgggttc ggcttcggct tcggcttcgg cttcggcttc ggcttcagca 180
agttcgagaa acgataacag tagagttaag gcatggaaga agggtagagg aggtagcgac 240
agcttggtac tgtcgagtga ttcatcagaa gattcaaaag ccagggagct cctcgagaca 300
gacgccggat taggtgcggc cgctgcgtta gcaagagcta ccgcggatgc ccaagctaga 360
acagcagcaa gcgccgatgc tacggctaat aaggcaactg caaaggctct tgtattagcc 420
gaggctgctg taagggcgga aaatgcagcg attgtaagga tccgtagggc tttatcggca 480
gcgcaagctc tcgtctcggc atccaatcgt gcaaaggccg cagctagagc tgcgagggaa 540
gctgctgcga actctgccgc tgctgccgca aaagcttcca ctaatcaagt gaaagccaac 600
gctgactcgc ttgtcgccaa cagagctgca gccgcccttc ttgctgctgc cgaggaagcc 660
ctccagaaag ccagtgcttc gcagaatgca gcagctgaag ctgctgcgaa agctcgtgcc 720
gcagctaacg cgaatgccgc aaccaccaga gccgcggcct cggccatact cgccgaagct 780
cgtgccagaa cagctatcac gaaagcactt gccgctcaat caacggcctc cgctcaggct 840
tcttccgcct ctcaagtaca aaatcgtgca aataacctac aagccgaaac cgcttcttta 900
gcccaatcca gggcagaagc cgcaatagct gcagctgcgg cacaagctgc cgctctcgca 960
gaagctaacg ctcaactcgc tcgtctcagc aaagcatctg caggtgcttc cagcgagggt 1020
tcggcttcag cctcggcatc agcctcggca tcagcctctt cgagtagtag cagcgcctaa 1080
<210> 80
<211> 1128
<212> DNA
<213> Vespa simillima xanthoptera
<400> 80
atgaacgtac aagcgacact cgtgctttgc ctgctcgcat tgttcggcag cgtggcccaa 60
ggtgggccat caaggttgtc tgaaaccagt gattcgtccg cagcatcttg gtcctcgagt 120
tcgtcttcaa gctcgtcctt gtcctcatct ctggcttcgg attctgcttc ttcttctgct 180
tcgggttcgg cttcggcttc ggcttcggct tcggcttcgg cttcagcaag ttcgagaaac 240
gataacagta gagttaaggc atggaagaag ggtagaggag gtagcgacag cttggtactg 300
tcgagtgatt catcagaaga ttcaaaagcc agggagctcc tcgagacaga cgccggatta 360
ggtgcggccg ctgcgttagc aagagctacc gcggatgccc aagctagaac agcagcaagc 420
gccgatgcta cggctaataa ggcaactgca aaggctcttg tattagccga ggctgctgta 480
agggcggaaa atgcagcgat tgtaaggatc cgtagggctt tatcggcagc gcaagctctc 540
gtctcggcat ccaatcgtgc aaaggccgca gctagagctg cgagggaagc tgctgcgaac 600
tctgccgctg ctgccgcaaa agcttccact aatcaagtga aagccaacgc tgactcgctt 660
gtcgccaaca gagctgcagc cgcccttctt gctgctgccg aggaagccct ccagaaagcc 720
agtgcttcgc agaatgcagc agctgaagct gctgcgaaag ctcgtgccgc agctaacgcg 780
aatgccgcaa ccaccagagc cgcggcctcg gccatactcg ccgaagctcg tgccagaaca 840
gctatcacga aagcacttgc cgctcaatca acggcctccg ctcaggcttc ttccgcctct 900
caagtacaaa atcgtgcaaa taacctacaa gccgaaaccg cttctttagc ccaatccagg 960
gcagaagccg caatagctgc agctgcggca caagctgccg ctctcgcaga agctaacgct 1020
caactcgctc gtctcagcaa agcatctgca ggtgcttcca gcgagggttc ggcttcagcc 1080
tcggcatcag cctcggcatc agcctcttcg agtagtagca gcgcctaa 1128
<210> 81
<211> 314
<212> PRT
<213> Apis cerana
<400> 81
Gly Leu Glu Gly Ser Gly Asn Pro Leu Pro Glu Leu Val Lys Gly Ser
1 5 10 15
Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg
20 25 30
Val Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val Leu Gln Ala
35 40 45
Glu Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala Ala Asp Leu
50 55 60
Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser Gln Ala Ala
65 70 75 80
Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln Ala Arg Ala
85 90 95
Gly Leu Glu Ser Val Ser Ile Ala Ala Ser Ala Thr Ser Ala Ala Lys
100 105 110
Glu Ala Ser Thr Ala Ala Arg Ala Ala Ala Ser Ala Leu Ser Thr Ala
115 120 125
Thr Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala Glu Ala Val
130 135 140
Ala Ser Glu Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala Asn Leu Ala
145 150 155 160
Ala Ala Ala Ser Glu Ala Ala Glu Thr Ala Leu Lys Ala Glu Lys Val
165 170 175
Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala Ala Ala Arg
180 185 190
Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala Thr Ala Ser
195 200 205
Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val Ala Val Leu
210 215 220
Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala Ala Thr Ser
225 230 235 240
Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn Val Glu Thr
245 250 255
Ala Thr Ile Gly Ala Asn Ile Asp Ser Ser Lys Gln Val Val Ser Ile
260 265 270
Pro Val Glu Ile Lys Lys Phe Pro Glu Pro Glu Leu Ser Thr Ser Trp
275 280 285
Arg Glu Asp Glu Glu Val Thr Lys Gly Lys Lys Glu Asp Ile Asn Leu
290 295 300
Asn Ser Phe Glu Leu Lys Ser Asn Val Phe
305 310
<210> 82
<211> 333
<212> PRT
<213> Apis cerana
<400> 82
Met Lys Ile Pro Val Leu Leu Ala Thr Cys Leu Tyr Leu Cys Gly Phe
1 5 10 15
Ala Ser Ala Gly Leu Glu Gly Ser Gly Asn Pro Leu Pro Glu Leu Val
20 25 30
Lys Gly Ser Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser
35 40 45
Gly Leu Arg Val Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val
50 55 60
Leu Gln Ala Glu Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala
65 70 75 80
Ala Asp Leu Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser
85 90 95
Gln Ala Ala Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln
100 105 110
Ala Arg Ala Gly Leu Glu Ser Val Ser Ile Ala Ala Ser Ala Thr Ser
115 120 125
Ala Ala Lys Glu Ala Ser Thr Ala Ala Arg Ala Ala Ala Ser Ala Leu
130 135 140
Ser Thr Ala Thr Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala
145 150 155 160
Glu Ala Val Ala Ser Glu Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala
165 170 175
Asn Leu Ala Ala Ala Ala Ser Glu Ala Ala Glu Thr Ala Leu Lys Ala
180 185 190
Glu Lys Val Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala
195 200 205
Ala Ala Arg Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala
210 215 220
Thr Ala Ser Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val
225 230 235 240
Ala Val Leu Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala
245 250 255
Ala Thr Ser Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn
260 265 270
Val Glu Thr Ala Thr Ile Gly Ala Asn Ile Asp Ser Ser Lys Gln Val
275 280 285
Val Ser Ile Pro Val Glu Ile Lys Lys Phe Pro Glu Pro Glu Leu Ser
290 295 300
Thr Ser Trp Arg Glu Asp Glu Glu Val Thr Lys Gly Lys Lys Glu Asp
305 310 315 320
Ile Asn Leu Asn Ser Phe Glu Leu Lys Ser Asn Val Phe
325 330
<210> 83
<211> 288
<212> PRT
<213> Apis cerana
<400> 83
Arg Val Ile Asn His Glu Ser Leu Lys Thr Asn Val Asp Ile Gln Val
1 5 10 15
Thr Pro Gly Gln Val Gly Asp Gly Ser Asp Ala Thr Ser Ser Ser Ile
20 25 30
Glu Asn Ala Leu Lys Val Ala Arg Ala Ser Glu Asn Val Gly Leu Asn
35 40 45
Leu Glu Leu Asn Ala Gly Ala His Ala Ala Ser Val Ala Ala Ala Ala
50 55 60
Gln Ala Lys Asn Thr Glu Ala Ala Glu Val Gly Ala Asn Ala Ala Leu
65 70 75 80
Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu Ile
85 90 95
Ala Ser Gln Leu Leu Thr Asn Ala Ala Lys Ala Ala Glu Ala Thr Val
100 105 110
Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala Ala Ala Lys Glu Ala
115 120 125
Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala Thr Glu Ala Gln Val
130 135 140
Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg Thr Ala Ile Ala Glu
145 150 155 160
Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala Ala Ile Ala Arg Lys
165 170 175
Ala Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile Ala Ala Ala Ala Glu
180 185 190
Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Thr Val Ala Leu Ser Asn
195 200 205
Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala Gln Ala Thr Ala Ser
210 215 220
Thr Gln Ala Ser Ala Ala Val Arg Val Asp Ser Gln Ala Ala Asn Ala
225 230 235 240
Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala Glu
245 250 255
Ala Ile Ala Ala Ala Glu Ala Glu Ala Ala Ser Lys Ala Ala Ser Phe
260 265 270
Ala Lys Lys Ile Val Asp Glu Lys Lys Ile His Val Glu Lys Leu Glu
275 280 285
<210> 84
<211> 307
<212> PRT
<213> Apis cerana
<400> 84
Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Val Trp Gly Leu
1 5 10 15
Ala Glu Gly Arg Val Ile Asn His Glu Ser Leu Lys Thr Asn Val Asp
20 25 30
Ile Gln Val Thr Pro Gly Gln Val Gly Asp Gly Ser Asp Ala Thr Ser
35 40 45
Ser Ser Ile Glu Asn Ala Leu Lys Val Ala Arg Ala Ser Glu Asn Val
50 55 60
Gly Leu Asn Leu Glu Leu Asn Ala Gly Ala His Ala Ala Ser Val Ala
65 70 75 80
Ala Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Val Gly Ala Asn
85 90 95
Ala Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala
100 105 110
Ser Glu Ile Ala Ser Gln Leu Leu Thr Asn Ala Ala Lys Ala Ala Glu
115 120 125
Ala Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala Ala Ala
130 135 140
Lys Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala Thr Glu
145 150 155 160
Ala Gln Val Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg Thr Ala
165 170 175
Ile Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala Ala Ile
180 185 190
Ala Arg Lys Ala Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile Ala Ala
195 200 205
Ala Ala Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Thr Val Ala
210 215 220
Leu Ser Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala Gln Ala
225 230 235 240
Thr Ala Ser Thr Gln Ala Ser Ala Ala Val Arg Val Asp Ser Gln Ala
245 250 255
Ala Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu Leu Val
260 265 270
Thr Ala Glu Ala Ile Ala Ala Ala Glu Ala Glu Ala Ala Ser Lys Ala
275 280 285
Ala Ser Phe Ala Lys Lys Ile Val Asp Glu Lys Lys Ile His Val Glu
290 295 300
Lys Leu Glu
305
<210> 85
<211> 316
<212> PRT
<213> Apis cerana
<400> 85
Gly Val Glu Glu Phe Lys Ser Ser Thr Thr Glu Glu Val Ile Gly Lys
1 5 10 15
Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser Ala Lys Arg
20 25 30
Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Val Phe Lys Ser Leu
35 40 45
Glu Asn Ile Lys Ala Ser Ala Gly Ala Asp Ala Lys Ala Ser Ala Val
50 55 60
Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu Arg Ala Ser
65 70 75 80
Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Leu Lys Asn
85 90 95
Ala Gln Gln Ala Gln Leu Ile Ala Gln Glu Lys Ala Leu Ala Ala Leu
100 105 110
Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala Asn Ala Ala
115 120 125
Ala Ala Ala Thr Gln Ser Ala Val Glu Arg Ala Gln Ala Ser Ser Arg
130 135 140
Thr Ala Thr Ala Ala Gln Asn Val Ala Ser Asn Leu Gln Lys Arg Thr
145 150 155 160
Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg Gln Leu Gln
165 170 175
Asp Ala Glu Gln Thr Lys Trp Ser Ala Asn Ala Ala Leu Glu Val Ser
180 185 190
Ala Ala Ala Thr Ala Ala Glu Thr Lys Thr Thr Ala Ser Ser Glu Ala
195 200 205
Ala Ser Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser Asp Ala Asp
210 215 220
Gly Ala Glu Lys Ser Ala Ser Thr Glu Ala Gln Ser Ala Ala Lys Ile
225 230 235 240
Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala Ser Glu Asp
245 250 255
Ser Gln Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg Ala Asn Val
260 265 270
Ala Thr Ala Ile Gly Asp Gly Ala Ile Leu Gly Leu Gly Gln Asp Val
275 280 285
Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu Ala Glu Val
290 295 300
Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe
305 310 315
<210> 86
<211> 335
<212> PRT
<213> Apis cerana
<400> 86
Met Gln Ile Pro Thr Phe Val Val Val Cys Leu Leu Thr Ser Gly Leu
1 5 10 15
Val His Ala Gly Val Glu Glu Phe Lys Ser Ser Thr Thr Glu Glu Val
20 25 30
Ile Gly Lys Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser
35 40 45
Ala Lys Arg Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Val Phe
50 55 60
Lys Ser Leu Glu Asn Ile Lys Ala Ser Ala Gly Ala Asp Ala Lys Ala
65 70 75 80
Ser Ala Val Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu
85 90 95
Arg Ala Ser Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala
100 105 110
Leu Lys Asn Ala Gln Gln Ala Gln Leu Ile Ala Gln Glu Lys Ala Leu
115 120 125
Ala Ala Leu Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala
130 135 140
Asn Ala Ala Ala Ala Ala Thr Gln Ser Ala Val Glu Arg Ala Gln Ala
145 150 155 160
Ser Ser Arg Thr Ala Thr Ala Ala Gln Asn Val Ala Ser Asn Leu Gln
165 170 175
Lys Arg Thr Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg
180 185 190
Gln Leu Gln Asp Ala Glu Gln Thr Lys Trp Ser Ala Asn Ala Ala Leu
195 200 205
Glu Val Ser Ala Ala Ala Thr Ala Ala Glu Thr Lys Thr Thr Ala Ser
210 215 220
Ser Glu Ala Ala Ser Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser
225 230 235 240
Asp Ala Asp Gly Ala Glu Lys Ser Ala Ser Thr Glu Ala Gln Ser Ala
245 250 255
Ala Lys Ile Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala
260 265 270
Ser Glu Asp Ser Gln Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg
275 280 285
Ala Asn Val Ala Thr Ala Ile Gly Asp Gly Ala Ile Leu Gly Leu Gly
290 295 300
Gln Asp Val Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu
305 310 315 320
Ala Glu Val Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe
325 330 335
<210> 87
<211> 320
<212> PRT
<213> Apis cerana
<400> 87
Ala Ser Glu Glu Val Glu Thr Arg Gly Lys Thr Lys Thr Ser Thr Val
1 5 10 15
Val Lys Ser Glu Lys Val Glu Val Val Pro Ala Lys Asp Glu Leu Lys
20 25 30
Leu Thr Ser Glu Pro Ile Leu Gly Arg Arg Val Gly Thr Gly Ala Ser
35 40 45
Glu Val Ala Ser Ser Ser Gly Glu Ile Ile Ala Ile Ser Leu Gly Thr
50 55 60
Gly Gln Ala Ala Ala Glu Ser Gln Ala Val Ala Ala Ser Gln Ser Lys
65 70 75 80
Ser Ala Ala Ser Ala Ala Ile Ser Ala Ser Glu Leu Ala Asn Lys Val
85 90 95
Ala Ala Leu Val Val Gly Ala Thr Ala Ala Gln Ala Arg Ala Ala Ala
100 105 110
Ala Ser Ser Gly Ala Leu Lys Ala Ser Leu Ala Thr Glu Glu Ser Ala
115 120 125
Glu Glu Ala Glu Ala Ala Val Ala Val Ala Lys Ala Ala Ala Glu Lys
130 135 140
Ala Glu Ser Leu Ala Arg Asn Leu Ala Ser Ala Ser Ala Arg Ala Ala
145 150 155 160
Ile Ser Ser Glu Ser Ala Asn Glu Leu Ala Gln Ala Glu Ser Ala Ala
165 170 175
Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys Ala Ala Glu
180 185 190
Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu Ala Asp Ala
195 200 205
Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val Ala Asp Ala
210 215 220
Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys Ala Glu Glu
225 230 235 240
Glu Ala Ser Ala Gln Ala Glu Asn Thr Ala Gly Val Ser Gln Ala Ala
245 250 255
Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala Ala Ala Ala
260 265 270
Thr Ser Glu Thr Ala Ala Glu Ala Gly Pro Leu Ala Gly Glu Leu Lys
275 280 285
Pro Pro Gln Trp Lys Arg Ile Pro Val Lys Lys Glu Glu Trp Lys Thr
290 295 300
Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu Trp Glu Val Lys
305 310 315 320
<210> 88
<211> 339
<212> PRT
<213> Apis cerana
<400> 88
Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Ile Trp Gly Leu
1 5 10 15
Ala Ser Gly Ala Ser Glu Glu Val Glu Thr Arg Gly Lys Thr Lys Thr
20 25 30
Ser Thr Val Val Lys Ser Glu Lys Val Glu Val Val Pro Ala Lys Asp
35 40 45
Glu Leu Lys Leu Thr Ser Glu Pro Ile Leu Gly Arg Arg Val Gly Thr
50 55 60
Gly Ala Ser Glu Val Ala Ser Ser Ser Gly Glu Ile Ile Ala Ile Ser
65 70 75 80
Leu Gly Thr Gly Gln Ala Ala Ala Glu Ser Gln Ala Val Ala Ala Ser
85 90 95
Gln Ser Lys Ser Ala Ala Ser Ala Ala Ile Ser Ala Ser Glu Leu Ala
100 105 110
Asn Lys Val Ala Ala Leu Val Val Gly Ala Thr Ala Ala Gln Ala Arg
115 120 125
Ala Ala Ala Ala Ser Ser Gly Ala Leu Lys Ala Ser Leu Ala Thr Glu
130 135 140
Glu Ser Ala Glu Glu Ala Glu Ala Ala Val Ala Val Ala Lys Ala Ala
145 150 155 160
Ala Glu Lys Ala Glu Ser Leu Ala Arg Asn Leu Ala Ser Ala Ser Ala
165 170 175
Arg Ala Ala Ile Ser Ser Glu Ser Ala Asn Glu Leu Ala Gln Ala Glu
180 185 190
Ser Ala Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys
195 200 205
Ala Ala Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu
210 215 220
Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val
225 230 235 240
Ala Asp Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys
245 250 255
Ala Glu Glu Glu Ala Ser Ala Gln Ala Glu Asn Thr Ala Gly Val Ser
260 265 270
Gln Ala Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala
275 280 285
Ala Ala Ala Thr Ser Glu Thr Ala Ala Glu Ala Gly Pro Leu Ala Gly
290 295 300
Glu Leu Lys Pro Pro Gln Trp Lys Arg Ile Pro Val Lys Lys Glu Glu
305 310 315 320
Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu Trp
325 330 335
Glu Val Lys
<210> 89
<211> 945
<212> DNA
<213> Apis cerana
<400> 89
ggtttggaag ggtcgggtaa cccattgccc gagctcgtga aaggtagcgc atcggccacc 60
gcgtcgactg ctgtgactgc tagatcgggg cttagagtcg gacaagtagc tttagcttcg 120
cagaaggatg ccgtactcca agctgaagct gctgcatccg ccgcgtcaga ggcacgcgcc 180
gctgccgatc tgacggctaa acttagccaa gaatcggcat cagtgcaatc acaggccgcc 240
gccaaaggga aggaaacgga ggaggcagcg gttggtcaag ctagagctgg tctcgagtcg 300
gtatccatcg ccgcatcggc cacttctgct gccaaagaag catcaaccgc cgccagagcc 360
gcagcatccg cactatccac agccacggtg caagcgaaaa tagccgagag agcagccaag 420
gctgaagctg ttgcctcaga ggaagccaag gccaaggcga ttgcagcagc caacttggcg 480
gctgcggcta gtgaagccgc ggaaacagcc ctcaaggctg agaaagtggc cgaagaagct 540
atcgcaagag cggcctctgc aaaggctgct gcaagagctg ctgcggccgc tctagcctcc 600
tcgaaggaag cagccacggc cagcgcgaga aacgccgcgg aatccgaggc caggaacgaa 660
gtagctgtat tgatcgccga gattgataaa aagagtaggg aaatcgacgc agccacttcg 720
cttaatgcgc gtgccgctgc caaagcaagc tccaggaacg tagaaacggc gacaatcggg 780
gctaacatcg actcttcgaa acaagtcgta tcaattccag tggaaataaa gaaattcccg 840
gagccagaac tgtcaacatc atggagagaa gatgaagagg ttacgaaagg aaaaaaggag 900
gatataaatc tgaatagctt cgaattgaag agcaatgtat tttag 945
<210> 90
<211> 1002
<212> DNA
<213> Apis cerana
<400> 90
atgaagattc cagtattgct tgcaacgtgc ctctaccttt gcggatttgc gtccgccggt 60
ttggaagggt cgggtaaccc attgcccgag ctcgtgaaag gtagcgcatc ggccaccgcg 120
tcgactgctg tgactgctag atcggggctt agagtcggac aagtagcttt agcttcgcag 180
aaggatgccg tactccaagc tgaagctgct gcatccgccg cgtcagaggc acgcgccgct 240
gccgatctga cggctaaact tagccaagaa tcggcatcag tgcaatcaca ggccgccgcc 300
aaagggaagg aaacggagga ggcagcggtt ggtcaagcta gagctggtct cgagtcggta 360
tccatcgccg catcggccac ttctgctgcc aaagaagcat caaccgccgc cagagccgca 420
gcatccgcac tatccacagc cacggtgcaa gcgaaaatag ccgagagagc agccaaggct 480
gaagctgttg cctcagagga agccaaggcc aaggcgattg cagcagccaa cttggcggct 540
gcggctagtg aagccgcgga aacagccctc aaggctgaga aagtggccga agaagctatc 600
gcaagagcgg cctctgcaaa ggctgctgca agagctgctg cggccgctct agcctcctcg 660
aaggaagcag ccacggccag cgcgagaaac gccgcggaat ccgaggccag gaacgaagta 720
gctgtattga tcgccgagat tgataaaaag agtagggaaa tcgacgcagc cacttcgctt 780
aatgcgcgtg ccgctgccaa agcaagctcc aggaacgtag aaacggcgac aatcggggct 840
aacatcgact cttcgaaaca agtcgtatca attccagtgg aaataaagaa attcccggag 900
ccagaactgt caacatcatg gagagaagat gaagaggtta cgaaaggaaa aaaggaggat 960
ataaatctga atagcttcga attgaagagc aatgtatttt ag 1002
<210> 91
<211> 867
<212> DNA
<213> Apis cerana
<400> 91
cgtgtgatta atcacgaatc cctgaagacg aacgtggata ttcaagtaac accaggacaa 60
gtcggtgatg gatctgacgc gactagctcc tccatagaaa acgccctaaa agtcgctcga 120
gcgtctgaga acgtgggcct gaatctggaa ttgaacgcag gcgcgcatgc tgccagtgtt 180
gccgctgctg cccaggccaa aaatacagag gctgcggaag taggagcaaa cgccgctctg 240
gccgccgcca ttgccaaacg agaggaagcg attaaagcca gcgagatagc aagccagtta 300
ttgaccaatg cagcaaaggc agcagaagcg actgtatcgg caacgaagag ggcagcacaa 360
ttgacggctg cagcgaaaga agcaaccaga gcttctgcag ccgctgctga agctgctacg 420
gaggcccagg taaaggctaa tgctgattcg attatcacga agaggactgc gattgctgag 480
gctcaagctg cggcagaagc tcaagttaag gcggcaatcg ctagaaaggc ggcagcgaat 540
tttttggcta aggctcaaat agcggctgcc gcggaatccg aggccacgaa actcgcggcc 600
gaagccacag tggcattaag taacgccgaa gtcgccgtga accaggctag aaacgcacag 660
gcaaccgcct cgactcaagc ttccgcagct gttagggtag attctcaagc agcgaacgct 720
gaagcagccg ctgtagcaca agccgaaact ctcttggtta cggcagaagc catcgcagct 780
gcagaggctg aggctgcgag caaagccgcc tcatttgcaa aaaagatcgt cgatgagaag 840
aaaatacatg tagaaaagtt ggaataa 867
<210> 92
<211> 924
<212> DNA
<213> Apis cerana
<400> 92
atgaagattc cagcaatatt cgtcacatct ctgctggtct ggggattggc cgagggccgt 60
gtgattaatc acgaatccct gaagacgaac gtggatattc aagtaacacc aggacaagtc 120
ggtgatggat ctgacgcgac tagctcctcc atagaaaacg ccctaaaagt cgctcgagcg 180
tctgagaacg tgggcctgaa tctggaattg aacgcaggcg cgcatgctgc cagtgttgcc 240
gctgctgccc aggccaaaaa tacagaggct gcggaagtag gagcaaacgc cgctctggcc 300
gccgccattg ccaaacgaga ggaagcgatt aaagccagcg agatagcaag ccagttattg 360
accaatgcag caaaggcagc agaagcgact gtatcggcaa cgaagagggc agcacaattg 420
acggctgcag cgaaagaagc aaccagagct tctgcagccg ctgctgaagc tgctacggag 480
gcccaggtaa aggctaatgc tgattcgatt atcacgaaga ggactgcgat tgctgaggct 540
caagctgcgg cagaagctca agttaaggcg gcaatcgcta gaaaggcggc agcgaatttt 600
ttggctaagg ctcaaatagc ggctgccgcg gaatccgagg ccacgaaact cgcggccgaa 660
gccacagtgg cattaagtaa cgccgaagtc gccgtgaacc aggctagaaa cgcacaggca 720
accgcctcga ctcaagcttc cgcagctgtt agggtagatt ctcaagcagc gaacgctgaa 780
gcagccgctg tagcacaagc cgaaactctc ttggttacgg cagaagccat cgcagctgca 840
gaggctgagg ctgcgagcaa agccgcctca tttgcaaaaa agatcgtcga tgagaagaaa 900
atacatgtag aaaagttgga ataa 924
<210> 93
<211> 951
<212> DNA
<213> Apis cerana
<400> 93
ggcgtcgagg aattcaagtc ctcgacaacc gaggaggtga tcggcaaaaa cttagaagtc 60
gacctattga aaaatgtgga tactagcgcg aaacgaagag agaatggcgc cccagtgctc 120
ggcaagaacg tattcaaatc cctggagaac atcaaggcgt cggcgggcgc ggatgccaaa 180
gcatcagccg tggtgaaagc gtccgctctg gctcttgcag aagcctattt gcgagcgtct 240
gcattgtctg ccgccgcttc agccaaggca gccgctgccc tgaagaatgc gcaacaagcg 300
caattaatcg cccaggaaaa ggctttggcc gcgttgaaag ctcagtccga ggaagaggca 360
gcttctgctc gtgcgaacgc agcagccgct gcaacacagt cagcagtgga acgcgctcaa 420
gcctcctcca gaacagcaac ggccgcccaa aacgtagcca gcaacttgca gaaacggacc 480
agcaccaagg ccgcggctga agccgctgct accctcagac aattacagga tgcggaacaa 540
accaaatgga gtgccaacgc tgctttggaa gtctccgctg ctgcaactgc cgcagaaacg 600
aagaccactg cctcctcgga ggccgctagc gccgccgcca aaaaggcggc cgcgatagct 660
tctgacgcgg atggcgcaga aaagtcggca tctaccgaag cacaatcagc tgcgaagatc 720
gaaagtgtgg cagccgccga aggatccgcc aactcggcct ccgaggactc ccaggccgcg 780
caattggaag cttccaccgc ggcgagagcc aacgtggcca cagctatcgg ggatggagcg 840
attttaggac ttggacagga cgtgggtgcc gcggctcagt tgcttgcaca ggcgaaggca 900
ttggccgaag ttagctcgaa atccgaaaat attgaggata aaaaattttg a 951
<210> 94
<211> 1008
<212> DNA
<213> Apis cerana
<400> 94
atgcagatcc caacgtttgt cgtcgtatgc ttgctcacat cgggcttggt gcacgcaggc 60
gtcgaggaat tcaagtcctc gacaaccgag gaggtgatcg gcaaaaactt agaagtcgac 120
ctattgaaaa atgtggatac tagcgcgaaa cgaagagaga atggcgcccc agtgctcggc 180
aagaacgtat tcaaatccct ggagaacatc aaggcgtcgg cgggcgcgga tgccaaagca 240
tcagccgtgg tgaaagcgtc cgctctggct cttgcagaag cctatttgcg agcgtctgca 300
ttgtctgccg ccgcttcagc caaggcagcc gctgccctga agaatgcgca acaagcgcaa 360
ttaatcgccc aggaaaaggc tttggccgcg ttgaaagctc agtccgagga agaggcagct 420
tctgctcgtg cgaacgcagc agccgctgca acacagtcag cagtggaacg cgctcaagcc 480
tcctccagaa cagcaacggc cgcccaaaac gtagccagca acttgcagaa acggaccagc 540
accaaggccg cggctgaagc cgctgctacc ctcagacaat tacaggatgc ggaacaaacc 600
aaatggagtg ccaacgctgc tttggaagtc tccgctgctg caactgccgc agaaacgaag 660
accactgcct cctcggaggc cgctagcgcc gccgccaaaa aggcggccgc gatagcttct 720
gacgcggatg gcgcagaaaa gtcggcatct accgaagcac aatcagctgc gaagatcgaa 780
agtgtggcag ccgccgaagg atccgccaac tcggcctccg aggactccca ggccgcgcaa 840
ttggaagctt ccaccgcggc gagagccaac gtggccacag ctatcgggga tggagcgatt 900
ttaggacttg gacaggacgt gggtgccgcg gctcagttgc ttgcacaggc gaaggcattg 960
gccgaagtta gctcgaaatc cgaaaatatt gaggataaaa aattttga 1008
<210> 95
<211> 963
<212> DNA
<213> Apis cerana
<400> 95
gcaagcgaag aggtggagac acggggcaag accaagacct cgacagtggt gaaaagcgag 60
aaagtggaag tcgttcccgc taaggatgaa cttaaattaa cgagcgagcc catccttgga 120
agaagagtgg gaactggagc atccgaggtg gcatctagca gcggtgaaat catcgcaata 180
agtcttggaa cagggcaggc agcggcagaa tctcaggccg tggccgcctc gcaatccaaa 240
tcggcagcga gcgccgccat aagcgcaagc gagcttgcca acaaagttgc tgctctagtt 300
gttggcgcga ctgcggcgca ggcgagagcg gccgccgcct cctcaggcgc gttgaaggcc 360
agcttggcga ccgaagaatc ggcggaagag gccgaggcgg ccgtggctgt cgccaaggct 420
gccgcggaaa aggccgaatc cctggcgaga aatctcgcgt cggcgagcgc tcgtgcggct 480
atctcgtcgg aaagtgcgaa cgaattggct caagctgaga gcgcggcagc ggccgaagcg 540
caggccaaga cagccgccgc cgccaaagca gcggaaatcg cccttaaggt cgctgagata 600
gcggtgaaag cggaagcaga cgcggcagct gccgccgtgg cagctgcaaa ggcaagggcc 660
gtagcagacg cggccgctgc ccgtgctgca gccgtgaacg ccatcgccaa ggcggaagag 720
gaggcctcgg cccaagcaga gaacaccgcc ggtgtttcgc aagctgccgc ctccgccgcg 780
gcggaatcgc gagccgctgc agcagccgcc gctgctactt cggagacagc ggctgaagct 840
ggcccgttag caggggagct gaaaccacca caatggaaac ggattcctgt taagaaggaa 900
gagtggaaaa catcaacgaa ggaagaatgg aaaacgacga atgaagaatg ggaggtgaag 960
taa 963
<210> 96
<211> 1020
<212> DNA
<213> Apis cerana
<400> 96
atgaagatcc catccatact cgcggtttcc ctgctgatct ggggtttggc aagcggcgca 60
agcgaagagg tggagacacg gggcaagacc aagacctcga cagtggtgaa aagcgagaaa 120
gtggaagtcg ttcccgctaa ggatgaactt aaattaacga gcgagcccat ccttggaaga 180
agagtgggaa ctggagcatc cgaggtggca tctagcagcg gtgaaatcat cgcaataagt 240
cttggaacag ggcaggcagc ggcagaatct caggccgtgg ccgcctcgca atccaaatcg 300
gcagcgagcg ccgccataag cgcaagcgag cttgccaaca aagttgctgc tctagttgtt 360
ggcgcgactg cggcgcaggc gagagcggcc gccgcctcct caggcgcgtt gaaggccagc 420
ttggcgaccg aagaatcggc ggaagaggcc gaggcggccg tggctgtcgc caaggctgcc 480
gcggaaaagg ccgaatccct ggcgagaaat ctcgcgtcgg cgagcgctcg tgcggctatc 540
tcgtcggaaa gtgcgaacga attggctcaa gctgagagcg cggcagcggc cgaagcgcag 600
gccaagacag ccgccgccgc caaagcagcg gaaatcgccc ttaaggtcgc tgagatagcg 660
gtgaaagcgg aagcagacgc ggcagctgcc gccgtggcag ctgcaaaggc aagggccgta 720
gcagacgcgg ccgctgcccg tgctgcagcc gtgaacgcca tcgccaaggc ggaagaggag 780
gcctcggccc aagcagagaa caccgccggt gtttcgcaag ctgccgcctc cgccgcggcg 840
gaatcgcgag ccgctgcagc agccgccgct gctacttcgg agacagcggc tgaagctggc 900
ccgttagcag gggagctgaa accaccacaa tggaaacgga ttcctgttaa gaaggaagag 960
tggaaaacat caacgaagga agaatggaaa acgacgaatg aagaatggga ggtgaagtaa 1020
<210> 97
<211> 562
<212> PRT
<213> Mallada signata
<400> 97
Ala Val Leu Ile Ser Gly Ser Ala Ala Gly Ala Ser Ser His Asn Ala
1 5 10 15
Ala Gly Ala Ala Ala Ala Ala Arg Ala Ala Leu Gly Ala Ser Gly Ala
20 25 30
Ala Gly Leu Gly Ala Ala Ser Gly Ala Ala Arg Arg Asn Val Ala Val
35 40 45
Gly Ala Asn Gly Ala Ala Ala Ala Ser Ala Ala Ala Ala Ala Ala Arg
50 55 60
Arg Ala Gly Ala Ile Gly Leu Asn Gly Ala Ala Gly Ala Asn Val Ala
65 70 75 80
Val Ala Gly Gly Lys Lys Gly Gly Ala Ala Gly Leu Asn Ala Gly Ala
85 90 95
Gly Ala Ser Leu Val Ser Ala Ala Ala Arg Arg Asn Gly Ala Leu Gly
100 105 110
Leu Asn Gly Ala Ala Gly Ala Asn Leu Ala Ala Ala Gly Gly Lys Lys
115 120 125
Gly Gly Ala Ile Gly Leu Asn Ala Gly Ala Ser Ala Asn Val Gly Ala
130 135 140
Ala Ala Ala Lys Lys Asn Gly Ala Ile Gly Leu Asn Ser Ala Ala Ser
145 150 155 160
Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Gly Gly Ala Ile Gly Leu
165 170 175
Asn Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser
180 185 190
Gly Ala Val Gly Leu Asn Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala
195 200 205
Ala Ala Lys Lys Ser Gly Ala Val Ala Ala Asn Ser Ala Ala Ser Ala
210 215 220
Asn Ala Ala Ala Ala Ala Gln Lys Lys Ala Ala Ala Asp Ala Ala Asn
225 230 235 240
Ala Ala Ala Ser Glu Ser Ala Ala Ala Ala Ala Ala Lys Lys Ala Ala
245 250 255
Ala Val Ala Glu Asn Ala Ala Ala Thr Ala Asn Ala Ala Ser Ala Leu
260 265 270
Arg Lys Asn Ala Leu Ala Ile Ala Ser Asp Ala Ala Ala Val Arg Ala
275 280 285
Asp Ala Ala Ala Ala Ala Ala Asp Asp Ala Ala Lys Ala Asn Asn Ala
290 295 300
Ala Ser Arg Gly Ser Asp Gly Leu Thr Ala Arg Ala Asn Ala Ala Thr
305 310 315 320
Leu Ala Ser Asp Ala Ala Arg Arg Ala Ser Asn Ala Ala Thr Ala Ala
325 330 335
Ser Asp Ala Ala Thr Asp Arg Leu Asn Ala Ala Thr Ala Ala Ser Asn
340 345 350
Ala Ala Thr Ala Arg Ala Asn Ala Ala Thr Arg Ala Asp Asp Ala Ala
355 360 365
Thr Asp Ala Asp Asn Ala Ala Ser Lys Ala Ser Asp Val Ser Ala Ile
370 375 380
Glu Ala Asp Asn Ala Ala Arg Ala Ala Asp Ala Asp Ala Ile Ala Thr
385 390 395 400
Asn Arg Ala Ala Glu Ala Ser Asp Ala Ala Ala Ile Ala Ala Asp Ala
405 410 415
Ala Ala Asn Ala Ala Asp Ala Ala Ala Gln Cys Asn Asn Lys Val Ala
420 425 430
Arg Val Ser Asp Ala Leu Ala Leu Ala Ala Asn Ala Ala Ala Arg Gly
435 440 445
Ser Asp Ala Ala Ala Glu Ala Gln Asp Ala Val Ala Arg Ala Ser Asp
450 455 460
Ala Ala Ala Ala Gln Ala Asp Gly Val Ala Ile Ala Val Asn Gly Ala
465 470 475 480
Thr Ala Arg Asp Ser Ala Ile Glu Ala Ala Ala Thr Ala Gly Ala Ala
485 490 495
Gln Ala Lys Ala Ala Gly Arg Ala Gly Ala Ala Ala Ala Gly Leu Arg
500 505 510
Ala Gly Ala Ala Arg Gly Ala Ala Ala Gly Ser Ala Arg Gly Leu Ala
515 520 525
Gly Gly Leu Ala Ala Gly Ser Asn Ala Gly Ile Ala Ala Gly Ala Ala
530 535 540
Ser Gly Leu Ala Arg Gly Ala Ala Ala Glu Val Cys Ala Ala Arg Ile
545 550 555 560
Ala Leu
<210> 98
<211> 588
<212> PRT
<213> Mallada signata
<400> 98
Met Ala Ala Ser Asn Lys Ile Ile Phe Ser Phe Leu Ala Ile Val Leu
1 5 10 15
Leu Gln Leu Ala Thr His Cys Ser Ser Thr Ala Val Leu Ile Ser Gly
20 25 30
Ser Ala Ala Gly Ala Ser Ser His Asn Ala Ala Gly Ala Ala Ala Ala
35 40 45
Ala Arg Ala Ala Leu Gly Ala Ser Gly Ala Ala Gly Leu Gly Ala Ala
50 55 60
Ser Gly Ala Ala Arg Arg Asn Val Ala Val Gly Ala Asn Gly Ala Ala
65 70 75 80
Ala Ala Ser Ala Ala Ala Ala Ala Ala Arg Arg Ala Gly Ala Ile Gly
85 90 95
Leu Asn Gly Ala Ala Gly Ala Asn Val Ala Val Ala Gly Gly Lys Lys
100 105 110
Gly Gly Ala Ala Gly Leu Asn Ala Gly Ala Gly Ala Ser Leu Val Ser
115 120 125
Ala Ala Ala Arg Arg Asn Gly Ala Leu Gly Leu Asn Gly Ala Ala Gly
130 135 140
Ala Asn Leu Ala Ala Ala Gly Gly Lys Lys Gly Gly Ala Ile Gly Leu
145 150 155 160
Asn Ala Gly Ala Ser Ala Asn Val Gly Ala Ala Ala Ala Lys Lys Asn
165 170 175
Gly Ala Ile Gly Leu Asn Ser Ala Ala Ser Ala Asn Ala Ala Ala Ala
180 185 190
Ala Ala Lys Lys Gly Gly Ala Ile Gly Leu Asn Ala Gly Ala Ser Ala
195 200 205
Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser Gly Ala Val Gly Leu Asn
210 215 220
Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser Gly
225 230 235 240
Ala Val Ala Ala Asn Ser Ala Ala Ser Ala Asn Ala Ala Ala Ala Ala
245 250 255
Gln Lys Lys Ala Ala Ala Asp Ala Ala Asn Ala Ala Ala Ser Glu Ser
260 265 270
Ala Ala Ala Ala Ala Ala Lys Lys Ala Ala Ala Val Ala Glu Asn Ala
275 280 285
Ala Ala Thr Ala Asn Ala Ala Ser Ala Leu Arg Lys Asn Ala Leu Ala
290 295 300
Ile Ala Ser Asp Ala Ala Ala Val Arg Ala Asp Ala Ala Ala Ala Ala
305 310 315 320
Ala Asp Asp Ala Ala Lys Ala Asn Asn Ala Ala Ser Arg Gly Ser Asp
325 330 335
Gly Leu Thr Ala Arg Ala Asn Ala Ala Thr Leu Ala Ser Asp Ala Ala
340 345 350
Arg Arg Ala Ser Asn Ala Ala Thr Ala Ala Ser Asp Ala Ala Thr Asp
355 360 365
Arg Leu Asn Ala Ala Thr Ala Ala Ser Asn Ala Ala Thr Ala Arg Ala
370 375 380
Asn Ala Ala Thr Arg Ala Asp Asp Ala Ala Thr Asp Ala Asp Asn Ala
385 390 395 400
Ala Ser Lys Ala Ser Asp Val Ser Ala Ile Glu Ala Asp Asn Ala Ala
405 410 415
Arg Ala Ala Asp Ala Asp Ala Ile Ala Thr Asn Arg Ala Ala Glu Ala
420 425 430
Ser Asp Ala Ala Ala Ile Ala Ala Asp Ala Ala Ala Asn Ala Ala Asp
435 440 445
Ala Ala Ala Gln Cys Asn Asn Lys Val Ala Arg Val Ser Asp Ala Leu
450 455 460
Ala Leu Ala Ala Asn Ala Ala Ala Arg Gly Ser Asp Ala Ala Ala Glu
465 470 475 480
Ala Gln Asp Ala Val Ala Arg Ala Ser Asp Ala Ala Ala Ala Gln Ala
485 490 495
Asp Gly Val Ala Ile Ala Val Asn Gly Ala Thr Ala Arg Asp Ser Ala
500 505 510
Ile Glu Ala Ala Ala Thr Ala Gly Ala Ala Gln Ala Lys Ala Ala Gly
515 520 525
Arg Ala Gly Ala Ala Ala Ala Gly Leu Arg Ala Gly Ala Ala Arg Gly
530 535 540
Ala Ala Ala Gly Ser Ala Arg Gly Leu Ala Gly Gly Leu Ala Ala Gly
545 550 555 560
Ser Asn Ala Gly Ile Ala Ala Gly Ala Ala Ser Gly Leu Ala Arg Gly
565 570 575
Ala Ala Ala Glu Val Cys Ala Ala Arg Ile Ala Leu
580 585
<210> 99
<211> 1689
<212> DNA
<213> Mallada signata
<400> 99
gctgtattga tttctggttc ggctgctggt gcttcctcac acaatgctgc tggtgcagct 60
gcagcagcca gagctgcctt aggcgcttct ggggctgcag gtttaggtgc tgcatctggt 120
gctgcaagaa gaaacgtagc agttggtgct aacggtgccg ccgccgctag tgctgcagct 180
gcagctgcca gacgagctgg cgctattggc ctaaatggag cagctggagc taatgtagct 240
gtcgctggtg gcaaaaaagg aggtgctgct ggattaaatg ctggcgctgg tgcttcttta 300
gtatctgcag ctgcaagacg aaatggagcc cttggactta acggtgcagc tggagcaaat 360
ctcgcagcag ctggtggcaa aaaaggaggt gctattggat taaacgctgg agcatcagcc 420
aatgttggtg ccgctgctgc caagaaaaat ggagccatag gacttaactc agctgcttca 480
gctaatgctg ccgctgccgc tgctaaaaaa ggtggagcca ttggattgaa tgctggagct 540
tcagcaaatg ctgctgctgc cgctgccaag aagagtggag ctgttggatt aaatgctgga 600
gcttctgcta acgctgctgc tgctgctgcc aagaaaagtg gagctgttgc tgccaattcc 660
gctgcttcag caaatgcagc tgctgctgca caaaagaaag ccgctgctga tgccgcaaat 720
gctgctgctt ctgaaagtgc tgctgctgct gcagccaaga aagccgccgc tgttgctgaa 780
aatgcagctg ccaccgccaa tgccgcttca gctttacgta aaaatgcatt agccattgcc 840
agtgatgcag cagctgtccg tgctgatgcc gctgccgccg ccgctgacga tgctgctaaa 900
gctaacaacg ctgcttcccg tggaagtgat ggtttaactg cccgcgccaa tgccgccact 960
ttagccagtg atgctgcccg tagagctagc aatgcagcaa cagctgccag cgatgctgcc 1020
actgaccgat tgaacgccgc caccgctgct agcaacgctg ccactgctcg tgcaaatgcc 1080
gccacacgtg ccgatgatgc cgccactgat gccgacaatg ctgcttcaaa ggccagtgat 1140
gtatcagcta ttgaagccga caacgctgca cgagctgctg atgctgatgc tatcgctacc 1200
aaccgtgccg ctgaagcaag cgatgctgct gctattgccg ctgatgccgc tgccaatgct 1260
gctgatgccg ctgcccaatg taataacaaa gttgcccgag taagtgatgc cttagctctc 1320
gccgctaatg ctgctgcccg aggatctgat gccgccgctg aagctcaaga tgctgttgcc 1380
agagcaagtg acgctgccgc tgcccaagct gatggtgttg ccattgccgt aaatggagct 1440
actgcgagag actcagcaat tgaagccgct gctactgctg gagctgccca agctaaagcc 1500
gctggacgtg ctggagctgc tgcagctggt ttaagagctg gtgccgctag aggtgctgcc 1560
gctggtagtg cccgcggtct agctggagga ttagctgcag gttccaatgc tggaatcgcg 1620
gctggtgcag cttctggatt agcaagaggc gcagctgctg aagtttgcgc agctagaata 1680
gcattgtaa 1689
<210> 100
<211> 1767
<212> DNA
<213> Mallada signata
<400> 100
atggcagcgt cgaacaaaat catcttcagc tttttagcta ttgttctatt acaacttgcc 60
acacactgtt catcaacagc tgtattgatt tctggttcgg ctgctggtgc ttcctcacac 120
aatgctgctg gtgcagctgc agcagccaga gctgccttag gcgcttctgg ggctgcaggt 180
ttaggtgctg catctggtgc tgcaagaaga aacgtagcag ttggtgctaa cggtgccgcc 240
gccgctagtg ctgcagctgc agctgccaga cgagctggcg ctattggcct aaatggagca 300
gctggagcta atgtagctgt cgctggtggc aaaaaaggag gtgctgctgg attaaatgct 360
ggcgctggtg cttctttagt atctgcagct gcaagacgaa atggagccct tggacttaac 420
ggtgcagctg gagcaaatct cgcagcagct ggtggcaaaa aaggaggtgc tattggatta 480
aacgctggag catcagccaa tgttggtgcc gctgctgcca agaaaaatgg agccatagga 540
cttaactcag ctgcttcagc taatgctgcc gctgccgctg ctaaaaaagg tggagccatt 600
ggattgaatg ctggagcttc agcaaatgct gctgctgccg ctgccaagaa gagtggagct 660
gttggattaa atgctggagc ttctgctaac gctgctgctg ctgctgccaa gaaaagtgga 720
gctgttgctg ccaattccgc tgcttcagca aatgcagctg ctgctgcaca aaagaaagcc 780
gctgctgatg ccgcaaatgc tgctgcttct gaaagtgctg ctgctgctgc agccaagaaa 840
gccgccgctg ttgctgaaaa tgcagctgcc accgccaatg ccgcttcagc tttacgtaaa 900
aatgcattag ccattgccag tgatgcagca gctgtccgtg ctgatgccgc tgccgccgcc 960
gctgacgatg ctgctaaagc taacaacgct gcttcccgtg gaagtgatgg tttaactgcc 1020
cgcgccaatg ccgccacttt agccagtgat gctgcccgta gagctagcaa tgcagcaaca 1080
gctgccagcg atgctgccac tgaccgattg aacgccgcca ccgctgctag caacgctgcc 1140
actgctcgtg caaatgccgc cacacgtgcc gatgatgccg ccactgatgc cgacaatgct 1200
gcttcaaagg ccagtgatgt atcagctatt gaagccgaca acgctgcacg agctgctgat 1260
gctgatgcta tcgctaccaa ccgtgccgct gaagcaagcg atgctgctgc tattgccgct 1320
gatgccgctg ccaatgctgc tgatgccgct gcccaatgta ataacaaagt tgcccgagta 1380
agtgatgcct tagctctcgc cgctaatgct gctgcccgag gatctgatgc cgccgctgaa 1440
gctcaagatg ctgttgccag agcaagtgac gctgccgctg cccaagctga tggtgttgcc 1500
attgccgtaa atggagctac tgcgagagac tcagcaattg aagccgctgc tactgctgga 1560
gctgcccaag ctaaagccgc tggacgtgct ggagctgctg cagctggttt aagagctggt 1620
gccgctagag gtgctgccgc tggtagtgcc cgcggtctag ctggaggatt agctgcaggt 1680
tccaatgctg gaatcgcggc tggtgcagct tctggattag caagaggcgc agctgctgaa 1740
gtttgcgcag ctagaatagc attgtaa 1767
<210> 101
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 101
ggaattctca tgagtttgga ggggccgggc aactcg 36
<210> 102
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 102
cggcggatcc ttattaaaat acgttgctct tcaagt 36
<210> 103
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 103
ggaattctca tgagccgcgt gattaatcac gagtccctg 39
<210> 104
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 104
cggcggatcc ttattattcc aactttgcta catgtatttt c 41
<210> 105
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 105
ggaattccca tgggcgtcga ggaattcaag tcctcg 36
<210> 106
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 106
cggcagatct ttattaaaat tttttatcct caata 35
<210> 107
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 107
ggaattccca tggcaaggga agaggtggag acacgg 36
<210> 108
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide primer
<400> 108
cggcggatcc ttattacttc acctcccatt cttcattc 38
Claims (38)
- i) 하나 이상의 실크 단백질을 생성하는 세포를 용해시키는 단계,
ii) 실크 단백질을 계면활성제 또는 이온성 액체와 접촉시켜 실크 단백질을 가용화시키는 단계, 및
iii) 실크 단백질을 농축시켜 실크 도프(dope)를 생성하는 단계
를 포함하는 실크 도프의 제조 방법으로서, 상기 하나 이상의 실크 단백질은 코일드 코일(coiled-coil) 구조를 포함하는 삼차 구조를 형성할 수 있는 것인 제조 방법. - 제1항에 있어서, 실크 단백질을
a) 계면활성제를 침전시키는 화합물을 첨가함으로써 용액 중 계면활성제의 양을 감소시키는 단계, 및
b) 단계 a)에서 형성된 침전물로부터 실크 단백질을 포함하는 용액을 분리하여 실크 도프를 생성하는 단계
에 의해 농축시키는 것인 제조 방법. - 제1항에 있어서, 계면활성제를 침전시키는 화합물이 염 또는 탄수화물, 또는 이들의 2종 이상의 조합인 제조 방법.
- 제3항에 있어서, 염이 칼륨 염 또는 나트륨 염인 제조 방법.
- 제1항에 있어서, 실크 단백질을 여과에 의해 농축시키는 것인 제조 방법.
- 제5항에 있어서, 실크 단백질을 막 여과에 의해 농축시키는 것인 제조 방법.
- 제6항에 있어서, 막 여과가 접선 유동 여과인 제조 방법.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 실크 도프 중 실크 단백질의 농도를 증가시키는 단계를 추가로 포함하는 제조 방법.
- 제8항에 있어서, 실크 도프를 탈수(dehydrating) 용액에 대해 투석하는 단계를 포함하는 제조 방법.
- 제9항에 있어서, 탈수 용액이 흡습성 중합체를 포함하는 것인 제조 방법.
- 제10항에 있어서, 흡습성 중합체가 폴리에틸렌 글리콜, 아밀라제(amylase) 및 세리신(sericin), 또는 이들의 2종 이상의 조합으로 구성된 군으로부터 선택되는 것인 제조 방법.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 실크 도프가 약 0.5 중량/부피% 이상의 실크 단백질을 포함하는 것인 제조 방법.
- 제12항에 있어서, 실크 도프가 약 0.5 중량/부피% 내지 약 15 중량/부피%의 실크 단백질을 포함하는 것인 제조 방법.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 세포가 박테리아 세포, 효모 세포, 곤충 세포, 식물 세포 또는 동물 세포, 또는 이들의 2종 이상의 조합인 제조 방법.
- 제14항에 있어서, 세포가 박테리아 세포인 제조 방법.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 단계 i)이 용해된 세포로부터 봉입체를 단리하는 것을 추가로 포함하는 것인 제조 방법.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 단계 i) 전에 세포를 배양하는 단계를 추가로 포함하는 제조 방법.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 코일드 코일 구조를 포함하는 삼차 구조를 형성할 수 있는 실크 단백질의 일부가 10개 카피 이상의 헵타드(heptad) 서열 abcdefg를 포함하고, 이때 위치 a 및 d의 아미노산의 25% 이상이 알라닌 잔기인 제조 방법.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 실크 단백질이
a) 서열 번호 1, 3, 5, 7, 17, 19, 21, 23, 33, 35, 37, 39, 49, 51, 53, 55, 65, 67, 69, 71, 81, 83, 85, 87 또는 97 중 어느 하나에 제공된 아미노산 서열,
b) 서열 번호 1, 3, 5, 7, 17, 19, 21, 23, 33, 35, 37, 39, 49, 51, 53, 55, 65, 67, 69, 71, 81, 83, 85, 87 또는 97 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및
c) a) 또는 b)의 생물학적 활성 단편
으로부터 선택되는 서열을 포함하는 것인 제조 방법. - 제1항 내지 제19항 중 어느 한 항에 있어서, 실크 단백질이
a) 서열 번호 1, 17, 33, 49, 65 또는 81 중 어느 하나에 제공된 아미노산 서열,
b) 서열 번호 1, 17, 33, 49, 65 또는 81 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및
c) a) 또는 b)의 생물학적 활성 단편
을 포함하는 제1 실크 단백질;
d) 서열 번호 3, 19, 35, 51, 67 또는 83 중 어느 하나에 제공된 아미노산 서열,
e) 서열 번호 3, 19, 35, 51, 67 또는 83 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및
f) d) 또는 e)의 생물학적 활성 단편
을 포함하는 제2 실크 단백질;
g) 서열 번호 5, 21, 37, 53, 69 또는 85 중 어느 하나에 제공된 아미노산 서열,
h) 서열 번호 5, 21, 37, 53, 69 또는 85 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및
i) g) 또는 h)의 생물학적 활성 단편
을 포함하는 제3 실크 단백질; 및/또는
j) 서열 번호 7, 23, 39, 55, 71 또는 87 중 어느 하나에 제공된 아미노산 서열,
k) 서열 번호 7, 23, 39, 55, 71 또는 87 중 어느 하나 이상과 30% 이상 동일한 아미노산 서열, 및
l) j) 또는 k)의 생물학적 활성 단편
을 포함하는 제4 실크 단백질을 포함하는 것인 제조 방법. - 제20항에 있어서, 제1 실크 단백질, 제2 실크 단백질, 제3 실크 단백질 및/또는 제4 실크 단백질이 동일한 세포에 의해 생성되는 것인 제조 방법.
- 제20항에 있어서, 제1 실크 단백질, 제2 실크 단백질, 제3 실크 단백질 및/또는 제4 실크 단백질이 상이한 세포에 의해 생성되는 것인 제조 방법.
- 제20항 내지 제22항 중 어느 한 항에 있어서, 단계 ii)가 대략 등몰량의 제1 실크 단백질, 제2 실크 단백질, 제3 실크 단백질 및 제4 실크 단백질을 포함하는 것인 제조 방법.
- 제1항 내지 제23항 중 어느 한 항에 있어서, 계면활성제가 음이온성 계면활성제인 제조 방법.
- 제24항에 있어서, 음이온성 계면활성제가 나트륨 도데실 설페이트(SDS), 암모늄 라우릴 설페이트 또는 다른 알킬 설페이트 염, 나트륨 1-옥탄설포네이트 일수화물, 나트륨 라우로일 사르코시네이트, 나트륨 라우릴 에테르 설페이트(SLES), 나트륨 타우로데옥시콜레이트 수화물, 알킬 벤젠 설포네이트, 또는 이들의 2종 이상의 조합인 제조 방법.
- 제1항 내지 제23항 중 어느 한 항에 있어서, 이온성 액체가
i) 클로라이드, 브로마이드, 요오다이드, 티오시아네이트, 아세테이트, C1-C4-알킬설페이트, 메탄설포네이트, 토실레이트, C1-C4-디알킬포스페이트, 하이드로젠설페이트 및 테트라클로로알루미네이트로부터 선택되는 음이온, 및
ii) 1,3-C1-C4-디알킬이미다졸륨, 3-클로로피리디늄, 4-디메틸아미노피리디늄, 2-에틸-4-아미노피리디늄, 2-메틸피리디늄, 2-에틸피리디늄, 2-에틸-6-메틸피리디늄, 퀴놀리늄, 이소퀴놀리늄, 피리디늄, 1-C1-C4-알킬이미다졸륨, 1-메틸이미다졸륨, 1,2-디메틸이미다졸륨, 1-n-부틸-이미다졸륨, 1,4,5-트리메틸이미다졸륨, 1,4-디메틸이미다졸륨, 이미다졸륨, 2-메틸이미다졸륨, 1-부틸-2-메틸이미다졸륨, 4-메틸이미다졸륨, 1-(2'-아미노에틸)이미다졸륨, 1-비닐이미다졸륨, 2-에틸이미다졸륨 및 벤조트리아졸륨으로부터 선택되는 양이온
을 포함하는 것인 제조 방법. - i) 하나 이상의 실크 단백질을 생성하는 세포 배양물 또는 무세포 발현 시스템으로부터 상청액을 얻는 단계,
ii) 실크 단백질을 계면활성제 또는 이온성 액체와 접촉시켜 실크 단백질을 가용화시키는 단계, 및
iii) 실크 단백질을 농축시켜 실크 도프를 생성하는 단계
를 포함하는 실크 도프의 제조 방법으로서, 상기 하나 이상의 실크 단백질은 코일드 코일 구조를 포함하는 삼차 구조를 형성할 수 있는 것인 제조 방법. - 제27항에 있어서, 단계 i)이 상청액으로부터의 실크 단백질의 농도를 증가시키는 것을 추가로 포함하는 것인 제조 방법.
- 제28항에 있어서, 실크 단백질의 농도를, 상기 상청액을 상기 실크 단백질을 침전시키는 물질과 접촉시킴으로써 증가시키는 것인 제조 방법.
- 제1항 내지 제29항 중 어느 한 항의 제조 방법에 의해 제조된 실크 도프를 압출 및/또는 연신하는 단계를 포함하는, 실크 섬유의 제조 방법.
- 제30항에 있어서, 압출이 실크 도프를 약 5 ㎛ 내지 약 500 ㎛의 모세관에 통과시키는 것을 포함하는 것인 제조 방법.
- 제30항 또는 제31항에 있어서, 실크 도프를 알코올을 포함하는 용액 내로 압출하는 것인 제조 방법.
- 제32항에 있어서, 알코올이 메탄올이고, 용액 중 메탄올의 농도가 약 40 부피/부피% 내지 약 80 부피/부피%인 제조 방법.
- 제1항 내지 제29항 중 어느 한 항의 제조 방법에 의해 제조된 실크 도프를 캐스트 성형(casting)하는 단계를 포함하는, 실크 필름의 제조 방법.
- 제1항 내지 제29항 중 어느 한 항의 제조 방법에 의해 제조된 실크 도프.
- 제30항 내지 제33항 중 어느 한 항의 제조 방법에 의해 제조된 실크 섬유.
- 제34항의 제조 방법에 의해 제조된 실크 필름.
- 제36항의 실크 섬유 및/또는 제37항의 실크 필름을 포함하는 제품.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US23715609P | 2009-08-26 | 2009-08-26 | |
US61/237,156 | 2009-08-26 | ||
US31581210P | 2010-03-19 | 2010-03-19 | |
US61/315,812 | 2010-03-19 | ||
PCT/AU2010/001095 WO2011022771A1 (en) | 2009-08-26 | 2010-08-25 | Processes for producing silk dope |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177011942A Division KR20170054542A (ko) | 2009-08-26 | 2010-08-25 | 실크 도프의 제조 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120076346A true KR20120076346A (ko) | 2012-07-09 |
KR101932771B1 KR101932771B1 (ko) | 2018-12-28 |
Family
ID=43627077
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127007759A KR101932771B1 (ko) | 2009-08-26 | 2010-08-25 | 실크 도프의 제조 방법 |
KR1020177011942A KR20170054542A (ko) | 2009-08-26 | 2010-08-25 | 실크 도프의 제조 방법 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177011942A KR20170054542A (ko) | 2009-08-26 | 2010-08-25 | 실크 도프의 제조 방법 |
Country Status (15)
Country | Link |
---|---|
US (1) | US8674077B2 (ko) |
EP (1) | EP2475677B1 (ko) |
JP (1) | JP5980679B2 (ko) |
KR (2) | KR101932771B1 (ko) |
CN (1) | CN102812036B (ko) |
AU (1) | AU2010286333B2 (ko) |
BR (1) | BR112012004268B1 (ko) |
CA (1) | CA2771915C (ko) |
CL (1) | CL2012000500A1 (ko) |
EA (1) | EA201270304A1 (ko) |
IL (1) | IL218300A (ko) |
MX (1) | MX2012002400A (ko) |
SG (1) | SG178870A1 (ko) |
WO (1) | WO2011022771A1 (ko) |
ZA (1) | ZA201202163B (ko) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013071356A1 (en) * | 2011-11-16 | 2013-05-23 | Commonwealth Scientific And Industrial Research Organisation | Collagen-like silk genes |
WO2013142901A1 (en) | 2012-03-26 | 2013-10-03 | Commonwealth Scientific And Industrial Research Organisation | Silk polypeptides |
JP6450676B2 (ja) * | 2013-05-28 | 2019-01-09 | 国立研究開発法人農業・食品産業技術総合研究機構 | 蜂のシルク蛋白質の水溶液とその製造方法 |
CN113564927A (zh) | 2014-12-02 | 2021-10-29 | 丝绸医疗公司 | 丝性能服装和产品及其制备方法 |
JP6348853B2 (ja) * | 2015-01-26 | 2018-06-27 | 日本電信電話株式会社 | 細胞培養用基板 |
CA2992462A1 (en) | 2015-07-14 | 2017-01-19 | Silk Therapeutics, Inc. | Silk performance apparel and products and methods of preparing the same |
US20190001272A1 (en) * | 2015-12-18 | 2019-01-03 | Tufts University | Silk Solution Purification System, Concentrating System, and Methods Thereof |
JPWO2017110922A1 (ja) * | 2015-12-25 | 2018-10-18 | Spiber株式会社 | 高分子凝集体の製造方法 |
GB201708853D0 (en) * | 2017-06-02 | 2017-07-19 | Jellagen Pty Ltd | Method |
CN107326057A (zh) * | 2017-07-28 | 2017-11-07 | 浙江理工大学 | 一种利用离子液体和蛋白酶提取桑蚕丝丝素蛋白的方法 |
CN111712514A (zh) | 2017-09-27 | 2020-09-25 | 自然进化公司 | 丝涂布织物和产品及其制备方法 |
CN114213517B (zh) * | 2021-02-08 | 2024-07-09 | 复向丝泰医疗科技(苏州)有限公司 | 利用切向流超滤技术制备可控高浓度丝素蛋白溶液的方法 |
US11584784B2 (en) | 2021-05-21 | 2023-02-21 | Cambridge Crops, Inc. | Systems and methods for manufacturing a silk fibroin solution and powders containing silk fibroin |
US11864569B2 (en) | 2021-08-16 | 2024-01-09 | Cambridge Crops, Inc. | Systems and methods for improving the performance of cereal using a silk fibroin solution and powders containing silk fibroin |
TR2021019717A2 (tr) * | 2021-12-13 | 2022-01-21 | Atiye Degirmenci | Ari i̇peği̇ni̇n medi̇kal ve kozmeti̇k amaçla kullanimi |
CN115531594B (zh) * | 2022-10-19 | 2023-07-04 | 南通大学 | 一种糖尿病伤口愈合敷料及其制备方法 |
Family Cites Families (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3121241C2 (de) | 1980-05-28 | 1984-07-19 | Dainippon Ink And Chemicals, Inc., Tokio/Tokyo | Verfahren zum Herstellen eines Verbundkunststoffrohres aus thermoplastischem Harz |
US4943674A (en) | 1987-05-26 | 1990-07-24 | Calgene, Inc. | Fruit specific transcriptional factors |
US4766224A (en) * | 1985-08-19 | 1988-08-23 | International Minerals & Chemical Corp. | Purification and activation of proteins from insoluble inclusion bodies |
US4677196A (en) * | 1985-09-06 | 1987-06-30 | International Minerals & Chemical Corp. | Purification and activation of proteins from insoluble inclusion bodies |
GB8607679D0 (en) | 1986-03-27 | 1986-04-30 | Winter G P | Recombinant dna product |
JPH0723585B2 (ja) | 1989-11-06 | 1995-03-15 | 信越化学工業株式会社 | ウール処理剤 |
US5989894A (en) | 1990-04-20 | 1999-11-23 | University Of Wyoming | Isolated DNA coding for spider silk protein, a replicable vector and a transformed cell containing the DNA |
JPH08511426A (ja) | 1993-06-15 | 1996-12-03 | イー・アイ・デユポン・ドウ・ヌムール・アンド・カンパニー | 新規の組換え産生性クモシルクアナログ |
MX9704137A (es) | 1994-12-07 | 1997-09-30 | Novo Nordisk As | Polipeptidos de alergenicidad reducida. |
US5939288A (en) | 1995-06-07 | 1999-08-17 | Iowa State University Research Foundation, Inc. | Plant secretory signal peptides and nectarins |
RU2173134C2 (ru) | 1995-06-26 | 2001-09-10 | Ханс Шварцкопф ГмбХ унд Ко. КГ | Средство для обработки волос |
US6013250A (en) | 1995-06-28 | 2000-01-11 | L'oreal S. A. | Composition for treating hair against chemical and photo damage |
US6398821B1 (en) | 1996-12-23 | 2002-06-04 | The Procter & Gamble Company | Hair coloring compositions |
JP3545588B2 (ja) | 1997-03-24 | 2004-07-21 | 株式会社資生堂 | 毛髪化粧料 |
EP0920875A1 (en) | 1997-06-18 | 1999-06-09 | JAPAN as repr. by DIR. GENERAL of NATIONAL INST. OF SERICULTURAL & ENTOMOLOGICAL SCIENCE MINISTRY OF AGR, FORESTRY & FISHERI | Wound covering material containing silk fibroin and silk sericin as the main components and process for producing the same |
AU751880B2 (en) | 1997-06-25 | 2002-08-29 | Novozymes A/S | A modified polypeptide |
US6284246B1 (en) | 1997-07-30 | 2001-09-04 | The Procter & Gamble Co. | Modified polypeptides with high activity and reduced allergenicity |
FR2774588B1 (fr) | 1998-02-11 | 2000-05-05 | Oreal | Composition cosmetique ou dermatologique contenant au moins une proteine de soie d'arachnides naturelle, recombinante ou un analogue |
DE19848002A1 (de) | 1998-10-17 | 2000-04-20 | Goldschmidt Ag Th | Polypeptid-Polysiloxan-Copolymere |
JP2000139755A (ja) | 1998-11-12 | 2000-05-23 | Miki Tokushu Seishi Kk | あぶらとり紙及びその製造方法 |
JP2000328460A (ja) | 1999-05-24 | 2000-11-28 | Dow Corning Toray Silicone Co Ltd | 水系繊維処理剤および繊維の処理方法 |
US6620917B1 (en) * | 2000-01-20 | 2003-09-16 | The United States Of America As Represented By The Secretary Of The Army | Method for the purification and aqueous fiber spinning of spider silks and other structural proteins |
US6608242B1 (en) | 2000-05-25 | 2003-08-19 | E. I. Du Pont De Nemours And Company | Production of silk-like proteins in plants |
GB0108181D0 (en) | 2001-04-02 | 2001-05-23 | Xiros Plc | Silk-based fibre |
AU2002312426A1 (en) | 2001-06-06 | 2002-12-16 | University Of Wyoming | Expression of spider silk proteins in higher plants |
EP1427742A1 (en) | 2001-08-29 | 2004-06-16 | University of Wyoming | Spider silk protein encoding nucleic acids, polypeptides, antibodies and method of use thereof |
ITVR20010098A1 (it) | 2001-09-11 | 2003-03-11 | Consorzio Per Gli Studi Uni | Procedimento per l'ottenimento di idrogeli di fibroina di seta. |
US20050055051A1 (en) | 2001-09-13 | 2005-03-10 | Grafton R. Donald | High strength suture with silk trace |
US6902932B2 (en) | 2001-11-16 | 2005-06-07 | Tissue Regeneration, Inc. | Helically organized silk fibroin fiber bundles for matrices in tissue engineering |
EP1472394A1 (en) | 2002-01-09 | 2004-11-03 | E. I. du Pont de Nemours and Company | Polypeptide fibers and processes for making them |
AU2003202949A1 (en) | 2002-01-11 | 2003-07-30 | Ali Alwattari | Methods and apparatus for spinning spider silk protein |
WO2003102132A2 (en) | 2002-04-26 | 2003-12-11 | Genetech, Inc. | Non-affinity purification of proteins |
US7516525B2 (en) | 2002-06-13 | 2009-04-14 | Texas Tech University | Process for making chemical protective wipes and such wipes |
JP3772207B2 (ja) | 2002-06-19 | 2006-05-10 | 独立行政法人農業生物資源研究所 | 生分解性生体高分子材料、その製造方法、およびこの高分子材料からなる機能性素材 |
GB0218977D0 (en) | 2002-08-15 | 2002-09-25 | Univ York | Polypeptide |
US20040132978A1 (en) | 2002-11-12 | 2004-07-08 | Fahnestock Stephen R. | Method for purifying and recovering silk proteins in soluble form and uses thereof |
CN1732022A (zh) | 2002-12-30 | 2006-02-08 | 血管技术国际股份公司 | 含有丝的支架移植物 |
NO316350B1 (no) | 2003-02-07 | 2004-01-12 | Hiform As | Laminat og framgangsmåte for framstilling av et fiberarmert laminert motstandselement |
US7060260B2 (en) | 2003-02-20 | 2006-06-13 | E.I. Du Pont De Nemours And Company | Water-soluble silk proteins in compositions for skin care, hair care or hair coloring |
US7115388B2 (en) | 2003-03-14 | 2006-10-03 | National Institute Of Agrobiological Sciences | Production of functional polypeptides originating from silk protein and use thereof |
JP4357859B2 (ja) | 2003-03-24 | 2009-11-04 | トヨタ自動車株式会社 | 繊維複合樹脂品及びその製造方法 |
EP1613796B1 (en) * | 2003-04-10 | 2017-03-22 | Tufts University | Concentrated aqueous silk fibroin solution and use thereof |
DE10336509A1 (de) | 2003-08-08 | 2005-03-03 | Ledertech Gmbh | Verbundmaterial für thermisch formbare Schuhkomponenten auf organischer Faserbasis |
US20070082197A1 (en) | 2003-11-04 | 2007-04-12 | Ko Frank K | Electrospun carbon nanotube reinforced silk fibers |
US7314851B2 (en) | 2003-12-11 | 2008-01-01 | The Foundation for the Promotion of Supplementary Occupations and Related Techniques of her Majesty Queen Sirikit | Silk soap comprising sericin protein |
JP4815108B2 (ja) | 2003-12-26 | 2011-11-16 | イビデン株式会社 | ハニカム構造体 |
US20050161058A1 (en) | 2004-01-26 | 2005-07-28 | Israel Yerushalmy | Spider silk dental floss |
EP1609801A1 (en) * | 2004-06-25 | 2005-12-28 | Technische Universität München | Proteins of natural origin and materials made therefrom |
CN1648292A (zh) * | 2004-12-10 | 2005-08-03 | 富润集团有限公司 | 绢纺原料生物除油工艺 |
ES2403733T3 (es) * | 2005-10-05 | 2013-05-21 | Commonwealth Scientific And Industrial Research Organisation | Proteínas de seda |
-
2010
- 2010-08-25 MX MX2012002400A patent/MX2012002400A/es not_active Application Discontinuation
- 2010-08-25 KR KR1020127007759A patent/KR101932771B1/ko active IP Right Grant
- 2010-08-25 AU AU2010286333A patent/AU2010286333B2/en active Active
- 2010-08-25 CA CA2771915A patent/CA2771915C/en active Active
- 2010-08-25 JP JP2012525816A patent/JP5980679B2/ja active Active
- 2010-08-25 SG SG2012013074A patent/SG178870A1/en unknown
- 2010-08-25 EP EP10811020.6A patent/EP2475677B1/en active Active
- 2010-08-25 KR KR1020177011942A patent/KR20170054542A/ko not_active Application Discontinuation
- 2010-08-25 CN CN201080042791.4A patent/CN102812036B/zh active Active
- 2010-08-25 EA EA201270304A patent/EA201270304A1/ru unknown
- 2010-08-25 US US13/392,054 patent/US8674077B2/en active Active
- 2010-08-25 WO PCT/AU2010/001095 patent/WO2011022771A1/en active Application Filing
- 2010-08-25 BR BR112012004268-8A patent/BR112012004268B1/pt active IP Right Grant
-
2012
- 2012-02-23 IL IL218300A patent/IL218300A/en active IP Right Grant
- 2012-02-27 CL CL2012000500A patent/CL2012000500A1/es unknown
- 2012-03-23 ZA ZA2012/02163A patent/ZA201202163B/en unknown
Also Published As
Publication number | Publication date |
---|---|
IL218300A (en) | 2017-08-31 |
WO2011022771A1 (en) | 2011-03-03 |
BR112012004268A2 (pt) | 2016-02-16 |
SG178870A1 (en) | 2012-04-27 |
EP2475677A1 (en) | 2012-07-18 |
IL218300A0 (en) | 2012-04-30 |
BR112012004268B1 (pt) | 2021-03-02 |
CA2771915C (en) | 2020-03-10 |
EA201270304A1 (ru) | 2012-09-28 |
CN102812036B (zh) | 2016-08-03 |
CA2771915A1 (en) | 2011-03-03 |
KR20170054542A (ko) | 2017-05-17 |
JP5980679B2 (ja) | 2016-08-31 |
CL2012000500A1 (es) | 2012-08-10 |
US20120302734A1 (en) | 2012-11-29 |
ZA201202163B (en) | 2013-08-28 |
AU2010286333B2 (en) | 2017-01-05 |
EP2475677A4 (en) | 2013-08-21 |
KR101932771B1 (ko) | 2018-12-28 |
EP2475677B1 (en) | 2018-08-01 |
AU2010286333A1 (en) | 2012-03-29 |
MX2012002400A (es) | 2012-06-25 |
CN102812036A (zh) | 2012-12-05 |
US8674077B2 (en) | 2014-03-18 |
JP2013502438A (ja) | 2013-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101932771B1 (ko) | 실크 도프의 제조 방법 | |
US20210094989A1 (en) | Silk Proteins | |
AU2012339619B2 (en) | Collagen-like silk genes | |
WO2013120143A1 (en) | Method of promoting the formation of cross-links between coiled coil silk proteins | |
CA2904749A1 (en) | Silk polypeptides | |
US20110177997A1 (en) | Cross-Beta Silk Genes | |
NZ626091B2 (en) | Collagen-like silk genes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application | ||
J201 | Request for trial against refusal decision | ||
J301 | Trial decision |
Free format text: TRIAL NUMBER: 2017101002107; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20170428 Effective date: 20180928 |
|
S901 | Examination by remand of revocation | ||
GRNO | Decision to grant (after opposition) | ||
GRNT | Written decision to grant |