KR20080056255A

KR20080056255A - 실크 단백질

Info

Publication number: KR20080056255A
Application number: KR1020087010225A
Authority: KR
Inventors: 타라 디 서덜랜드; 빅토리아 에스 해리토스; 홀리 트루먼; 앨러가콘 스리스칸타; 새라 웨이스먼; 피터 엠 캠벨
Original assignee: 커먼웰쓰 사이언티픽 앤드 인더스트리얼 리서치 오가니제이션
Priority date: 2005-10-05
Filing date: 2006-10-04
Publication date: 2008-06-20
Also published as: EP2395014A3; JP2009509550A; EP1931702A1; US20120245103A1; CA2624667C; AU2006299740B2; US20210094989A1; DK1931702T3; CA2624667A1; BRPI0616894A2; CN101321777A; BRPI0616894B1; EP1931702A4; ES2403733T3; CN101321777B; WO2007038837A1; US8481681B2; RU2008117631A; BRPI0616894B8; AU2006299740A1

Abstract

본 발명은 실크 단백질 뿐만 아니라, 상기 단백질을 코딩하는 핵산을 제공한다. 본 발명은 또한 실크 단백질을 합성하는 재조합 세포 및/또는 유기체를 제공한다. 본 발명의 실크 단백질은 다양한 목적으로, 예로서, 개인 관리 제품, 플라스틱, 직물 및 생체 의학 제품 생산에 사용될 수 있다.

Description

실크 단백질{SILK PROTEINS}

본 발명은 실크 단백질 뿐만 아니라, 상기 단백질을 코딩하는 핵산에 관한 것이다. 본 발명은 또한 실크 단백질을 합성하는 재조합 세포 및/또는 유기체에 관한 것이다. 본 발명의 실크 단백질은 다양한 목적으로, 예로서, 개인 관리 제품(personal care product), 플라스틱, 직물 및 생체 의학 제품 생산에 사용될 수 있다.

실크는 강도 및 인성이 뛰어난 섬유 단백질 분비물이며, 이는 그 자체로서 광범위한 연구의 표적이 되어 왔다. 실크는 30,000여종 이상의 거미와 많은 곤충들에 의해 생산된다. 이들 실크중 매우 극소수만이 특징을 갖고 있고, 대부분의 연구자들은 재배되는 누에인 봄빅스 모리(Bombyx mori)의 고치 실크와, 황금 원형-섬유 거미(orb-weaving spider)인 네필라 클라비페스(Nephila clavipes)의 거미줄에 집중하고 있다.

나비목(Lepidoptera)과 거미에 있어서 견섬유 실크 유전자는 일반적으로 교대로 있는 소수성 및 친수성 블록의 넓은 부위에 걸쳐져 있는 양끝단에 돌기된 말단 도메인을 갖는 거대한 단백질을 코딩한다[Bini et al., 2004]. 일반적으로, 이들 단백질은 β-구조, β-나선구조, α-나선형 구조 및 무정형 부위와 느슨하게 결 합되어 있는 β-병풍 구조의 결정 배열의 상이한 조합을 포함한다(리뷰를 위해[Craig and Riekel, 2002]를 참조할 수 있다).

공지되어 있는 가장 강한 천연 섬유들중 몇몇을 실크 섬유가 대표하고 있기 때문에 그의 합성을 재현하기 위한 시도로 광범위하게 연구되고 있다. 그러나, 나비목 및 거미 견섬유 유전자 발현의 재현에 관한 문제는 다양한 재조합 발현 시스템에서 발현율이 낮다는 점인데, 이는 유해한 재조합 이벤트를 일으키는 실크 유전자의 반복 뉴클레오티드 모티프의 조합, 큰 유전자 크기 및 숙주 세포 내에서 tRNA 풀을 고갈시키는, 유전자내 각 아미노산에 대하여 사용되는 소수의 코돈 때문이다. 재조합 발현은 번역시, 예를 들면, 코돈 선호 및 코돈 요구의 결과로서 번역 중지 및 유전자를 절단시키는 광범위한 재조합율과 같은 난제를 초래한다. 현재까지의, 실크 유전자 발현과 관련된 많은 문제들은 보다 짧고, 덜 반복적인 서열을 통해서 해소될 수 있다.

나비목(특히, 봄빅스 모리의 고치 실크) 및 거미(특히, 네필라 클라비페스 거미줄)에 대해서는 광범위한 지식이 축적되어 있는 반면, 다른 곤충의 실크의 화학 조성 및 분자 구조에 대해서는 거의 알려진 바 없다.

1960년대 초반, 꿀벌 유충의 침샘으로부터 추출된 실크 섬유로부터 얻은 X-선 회절 패턴 결과, 침이 있는 벌목(Hymenoptera)의 실크는 알파-나선형 구조를 갖는 것으로 밝혀졌다[Rudall, 1962]. 이러한 실크가 나선형이라는 것을 입증했을 뿐만 아니라, 수득된 상기 패턴은 알파-나선형 쇄의 꼬인 코일 시스템을 나타내었다[Atkins, 1967]. 말벌인 슈도폼피루스 훔볼티(Pseudopompilus humbolti)[Rudall, 1962] 및 뒤영벌인 봄부스 루코룸(Bombus lucorum)[Lucas and Rudall, 1967]을 비롯한, 다른 세요아목(Aculeata) 종으로부터 유래된 고치 실크에 대하여 유사한 X-선 회절 패턴을 수득하였다.

세요아목 실크에 관하여 기술된 알파-나선형 구조와는 대조적으로, 세요아목에 대한 관련 계통 분기인 맵시벌상과(Ichneumonoidea)로부터 특징화되는 실크는 평행-β 구조를 갖는다. 이러한 구조를 갖는 4개의 일례에 관한 X-선 다이아그램은 고치벌과(Braconidae)(코테시아(Cotesia)(=아펜텔레스(Apenteles)) 글로머레이트(glomerata); 코테시아(Cotesia)(=아펜텔레스(Apenteles)) 고놉테리기스(gonopterygis); 아펜텔레스 비그넬리(Apenteles bignelli))에서 기술되었고, 3개는 맵시벌과(Ichneumonidae)(두소나 sp.(Dusona sp.); 피토디에트리스 sp.(Phytodietris sp.); 브랜추스 페모랄리스(Branchus femoralis))에서 기술되었다[Lucas and Rudall, 1967]. 또한, 고치벌과(코테시아 글로머레이트) 실크의 서열도 기술되어 있다(진뱅크 데이타베이스 등록번호 AB 188680; [Yamada et al., 2004]). 이러한 부분 단백질 서열은 고도로 보존되는 28개의 X-아스파라긴 반복부(여기에서, X는 알라닌 또는 세린이다)로 구성되나, 헵타드(heptad) 반복부를 형성하는 꼬인 코일을 함유하는 것으로는 예측되지 않는다. 고치벌과의 고치 실크의 아미노산 조성을 광범위하게 분석한 결과, 밤나방살이고치벌아과(Microgastrinae)로부터 유래된 실크는 그의 아스파라긴 및 세린 함량이 높다는 점에서 독특한 것으로 밝혀졌다([Lucas et al., 1960];[Quicke et al., 2004]). 관련된 아과는 아미노산 조성이 유의적으로 상이한 실크를 생산하는데, 이는 밤나방살이고치벌아과 실크가 상기 아과에서 특이적으로 진보한 것임을 제안한다[Yamada et al., 2004]. 단리된 고치 실크 단백질로부터 유래된 내부 펩티드에서 수득한 서열로부터 디자인된 PCR 프라이머를 사용하여 코테시아 글로머레이트의 부분 cDNA를 단리하였다. 이러한 부분 서열의 예측되는 아미노산 조성은 철저히 세척한, 이들 종으로부터 얻은 실크의 아미노산 조성과 매우 유사하다.

다른, 침이 없는 벌아목(Apocrita)과 나머지 벌목(심프타(Symphata))내 실크중 다수의 구조는 대개 통상적으로 평행-β 구조이고, 이들 모두 콜라겐 유사성이고, 잎벌과(Tenthredinidae)에 의해 생산되는 폴리글리신 실크이다[Lucas and Rudall, 1967].

꿀벌 실크 단백질은 최종 영(instar) 중간 무렵에 합성되고, 이는 탈중합화된 실크 단백질의 믹스로서 영상화될 수 있다[Silva-Zacarin et al., 2003]. 영이 진행됨에 따라, 물은 상기 샘으로부터 제거되고, 탈수를 통해 실크 단백질의 중합화가 이루어짐으로써 조직화가 잘된 불용성 실크 미세섬유 표지 탁토이드가 형성된다[Silva-Zacarin et al, 2003]. 탈수가 진행됨에 따라 탁토이드가 추가로 재조직화되고[Silva-Zacarin et al., 2003], 가능하게는 미세섬유 사이의 새로운 미세섬유간 결합이 이루어진다[Rudall, 1962]. 꿀벌 실크 샘으로부터 단리된 원섬유의 전자 현미경 영상은 직경이 대략 20-25Å인 구조를 나타낸다[Flower and Kenchington, 1967]. 이 값은 3-, 4-, 또는 5-가닥 꼬인 코일과 일치한다.

다양한 침이 있는 벌목 종 실크의 아미노산 조성은 (Lucas and Rudall (1967))에 의해 측정되었고, 고함량의 알라닌, 세린, 산성 잔기, 아스파르트산 및 글루탐산과 종래의 견섬유와 비교할 때에 양이 감소된 글리신을 함유하는 것으로 밝혀졌다. 침이 있는 벌목 실크의 나선형 함량은 글리신 함량의 감소와 산성 잔기 함량의 증가 결과인 것으로 간주되었다[Rudall and Kenchington, 1971].

풀잠자리(목: 풀잠자리목(Neuroptera)) 유충 실크에 대해서는 알려진 바가 거의 없다. 고치는 내부의 고체층과 외부의 섬유층, 이 2개로 구성된다. 앞서, 고치는 큐티쿨린 실크로 구성된다고 기술된 바와 같이[Rudall and Kenchington, 1971], 오직 내부 고체층에 관해서만 기술되어 있다. (LaMunyon (1988))은 외부 섬유를 구성하는, 말피 기관으로부터 분비된 물질을 기술하였다. 상기 층이 침전된 후, 고체 내부벽은 많은 융모를 가진 루멘중 상피 세포로부터 분비된 분비물로부터 구성되었다[LaMunyon, 1988].

또한, 풀잠자리 유충은 모든 영에 걸쳐 말피 기관으로부터 단백질성의 접착성 물질을 생산하여 유충을 기질에 접착시키거나, 유충의 등 위에 위장 아이템을 붙이거나, 먹이를 포획하는 것으로 알려져 있다[Speilger, 1962]. 로마미이아(Lomamyia)(베토티다에(Bethothidae))에서, 유충은 실크와 접착성 물질을 동시에 생산하고, 이들 2개의 물질은 매우 동일한 산물일 수 있다고 가정되어 왔다[Speilger, 1962]. 접착성 분비물은 가용성이 높고, 이는 또한 포식자에 대한 방어에도 관련이 있는 것으로 여겨지고 있다[LaMunyon & Adams, 1987].

벌목 및 풀잠자리목과 같은 곤충에 의해 생산된 실크의 독특한 성질을 고려할 때, 이들 유기체로부터 실크 단백질을 코딩하는 신규한 핵산을 동정할 필요가 있다.

[발명의 요약]

본 발명자들은 곤충으로부터 다수의 실크 단백질을 동정하였다. 이들 실크 단백질은 놀랍게도 다른 공지 실크 단백질과 그의 1차 서열, 2차 구조 및/또는 아미노산 함량면에서 상이하다.

따라서, 제1 측면에서, 본 발명은 폴리펩티드의 적어도 일부가 꼬인 코일 구조를 갖는, 실질적으로 정제된 실크 폴리펩티드 및/또는 재조합 실크 폴리펩티드를 제공한다.

당업계에 공지되어 있는 바와 같이, 폴리펩티드의 꼬인 코일 구조는 공통 서열 (abcdefg)_n로 표시되는 헵타드 반복부를 특징으로 하는데, 일반적으로 a와 d 위치에는 소수성 잔기가 존재하고, 일반적으로 나머지 위치에는 극성 잔기가 존재한다. 놀랍게도, 본 발명의 폴리펩티드의 헵타드는 총괄적으로 볼 때, '소수성' 헵타드 위치 a 및 d에 매우 고도로 풍부한 알라닌을 갖는다는 점에서 신규한 조성을 갖는다. 게다가, 이들 위치에는 고수준의 작은 극성 잔기가 존재한다. 추가로, e 위치에는 또한 고수준의 알라닌 및 작은 소수성 잔기가 존재한다.

따라서, 특히 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 10 카피 이상 포함하며, 위치 a 및 d에 있는 아미노산 중 25% 이상이 알라닌 잔기이다.

추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 10 카피 이상 포함하며, 위치 a, d 및 e에 있는 아미노산 중 25% 이상이 알라닌 잔기이다.

추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 10 카피 이상 포함하며, 위치 a에 있는 아미노산 중 25% 이상이 알라닌 잔기이다.

추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 10 카피 이상 포함하며, 위치 d에 있는 아미노산 중 25% 이상이 알라닌 잔기이다.

추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 10 카피 이상 포함하며, 위치 e에 있는 아미노산 중 25% 이상이 알라닌 잔기이다.

특히 바람직한 실시태양에서, 헵타드 서열 10 카피 이상이 인접한다.

추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 5 카피 이상 포함하며, 위치 a 및 d에 있는 아미노산 중 15% 이상이 알라닌 잔기이다.

추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 5 카피 이상 포함하며, 위치 a, d 및 e에 있는 아미노산 중 15% 이상이 알라닌 잔기이다.

추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 5 카피 이상 포함하며, 위치 a에 있는 아미노산 중 15% 이상이 알라닌 잔기이다.

추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 5 카피 이상 포함하며, 위치 d에 있는 아미노산 중 15% 이상이 알라닌 잔기이다.

추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 5 카피 이상 포함하며, 위치 e에 있는 아미노산 중 15% 이상이 알라닌 잔기이다.

특히 바람직한 실시태양에서, 헵타드 서열 5 카피 이상이 인접한다.

하나의 실시태양에서, 폴리펩티드는

i) 서열 번호 1, 서열 번호 2, 서열 번호 22, 서열 번호 23, 서열 번호 40, 서열 번호 41, 서열 번호 56 및 서열 번호 57 중 어느 하나에 제시된 아미노산 서열;

ii) 서열 번호 1, 서열 번호 2, 서열 번호 22, 서열 번호 23, 서열 번호 40, 서열 번호 41, 서열 번호 56 및 서열 번호 57 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및

iii) i) 또는 ii)의 생물학적 활성 단편으로부터 선택되는 서열을 포함한다.

또다른 실시태양에서, 폴리펩티드는

i) 서열 번호 3, 서열 번호 4, 서열 번호 24, 서열 번호 25, 서열 번호 42, 서열 번호 43, 서열 번호 58 및 서열 번호 59 중 어느 하나에 제시된 아미노산 서열;

ii) 서열 번호 3, 서열 번호 4, 서열 번호 24, 서열 번호 25, 서열 번호 42, 서열 번호 43, 서열 번호 58 및 서열 번호 59 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및

또다른 실시태양에서, 폴리펩티드는

i) 서열 번호 5, 서열 번호 6, 서열 번호 26, 서열 번호 27, 서열 번호 44, 서열 번호 45, 서열 번호 60 및 서열 번호 61 중 어느 하나에 제시된 아미노산 서열;

ii) 서열 번호 5, 서열 번호 6, 서열 번호 26, 서열 번호 27, 서열 번호 44, 서열 번호 45, 서열 번호 60 및 서열 번호 61 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및

또다른 실시태양에서, 폴리펩티드는

i) 서열 번호 7, 서열 번호 8, 서열 번호 28, 서열 번호 29, 서열 번호 46, 서열 번호 47, 서열 번호 62 및 서열 번호 63 중 어느 하나에 제시된 아미노산 서열;

ii) 서열 번호 7, 서열 번호 8, 서열 번호 28, 서열 번호 29, 서열 번호 46, 서열 번호 47, 서열 번호 62 및 서열 번호 63 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및

추가의 실시태양에서, 폴리펩티드는

i) 서열 번호 72 또는 서열 번호 73에 제시된 아미노산 서열;

ii) 서열 번호 72 및/또는 서열 번호 73에 30% 이상 일치하는 아미노산 서열; 및

제1 측면의 단백질과 공-회합하고 있는 추가의 실크 단백질이 동정되었다. 이들 단백질중 하나(서열 번호 10)는 PROFsec에 의해 41%의 알파-나선형, 8%의 베타-구조 및 50%의 루프 2차 구조를 갖는 것으로 예측되었고, 따라서, 혼합형 구조 단백질로서 분류된다. 본 단백질의 MARCOIL 분석을 통해 꼬인 코일 구조를 갖는 단백질의 특징을 나타내는 헵타드 반복부의 짧은 부위만을 예측하였다.

따라서, 제2 측면에서, 본 발명은

i) 서열 번호 9, 서열 번호 10 및 서열 번호 30 중 어느 하나에 제시된 아미노산 서열;

ii) 서열 번호 9, 서열 번호 10 및 서열 번호 30 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및

iii) i) 또는 ii)의 생물학적 활성 단편으로부터 선택되는 서열을 포함하는, 실질적으로 정제된 실크 폴리펩티드 및/또는 재조합 실크 폴리펩티드를 제공한다.

이론에 의해 제한하고자 하는 것은 아니지만, 제1 측면의 단백질 4개는 서로에 대하여 거의 평행한 나선형 축을 갖는 다발을 형성하고, 이러한 다발은 축방향으로 원섬유까지 확장되는 것으로 보인다. 추가로, 예를 들면, 꿀벌 및 뒤영벌과 같은 적어도 일부의 종에서 제2 측면의 단백질은 다양한 제1 측면의 꼬인 코일 단백질 다발 함께 결합하여 섬유 단백질 복합체를 형성하는데 도움을 주는 "접착체"로서의 역할을 하는 것으로 예측된다. 그러나, 실크 섬유와 공중합체는 제2 측면의 폴리펩티드 없이도 여전히 형성될 수 있다.

바람직한 실시태양에서, 본 발명의 폴리펩티드는 벌목 또는 풀잠자리목 종으로부터 정제될 수 있거나, 그로부터 선택되는 폴리펩티드의 돌연변이체이다. 바람직하게는, 벌목 종은 아피스 멜리페라(Apis mellifera), 오에코필라 스마라그디나(Oecophylla smaragdina), 미르메시아 포리카타(Myrmecia foricata) 또는 봄부스 테레스트리스(Bombus terrestris)이다. 바람직하게는, 풀잠자리목 종은 말라다 시그나타(Mallada signata)이다.

또다른 측면에서, 본 발명은 1종 이상의 다른 폴리펩티드에 융합된 본 발명의 폴리펩티드를 제공한다.

바람직한 실시태양에서, 1종 이상의 다른 폴리펩티드는 본 발명의 폴리펩티드의 안정성을 증진시키는 폴리펩티드, 융합 단백질 정제에 도움을 주는 폴리펩티드 및 세포로부터 본 발명의 폴리펩티드가 분비되는 것(예컨대, 식물 세포로부터 분비되는 것)을 돕는 폴리펩티드로 구성된 군으로부터 선택된다.

또다른 측면에서, 본 발명은 폴리펩티드의 적어도 일부가 꼬인 코일 구조를 갖고, 실크 폴리펩티드를 코딩하는 단리된 폴리뉴클레오티드 및/또는 외인성 폴리뉴클레오티드를 제공한다.

하나의 실시태양에서, 폴리뉴클레오티드는

i) 서열 번호 11, 서열 번호 12, 서열 번호 31, 서열 번호 32, 서열 번호 48, 서열 번호 49, 서열 번호 64 및 서열 번호 65 중 어느 하나에 제시된 뉴클레오티드 서열;

ii) 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열;

iii) 서열 번호 11, 서열 번호 12, 서열 번호 31, 서열 번호 32, 서열 번호 48, 서열 번호 49, 서열 번호 64 및 서열 번호 65 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및

iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열로부터 선택되는 서열을 포함한다.

또다른 실시태양에서, 폴리뉴클레오티드는

i) 서열 번호 13, 서열 번호 14, 서열 번호 33, 서열 번호 34, 서열 번호 50, 서열 번호 51, 서열 번호 66 및 서열 번호 67 중 어느 하나에 제시된 뉴클레오티드 서열;

ii) 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열;

iii) 서열 번호 13, 서열 번호 14, 서열 번호 33, 서열 번호 34, 서열 번호 50, 서열 번호 51, 서열 번호 66 및 서열 번호 67 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및

또다른 실시태양에서, 폴리뉴클레오티드는

i) 서열 번호 15, 서열 번호 16, 서열 번호 35, 서열 번호 36, 서열 번호 52, 서열 번호 53, 서열 번호 68 및 서열 번호 69 중 어느 하나에 제시된 뉴클레오티드 서열;

ii) 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열;

iii) 서열 번호 15, 서열 번호 16, 서열 번호 35, 서열 번호 36, 서열 번호 52, 서열 번호 53, 서열 번호 68 및 서열 번호 69 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및

추가의 실시태양에서, 폴리뉴클레오티드는

i) 서열 번호 17, 서열 번호 18, 서열 번호 37, 서열 번호 38, 서열 번호 54, 서열 번호 55, 서열 번호 70, 서열 번호 71 및 서열 번호 76 중 어느 하나에 제시된 뉴클레오티드 서열;

ii) 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열;

iii) 서열 번호 17, 서열 번호 18, 서열 번호 37, 서열 번호 38, 서열 번호 54, 서열 번호 55, 서열 번호 70, 서열 번호 71 및 서열 번호 76 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및

또다른 실시태양에서, 폴리뉴클레오티드는

i) 서열 번호 74 또는 서열 번호 75로 제공되는 뉴클레오티드 서열;

ii) 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열;

iii) 서열 번호 74 또는 서열 번호 75에 30% 이상 일치하는 뉴클레오티드 서열; 및

추가의 측면에서, 본 발명은

i) 서열 번호 19, 서열 번호 20, 서열 번호 21 및 서열 번호 39 중 어느 하나에 제시된 뉴클레오티드 서열;

ii) 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열;

iii) 서열 번호 19, 서열 번호 20, 서열 번호 21 및 서열 번호 39 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및

iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열로부터 선택되는 서열을 포함하는, 단리된 폴리뉴클레오티드 및/또는 외인성 폴리뉴클레오티드를 제공한다.

바람직한 실시태양에서, 폴리뉴클레오티드는 벌목 또는 풀잠자리목으로부터 단리될 수 있거나, 벌목 또는 풀잠자리목으로부터 단리된 폴리뉴클레오티드의 돌연변이체이다. 바람직하게는, 벌목 종은 아피스 멜리페라, 오에코필라 스마라그디나, 미르메시아 포리카타 또는 봄부스 테레스트리스이다. 바람직하게는, 풀잠자리목 종은 말라다 시그나타이다.

추가의 측면에서, 본 발명은 본 발명의 1종 이상의 폴리뉴클레오티드를 포함하는 벡터를 제공한다.

바람직하게는, 벡터는 발현 벡터이다.

또다른 측면에서, 본 발명은 본 발명의 1종 이상의 폴리뉴클레오티드 및/또는 본 발명의 1종 이상의 벡터를 포함하는 숙주 세포를 제공한다.

숙주 세포는 임의 유형의 세포일 수 있다. 일례로 박테리아, 효모 또는 식물 세포를 포함하나, 이에 한정되지 않는다.

폴리펩티드를 코딩하는 폴리뉴클레오티드가 발현될 수 있도록 하는 조건하에서 본 발명의 숙주 세포, 또는 본 발명의 벡터를 배양하고, 발현된 폴리펩티드를 회수하는 것을 포함하는, 본 발명에 따른 폴리펩티드를 제조하는 방법 또한 제공한다.

트랜스제닉(transgenic) 식물이 본 발명의 폴리펩티드 생산에 특히 유용할 것이라고 직시된다. 따라서, 추가의 또다른 측면에서, 본 발명은 1종 이상의 본 발명의 폴리펩티드를 코딩하는 외인성 폴리뉴클레오티드를 포함하는 트랜스제닉 식물을 제공한다.

또다른 측면에서, 본 발명은 1종 이상의 본 발명의 폴리펩티드를 코딩하는 외인성 폴리뉴클레오티드를 포함하는, 인간을 제외한 트랜스제닉 동물을 제공한다.

추가의 또다른 측면에서, 본 발명은 본 발명의 폴리펩티드에 특이적으로 결합하는 항체를 제공한다.

추가의 측면에서, 본 발명은 1종 이상의 본 발명의 폴리펩티드를 포함하는 실크 섬유를 제공한다.

바람직하게는, 폴리펩티드는 재조합 폴리펩티드이다.

하나의 실시태양에서, 폴리펩티드 중 적어도 일부는 가교 결합된 것이다. 하나의 실시태양에서, 폴리펩티드의 리진 잔기 중 적어도 일부는 가교 결합된 것이다.

또다른 측면에서, 본 발명은 2종 이상 본 발명의 폴리펩티드를 포함하는 공중합체를 제공한다.

바람직하게는, 폴리펩티드는 재조합 폴리펩티드이다.

하나의 실시태양에서, 공중합체는 4종 이상의 상이한 제1 측면의 폴리펩티드를 포함한다. 또다른 실시태양에서, 공중합체는 추가로 제2 측면의 폴리펩티드를 포함한다.

숙련된 수령인이 이해하고 있는 바와 같이, 본 발명의 폴리펩티드는 당업계에서 다른 유형의 실크 단백질에 대해 공지되어 있는 바와 같이 매우 다양한 용도를 갖고 있다. 따라서, 추가의 측면에서, 본 발명은 1종 이상의 본 발명의 폴리펩티드, 본 발명의 실크 섬유 및/또는 본 발명의 공중합체를 포함하는 제품을 제공한다.

제품의 일례로는 개인 관리 제품, 직물, 플라스틱 및 생체 의학 제품을 포함하나, 이에 한정되지 않는다.

또한 추가의 측면에서, 본 발명은 1종 이상의 본 발명의 폴리펩티드, 본 발명의 실크 섬유 및/또는 본 발명의 공중합체 및 1종 이상의 허용 가능한 담체를 포함하는 제품을 제공한다.

하나의 실시태양에서, 조성물은 추가로 약물을 포함한다.

또다른 실시태양에서, 조성물은 의료 장치 또는 미용화장품(cosmetic)에서 의약으로서 사용된다.

또다른 측면에서, 본 발명은 1종 이상의 본 발명의 폴리뉴클레오티드 및 하나 이상의 담체를 포함하는 제품을 제공한다.

바람직한 실시태양에서, 본 발명의 조성물, 실크 섬유, 공중합체 및/또는 제품은 곤충에 의해 생산되는 로얄 젤리 단백질은 포함하지 않는다.

추가의 측면에서, 본 발명은 질병 치료 또는 예방용 약물 및 약제학적으로 허용 가능한 담체를 포함하는 조성물을 투여하는 방법으로서, 여기에서, 약제학적으로 허용 가능한 담체가 1종 이상의 본 발명의 폴리펩티드, 본 발명의 실크 섬유 및/또는 본 발명의 공중합체로부터 선택되는 것인, 질병을 치료 또는 예방하는 방법을 제공한다.

추가의 또다른 측면에서, 본 발명은 질병 치료 또는 예방용 약제 제조를 위한 1종 이상의 본 발명의 폴리펩티드, 본 발명의 실크 섬유 및/또는 본 발명의 공중합체 및 약물의 용도를 제공한다.

추가의 측면에서, 본 발명은 1종 이상의 본 발명의 폴리펩티드, 1종 이상의 본 발명의 폴리뉴클레오티드, 본 발명의 실크 섬유 및/또는 본 발명의 공중합체를 포함하는 키트를 제공한다.

바람직하게는, 키트는 추가로 키트 사용에 관한 정보 및/또는 설명서를 포함한다.

자명한 바와 같이, 본 발명의 한 측면의 바람직한 특성과 특징은 본 발명의 다수의 다른 측면에 적용될 수 있다.

본 명세서를 통하여, "포함한다(comprises)" 또는 이것의 변형인 "포함한다(comprises)" 또는 "포함하는(comprising)"이라는 용어는 언급된 요소, 완전체, 또는 단계, 또는 요소, 완전체, 또는 단계들의 군을 포함하는 것을 의미하나, 그 외의 다른 요소, 완전체, 또는 단계, 또는 요소, 완전체, 또는 단계들의 군을 포함하지 않는다는 것은 아니다.

이하, 본 발명은 하기의 비제한적인 실시예와 첨부되는 도면과 관련하여 기술된다.

[도면의 간단한 설명]

도 1. 실크: 1) 꿀벌 실크, 2) 뒤영벌 실크, 3) 불독 개미 실크, 4) 바느질 개미 실크, 5) 풀잠자리 유충 실크의 아미드 I 및 II 부위의 푸리에 변환 적외선 스펙트럼. 모든 실크는 나선형 단백질로 예상되는 스펙트럼을 갖는다. 벌목 실크 (개미 및 벌)은 1645-1646cm^-1(표지됨)에서 최대 스펙트럼값을 갖고, 꼬인 코일 단백질의 전형적인 특징을 나타내는 바와 같이[Heimburg et al., 1999], 종래의 알파-나선형 신호보다 대략 10cm^-1 아래로 이동하였고, 범위는 넓어졌다.

도 2. SDS로 세척된 꿀벌 벌집 실크의 아미노산 조성과 제노스피라 단백질(즉, 제노스피라1, 제노스피라2, 제노스피라3 및 제노스피라4)(동몰량으로 총합은 65%) 및 제노신 (35%)의 아미노산 조성 비교.

도 3. 아미노산 조성과 실크 유전자에 의해 코딩된 단백질로부터 예측되는 아미노산 조성의 비교.

도 4. 꿀벌 실크 단백질내 꼬인 코일 부위 예측. COILS는 서열을 공지의 평행한 2-가닥 꼬인 코일의 데이타베이스와 비교하고, 유사도 스코어를 유도해 내는 프로그램이다. [Lupas et al. (1991)]에 기재되어 있는 바와 같이, 상기 스코어를 구상 및 꼬인 코일 단백질에서의 스코어 분포와 상기 스코어를 비교함으로써 프로그램은 서열이 꼬인 코일 구조를 채택하게 될 가능성에 대하여 산출하게 된다. 28개의 윈도우 크기를 사용함으로써 상기 프로그램은 하기 갯수만큼의 잔기가 각 단백질 꼬인 코일 도메인내 존재한다고 예측하고 있다: 제노스피라3: 77개; 제노스피라4: 35개; 제노스피라1: 28개; 제노스피라2: 80개.

도 5. 꼬인 코일 구조를 형성하는 주 헵타드에 관한 MARCOIL 예측을 나타내는 꿀벌 실크 단백질의 정렬. 헵타드 서열을 아미노산 위에 나타내고, 위치 a 및 d의 알라닌 잔기는 하이라이트로 표시되어 있다.

도 6. 헵타드 위치 배정을 나타내는 벌목 (벌 및 개미) 실크 단백질의 Marcoil 예측된 꼬인 코일 부위의 정렬. Amel, 꿀벌; BB, 뒤영벌; BA, 불독 개미; WA, 바느질 개미; F1-4, 실크 견섬유 1-4. 헵타드 서열을 아미노산 위에 나타내고, 위치 a, d 및 e의 알라닌 잔기는 하이라이트로 표시되어 있다.

도 7. 말라다 시그나타 유충 실크 단백질 및 벌목 실크 단백질의 오솔로그 집단의 예측된 꼬인 코일 부위내 헵타드 위치의 아미노산 성질.

도 8. 말기의 최종 영 침샘 단백질의 SDS 폴리아크릴아미드 겔 전기영동. 트립신 분해 후, cDNA 서열로부터 동정된 단백질로부터 예측된 단백질 서열과 데이타를 매치시키는 애질런트 스펙트럼 밀 소프트웨어(Agilent's Spectrum Mill software)를 사용하여 질량 스펙트럼 데이타 세트를 분석하여 단백질을 동정하였다. 소프트웨어는 펩티드 단편에 대하여 실험상 관찰된 질량 세트와, 제공된 데이타베이스내의 단백질 서열에 따라 생성될 수 있는 단편의 예측치 사이의 각 매치의 질에 관한 스코어를 생성하였다. 본원에 나타낸 서열 매치 모두는 스펙트럼 밀 소프트웨어에 의해 20보다 큰 스코어를 받았는데, 여기에서, 20이라는 스코어는 유효 매치의 자동, 신뢰 허용에 대하여 충분할 것이다.

도 9. 실크 단백질중 꼬인 코일 부위의 절약 분석. 4개의 꼬인 코일 단백질이 갖는 관련성은 유전자가 진정 세요아목(Euaculeata) 분기 이전의 공통 조상으로부터 진화하였다는 것을 제안한다. 점선으로 경계를 표시한 영역은 쥬라기 말기에 개미 및 말벌(말벌과(Vespoidea))이 벌(꿀벌과(Apoidea))로부터 분기되지 이전에 발생한 변종을 나타낸다(155 myrs; [Grimaldi and Engel, 2005]). 1000회의 반복으로부터 부트스트랩 수치를 표시하는 숫자를 나타낸다.

도 10. A) 트립신 분해 후에 벌 실크로부터 생성된 펩티드의 질량 스펙트럼 분석으로 동정된 아피스 멜리페라 실크 단백질. 음영으로 표시된 부분은 질량 스펙트럼 분석으로 동정된 펩티드이다. 본원에 나타낸 서열 매치 모두는 스펙트럼 밀 소프트웨어에 의해 20보다 큰 스코어를 받았는데, 여기에서, 20이라는 스코어는 유효 매치의 자동, 신뢰 허용에 대하여 충분할 것이다.

B) 뒤영벌, 불독 개미, 바느질 개미 및 풀잠자리 실크 단백질의 전장의 아미노 서열.

도 11. 꿀벌, 뒤영벌, 불독 개미, 바느질 개미 및 풀잠자리 실크 단백질을 코딩하는 오픈 리딩 프레임.

도 12. 제노신을 코딩하는 서열. 단일 인트론(하이라이트로 표시)이 개입된 전체 코딩 서열을 제공한다.

도 13. 타바코에서 실크 단백질의 발현. 1. 빈 발현 벡터로 형질전환된 E. 콜라이(E. coli), 2. AmelF4(제노스피라4) 코딩 부위를 함유하는 발현 벡터로 형질전환된 E. 콜라이, 3. 빈 발현 벡터로 형질전환된 타바코, 4. AmelF4 코딩 부위로 형질전환된 타바코로부터의 단백질 웨스턴 블롯 분석 후의 히스티딘 태깅된 단백질의 검출.

도 14. 복굴절성 실을 나타내는, 재조합 꿀벌 실크 단백질로 제조된 섬유. 복굴절성은 구조물이 실내 존재한다는 것을 지시한다. 상이한 재조합 꿀벌 실들을 패널 A-D 각각에 나타내고, 재조합 풀잠자리 실을 패널 E에 나타낸다.

서열목록에 관한 풀이

서열 번호 1 - 본원에서 제노스피라1(또는 본원에서 AmelF1)로 명명되는 꿀벌 실크 단백질(마이너스 신호 펩티드).

서열 번호 2 - 본원에서 제노스피라1로 명명되는 꿀벌 실크 단백질.

서열 번호 3 - 본원에서 제노스피라2(또는 본원에서 AmelF2)로 명명되는 꿀벌 실크 단백질(마이너스 신호 펩티드).

서열 번호 4 - 본원에서 제노스피라2로 명명되는 꿀벌 실크 단백질.

서열 번호 5 - 본원에서 제노스피라3(또는 본원에서 AmelF3)으로 명명되는 꿀벌 실크 단백질(마이너스 신호 펩티드).

서열 번호 6 - 본원에서 제노스피라3으로 명명되는 꿀벌 실크 단백질.

서열 번호 7 - 본원에서 제노스피라4(또는 본원에서 AmelF4)로 명명되는 꿀벌 실크 단백질(마이너스 신호 펩티드).

서열 번호 8 - 본원에서 제노스피라4로 명명되는 꿀벌 실크 단백질.

서열 번호 9 - 본원에서 제노신(또는 본원에서 AmelSA1)으로 명명되는 꿀벌 실크 단백질(마이너스 신호 펩티드).

서열 번호 10 - 본원에서 제노신으로 명명되는 꿀벌 실크 단백질.

서열 번호 11 - 꿀벌 실크 단백질 제노스피라1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 12 - 꿀벌 실크 단백질 제노스피라1을 코딩하는 뉴클레오티드 서열.

서열 번호 13 - 꿀벌 실크 단백질 제노스피라2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 14 - 꿀벌 실크 단백질 제노스피라2를 코딩하는 뉴클레오티드 서열.

서열 번호 15 - 꿀벌 실크 단백질 제노스피라3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 16 - 꿀벌 실크 단백질 제노스피라3을 코딩하는 뉴클레오티드 서열.

서열 번호 17 - 꿀벌 실크 단백질 제노스피라4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 18 - 꿀벌 실크 단백질 제노스피라4를 코딩하는 뉴클레오티드 서열.

서열 번호 19 - 꿀벌 실크 단백질 제노신을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 20 - 꿀벌 실크 단백질 제노신을 코딩하는 뉴클레오티드 서열.

서열 번호 21 - 꿀벌 실크 단백질 제노신을 코딩하는 유전자 서열.

서열 번호 22 - 본원에서 BBF1로 명명되는 뒤영벌 실크 단백질(마이너스 신호 펩티드).

서열 번호 23 - 본원에서 BBF1로 명명되는 뒤영벌 실크 단백질.

서열 번호 24 - 본원에서 BBF2로 명명되는 뒤영벌 실크 단백질(마이너스 신호 펩티드).

서열 번호 25 - 본원에서 BBF2로 명명되는 뒤영벌 실크 단백질.

서열 번호 26 - 본원에서 BBF3으로 명명되는 뒤영벌 실크 단백질(마이너스 신호 펩티드).

서열 번호 27 - 본원에서 BBF3으로 명명되는 뒤영벌 실크 단백질.

서열 번호 28 - 본원에서 BBF4로 명명되는 뒤영벌 실크 단백질(마이너스 신호 펩티드).

서열 번호 29 - 본원에서 BBF4로 명명되는 뒤영벌 실크 단백질.

서열 번호 30 - 본원에서 BBSA1로 명명되는 뒤영벌 실크 단백질의 부분 아미노산 서열.

서열 번호 31 - 뒤영벌 실크 단백질 BBF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 32 - 뒤영벌 실크 단백질 BBF1을 코딩하는 뉴클레오티드 서열.

서열 번호 33 - 뒤영벌 실크 단백질 BBF2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 34 - 뒤영벌 실크 단백질 BBF2를 코딩하는 뉴클레오티드 서열.

서열 번호 35 - 뒤영벌 실크 단백질 BBF3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 36 - 뒤영벌 실크 단백질 BBF3을 코딩하는 뉴클레오티드 서열.

서열 번호 37 - 뒤영벌 실크 단백질 BBF4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 38 - 뒤영벌 실크 단백질 BBF4를 코딩하는 뉴클레오티드 서열.

서열 번호 39 - 뒤영벌 실크 단백질 BBSA1을 코딩하는 부분 뉴클레오티드 서열.

서열 번호 40 - 본원에서 BAF1로 명명되는 불독 개미 실크 단백질(마이너스 신호 펩티드).

서열 번호 41 - 본원에서 BAF1로 명명되는 불독 개미 실크 단백질.

서열 번호 42 - 본원에서 BAF2로 명명되는 불독 개미 실크 단백질(마이너스 신호 펩티드).

서열 번호 43 - 본원에서 BAF2로 명명되는 불독 개미 실크 단백질.

서열 번호 44 - 본원에서 BAF3으로 명명되는 불독 개미 실크 단백질(마이너스 신호 펩티드).

서열 번호 45 - 본원에서 BAF3으로 명명되는 불독 개미 실크 단백질.

서열 번호 46 - 본원에서 BAF4로 명명되는 불독 개미 실크 단백질(마이너스 신호 펩티드).

서열 번호 47 - 본원에서 BAF4로 명명되는 불독 개미 실크 단백질.

서열 번호 48 - 불독 개미 실크 단백질 BAF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 49 - 불독 개미 실크 단백질 BAF1을 코딩하는 뉴클레오티드 서열.

서열 번호 50 - 불독 개미 실크 단백질 BAF2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 51 - 불독 개미 실크 단백질 BAF2를 코딩하는 뉴클레오티드 서열.

서열 번호 52 - 불독 개미 실크 단백질 BAF3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 53 - 불독 개미 실크 단백질 BAF3을 코딩하는 뉴클레오티드 서열.

서열 번호 54 - 불독 개미 실크 단백질 BAF4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 55 - 불독 개미 실크 단백질 BAF4를 코딩하는 뉴클레오티드 서열.

서열 번호 56 - 본원에서 GAF1로 명명되는 바느질 개미 실크 단백질(마이너스 신호 펩티드).

서열 번호 57 - 본원에서 GAF1로 명명되는 바느질 개미 실크 단백질.

서열 번호 58 - 본원에서 GAF2로 명명되는 바느질 개미 실크 단백질(마이너스 신호 펩티드).

서열 번호 59 - 본원에서 GAF2로 명명되는 바느질 개미 실크 단백질.

서열 번호 60 - 본원에서 GAF3으로 명명되는 바느질 개미 실크 단백질(마이너스 신호 펩티드).

서열 번호 61 - 본원에서 GAF3으로 명명되는 바느질 개미 실크 단백질.

서열 번호 62 - 본원에서 GAF4로 명명되는 바느질 개미 실크 단백질(마이너스 신호 펩티드).

서열 번호 63 - 본원에서 GAF4로 명명되는 바느질 개미 실크 단백질.

서열 번호 64 - 바느질 개미 실크 단백질 GAF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 65 - 바느질 개미 실크 단백질 GAF1을 코딩하는 뉴클레오티드 서열.

서열 번호 66 - 바느질 개미 실크 단백질 GAF2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 67 - 바느질 개미 실크 단백질 GAF2를 코딩하는 뉴클레오티드 서열.

서열 번호 68 - 바느질 개미 실크 단백질 GAF3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 69 - 바느질 개미 실크 단백질 GAF3을 코딩하는 뉴클레오티드 서열.

서열 번호 70 - 바느질 개미 실크 단백질 GAF4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 71 - 바느질 개미 실크 단백질 GAF4를 코딩하는 뉴클레오티드 서열.

서열 번호 72 - 본원에서 MalF1로 명명되는 풀잠자리 실크 단백질(마이너스 신호 펩티드).

서열 번호 73 - 본원에서 MalF1로 명명되는 풀잠자리 실크 단백질.

서열 번호 74 - 풀잠자리 실크 단백질 MalF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).

서열 번호 75 - 풀잠자리 실크 단백질 MalF1을 코딩하는 뉴클레오티드 서열.

서열 번호 76 - (pET14b 및 pVEC8로 서브클로닝되기 이전의) 식물 발현을 위해 최적화된, 본원에서 제노스피라4 코돈으로 명명되는 꿀벌 실크 단백질을 코딩하는 뉴클레오티드 서열.

서열 번호 77 - 식물 발현(번역 융합 미포함)을 위해 최적화된 꿀벌 실크 단백질(제노스피라4) 오픈 리딩 프레임.

[상세한 설명]

일반 기법 및 정의

달리 구체적으로 정의하지 않는 한, 본원에서 사용되는 모든 기술적 및 과학적 용어는 당업계(예로서, 세포 배양, 분자 유전학, 면역학, 면역조직학, 단백질 화학 및 생화학에서)의 숙련자에게 통상적으로 이해되는 것과 동일한 의미를 가져야 한다.

달리 명시하지 않는 한, 본 발명에서 사용되는 재조합 단백질, 세포 배양 및 면역학적 기법은 당업계의 숙련자에게 잘 알려져 있는 표준 방법이다. 그러한 기법은 출처, 예를 들면, ([J. Perbal, A Practical Guide to Molecular Cloning, John Wiley and Sons (1984)], [J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbour Laboratory Press (1989)], [T.A. Brown (editor), Essential Molecular Biology: A Practical Approach, Volumes 1 and 2, IRL Press (1991)], [D.M. Glover and B.D. Hames (editors), DNA Cloning: A Practical Approach, Volumes 1-4, IRL Press (1995 and 1996)] 및 [F.M. Ausubel et al. (editors), Current Protocols in Molecular Biology, Greene Pub. Associates and Wiley-Interscience (1988)(현재까지 업데이트된 것 모두 포함)], [Ed Harlow and David Lane (editors) Antibodies: A Laboratory Manual, Cold Spring Harbour Laboratory, (1988)] 및 [J.E. Coligan et al. (editors) Current Protocols in Immunology, John Wiley & Sons(현재까지 업데이트된 것 모두 포함)])의 문헌을 통해 기술되고 설명되고, 이는 본원에서 참고로 인용된다.

본원에서 사용되는 바, "실크 단백질" 및 "실크 폴리펩티드"라는 용어는 실크 섬유 및/또는 섬유 단백질 복합체를 생산하는데 사용될 수 있는 섬유 단백질/폴리펩티드를 지칭한다. 본 발명의 자연적으로 발생된 실크 단백질이 예를 들면, 꿀벌과 같은 곤충의 벌집 실크중 일부를 형성하지만, 본원에 기술되어 있는 바와 같이, 적절한 곤충 내에서 발현될 경우, 동일한 작용을 실행하는 상기 단백질의 변이체가 용이하게 생산될 수 있다.

본원에서 사용되는 바, "실크 섬유"는 예를 들면, 직물과 같은 다양한 품목으로 직조될 수 있는, 본 발명의 단백질을 포함하는 미세섬유를 지칭한다.

본원에서 사용되는 바, "공중합체"는 2개 이상의 본 발명의 실크 단백질을 포함하는 조성물이다. 이 용어는 예를 들면, 곤충의 벌집과 같이 자연적으로 발생된 공중합체는 제외시킨다.

"식물"이라는 용어는 전체 식물, 식물 구조(예컨대, 잎, 줄기), 뿌리, 꽃 기관/구조, 종자(배, 배유 및 종피), 식물 조직(예컨대, 관다발 조직, 기본 조직 등), 세포 및 상기의 자손을 포함한다.

"트랜스제닉 식물"은 동일 종, 변종, 또는 재배종의 야생형 식물에서 발견되지 않는 유전자 작제물("트랜스 유전자(transgene)")을 함유하는 식물을 지칭한다. 본원에서 지칭되는 "트랜스 유전자"는 생명 공학 분야에 있어서의 일반적인 의미를 갖고, 재조합 DNA 또는 RNA 기술에 의해 생산되거나 변경되고, 식물 세포로 도입되는 유전자 서열을 포함한다. 트랜스 유전자는 식물 세포로부터 유래된 유전자 서열을 포함할 수 있다. 전형적으로, 트랜스 유전자는 예컨대, 형질전환과 같은 인간 조작에 의해 식물에 도입되지만, 당업자가 인지하고 있는 것과 같은 임의의 방법이 사용될 수 있다

"폴리뉴클레오티드"는 올리고뉴클레오티드, 핵산 분자 또는 그의 임의의 단편을 지칭한다. 이는 게놈 또는 합성 기원의, 이중 가닥 또는 단일 가닥 및 당질, 지질, 단백질, 또는 본원에서 정의된 특정 활성을 실행하는 다른 물질과 배합된 DNA 또는 RNA일 수 있다.

본원에서 사용되는 바, "작동 가능하게 연결된" 것은 2개 이상의 핵산(예로서, DNA) 세그먼트들 간의 작용 관계를 지칭한다. 전형적으로, 전사되는 서열에 대한 전사 조절 요소의 작용 관계를 지칭한다. 예컨대, 프로모터가 적절한 숙주 세포에서 코딩 서열의 전사를 자극하거나 조정한다면, 이는 본원에서 정의된 예를 들면, 폴리뉴클레오티드와 같은 코딩 서열에 작동 가능하게 연결된 것이다. 일반적으로, 전사되는 서열에 작동 가능하게 연결된 프로모터 전사 조절 요소는 전사되는 서열에 물리적으로 인접해 있고, 즉, 시스-작용한다. 그러나, 몇몇 전사 조절 요소는 예를 들면, 인핸서는 전사가 그에 의해 증진되는 코딩 서열에 물리적으로 인접해 있거나, 근접하게 위치할 필요도 없다.

"신호 펩티드"라는 용어는 분비되는 성숙한 단백질에 우선하는 아미노 말단 폴리펩티드를 지칭한다. 신호 펩티드는 성숙한 단백질로부터 절단되는 바, 성숙한 단백질 내에 존재하는 것은 아니다. 신호 펩티드는 세포막을 가로질러 분비되는 단백질을 지시하고 전위시키는 작용을 갖는다. 신호 펩티드는 신호 서열로도 지칭된다.

본원에서 사용되는 바, "형질전환"은 폴리뉴클레오티드의 혼입에 의해 세포내 새로운 유전자를 습득하는 것이다.

본원에서 사용되는 바, "약물"이라는 용어는 특정 질병을 치료 또는 예방하기 위하여 사용될 수 있는 임의의 화합물을 지칭하는 것으로, 본 발명의 실크 단백질과 함께 제형화될 수 있는 약물의 일례로는 단백질, 핵산, 항암제, 진통제, 항생제, 소염제(스테로이드성 및 비-스테로이드성 모두), 호르몬, 백신, 표지된 물질 등을 포함하나, 이에 한정되지 않는다.

폴리펩티드

본 발명자는 "실질적으로 정제된 폴리펩티드"란 일반적으로 지질, 핵산, 다른 폴리펩티드 및 다른 오염성 분자, 예를 들면, 그의 본래의 상태에서 그와 회합되어 있는 왁스로부터 분리되어 있는 폴리펩티드라는 것을 의미한다. 본 발명의 다른 단백질을 제외하고, 실질적으로 정제된 폴리펩티드는 그와 자연적으로 회합되어 있는 다른 성분들로부터 바람직하게는 60% 이상 유리, 더욱 바람직하게는, 75% 이상 유리 및 더욱 바람직하게는 90% 이상이 유리되어 있다.

폴리펩티드와 관련하여 "재조합"이라는 용어는 폴리펩티드가 세포에 의해, 또는 무세포 발현 시스템에서 그의 본래의 상태와 비교할 때 변경된 양으로 또는 변경된 속도로 생산되는 폴리펩티드를 언급한다. 하나의 실시태양에서, 세포는 자연적으로 폴리펩티드를 생산하지 않는 세포이다. 그러나, 세포는, 생산하고자 하는 폴리펩티드의 양을 변경, 바람직하게는 증가시키는 비-내인성 유전자를 포함하는 세포일 수 있다. 본 발명의 재조합 폴리펩티드로는 그가 생산되는 트랜스제닉(재조합) 세포, 또는 무세포 발현 시스템의 다른 성분들로부터 분리되지 않는 폴리펩티드 및 상기 세포, 또는 무세포 시스템에서 생산된 후, 이어서 적어도 몇몇의 다른 성분들로부터 정제되는 폴리펩티드를 포함한다.

"폴리펩티드" 및 "단백질"이라는 용어는 일반적으로 상호교환적으로 사용되고, 비-아미노산 기의 첨가에 의해 변형될 수 있거나, 변형될 수 없는 단일 폴리펩티드 쇄를 지칭한다. 본원에서 사용되는 바, "단백질" 및 "폴리펩티드"라는 용어는 또는 본원에 기술된 본 발명의 폴리펩티드의 변이체, 돌연변이체, 변형체, 유사체 및/또는 유도체를 포함한다.

폴리펩티드 일치도(%)는 갭 생성 패널티=5 및 갭 확장 패널티=0.3으로 GAP[Needleman and Wunsch, 1970) 분석(GCG 프로그램)에 의해 측정된다. 질의 서열의 길이는 15개 이상의 아미노산이고, GAP 분석은 15개 이상의 아미노산에 대하여 2개의 서열을 정렬하고, 더욱 바람직하게는, 질의 서열의 길이는 50개 이상의 아미노산이고, GAP 분석은 50개 이상의 아미노산에 대하여 2개의 서열을 정렬한다. 더욱 바람직하게는, 질의 서열의 길이는 100개 이상의 아미노산이고, GAP 분석은 100개 이상의 아미노산에 대하여 2개의 서열을 정렬한다. 더욱 더 바람직하게는, 질의 서열의 길이는 250개 이상의 아미노산이고, GAP 분석은 250개 이상의 아미노산에 대하여 2개의 서열을 정렬한다. 더욱 더 바람직하게는, GAP 분석은 2개 서열의 전장에 대하여 2개의 서열을 정렬한다.

본원에서 사용되는 바, "생물학적으로 활성"인 단편은 전장의 폴리펩티드의 정의된 활성, 즉, 실크를 생산하는데 사용되는 능력을 유지하는 본 발명의 폴리펩티드의 일부분이다. 생물학적으로 활성 단편은 정의된 활성을 유지하는 한, 어느 크기도 될 수 있다.

정의된 폴리펩티드와 관련하여, 상기 제공된 것보다 더 높은 일치도 값(%)이 바람직한 실시태양을 포함할 것이라는 것도 이해될 것이다. 따라서, 해당되는 경우, 최소 일치도 값(%)을 고려해 볼 때, 폴리펩티드는 관련하여 지명된 서열 번호와 40% 이상, 더욱 바람직하게는, 45% 이상, 더욱 바람직하게는, 50% 이상, 더욱 바람직하게는, 55% 이상, 더욱 바람직하게는, 60% 이상, 더욱 바람직하게는, 65% 이상, 더욱 바람직하게는, 70% 이상, 더욱 바람직하게는, 75% 이상, 더욱 바람직하게는, 80% 이상, 더욱 바람직하게는, 85% 이상, 더욱 바람직하게는, 90% 이상, 더욱 바람직하게는, 91% 이상, 더욱 바람직하게는, 92% 이상, 더욱 바람직하게는, 93% 이상, 더욱 바람직하게는, 94% 이상, 더욱 바람직하게는, 95% 이상, 더욱 바람직하게는, 96% 이상, 더욱 바람직하게는, 97% 이상, 더욱 바람직하게는, 98% 이상, 더욱 바람직하게는, 99% 이상, 더욱 바람직하게는, 99.1% 이상, 더욱 바람직하게는, 99.2% 이상, 더욱 바람직하게는, 99.3% 이상, 더욱 바람직하게는, 99.4% 이상, 더욱 바람직하게는, 99.5% 이상, 더욱 바람직하게는, 99.6% 이상, 더욱 바람직하게는, 99.7% 이상, 더욱 바람직하게는, 99.8% 이상 및 더욱 더 바람직하게는, 99.9% 이상 일치하는 아미노산 서열을 포함한다.

본 발명의 폴리펩티드의 아미노산 서열 돌연변이체는 적절한 뉴클레오티드 변화를 본 발명의 핵산에 도입하거나, 원하는 폴리펩티드를 시험관내에서 합성함으로써 제조될 수 있다. 그러한 돌연변이체는 아미노산 서열내 예컨대, 잔기의 결실, 삽입, 또는 치환을 포함한다. 단, 최종 폴리펩티드 산물이 원하는 특징을 소지한다면, 최종 작제물에 달하기 위하여 결실, 삽입 및 치환의 조합이 이루어질 수 있다.

돌연변이체 (변경된) 폴리펩티드는 당업계에 공지된 임의의 기법을 사용하여 제조될 수 있다. 예컨대, 본 발명의 폴리뉴클레오티드는 시험관 내에서 돌연변이 유발될 수 있다. 그러한 시험관내 돌연변이 유발 기법으로는 적합한 벡터 내로 폴리뉴클레오티드를 서브-클로닝하는 것, "돌연변이자" 균주, 예를 들면, E. 콜라이 XL-1 레드(Stratagene)내로 벡터를 형질전환시키는 것 및 적합한 세대수 동안 형질전환된 박테리아를 증식시키는 것을 포함한다. 또다른 일례로, 본 발명의 폴리뉴클레오티드를 (Harayama (1998))에 의해 광범위하게 기재된 DNA 셔플링 기법에 이용한다. 이들 DNA 셔플링 기법은 가능하게는 본 발명의 것과 관련된 유전자 이외의 본 발명의 유전자, 예를 들면, 본원에서 특징화된 특정 종 이외의 벌목 또는 풀잠자리목 종으로부터 유래된 실크 유전자를 포함한다. 돌연변이화/변경된 DNA로부터 유래된 산물은 실크 단백질로서 사용될 수 있는지 여부를 결정하기 위하여 본원에 기술된 기법을 사용함으로써 용이하게 선별될 수 있다.

아미노산 서열 돌연변이체 디자인시, 돌연변이 부위의 위치 및 돌연변이의 성질은 변형시키고자 하는 특징(들)에 따라 달라질 것이다. 돌연변이 부위는 개별적으로 또는 계속하여, 예를 들면, (1) 먼저 보존적 아미노산 선택물로 치환한 후, 달성 결과에 따라 더 많은 라디칼 선택물로 치환하거나, (2) 표적 잔기를 결실시키거나, (3) 위치 부위에 인접하는 다른 잔기를 삽입함으로써 변형될 수 있다.

아미노산 서열 결실 범위는 일반적으로, 약 1 내지 15개의 잔기, 더욱 바람직하게는, 약 1 내지 10개의 잔기 및 전형적으로, 약 1 내지 5개의 인접 잔기이다.

치환 돌연변이체에서는 폴리펩티드 분자 내의 1종 이상의 아미노산 잔기가 제거되고, 그 자리에 다른 잔기가 삽입된다. 치환 돌연변이 유발에 대한 가장 큰 관심의 대상이 되는 부위로는 작용을 위해 중요한 것으로 동정된 부위를 포함한다. 관심의 대상이 되는 다른 부위는 다양한 균주 또는 종으로부터 수득된 특정 잔기가 동정된 것이다. 이러한 위치는 생물학적 활성에 중요할 수 있다. 이들 부위, 특히, 3개 이상의 다른 동일 보존 부위의 서열내 포함되는 것이 상대적으로 보존적인 방식으로 바람직하게 치환된다. 그러한 보존적인 치환체를 "예시적인 치환"이라는 제목하의 표 1에 제시한다.

상기 요약한 바와 같이, 본 발명의 폴리펩티드 중 몇몇의 일부는 꼬인 코일 구조를 갖는다. 폴리펩티드의 꼬인 코일 구조는 공통 서열 (abcdefg)_n로 나타내는 헵타드 반복부를 특징으로 한다. 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 10 카피 이상 포함하며, 위치 a 및 d에 있는 아미노산 중 25% 이상이 알라닌 잔기이다.

표 1. 예시적인 치환

바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드는 12 카피 이상, 더욱 바람직하게는, 15 카피 이상, 더욱 더 바람직하게는, 18 카피 이상의 연속된 헵타드 카피를 포함한다. 추가의 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드는 헵타드를 최대 적어도 28 카피 가질 수 있다. 전형적으로, 헵타드 카피는 직렬로 반복될 것이다. 그러나, 예컨대, 도 5 및 6에 나타낸 것과 같이, 수개의 아미노산이 2개의 헵타드 사이에서 발견될 수 있거나, 수개의 절단된 헵타드가 발견될 수 있는 것과 같이(예컨대, 도 5의 제노스피라1을 참조할 수 있다), 완전한 직렬 반복부일 필요는 없다.

꼬인 코일 구조를 본 발명의 폴리펩티드에 대하여 이루어질 수 있는 아미노산 치환에 관한 가이던스는 도 5 및 6 뿐만 아니라, 표 6 내지 10에서 제공된다. 본원에서 제공되는 실험 데이타에 기초한, 예측상의 유용한 아미노산 치환체가 어쨌든 표 1에서 제공되는 예시적인 치환과 상충하는 경우, 실험 데이타에 기초한 치환을 사용하는 것이 바람직하다.

본 발명의 폴리펩티드의 꼬인 코일 구조는 특히, 헵타드중 아미노산 위치 a, d 및 e에 고함량의 알라닌 잔기를 갖는다. 그러나, 위치 b, c, f 및 g 또한 고빈도로 알라닌 잔기를 갖는다. 바람직한 실시태양에서, 헵타드중 아미노산 위치 a, d 및/또는 e에 있는 아미노산 중 15% 이상, 더욱 바람직하게는, 25% 이상, 더욱 바람직하게는, 30% 이상, 더욱 바람직하게는, 40% 이상 및 더욱 더 바람직하게는, 50% 이상이 알라닌 잔기이다. 추가의 바람직한 실시태양에서, 헵타드중 a 및 d의 양 위치에 있는 아미노산 중 25% 이상, 더욱 바람직하게는, 30% 이상, 더욱 바람직하게는, 40% 이상 및 더욱 더 바람직하게는, 50% 이상이 알라닌 잔기이다. 추가로, 헵타드중 위치 b, c, f 및 g에 있는 아미노산 중 바람직하게는, 15% 이상, 더욱 바람직하게는, 20% 이상, 더욱 바람직하게는, 더욱 더 바람직하게는, 25% 이상이 알라닌 잔기이다.

전형적으로, 헵타드는 어느 프롤린 또는 히스티딘 잔기도 포함하지 않을 것이다. 추가로, 헵타드는 만약 있다 해도, 소수의(1 또는 2개) 페닐알라닌, 메티오닌, 티로신, 시스테인, 글리신 또는 트립토판 잔기를 포함할 것이다. 알라닌 이외의, 헵타드내 공통(예컨대, 5% 초과, 더욱 바람직하게는, 10% 초과) 아미노산으로는류신(특히, 위치 b 및 d), 세린(특히, 위치 b, e 및 f), 글루탐산(특히, 위치 c, e 및 f), 리신(특히, 위치 b, c, d, f 및 g), 뿐만 아니라, 위치 g의 아르기닌을 포함한다.

본 발명의 폴리펩티드(및 폴리뉴클레오티드)는 매우 다양한 벌목 및 풀잠자리목 종으로부터 정제(분리)될 수 있다. 벌목의 일례로는 벌아목(벌, 개미 및 말벌)의 임의의 종을 포함하며, 이는 하기와 같은 곤충과: 청벌과(Chrysididae)(뻐꾸기벌), 개미과(Formicidae)(개미), 개미벌과(Mutillidae)(개미벌), 대모벌과(Pompilidae)(거미 말벌), 배벌과(Scoliidae), 말벌과(Vespidae) (종이 말벌, 포터 말벌, 호박벌), 무화과 말벌과(Agaonidae)(무화과 말벌), 수중다리좀벌과(Chalcididae)(수중다리좀벌), 개미살이좀벌과(Eucharitidae)(개미살이좀벌), 벼룩좀벌과(Eupelmidae)(벼룩좀벌), 금좀벌과(Pteromalidae)(금좀벌), 호리벌과(Evaniidae)(호리벌), 고치벌과, 맵시벌과(맵시벌), 가위벌과(Megachilidae), 꿀벌과(Apidae), 어리 꿀벌과(Colletidae), 꼬마꽃벌과(Halictidae) 및 털보애꽃벌과(Melittidae)(오일 채집 벌)을 포함하나, 이에 한정되지 않는다. 풀잠자리목의 일례로는 하기 곤충과: 사마귀붙이과(Mantispidae), 풀잠자리과(Chrysopidae)(풀잠자리), 명주잠자리과(Myrmeleontidae)(명주잠자리) 및 뿔잠자리과(Ascalaphidae)(뿔잠자리)로부터의 종을 포함하나, 이에 한정되지 않는다. 그러한 추가의 폴리펩티드(및 폴리뉴클레오티드)는 봄부스 테레스트리스, 미르메시아 포르피카타, 오에코필라 스마라그디나 및 말라다 시그나타로부터 유래된 실크에 대하여 본원에 기술된 것과 동일한 방법을 사용하여 특징될 수 있다.

추가로, 원하는 경우, 비천연 아미노산 또는 화학적 아미노산 유사체가 본 발명의 폴리펩티드내로 치환체 또는 첨가체로서 도입될 수 있다. 그러한 아미노산으로는 일반적으로 공통 아미노산의 D-이성체, 2,4-디아미노부티르산, α-아미노 이소부티르산, 4-아미노부티르산, 2-아미노부티르산, 6-아미노 헥사노산, 2-아미노 이소부티르산, 3-아미노 프로피온산, 오르니틴, 노르류신, 노르발린, 하이드록시프롤린, 사코신, 시트룰린, 호모시트룰린, 시스테인산, t-부틸글리신, t-부틸알라닌, 페닐글리신, 사이클로헥실알라닌, β-알라닌, 플루오로-아미노산, 변조 아미노산 예를 들면, β-메틸 아미노산, Cα-메틸 아미노산, Nα-메틸 아미노산 및 아미노산 유사체를 포함하나, 이에 한정되지 않는다.

또한, 합성시 또는 합성 이후에, 예로서, 바이오틴화, 벤질화, 당화, 아세틸화, 인산화, 아미드화, 보호기/차단기에 의한 유도체화, 단백질분해 절단, 항체 분자 또는 다른 세포 리간드에 연결 등에 의해 차별적으로 변형된 본 발명의 폴리펩티드는 본 발명의 범주 내에 포함된다. 이들 변형은 본 발명의 폴리펩티드의 안정성 및/또는 생체활성을 증가시키는 역할을 할 수 있다.

본 발명의 폴리펩티드는 천연 폴리펩티드의 생산 및 회수, 재조합 폴리펩티드의 생산 및 회수 및 폴리펩티드의 화학적 합성을 비롯한 다양한 방법으로 생산될 수 있다. 하나의 실시태양에서, 본 발명의 분리된 폴리펩티드는 폴리펩티드를 생산하는데 유효한 조건하에서 폴리펩티드를 발현시킬 수 있는 세포를 배양하고, 폴리펩티드를 회수함으로써 생산된다. 배양에 바람직한 세포는 본 발명의 재조합 세포이다. 유효한 배양 조건으로는 폴리펩티드 생산을 허용하는 유효 배지, 생체 반응 장치, 온도, pH 및 산소 조건을 포함한다. 유효 배지란 그 안에서 세포가 배양됨으로써 본 발명의 폴리펩티들 생산하게 되는 임의의 배지를 지칭한다. 그러한 배지는 전형적으로 동화될 수 있는 탄소, 질소 및 인산염 공급원 및 적절한 염, 미네랄, 금속 및 다른 영양소, 예를 들면, 비타민을 갖는 수성 배지를 포함한다. 본 발명의 세포는 종래의 발효 생체 반응 장치, 진탕 플라스크, 시험관, 미량역가 디쉬 및 페트리판에서 배양될 수 있다. 재조합 세포에 적합한 온도, pH 및 산소 함량하에 배양이 수행될 수 있다. 그러한 배양 조건은 당업계의 숙련인의 전문적 기술내 포함된다.

폴리뉴클레오티드

본 발명자는 DNA, RNA, 또는 그의 조합, 단일 또는 이중 가닥, 센스 또는 안티센스 배향 또는 양 둘의 조합, dsRNA 등을 비롯한 "단리된 폴리뉴클레오티드"를 그의 본래의 상태로 함께 회합하거나 연결된 폴리뉴클레오티드 서열로부터 적어도 부분적으로 분리된 폴리뉴클레오티드라고 정의한다. 단리된 폴리뉴클레오티드는 그들이 자연적으로 함께 회합하고 있는 다른 성분들로부터 바람직하게는, 60% 이상 유리, 바람직하게는, 75% 이상 유리 및 가장 바람직하게는, 90% 이상 유리된 것이다. 추가로, "폴리뉴클레오티드"라는 용어는 본원에서 "핵산"이라는 용어와 상호교환적으로 사용된다.

폴리뉴클레오티드와 관련하여 "외인성"이라는 용어는 폴리뉴클레오티드가 그의 본래의 상태와 비교하여 양이 변경되어 세포에, 또는 무세포 발현 시스템에 존재할 때의 폴리뉴클레오티드를 지칭한다. 하나의 실시태양에서, 세포는 자연적으로 폴리뉴클레오티드를 포함하지 않는 세포이다. 그러나, 세포는 코딩된 폴리펩티드의 생산량을 변경, 바람직하게는 증가시키는 비-내인성 폴리뉴클레오티드를 포함하는 세포일 수 있다. 본 발명의 외인성 폴리뉴클레오티드로는 그가 존재하는 트랜스제닉(재조합) 세포, 또는 무세포 발현 시스템의 다른 성분들로부터 분리되지 않는 폴리뉴클레오티드 및 상기 세포, 또는 무세포 시스템에서 생산된 후, 이어서 적어도 몇몇의 다른 성분들로부터 정제되는 폴리뉴클레오티드를 포함한다.

폴리뉴클레오티드 일치도(%)는 갭 생성 패널티=5 및 갭 확장 패널티=0.3으로 GAP[Needleman and Wunsch, 1970) 분석(GCG 프로그램)에 의해 측정된다. 달리 명시되지 않는 한, 질의 서열의 길이는 45개 이상의 뉴클레오티드이고, GAP 분석은 45개 이상의 뉴클레오티드 부위에 대하여 2개의 서열을 정렬한다. 바람직하게는, 질의 서열의 길이는 150개 이상의 뉴클레오티드이고, GAP 분석은 300개 이상의 뉴클레오티드 부위에 대하여 2개의 서열을 정렬한다. 더욱 바람직하게는, 질의 서열의 길이는 150개 이상의 뉴클레오티드이고, GAP 분석은 300개 이상의 뉴클레오티드 부위에 대하여 2개의 서열을 정렬한다. 더욱 더 바람직하게는, GAP 분석은 2개 서열의 전장에 대하여 2개의 서열을 정렬한다.

정의된 폴리뉴클레오티드와 관련하여, 상기 제공된 것보다 더 높은 일치도 값(%)이 바람직한 실시태양을 포함할 것이라는 것도 이해될 것이다. 따라서, 해당되는 경우, 최소 일치도 값(%)을 고려해 볼 때, 폴리뉴클레오티드는 관련하여 지명된 서열 번호와 40% 이상, 더욱 바람직하게는, 45% 이상, 더욱 바람직하게는, 50% 이상, 더욱 바람직하게는, 55% 이상, 더욱 바람직하게는, 60% 이상, 더욱 바람직하게는, 65% 이상, 더욱 바람직하게는, 70% 이상, 더욱 바람직하게는, 75% 이상, 더욱 바람직하게는, 80% 이상, 더욱 바람직하게는, 85% 이상, 더욱 바람직하게는, 90% 이상, 더욱 바람직하게는, 91% 이상, 더욱 바람직하게는, 92% 이상, 더욱 바람직하게는, 93% 이상, 더욱 바람직하게는, 94% 이상, 더욱 바람직하게는, 95% 이상, 더욱 바람직하게는, 96% 이상, 더욱 바람직하게는, 97% 이상, 더욱 바람직하게는, 98% 이상, 더욱 바람직하게는, 99% 이상, 더욱 바람직하게는, 99.1% 이상, 더욱 바람직하게는, 99.2% 이상, 더욱 바람직하게는, 99.3% 이상, 더욱 바람직하게는, 99.4% 이상, 더욱 바람직하게는, 99.5% 이상, 더욱 바람직하게는, 99.6% 이상, 더욱 바람직하게는, 99.7% 이상, 더욱 바람직하게는, 99.8% 이상 및 더욱 더 바람직하게는, 99.9% 이상 일치하는 아미노산 서열을 포함한다.

본 발명의 폴리뉴클레오티드는 자연적으로 발생된 분자와 비교할 때, 뉴클레오티드 잔기의 결실, 삽입, 또는 치환이라는 하나 이상의 돌연변이를 가질 수 있다. 돌연변이체는 자연적으로 발생된 것이거나(즉, 천연 공급원으로부터 단리된 것), 합성일 수 있다(예컨대, 핵산 상에서의 자리-지정 돌연변이 유발에 의해).

본 발명의 올리고뉴클레오티드 및/또는 폴리뉴클레오티드는 엄격한 조건하에서 본 발명의 실크 유전자, 또는 상기 유전자 측면에 위치하는 부위에 혼성화한다. 본원에서 사용되는 바, "엄격한 혼성화 조건" 등은 올리고뉴클레오티드 길이에 따른 혼성화 온도의 변화를 비롯한 당업계의 통상적인 파라미터를 지칭한다. 핵산 혼성화 파라미터는 상기 방법이 작성되어 있는 참조 문헌에서 찾아볼 수 있다([Sambrook, et al. (상기 동일)] 및 [Ausubel, et al. (상기 동일)]). 예컨대, 본원에서 사용되는 바, 엄격한 혼성화 조건은 혼성화 완충액(3.5 x SSC, 0.02% 피콜, 0.02% 폴리비닐 피롤리돈, 0.02% 소 혈청 알부민(BSA: Bovine Serum Albumin), 2.5mM NaH₂PO₄ (pH 7), 0.5% SDS, 2mM EDTA)중 65℃에서 혼성화한 후, 0.2 x SSC, 0.01% BSA중 50℃에서 1회 이상 세척하는 것을 지칭한다. 별법으로, 핵산 및/또는 올리고뉴클레오티드("프라이머" 또는 "프로브"로서도 지칭될 수 있다)는 핵산 증폭 기법, 예를 들면, PCR에 사용되는 조건하에서 관심의 대상이 되는 곤충의 게놈, 예를 들면, 꿀벌의 게놈에 혼성화한다.

본 발명의 올리고뉴클레오티드는 RNA, DNA, 또는 그의 유도체일 수 있다. 폴리뉴클레오티드 및 올리고뉴클레오티드라는 용어는 중복되는 의미를 갖지만, 올리고뉴클레오티드는 전형적으로 상대적으로 짧은 단일 가닥 분자이다. 그러한 올리고뉴클레오티드의 최소 크기는 올리고뉴클레오티드와 표적 핵산 분자 상의 상보적인 서열 사이의 안정적인 하이브리드 형성을 위해 필요한 크기이다. 올리고뉴클레오티드 길이는 바람직하게는, 15개 이상의 뉴클레오티드, 더욱 바람직하게는, 18개 이상의 뉴클레오티드, 더욱 바람직하게는, 19개 이상의 뉴클레오티드, 더욱 바람직하게는, 20개 이상의 뉴클레오티드, 더욱 더 바람직하게는, 25개 이상의 뉴클레오티드이다.

보통, 폴리뉴클레오티드 또는 올리고뉴클레오티드 단량체는 포스포디에스테르 결합 또는 그의 유사체에 의해 연결됨으로써, 크기 범위가 상대적으로 짧은 단량체 단위, 예로서, 12-18개부터 수백 여개의 단량체 단위인 올리고뉴클레오티드를 형성한다. 포스포디에스테르 결합의 유사체로는 포스포로티오에이트, 포스포로디티오에이트, 포스포로셀레노에이트, 포스포로디셀레노에이트, 포스포로아닐로티오에이트, 포스포라닐리데이트, 포스포라미데이트를 포함한다.

본 발명은 예컨대, 핵산 분자를 동정하는 프로브, 또는 핵산 분자를 생산하는 프라이머로서 사용될 수 있는 올리고뉴클레오티드를 포함한다. 프로브로서 사용되는 본 발명의 올리고뉴클레오티드는 전형적으로 검출 가능한 표지, 예를 들면, 방사성 동위 원소, 효소, 바이오틴, 형광 분자, 또는 화학발광 분자에 접합된다.

재조합 벡터

본 발명의 하나의 실시태양은 숙주 세포 내로 폴리뉴클레오티드 분자를 전달할 수 있는 임의의 벡터 내로 삽입되는 본 발명의 1종 이상의 단리된 폴리뉴클레오티드 분자를 포함하는 재조합 벡터를 포함한다. 그러한 벡터는, 자연적으로는 본 발명의 폴리뉴클레오티드 분자에 인접해서는 발견되지 않고, 바람직하게는, 폴리뉴클레오티드 분자(들)이 유래되는 종 이외의 종으로부터 유래된 것인, 이종 폴리뉴클레오티드 서열을 함유한다. 벡터는 RNA 또는 DNA, 원핵 또는 진핵성일 수 있고, 전형적으로는 트랜스포존(예를 들면, US 5,792,294에 기재되어 있는 것), 바이러스, 또는 플라스미드이다.

한 유형의 재조합 벡터는 발현 벡터에 작동 가능하게 연결되어 있는 본 발명의 폴리뉴클레오티드 분자를 포함한다. 작동 가능하게 연결되어 있다라는 표현은 폴리뉴클레오티드 분자가 숙주 세포 내로 형질전환되었을 때에 발현될 수 있는 방식으로 발현 벡터 내로 폴리뉴클레오티드 분자가 삽입되는 것을 지칭한다. 본원에서 사용되는 바, 발현 벡터는 숙주 세포를 형질전환시킬 수 있고, 특정 폴리뉴클레오티드 분자를 발현시킬 수 있는 DNA 또는 RNA 벡터이다. 바람직하게는, 발현 벡터는 또한 숙주 세포 내에서 복제될 수 있다. 발현 벡터는 원핵 또는 진핵성일 수 있고, 전형적으로는 바이러스 또는 플라스미드이다. 본 발명의 발현 벡터는 박테리아, 진균, 내부 기생충, 절지동물, 동물 및 식물 세포를 비롯한 본 발명의 재조합 세포에서 작용을 하는(즉, 유전자 발현 지시) 임의의 벡터를 포함한다. 본 발명의 특히 바람직한 발현 벡터는 식물 세포에서 유전자 발현을 지시할 수 있다. 본 발명의 벡터는 또한 무세포 발현 시스템에서 폴리펩티드를 생산하는데 사용될 수 있고, 그러한 시스템은 당업계에 잘 알려져 있다.

특히, 본 발명의 발현 벡터는 조절 서열, 예를 들면, 전사 조절 서열, 번역 조절 서열, 복제기점 및 재조합 세포와 상용성이고, 본 발명의 폴리뉴클레오티드 분자의 발현을 조절하는 다른 조절 서열을 포함한다. 특히, 본 발명의 재조합 분자는 전사 조절 서열을 포함한다. 전사 조절 서열은 전사의 개시, 연장 및 종결을 조절하는 서열이다. 특히 중요한 전사 조절 서열은 전사 개시를 조절하는 것, 예를 들면, 프로모터, 인핸서, 오퍼레이터 및 리프레서 서열를 포함한다. 적합한 전사 조절 서열은 1종 이상의 본 발명의 재조합 세포에서 작용할 수 있는 임의의 전사 조절 서열을 포함한다. 다양한 상기 전사 조절 서열은 당업자에게 알려져 있다. 바람직한 전사 조절 서열은 박테리아, 효모, 절지동물, 식물 또는 포유동물 세포에서 작용하는 것, 예를 들면, tac, lac, trp, trc, oxy-pro, omp/lpp, rrnB, 박테리오파지 람다, 박테리오파지 T7, T7lac, 박테리오파지 T3, 박테리오파지 SP6, 박테리오파지 SP01, 메탈로티오네인, 알파-메이팅 인자, 피치아(Pichia) 알코올 옥시다제, 알파바이러스 아게놈성 프로모터(예를 들면, 신드비스(Sindbis) 바이러스 아게놈성 프로모터), 항생제 내성 유전자, 배큘로바이러스, 헬리코베르파 지아(Heliothis zea) 곤충 바이러스, 백시나 바이러스, 헤르페스바이러스, 라쿤 폭스바이러스, 다른 폭스바이러스, 아데노바이러스, 거대 세포 바이러스(예를 들면, 중간 초기 프로모터), 원숭이 바이러스 40, 레트로바이러스, 액틴, 레트로바이러스 말단의 긴 반복부, 라우스 육종바이러스, 열 쇼크, 인산염 및 질산염 전사 조절 서열 뿐만 아니라, 원핵 또는 진핵에서 유전자 발현을 조절할 수 있는 다른 서열을 포함하나, 이에 한정되지 않는다.

특히 바람직한 전사 조절 서열은 식물 또는 그의 일부분의 사용에 따라 구성적으로, 또는 단계별로 및/또는 조직 특이적으로 식물에서 전사를 지시하는데 활성을 띤 프로모터이다. 이들 식물 프로모터로는 구성(constitutive) 발현을 나타내는 프로모터, 예를 들면, 콜리플라워 모자이크 바이러스(CaMV: Cauliflower Mosaic Virus)의 35S 프로모터, 잎-특이 발현을 위한 것, 예를 들면, 리불로스이인산 카르복실라제 소단위체(small subunit) 유전자의 프로모터, 뿌리-특이 발현을 위한 것, 예를 들면, 글루타민 신타제 유전자로부터의 프로모터, 종자-특이 발현을 위한 것, 예를 들면, 브라시카 나푸스(Brassica napus)로부터의 크루시페린 프로모터, 괴경-특이 발현을 위한 것, 예를 들면, 감자로부터의 제I 부류 파타틴 프로모터, 또는 과실-특이 발현을 위한 것, 예를 들면, 토마토로부터의 폴리갈락투로나제(PG: polygalacturonase) 프로모터를 포함한다.

본 발명의 재조합 분자는 또한 (a) 본 발명의 발현된 폴리펩티드가 폴리펩티드를 생산하는 세포로부터 분비될 수 있도록 하는 분비 신호(즉, 신호 세그먼트 핵산 서열)를 함유할 수 있고/거나, (b) 융합 단백질로서 본 발명의 핵산 분자를 발현시키는 융합 서열을 함유할 수 있다. 적합한 신호 세그먼트의 일례로는 본 발명의 폴리펩티드의 분비를 지시할 수 있는 임의의 신호 세그먼트를 포함한다. 바람직한 신호 세그먼트로는 조직 플라스미노겐 활성제(t-PA: tissue plasminogen activator), 인터페론, 인터루킨, 성장 호르몬, 바이러스 인벨럽 당단백질 신호 세그먼트, 니코티아나 넥타린(Nicotiana nectarin) 신호 펩티드(US 5,939,288), 타바코 확장 신호, 대두 올레오신 오일체 결합 단백질 신호, 아라비도프시스 탈리아나(Arabidopsis thaliana) 액포 염기성 키티나제 신호 펩티드 뿐만 아니라, 본 발명의 폴리펩티드의 본래의 신호 서열을 포함하나, 이에 한정되지 않는다. 또한, 본 발명의 핵산 분자는 코딩된 폴리펩티드를 프로테오좀으로 보내는 융합 세그먼트, 예를 들면, 유비퀴틴 융합 세그먼트에 결합될 수 있다. 재조합 분자는 또한 본 발명의 핵산 서열 주변의 그리고/또는 그 안의 개재 서열 및/또는 비번역 서열을 포함할 수 있다.

숙주 세포

본 발명의 또다른 실시태양으로는 하나 이상의 본 발명의 재조합 분자, 그의 자손 세포로 형질전환된 숙주 세포를 포함하는 재조합 세포를 포함한다. 폴리뉴클레오티드 분자를 세포로 형질전환시키는 것은 폴리뉴클레오티드 분자를 세포 내로 삽입시킬 수 있는 임의의 방법에 의해 수행될 수 있다. 형질전환 기법으로는 형질감염, 전기천공, 미세주입, 리포펙션, 흡착 및 원형질체 융합을 포함하나, 이에 한정되지 않는다. 재조합 세포는 단세포 남아 있을 수 있거나, 조직, 기관 또는 다세포 유기체로 성장할 수 있다. 형질전환된 본 발명의 폴리뉴클레오티드 분자는 염색체 밖에 남아 있을 수 있거나, 발현되는 그의 능력이 유지되는 방식으로 형질전환된(즉, 재조합) 세포의 염색체내의 하나 이상의 부위로 통합될 수 있다.

형질전환시키는데 적합한 숙주 세포로는 본 발명의 폴리뉴클레오티드로 형질전환될 수 있는 임의의 세포를 포함한다. 본 발명의 숙주 세포는 본 발명의 폴리펩티드를 내인적으로(즉, 자연적으로) 생산할 수 있거나, 1종 이상의 본 발명의 폴리뉴클레오티드 분자로 형질전환된 후에 상기 폴리펩티드를 생산할 수 있다. 본 발명의 숙주 세포는 1종 이상의 본 발명의 단백질을 생산할 수 있는 임의의 세포일 수 있고, 박테리아, 진균(효모 포함), 기생충, 절지동물, 동물 및 식물 세포를 포함한다. 숙주 세포의 일례로는 살모넬라(Salmonella), 에스케리키아(Escherichia), 바실러스(Bacillus), 리스테리아(Listeria), 사카로미세스(Saccharomyces), 스포돕테라(Spodoptera), 마이코박테리아(Mycobacteria), 트리코플러시아(Trichoplusia), BHK(baby hamster kidney) 세포, MDCK 세포, CRPK 세포, CV-I 세포, COS(예로서, COS-7) 세포 및 베로(Vero) 세포를 포함한다. 숙주 세포의 추가의 일례로는 E. 콜라이 K-12 유도체를 비롯한 E. 콜라이; 살모넬라 티피(Salmonella typhi); 약독화된 균주를 비롯한 살모넬라 티피무리엄(Salmonella typhimurium); 스포돕테라 프루지페르다(Spodoptera frugiperda); 트리코플루시아 니(Trichoplusia ni) 및 비-발암성 마우스 근육모세포 G8 세포(예로서, ATCC CRL 1246)이다. 추가의 적절한 포유동물 세포 숙주로는 기타 확장 세포주, 기타 섬유모세포 세포주(예로서, 인간, 뮤린 또는 닭 배아 섬유모세포 세포주), 골수종 세포주, 차이니즈 햄스터 난소 세포, 마우스 NIH/3T3 세포, LMTK 세포 및/또는 HeLa 세포를 포함한다. 특히 바람직한 숙주 세포는 식물 세포, 예를 들면, 도이췌 잠룽 폰 미크로오르가니스멘 운트 첼쿨투렌 게엠베하(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH)(져먼 콜렉션 오브 마이크로오가니즘 앤드 셀 컬쳐(German Collection of Microorganisms and Cell Cultures))로부터 이용가능한 것이다.

예컨대, 숙주 세포 내에서 폴리뉴클레오티드 분자의 카피수를 조작하고, 폴리뉴클레오티드 분자가 전사되는 효율을 조작하고, 생성된 전사체가 번역되는 효율을 조작하고, 번역 후 변형 효율을 조작함으로써 형질전환된 폴리뉴클레오티드 분자의 발현을 개선시키기 위하여 재조합 DNA 기술을 사용할 수 있다. 본 발명의 폴리뉴클레오티드 분자의 발현을 증가시키는데 유용한 재조합 기법으로는 폴리뉴클레오티드 분자를 카피수가 높은 플라스미드로 작동 가능하게 연결시키는 것, 폴리뉴클레오티드 분자를 하나 이상의 숙주 세포 염색체 내로 통합시키는 것, 벡터 안정성 서열을 플라스미드에 첨가하는 것, 전사 조절 신호(예로서, 프로모터, 오퍼레이터, 인핸서)를 치환 또는 변형시키는 것, 번역 조절 신호(예로서, 리보솜 결합 부위, 샤인-달가노(Shine-Dalgarno) 서열)를 치환 또는 변형시키는 것, 본 발명의 폴리뉴클레오티드 분자를 숙주 세포의 코돈 용도에 상응하도록 변형시키는 것 및 전사체를 불안정화시키는 서열을 결실시키는 것을 포함하나, 이에 한정되지 않는다.

트랜스제닉 식물

"식물"이라는 용어는 식물 전체, 식물 기관(예로서, 잎, 줄기, 뿌리 등), 종자, 식물 세포 등을 지칭한다. 본 발명의 실시에서의 사용을 위해 고려되는 식물로는 외떡잎식물 및 쌍떡잎식물, 이들 모두를 포함한다. 표적 식물로는 곡류(밀, 보리, 호밀, 귀리, 벼, 수수 및 관련 작물); 비트(사탕무 및 사료용 비트); 이과, 핵과 및 연실류(사과, 배, 자두, 복숭아, 아몬드 , 체리, 딸기, 라스베리 및 블랙-베리); 콩과 식물(강낭콩, 렌즈콩, 완두콩, 대두); 유지 식물(평지, 머스타드, 양귀비, 올리브, 해바라기, 코코넛, 피마자유 식물, 코코아 빈, 땅콩); 오이 식물(페포호박, 오이, 메론); 섬유 식물(목화, 아마, 대마, 황마); 감귤류(오렌지, 레몬, 자몽, 만다린귤나무); 채소류(시금치, 상추, 아스파라거스, 양배추, 당근, 양파, 토마토, 감자, 파프리카); 녹나무과(아보카도, 계피, 장뇌); 또는 식물, 예를 들면, 옥수수, 타바코, 너트, 커피, 사탕수수, 홍차, 덩국식물, 홉, 잔디, 바나나 및 천연 고무 식물 뿐만 아니라, 관상용(화초, 관목, 활엽수 및 상록수, 예를 들면, 침엽수)을 포함하나, 이에 한정되지 않는다.

본 발명과 관련하여 정의된 바와 같이, 트랜스제닉 식물은 원하는 식물 또는 식물 기관에서 1종 이상의 본 발명의 폴리펩티드를 생산할 수 있도록 재조합 기법을 사용하여 유전적으로 변형된 식물(뿐만 아니라 상기 식물의 세포) 및 그의 자손을 포함한다. 트랜스제닉 식물은 당업계에 알려져 있는 기법, 예를 들면, 일반적으로, ([A. Slater et al., Plant Biotechnology - The Genetic Manipulation of Plants, Oxford University Press (2003)] 및 [P. Christou and H. Klee, Handbook of Plant Biotechnology, John Wiley and Sons (2004)])에 기재되어 있는 것을 사용하여 생산될 수 있다.

본 발명의 폴리뉴클레오티드는 트랜스제닉 식물에서 모든 발생 단계 동안 구성적으로 발현될 수 있다. 식물 또는 식물 기관 용도에 따라, 폴리펩티드는 단계-특이 방식으로 발현될 수 있다. 추가로, 폴리뉴클레오티드는 조직-특이적으로 발현될 수 있다.

식물에서 관심의 대상이 되는 폴리펩티드를 코딩하는 유전자를 발현시키는 것으로 알려져 있거나, 그런 것으로 밝혀진 조절 서열이 본 발명에 사용될 수 있다. 사용되는 조절 서열을 선택하는 것은 관심의 대상이 되는 표적 식물 및/또는 표적 기관에 따라 달라진다. 그러한 조절 서열은 식물 또는 식물 바이러스로부터 수득할 수 있거나, 화학적으로 합성될 수 있다. 그러한 조절 서열은 당업자에게 잘 알려져 있다.

구성 식물 프로모터가 잘 알려져 있다. 앞서 언급된 프로모터 이외에, 몇몇 다른 적합한 프로모터로는 노팔린 신타제 프로모터, 옥토파인 신타제 프로모터, CaMV 35S 프로모터, 리불로스-1,5-이인산염 카르복실라제 프로모터, Adh1-기재 pEmu, Act1, SAM 신타제 프로모터 및 Ubi 프로모터 및 엽록소 a/b 결합 단백질의 프로모터를 포함한다. 별법으로, 트랜스 유전자(들)가 조절되는 양식으로 발현될 필요가 있을 수 있다. 가능하게는, 조직-특이적, 발생-특이적이거나, 유도성인 프로모터의 조절하에 실크 단백질의 코딩 서열을 배치함으로써 폴리펩티드 발현을 조절할 수 있다. 수개의 조직-특이적으로 조절되는 유전자 및/또는 프로모터가 식물에 있어서 보고되어 있다. 이들은 종자 저장 단백질(예를 들면, 나핀, 크루시페린, β-콘글리시닌, 글리시닌 및 파세올린), 제인 또는 오일체 단백질(예를 들면, 올레오신)을 코딩하는 유전자, 또는 지방산 생합성(아실 캐리어 단백질, 스테아로일-ACP 데사투라제 및 지방산 데사투라제(fad 2-1) 포함) 에 관여하는 유전자 및 배아 발생시 발현되는 기타 유전자(예를 들면, Bce4)를 포함한다. 완두콩 비실린 프로모터가 종자-특이 발현에 특히 유용하다. 완전히 자란 잎에서 발현에 유용한 다른 프로모터는 노화 발생시 켜지는 프로모터, 예를 들면, 아라비도프시스로부터의 SAG 프로모터이다. 개화시, 또는 개화기 동안, 과실 발생시를 거쳐, 적어도 익기 시작할 때까지 발현되는 과실-특이 프로모터 부류는 US 4,943,674에서 논의된 바 있다. 조직-특이 프로모터에 관한 다른 일례로는 구근에서의 발현을 지시하는 것(예컨대, 파타틴 유전자 프로모터), 섬유 세포에서의 발현을 지시하는 것(발생적으로 조절된 섬유 세포 단백질의 일례는 E6 섬유이다)을 포함한다.

예를 들면, 종결자 서열 및 폴리아데닐화 신호와 같은 다른 조절 서열로는 식물에서의 것과 같은 작용을 하는 임의의 서열을 포함하고, 그를 선택하는 것은 숙련인에게는 자명할 것이다. 발현 카세트에 사용되는 종결 부위는 상대적으로 교환가능한 것으로 보이기 때문에 대개 편의상 선택될 것이다. 사용되는 종결 부위는 전사 개시 부위와의 본래의 것일 수 있거나, 관심의 대상이 되는 폴리뉴클레오티드 서열과의 본래의 것일 수 있거나, 또다른 공급원으로부터 유래될 수 있다. 종결 부위는 자연적으로 발생된 것일 수 있거나, 전체 또는 부분적으로 합성된 것일 수 있다. 편리한 종결 부위는 A. 투메파시엔스(A. tumefaciens)의 Ti-플라스미드로부터 이용가능한 것, 예를 들면, 옥토파인 신타제 및 노팔린 신타제 종결 부위, 또는 β-파세올린의 유전자인, 화학적으로 유도성인 lant 유전자, pIN로부터 이용가능한 것이다.

관심의 대상이 되는 폴리펩티드를 코딩하는 핵산 서열을 함유하는 발현 작제물을 표적 식물로 도입시키기 위하여 수개의 기법이 이용될 수 있다. 그러한 기법으로는 칼슘/폴리에틸렌 글리콜 방법, 전기천공 및 미세주사 또는 (코팅된) 입자 충격(bombardment)을 사용한 원형질체의 형질전환을 포함한다. 이른바 직접 DNA 형질전환 방법 이외에도, 벡터를 포함하는 형질전환 시스템, 예를 들면, 바이러스 및 박테리아 벡터(예로서, 애그로박테리움(Agrobacterium) 속으로부터의 것)가 광범위하게 사용될 수 있다. 선택 및/또는 선별 이후, 형질전환되는 원형질체, 세포 또는 식물 부는 당업계에 공지된 방법을 사용하여 식물 전체에서 재생될 수 있다. 형질전환 및/또는 재생 기법을 선택하는 것은 본 발명에 있어 중요치 않다.

트랜스제닉 세포 및 식물에 트랜스 유전자가 존재하는지를 확인하기 위하여 당업자에게 알려져 있는 방법을 사용하여 중합효소 연쇄 반응(PCR: polymerase chain reaction) 증폭 또는 써던 블롯 분석을 실시할 수 있다. 트랜스 유전자의 발현 산물은 산물의 성질에 따라 다양한 방법들중 임의의 것으로 검출될 수 있고, 웨스턴 블롯 및 효소 검정법을 포함한다. 상이한 식물 조직에서의 단백질 발현을 정량하고, 복제를 검출하는데 특히 유용한 방법은 리포터 유전자, 예를 들면, GUS를 사용하는 것이다. 일단 트랜스제닉 식물을 수득하면, 원하는 표현형을 갖는 식물 조직 또는 식물 부를 생산하도록 재배할 수 있다. 식물 조직 또는 식물 부를 수확할 수 있고/거나, 종자를 수집할 수 있다. 종자는 원하는 특징이 있는 조직 또는 부를 갖는 추가의 식물을 재배하기 위한 근원으로서의 역할을 할 수 있다.

인간을 제외한 트랜스제닉 동물

트랜스제닉 동물을 생산하는 기법은 당업계에 잘 알려져 있다. 본 주제에 관하여 유용한 일반 서적은 [Houdebine, Transgenic animals - Generation and Use (Harwood Academic, 1997)]이다.

이종 DNA는 예컨대, 포유동물의 수정란으로 도입될 수 있다. 예를 들면, 전능성 또는 다능성 줄기 세포는 미세주사, 인산칼슘 매개 침강, 리포좀 융합, 레트로바이러스 감염 또는 다른 수단에 의해 형질전환될 수 있고, 이어서, 형질전화된 세포는 배아로 도입된 후, 배아는 트랜스제닉 동물로 발생한다. 매우 바람직한 방법에서 원하는 DNA를 함유하는 레트로바이러스로 발생중인 배아를 감염시키고, 감염된 배아로부터 트랜스제닉 동물을 생산한다. 그러나, 가장 바람직한 방법에서 적절한 DNA는 바람직하게 단세포 단계에서 배아의 전핵 또는 세포질로 공주입되고, 배아는 성숙한 트랜스제닉 동물로 발생할 수 있다.

트랜스제닉 동물을 생산하는데 사용되는 또다른 방법으로는 표준 방법에 의해 전핵 단계의 난으로 핵산을 미세주입하는 것을 포함한다. 이어서, 주입된 난은 상상 임신한 수혜자의 수란관으로 전달되기 이전에 배양된다.

트랜스제닉 동물은 또한 핵 전달 기술에 의해 생산될 수 있다. 이러한 방법을 사용으로 기증 동물로부터의 섬유모 세포는 조절 서열의 조절하에서 관심의 대상이 되는 결합 도메인 또는 결합부에 대한 코딩 서열을 혼입하고 있는 플라스미드로 안정적으로 형질감염된다. 이어서 안정적인 형질감염체는 제핵 난모세포로 융합되고, 배양되고 암컷 수혜자로 전달된다.

실크 회수 방법 및 생산

본 발명의 실크 단백질은 다양한 방법으로 상기 단백질을 생산하는 예를 들면, 식물, 박테리아 또는 효모 세포와 같은 재조합 세포로부터 추출되고 정제될 수 있다. 하나의 실시태양에서, 상기 방법으로는 pH를 낮추고 열을 가한 후, 황산암모늄 분별법에 의해 균질화된 세포/조직/식물 등으로부터 본래의 세포 단백질을 제거하는 것을 포함한다. 간랸하게, 세포/조직/식물을 균질화하여 전 가용성 단백질을 추출한다. pH 4.7에서 침강시킨 후, 60℃에서 침강시켜 본래의 단백질을 제거한다. 이어서, 40% 포화도를 갖는 황산암모늄으로 생성된 상등액을 분별시킨다. 생성된 단백질은 대략 95% 순도가 될 것이다. 종래의 겔 또는 친화 크로마토그래피로 추가 정제를 달성할 수 있다.

또다른 일례로, 세포 용해물을 1시간 이상 동안 고농도의 산, 예로서, HCl 또는 프로피온산으로 처리하여 pH를 ~1-2 낮춤으로써 실크 단백질은 가용화시키지만, 다른 단백질은 침강시킨다.

단백질 농도가 임계값을 초과할 때, 원섬유 응집체는 본 발명의 실크 단백질의 자발적인 자가-조립에 의해 용액으로 형성될 것이다. (O'Brien et al.)[I. O'Brien et al., "Design, Synthesis and Fabrication of Novel Self-Assembling Fibrillar Proteins", in Silk Polymers: Materials Science and Biotechnology, pp. 104-117, Kaplan, Adams, Farmer and Viney, eds., c. 1994 by American Chemical Society, Washington, D. C]의 방법에 따라 모으고, 거시적 섬유로 기계적으로 방적할 수 있다.

고유의 꼬인 코일 2차 구조 성질상, 단백질, 예를 들면, 제노스피라1-4, BBF1-4, BAF1-4 및 GAF1-4는 탈수시 자발적으로 꼬인 코일 2차 구조를 형성할 것이다. 하기 기술하는 바와 같이, 꼬인 코일의 강도는 근접해 있는 리신 잔기의 효소적 또는 화학적 가교 결합을 통해 증강될 수 있다.

본 발명의 실크 섬유 및/또는 공중합체는 공정 요건이 낮다. 본 발명의 실크 단백질은, 예로서, 가교 결합 예를 들면, 리신 가교 결합으로 강화될 수 있는 강한 꼬인 코일을 자발적으로 형성함에 따라 강 섬유를 형성하는 방적과 같은 최소의 공정을 요구한다. 이는 섬유의 조(β-구조) 및 강도를 얻기 위해 복잡한 방적 기법을 필요로 하는 B. 모리(B. mori) 및 거미 재조합 실크 폴리펩티드와는 대조를 이룬다.

그러나, 섬유는 액체 결정상의 특징적인 성질을 갖는 용액으로부터 방적될 수 있다. 상 전이가 일어나는 섬유 농도는 용액내 존재하는 단백질의 조성 또는 단백질의 배합에 따라 달라진다. 그러나, 상 전이는 용액의 투명도와 복굴절을 모니터함으로써 검출될 수 있다. 교차된 편광 필터를 통해 관찰하였을 때 용액이 외관상 투명하고, 복굴절이 나타날 때 액체 결정상의 징후가 검출될 수 있다.

하나의 섬유 형성 기법에서는 먼저 기계적 수단에 의해 픽업되는 것의 길이가 충분할 때까지 메탄올로부터 오르피스를 통해 단백질 용액으로부터 섬유를 압출시킬 수 있다. 이어서, 메탄올 용액을 통해 상기의 기계적 수단에 의해서 섬유을 예인하고, 수집하고, 건조시킬 수 있다. 섬유 인발 방법은 당업계에 잘 알려져 있는 것으로 간주된다.

본 발명의 실크 섬유 및/또는 공중합체를 생산하기 위하여 사용될 수 있는 방법의 추가적인 일례로는 US 2004/0170827 및 US 2005/0054830에 기재되어 있다.

바람직한 실시태양에서, 본 발명의 실크 섬유 및/또는 공중합체는 가교 결합되어 있다. 하나의 실시태양에서, 실크 섬유 및/또는 공중합체는 당업계에 알려져 있는 기법을 사용하여 관심의 대상이 되는 표면/물품/제품 등에 가교 결합되어 있다. 또다른 실시태양에서 (또는 이전 실시태양과의 조합으로), 실크 섬유 및/또는 공중합체에서 적어도 몇몇의 실크 단백질은 서로서로에 대하여 가교 결합되어 있다. 바람직하게는, 실크 단백질은 단백질중 리신 잔기에서 가교 결합되어 있다. 그러한 사교결합은 당업계에 공지되어 있는 화학적 및/또는 효소적 기법을 사용하여 실시될 수 있다. 예컨대, 효소적 가교 결합은 리실 옥시다제에 의해 촉매화될 수 있는 반면, 비효소적 가교 결합은 당화된 리신 잔기에 의해 생성될 수 있다[Reiser et al., 1992].

항체

본 발명은 또한 본 발명의 폴리펩티드 또는 그의 단편에 대한 모노클로날 또는 폴리클로날 항체를 제공한다. 따라서, 본 발명은 추가로 본 발명의 폴리펩티드에 대한 모노클로날 또는 폴리클로날 항체를 생산하는 방법을 제공한다.

"특이적으로 결합"이라는 용어는 항체가 다른 공지 실크 단백질을 제외한, 1종 이상의 본 발명의 폴리펩티드에 결합할 수 있는 능력을 지칭한다.

본원에서 사용되는 바, "에피토프"라는 용어는 항체가 결합하는 본 발명의 폴리펩티드의 부위를 지칭한다. 에피토프에 대한 항체를 생성하기 위하여 에피토프를 동물에 투여할 수 있지만, 본 발명의 항체는 바람직하게 전체 폴리펩티드 맥락에서 에피토프 부위에 특이적으로 결합한다.

폴리클로날 항체가 바람직한 경우, 선택된 포유동물(예로서, 마우스, 래빗, 염소, 말 등)을 본 발명의 면역원성 폴리펩티드로 면역화시킨다. 면역화된 동물로부터 유래된 혈청을 수집하고, 공지 방법에 따라 처리한다. 폴리클로날 항체를 함유하는 혈청이 다른 항원에 대한 항체를 함유할 경우, 면역친화성 크로마토그래피에 의해 폴리클로날 항체를 정제할 수 있다. 폴리클로날 항혈청을 생산하고, 공정처리하는 기법이 당업계에 알려져 있다. 그러한 항체를 제조할 수 있도록 하기 위하여, 본 발명은 또한 동물에서 면역원으로서 사용하기 위한 것으로, 또다른 폴리펩티드에 합텐화된 본 발명의 폴리펩티드 또는 그의 단편을 제공한다.

본 발명의 폴리펩티드에 대한 모노클로날 항체 또한 당업자에 의해 용이하게 생산될 수 있다. 하이브리도마에 의해 모노클로날 항체를 제조하는 일반 방법론이 잘 알려져 있다. 세포 융합에 의해 및 다른 기법, 예를 들면, 종양원성 DNA로 B 림프구를 직접 형질전환시키는 것, 또는 엡스타인-바 바이러스로 형질감염시키는 것에 의해 불멸의 항체-생산 세포주를 생성할 수 있다. 생산된 모노클로날 항체 패널을 다양한 성질; 즉, 동형 및 에피토프 친화도에 대하여 선별할 수 있다.

대체 기법으로는 예컨대, 파지가 매우 다양한 상보성 결정 부위(CDR: complementarity determining region)를 포함하는 그의 코트 표면상에 scFv를 발현시키는, 파지 디스플레이 라이브러리를 선별하는 것을 포함한다. 이러한 기법은 당업계에 잘 알려져 있다.

본 발명의 목적을 위해, "항체"라는 용어는, 그와 반대로 기술되지 않는 한, 표적 항원에 대하여 그들의 결합 활성을 유지하는, 전체 항체의 단편을 포함한다. 그러한 단편은 Fv, F(ab') 및 F(ab')₂ 단편 뿐만 아니라, 단일 쇄 항체(scFv)를 포함한다. 추가로, 항체 및 그의 단편은 예컨대, EP-A-239400에 기재되어 있는 바와 같이 인간화된 항체일 수 있다.

본 발명의 항체는 적합한 시약, 대조군, 설명서 등과 함께 적합한 용기 내의 고체 지지체에 결합할 수 있고/거나, 키트 내로 패킹될 수 있다.

바람직하게는, 본 발명의 항체는 검출 가능하게 표지된다. 항체 결합을 직접적으로 측정할 수 있도록 하는, 검출 가능한 표지의 일례로는 방사성 동위 원소, 형광단, 염료, 자기 비드, 화학발광, 콜로이드성 입자 등을 포함한다. 결합을 간접적으로 측정할 수 있도록 하는 표지의 일례로는 기질이 착색된 산물 또는 형광 산물을 제공할 수 있는 효소를 포함한다. 추가의 예시적인 검출 가능한 표지로는 적합한 기질의 첨가 후, 검출 가능한 산물 신호를 제공할 수 있는 공유 결합된 효소를 포함한다. 접합체에 사용하기 적합한 효소의 일례로는 홀스래디시 퍼옥시다제, 알칼리성 포스파타제, 말레이트 탈수소효소 등을 포함한다. 상업적으로 이용할 수 없는 경우, 상기 항체-효소 접합체는 당업자에게 알려져 있는 기법에 의해 용이하게 생산된다. 추가의 예시적인 검출 가능 표지로는 고 친화도로 아비딘 또는 스트렙타비딘에 결합하는 바이오틴; 플루오로크롬(예로서, 피코빌리단백질, 피코에리트린 및 알로피코시아닌; 형광 표지 세포 분리기와 함께 사용될 수 있는 플루오레세인 및 텍사스 레드(Texas red)); 합텐 등을 포함한다. 바람직하게는, 검출 가능한 표지, 예로서, 플레티 루미노미터에서 직접 측정할 수 있도록 한다. 본 발명의 폴리펩티드를 검출하기 위하여 상기와 같이 표지된 항체가 당업계에 공지된 기법에 사용될 수 있다.

조성물

본 발명의 조성물은 "허용 가능한 담체"를 포함할 수 있다. 그러한 허용 가능한 담체의 일례로는 물, 염수, 링거액, 덱스트로스 용액, 핸크 용액 및 기타의 생리학적으로 균형잡힌 염 수용액을 포함한다. 비수용성 비히클, 예를 들면, 고정유, 참깨유, 에틸 올레이트 및 트리글리세리드 또한 사용될 수 있다.

하나의 실시태양에서, "허용 가능한 담체"는 "약제학적으로 허용 가능한 담체"이다. 약제학적으로 허용 가능한 담체라는 용어는 동물, 특히, 포유동물 및 더욱 특히, 인간에게 투여되었을 때 알레르기성, 독성, 또는 다른 유해한 부작용을 일으키지 않는 분자 엔티티 및 조성물을 지칭한다. 유용한 약제학적으로 허용 가능한 담체 또는 희석제의 일례로는 용매, 분산 매질, 코팅제, 안정화제, 보호성 콜로이드제, 접착성, 증점제, 점탄성 조절제, 투과제, 격리제 및 본 발명의 폴리펩티드의 활성에는 영향을 미치지 않는 등장화제 및 흡추 지연제를 포함하나, 이에 한정되지 않는다. 예컨대, 코팅제, 예를 들면, 레시틴을 사용함으로써, 분산제의 경우, 필요한 입자 크기를 유지시킴으로써 및 계면활성제를 사용함으로써 적절한 유동성이 유지될 수 있다. 더욱 일반적으로, 본 발명의 폴리펩티드는 일반적인 제법에 상응하는 임의의 비-독성 고체 또는 액체의 첨가제와 함께 배합될 수 있다.

본원에서 개요된 바와 같이, 몇몇 실시태양에서, 본 발명의 폴리펩티드, 실크 섬유 및/또는 공중합체는 약제학적으로 허용 가능한 담체로서 사용된다.

다른 적합한 조성물은 구체적으로 본 발명의 폴리펩티드의 특정 용도에 관하여 하기에 기술된다.

용도

실크 단백질은 인성 및 강도가 뛰어나기 때문에 신규한 생체 적합 물질의 생성에 유용하다. 그러나, 현재의, 거미 및 곤충의 섬유 단백질은 거대 단백질이고(10O kDa 초과), 이들은 고도로 반복성인 아미노산 서열로 구성된다. 이들 단백질은, 특히 재조합 시스템에서 생산을 어렵게 만드는, 고도로 편재된 코돈을 함유하는 거대 유전자에 의해 코딩된다. 반대로, 본 발명의 실크 단백질은 짧고, 비-반복성이다. 이러한 성질을 통해 상기 단백질을 코딩하는 유전자는 특히 신규한 생체 적합 물질의 생산을 위한 것으로서 관심의 대상이 된다.

본 발명의 실크 단백질, 실크 섬유 및/또는 공중합체는 광범위하고 다양하게 의료용, 군용, 산업용 및 상업용으로 사용될 수 있다. 섬유는 의료 장치, 예를 들면, 봉합사, 피부 이식편, 세포 성장 매트릭스, 대체 인대 및 외과용 메쉬 제조에, 그리고, 매우 다양한 산업용품 및 상업용품, 예컨대, 케이블, 로프, 망, 낚시줄, 의류 섬유, 방탄 조끼 안감, 용기용 섬유, 배낭(backpack), 배낭(knapsack), 가방 또는 지갑 끈, 접착성 결합재, 비-접착성 결합재, 스트래핑재, 텐트 섬유, 타포린, 수영장 덮개, 자동차 덮개, 울타리의 재료, 밀폐제, 구성재, 방수재, 가요성 파티션 재료, 스포츠 장치에; 및, 사실상, 그에 대한 바람직한 특징이 높은 인장 강도와 탄력성인, 거의 모든 섬유 또는 섬유 사용에 사용될 수 있다. 본 발명의 실크 단백질, 실크 섬유 및/또는 공중합체는 또한 예를 들면, 미용화장품, 피부 관리, 모발 관리 및 모발 염색제와 같은 개인 관리 제품용 조성물; 및 예를 들면, 안료와 같은 입자 코팅제에 사용된다.

실크 단백질은 그들 본래의 형태로 사용될 수 있거나, 더 많은 유익한 효과를 제공하는 유도체를 형성하기 위하여 변형될 수 있다. 예컨대, 실크 단백질은 US 5,981,718 및 US 5,856,451에 기재되어 있는 것과 같이, 알레르기 유발성을 감소시키기 위하여 중합체에 접합됨으로써 변형될 수 있다. 적합한 변형 중합체로는 폴리알킬렌 옥시드, 폴리비닐 알코올, 폴리-카복실레이트, 폴리(비닐피롤리돈) 및 텍스트란을 포함하나, 이에 한정되지 않는다. 또다른 일례로, 실크 단백질은 선택적인 분해와, 다른 단백질 개질제의 스플라이싱에 의해 변형될 수 있다. 예컨대, 약 60℃의 승온하에서 산으로 처리함으로써 실크 단백질은 보다 작은 펩티드로 절단될 수 있다. 유용한 산으로는 묽은 염산, 황산, 또는 인산을 포함하나, 이에 한정되지 않는다. 별법으로, 염기, 예를 들면, 수산화나트륨으로 처리함으로써 실크 단백질이 분해될 수 있거나, 적합한 프로테아제를 사용하는 효소 분해가 사용될 수 있다.

단백질은 개인 관리 제품의 특정 용도에 유익한 성능 특징을 제공하도록 추가 변형될 수 있다. 개인 관리 제품용으로 단백질을 변형시키는 것은 당업계에 잘 알려져 있다. 예컨대, 통상 사용되는 방법은 US 6,303,752, US 6,284,246 및 US 6,358,501에 기재되어 있다. 변형의 일례로는 수-유 에멀젼 증진을 촉진시키기 위한 에톡실화, 친유성의 상용성을 제공하는 실옥실화 및 비누 및 세제 조성물과의 상용성을 돕는 에스테르화를 포함하나, 이에 한정되지 않는다. 게다가, 실크 단백질은 아민, 옥시란, 시아네이트, 카복실산 에스테르, 실리콘 공중합체, 실록산 에스테르, 4급 아민 지방성 화합물, 우레탄, 폴리아크릴아미드, 디카르복실산 에스테르 및 할로겐화된 에스테르를 포함하나, 이에 한정되지 않는, 작용기로 유도체화될 수 있다. 실크 단백질은 또한 디이민과의 반응에 의해 및 금속 염 형성에 의해 유도체화될 수 있다.

상기의 "폴리펩티드"(및 "단백질")의 정의와 같이, 상기의 유도체화되고/거나 변형된 분자 또한 본원에서는 광범위하게 "폴리펩티드" 및 "단백질"로서 지칭된다.

본 발명의 실크 단백질은 다른 섬유 유형과 함께 방적될 수 있고/거나, 다발화되거나 편조될 수 있다. 일례로 중합성 섬유(예로서, 폴리프로필렌, 나일론, 폴리에스테르), 다른 식물 및 동물 근원의 섬유 및 실크(예로서, 면, 울, 봄빅스 모리 또는 거미 실크) 및 유리 섬유를 포함하나, 이에 한정되지 않는다. 바람직한 실시태양은 10% 폴리프로필렌 섬유와 편조된 실크 섬유이다. 본 발명은 상기 섬유 배합물의 생산을 용이하게 실시함으로써, 일반적으로 의료용, 산업용 또는 상업용 섬유의 제조와 생산에서 추구될 수 있는 것으로, 예로서, 외관, 연성, 중량, 내구성, 발수성, 제조비용 개선과 같은 임의의 바람직한 특징들을 증진시킬 수 있다는 것에 주시하고 있다.

개인 관리 제품

미용화장품 및 피부 관리 조성물은 화장용으로 허용 가능한 매질중 유효량의 실크 단백질을 포함하는 무수 조성물일 수 있다. 이들 조성물의 용도로는 피부 관리, 피부 클렌징, 메이크-업 및 주름 방지 제품을 포함하나, 이에 한정되지 않는다. 미용화장품 및 피부 관리 조성물용 실크 단백질의 유효량은 본원에서 조성물 총 중량에 대하여 약 10^-4 내지 약 30 중량%, 그러나, 바람직하게 약 10^-3 내지 15 중량%의 비율로서 정의된다. 이러한 비율은 미용화장품 또는 피부 관리 조성물 타입의 작용에 따라 달라질 수 있다. 화장용으로 허용 가능한 매질에 적합한 조성물은 US 6,280,747에 기재되어 있다. 예컨대, 화장용으로 허용 가능한 매질은 일반적으로 조성물 총 중량에 대하여 약 10 내지 약 90 중량%의 비율로 지방 물질을 함유할 수 있으며, 지방산은 1종 이상의 액체, 고체 또는 반-고체 지방 물질을 함유한다. 지방 물질로는 오일, 왁스, 검 및 이른바 페이스트형 지방 물질을 포함하나, 이에 한정되지 않는다. 별법으로, 조성물은 안정적인 분산액, 예를 들면, 유중수 또는 수중유 에멀젼의 형태로 존재할 수 있다. 게다가, 조성물은 항산화제, 방부제, 충진제, 계면활성제, UVA 및/또는 UVB 썬스크린, 방향제, 증점제, 습윤제 및 음이온성, 비이온성 또는 양쪽성 중합체 및 염료 또는 안료를 비롯한, 하나 이상의 종래 미용화장품 또는 피부과학적 첨가제 또는 애주번트를 함유할 수 있다.

유화 미용화장품 및 본 발명의 1종 이상의 실크 단백질을 포함하며 유화된 물질 용도로 생산가능한 유사 약물로는 예컨대, 클렌징 미용화장품(미용 비누, 훼이셜 워시, 샴푸, 린스 등), 모발 관리 제품(모발 염료, 모발 미용화장품 등), 기초 미용화장품(일반 크림, 에멀젼, 면도 크림, 컨디셔너, 코롱, 면도 로션, 미용화장품 오일, 훼이셜 마스크 등), 메이크-업 미용화장품(파운데이션, 눈썹 펜슬, 아이 크림, 아이쉐도우, 마스카라 등), 방향 미용화장품(향수 등), 태닝 및 썬스크린 미용화장품(태닝 및 썬스크린 크림, 태닝 및 썬스크린 로션, 태닝 및 썬스크린오일 등), 손톱용 미용화장품(손톱 크림 등), 아이라이너 미용화장품(아이라이너 등), 입술용 미용화장품(립스틱, 립 크림 등), 구강 관리 제품(치약 등), 목욕용 미용화장품(목욕 제품 등) 등을 포함한다.

미용화장품 조성물은 또한 예를 들면, 매니큐어와 같은, 손톱 관리용 제품의 형태로 존재할 수 있다. 본원에서 매니큐어는 화장용으로 허용 가능한 매질중 유효량의 실크 단백질을 포함하는 손톱 손질 및 착색용 조성물로서 정의된다. 매니큐어 조성물로 사용하기 위한 실크 단백질의 유효량은 본원에서 매니큐어 총 중량에 대하여 약 10^-4 내지 약 30 중량%의 비율로서 정의된다. 매니큐어용으로 허용 가능한 매질의 성분은 US 6,280,747에 기재되어 있다. 매니큐어는 전형적으로 용매 및 필름 형성 물질, 예를 들면, 셀룰로스 유도체, 폴리비닐 유도체, 아크릴 중합체 또는 공중합체s, 비닐 공중합체 및 폴리에스테르 중합체와 같은 필름 형성 물질을 함유한다. 조성물은 또한 유기 또는 무기 안료를 함유할 수 있다.

모발 관리용 조성물은 본원에서, 화장용으로 허용 가능한 매질중 유효량의 실크 단백질을 포함하는 것으로서, 샴푸, 컨디셔너, 로션, 에어로졸, 겔 및 무스를 포함하나, 이에 한정되지 않는 모발 손질용 조성물로서 정의된다. 모발 관리 조성물로 사용하기 위한 실크 단백질의 유효량은 본원에서 조성물 총 중량에 대하여 약 10^-2 내지 약 90 중량%의 비율로서 정의된다. 모발 관리 조성물용으로 화장용으로 허용 가능한 매질의 성분은 US 2004/0170590, US 6,280,747, US 6,139,851 및 US 6,013,250에 기재되어 있다. 예컨대, 이들 모발 관리 조성물은 수성, 알코올성 또는 수성-알코올성 용액일 수 있고, 알코올은 바람직하게 에탄올 또는 이소프로판올일 수 있고, 수성-알코올성 용액일 경우, 총 중량에 대하여 약 1 내지 약 75 중량% 의 비율로 존재할 수 있다. 게다가, 모발 관리 조성물은 상기 제공된 것과 같은 하나 이상의 종래 미용화장품 또는 피부과학적 첨가제 또는 애주번트를 함유할 수 있다.

모발 착색용 조성물은 본원에서, 화장용으로 허용 가능한 매질중 유효량의 실크 단백질을 포함하는 것으로서, 모발 착색, 염색, 또는 탈색용 조성물로서 정의된다. 모발 착색용 조성물로 사용하기 위한 실크 단백질의 유효량은 본원에서 조성물 총 중량에 대하여 약 10^-4 내지 약 60 중량%의 비율로서 정의된다. 모발 착색용 조성물용으로 화장용으로 허용 가능한 매질의 성분은 US 2004/0170590, US 6,398,821 및 US 6,129,770에 기재되어 있다. 예컨대, 모발 착색용 조성물은 일반적으로 무기 과산소-기재 염료 산화제 및 산화 용이성 착색제의 혼합물을 포함한다. 과산소-기재 염료 산화제는 가장 통상적으로 과산화수소이다. 산화적 모발 착색제는 1차 중간체(예컨대, p-페닐렌디아민, p-아미노페놀, p-디아미노피리딘, 하이드록시인돌, 아미노인돌, 아미노티미딘, 또는 시아노페놀)를 2차 중간체(예컨대, 페놀, 레조르시놀, m-아미노페놀, m-페닐렌디아민, 나프톨, 피라졸론, 하이드록시인돌, 카테콜 또는 피라졸)와 산화적으로 커플링시킴으로써 형성된다. 게다가, 모발 착색용 조성물은 산화성 산, 격리제, 안정화제, 증점제, 완충제 담체, 계면활성제, 용매, 항산화제, 중합체, 비-산화성 염료 및 컨디셔너를 함유할 수 있다.

실크 단백질은 또한 미용화장품 및 코팅 조성물에서 사용하기 위한 입자의 분산성을 개선시키기 위하여 안료 및 미용화장품 입자를 코팅하는데 사용될 수 있다. 미용화장품 입자는 본원에서 예를 들면, 미용화장품 조성물에 사용되는 안료 또는 불활성 입자와 같은 미립자 물질로서 정의된다. 적합한 안료 및 미용화장품 입자는 무기 착색 안료, 유기 안료 및 불활성 입자를 포함하나, 이에 한정되지 않는다. 무기 착색 안료로는 이산화티탄, 산화아연 및 철, 마그네슘, 코발트 및 알루미늄 산화물을 포함하나, 이에 한정되지 않는다. 유기 안료로는 D&C 레드 번호 36호, D&C 오렌지 번호 17호, D&C 레드 번호 7호, 11호, 31호 및 34호의 칼슘 레이트, D&C 레드 번호 12호의 바륨 레이크, D&C 레드 번호 13호의 스트론튬 레이크, FD&C 옐로우 번호 5호의 알루미늄 레이크 및 탄소 블랙 입자를 포함하나, 이에 한정되지 않는다. 불활성 입자로는 탄산칼슘, 알루미늄규산염, 칼슘규산염, 마그네슘규산염, 운모, 활석, 황산바륨, 황산칼슘, 분말형 나일론(Nylon)™, 과불소화 알칸 및 다른 불활성 플라스틱을 포함하나, 이에 한정되지 않는다.

실크 단백질은 또한 치실에 사용될 수 있다(예컨대, US 2005/0161058을 참조할 수 있다). 치실은 단일필라멘트 사(yarn) 또는 다중필라멘트 사일 수 있고, 상기 섬유는 꼬여 있거나, 그렇지 않을 수 있다. 치실은 개별 조각으로서 패킹되어 있거나, 임의의 원하는 길이대로 조각을 절단할 수 있도록 하는 커터를 포함하는 롤로 캐핑될 수 있다. 치실은 스트립 및 쉬트 등을 포함하나, 이에 한정되지 않는, 미세섬유 이외의 다양한 형상으로 제공될 수 있다. 치실은 상이한 물질, 예를 들면, 제한하는 것은 아니지만, 왁스, 치실용 폴리테트라플루오로에틸렌 단일필라멘트 사로 코팅될 수 있다.

실크 단백질은 또한 비누에 사용될 수 있다(예컨대, US 2005/0130857을 참조할 수 있다).

안료 및 미용화장품 입자 코팅제

안료 및 미용화장품 입자 코팅제로 사용하기 위한 실크 단백질의 유효량은 본원에서 입자의 건식 중량에 대하여 약 10^-4 내지 약 50 중량%, 바람직하게는, 약 0.25 내지 약 15 중량%의 비율로서 정의된다. 사용되는 실크 단백질의 최적량은 코팅되는 안료 또는 미용화장품 입자의 유형에 따라 달라진다. 예컨대, 무기 착색 안료와 함께 사용되는 실크 단백질의 양은 바람직하게 약 0.01% 내지 20 중량% 사이이다. 유기 안료의 경우, 실크 단백질의 바람직한 양은 약 1% 내지 약 15 중량% 사이인 반면, 불활성 입자의 경우, 바람직한 양은 약 0.25% 내지 약 3 중량% 사이이다. 코팅되는 안료 및 입자의 제조 방법은 US 5,643,672에 기재되어 있다. 이들 방법은 실크 단백질 수용액을 텀블링 또는 혼합시키면서 입자에 첨가하는 것, 실크 단백질 및 입자 슬러리를 형성하고 건조시키는 것, 입자 상에서 실크 단백질 용액을 분무 건조시키거나, 실크 단백질 및 입자 슬러리를 동결건조시키는 것을 포함한다. 이들 코팅된 안료 및 미용화장품 입자가 미용화장품 제제, 페인트, 잉크 등에 사용될 수 있다.

생체 의학 제품

실크 단백질은 상처 치유를 촉진시키기 위한, 붕대 상의 코팅제로서 사용될 수 있다. 이러한 적용을 위해, 붕대 재료는 유효량의 실크 단백질로 코팅된다. 상처-치유용 붕대를 위한 실크 단백질의 유효량은 본원에서 붕대 재료에 대하여 약 10^-4 내지 약 30 중량%의 비율로서 정의된다. 코팅되는 재료는 임의로 연성, 생물학적으로 불활성, 다공성 피륙 또는 섬유일 수 있다. 일례로 면, 실크, 레이온, 아세테이트, 아크릴, 폴리에틸렌, 폴리에스테르 및 그의 조합을 포함하나, 이에 한정되지 않는다. 피륙 또는 섬유를 코팅하는 것은 당업계에 알려져 있는 다수의 방법에 의해 수행될 수 있다. 예컨대, 코팅시키고자 하는 물질을, 실크 단백질을 함유하는 수용액에 침지시킬 수 있다. 별법으로, 분무 총을 사용하여 피복시키고자 하는 물질의 표면 상에 실크 단백질을 함유하는 용액을 분무시킬 수 있다. 게다가, 롤러 코트 인쇄 공정을 사용하여 실크 단백질을 함유하는 용액을 표면 상에 코팅시킬 수 있다. 상처 붕대는 요오드, 요오드화칼륨, 포비돈요오드, 아크리놀, 과산화수소, 염화벤즈알코늄 및 클로로헥시딘; 치료 촉진제, 예를 들면, 알란토인, 염산디부카인 및 클로로페닐아민 말산염; 혈관수축제, 예를 들면, 염화나파졸린; 수렴제, 예를 들면, 산화아연; 및 크러스트 발생제, 예를 들면, 붕산을 포함하나, 이에 한정되지 않는 다른 첨가제를 포함할 수 있다.

본 발명의 실크 단백질은 또한 상처 드레싱 물질로서 필름 형태로 사용될 수 있다. 무정형 필름 형태의 상처 드레싱 물질로서의 실크 단백질의 용도는 US 6,175,053에 기재되어 있다. 무정형 필름은 유효량의 실크 단백질을 포함하며, 결정도가 10% 미만인 조밀한 비다공성 필름을 포함한다. 상처 관리용 필름을 위해, 실크 단백질의 유효량은 본원에서 약 1 내지 99 중량% 사이로 정의된다. 필름은 또한 상기 기술된 것과 같은, 다른 단백질, 예를 들면, 세리신 및 소독제, 치료 촉진제, 혈관수축제, 수렴제 및 크러스트 발생제를 포함하나, 이에 한정되지 않는 다른 성분들을 함유할 수 있다. 다른 단백질, 예를 들면, 세리신은 조성물의 1 내지 99 중량%를 포함할 수 있다. 열거된 다른 성분들의 양은 조성물의 총 약 30 중량% 미만, 더욱 바람직하게 약 0.5 내지 20 중량% 미만이 바람직하다. 상처 드레싱 필름은 수용액중 상기 언급한 물질을 용해시키고, 여과 또는 원심분리에 의해 불용성 물질을 제거하고, 예를 들면, 아크릴 판과 같은 매끄러운 고체 표면상에 용액을 캐스팅한 후 건조시킴으로써 제조될 수 있다.

본 발명의 실크 단백질은 또한 봉합사에 사용될 수 있다(예컨대, US 2005/0055051을 참조할 수 있다). 그러한 봉합사는 초고분자량 섬유 및 실크 섬유로 제조된 편조 재킷을 특징으로 할 수 있다. 폴리에틸렌이 강도를 제공한다. 폴리에스테르 섬유는 고분자량 폴리에틸렌과 직조됨으로써 고정시키는 성질을 개선시킬 수 있다. 실크는 봉합 인식 및 표시가 개선되었음을 추적할 수 있도록 하는 대비색으로 제공될 수 있다. 실크는 또한 다른 섬유보다도 더 조직에 대하여 순응성을 띠고, 이로써 봉합사 끝단과 주변 조직 사이의 유해한 상호작용에 관하여 걱정할 필요없이, 끝단을 매듭에 가깝게 자를 수 있다. 고강도 봉합사의 성질을 취급하는 것은 또한 봉합사를 코팅하는 다양한 물질을 사용함으로써 증진될 수 있다. 봉합사는 유리하게는 에치본드(Ethibond) 번호 5호 봉합사의 강도를 갖지만, 직경, 촉감 및 고정능은 번호 2호 봉합사의 것을 갖는다. 결과적으로, 봉합사는 대부분의 정형외과 수술, 예를 들면, 회전 근개 회복, 아킬레스건 회복, 슬개 건 회복, ACL/PCL 재건술, 엉덩이 및 어깨 재건술 및 봉합 고정 장치내에 또는 그와 함께 사용되는 대체술에 대하여 이상적인 것이다. 봉합사는 코팅되지 않을 수 있거나, 예컨대, 브레이드의 윤활성, 매듭 보호, 또는 내마모성을 개선시키기 위하여 왁스(밀랍, 석랍, 폴리에틸렌 왁스, 또는 기타), 실리콘(다우 코닝(Dow Corning) 실리콘 유체 202A 또는 기타), 실리콘 고무, PBA(부틸레이트 산), 에틸 셀룰로스(Filodel) 또는 다른 코팅제로 코팅시킬 수 있다.

본 발명의 실크 단백질은 또한 스텐트에 사용될 수 있다(예컨대, US 2004/0199241를 참조할 수 있다). 예컨대, 관내 스텐트 및 이식편을 포함하는 스텐트 이식편을 제공하며, 여기에서, 스텐트 이식편은 실크를 포함한다. 실크는 스텐트 이식편을 받는 숙주에서 반응을 유도하며, 여기에서, 반응이 실크 스텐트 이식편과, 실크 스텐트 이식편의 실크에 인접한 숙주 조직 사이의 부착을 증진시킬 수 있다. 실크는 임의의 다양한 수단들중 임의의 것, 예로서, 실크를 이식편으로 섞어 짜거나, 실크를 이식편에 부착시킴으로써(예로서, 접착제에 의해 또는 봉합사에 의해) 이식편에 접착시킬 수 있다. 실크는 실, 편조, 쉬트, 분말 등의 형태로 존재할 수 있다. 스텐트 이식편 상의 실크의 위치에 있어서, 실크는 스텐트 외면에만 접착될 수 있고/거나, 실크는 숙주에서 이웃 조직에 대한 원위 부위를 안정하게 하는데 도움을 주기 위하여 스텐트 이식편의 원위 부위에 접착될 수 있다. 본 발명과 관련하여, 원하는 치료 부위와 성질에 따라 매우 다양한 스텐트 이식편이 사용될 수 있다. 스텐트 이식편은 예컨대, 분지형 또는 관상 이식편, 원통형 또는 첨형, 자가-확장형 또는 풍선-확자형, 단일체, 또는 모듈러 등일 수 있다.

실크 이외에도, 스텐트 이식편은 실크중 일부 또는 모두 위에 코팅제를 함유할 수 있는데, 상기 코팅제는 스텐트 이식편이 숙주내로 삽입될 때 분해됨으로써, 실크와 숙주 사이의 접촉을 지연시킬 수 있다. 적합한 코팅제로는 제한없이 젤라틴, 분해성 폴리에스테르(예로서, PLGA, PLA, MePEG-PLGA, PLGA-PEG-PLGA 및 그의 공중합체 및 혼화물), 셀룰로스 및 셀룰로스 유도체(예로서, 하이드록시프로필 셀룰로스), 다당질(예로서, 하이알유론산, 덱스트란, 황산덱스트란, 키노산), 지질, 지방산, 당 에스테르, 핵산 에스테르, 폴리무수물, 폴리오르토에스테르 및 폴리비닐알코올(PVA: polyvinylalcohol)을 포함한다. 실크를 함유하는 스텐트 이식편은 생물학적 활성제(약물)를 함유할 수 있는데, 여기에서, 상기 약제는 스텐트 이식편으로 방출되고, 스텐트 이식편이 삽입되는 숙주에서 세포 반응의 증진을 유도하고/거나(예로서, 세포 또는 세포외 기질 침전), 섬유소성 반응의 증진을 유도한다.

본 발명의 실크 단백질은 또한 생체외에서 인대 및 건 생산을 위한 매트릭스에 사용될 수 있다(예컨대, US 2005/0089552를 참조할 수 있다). 실크-섬유-기재 매트릭스를 다능성 세포, 예를 들면, 골수 간질 세포(BMSC: bone marrow stromal cell)에 시딩할 수 있다. 생명공학 기술로 만들어진 인대 또는 건은 유리하게는 가해지는 기계적 힘 방향의 세포 배향 및/또는 매트릭스 권축 패턴과, 상기와 같은 힘이 가해질 경우, 기계적 힘 또는 자극에 의해 생성되는 기계적 하중의 축을 따라 I형 콜라겐, II형 콜라겐 및 섬유결합소 단백질을 비롯한 인대 및 건 특이 마커가 생산되는 것도 특징으로 한다. 바람직한 실시태양에서, 인대 또는 건은 나선형 구조로 배열된 섬유 다발이 존재하는 것을 특징으로 한다. 생산될 수 있는 인대 또는 건의 몇몇 일례로는 전방 십자 인대, 후방 십자 인대, 회전 근개 건, 팔꿈치 및 무릎의 내측 측부 인대, 손의 굽힘 건, 팔목 측부 인대 및 턱 또는 턱 관절 건 및 인대를 포함한다. 본 발명의 방법으로 생산될 수 있는 다른 조직은 연골(관절 및 반월상 모두), 골, 근육, 피부 및 혈관을 포함한다.

본 발명의 실크 단백질은 또한 하이드로겔에 사용될 수 있다(예컨대, US 2005/0266992를 참조할 수 있다). 실크 견섬유 하이드로겔은 조직 공학용 스캐폴드, 세포 배양용 기판, 상처 및 화상 드레싱, 연조직 치환체, 골 충진제 및,약제학적 또는 생물학적으로 활성인 화합물에 대한 지지체로서 사용할 수 있도록 하는 개공 구조를 특징으로 할 수 있다.

실크 단백질은 또한 피부과학적 조성물에 사용될 수 있다(예컨대, US 2005/0019297을 참조할 수 있다). 추가로, 본 발명의 실크 단백질 및 그의 유도체는 지효성 조성물에 사용될 수 있다(예컨대, US 2004/0005363을 참조할 수 있다).

직물

본 발명의 실크 단백질은 또한 직물로 추후에 사용되는 섬유 표면상에 적용될 수 있다. 이는 섬유 상에 단층의 단백질 필름을 제공함으로써 매끄러운 마감재를 얻을 수 있다. US 6,416,558 및 US 5,232,611에는 마감용 코트를 섬유에 가하는 것이 기재되어 있다. 이들 개시물에 기재되어 있는 방법은 섬유를 마감처리함으로써 우수한 촉감과 매끄러운 표면을 제공할 수 있도록 하는 다양한 일례들을 제공한다. 이러한 적용을 위해, 섬유를 유효량의 실크 단백질로 코팅한다. 직물용 섬유 코팅제를 위한 실크 단백질의 유효량은 본원에서 섬유재에 대하여 약 1 내지 약 99 중량%의 비율로서 정의된다. 섬유재로는 면직물 섬유, 폴리에스테르, 예를 들면, 레이온 및 라이크라(Lycra)™, 나일론, 양모 및 천연 실크를 비롯한 다른 천연 섬유를 포함하나, 이에 한정되지 않는다. 실크 단백질을 섬유 상에 적용시키는데 적합한 조성물은 공-용매, 예를 들면, 에탄올, 이소프로판올, 헥사플루오라놀, 이소티오시아노우라네이트 및 물과 함께 혼합되어 용액 또는 마이크로에멀젼을 형성할 수 있는 다른 극성 용매를 포함할 수 있다. 실크 단백질을 함유하는 용액을 섬유 상에 분무할 수 있거나, 섬유를 용액 내로 침지시킬 수 있다. 반드시 그러하지는 않지만, 코팅된 물질을 순간 건조시키는 것이 바람직하다. 대체 프로토콜은 실크 단백질 조성물을 직조 섬유 상에 적용시키는 것이다. 이러한 적용의 이상적인 실시태양은 예를 들면, 스타킹용으로 사용되는 연신성 위브를 코팅하기 위하여 실크 단백질을 사용하는 것이다.

복합재

실크 섬유는 패널 판지 및 다른 건축 자재 또는 성형 가구로서 및 목재와 입자 판지를 대신하는 벤치톱을 제조하기 위하여 폴리우레탄, 다른 수지 또는 열가소성 충진제에 첨가될 수 있다. 복합물은 또한 건물 및 자동차 건설, 특히, 옥사 및 문짝에 사용될 수 있다. 실크 섬유는 수지가 상기 자재를 더욱 강하게 만들고, 다른 입자 판자 및 복합 물질과 강도가 동일하거나 그보다 우수하지만 구조물의 중량은 보다 경량으로 할 수 있도록 강화시킨다. 실크 섬유는 분리된 것일 수 있고, 합성 복합물-형성 수지에 첨가될 수 있거나, 식물-유래의 단백질, 전분 및 오일과 함께 배합되어 사용됨으로써 생물학적-기재의 복합 물질을 생산할 수 있다. 상기 물질의 생산 공정은 JP 2004284246, US 2005175825, US 4,515,737, JP 47020312 및 WO 2005/017004에 기재되어 있다.

종이용 첨가제

본 발명의 실크의 섬유 성질이 제지에 강도와 질감을 가할 수 있다. 여분의 매끄러운 수제 종이를 제조하기 위하여 면 펄프에 실크사로 반문을 형성하여 제조된 실크지는 선물용 포장지, 노트북 커버, 쇼핑백용으로 사용된다. 본 발명의 실크 단백질을 포함할 수 있는 종이 제품에 관한 생산 공정은 일반적으로 JP 2000139755에 기재되어 있다.

고급재

본 발명의 실크는 상당한 인성을 갖고, 젖었을 때에 이러한 성질을 유지한다는 점에서 다른 실크보다도 뛰어나다[Hepburn et al., 1979].

의류 직물 산업에서 상당한 성장을 이룬 분야는 산업용 및 지능형 직물이다. 건강에 좋고, 고가치로 기능성이며, 환경 친화성인 개인용 섬유 제품에 대한 수요가 증가하고 있다. 섬유, 예를 들면, 젖었을 때 성질이 변하지 않는, 특히, 그의 강도와 연신성을 유지시키는 본 발명의 섬유는 스포츠복 및 레저복 뿐만 아니라, 작업복 및 보호 의류를 위한 기능성 의류에 유용하다.

무기와 감시 기술의 발전으로 개인 보호 장치 및 전투-분야와 관련된 시스템 및 구조에서 혁신이 일어났다. 예를 들면, 장기간 노출에 대한 물질의 내구성, 중무기 및 외부 환경으로부터의 보호와 같은 종래 요건 이외에도, 본 발명의 실크 직물은 탄도 발사체, 화약 및 화학 물질에 내성을 띠도록 공정처리될 수 있다. 상기 물질의 생산 공정은 WO 2005/045122 및 US 2005268443에 기재되어 있다.

실시예 1 - 말기의 최종 영 침샘 cDNA의 제조 및 분석

실크를 트립신으로 분해하여 수득한 펩티드의 이온 포착 연속 질량 스펙트럼(MS/MS) 단편화 패턴을 말기의 최종 영 유충의 침샘으로부터 단리된 cDNA에 의해 코딩된 단백질의 예측된 질량 스펙트럼 데이타와 매치시켜 진정 세요아목 및 풀잠자리목(아피스 멜리페라, 봄부스 테레스트리스, 미르메시아 포르피카타, 오에코필라 스마라그디나, 말라다 시그나타) 실크에서 발견된 단백질을 동정하였다. 이러한 꿀벌에 대한 분석으로 어떤 단백질도 결손되어 있지 않다는 것을 확인하기 위하여 펩티드 질량 스펙트럼 데이타 또한 6개의 리딩 프레임 모두에서 Ame13 꿀벌 게놈 서열의 벌 게놈 프로젝트 및 번역에 의해 예측된 아피스 멜리페라 단백질의 실제 트립신 분해물과 비교하였다.

꿀벌

가내 꿀벌통으로부터 아피스 멜리페라 유충을 수득하였다. 앞서, 아피스 멜 리페라에서의 실크 생산은 최종 영 후반부 동안 침샘으로 한정되는 것으로 나타났다[Silva-Zacarin et al., 2003]. 이 기간 동안, RNA는 상기 샘의 뒤 끝단부에 더욱 풍부해진다[Flower and Kenchington, 1967]. 인산염 완충처리된 염수에 침지된 말기의 5번째 영 아피스 멜리페라로부터 50개의 침샘을 입방체 모양의 세포 부위로 절개하였다. 절개된 샘의 뒤 끝단부를 즉시 RNAlater®(미국 텍사스주 오스틴에 소재하는 Ambion)에 놓음으로써 mRNA를 안정화시킨 후, 4℃에 저장하였다.

앰비온(Ambion)(미국 텍사스주 오스틴에 소재)으로부터 입수한 PCR 키트용 RNAqueous를 사용하여 말기의 최종 영 침샘으로부터 총 RNA(35㎍)를 단리시켰다. 제조사의 설명서에 따라, 인비트로겐(Invitrogen)(USA 캘리포니아주 캘즈배드에 소재)로부터 입수한 마이크로-패스트트랙(Micro-FastTrack)™ 2.0 mRNA 단리용 키트를 사용하여 총 RNA로부터 전령 RNA를 단리시키고, 단리된 mRNA는 10ul RNAse 유리수(free water)로 용출시켰다.

표준 프로토콜을 하기와 같이 변형시켜 인비트로겐(미국 캘리포니아주 칼스배드 소재)의 클론마이너(CloneMiner)™ cDNA 라이브러리 작제 키트를 사용하여 아피스 멜리페라 유충으로부터 단리된 mRNA로부터 cDNA 라이브러리를 작제하였다: 제1 가닥 합성을 위해 0.5㎕의 바이오틴-attB2-올리고(dT) 프라이머를 6pmol.㎕^-1로 및 0.5㎕의 dNTPs를 각각 2mM로 10㎕의 mRNA에 가하였다. 65℃에서 5분 동안, 이어서, 45℃에서 2분 동안 인큐베이션시킨 후, 2㎕ 5 X 제1 가닥 완충액, 1㎕의 0.1M DTT 및 0.5㎕ 수퍼스크립(Superscript)™ II RT를 200U.㎕^-1로 가하였다. 제2 가닥 합성을 위해, 시약 모두의 총 용량을 2등분하고, 에탄온 침전 후, cDNA를 5㎕의 DEPC-처리된 물에 재현탁시켰다. 총 용량 10㎕중 aatB1 어댑터(1㎕)를 16℃에서 48시간 동안 2㎕ 5X 어댑터 완충액, 1㎕ 0.1M DTT 및 1㎕ T4 DNA 리가제(1U.㎕^-1)와 함께 5㎕ cDNA에 결찰시키고, 16시간 후에 추가의 0.5㎕ T4 DNA 리가제(1U.㎕^-1)를 가하였다. 에탄올로 침전되는 300-500㎕로 용출시키면서 cDNA는 샘플을 사용하여 제조사의 설명서에 따라 크기 분별하고, 재현탁시키고, 권고에 따라 제공된 E. 콜라이 DH10B™ T1 파지 내성 세포로 형질전환시켰다. cDNA 라이브러리는 대략 1% 원래의 벡터와 함께 대략 1,200,000개의 콜로니 형성 단위(cfu: colony forming unit)를 포함하였다. 평균 삽입체 크기는 1.3 ± 1.4 kbp였다.

82개의 클론을 무작위로 선별하고, 게놈랩™ DTCS 퀵 스타트 키트(GenomeLab™ DTCS Quick start kit) (BeckmanCoulter, 미국 캘리포니아주 플러톤 소재)를 사용하여 서열화하고, CEQ8000 바이오래드(Biorad) 서열기로 이동시켰다. 이를 54개의 군으로 집단화하였다(표 2). 실크 단백질을 코딩하는 cDNA의 동정은 하기에 기술한다.

다른 종

앰비온(미국 텍사스주 오스틴 소재)으로부터 입수한 PCR 키트용 RNAqueous를 사용하여 4마리의 뒤영벌(봄부스 테레스트리스)(2㎍ RNA), 4마리의 불독 개미(미르메시아 포르피카타)(3㎍ RNA), 대략 100마리의 바느질 개미(오에코필라 스마라그디나(0.4㎍ RNA) 및 대략 50마리의 녹색 풀잠자리(말라다 시그나타)의 말기 유충 입 술샘으로부터 총 RNA를 단리시켰다. mRNA를 인비트로겐(미국 캘리포니아주 캘스배드)로부터 입수한 마이크로-패스트트랙™ 2.0 mRNA 단리용 키트를 사용하여 총 RNA로부터 최종 용량 10㎕의 물로 단리시켰다. cDNA 라이브러리는 인비트로겐(미국 캘리포니아주 캘스배드)의 클론마이너™ cDNA 키트를 사용하여 mRNA로부터 작제하고, 하기와 같이 표준 프로토콜을 변형하였다: 제1 가닥 합성을 위해 3pmol의 바이오틴-attB2-올리고(dT) 프라이머 및 1nmol의 각각의 dNTPs를 10㎕ mRNA에 가하였다. 65℃에서 5분 동안, 이어서, 45℃에서 2분 후에, 2㎕ 5 X 제1 가닥 완충액, 50nmol DTT 및 100U 수퍼스크립™ II RT를 가하였다.

표 2. SDS로 처리한 벌집 실크의 트립신 분해로부터 얻은 펩티드의 A. 멜리페라(A. mellifera) 최종 영 침샘 cDNA 및 MS 이온 트랩 단편화 패턴

제2 가닥 합성을 위해, 시약 모두의 총 용량을 제조사의 권고량으로부터 2등분하고, 에탄온 침전 후, cDNA를 5㎕의 DEPC-처리된 물에 재현탁시켰다. 총 용량 10㎕중 aatB1 어댑터(1㎕)를 16℃에서 12시간 동안 2㎕ 5X 어댑터 완충액, 50nmol DTT 및 1U T4 DNA 리가제와 함께 5㎕ cDNA에 결찰시켰다. cDNA 라이브러리는 불독 개미 및 뒤영벌 라이브러리의 경우 1% 미만의 원래의 벡터와 함께 및 녹색 개미 라이브러리의 경우 80% 초과의 원래의 벡터와 함께 대략 2.4 x 10⁷개(뒤영벌), 5.O x 10⁷개(불독 개미) 및 6000개(녹색 개미) 콜로니 형성 단위(cfu)를 포함하였다. 라이브러리내 평균 삽입체 크기는 1.3Kbp였다.

뒤영벌 및 불독 개미로부터 얻은 100개 초과의 무작위 클론, 꿀벌로부터의 82개의 클론 및 풀잠자리로부터의 60개의 클론으로부터 서열 데이타를 수득하였다. 미세한 녹색 개미(길이 대략 1mm)로부터 침샘을 수득하는데 갖는 기술상의 어려움으로 인해 이러한 종으로부터 얻은 라이브러리의 효율은 감소되었고, 따라서, 오직 40개의 서열만을 조사하였다. 동정된 실크 단백질에 관한 요약은 표 3으로 제공한다.

표 3. 진정 세요아목 실크 단백질의 동정 및 성질

실시예 2 - 천연 실크 제조 및 프로테옴 분석

유충 제거 후의 꿀벌 벌집, 유충 제거 후의 뒤영벌 고치, 유충 제거 후의 불독 개미 고치, 또는 바느질 개미 실크 구조물을 온수에서 3회에 걸쳐 철저하게 세척하여 수용성 오염물을 제거하고, 클로로포름에서 3회에 걸쳐 철저하게 세척하여 왁스를 제거하였다. 클로로포름은 증류수에서 세정하여 제거하고, 이러한 실크의 하위세트는 분석을 위해 유지시켰다. 누에 실크에서 고무 성질을 제거하는 표준 방법인 0.05% 탄산나트륨 용액에서 30분 동안 비등시켜 벌목(개미 및 벌) 실크 샘플의 하위세트를 추가로 세척한 후, 증류수에서 세정하였다. 풀잠자리 실크는 증류수 에서만 세정하였다. 0.05% 탄산나트륨 용액에서 30분 동안 비등시켜 풀잠자리 실크 샘플의 하위세트에서 고무 성질을 제거하였다.

꿀벌 물질의 하위세트를 95℃에서 밤새도록 2% SDS에 적신 후 증류수에서 3회에 걸쳐 세척하였다. 뜨거운 SDS 용액에서 추출하여 대부분의 단백질을 가용화시켰지만, 이 경우, 실크 구조물은 그의 그의 구조를 유지하였다.

하기 기술하는 바와 같이, 액체 크로마토그래피에 이어 연속 질량 분광법(LCMS: liquid chromatography followed by tandem mass spectrometry)에 의해 깨끗한 실크를 분석하였다.

세정된 실크 조각은 160ng의 서열화 등급 트립신(Promega)을 함유하는 25mM의 중탄산암모늄 20㎕이 첨가되는 각 웰의 바닥을 통해, C18 역상 크로마토그래피 매질의 플러그를 포함하는 96 웰 마이크로타이터 트레이인 밀리포어(Millipore) '집플레이트(zipplate)'의 웰에 놓았다. 이어서, 트레이를 30℃의 습윤화된 비닐 봉지에서 밤새도록 인큐베이션시켰다.

각 웰의 측면에 아세토니트릴(1O㎕)을 피펫팅하고, 상기 플레이타를 37℃에서 15분 동안 인큐베이션시켜 C18 물질을 습윤화시켰다. 포름산 용액(130㎕, 1% v/v)을 각 웰에 가하고, 30분 후, 저감 진공하에 플레이트의 베이스를 통해 각 웰로부터 용액을 천천히 인발함으로써 분해된 벌의 단백질로부터 유래된 펩티드를 포획하였다. 100㎕의 포름산 용액을 통해 인발하여 C18 물질을 2회에 걸쳐 세척하였다. C18 물질상에 직접 피펫팅된 70% 메탄올중의 6㎕의 1% 포름산으로 펩티드를 용출시키고, 즉시 내재 마이크로타이터 트레이에 대한 C18 플러그를 통해 원심분리하 였다. 증발에 의해 각 웰의 용적이 약 2-배로 감소될 때까지 상기 플레이를 진공하에 놓았다. 포름산 용액(10㎕)을 각 웰에 가하고, 트레이를 애질런트 1100 모세관 액체 크로마토그래피 시스템의 웰 플레이트 샘플러로 옮겼다.

실크 추출물로부터 유래된 펩티드(8㎕)를 1분 동안 0.1% 포름산/5% 아세토니트릴의 유속을 20㎕.분^-1으로 하여 애질런트 조르박스(Zorbax) SB-C18 5㎛ 150 x 0.5mm 칼럼에 결합시킨 후, 아세토니트릴의 농도를 증가시키면서 1분간에 걸쳐 0.1% 포름산/20% 아세토니트릴에 5㎕.분^-1으로, 이어서, 28분간에 걸쳐 0.1% 포름산/50% 아세토니트릴에, 이어서, 1분간에 걸쳐 0.1% 포름산/95% 아세토니트릴에 용출시켰다. 칼럼을 5분간에 걸쳐 20㎕.분^-1으로 0.1% 포름산/95%-100% 아세토니트릴을 사용하여 세척한 후, 다음 웰로부터 유래된 펩티드를 샘플링하기 앞서 7분 동안 0.1% 포름산/5% 아세토니트릴로 재평형화하였다.

미세분무기가 설비된 기기의 전기분무 이온 소스를 통해 칼럼으로부터의 용출액을 애질런트 XCT 이온 트랩 질량 분광계로 도입시켰다. 간략하면, 펩티드가 칼럼으로부터 용출됨에 따라 이온 트랩은 전체 스펙트럼 양성 이온 스캔(100-2200m/z)을 수집하고, 이어서, 오직 단일 전하만을 수반하는 이온이 선택되는 것을 방지하면서, 전체 스펙트럼에서 관찰되는 2개의 MS/MS 이온 스캔을 수집하였다. 이온을 MS/MS 분석을 위해 선택할 때에는 모든 다른 것은 이온 트랩으로부터 제외시키고, 선택된 이온은 기기에 관하여 권고된 "스마트프래그(SmartFrag)" 및 "펩티드 스캔(Peptide Scan)" 세팅에 따라 이온을 단편화시켰다. 일단 임의의 특정 m/z 값 에 대한 2개의 단편화 스펙트럼이 수집되면 중복 데이타가 수집되지 못하도록 추가의 30초 동안 분석을 위한 선택으로부터 제외시켰다.

전체 실험으로 얻은 질량 스펙트럼 데이타 세트는 cDNA 라이브러리로부터 얻은 단백질 서열에 관한 예측치와 데이타를 매치시키는 애질런트 스펙트럼 밀 소프트웨어를 사용하여 분석하였다. 소프트웨어는 펩티드 단편에 대하여 실험상 관찰된 질량 세트와, 제공된 데이타베이스내의 단백질 서열에 따라 생성될 수 있는 단편의 예측치 사이의 각 매치의 질에 관한 스코어를 생성하였다. 본원에 기록된 서열 매치 모두는 20보다 큰 스코어를 받았고, 디폴트는 유효 매치의 자동, 신뢰 허용에 대하여 세팅하였다.

이러한 분석을 통해, 입술샘에서 고수준으로 발현된 5개의 단백질은 기원이 같은 각각의 벌 종으로부터 유래된 실크와 매치되었고(표 2 및 3에 나타내었다), 입술샘에서 고수준으로 발현된 4개의 단백질은 기원이 같은 각각의 개미 종으로부터 유래된 실크와 매치되었음(표 3에 나타내었다)이 확인되었다. 유충의 입술샘에서 이들 단백질을 코딩하는 전령 RNA가 풍부한 것은 생산되는 단백질이 풍부한 것과 일치하였다(표 3에 전령의 풍부도를 나타냄).

확인 과정에 의해 어떤 꿀벌 실크 단백질도 빠지지 않았음을 확인하기 위하여 본 발명자들은 벌의 완전 게놈 DNA 서열내 전사된 유전자를 인식하고자 하는 컴퓨터 알고리즘에 의해 작성된 꿀벌 게놈 프로젝트로부터 공공연히 이용가능하게 예측된 단백질 서열과 꿀벌 실크 트립신 펩티드 질량 스펙트럼 데이타를 비교하였다. 게다가, 본 발명자들은 꿀벌 게놈 프로젝트(Ame13 공개)에 의해 제공되는 각각의 인접 게놈 DNA 서열의 6개의 가능한 리딩 프레임중 번역 데이타베이스를 작성하였다. 이러한 해독된 DNA 서열은, 상기 서열이 마치 매우 큰 단백질 서열인 것처럼 스펙트럼 밀 소프트웨어에 제시되었다. MS/MS 펩티드 데이타를 매치시킴으로써 1차적으로 유전자 구조를 예측할 필요없이 단리된 벌 단백질중 일부분을 코딩하는, 게놈 서열내 오픈 리딩 프레임을 동정하였다. 이러한 분석에 의해서는 어떠한 추가 단백질도 동정되지 않았다.

실시예 3 - 천연 실크 구조 분석

실시예 2에 기술되어 있는 바와 같이 천연 실크 샘플을 제조하였다. 파이크 미라클(Pike Miracle) 다이아몬드 감쇠 전반사 부속장치를 포함하는 브루커 텐서 37 푸리에 변환 적외선 분광계(Bruker Tensor 37 Fourier transform infrared spectrometer)를 사용하여 실크 샘플을 조사하였다. 꿀벌, 뒤영벌, 녹색 개미, 불독 개미 실크 및 풀잠자리 유충 실크 스펙트럼의 아미드 I 및 II 부위의 분석(도 1)은 이들 실크 모두가 주로 알파-나선형 2차 구조를 갖는다는 것을 나타낸다. 진정 세요아목 종의 실크는 FT-IR 스펙트럼에 있어 1645-1646cm^-1에서 우세한 피크를 갖고, 종래의 알파-나선형 신호보다 대략 10cm^-1 아래로 이동하였고, 범위는 넓어졌다. α-나선형 신호에 있어 이러한 이동은 꼬인 코일 단백질의 전형적인 특징을 나타낸다[Heimburg et al., 1999]. 고무 성질이 제거된 샘플로부터 얻은 스펙트럼에서는 변화가 없었다.

실시예 4 - 천연 실크의 아미노산 조성은 동정된 실크 단백질의 것과 매우 유사하다

110℃에서 24시간 동안 기상 가수분해한 후, 오스트레일리안 프로테옴 아날리시스 패실러티 리미티드(Australian Proteome Analysis Facility Ltd.)(시드니 맥쿼리 대학 소재)에 의해 워터 AccQTag(Waters AccQTag) 화학 물질을 사용하여 천연 실크의 아미노산 조성을 측정하였다.

SDS로 세척된 실크의 측정된 아미노산 조성은 동정된 실크 단백질 서열로부터 예측된 것과 유사하였다(도 2 및 3).

실시예 5 - 실크 단백질의 구조 분석

예측된 분비 펩티드

실크 단백질에 대하여 예측된 바와 같이, 신호 펩티드를 동정하기 위하여 2개의 모델을 사용하는 시그날P(SignalP) 3.0 신호 예측 프로그램[Bendtsen et al., 2004]은 동정된 실크 유전자 모두가 세포로부터의 분비에 대하여 표적하는 신호 펩티드를 함유하는 단백질을 코딩한다는 것을 예측하였다(데이타는 나타내지 않음). 폴리펩티드의 예측되는 절단 부위는 하기와 같다:

제노스피라1(AmelF1) - 위치 19번과 20번 사이(ASA-GL),

제노스피라2(AmelF2) - 위치 19번과 20번 사이(AEG-RV),

제노스피라3(AmelF3) - 위치 19번과 20번 사이(VHA-GV),

제노스피라4(AmelF4) - 위치 19번과 20번 사이(ASG-AR),

제노신(AmelSAl) - 위치 19번과 20번 사이(VCA-GV),

BBF1 - 위치 19번과 20번 사이(ASA-GQ),

BBF2 - 위치 20번과 21번 사이 (AEG-HV),

BBF3 - 위치 19번과 20번 사이(VHA-GS),

BBF4 - 위치 19번과 20번 사이(ASA-GK),

BAF1 - 위치 19번과 20번 사이(ASA-SG),

BAF2 - 위치 19번과 20번 사이(ASG-RV),

BAF3 - 위치 19번과 20번 사이(ASG-NL),

BAF4 - 위치 19번과 20번 사이(VGA-SE),

GAF1 - 위치 19번과 20번 사이(ADA-SK),

GAF2 - 위치 19번과 20번 사이(ASG-GV),

GAF3 - 위치 19번과 20번 사이(ASG-GV),

GAF4 - 위치 19번과 20번 사이(VGA-SE),

MalF1 - 위치 26번과 27번 사이(SST-AV).

4마리의 개미 모두와 5마리의 벌중 4마리에서의 실크 단백질은 나선형이고, 꼬인 코일을 형성하였다.

단백질 모델링과 패턴 인식 알고리즘으로부터 얻은 결과를 통해 동정된 꿀벌 실크 단백질의 대다수가 꼬인 코일을 형성하는 나선형 단백질임을 확인하게 되었다.

PROFsec[Rost and Sander, 1993] 및 NNPredict([McClelland and Rumelhart, 1988];[Kneller et al., 1990]) 알고리즘을 사용하여 동정된 실크 유전자의 2차 구조를 조사하였다. 이들 알고리즘을 통해 제노스피라1[GB12184-PA](서열 번호 1), 제노스피라2[GB12348-PA](서열 번호 3), 제노스피라3[GB17818-PA](서열 번호 5) 및 제노스피라4[GB19585-PA](서열 번호 7)를 동정하였는데, 이들은 고도의 나선형 단백질로서, 76-85% 사이가 나선형 구조였다(표 4). 제노신[GB15233-PA](서열 번호 10)은 유의적으로 덜한 나선형 구조를 가졌다.

표 4. 나선형, 확장형 및 루프의 퍼센트(%)를 나타내는, PROFsec[Rost and Sander, 1993]에 의해 예측되는 아피스 멜리페라 실크 단백질의 2차 구조

추가의 단백질 모델링과 패턴 인식 알고리즘으로부터 얻은 결과를 통해 동정된 실크 단백질의 대다수가 꼬인 코일을 형성하는 나선형 단백질임을 확인하게 되었다. PredictProtein[Rost et al, 2004] 알고리즘을 사용하여 동정된 실크 유전자의 2차 구조를 조사하였다. 이들 알고리즘을 통해 제노스피라1(서열 번호 1), 제노스피라2(서열 번호 3), 제노스피라3(서열 번호 5), 제노스피라4(서열 번호 7), BBF1(서열 번호 22), BBF2(서열 번호 24), BBF3(서열 번호 26), BBF4(서열 번호 28), BAF1(서열 번호 40), BAF2(서열 번호 42), BAF3(서열 번호 44), BAF4(서열 번호 46), GAF1(서열 번호 56), GAF2(서열 번호 58), GAF3(서열 번호 60), GAF4(서열 번호 62) 및 MalF1(서열 번호 72)을 동정하였는데, 이들은 고도의 나선형 단백질로서, 69-88% 사이가 나선형 구조였다(표 3). 제노신[GB15233-PA](서열 번호 10)은 유의적으로 덜한 나선형 구조를 가졌다. AmelSA1[GB15233-PA](제노신)(서열 번호 10) 및 BBSA1(서열 번호 30)은 유의적으로 덜한 나선형 구조를 가졌다.

나선형 단백질의 수퍼-코일링(꼬인 코일)은 일반적으로 a와 d 위치에 소수성 잔기가 존재하고, 일반적으로 나머지 위치에는 하전된 잔기 또는 극성 잔기가 존재하는, 보통 (abcdefg)_n로 지칭되는 특징적인 헵타드 반복부 서열로부터 발생한다. 패턴 인식 프로그램(MARCOIL[Delorenzi and Speed, 2002], COILS[Lupas et al., 1991])을 통해 제노스피라1[GB12184-PA](서열 번호 1), 제노스피라2[GB12348-PA](서열 번호 3), 제노스피라3[GB17818-PA](서열 번호 5) 및 제노스피라4[GB19585-PA](서열 번호 7)(MARCOIL: 표 5; COILS: 도 4) 뿐만 아니라, BBF1(서열 번호 22), BBF2(서열 번호 24), BBF3(서열 번호 26), BBF4(서열 번호 28), BAF1(서열 번호 40), BAF2(서열 번호 42), BAF3(서열 번호 44), BAF4(서열 번호 46), GAF1(서열 번호 56), GAF2(서열 번호 58), GAF3(서열 번호 60), GAF4(서열 번호 62) 및 MalF1(서열 번호 72) (MARCOIL: 표 3)중 꼬인 코일을 대표하는 다수의 헵타드 반복부를 동정하였다.

꿀벌 실크 단백질중 신규한 꼬인 코일 서열의 동정

제노스피라1[GB12184-PA], 제노스피라2[GB12348-PA], 제노스피라3[GB17818-PA], 제노스피라4[GB19585-PA]의 서열내 동정된 아미노산 잔기의 헵타드 반복부는 각각 꼬인 코일 2차 구조를 매우 잘 나타내었다(도 5)(신뢰 수준에 대하여는 표 5를 참조할 수 있다). 헵타드가 연속적으로, 그리고 수없이 많이 발견된다는 사실은 단백질이 매우 규칙적인 구조를 채택하고 있음을 제안한다. 중복 헵타드를 2개의 꿀벌 단백질에서 동정하였다: 제노스피라1의 주 꼬인 코일 부위는 3개의 잔기 오프셋(offset)에 이어, 5개의 잔기 스페이스 및 4개의 연속적인 헵타드를 포함하는 중복 헵타드를 함유하였고; 제노스피라2의 전체 꼬인 코일 부위는 단일 오프셋 및 4개의 잔기 오프셋(3개의 잔기 오프셋과 동일)을 포함하는 다중 중폭 헵타드를 가졌다. 주 헵타드중 다양한 위치의 아미노산 조성을 표 6의 첫번째 칼럼에 나타내고, 바로 옆 칼럼에는 중복 헵타드의 위치를 표시한다.

표 5. MARCOIL[Delorenzi and Speed, 2002] 패턴 인식 알고리즘에 의해 꼬인 코일로서 존재하는 것으로 예측되는 동정된 실크 단백질내 잔기(%)

단백질	성숙한 단백질(아미노산) 길이	꼬인 코일로서 존재하는 단백질(%)
단백질	성숙한 단백질(아미노산) 길이	50% 역치	90% 역치	99% 역치
제노스피라3	315	64% (잔기 68-268)	34% (잔기 128-223 및 235-246)	20% (잔기 149-211)
제노스피라4	290	73% (잔기 83-293)	60% (잔기 98-168 및 182-285)	27% (잔기 113-154 및 212-247)
제노스피라1	316	69% (잔기 67-282)	49% (잔기 103-256)	18% (잔기 113-169)
제노스피라2	328	65% (잔기 89-298)	54% (잔기 110-283)	45% (잔기 127-270)
제노신	350	26% (잔기 32-127)	9% (잔기 42-75)	2% (잔기 59-67)

놀랍게도, 총괄하여 볼 때 주 헵타드는 신규한 조성물을 갖는데, '소수성' 헵타드 위치 a 및 d에는 특히 알라닌이 고도로 풍부하다(표 6 및 도 5를 참조할 수 있다). 게다가, 많은 헵타드가 동일 헵타드 내에서도 위치 a 및 d, 둘 모두에 알라닌을 갖는다(제노스피라1[GB12184-PA]에서 33%; 제노스피라2[GB12348-PA]에서 36%; 제노스피라3[GB17818-PA]에서 27%; 및 제노스피라4[GB19585-PA]에서 38%; 표 6 및 7을 참조할 수 있다).

표 6. 꿀벌 실크 단백질의 꼬인 코일 부위내 다양한 헵타드 위치에서의 각 아미노산 잔기 갯수 요약

표 7. 꿀벌 실크 단백질 헵타드중 알라닌 잔기 요약

벌목 실크의 꼬인 코일 부위내 다양한 헵타드 위치에서의 아미노산 조성이 도 6 및 7에 요약되어 있다. 상기 언급한 바와 같이, 헵타드내 위치는 신규한 조성을 갖는데 - 다른 꼬인 코일과 비교할 때 벌 및 개미 실크의 '소수성' 헵타드 위치 a 및 d에는 초고수준의 알라닌(평균 58%)과 고수준의 작은 극성 잔기(평균 21%)가 존재한다. 게다가, 위치 e는 특히 작고 소수성이다(표 8, 도 7). 국소 해부학적으로, 상기 위치는 나선형 구조 내의 잔기에 인접하게 위치한다. 그의 조성이 a 및 d와 유사하다는 것은 실크가 α-나선 하나당 3개의 코어 잔기를 갖는 꼬인 코일 구조를 채택하고 있음을 제안한다. 이 코어에 있어서 2개의 잔기보다는 3개의 잔기 코어가 보다 큰 소수성 경계면을 만드는 것이고[Deng et al., 2006] - 이것이 꼬인 코일의 형성과 안정성을 돕는 특성이 된다.

또한, 총괄하여 볼 때 헵타드내 위치 b, c, e, f 및 g는 일반적으로 앞서 특징화된 단백질 꼬인 코일 부위보다 소수성이 크고, 극성은 작고, 하전성도 작다(도 7 및 표 8 및 9를 참조할 수 있다). 그러므로, 역사상, 침이 있는 벌목 실크의 나 선형 함량은 글리신 함량의 감소와 산성 잔기 함량의 증가 결과인 것으로 간주되었지만[Rudall and Kenchington, 1971], 본 발명자들은 신규한 구조의 원인이 되는 것은 글리신/산성 잔기라기 보다는 폴리펩티드 쇄내의 알라닌 잔기의 위치라는 것을 발견하게 되었다.

표 8. a, d 및 e 위치(코어)가 다른 위치보다 더 작고 소수성이 크다는 것을 나타내는, 오솔로그 벌목 실크 단백질과 녹색 풀잠자리 실크 단백질(MalF1)의 각 헵타드 위치의 평균 크기 및 소수성도. 몇몇 경우, b 위치(부분 잠복형) 또한 작고 소수성이다.

실시예 6 - 벌 실크 단백질은 광범위하게 가교 결합될 수 있다

벌 실크 단백질 모두는 많은 리신(6.5%-16.3%)을 함유한다. 벌 실크의 측정 된 아미노산 조성과 동정된 실크 단백질 서열 사이의 비교를 통해 다수의 리신 잔기가 매치되지 않는다는 것이 밝혀졌고, 실크에서는 예상된 것보다 적은 리신이 검출되었다(도 2 및 3). 이는 리신 잔기가 변형됨으로써, 표준 아미노산 분석법으로는 동정되지 않았다는 것을 제안한다. 리신은 다양한 가교 결합: 리실 옥시다제에 의해 촉매화되는 효소적 가교 결합 또는 당화 리신 잔기로부터 생성되는 비효소적 가교 결합을 형성한다고 알려져 있다[Reiser et al., 1992)]. 꿀벌 및 뒤영벌 실크 아미노산 분석에서 리신이 실제보다 적게 표시된 것은 리신 가교 결합이 존재한다는 것과 일치한다.

표 9. 실크 단백질의 꼬인 코일 부위중 다양한 헵타드 위치에 있는 각 부류의 아미노산 잔기 갯수

SDS 폴리아크릴아미드 겔 전기영동(PAGE: polyacrylamide gel electrophoresis)시킨, 공유 가교 결합된 단백질은 가교 결합된 복합체의 분자량에 따라 이동할 것으로 예상된다. 본 발명자들은 말기의 최종 영 꿀벌 입술샘 단백질을 SDS PAGE시키고, 표준 단백질 마커와 관련하여 실크 단백질의 이동성을 측정하였다. 각 동정된 실크 단백질의 단량체에 상응하는 밴드들이 관찰되었지만, 가교 결합된 시스템에서 예상되는 바와 같이, 상기 단백질을 함유하는 고분자 밴드 또한 존재하였다(도 8).

상기 기술한 바와 같이, 꿀벌 입술샘은 조직화된 실크 단백질과 조직화되지 않은 실크 단백질의 혼합물을 함유한다. 관찰된 가교 결합된 단백질은 아마도 샘의 앞쪽 부위의 단백질 군집에 상응하는 것이, 여기에서 실크는 압출을 위해 제조되는 것이다. 모든 단계의 침샘 실크 단백질의 이종 혼합물에서 관찰되는 것보다 세포외 꿀벌 실크가 실질적으로 더 많은 가교 결합된 단백질을 함유한다고 가정하는 것도 합당하다. 결합이 시스테인 가교 결합일 수는 없는데, 이는 실크가 환원적 처리에 의해서는 영향을 받지 않고, 동정된 실크 단백질이 시스테인 잔기를 거의 함유하지 않거나, 전혀 함유하지 않기 때문이었다.

실시예 7 - 진정 세요아목 실크 단백질은 다른 실크 단백질과 유의적으로 상이하다

진정 세요아목 실크는 아미노산 조성(표 10), 관여하는 단백질의 분자량, 2차 구조 및 물리적 성질(표 11 및 12)과 관련하여 기재된 다른 실크 유전자와 유의적으로 상이하다. 나비목 실크는 주로 작은 아미노산 잔기, 알라닌, 세린 및 글리신으로 구성되고(예컨대, 봄빅스 모리의 실크, 표 10), 확장형 베타 2차 구조가 지배적이다. 코테시아 글로머레이트 실크 단백질에는 아스파라긴과 세린이 많고 - 후자의 잔기가 풍부한 것이 나비목실크 세리신(접착체)의 특징이다(표 10). 코테시아 글로머레이트 실크 단백질의 모델링을 통해서는 2차 구조내 나선형 구조 또는 꼬인 코일을 동정하지 못했다. 반대로, 벌, 개미 및 풀잠자리 실크에는 알라닌이 풍부하고(표 10), 이는 꼬인 코일을 형성하는 고수준의 나선형 2차 구조로 구성된다.

표 10. 다양한 곤충으로부터 유래된 실크의 아미노산 조성(가장 풍부한 잔기를 볼드체로 나타냄)

표 11. 곤충 실크 간의 차이

	개미 및 벌 실크	말라다 실크	코테시아 sp.	나비목, 예를 들면, 봄빅스 모리
가장 풍부한 아미노산	Ala	Ala	Ser , Asn	Gly , Ala
견섬유 단백질의 크기	25-35kDA	57kDa	대략 500kDa	>100kDa
2차 구조	꼬인 코일	꼬인 코일	아마도 대개는 베타 구조임. 2차 구조 예측 프로그램인 PROFsec 및 MARCOIL은 어떤 나선형 구조도 꼬인 코일 부위도 인식하지 못한다.	β-구조, β-나선구조, α-나선형 구조 및 무정형 부위와 느슨하게 결합되어 있는 β-병풍 구조

표 12. 곤충 실크의 가용성

4개의 벌목 종의 실크 단백질의 꼬인 코일 부위에 관한 분기학적 분석(도 9)은 유전자가 기생 말벌로부터의 진정 세요아목 분기 이전의 공통 조상으로부터 진화하였다는 것을 제안한다. 실크 서열은 광범위하게 분기되었고, 본 발명자들은 오직 각 단백질중 꼬인 코일 부위를 포함하는 210개의 아미노산만을 정렬시킬 수 있었다. 본원에서 제공하는 각 실크 단백질의 꼬인 코일 부위 사이의 아미노산 서열 일치도를 표 13에 나타내고, 상응하는 부위의 DNA 일치도를 표 14에 나타낸다. 단백질은 유사한 아미노산 함량(특히, 고수준의 알라닌)과 3차 구조를 갖는 반면, 1차 아미노산 서열 일치도는 매우 낮다. 사실상, 말라다 실크 단백질을 코딩하는 유전자는 독립적으로 진화하였고, 실크 단백질 서열은 그 자체로서 벌목 서열로 정렬될 수 없다. 이는 아미노산 일치도에 있어 상당한 차이가 있을 수 있지만, 이것이 단백질의 생물학적 작용에는 영향을 미치지 않는다는 것을 시사한다.

분기학적 분석을 통해 진정 세요아목 말벌의 실크는 개미 및 벌의 실크와 관련된 단백질로 구성되어 있고, 비록 이들 단백질이 본원에 기술된 단백질과 유사한 조성과 구조를 갖더라도, 이는 고도로 분기된 1차 서열을 가질 수 있을 것으로 예 측된다.

본원에서 제공된 실크 단백질의 아미노산 서열(도 10)을 단백질 데이타베이스와 비교하였지만, 선행 기술에서는 어떤 단백질도 상당 수준의 서열 일치도로 동정되지 못했다(예컨대, 실크 단백질 서열 전반에 걸쳐 30% 초과로 일치하는 것은 없다).

표 13. 개미 및 벌에서 섬유 단백질의 꼬인 코일 부위의 단백질 서열 간의 일치도(%)

표 14. 개미 및 벌에서 섬유 단백질의 꼬인 코일 부위를 코딩하는 뉴클레오티드 서열 간의 일치도(%)

실크 단백질을 코딩하는 오픈 리딩 프레임(도 11에서 제공)을 상기 기술된 것과 유사하게 데이타베이스 서치를 실시하였다. 동정된 관련 분자만을 꿀벌 게놈 프로젝트의 일부로서 공개하였다(www.ncbi.nlm.nih.gov/genome/guide/bee). 오픈 리딩 프레임은 벌 게놈 프로젝트에 의해 예측되었지만, 코딩된 단백질의 작용은 제안되지 못했다. 추가로, mRNA의 오픈 리딩 프레임을 포함하는 폴리뉴클레오티드가 이들 분자중 임의의 어느 것에 대하여 생산되었다는 증거도 없다.

제노스피라1, 제노스피라2, 제노스피라3 및 제노스피라4를 코딩하는 유전자는 전체 단일 오픈 리딩 프레임에 적용되는 엑손을 포함하는 반면, 제노신을 코딩하는 유전자는 1종 이상의 인트론을 포함한다(도 12를 참조할 수 있다).

실시예 8 - 트랜스제닉 식물에서 실크 단백질의 발현

본 발명의 실크 단백질을 코딩하는 식물 발현 벡터는 카나마이신 내성 유전자(NptII)를 함유하는 2진 벡터 백본내 CaMV 35S 프로모터의 하류에 배치된 상기 단백질을 코딩하는 조합 핵산 분자(예컨대, 서열 번호 11 내지 21, 31 내지 39, 48 내지 55, 64 내지 71, 74 또는 75 중 어느 하나에 제시된 폴리뉴클레오티드)로 구성될 수 있다.

서열 번호 11, 13, 15, 17, 19, 31, 33, 35, 37, 48, 50, 52, 54, 64, 66, 68, 70 또는 74중 어느 하나를 포함하는 폴리뉴클레오티드의 경우, 작제물은 추가로 인-프레임 및 실크 단백질을 코딩하는 서열의 상류에 배치된, 예를 들면, 아라비도프시스 탈리아나 액포 염기성 키티나제 신호 펩티드와 같은 신호 펩티드 부위를 포함할 수 있다.

실크 단백질을 코딩하는 폴리펩티드를 수반하는 작제물은 아라비도프시스 탈리아나로 형질전환 전에 전기천공에 의해 애그로박테리움 투메파시엔스로 개별적으로 형질전환된다. 배축 형질전환 방법을 사용함으로써, 카나마이신 배지를 포함하는 선택 배지 상에서 생존할 수 있는 것에 대하여 선별될 수 있는 A. 탈리아나(A. thaliana)를 형질전환시킬 수 있다. 뿌리가 재생물에서 형성된 후, 이를 토양으로 옮겨 1차 트랜스제닉 식물을 확립시킨다.

PCR 선별을 통해 형질전환 과정을 확인할 수 있다. 폴리뉴클레오티드의 혼입과 발현은 트립신으로 분해된 발현 단백질의 PCR, 써던 블롯 분석 및/또는 LC/MS를 사용함으로써 측정될 수 있다.

2개 이상의 상이한 실크 단백질을 코딩하는 작제물이 동일 벡터내 제공될 수 있거나, 다수의 상이한 벡터는 상이한 단백질을 코딩하는 각각의 식물로 형질전환될 수 있다.

식물 발현에 관한 실험상의 일례로, AmelF4(제노스피라4)(서열 번호 76)의 코돈-최적환 버전을 pET14b(Novagen)로 클로닝하여 pET14b-6xHis:F4op를 생성하고, 단백질의 N-말단에 6 x 히스티딘을 갖는 인-프레임 번역 융합체를 형성한다. 단백질 "6 x 히스티딘:F4op"을 코딩하는 서열을 CaMV 35S 프로모터 및 ocs 폴리아데닐화 조절 기구의 조절하에서 pVEC8로 클로닝하여[Wang et al, 1992], pVEC8-35S-6xHis:F4op-ocs를 생성한다. pET14b-6xHis:F4op를 화학적으로-수행 능력을 지닌 E. 콜라이로 형질전환시키고, pVEC8-35S-6xHis:F4op를 애그로박테리움 매개 형질전환에 의해 타바코 잎 디스크로 형질전환시켰다. 항생제 내성 E. 콜라이(유도성 발현) 및 타바코 잎으로부터 단백질을 단리시키고, 검출용 테트라-히스티딘(Tetra-Histidine) 항체(독일 카를스룰에 소재하는 Qiagen)에 대하여 웨스턴 블롯 분석을 실시하였다. 빈 벡터 pET14b 및 pVEC8-35S-ocs는 각 숙주 배경에 대한 음성 조절로 사용하였다. 도 13에 나타내는 바와 같이, 본 실험을 통해 제노스피라4(AmelF4) 단백질을 생산하는 식물을 수득하였다.

실시예 9 - 실크 단백질의 발효 및 정제

꿀벌 유전자 AmelF1-F4(각각 제노스피라1 내지 4) 및 풀잠자리 MalF1 유전자의 실크 코딩 부위를 PCR에 의해 증폭시킨 후 발현 작제물을 작제하고, pET14b 발현 벡터(위스콘신주 매디슨에 소재하는 Novagen)로 클로닝하였다. 이어서 생성된 발현 플라스미드를 E. 콜라이 BL21(DE3) 로제타 세포내로 전기천공시키고, 앰피실린을 함유하는 LB 아가상에서 밤새도록 배양하였다. 이어서, 단일 콜로니를 사용하여 앰피실린을 함유하는 LB 브로쓰에 접종한 후, 37℃에서 밤새도록 배양하였다. 원심분리하여 세포를 수거하고, 세제로 용해시킨다(Bugbuster, Novagen). 봉입체를 철저히 세척하고 6M 구아니디늄에 재용해시켰다.

본 방법을 통해 순도 95% 초과의 꿀벌 단백질과 순도 50% 초과의 풀잠자리 MalF1 단백질을 포함하는 단백질 혼합물을 수득하였다. E. 콜라이 세포의 습식 중량중 50% 이하의 수율이 규칙적으로 수득되었고, 이는 단백질이 이러한 방식으로 쉽게 발현될 수 있다는 것을 시사한다.

가용화된 꿀벌 재조합 단백질을 제조사의 설명에 따라 제고된 탈론(Talon) 수지 칼럼에 적용시켰다. 이어서, 10OmM Tris.HCL, 15OmM 이미다졸 pH 8중 칼럼에 대하여 용출시켰다.

실시예 10 - 실크 단백질의 실로의 공정 과정

하기 절차를 사용하는 다양한 방법들(도 14를 참조할 수 있다)를 사용하여 쉽게 꿀벌 및 풀잠자리 실크 단백질을 실로 제조할 수 있다.

말기의 최종 영 아피스 멜리페라의 침샘의 앞쪽 세그먼트를 인산염 완충처리된 염수하에서 절개하고, 완충액 소적내 평평한 표면으로 옮겼다. 핀셋으로 세그먼트 양 끝단을 잡았다. 일정한 속도로 한쪽 끝단을 소적의 바깥쪽으로 끌어 올려 다른 한쪽으로부터 멀리 떨어지도록 하였다. 이를 통해 대기중에서 신속하게 고형화되는 세사를 인발시킬 수 있었다.

꿀벌 및 풀잠자리 유충 재조합 실크 단백질은 예컨대, 가용성 단백질을 부탄올 용액에 적하하거나, 탈론(Talon) 수지 칼럼 상에서 단백질을 농축시키는 것과 같은 탈수 또는 농축 후에 실 또는 구조물을 형성하였다.

또한, 꿀벌 또는 풀잠자리 재조합 실크 단백질을 유기 용매(예를 들면, 헥 산)과 혼합하여 적당한 구조의 경계면으로 농축시킨 후, 시약(예를 들면, 부탄올)을 가하여 상기 경계면으로부터 뽑아낸 후에 실을 수득하였다. 이러한 방법에 의해 형성된 실은 천연 실크와 유사한 FT-IR 스펙트럼을 가졌고, 이는 실이 동일한 꼬인 코일 구조로 구성되어 있음을 시사하는 것이다.

본원에 기술된 다른 종으로부터 유래된 실크 단백질 또한 이러한 방법에 의해 공정처리할 수 있다.

광범위하게 기술되고 있는 바와 같이, 본 발명의 정신 또는 범주로부터 벗어나지 않으면서 특정 실시태양으로 나타낸 것과 같이 본 발명에 대하여 다수의 변형 및/또는 수정이 이루어질 수 있다는 것을 당업자는 이해할 것이다. 그러므로, 본 실시태양은 모든 점에서 제한적인 것이 아니라 예시적인 것으로 간주되어야 한다.

상기에서 논의된 모든 간행물은 그의 전문이 본원에서 인용된다. 본 명세서에 포함되어 있는 문서, 시험, 물질, 장치, 물품 등에 관한 논의는 단지 본 발명에 관한 내용을 설명하기 위해 포함된 것이다. 이들 사항 중 어느 것도 또는 이들 모두는 본 출원의 각 우선권 주장일 이전에 존재하고 있었던 바, 이것이 선행 기술의 기초중 일부를 형성한다거나, 본 발명의 관련 기술 분야에서 일반 상식인 것으로서 용인되지는 않아야 한다.

참조 문헌

SEQUENCE LISTING <110> Commonwealth Scientific and Industrial Research Organization <120> Silk proteins <130> 504791 <150> US 60/723,766 <151> 2005-10-05 <160> 77 <170> PatentIn version 3.3 <210> 1 <211> 314 <212> PRT <213> Apis mellifera <400> 1 Gly Leu Glu Gly Pro Gly Asn Ser Leu Pro Glu Leu Val Lys Gly Ser 1 5 10 15 Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg 20 25 30 Ala Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val Leu Gln Ala 35 40 45 Gln Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala Ala Asp Leu 50 55 60 Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser Gln Ala Ala 65 70 75 80 Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln Ala Arg Ala 85 90 95 Gly Leu Glu Ser Val Ser Met Ala Ala Ser Ala Thr Ser Ala Ala Lys 100 105 110 Glu Ala Ser Thr Ala Ala Lys Ala Ala Ala Ser Ala Leu Ser Thr Ala 115 120 125 Val Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala Glu Ala Val 130 135 140 Ala Ser Asp Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala Asn Leu Ala 145 150 155 160 Ala Glu Ala Ser Val Ala Ala Glu Ala Ala Leu Lys Ala Glu Lys Val 165 170 175 Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala Ala Ala Arg 180 185 190 Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala Thr Ala Ser 195 200 205 Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val Ala Val Leu 210 215 220 Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala Ala Ser Ser 225 230 235 240 Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn Val Glu Thr 245 250 255 Ala Thr Ile Gly Ala Asn Ile Asn Ser Ser Lys Gln Val Val Ser Ile 260 265 270 Pro Val Glu Ile Lys Lys Phe Ser Glu Pro Glu Val Ser Thr Ser Trp 275 280 285 Arg Glu Asp Glu Glu Val Thr Lys Glu Lys Lys Glu His Ile Asn Leu 290 295 300 Asn Asp Phe Asp Leu Lys Ser Asn Val Phe 305 310 <210> 2 <211> 333 <212> PRT <213> Apis mellifera <400> 2 Met Lys Ile Pro Val Leu Leu Ala Thr Cys Leu Tyr Leu Cys Gly Phe 1 5 10 15 Ala Ser Ala Gly Leu Glu Gly Pro Gly Asn Ser Leu Pro Glu Leu Val 20 25 30 Lys Gly Ser Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser 35 40 45 Gly Leu Arg Ala Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val 50 55 60 Leu Gln Ala Gln Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala 65 70 75 80 Ala Asp Leu Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser 85 90 95 Gln Ala Ala Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln 100 105 110 Ala Arg Ala Gly Leu Glu Ser Val Ser Met Ala Ala Ser Ala Thr Ser 115 120 125 Ala Ala Lys Glu Ala Ser Thr Ala Ala Lys Ala Ala Ala Ser Ala Leu 130 135 140 Ser Thr Ala Val Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala 145 150 155 160 Glu Ala Val Ala Ser Asp Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala 165 170 175 Asn Leu Ala Ala Glu Ala Ser Val Ala Ala Glu Ala Ala Leu Lys Ala 180 185 190 Glu Lys Val Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala 195 200 205 Ala Ala Arg Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala 210 215 220 Thr Ala Ser Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val 225 230 235 240 Ala Val Leu Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala 245 250 255 Ala Ser Ser Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn 260 265 270 Val Glu Thr Ala Thr Ile Gly Ala Asn Ile Asn Ser Ser Lys Gln Val 275 280 285 Val Ser Ile Pro Val Glu Ile Lys Lys Phe Ser Glu Pro Glu Val Ser 290 295 300 Thr Ser Trp Arg Glu Asp Glu Glu Val Thr Lys Glu Lys Lys Glu His 305 310 315 320 Ile Asn Leu Asn Asp Phe Asp Leu Lys Ser Asn Val Phe 325 330 <210> 3 <211> 290 <212> PRT <213> Apis mellifera <400> 3 Arg Val Ile Asn His Glu Ser Leu Lys Thr Ser Glu Asp Ile Gln Gly 1 5 10 15 Gly Tyr Ser Ala Gly Ile Val Gly Asp Gly Ser Asp Ala Leu Gly Ser 20 25 30 Ser Ile Glu Asn Ala Gln Lys Val Ala Arg Ala Ala Glu Asn Val Gly 35 40 45 Leu Asn Leu Glu Leu Gly Ala Gly Ala Arg Ala Ala Ser Val Ala Ala 50 55 60 Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Ala Gly Ala Asn Ala 65 70 75 80 Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser 85 90 95 Glu Ile Ala Asn Gln Leu Leu Thr Asn Ala Ala Lys Ala Ala Glu Ala 100 105 110 Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala Ala Ala Lys 115 120 125 Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala Thr Glu Ala 130 135 140 Gln Val Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg Ala Ala Ile 145 150 155 160 Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala Ala Ile Ala 165 170 175 Arg Lys Ser Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile Ala Ala Ala 180 185 190 Ala Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Val Val Ala Leu 195 200 205 Thr Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala Gln Ala Asn 210 215 220 Ala Ser Thr Gln Ala Ser Met Ala Val Arg Val Asp Ser Gln Ala Ala 225 230 235 240 Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr 245 250 255 Ala Glu Ala Val Ala Ala Ala Glu Ala Glu Val Ala Asn Lys Ala Ala 260 265 270 Thr Phe Ala Lys Gln Ile Val Asn Glu Lys Lys Ile His Val Ala Lys 275 280 285 Leu Glu 290 <210> 4 <211> 309 <212> PRT <213> Apis mellifera <400> 4 Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Val Trp Gly Leu 1 5 10 15 Ala Glu Gly Arg Val Ile Asn His Glu Ser Leu Lys Thr Ser Glu Asp 20 25 30 Ile Gln Gly Gly Tyr Ser Ala Gly Ile Val Gly Asp Gly Ser Asp Ala 35 40 45 Leu Gly Ser Ser Ile Glu Asn Ala Gln Lys Val Ala Arg Ala Ala Glu 50 55 60 Asn Val Gly Leu Asn Leu Glu Leu Gly Ala Gly Ala Arg Ala Ala Ser 65 70 75 80 Val Ala Ala Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Ala Gly 85 90 95 Ala Asn Ala Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile 100 105 110 Lys Ala Ser Glu Ile Ala Asn Gln Leu Leu Thr Asn Ala Ala Lys Ala 115 120 125 Ala Glu Ala Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala 130 135 140 Ala Ala Lys Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala 145 150 155 160 Thr Glu Ala Gln Val Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg 165 170 175 Ala Ala Ile Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala 180 185 190 Ala Ile Ala Arg Lys Ser Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile 195 200 205 Ala Ala Ala Ala Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Val 210 215 220 Val Ala Leu Thr Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala 225 230 235 240 Gln Ala Asn Ala Ser Thr Gln Ala Ser Met Ala Val Arg Val Asp Ser 245 250 255 Gln Ala Ala Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu 260 265 270 Leu Val Thr Ala Glu Ala Val Ala Ala Ala Glu Ala Glu Val Ala Asn 275 280 285 Lys Ala Ala Thr Phe Ala Lys Gln Ile Val Asn Glu Lys Lys Ile His 290 295 300 Val Ala Lys Leu Glu 305 <210> 5 <211> 316 <212> PRT <213> Apis mellifera <400> 5 Gly Val Glu Glu Phe Lys Ser Ser Ala Thr Glu Glu Val Ile Ser Lys 1 5 10 15 Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser Ala Lys Arg 20 25 30 Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Thr Leu Gln Ser Leu 35 40 45 Glu Lys Ile Lys Thr Ser Ala Ser Val Asn Ala Lys Ala Ala Ala Val 50 55 60 Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu Arg Ala Ser 65 70 75 80 Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Leu Lys Asn 85 90 95 Ala Gln Gln Ala Gln Leu Asn Ala Gln Glu Lys Ser Leu Ala Ala Leu 100 105 110 Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala Asn Ala Ala 115 120 125 Thr Ala Ala Thr Gln Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg 130 135 140 Leu Ala Thr Val Ala Gln Asn Val Ala Ser Asp Leu Gln Lys Arg Thr 145 150 155 160 Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg Gln Leu Gln 165 170 175 Asp Ala Glu Arg Thr Lys Trp Ser Ala Asn Ala Ala Leu Glu Val Ser 180 185 190 Ala Ala Ala Ala Ala Ala Glu Thr Lys Thr Thr Ala Ser Ser Glu Ala 195 200 205 Ala Asn Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser Asp Ala Asp 210 215 220 Gly Ala Glu Arg Ser Ala Ser Thr Glu Ala Gln Ser Ala Ala Lys Ile 225 230 235 240 Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala Ser Glu Asp 245 250 255 Ser Arg Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg Ala Asn Val 260 265 270 Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Gly Glu Glu Ala 275 280 285 Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu Ala Glu Val 290 295 300 Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe 305 310 315 <210> 6 <211> 335 <212> PRT <213> Apis mellifera <400> 6 Met Gln Ile Pro Thr Phe Val Ala Ile Cys Leu Leu Thr Ser Gly Leu 1 5 10 15 Val His Ala Gly Val Glu Glu Phe Lys Ser Ser Ala Thr Glu Glu Val 20 25 30 Ile Ser Lys Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser 35 40 45 Ala Lys Arg Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Thr Leu 50 55 60 Gln Ser Leu Glu Lys Ile Lys Thr Ser Ala Ser Val Asn Ala Lys Ala 65 70 75 80 Ala Ala Val Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu 85 90 95 Arg Ala Ser Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala 100 105 110 Leu Lys Asn Ala Gln Gln Ala Gln Leu Asn Ala Gln Glu Lys Ser Leu 115 120 125 Ala Ala Leu Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala 130 135 140 Asn Ala Ala Thr Ala Ala Thr Gln Ser Ala Leu Glu Arg Ala Gln Ala 145 150 155 160 Ser Ser Arg Leu Ala Thr Val Ala Gln Asn Val Ala Ser Asp Leu Gln 165 170 175 Lys Arg Thr Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg 180 185 190 Gln Leu Gln Asp Ala Glu Arg Thr Lys Trp Ser Ala Asn Ala Ala Leu 195 200 205 Glu Val Ser Ala Ala Ala Ala Ala Ala Glu Thr Lys Thr Thr Ala Ser 210 215 220 Ser Glu Ala Ala Asn Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser 225 230 235 240 Asp Ala Asp Gly Ala Glu Arg Ser Ala Ser Thr Glu Ala Gln Ser Ala 245 250 255 Ala Lys Ile Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala 260 265 270 Ser Glu Asp Ser Arg Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg 275 280 285 Ala Asn Val Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Gly 290 295 300 Glu Glu Ala Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu 305 310 315 320 Ala Glu Val Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe 325 330 335 <210> 7 <211> 323 <212> PRT <213> Apis mellifera <400> 7 Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr Ser Thr Val 1 5 10 15 Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys Asp Glu Leu 20 25 30 Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly Thr Gly Ala 35 40 45 Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile Ser Leu Gly 50 55 60 Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala Ser Gln Ser 65 70 75 80 Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu Thr Asn Lys 85 90 95 Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala Arg Ala Thr 100 105 110 Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr Glu Glu Ala 115 120 125 Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala Ala Ala Glu 130 135 140 Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser Ala Arg Ala 145 150 155 160 Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala Glu Ser Ala 165 170 175 Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys Ala Ala 180 185 190 Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu Ala Asp 195 200 205 Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val Ala Asp 210 215 220 Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys Ala Glu 225 230 235 240 Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val Leu Gln Ala 245 250 255 Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala Ala Ala 260 265 270 Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala Gly Glu Met 275 280 285 Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys Lys Glu Glu 290 295 300 Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu Trp 305 310 315 320 Glu Val Lys <210> 8 <211> 342 <212> PRT <213> Apis mellifera <400> 8 Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Ile Trp Gly Leu 1 5 10 15 Ala Ser Gly Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr 20 25 30 Ser Thr Val Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys 35 40 45 Asp Glu Leu Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly 50 55 60 Thr Gly Ala Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile 65 70 75 80 Ser Leu Gly Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala 85 90 95 Ser Gln Ser Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu 100 105 110 Thr Asn Lys Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala 115 120 125 Arg Ala Thr Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr 130 135 140 Glu Glu Ala Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala 145 150 155 160 Ala Ala Glu Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser 165 170 175 Ala Arg Ala Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala 180 185 190 Glu Ser Ala Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala 195 200 205 Lys Ala Ala Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala 210 215 220 Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala 225 230 235 240 Val Ala Asp Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala 245 250 255 Lys Ala Glu Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val 260 265 270 Leu Gln Ala Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala 275 280 285 Ala Ala Ala Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala 290 295 300 Gly Glu Met Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys 305 310 315 320 Lys Glu Glu Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn 325 330 335 Glu Glu Trp Glu Val Lys 340 <210> 9 <211> 353 <212> PRT <213> Apis mellifera <400> 9 Gly Val Asn Thr Glu Leu Lys Lys Asp Gly Glu Leu Lys Glu Glu Ser 1 5 10 15 Tyr Glu Lys Ser Glu Ser Lys Ser Leu Lys Glu Ile Lys Glu Glu Arg 20 25 30 Ala Ser Lys Ser Lys Ser Glu Arg Leu Lys Ile Arg Glu Glu Lys Arg 35 40 45 Glu Glu Glu Glu Lys Ser Lys Ser Leu Asn Leu Val Val Val Arg Glu 50 55 60 Lys Ile Thr Lys Leu Ser Ser Trp Leu Lys Glu Glu Lys Asp Ile Ser 65 70 75 80 Pro Leu Leu Glu Glu Lys Asn Gly Lys Gly Leu Leu Gly Leu Glu Asp 85 90 95 Val Thr Asp Glu Leu Asn Ile Ala Leu Lys Ser Leu Lys Glu Gly Lys 100 105 110 Lys Phe Asp Thr Trp Lys Phe Glu Lys Gly Ser Glu Asp Val Arg Ser 115 120 125 Leu Glu Glu Leu Asp Thr Ser Val Val Glu Leu Leu Lys Leu Ile Lys 130 135 140 Glu Gly Lys Thr Asp His Gly Ala Ile Asp Leu Glu Lys Asn Gly Lys 145 150 155 160 Val Leu Val Asp Leu Glu Lys Ile Ser Glu Asn Ile Leu Glu Thr Cys 165 170 175 Gly Ser Gln Lys Lys Thr Val Glu Val Val Asp Asp Lys Asp Lys Lys 180 185 190 Trp Asn Lys Glu Ser Gly Trp Lys Lys Asn Leu Asn Asp Leu Asp Trp 195 200 205 Lys Lys Asp Leu Asp Lys Asp Lys Val Gly Gly Gly Leu Leu Gly Gly 210 215 220 Leu Ser Gly Leu Leu Asn Ser Leu Lys Ser Glu Lys Gly Leu Leu Gly 225 230 235 240 Leu Leu Asn Lys Asn Gln Ile Glu Leu Leu Ile Pro Leu Ile Ser Glu 245 250 255 Ile Lys Lys Lys Asn Ile Asp Phe Asn Leu Phe Asp Ser Val Asp Ser 260 265 270 Val Glu Arg Asn Leu Asp Leu Lys Leu Phe Thr Ser Ser Val Ser Lys 275 280 285 Val Thr Glu Leu Leu Asn Lys Gly Ile Asp Ile Gln Thr Ile Leu Asn 290 295 300 Ala Lys Asn Gly Asp Glu Phe Asp Leu Ser Gly Lys Glu Leu Lys Asn 305 310 315 320 Val Lys Gly Ile Phe Gly Leu Ile Gly Ser Leu Lys Arg Ser Leu Gly 325 330 335 Leu Glu Asn Ile Leu Asn Leu Pro Phe Lys Arg Ile Pro Leu Leu Lys 340 345 350 Leu <210> 10 <211> 372 <212> PRT <213> Apis mellifera <400> 10 Met Lys Tyr Met Leu Leu Leu Leu Ser Ile Phe Ile Cys Ala His Ile 1 5 10 15 Val Cys Ala Gly Val Asn Thr Glu Leu Lys Lys Asp Gly Glu Leu Lys 20 25 30 Glu Glu Ser Tyr Glu Lys Ser Glu Ser Lys Ser Leu Lys Glu Ile Lys 35 40 45 Glu Glu Arg Ala Ser Lys Ser Lys Ser Glu Arg Leu Lys Ile Arg Glu 50 55 60 Glu Lys Arg Glu Glu Glu Glu Lys Ser Lys Ser Leu Asn Leu Val Val 65 70 75 80 Val Arg Glu Lys Ile Thr Lys Leu Ser Ser Trp Leu Lys Glu Glu Lys 85 90 95 Asp Ile Ser Pro Leu Leu Glu Glu Lys Asn Gly Lys Gly Leu Leu Gly 100 105 110 Leu Glu Asp Val Thr Asp Glu Leu Asn Ile Ala Leu Lys Ser Leu Lys 115 120 125 Glu Gly Lys Lys Phe Asp Thr Trp Lys Phe Glu Lys Gly Ser Glu Asp 130 135 140 Val Arg Ser Leu Glu Glu Leu Asp Thr Ser Val Val Glu Leu Leu Lys 145 150 155 160 Leu Ile Lys Glu Gly Lys Thr Asp His Gly Ala Ile Asp Leu Glu Lys 165 170 175 Asn Gly Lys Val Leu Val Asp Leu Glu Lys Ile Ser Glu Asn Ile Leu 180 185 190 Glu Thr Cys Gly Ser Gln Lys Lys Thr Val Glu Val Val Asp Asp Lys 195 200 205 Asp Lys Lys Trp Asn Lys Glu Ser Gly Trp Lys Lys Asn Leu Asn Asp 210 215 220 Leu Asp Trp Lys Lys Asp Leu Asp Lys Asp Lys Val Gly Gly Gly Leu 225 230 235 240 Leu Gly Gly Leu Ser Gly Leu Leu Asn Ser Leu Lys Ser Glu Lys Gly 245 250 255 Leu Leu Gly Leu Leu Asn Lys Asn Gln Ile Glu Leu Leu Ile Pro Leu 260 265 270 Ile Ser Glu Ile Lys Lys Lys Asn Ile Asp Phe Asn Leu Phe Asp Ser 275 280 285 Val Asp Ser Val Glu Arg Asn Leu Asp Leu Lys Leu Phe Thr Ser Ser 290 295 300 Val Ser Lys Val Thr Glu Leu Leu Asn Lys Gly Ile Asp Ile Gln Thr 305 310 315 320 Ile Leu Asn Ala Lys Asn Gly Asp Glu Phe Asp Leu Ser Gly Lys Glu 325 330 335 Leu Lys Asn Val Lys Gly Ile Phe Gly Leu Ile Gly Ser Leu Lys Arg 340 345 350 Ser Leu Gly Leu Glu Asn Ile Leu Asn Leu Pro Phe Lys Arg Ile Pro 355 360 365 Leu Leu Lys Leu 370 <210> 11 <211> 942 <212> DNA <213> Apis mellifera <400> 11 ggtttggagg ggccgggcaa ctcgttgccc gagctcgtga aaggtagcgc atcggccacc 60 gcgtcgaccg ctgtgaccgc tagatcagga cttagagccg gacaagtagc tttagcttcg 120 cagaaggatg ccgtactcca agctcaagct gctgcatccg ccgcgtcaga ggcgcgcgct 180 gctgccgatc tgacggctaa acttagccaa gaatcggcat cagtgcaatc gcaggctgcc 240 gccaaaggga aggaaacgga ggaggcagct gttggtcaag ctagggctgg cctcgagtcg 300 gtgtccatgg ccgcatcagc cacatctgct gccaaagaag catcgaccgc cgccaaagcc 360 gcagcatccg cactatccac agccgtggtg caagcgaaaa tagctgagag ggcagccaaa 420 gctgaagctg ttgcctcgga cgaagccaag gccaaggcga ttgcagcagc caacttggcg 480 gctgaggcca gtgtagccgc agaagcagct ctcaaggccg agaaagtggc cgaagaagcc 540 atcgcaagag cggcctctgc aaaggctgcc gcaagagctg ctgctgccgc tctagcctcc 600 tcgaaggaag cagccacggc cagcgcaaga aacgccgcgg aatccgaggc caggaacgaa 660 gtagctgtat tgatcgccga gattgataaa aagagtaggg aaatcgacgc agccagttcg 720 cttaatgcgc gtgccgctgc caaggcaagc tccaggaacg tagaaacggc gacaatcggg 780 gccaacatca actcttcgaa acaagtcgtg tcaattccag tggaaataaa gaaattctcg 840 gagccggaag tgtcaacatc atggagagaa gatgaagagg ttacgaaaga gaagaaggag 900 cacataaatc tgaacgactt cgacttgaag agcaacgtat tt 942 <210> 12 <211> 999 <212> DNA <213> Apis mellifera <400> 12 atgaagattc cagtattgct tgcaacgtgc ctctaccttt gcggatttgc gtccgccggt 60 ttggaggggc cgggcaactc gttgcccgag ctcgtgaaag gtagcgcatc ggccaccgcg 120 tcgaccgctg tgaccgctag atcaggactt agagccggac aagtagcttt agcttcgcag 180 aaggatgccg tactccaagc tcaagctgct gcatccgccg cgtcagaggc gcgcgctgct 240 gccgatctga cggctaaact tagccaagaa tcggcatcag tgcaatcgca ggctgccgcc 300 aaagggaagg aaacggagga ggcagctgtt ggtcaagcta gggctggcct cgagtcggtg 360 tccatggccg catcagccac atctgctgcc aaagaagcat cgaccgccgc caaagccgca 420 gcatccgcac tatccacagc cgtggtgcaa gcgaaaatag ctgagagggc agccaaagct 480 gaagctgttg cctcggacga agccaaggcc aaggcgattg cagcagccaa cttggcggct 540 gaggccagtg tagccgcaga agcagctctc aaggccgaga aagtggccga agaagccatc 600 gcaagagcgg cctctgcaaa ggctgccgca agagctgctg ctgccgctct agcctcctcg 660 aaggaagcag ccacggccag cgcaagaaac gccgcggaat ccgaggccag gaacgaagta 720 gctgtattga tcgccgagat tgataaaaag agtagggaaa tcgacgcagc cagttcgctt 780 aatgcgcgtg ccgctgccaa ggcaagctcc aggaacgtag aaacggcgac aatcggggcc 840 aacatcaact cttcgaaaca agtcgtgtca attccagtgg aaataaagaa attctcggag 900 ccggaagtgt caacatcatg gagagaagat gaagaggtta cgaaagagaa gaaggagcac 960 ataaatctga acgacttcga cttgaagagc aacgtattt 999 <210> 13 <211> 870 <212> DNA <213> Apis mellifera <400> 13 cgcgtgatta atcacgagtc cctgaagacg agcgaggata ttcaaggagg atattcagca 60 ggaatagtcg gtgatggatc tgacgcgctt ggctcctcca tagaaaacgc ccaaaaagtc 120 gctcgagcgg ctgaaaacgt gggcttgaat ctggaattgg gcgcaggcgc gcgtgctgcc 180 agtgttgccg ctgctgccca ggccaaaaac acagaggctg cggaagcagg agcaaacgcc 240 gctctggccg ccgccattgc caaacgggag gaagcgatta aagccagcga gatagcaaac 300 caattgttga ccaatgcagc aaaagcggca gaagcgactg tatcggcaac gaagagggca 360 gcacaattga cggctgcagc gaaagaagca accagagctt ctgcagccgc tgctgaagct 420 gctacggagg cccaggtaaa ggctaacgcc gattcaatca tcacgaagag ggctgcgatt 480 gccgaggctc aagctgcggc ggaagctcaa gttaaggcgg caatcgccag aaaatcggca 540 gcgaattttt tggctaaggc tcaaatagcg gctgccgcgg aatccgaggc cacgaaactc 600 gcggccgaag ctgtagtggc actaacaaac gccgaagtcg ccgtgaacca ggctagaaac 660 gcacaggcaa acgcctcgac tcaagcttcc atggctgtta gggtagattc tcaagcagcg 720 aacgctgaag cagccgctgt agcgcaagcc gaaactctct tggttacggc agaagctgtc 780 gcagctgcgg aggctgaggt tgcgaacaaa gccgccacat ttgcaaaaca gatcgtcaac 840 gagaagaaaa tacatgtagc aaagttggaa 870 <210> 14 <211> 927 <212> DNA <213> Apis mellifera <400> 14 atgaagattc cagcaatatt cgtcacgtct ctgctggtct ggggattggc cgagggccgc 60 gtgattaatc acgagtccct gaagacgagc gaggatattc aaggaggata ttcagcagga 120 atagtcggtg atggatctga cgcgcttggc tcctccatag aaaacgccca aaaagtcgct 180 cgagcggctg aaaacgtggg cttgaatctg gaattgggcg caggcgcgcg tgctgccagt 240 gttgccgctg ctgcccaggc caaaaacaca gaggctgcgg aagcaggagc aaacgccgct 300 ctggccgccg ccattgccaa acgggaggaa gcgattaaag ccagcgagat agcaaaccaa 360 ttgttgacca atgcagcaaa agcggcagaa gcgactgtat cggcaacgaa gagggcagca 420 caattgacgg ctgcagcgaa agaagcaacc agagcttctg cagccgctgc tgaagctgct 480 acggaggccc aggtaaaggc taacgccgat tcaatcatca cgaagagggc tgcgattgcc 540 gaggctcaag ctgcggcgga agctcaagtt aaggcggcaa tcgccagaaa atcggcagcg 600 aattttttgg ctaaggctca aatagcggct gccgcggaat ccgaggccac gaaactcgcg 660 gccgaagctg tagtggcact aacaaacgcc gaagtcgccg tgaaccaggc tagaaacgca 720 caggcaaacg cctcgactca agcttccatg gctgttaggg tagattctca agcagcgaac 780 gctgaagcag ccgctgtagc gcaagccgaa actctcttgg ttacggcaga agctgtcgca 840 gctgcggagg ctgaggttgc gaacaaagcc gccacatttg caaaacagat cgtcaacgag 900 aagaaaatac atgtagcaaa gttggaa 927 <210> 15 <211> 949 <212> DNA <213> Apis mellifera <400> 15 ggcgtcgagg aattcaagtc ctcggcaacc gaggaggtga tcagcaaaaa cttagaagtc 60 gacctgttga aaaatgtgga cactagcgcg aaacgaagag agaacggcgc cccggtgctc 120 ggcaagaaca cacttcaatc cctggagaag atcaagacgt cggcgagcgt gaatgccaaa 180 gcagcagccg tggtgaaagc gtccgctctg gctcttgcag aggcctattt gcgagcgtcc 240 gcattgtcag ccgccgcttc agccaaggca gccgccgccc tgaaaaatgc tcaacaagcg 300 caattaaacg cccaggaaaa gtctttggcc gcgttgaaag ctcagtccga ggaagaggca 360 gcttctgctc gtgcaaacgc agcaaccgcc gcgacacagt cggcactgga acgcgctcaa 420 gcctcctcca ggttagcaac ggtcgcccaa aacgtagcca gcgacttgca gaaacggacc 480 agcaccaagg ccgcggctga agccgctgcc accctcagac aattacagga cgcggaacga 540 acgaaatgga gtgccaacgc tgccttagaa gtctccgccg ctgcagctgc cgcagaaacc 600 aagaccactg cctcctcgga ggccgccaac gccgccgcca aaaaggcggc cgcgatagct 660 tctgacgcgg acggcgcgga aaggtcggca tctaccgagg cacaatcagc tgcgaagatc 720 gagagtgtgg cagccgccga gggatccgcc aactcggcct ctgaggattc ccgggccgct 780 caattggaag cctccaccgc ggcgagagcc aacgtggccg cagctgtcgg ggatggagcg 840 attataggac ttggagagga agcgggtgcc gcggctcagt tgcttgcaca ggcgaaggca 900 ttggccgaag ttagctcgaa atccgaaaat attgaggata aaaaatttt 949 <210> 16 <211> 1006 <212> DNA <213> Apis mellifera <400> 16 atgcagatcc caacgtttgt cgccatatgc ttgctcacat cgggcttggt gcacgcaggc 60 gtcgaggaat tcaagtcctc ggcaaccgag gaggtgatca gcaaaaactt agaagtcgac 120 ctgttgaaaa atgtggacac tagcgcgaaa cgaagagaga acggcgcccc ggtgctcggc 180 aagaacacac ttcaatccct ggagaagatc aagacgtcgg cgagcgtgaa tgccaaagca 240 gcagccgtgg tgaaagcgtc cgctctggct cttgcagagg cctatttgcg agcgtccgca 300 ttgtcagccg ccgcttcagc caaggcagcc gccgccctga aaaatgctca acaagcgcaa 360 ttaaacgccc aggaaaagtc tttggccgcg ttgaaagctc agtccgagga agaggcagct 420 tctgctcgtg caaacgcagc aaccgccgcg acacagtcgg cactggaacg cgctcaagcc 480 tcctccaggt tagcaacggt cgcccaaaac gtagccagcg acttgcagaa acggaccagc 540 accaaggccg cggctgaagc cgctgccacc ctcagacaat tacaggacgc ggaacgaacg 600 aaatggagtg ccaacgctgc cttagaagtc tccgccgctg cagctgccgc agaaaccaag 660 accactgcct cctcggaggc cgccaacgcc gccgccaaaa aggcggccgc gatagcttct 720 gacgcggacg gcgcggaaag gtcggcatct accgaggcac aatcagctgc gaagatcgag 780 agtgtggcag ccgccgaggg atccgccaac tcggcctctg aggattcccg ggccgctcaa 840 ttggaagcct ccaccgcggc gagagccaac gtggccgcag ctgtcgggga tggagcgatt 900 ataggacttg gagaggaagc gggtgccgcg gctcagttgc ttgcacaggc gaaggcattg 960 gccgaagtta gctcgaaatc cgaaaatatt gaggataaaa aatttt 1006 <210> 17 <211> 969 <212> DNA <213> Apis mellifera <400> 17 gcaagggaag aggtggagac acgggacaag accaagacct cgacagtggt gaaaagcgag 60 aaagtggaag tcgttgctcc cgctaaggat gaacttaaat taacgagcga gcctatcttt 120 ggaagaagag tgggaactgg agcatccgag gtggcatcta gcagcggtga agccatcgcg 180 ataagtcttg gagcagggca gtcagcggca gagtctcagg ccttggccgc ctcgcaatcc 240 aaaacggcag cgaacgccgc cataggcgcg agcgagctta ccaacaaagt tgctgctcta 300 gttgctggcg cgactggtgc gcaggcgaga gctacggccg cctcctcgag cgcgttgaag 360 gccagcttgg cgaccgaaga agcggcggaa gaggccgagg cggccgtggc tgacgccaag 420 gctgccgcgg aaaaggccga atccctggcg aaaaatctcg cgtcggcgag cgctcgcgcg 480 gccctctcct ccgaaagggc gaacgaattg gctcaagctg agagcgctgc agcggccgag 540 gcgcaggcca agacagcagc cgccgccaaa gcagcggaaa tcgcccttaa ggtcgctgag 600 atagcggtga aggcggaagc ggacgcagca gctgccgccg tggcagctgc aaaggcaaga 660 gccgtggcag acgcggccgc tgcccgtgcc gcagccgtga acgccatcgc caaggcggaa 720 gaggaggcct cggcccaagc agagaacgcc gccggtgttt tgcaagcagc cgcctccgcc 780 gcggcggaat cgcgagccgc tgcagctgcc gccgctgcta cctcggaggc agcggctgaa 840 gctggcccgt tggcaggtga gatgaaacca ccgcactgga aatgggaacg gattcctgtg 900 aagaaggagg agtggaaaac gtcaacgaag gaagaatgga aaacgacgaa tgaagaatgg 960 gaggtgaag 969 <210> 18 <211> 1026 <212> DNA <213> Apis mellifera <400> 18 atgaagatcc catccatact cgcggtttcc ctgctgatct ggggtttggc aagcggcgca 60 agggaagagg tggagacacg ggacaagacc aagacctcga cagtggtgaa aagcgagaaa 120 gtggaagtcg ttgctcccgc taaggatgaa cttaaattaa cgagcgagcc tatctttgga 180 agaagagtgg gaactggagc atccgaggtg gcatctagca gcggtgaagc catcgcgata 240 agtcttggag cagggcagtc agcggcagag tctcaggcct tggccgcctc gcaatccaaa 300 acggcagcga acgccgccat aggcgcgagc gagcttacca acaaagttgc tgctctagtt 360 gctggcgcga ctggtgcgca ggcgagagct acggccgcct cctcgagcgc gttgaaggcc 420 agcttggcga ccgaagaagc ggcggaagag gccgaggcgg ccgtggctga cgccaaggct 480 gccgcggaaa aggccgaatc cctggcgaaa aatctcgcgt cggcgagcgc tcgcgcggcc 540 ctctcctccg aaagggcgaa cgaattggct caagctgaga gcgctgcagc ggccgaggcg 600 caggccaaga cagcagccgc cgccaaagca gcggaaatcg cccttaaggt cgctgagata 660 gcggtgaagg cggaagcgga cgcagcagct gccgccgtgg cagctgcaaa ggcaagagcc 720 gtggcagacg cggccgctgc ccgtgccgca gccgtgaacg ccatcgccaa ggcggaagag 780 gaggcctcgg cccaagcaga gaacgccgcc ggtgttttgc aagcagccgc ctccgccgcg 840 gcggaatcgc gagccgctgc agctgccgcc gctgctacct cggaggcagc ggctgaagct 900 ggcccgttgg caggtgagat gaaaccaccg cactggaaat gggaacggat tcctgtgaag 960 aaggaggagt ggaaaacgtc aacgaaggaa gaatggaaaa cgacgaatga agaatgggag 1020 gtgaag 1026 <210> 19 <211> 1059 <212> DNA <213> Apis mellifera <400> 19 ggcgtaaata cagaattaaa aaaagatggt gaactaaagg aagagtctta tgagaaaagc 60 gagtcaaaga gtttaaaaga aattaaagaa gaacgtgctt caaaatcaaa aagtgaacgt 120 ttgaagattc gtgaagaaaa acgcgaagag gaagaaaaat ccaagagtct gaatctggtc 180 gtggtcagag aaaagattac caaactttct tcatggctca aagaagagaa agatatcagt 240 cctcttttgg aagaaaaaaa tggcaaaggt ctattgggtt tggaagatgt cacggacgag 300 ttaaatatcg ctcttaaatc gttgaaggag ggcaaaaagt ttgatacttg gaaattcgag 360 aaaggtagcg aagacgttcg ttctttggaa gaacttgata cgagcgtcgt tgaactttta 420 aaattaataa aggaaggaaa aactgaccat ggtgctatag atttggagaa gaatggtaag 480 gtacttgtag atttggaaaa aatctcagaa aacatacttg aaacttgtgg atcacaaaag 540 aagactgtgg aagttgtaga tgataaagac aaaaaatgga ataaagaatc aggttggaaa 600 aaaaatctaa atgatctaga ttggaaaaaa gatttagata aagataaagt tggtggcggt 660 ttgcttggcg gtttaagtgg cctcttaaat agtttaaaat cagaaaaagg tcttctaggt 720 cttttgaata agaatcaaat tgagttatta attcctttaa tcagtgagat aaaaaagaaa 780 aatatagatt ttaatctctt cgattctgtt gattctgtcg aaagaaattt agacttgaaa 840 cttttcacaa gttctgtttc aaaagttact gaattattaa ataaaggaat cgatattcaa 900 acaattttga atgcgaaaaa tggagatgaa ttcgatttaa gcggcaaaga attgaaaaac 960 gtcaaaggga tatttggttt gattggaagt ttgaaacgct cattaggatt agaaaatata 1020 ttgaacttac cgtttaaacg tatacctctg cttaaatta 1059 <210> 20 <211> 1116 <212> DNA <213> Apis mellifera <400> 20 atgaaataca tgctcttgtt gctatctata ttcatctgtg cacatattgt atgcgcaggc 60 gtaaatacag aattaaaaaa agatggtgaa ctaaaggaag agtcttatga gaaaagcgag 120 tcaaagagtt taaaagaaat taaagaagaa cgtgcttcaa aatcaaaaag tgaacgtttg 180 aagattcgtg aagaaaaacg cgaagaggaa gaaaaatcca agagtctgaa tctggtcgtg 240 gtcagagaaa agattaccaa actttcttca tggctcaaag aagagaaaga tatcagtcct 300 cttttggaag aaaaaaatgg caaaggtcta ttgggtttgg aagatgtcac ggacgagtta 360 aatatcgctc ttaaatcgtt gaaggagggc aaaaagtttg atacttggaa attcgagaaa 420 ggtagcgaag acgttcgttc tttggaagaa cttgatacga gcgtcgttga acttttaaaa 480 ttaataaagg aaggaaaaac tgaccatggt gctatagatt tggagaagaa tggtaaggta 540 cttgtagatt tggaaaaaat ctcagaaaac atacttgaaa cttgtggatc acaaaagaag 600 actgtggaag ttgtagatga taaagacaaa aaatggaata aagaatcagg ttggaaaaaa 660 aatctaaatg atctagattg gaaaaaagat ttagataaag ataaagttgg tggcggtttg 720 cttggcggtt taagtggcct cttaaatagt ttaaaatcag aaaaaggtct tctaggtctt 780 ttgaataaga atcaaattga gttattaatt cctttaatca gtgagataaa aaagaaaaat 840 atagatttta atctcttcga ttctgttgat tctgtcgaaa gaaatttaga cttgaaactt 900 ttcacaagtt ctgtttcaaa agttactgaa ttattaaata aaggaatcga tattcaaaca 960 attttgaatg cgaaaaatgg agatgaattc gatttaagcg gcaaagaatt gaaaaacgtc 1020 aaagggatat ttggtttgat tggaagtttg aaacgctcat taggattaga aaatatattg 1080 aacttaccgt ttaaacgtat acctctgctt aaatta 1116 <210> 21 <211> 1660 <212> DNA <213> Apis mellifera <400> 21 atgaaataca tgctcttgtt gctatctata ttcatctgtg cacatattgt atgcgcaggc 60 gtaaatacag aattaaaaaa agatggtgaa ctaaaggaag agtcttatga gaaaagcgag 120 tcaaagagtt taaaagaaat taaagaagaa cgtgcttcaa aatcaaaaag tgaacgtttg 180 aagattcgtg aaggtaattc gtgagattca agattcaaat caattaaatt tgaaaattat 240 gaaagtagta ttgttaaatt ataagataga agattttatc taaaaaataa taaattaagc 300 tttttgtatt tttggatatt gtagatattt ttaatataga attcttataa agttaaaaaa 360 tattttataa attaaacaac tttttattat ttttatgatc taaaaattaa aaatttcaag 420 ttaaagttca aattaaaaat ttgtaaaaaa tatggaaaaa acataaaaat tgaatttgtt 480 gtaatttaaa aaggattttt attatttatt gattaattat gaatataagt tcgaaaaatc 540 ctaaatatta atgtttaaaa ttttaattct taacaaaata tatttaattt aattcttaac 600 aaagatacat ttaaagaatt tcgcaaattt aaaaattagg tttttaattt taagaatcaa 660 atggtaaaaa acattttaaa tttgaaatat ataaaagtaa atcttttaat cgacaaacgg 720 atgaatttat tgattagaaa aacgcgaaga ggaagaaaaa tccaagagtc tgaatctggt 780 cgtggtcaga gaaaagatta ccaaactttc ttcatggctc aaagaagaga aagatatcag 840 tcctcttttg gaagaaaaaa atggcaaagg tctattgggt ttggaagatg tcacggacga 900 gttaaatatc gctcttaaat cgttgaagga gggcaaaaag tttgatactt ggaaattcga 960 gaaaggtagc gaagacgttc gttctttgga agaacttgat acgagcgtcg ttgaactttt 1020 aaaattaata aaggaaggaa aaactgacca tggtgctata gatttggaga agaatggtaa 1080 ggtacttgta gatttggaaa aaatctcaga aaacatactt gaaacttgtg gatcacaaaa 1140 gaagactgtg gaagttgtag atgataaaga caaaaaatgg aataaagaat caggttggaa 1200 aaaaaatcta aatgatctag attggaaaaa agatttagat aaagataaag ttggtggcgg 1260 tttgcttggc ggtttaagtg gcctcttaaa tagtttaaaa tcagaaaaag gtcttctagg 1320 tcttttgaat aagaatcaaa ttgagttatt aattccttta atcagtgaga taaaaaagaa 1380 aaatatagat tttaatctct tcgattctgt tgattctgtc gaaagaaatt tagacttgaa 1440 acttttcaca agttctgttt caaaagttac tgaattatta aataaaggaa tcgatattca 1500 aacaattttg aatgcgaaaa atggagatga attcgattta agcggcaaag aattgaaaaa 1560 cgtcaaaggg atatttggtt tgattggaag tttgaaacgc tcattaggat tagaaaatat 1620 attgaactta ccgtttaaac gtatacctct gcttaaatta 1660 <210> 22 <211> 308 <212> PRT <213> Bombus terrestris <400> 22 Gly Gln Ser Ser Pro Leu Leu Glu Ile Val Gln Gly Ser Ala Ser Ala 1 5 10 15 Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg Ala Gly Gln 20 25 30 Val Ala Val Ala Ser Gln Lys Asp Ala Thr Leu Gln Ala Asp Ala Ser 35 40 45 Ala Ala Ala Ala Ala Ala Ala Arg Ala Ser Ala Asp Gln Ser Ala Ser 50 55 60 Leu Ala Gln Gln Ser Ala Ser Leu Gln Ser Lys Ala Ala Ala Arg Ala 65 70 75 80 Lys Ser Ala Glu Glu Ser Ala Ala Ala Thr Ala Lys Ala Glu Leu Gln 85 90 95 Ala Glu Ser Ile Ala Ala Ser Ala Ser Ser Asn Ala Arg Glu Ala Ala 100 105 110 Ala Ser Ala Lys Ala Ser Ala Ser Ala Met Ser Ser Ala Ala Val Gln 115 120 125 Ala Lys Leu Ala Glu Lys Thr Ala Lys Asn Gln Ala Leu Ala Ser Glu 130 135 140 Glu Ala Lys Leu Lys Ala Ala Ala Ala Ala Ser Ala Ala Ala Ala Ala 145 150 155 160 Ser Ala Ala Ala Glu Ala Ala Leu Lys Ala Glu Arg Ile Ala Glu Glu 165 170 175 Ala Ile Ala Lys Ala Ala Ala Ala Lys Ala Ala Ala Arg Ala Ala Ala 180 185 190 Ala Ala Leu Asn Ser Ala Lys Glu Ala Ala Thr Ser Ser Ala Arg Ser 195 200 205 Ala Ala Glu Ala Glu Ala Lys Ser Glu Val Ala Ile Leu Ile Ser Glu 210 215 220 Leu Asp Lys Lys Ser Arg Glu Val Ala Ala Ser Ala Ser Ala Lys Ala 225 230 235 240 Arg Ala Ala Ala Ala Ala Ser Ser Arg Asn Ala Glu Thr Ala Val Ile 245 250 255 Gly Ala Asn Ile Asn Val Ala Lys Glu Val Leu Ala Ile Pro Ile Glu 260 265 270 Pro Lys Lys Leu Pro Glu Pro Glu Leu Ala Leu Lys Glu Glu Asn Val 275 280 285 Ala Val Ala Ser Ser Glu Ser Glu Val Lys Val Glu Thr Ser Ser Glu 290 295 300 Ala Trp Ser Ile 305 <210> 23 <211> 327 <212> PRT <213> Bombus terrestris <400> 23 Met Lys Ile Pro Ala Leu Leu Val Thr Cys Leu Tyr Leu Trp Gly Phe 1 5 10 15 Ala Ser Ala Gly Gln Ser Ser Pro Leu Leu Glu Ile Val Gln Gly Ser 20 25 30 Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg 35 40 45 Ala Gly Gln Val Ala Val Ala Ser Gln Lys Asp Ala Thr Leu Gln Ala 50 55 60 Asp Ala Ser Ala Ala Ala Ala Ala Ala Ala Arg Ala Ser Ala Asp Gln 65 70 75 80 Ser Ala Ser Leu Ala Gln Gln Ser Ala Ser Leu Gln Ser Lys Ala Ala 85 90 95 Ala Arg Ala Lys Ser Ala Glu Glu Ser Ala Ala Ala Thr Ala Lys Ala 100 105 110 Glu Leu Gln Ala Glu Ser Ile Ala Ala Ser Ala Ser Ser Asn Ala Arg 115 120 125 Glu Ala Ala Ala Ser Ala Lys Ala Ser Ala Ser Ala Met Ser Ser Ala 130 135 140 Ala Val Gln Ala Lys Leu Ala Glu Lys Thr Ala Lys Asn Gln Ala Leu 145 150 155 160 Ala Ser Glu Glu Ala Lys Leu Lys Ala Ala Ala Ala Ala Ser Ala Ala 165 170 175 Ala Ala Ala Ser Ala Ala Ala Glu Ala Ala Leu Lys Ala Glu Arg Ile 180 185 190 Ala Glu Glu Ala Ile Ala Lys Ala Ala Ala Ala Lys Ala Ala Ala Arg 195 200 205 Ala Ala Ala Ala Ala Leu Asn Ser Ala Lys Glu Ala Ala Thr Ser Ser 210 215 220 Ala Arg Ser Ala Ala Glu Ala Glu Ala Lys Ser Glu Val Ala Ile Leu 225 230 235 240 Ile Ser Glu Leu Asp Lys Lys Ser Arg Glu Val Ala Ala Ser Ala Ser 245 250 255 Ala Lys Ala Arg Ala Ala Ala Ala Ala Ser Ser Arg Asn Ala Glu Thr 260 265 270 Ala Val Ile Gly Ala Asn Ile Asn Val Ala Lys Glu Val Leu Ala Ile 275 280 285 Pro Ile Glu Pro Lys Lys Leu Pro Glu Pro Glu Leu Ala Leu Lys Glu 290 295 300 Glu Asn Val Ala Val Ala Ser Ser Glu Ser Glu Val Lys Val Glu Thr 305 310 315 320 Ser Ser Glu Ala Trp Ser Ile 325 <210> 24 <211> 293 <212> PRT <213> Bombus terrestris <400> 24 His Val Val Lys Arg Asp Lys Glu Leu Lys Ala Pro Ala Leu Pro Glu 1 5 10 15 Leu Leu Gly Asp Gly Ser Asp Thr Leu Gly Ala Ser Met Glu Asn Gly 20 25 30 Ile Lys Val Ala Arg Ala Ser Gln Asn Val Gly Leu Arg Thr Glu Leu 35 40 45 Asn Ala Ala Ala Arg Ala Ala Ala Ala Ala Ala Thr Lys Gln Ala Lys 50 55 60 Asp Thr Glu Ala Ala Glu Ala Gly Ala Ala Ala Ala Ile Ala Ile Ala 65 70 75 80 Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu Leu Ala Ser Lys 85 90 95 Leu Leu Thr Ala Ala Ala Gly Ser Ser Glu Ala Ala Val Ser Ala Thr 100 105 110 Val Arg Ala Ala Gln Leu Thr Ala Ala Ala Ser Ala Ala Ala Lys Ala 115 120 125 Ser Ala Ser Ala Ser Glu Ala Ser Ala Glu Ala Gln Val Arg Ala Asn 130 135 140 Ala Glu Ala Asn Ile Ala Lys Lys Ala Ser Ala Ala Glu Ala Lys Ala 145 150 155 160 Ala Ala Glu Ala Gln Val Lys Ala Glu Leu Ala Lys Lys Ala Ala Ala 165 170 175 Gly Phe Leu Ala Lys Ala Arg Leu Ala Ala Ser Ala Glu Ser Glu Ala 180 185 190 Thr Lys Leu Ala Ala Glu Ala Glu Val Ala Leu Ala Lys Ala Arg Val 195 200 205 Ala Val Asp Gln Ser Gln Ser Ala Gln Ala Thr Ala Thr Ala Gln Ala 210 215 220 Ala Thr Ala Val Gln Leu Gln Ser Gln Ala Ala Asn Ala Glu Ala Ser 225 230 235 240 Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala Glu Ala Val Ser 245 250 255 Ala Ala Glu Ala Glu Ala Ala Thr Lys Ala Thr Ser Trp Gly Glu Glu 260 265 270 Cys His Gln Arg Glu Lys Val Thr Phe Ser Glu Asp Arg Leu Asn Glu 275 280 285 Arg Gln Asp Asn Trp 290 <210> 25 <211> 313 <212> PRT <213> Bombus terrestris <400> 25 Met Lys Ile Pro Ala Ile Leu Val Thr Ser Leu Leu Val Trp Gly Gly 1 5 10 15 Leu Ala Glu Gly His Val Val Lys Arg Asp Lys Glu Leu Lys Ala Pro 20 25 30 Ala Leu Pro Glu Leu Leu Gly Asp Gly Ser Asp Thr Leu Gly Ala Ser 35 40 45 Met Glu Asn Gly Ile Lys Val Ala Arg Ala Ser Gln Asn Val Gly Leu 50 55 60 Arg Thr Glu Leu Asn Ala Ala Ala Arg Ala Ala Ala Ala Ala Ala Thr 65 70 75 80 Lys Gln Ala Lys Asp Thr Glu Ala Ala Glu Ala Gly Ala Ala Ala Ala 85 90 95 Ile Ala Ile Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu 100 105 110 Leu Ala Ser Lys Leu Leu Thr Ala Ala Ala Gly Ser Ser Glu Ala Ala 115 120 125 Val Ser Ala Thr Val Arg Ala Ala Gln Leu Thr Ala Ala Ala Ser Ala 130 135 140 Ala Ala Lys Ala Ser Ala Ser Ala Ser Glu Ala Ser Ala Glu Ala Gln 145 150 155 160 Val Arg Ala Asn Ala Glu Ala Asn Ile Ala Lys Lys Ala Ser Ala Ala 165 170 175 Glu Ala Lys Ala Ala Ala Glu Ala Gln Val Lys Ala Glu Leu Ala Lys 180 185 190 Lys Ala Ala Ala Gly Phe Leu Ala Lys Ala Arg Leu Ala Ala Ser Ala 195 200 205 Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Glu Val Ala Leu Ala 210 215 220 Lys Ala Arg Val Ala Val Asp Gln Ser Gln Ser Ala Gln Ala Thr Ala 225 230 235 240 Thr Ala Gln Ala Ala Thr Ala Val Gln Leu Gln Ser Gln Ala Ala Asn 245 250 255 Ala Glu Ala Ser Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala 260 265 270 Glu Ala Val Ser Ala Ala Glu Ala Glu Ala Ala Thr Lys Ala Thr Ser 275 280 285 Trp Gly Glu Glu Cys His Gln Arg Glu Lys Val Thr Phe Ser Glu Asp 290 295 300 Arg Leu Asn Glu Arg Gln Asp Asn Trp 305 310 <210> 26 <211> 313 <212> PRT <213> Bombus terrestris <400> 26 Gly Ser Val Glu Leu Gly Ala Pro Lys Gln Glu Ser Val Leu Val Glu 1 5 10 15 Gln Leu Leu Leu Lys Asn Val Glu Thr Ser Ala Lys Arg Lys Glu Asn 20 25 30 Gly Ala Pro Lys Leu Gly Glu Ser Thr Ala Ala Ala Leu Ala Ser Thr 35 40 45 Lys Ala Thr Ala Ala Ala Glu Ala Lys Ala Ser Ala Lys Val Lys Ala 50 55 60 Ser Ala Leu Ala Leu Ala Glu Ala Phe Leu Arg Ala Ser Ala Ala Phe 65 70 75 80 Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Val Lys Glu Ala Thr Gln 85 90 95 Ala Gln Leu Leu Ala Gln Glu Lys Ala Leu Ile Ala Leu Lys Thr Gln 100 105 110 Ser Glu Gln Gln Ala Ala Ser Ala Arg Ala Asp Ala Ala Ala Ala Ala 115 120 125 Ala Val Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg Ala Ala Thr 130 135 140 Thr Ala Gln Asp Ile Ser Ser Asp Leu Glu Lys Arg Val Ala Thr Ser 145 150 155 160 Ala Ala Ala Glu Ala Gly Ala Thr Leu Arg Ala Glu Gln Ser Ala Ala 165 170 175 Gln Ser Lys Trp Ser Ala Ala Leu Ala Ala Gln Thr Ala Ala Ala Ala 180 185 190 Ala Ala Ile Glu Ala Lys Ala Thr Ala Ser Ser Glu Ser Thr Ala Ala 195 200 205 Ala Thr Ser Lys Ala Ala Val Leu Thr Ala Asp Thr Ser Ser Ala Glu 210 215 220 Ala Ala Ala Ala Ala Glu Ala Gln Ser Ala Ser Arg Ile Ala Gly Thr 225 230 235 240 Ala Ala Thr Glu Gly Ser Ala Asn Trp Ala Ser Glu Asn Ser Arg Thr 245 250 255 Ala Gln Leu Glu Ala Ser Ala Ser Ala Lys Ala Thr Ala Ala Ala Ala 260 265 270 Val Gly Asp Gly Ala Ile Ile Gly Leu Ala Arg Asp Ala Ser Ala Ala 275 280 285 Ala Gln Ala Ala Ala Glu Val Lys Ala Leu Ala Glu Ala Ser Ala Ser 290 295 300 Leu Gly Ala Ser Glu Lys Asp Lys Lys 305 310 <210> 27 <211> 332 <212> PRT <213> Bombus terrestris <400> 27 Met Gln Ile Pro Ala Ile Phe Val Thr Cys Leu Leu Thr Trp Gly Leu 1 5 10 15 Val His Ala Gly Ser Val Glu Leu Gly Ala Pro Lys Gln Glu Ser Val 20 25 30 Leu Val Glu Gln Leu Leu Leu Lys Asn Val Glu Thr Ser Ala Lys Arg 35 40 45 Lys Glu Asn Gly Ala Pro Lys Leu Gly Glu Ser Thr Ala Ala Ala Leu 50 55 60 Ala Ser Thr Lys Ala Thr Ala Ala Ala Glu Ala Lys Ala Ser Ala Lys 65 70 75 80 Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Phe Leu Arg Ala Ser 85 90 95 Ala Ala Phe Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Val Lys Glu 100 105 110 Ala Thr Gln Ala Gln Leu Leu Ala Gln Glu Lys Ala Leu Ile Ala Leu 115 120 125 Lys Thr Gln Ser Glu Gln Gln Ala Ala Ser Ala Arg Ala Asp Ala Ala 130 135 140 Ala Ala Ala Ala Val Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg 145 150 155 160 Ala Ala Thr Thr Ala Gln Asp Ile Ser Ser Asp Leu Glu Lys Arg Val 165 170 175 Ala Thr Ser Ala Ala Ala Glu Ala Gly Ala Thr Leu Arg Ala Glu Gln 180 185 190 Ser Ala Ala Gln Ser Lys Trp Ser Ala Ala Leu Ala Ala Gln Thr Ala 195 200 205 Ala Ala Ala Ala Ala Ile Glu Ala Lys Ala Thr Ala Ser Ser Glu Ser 210 215 220 Thr Ala Ala Ala Thr Ser Lys Ala Ala Val Leu Thr Ala Asp Thr Ser 225 230 235 240 Ser Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ser Ala Ser Arg Ile 245 250 255 Ala Gly Thr Ala Ala Thr Glu Gly Ser Ala Asn Trp Ala Ser Glu Asn 260 265 270 Ser Arg Thr Ala Gln Leu Glu Ala Ser Ala Ser Ala Lys Ala Thr Ala 275 280 285 Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Ala Arg Asp Ala 290 295 300 Ser Ala Ala Ala Gln Ala Ala Ala Glu Val Lys Ala Leu Ala Glu Ala 305 310 315 320 Ser Ala Ser Leu Gly Ala Ser Glu Lys Asp Lys Lys 325 330 <210> 28 <211> 338 <212> PRT <213> Bombus terrestris <400> 28 Gly Lys Pro Leu Ile Ala Asn Ala Gln Ile Gly Lys Val Lys Thr Glu 1 5 10 15 Thr Ser Ser Ser Ser Glu Ile Glu Thr Leu Val Ser Gly Ser Gln Thr 20 25 30 Leu Val Ala Gly Ser Glu Thr Leu Ala Ser Glu Ser Glu Ala Leu Ala 35 40 45 Ser Lys Ser Glu Ala Leu Thr Ser Glu Ala Glu Ile Ala Ser Val Thr 50 55 60 Thr Lys Asp Glu Leu Ile Leu Lys Gly Glu Ala Ile Thr Gly Lys Lys 65 70 75 80 Leu Gly Thr Gly Ala Ser Glu Val Ala Ala Ala Ser Gly Glu Ala Ile 85 90 95 Ala Thr Thr Leu Gly Ala Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala 100 105 110 Ala Ala Ala Gln Ala Lys Ser Ala Ala Ala Ala Ala Ala Asn Ala Gly 115 120 125 Glu Ser Ser Asn Ser Ala Ala Ala Leu Val Ala Ala Ala Ala Ala Ala 130 135 140 Gln Gly Lys Ala Ala Ala Ala Ala Ala Ala Ala Thr Lys Ala Ser Leu 145 150 155 160 Glu Ala Ala Asp Ala Ala Glu Glu Ala Glu Ser Ala Val Ala Leu Ala 165 170 175 Arg Ala Ala Ser Ala Lys Ala Glu Ala Leu Ala Ser Thr Ala Ala Ala 180 185 190 Ala Asn Thr Arg Ala Ala Leu Gln Ala Glu Lys Ser Asn Glu Leu Ala 195 200 205 Gln Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ala Lys Ala Ala Ala 210 215 220 Ala Ala Lys Ala Thr Gln Leu Ala Leu Lys Val Ala Glu Thr Ala Val 225 230 235 240 Lys Thr Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala 245 250 255 Arg Ala Val Ala Asp Ala Ala Ala Ser Arg Ala Thr Ala Val Asn Ala 260 265 270 Ile Ala Glu Ala Glu Glu Arg Asp Ser Ala Gln Ala Glu Asn Thr Ala 275 280 285 Gly Val Ala Gln Ala Ala Leu Ala Ala Ala Glu Ala Gln Asp Ser Cys 290 295 300 Ile Gly Ala Ala Ala Thr Pro Arg His Ser Ser Ser Tyr Ala Trp Trp 305 310 315 320 Lys Leu Arg Ile Thr Ser Leu Ile Val Ile Leu Ser Pro Arg Asn Arg 325 330 335 Arg Thr <210> 29 <211> 357 <212> PRT <213> Bombus terrestris <400> 29 Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Val Trp Gly Leu 1 5 10 15 Ala Ser Ala Gly Lys Pro Leu Ile Ala Asn Ala Gln Ile Gly Lys Val 20 25 30 Lys Thr Glu Thr Ser Ser Ser Ser Glu Ile Glu Thr Leu Val Ser Gly 35 40 45 Ser Gln Thr Leu Val Ala Gly Ser Glu Thr Leu Ala Ser Glu Ser Glu 50 55 60 Ala Leu Ala Ser Lys Ser Glu Ala Leu Thr Ser Glu Ala Glu Ile Ala 65 70 75 80 Ser Val Thr Thr Lys Asp Glu Leu Ile Leu Lys Gly Glu Ala Ile Thr 85 90 95 Gly Lys Lys Leu Gly Thr Gly Ala Ser Glu Val Ala Ala Ala Ser Gly 100 105 110 Glu Ala Ile Ala Thr Thr Leu Gly Ala Gly Gln Ala Ala Ala Glu Ala 115 120 125 Gln Ala Ala Ala Ala Ala Gln Ala Lys Ser Ala Ala Ala Ala Ala Ala 130 135 140 Asn Ala Gly Glu Ser Ser Asn Ser Ala Ala Ala Leu Val Ala Ala Ala 145 150 155 160 Ala Ala Ala Gln Gly Lys Ala Ala Ala Ala Ala Ala Ala Ala Thr Lys 165 170 175 Ala Ser Leu Glu Ala Ala Asp Ala Ala Glu Glu Ala Glu Ser Ala Val 180 185 190 Ala Leu Ala Arg Ala Ala Ser Ala Lys Ala Glu Ala Leu Ala Ser Thr 195 200 205 Ala Ala Ala Ala Asn Thr Arg Ala Ala Leu Gln Ala Glu Lys Ser Asn 210 215 220 Glu Leu Ala Gln Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ala Lys 225 230 235 240 Ala Ala Ala Ala Ala Lys Ala Thr Gln Leu Ala Leu Lys Val Ala Glu 245 250 255 Thr Ala Val Lys Thr Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala 260 265 270 Ala Lys Ala Arg Ala Val Ala Asp Ala Ala Ala Ser Arg Ala Thr Ala 275 280 285 Val Asn Ala Ile Ala Glu Ala Glu Glu Arg Asp Ser Ala Gln Ala Glu 290 295 300 Asn Thr Ala Gly Val Ala Gln Ala Ala Leu Ala Ala Ala Glu Ala Gln 305 310 315 320 Asp Ser Cys Ile Gly Ala Ala Ala Thr Pro Arg His Ser Ser Ser Tyr 325 330 335 Ala Trp Trp Lys Leu Arg Ile Thr Ser Leu Ile Val Ile Leu Ser Pro 340 345 350 Arg Asn Arg Arg Thr 355 <210> 30 <211> 422 <212> PRT <213> Bombus terrestris <400> 30 Gly Asn Ser Glu Ser Gly Glu Asn Trp Lys Asn Gly Glu Ser Ser Glu 1 5 10 15 Ser Gly Lys Asn Trp Arg Asn Ser Gly Ser Ser Glu Ser Gly Lys Asn 20 25 30 Trp Lys Asn Gly Gly Ser Ser Glu Ser Asn Lys His Trp Lys Asn Gly 35 40 45 Gly Ser Ser Glu Ser Gly Glu Lys Trp Lys Asn Ser Glu Ser Ser Glu 50 55 60 Ser Gly Lys Asn Trp Lys Asn Ser Gly Ser Ser Glu Ser Gly Lys Asn 65 70 75 80 Trp Lys Asn Gly Gly Ser Ser Glu Ser Asn Lys His Trp Lys Ser Gly 85 90 95 Gly Ser Ser Glu Ser Gly Glu Lys Trp Lys Asn Ser Glu Ser Gly Asn 100 105 110 Lys Gly Lys Ser Ser Lys Ser Ser Glu Ser Trp Lys Ser Asn Glu Asn 115 120 125 Ser Lys Asn Asp Gly Ser Trp Lys Ser Ser Glu Glu Ser Glu Lys Trp 130 135 140 Lys Asp Gly Lys Ala Val Ala Glu Asp Ser Val Ser Ile Asn Trp Ala 145 150 155 160 Asp Val Lys Glu Gln Ile Ser Asn Ile Ala Thr Ser Leu Glu Lys Gly 165 170 175 Gly Asn Leu Glu Ala Val Leu Lys Ile Lys Lys Gly Glu Lys Lys Ile 180 185 190 Ser Ser Leu Glu Glu Ile Lys Glu Lys Ile Ser Val Leu Leu Lys Trp 195 200 205 Ile Gln Glu Gly Lys Asp Thr Ser Ser Leu Leu Asp Leu Lys Glu Gly 210 215 220 Ser Lys Asp Ile Ala Ser Leu Lys Glu Ile Lys Gly Lys Ile Leu Leu 225 230 235 240 Ile Val Lys Leu Val Asn Glu Gly Lys Asp Thr Ser Gly Leu Leu Asp 245 250 255 Leu Glu Ala Ser Gly Lys Val Ile Leu Glu Leu Gln Ser Ala Ile Glu 260 265 270 Lys Val Leu Val Lys Ser Glu Lys Val Thr Lys Val Ser Glu Val Ser 275 280 285 Gly Leu Val Lys Ser Lys Thr Val Ser Asp Ile Lys Pro Leu Gln Ala 290 295 300 Val Ile Pro Leu Ile Leu Glu Leu Gln Lys Thr Asp Ile Asn Leu Ser 305 310 315 320 Thr Leu Asn Lys Trp Ser Thr Val Asn Val Asn Ser Ile Asp Lys Glu 325 330 335 Arg Val Thr Lys Thr Val Pro Val Leu Leu Gln Ser Met Lys Gly Gly 340 345 350 Glu Asp Ile Gln Asn Leu Leu Ser Ala Lys Gly Ala Lys Lys Leu Gly 355 360 365 Ile Ser Ala Leu Asp Leu Gln Ala Val Gln Gly Ala Leu Gly Val Val 370 375 380 Gly Lys Leu Ser Ser Gly Gly Ala Leu Asn Ser Lys Gly Leu Leu Asn 385 390 395 400 Leu Lys Asp Gly Ala Ser Val Leu Gly Ala Gly Lys Ile Gly Gly Leu 405 410 415 Ile Pro Leu Pro Lys Leu 420 <210> 31 <211> 927 <212> DNA <213> Bombus terrestris <400> 31 ggccagagct cacctctgct cgagatcgtg cagggtagcg cgtcggccac cgcatccacc 60 gctgtgaccg ctagatccgg acttcgtgcc ggtcaggtag ccgtggcctc gcagaaggat 120 gccacacttc aggcagatgc ctcagcggcc gccgcggccg ctgcacgcgc ttccgccgac 180 cagtcggcca gtctagccca acagtcggcg tctttgcagt ccaaagctgc cgccagagca 240 aaatcagccg aggagtcagc ggcagctacg gccaaagccg agttgcaggc agaatccatt 300 gctgcatctg ccagttccaa tgccagagag gctgcagcgt ccgcaaaagc ctccgcatcc 360 gcgatgtcat cggctgccgt gcaggcgaaa ctcgctgaaa agacggccaa gaatcaagct 420 ctggcttccg aagaagccaa actcaaggct gccgccgctg ccagcgcagc agcagcagcc 480 agcgccgccg ccgaggcagc cctgaaagct gagagaatag cggaagaagc catcgccaag 540 gcggccgctg ccaaagcagc cgccagagcc gctgcagccg cgttaaactc cgcgaaggaa 600 gccgccacga gcagcgcaag gagcgccgcc gaagccgaag ctaagagcga agtcgctata 660 ctgatcagcg aactcgacaa gaagagcagg gaagtcgccg cttccgcgtc cgccaaggca 720 cgcgctgctg ctgcggctag ctccagaaac gcagaaacgg ctgttatcgg agctaacatc 780 aatgtggcca aagaggtctt ggcgattccc atcgagccaa agaaacttcc ggagccagag 840 ctggcgttga aagaagagaa tgtcgcggtc gcgagctcag agagtgaagt gaaggtagaa 900 acgagcagcg aagcatggtc aatttaa 927 <210> 32 <211> 984 <212> DNA <213> Bombus terrestris <400> 32 atgaagattc cagcactgct cgtaacgtgc ctctaccttt ggggcttcgc gtccgccggc 60 cagagctcac ctctgctcga gatcgtgcag ggtagcgcgt cggccaccgc atccaccgct 120 gtgaccgcta gatccggact tcgtgccggt caggtagccg tggcctcgca gaaggatgcc 180 acacttcagg cagatgcctc agcggccgcc gcggccgctg cacgcgcttc cgccgaccag 240 tcggccagtc tagcccaaca gtcggcgtct ttgcagtcca aagctgccgc cagagcaaaa 300 tcagccgagg agtcagcggc agctacggcc aaagccgagt tgcaggcaga atccattgct 360 gcatctgcca gttccaatgc cagagaggct gcagcgtccg caaaagcctc cgcatccgcg 420 atgtcatcgg ctgccgtgca ggcgaaactc gctgaaaaga cggccaagaa tcaagctctg 480 gcttccgaag aagccaaact caaggctgcc gccgctgcca gcgcagcagc agcagccagc 540 gccgccgccg aggcagccct gaaagctgag agaatagcgg aagaagccat cgccaaggcg 600 gccgctgcca aagcagccgc cagagccgct gcagccgcgt taaactccgc gaaggaagcc 660 gccacgagca gcgcaaggag cgccgccgaa gccgaagcta agagcgaagt cgctatactg 720 atcagcgaac tcgacaagaa gagcagggaa gtcgccgctt ccgcgtccgc caaggcacgc 780 gctgctgctg cggctagctc cagaaacgca gaaacggctg ttatcggagc taacatcaat 840 gtggccaaag aggtcttggc gattcccatc gagccaaaga aacttccgga gccagagctg 900 gcgttgaaag aagagaatgt cgcggtcgcg agctcagaga gtgaagtgaa ggtagaaacg 960 agcagcgaag catggtcaat ttaa 984 <210> 33 <211> 882 <212> DNA <213> Bombus terrestris <400> 33 cacgtggtga agcgcgacaa ggagctcaag gccccggctt taccggaact actcggtgat 60 gggtctgaca cgctcggtgc ctcgatggag aacgggatca aagtcgccag agcatcgcag 120 aatgtgggtc tgagaacaga gttgaatgca gccgcgcggg ctgcagccgc tgctgcgacc 180 aagcaggcca aagacacaga ggccgcggaa gctggagcgg ccgctgcgat tgccatcgct 240 atcgccaagc gtgaagaagc tatcaaagca agcgaattag ccagcaagtt gttgacagcc 300 gcggctgggt ccagcgaagc tgccgtgtca gcgacggtga gggcggcgca attgacggcc 360 gcagctagcg cagctgccaa agcttctgca tccgcctctg aggcttctgc cgaagcccag 420 gtgagggcca acgccgaagc aaacatcgcc aagaaagctt cggcagctga agcaaaagcc 480 gcagccgaag cccaggttaa ggcggaactc gccaagaaag cggccgccgg tttcttagct 540 aaggctagac tagcggccag cgccgaatcc gaggccacta aactcgcagc cgaagctgaa 600 gtagcactgg ctaaggccag agtcgccgtc gaccagtcgc agagcgcaca ggcaaccgct 660 accgctcaag ctgccacagc cgttcagctg cagtctcaag cagctaacgc ggaagcctcc 720 gctgtagcac aggctgaaac tctgctggtc acggcggaag ccgtctctgc cgcggaagcc 780 gaagccgcga ccaaagctac cagttggggc gaagaatgtc atcaacgaga aaaagttacg 840 tttagcgaag atcgattaaa cgagagacaa gacaattggt ag 882 <210> 34 <211> 942 <212> DNA <213> Bombus terrestris <400> 34 atgaagattc cagcaatact ggttacgtct ctgctggtct ggggtggtct ggccgagggc 60 cacgtggtga agcgcgacaa ggagctcaag gccccggctt taccggaact actcggtgat 120 gggtctgaca cgctcggtgc ctcgatggag aacgggatca aagtcgccag agcatcgcag 180 aatgtgggtc tgagaacaga gttgaatgca gccgcgcggg ctgcagccgc tgctgcgacc 240 aagcaggcca aagacacaga ggccgcggaa gctggagcgg ccgctgcgat tgccatcgct 300 atcgccaagc gtgaagaagc tatcaaagca agcgaattag ccagcaagtt gttgacagcc 360 gcggctgggt ccagcgaagc tgccgtgtca gcgacggtga gggcggcgca attgacggcc 420 gcagctagcg cagctgccaa agcttctgca tccgcctctg aggcttctgc cgaagcccag 480 gtgagggcca acgccgaagc aaacatcgcc aagaaagctt cggcagctga agcaaaagcc 540 gcagccgaag cccaggttaa ggcggaactc gccaagaaag cggccgccgg tttcttagct 600 aaggctagac tagcggccag cgccgaatcc gaggccacta aactcgcagc cgaagctgaa 660 gtagcactgg ctaaggccag agtcgccgtc gaccagtcgc agagcgcaca ggcaaccgct 720 accgctcaag ctgccacagc cgttcagctg cagtctcaag cagctaacgc ggaagcctcc 780 gctgtagcac aggctgaaac tctgctggtc acggcggaag ccgtctctgc cgcggaagcc 840 gaagccgcga ccaaagctac cagttggggc gaagaatgtc atcaacgaga aaaagttacg 900 tttagcgaag atcgattaaa cgagagacaa gacaattggt ag 942 <210> 35 <211> 942 <212> DNA <213> Bombus terrestris <400> 35 ggtagcgtgg aactcggtgc ccccaagcag gagtctgtcc tcgtggagca gctcctattg 60 aagaacgtgg agactagtgc gaagcgaaag gagaacggcg caccgaaact cggcgagagc 120 acagctgcgg ctctggctag taccaaggca actgcagccg cagaggctaa ggcatccgcc 180 aaagtgaaag cttctgcctt ggccctcgct gaggctttct tgcgtgcgtc ggcagcgttt 240 gctgctgctt cagccaaagc tgctgccgct gtaaaggaag caacgcaggc acagttgctg 300 gcacaggaga aggctttgat agcgttgaaa actcaatctg agcaacaagc tgcctctgct 360 cgcgcggacg ccgcggctgc cgcagccgta tccgcgctag aacgcgccca ggcctcctcc 420 agagcagcca cgaccgccca agacatctcc agcgatctgg agaaacgtgt cgccacctca 480 gccgctgctg aagcaggtgc caccctcaga gcggaacaat ccgccgcgca atcgaaatgg 540 tccgccgcac tggccgccca aaccgccgct gctgcagccg ctatagaagc aaaggccacc 600 gcttcctcag aaagcaccgc tgccgctact agtaaggccg ccgtgttgac cgctgacact 660 agcagcgcag aagctgccgc tgcagcggag gcacaatccg cttcgcggat cgcaggtaca 720 gcagccaccg agggatccgc caactgggct agcgagaact cgcgtaccgc acaactggaa 780 gcttccgcct cagcgaaggc caccgcagcc gcagctgtcg gagatggagc tattatagga 840 cttgcacggg acgctagtgc cgcagctcag gcagccgcag aagttaaagc cttagctgaa 900 gctagtgcca gcttaggtgc ttcagaaaag gacaagaaat ga 942 <210> 36 <211> 999 <212> DNA <213> Bombus terrestris <400> 36 atgcagatcc cagcgatttt cgtcacgtgc ctgctcacat ggggcctggt gcacgcaggt 60 agcgtggaac tcggtgcccc caagcaggag tctgtcctcg tggagcagct cctattgaag 120 aacgtggaga ctagtgcgaa gcgaaaggag aacggcgcac cgaaactcgg cgagagcaca 180 gctgcggctc tggctagtac caaggcaact gcagccgcag aggctaaggc atccgccaaa 240 gtgaaagctt ctgccttggc cctcgctgag gctttcttgc gtgcgtcggc agcgtttgct 300 gctgcttcag ccaaagctgc tgccgctgta aaggaagcaa cgcaggcaca gttgctggca 360 caggagaagg ctttgatagc gttgaaaact caatctgagc aacaagctgc ctctgctcgc 420 gcggacgccg cggctgccgc agccgtatcc gcgctagaac gcgcccaggc ctcctccaga 480 gcagccacga ccgcccaaga catctccagc gatctggaga aacgtgtcgc cacctcagcc 540 gctgctgaag caggtgccac cctcagagcg gaacaatccg ccgcgcaatc gaaatggtcc 600 gccgcactgg ccgcccaaac cgccgctgct gcagccgcta tagaagcaaa ggccaccgct 660 tcctcagaaa gcaccgctgc cgctactagt aaggccgccg tgttgaccgc tgacactagc 720 agcgcagaag ctgccgctgc agcggaggca caatccgctt cgcggatcgc aggtacagca 780 gccaccgagg gatccgccaa ctgggctagc gagaactcgc gtaccgcaca actggaagct 840 tccgcctcag cgaaggccac cgcagccgca gctgtcggag atggagctat tataggactt 900 gcacgggacg ctagtgccgc agctcaggca gccgcagaag ttaaagcctt agctgaagct 960 agtgccagct taggtgcttc agaaaaggac aagaaatga 999 <210> 37 <211> 1017 <212> DNA <213> Bombus terrestris <400> 37 ggcaaaccac tcattgccaa tgcgcaaata gggaaggtca agaccgaaac gtcatcgtct 60 tcagagattg agacgttggt atcaggaagc cagacattgg tggcaggaag tgagacattg 120 gcttcagaaa gcgaggcatt ggcgtcaaaa agcgaggcat tgacgtcaga agccgagata 180 gcgagcgtga caacgaagga cgagctcata ctaaagggcg aagctatcac tggaaagaaa 240 ctaggaaccg gggcgtcgga agtagcggcg gcctctgggg aggctatcgc aactaccctt 300 ggcgcgggac aagctgcagc agaggcacaa gcagccgccg ccgcgcaagc aaaatcagca 360 gcggcagctg ccgcgaatgc aggtgaatcc agcaacagtg ctgctgcgtt ggttgctgct 420 gcagctgcag cacaaggaaa agcggctgcc gccgcagcag ccgcgacgaa ggctagctta 480 gaggccgcag acgctgctga ggaagctgag tcggccgtgg ccttggctag ggctgcctcc 540 gcaaaggcgg aagcgctcgc atcgaccgcc gctgctgcga atacccgtgc tgctctccaa 600 gcggaaaaat cgaacgagct ggcgcaagct gaggctgcag ccgccgccga agcccaggct 660 aaagccgccg ctgctgccaa ggcaacacaa ctcgccctta aagttgccga aactgcggtg 720 aaaacggaag cagatgcagc agctgccgcc gttgcggccg caaaagccag agcagtcgca 780 gacgcagccg cgtctcgtgc gaccgcagtg aacgccattg ctgaagcgga agaaagagac 840 tctgcacagg cggagaacac cgctggtgta gcacaagcag cgctcgctgc tgcggaagca 900 caagactcct gcatcggcgc tgccgcgact cctaggcatt cgtcgagcta tgcatggtgg 960 aagcttagga taacatcctt gatcgtcatt ctatcgccac gcaatcgacg tacttaa 1017 <210> 38 <211> 1074 <212> DNA <213> Bombus terrestris <400> 38 atgaagattc catcgatact cgcggtgtcc ctgctggttt ggggtctggc cagcgcaggc 60 aaaccactca ttgccaatgc gcaaataggg aaggtcaaga ccgaaacgtc atcgtcttca 120 gagattgaga cgttggtatc aggaagccag acattggtgg caggaagtga gacattggct 180 tcagaaagcg aggcattggc gtcaaaaagc gaggcattga cgtcagaagc cgagatagcg 240 agcgtgacaa cgaaggacga gctcatacta aagggcgaag ctatcactgg aaagaaacta 300 ggaaccgggg cgtcggaagt agcggcggcc tctggggagg ctatcgcaac tacccttggc 360 gcgggacaag ctgcagcaga ggcacaagca gccgccgccg cgcaagcaaa atcagcagcg 420 gcagctgccg cgaatgcagg tgaatccagc aacagtgctg ctgcgttggt tgctgctgca 480 gctgcagcac aaggaaaagc ggctgccgcc gcagcagccg cgacgaaggc tagcttagag 540 gccgcagacg ctgctgagga agctgagtcg gccgtggcct tggctagggc tgcctccgca 600 aaggcggaag cgctcgcatc gaccgccgct gctgcgaata cccgtgctgc tctccaagcg 660 gaaaaatcga acgagctggc gcaagctgag gctgcagccg ccgccgaagc ccaggctaaa 720 gccgccgctg ctgccaaggc aacacaactc gcccttaaag ttgccgaaac tgcggtgaaa 780 acggaagcag atgcagcagc tgccgccgtt gcggccgcaa aagccagagc agtcgcagac 840 gcagccgcgt ctcgtgcgac cgcagtgaac gccattgctg aagcggaaga aagagactct 900 gcacaggcgg agaacaccgc tggtgtagca caagcagcgc tcgctgctgc ggaagcacaa 960 gactcctgca tcggcgctgc cgcgactcct aggcattcgt cgagctatgc atggtggaag 1020 cttaggataa catccttgat cgtcattcta tcgccacgca atcgacgtac ttaa 1074 <210> 39 <211> 1411 <212> DNA <213> Bombus terrestris <400> 39 ggaaattcgg aaagcggcga aaattggaag aacggtgaaa gctccgaaag cggcaaaaat 60 tggaggaaca gcggaagctc cgaaagcggc aaaaattgga agaatggcgg aagctcagaa 120 agcaacaaac attggaagaa cggtggaagc tcggaaagcg gcgagaaatg gaaaaacagt 180 gaaagctccg aaagcggcaa aaattggaag aacagcggaa gctccgaaag cggcaaaaat 240 tggaaaaacg gcggaagctc ggaaagcaac aaacattgga agagcggtgg aagctcggaa 300 agtggcgaga aatggaaaaa cagtgaaagc ggaaataaag gcaaaagctc aaaaagcagc 360 gaaagttgga agagcaacga aaactcgaag aacgacggca gctggaagag cagtgaagaa 420 tcagaaaagt ggaaagatgg taaagcagtg gcggaagaca gcgttagtat aaactgggca 480 gatgtcaaag agcagattag caacattgct acatccttag aaaagggtgg taacctcgag 540 gctgtattga aaataaagaa aggagaaaag aaaatttcaa gtttggagga aatcaaggag 600 aaaatctctg tcctactgaa atggattcaa gaaggcaaag atactagcag cctattagat 660 ttgaaagagg gtagcaagga tattgcgtcg ttgaaagaaa tcaaaggaaa gatccttttg 720 attgttaaat tagtgaacga agggaaagac actagtggtc ttttagattt agaagcgagt 780 ggcaaagtaa ttttagaatt gcaaagcgcc atagaaaagg ttctcgtaaa gtcagaaaag 840 gtaaccaaag tatctgaagt ttccggttta gtaaaaagca aaactgtctc ggacataaaa 900 ccgcttcaag cagtaattcc tttaatcctt gaattgcaaa aaacagacat taaccttagt 960 accttaaaca agtggtccac tgttaacgta aattctatag ataaagaacg cgtcacgaaa 1020 acggttccag tgctccttca atccatgaaa ggaggcgaag atattcagaa ccttttgagt 1080 gcgaaaggtg caaagaaact tggcattagt gctttggact tacaggcagt tcaaggagct 1140 cttggcgtgg ttggaaagct aagttcaggt ggtgcgttga actcaaaagg cttgttgaac 1200 ttgaaagacg gcgctagtgt gttaggtgca ggaaaaatcg gaggattaat tcctttaccg 1260 aaactttaag agatagaccg ataaaggcag atatactctc ggaagatttt tttggaagtt 1320 gaatagtccg caaaaaaatt atctctgatt attataattt agcctaaaat attaaataaa 1380 atggagaaat aacgttgaaa tatataaata a 1411 <210> 40 <211> 403 <212> PRT <213> Myrmecia forficata <400> 40 Ser Gly Pro Arg Leu Leu Gly Gly Arg Ser Ala Ala Ser Ala Ser Ala 1 5 10 15 Ser Ala Ser Ala Glu Ala Ser Ala Gly Gly Trp Arg Lys Ser Gly Ala 20 25 30 Ser Ala Ser Ala Ser Ala Lys Ala Gly Ser Ser Asn Ile Leu Ser Arg 35 40 45 Val Gly Ala Ser Arg Ala Ala Ala Thr Leu Val Ala Ser Ala Ala Val 50 55 60 Glu Ala Lys Ala Gly Leu Arg Ala Gly Lys Ala Thr Ala Glu Glu Gln 65 70 75 80 Arg Glu Ala Leu Glu Met Leu Thr Leu Ser Ala Asp Lys Asn Ala Glu 85 90 95 Ala Arg Ile Leu Ala Asp Asp Thr Ala Val Leu Val Gln Gly Ser Ala 100 105 110 Glu Ala Gln Ser Val Ala Ala Ala Lys Thr Val Ala Val Glu Glu Glu 115 120 125 Ser Ala Ser Leu Asp Ala Ala Ala Val Glu Ala Glu Val Ala Ala Ala 130 135 140 Thr Ser Lys Ser Ser Ala Gly Gln Ala Leu Gln Ser Ala Gln Thr Ala 145 150 155 160 Ala Ser Ala Leu Arg Thr Ser Ala Arg Ser Ala Leu Thr Ala Leu Lys 165 170 175 Leu Ala Arg Leu Gln Gly Ala Ala Ser Ser Asn Ala Ala Arg Met Met 180 185 190 Glu Lys Ala Leu Ala Ala Thr Gln Asp Ala Asn Ala Ala Ala Gln Gln 195 200 205 Ala Met Ala Ala Glu Ser Ala Ala Ala Glu Ala Ala Ala Ile Ala Ala 210 215 220 Ala Lys Gln Ser Glu Ala Arg Asp Ala Gly Ala Glu Ala Lys Ala Ala 225 230 235 240 Met Ala Ala Leu Ile Thr Ala Gln Arg Asn Leu Val Gln Ala Asn Ala 245 250 255 Arg Ala Glu Met Ala Ser Glu Glu Ala Glu Leu Asp Ser Lys Ser Arg 260 265 270 Ala Ser Asp Ala Lys Val Asn Ala Val Ala Arg Ala Ala Ser Lys Ser 275 280 285 Ser Ile Arg Arg Asp Glu Leu Ile Glu Ile Gly Ala Glu Phe Gly Lys 290 295 300 Ala Ser Gly Glu Val Ile Ser Thr Gly Thr Arg Ser Asn Gly Gly Gln 305 310 315 320 Asp Ala Ile Ala Thr Ala Glu Ala Ser Ser Ser Ala Ser Ala Val Gly 325 330 335 Ile Lys Lys Thr Ser Gly His Trp Gly Ser Gly Lys Trp Ser Arg Val 340 345 350 Ser Lys Gly Lys Gly Trp Ala Ser Ser Asn Ala Asp Ala Asp Ala Ser 355 360 365 Ser Ser Ser Ile Ile Ile Gly Gly Leu Lys Arg Gly Gly Leu Gly Ser 370 375 380 Glu Ala Ser Ala Ala Ala Ser Ala Glu Ala Glu Ala Ser Ala Gly Thr 385 390 395 400 Leu Leu Leu <210> 41 <211> 422 <212> PRT <213> Myrmecia forficata <400> 41 Met Lys Ile Pro Ala Ile Ile Ala Thr Ser Leu Leu Leu Trp Gly Phe 1 5 10 15 Ala Ser Ala Ser Gly Pro Arg Leu Leu Gly Gly Arg Ser Ala Ala Ser 20 25 30 Ala Ser Ala Ser Ala Ser Ala Glu Ala Ser Ala Gly Gly Trp Arg Lys 35 40 45 Ser Gly Ala Ser Ala Ser Ala Ser Ala Lys Ala Gly Ser Ser Asn Ile 50 55 60 Leu Ser Arg Val Gly Ala Ser Arg Ala Ala Ala Thr Leu Val Ala Ser 65 70 75 80 Ala Ala Val Glu Ala Lys Ala Gly Leu Arg Ala Gly Lys Ala Thr Ala 85 90 95 Glu Glu Gln Arg Glu Ala Leu Glu Met Leu Thr Leu Ser Ala Asp Lys 100 105 110 Asn Ala Glu Ala Arg Ile Leu Ala Asp Asp Thr Ala Val Leu Val Gln 115 120 125 Gly Ser Ala Glu Ala Gln Ser Val Ala Ala Ala Lys Thr Val Ala Val 130 135 140 Glu Glu Glu Ser Ala Ser Leu Asp Ala Ala Ala Val Glu Ala Glu Val 145 150 155 160 Ala Ala Ala Thr Ser Lys Ser Ser Ala Gly Gln Ala Leu Gln Ser Ala 165 170 175 Gln Thr Ala Ala Ser Ala Leu Arg Thr Ser Ala Arg Ser Ala Leu Thr 180 185 190 Ala Leu Lys Leu Ala Arg Leu Gln Gly Ala Ala Ser Ser Asn Ala Ala 195 200 205 Arg Met Met Glu Lys Ala Leu Ala Ala Thr Gln Asp Ala Asn Ala Ala 210 215 220 Ala Gln Gln Ala Met Ala Ala Glu Ser Ala Ala Ala Glu Ala Ala Ala 225 230 235 240 Ile Ala Ala Ala Lys Gln Ser Glu Ala Arg Asp Ala Gly Ala Glu Ala 245 250 255 Lys Ala Ala Met Ala Ala Leu Ile Thr Ala Gln Arg Asn Leu Val Gln 260 265 270 Ala Asn Ala Arg Ala Glu Met Ala Ser Glu Glu Ala Glu Leu Asp Ser 275 280 285 Lys Ser Arg Ala Ser Asp Ala Lys Val Asn Ala Val Ala Arg Ala Ala 290 295 300 Ser Lys Ser Ser Ile Arg Arg Asp Glu Leu Ile Glu Ile Gly Ala Glu 305 310 315 320 Phe Gly Lys Ala Ser Gly Glu Val Ile Ser Thr Gly Thr Arg Ser Asn 325 330 335 Gly Gly Gln Asp Ala Ile Ala Thr Ala Glu Ala Ser Ser Ser Ala Ser 340 345 350 Ala Val Gly Ile Lys Lys Thr Ser Gly His Trp Gly Ser Gly Lys Trp 355 360 365 Ser Arg Val Ser Lys Gly Lys Gly Trp Ala Ser Ser Asn Ala Asp Ala 370 375 380 Asp Ala Ser Ser Ser Ser Ile Ile Ile Gly Gly Leu Lys Arg Gly Gly 385 390 395 400 Leu Gly Ser Glu Ala Ser Ala Ala Ala Ser Ala Glu Ala Glu Ala Ser 405 410 415 Ala Gly Thr Leu Leu Leu 420 <210> 42 <211> 392 <212> PRT <213> Myrmecia forficata <400> 42 Arg Val Ile Glu Ser Ser Ser Ser Ala Ser Ala Gln Ala Ser Ala Ser 1 5 10 15 Ala Gly Ser Arg Gly Leu Leu Gly Lys Arg Pro Ile Gly Lys Leu Glu 20 25 30 Trp Gly Lys Glu Glu Lys Lys Leu Glu Glu Leu Asp Glu Glu Ser Leu 35 40 45 Asn Glu Ala Ala Leu Lys Val Gly Ile Lys Asn Gly Gly Leu Asp Val 50 55 60 Ala Lys Gly Ala Ala Val Leu Glu Ala Ala Met Ser Asp Val Ala Thr 65 70 75 80 Leu Thr Asp Gln Arg Ser Leu Val Asp Leu Gly Leu Gly Pro Val Ala 85 90 95 Asn Glu Ala Glu Ile Leu Ala Glu Ala Gln Ala Ala Thr Ser Ala Gln 100 105 110 Ala Gly Ala Val Ala Asn Ser Ala Ala Glu Arg Ala Ile Ala Ala Met 115 120 125 Glu Met Ala Asp Arg Thr Glu Tyr Ile Ala Ala Leu Val Thr Thr Lys 130 135 140 Ala Ala Lys Ala Ala Glu Ala Thr Met Ala Ala Thr Ala Arg Ala Thr 145 150 155 160 Ala Ala Ala Ser Ala Ser Lys Ile Ser Ser Gln Glu Ser Ala Ala Ser 165 170 175 Ala Ala Asn Ala Ala Asn Ala Glu Ala Lys Ala Asn Ala Ala Ser Ile 180 185 190 Ile Ala Asn Lys Ala Asn Ala Val Leu Ala Glu Ala Ala Ala Val Leu 195 200 205 Ala Ala Thr Ala Ala Lys Ala Lys Glu Ser Ala Met Lys Ser Leu Ser 210 215 220 Ala Ala Gln Ala Ala Ala Lys Ala Gln Ala Arg Asn Ala Glu Ala Ser 225 230 235 240 Ala Glu Ala Gln Ile Lys Leu Ser Gln Ala Arg Ala Ala Val Ala Arg 245 250 255 Ala Ala Ala Asp Gln Ala Val Cys Ser Ser Gln Ala Gln Ala Ala Ser 260 265 270 Gln Ile Gln Ser Arg Ala Ser Ala Ser Glu Ser Ala Ala Ser Ala Gln 275 280 285 Ser Glu Thr Asn Thr Ala Ala Ala Glu Ala Val Ala Thr Ala Asp Ala 290 295 300 Glu Ala Ala Ala Gln Ala Glu Ala Trp Val Met Ser Leu Lys Asn Asp 305 310 315 320 Leu Trp Leu His Leu Asn Met Lys Gly Glu Ala Lys Ala Glu Gly Glu 325 330 335 Ala Val Ser Ile Ser Lys Gly His Arg Gly Gly Ile Arg Ser Gly Ser 340 345 350 Ile Ser Glu Ala Ser Ala Glu Ala Ser Ser Asn Val Ser Met Gly Gly 355 360 365 Arg His Gly Arg Lys Asp Leu Val Ser Glu Ala Leu Ala Gly Ala Ser 370 375 380 Ala Gly Ser Ser Ala Asp Ser Leu 385 390 <210> 43 <211> 411 <212> PRT <213> Myrmecia forficata <400> 43 Met Lys Ile Pro Ala Ile Leu Val Thr Ser Leu Leu Ala Trp Gly Leu 1 5 10 15 Ala Ser Gly Arg Val Ile Glu Ser Ser Ser Ser Ala Ser Ala Gln Ala 20 25 30 Ser Ala Ser Ala Gly Ser Arg Gly Leu Leu Gly Lys Arg Pro Ile Gly 35 40 45 Lys Leu Glu Trp Gly Lys Glu Glu Lys Lys Leu Glu Glu Leu Asp Glu 50 55 60 Glu Ser Leu Asn Glu Ala Ala Leu Lys Val Gly Ile Lys Asn Gly Gly 65 70 75 80 Leu Asp Val Ala Lys Gly Ala Ala Val Leu Glu Ala Ala Met Ser Asp 85 90 95 Val Ala Thr Leu Thr Asp Gln Arg Ser Leu Val Asp Leu Gly Leu Gly 100 105 110 Pro Val Ala Asn Glu Ala Glu Ile Leu Ala Glu Ala Gln Ala Ala Thr 115 120 125 Ser Ala Gln Ala Gly Ala Val Ala Asn Ser Ala Ala Glu Arg Ala Ile 130 135 140 Ala Ala Met Glu Met Ala Asp Arg Thr Glu Tyr Ile Ala Ala Leu Val 145 150 155 160 Thr Thr Lys Ala Ala Lys Ala Ala Glu Ala Thr Met Ala Ala Thr Ala 165 170 175 Arg Ala Thr Ala Ala Ala Ser Ala Ser Lys Ile Ser Ser Gln Glu Ser 180 185 190 Ala Ala Ser Ala Ala Asn Ala Ala Asn Ala Glu Ala Lys Ala Asn Ala 195 200 205 Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala Val Leu Ala Glu Ala Ala 210 215 220 Ala Val Leu Ala Ala Thr Ala Ala Lys Ala Lys Glu Ser Ala Met Lys 225 230 235 240 Ser Leu Ser Ala Ala Gln Ala Ala Ala Lys Ala Gln Ala Arg Asn Ala 245 250 255 Glu Ala Ser Ala Glu Ala Gln Ile Lys Leu Ser Gln Ala Arg Ala Ala 260 265 270 Val Ala Arg Ala Ala Ala Asp Gln Ala Val Cys Ser Ser Gln Ala Gln 275 280 285 Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser Ala Ser Glu Ser Ala Ala 290 295 300 Ser Ala Gln Ser Glu Thr Asn Thr Ala Ala Ala Glu Ala Val Ala Thr 305 310 315 320 Ala Asp Ala Glu Ala Ala Ala Gln Ala Glu Ala Trp Val Met Ser Leu 325 330 335 Lys Asn Asp Leu Trp Leu His Leu Asn Met Lys Gly Glu Ala Lys Ala 340 345 350 Glu Gly Glu Ala Val Ser Ile Ser Lys Gly His Arg Gly Gly Ile Arg 355 360 365 Ser Gly Ser Ile Ser Glu Ala Ser Ala Glu Ala Ser Ser Asn Val Ser 370 375 380 Met Gly Gly Arg His Gly Arg Lys Asp Leu Val Ser Glu Ala Leu Ala 385 390 395 400 Gly Ala Ser Ala Gly Ser Ser Ala Asp Ser Leu 405 410 <210> 44 <211> 375 <212> PRT <213> Myrmecia forficata <400> 44 Asn Leu Leu Lys Glu Ser Lys Ala Ser Ala Ser Ala Ser Ala Ser Ala 1 5 10 15 Ser Ala Arg Ala Ser Gly Lys Lys Asn Leu His Val Leu Pro Leu Pro 20 25 30 Lys Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser Val Phe Asp Ile 35 40 45 Lys Asp Val Val Leu Ser Ala Val Asp Glu Ile Asn Gly Ala Pro Lys 50 55 60 Leu Gly Leu Gly Trp Lys Lys Val Ser Met Gly Val Glu Arg Ala Glu 65 70 75 80 Ala Asn Ala Ala Ala Ala Ala Glu Ala Leu Ala Met Ile Lys Lys Ile 85 90 95 Ala Met Ala Arg Ser Ser Ala Tyr Val Gln Ala Ala Trp Ala Ser Ala 100 105 110 Gln Ala Ser Ala Asp Ala Leu Ala Ser Ala Arg Val Ala Gln Ala Ser 115 120 125 Gln Glu Ala Ala Glu Ala Lys Gly Arg Ala Ala Ser Glu Ala Leu Ser 130 135 140 Arg Ala Ile Glu Ala Ser Ser Arg Ala Asp Ala Ala Ala Ala Ala Thr 145 150 155 160 Leu Asp Ala Met Asp Arg Thr Met Glu Asn Ala Arg Ala Ala Asn Ala 165 170 175 Ala Gln Thr Gln Ala Ser Gly Gln Ala Glu Asn Ala Asn Arg Ser Ala 180 185 190 Ala Ala Ile Leu Ala Ala Leu Leu Arg Ile Ala Glu Ala Ser Ala Leu 195 200 205 Asn Asn Glu Ala Ala Val Asn Ala Ala Ala Ala Ala Ala Ala Ala Ser 210 215 220 Ala Leu Gln Ala Lys Ala Asn Ala Ala Ser Gln Ala Thr Ala Arg Ala 225 230 235 240 Ala Gly Gln Ala Ser Thr Ala Ala Glu Glu Ala Gln Ser Ala Gln Glu 245 250 255 Ala Ala Asp Lys Asn Ala Glu Leu Thr Thr Val Met Leu Glu Lys Ala 260 265 270 Ser Ala Asp Gln Gln Ala Ala Ser Ala Arg Ala Asp Tyr Tyr Thr Ala 275 280 285 Ser Thr Glu Ala Glu Ala Ala Ala Gln Ala Ser Ala Ile Asn Ala Leu 290 295 300 Arg Asp Gly Ile Val Val Gly Met Gly Asn Asp Ala Gly Ala Ser Ala 305 310 315 320 Gln Ala Met Ala Gln Val Glu Ala Leu Ala Arg Ala Ser Glu His Lys 325 330 335 Ala Leu Gly Glu Lys Lys Lys Gly Leu Val Trp Gly Tyr Gly Ser Lys 340 345 350 Gly Ser Ser Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Glu Ala Ser 355 360 365 Ser Arg Leu Gly Lys Asp Trp 370 375 <210> 45 <211> 394 <212> PRT <213> Myrmecia forficata <400> 45 Met Lys Ile Pro Ala Ile Leu Val Thr Ser Phe Leu Ala Trp Gly Leu 1 5 10 15 Ala Ser Gly Asn Leu Leu Lys Glu Ser Lys Ala Ser Ala Ser Ala Ser 20 25 30 Ala Ser Ala Ser Ala Arg Ala Ser Gly Lys Lys Asn Leu His Val Leu 35 40 45 Pro Leu Pro Lys Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser Val 50 55 60 Phe Asp Ile Lys Asp Val Val Leu Ser Ala Val Asp Glu Ile Asn Gly 65 70 75 80 Ala Pro Lys Leu Gly Leu Gly Trp Lys Lys Val Ser Met Gly Val Glu 85 90 95 Arg Ala Glu Ala Asn Ala Ala Ala Ala Ala Glu Ala Leu Ala Met Ile 100 105 110 Lys Lys Ile Ala Met Ala Arg Ser Ser Ala Tyr Val Gln Ala Ala Trp 115 120 125 Ala Ser Ala Gln Ala Ser Ala Asp Ala Leu Ala Ser Ala Arg Val Ala 130 135 140 Gln Ala Ser Gln Glu Ala Ala Glu Ala Lys Gly Arg Ala Ala Ser Glu 145 150 155 160 Ala Leu Ser Arg Ala Ile Glu Ala Ser Ser Arg Ala Asp Ala Ala Ala 165 170 175 Ala Ala Thr Leu Asp Ala Met Asp Arg Thr Met Glu Asn Ala Arg Ala 180 185 190 Ala Asn Ala Ala Gln Thr Gln Ala Ser Gly Gln Ala Glu Asn Ala Asn 195 200 205 Arg Ser Ala Ala Ala Ile Leu Ala Ala Leu Leu Arg Ile Ala Glu Ala 210 215 220 Ser Ala Leu Asn Asn Glu Ala Ala Val Asn Ala Ala Ala Ala Ala Ala 225 230 235 240 Ala Ala Ser Ala Leu Gln Ala Lys Ala Asn Ala Ala Ser Gln Ala Thr 245 250 255 Ala Arg Ala Ala Gly Gln Ala Ser Thr Ala Ala Glu Glu Ala Gln Ser 260 265 270 Ala Gln Glu Ala Ala Asp Lys Asn Ala Glu Leu Thr Thr Val Met Leu 275 280 285 Glu Lys Ala Ser Ala Asp Gln Gln Ala Ala Ser Ala Arg Ala Asp Tyr 290 295 300 Tyr Thr Ala Ser Thr Glu Ala Glu Ala Ala Ala Gln Ala Ser Ala Ile 305 310 315 320 Asn Ala Leu Arg Asp Gly Ile Val Val Gly Met Gly Asn Asp Ala Gly 325 330 335 Ala Ser Ala Gln Ala Met Ala Gln Val Glu Ala Leu Ala Arg Ala Ser 340 345 350 Glu His Lys Ala Leu Gly Glu Lys Lys Lys Gly Leu Val Trp Gly Tyr 355 360 365 Gly Ser Lys Gly Ser Ser Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala 370 375 380 Glu Ala Ser Ser Arg Leu Gly Lys Asp Trp 385 390 <210> 46 <211> 422 <212> PRT <213> Myrmecia forficata <400> 46 Ser Glu Leu Glu Ser Glu Ala Ser Ala Ala Ala Ser Ala Gln Ala Glu 1 5 10 15 Ala Ser Ser Ser Gly Arg Ser Gly Lys Leu Ser Ala Ser Gln Ala Ser 20 25 30 Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Ser Arg Gly Gly Ser Lys 35 40 45 Gly Gly Trp Gly Gln Leu Arg Arg Gly Asp Val Lys Ser Glu Ala Lys 50 55 60 Ser Ala Ala Ala Ile Ala Val Glu Gly Ala Lys Ile Gly Thr Gly Ile 65 70 75 80 Gly Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg Gly Leu Gly 85 90 95 Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala Gly Gln Ala 100 105 110 Glu Val Ala Ala Lys Ser Cys Glu Leu Ala Asp Lys Thr Thr Ala Lys 115 120 125 Ala Val Ala Met Val Glu Ala Ala Ala Glu Ala Glu Ile Glu Val Ala 130 135 140 Asn Gln Glu Val Ala Ala Val Lys Leu Ser Thr Trp Ala Ala Lys Ala 145 150 155 160 Ala Arg Ile Val Glu Glu Asp Ser Ala Ala Val Arg Ala Ala Ala Gly 165 170 175 Lys Leu Leu Leu Ala Ala Arg Ala Ala Ala Ala Ala Glu Arg Arg Ala 180 185 190 Asn Glu Glu Ser Glu Ala Ala Asn Glu Leu Ala Gln Ala Ser Ser Ala 195 200 205 Ala Ala Ala Glu Ala Glu Ala Lys Ala Asn Ala Gly Arg Glu Ala Ala 210 215 220 Ala Ala Ala Leu Ala Ile Ala Glu Ala Ala Val Ala Ile Glu Gln Glu 225 230 235 240 Ala Val Ile Leu Ala Arg Lys Ala Gln Asp Ala Arg Leu Asn Ala Glu 245 250 255 Ala Ala Ala Ala Ala Ala Met Asn Ala Arg Val Ile Ala Ser Ala Glu 260 265 270 Ser Glu Ala Ser Glu Asp Leu Glu Asn Arg Ala Ser Val Ala Arg Ala 275 280 285 Ser Ala Ala Gly Ala Ala Glu Ala Lys Ala Ile Ala Thr Asp Ala Gly 290 295 300 Ala Thr Ala Glu Ile Ala Ala Tyr Ser Trp Ala Lys Lys Gly Glu Leu 305 310 315 320 Ile Asn Pro Gly Pro Leu Pro Lys Ile Ile Ser Val Asn Ala Asp Leu 325 330 335 Ser Lys Ser Glu Val Glu Ala Met Lys Ile Thr Arg Gly Gln Val Gln 340 345 350 Glu Val Lys Lys Ile Ser Thr His Lys Gly Gly Trp Gly Trp Gly Lys 355 360 365 Glu Gly Arg Ser Lys Val Ser Ser Asn Ala Ser Ala Arg Ala Ser Ala 370 375 380 Ser Ala Asn Ala Ala Ala Gly Ser Leu Gly Ser Lys Trp Gly Arg Gln 385 390 395 400 Leu Ser Ala Ser Ser Ala Ser Ala Asp Ala Asn Ala Glu Ala Asp Ser 405 410 415 Gln Leu Leu Lys Val Trp 420 <210> 47 <211> 441 <212> PRT <213> Myrmecia forficata <400> 47 Met Lys Ile Pro Ala Ile Leu Ala Thr Ser Leu Leu Ile Trp Gly Leu 1 5 10 15 Val Gly Ala Ser Glu Leu Glu Ser Glu Ala Ser Ala Ala Ala Ser Ala 20 25 30 Gln Ala Glu Ala Ser Ser Ser Gly Arg Ser Gly Lys Leu Ser Ala Ser 35 40 45 Gln Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Ser Arg Gly 50 55 60 Gly Ser Lys Gly Gly Trp Gly Gln Leu Arg Arg Gly Asp Val Lys Ser 65 70 75 80 Glu Ala Lys Ser Ala Ala Ala Ile Ala Val Glu Gly Ala Lys Ile Gly 85 90 95 Thr Gly Ile Gly Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg 100 105 110 Gly Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala 115 120 125 Gly Gln Ala Glu Val Ala Ala Lys Ser Cys Glu Leu Ala Asp Lys Thr 130 135 140 Thr Ala Lys Ala Val Ala Met Val Glu Ala Ala Ala Glu Ala Glu Ile 145 150 155 160 Glu Val Ala Asn Gln Glu Val Ala Ala Val Lys Leu Ser Thr Trp Ala 165 170 175 Ala Lys Ala Ala Arg Ile Val Glu Glu Asp Ser Ala Ala Val Arg Ala 180 185 190 Ala Ala Gly Lys Leu Leu Leu Ala Ala Arg Ala Ala Ala Ala Ala Glu 195 200 205 Arg Arg Ala Asn Glu Glu Ser Glu Ala Ala Asn Glu Leu Ala Gln Ala 210 215 220 Ser Ser Ala Ala Ala Ala Glu Ala Glu Ala Lys Ala Asn Ala Gly Arg 225 230 235 240 Glu Ala Ala Ala Ala Ala Leu Ala Ile Ala Glu Ala Ala Val Ala Ile 245 250 255 Glu Gln Glu Ala Val Ile Leu Ala Arg Lys Ala Gln Asp Ala Arg Leu 260 265 270 Asn Ala Glu Ala Ala Ala Ala Ala Ala Met Asn Ala Arg Val Ile Ala 275 280 285 Ser Ala Glu Ser Glu Ala Ser Glu Asp Leu Glu Asn Arg Ala Ser Val 290 295 300 Ala Arg Ala Ser Ala Ala Gly Ala Ala Glu Ala Lys Ala Ile Ala Thr 305 310 315 320 Asp Ala Gly Ala Thr Ala Glu Ile Ala Ala Tyr Ser Trp Ala Lys Lys 325 330 335 Gly Glu Leu Ile Asn Pro Gly Pro Leu Pro Lys Ile Ile Ser Val Asn 340 345 350 Ala Asp Leu Ser Lys Ser Glu Val Glu Ala Met Lys Ile Thr Arg Gly 355 360 365 Gln Val Gln Glu Val Lys Lys Ile Ser Thr His Lys Gly Gly Trp Gly 370 375 380 Trp Gly Lys Glu Gly Arg Ser Lys Val Ser Ser Asn Ala Ser Ala Arg 385 390 395 400 Ala Ser Ala Ser Ala Asn Ala Ala Ala Gly Ser Leu Gly Ser Lys Trp 405 410 415 Gly Arg Gln Leu Ser Ala Ser Ser Ala Ser Ala Asp Ala Asn Ala Glu 420 425 430 Ala Asp Ser Gln Leu Leu Lys Val Trp 435 440 <210> 48 <211> 1212 <212> DNA <213> Myrmecia forficata <400> 48 agcgggccgc gcttactcgg cggcagatcg gccgcgtccg cgtcggcttc cgcttcggct 60 gaggcgtcgg cgggcggttg gaggaaaagc ggcgcatccg cttccgcttc cgctaaggct 120 ggtagcagca acatcctcag ccgcgtggga gcttcgaggg cggccgcgac gttggtcgct 180 tccgccgcgg tggaggccaa ggcgggtctc cgtgccggca aggcaaccgc cgaggagcag 240 agggaggctt tggaaatgct caccttgtcc gccgacaaga atgccgaggc gcgtatcctg 300 gccgacgaca cggccgttct ggttcaaggc agcgccgagg cacagtcggt cgccgccgcg 360 aagaccgtcg cggtcgagga agagtccgct tccttggatg cggccgcagt tgaagcggag 420 gtcgcagccg ccacgtcgaa atcgtcggct ggccaagcac tccagtccgc acagaccgcc 480 gcatctgctc tcagaacttc cgccaggagc gccttgacgg ccctcaagct ggcacgcctc 540 caaggcgcgg cttctagcaa cgctgccagg atgatggaaa aggcgctggc cgccacccag 600 gacgcaaatg ccgccgccca gcaagctatg gcggccgaga gtgcagccgc agaagcagcg 660 gctatcgcgg cagcgaaaca atcggaggcg agagacgccg gcgccgaggc caaggccgcc 720 atggcagcac tcatcaccgc ccagaggaat ctcgtgcagg ccaatgccag ggcggaaatg 780 gcaagcgagg aagccgaatt ggattcgaag tctagagcgt ccgacgccaa ggtgaacgcc 840 gttgctcgtg cggcctccaa gtccagcata cgcagagatg aacttatcga gatcggcgct 900 gagttcggca aggccagcgg cgaggtgatt tccaccggca cgcgttccaa cggcggtcaa 960 gacgccatcg ccaccgccga ggcatcgagt agcgcgtccg ccgtcggcat caagaaaaca 1020 agcggacact gggggagcgg aaaatggagt cgtgtctcca agggtaaagg atgggcttcc 1080 tcgaatgcgg acgctgacgc cagcagcagc agcatcatca tcggcggtct caaacgcggc 1140 ggcctcggtt cggaagcctc tgcggcagct tccgcagaag cggaagcttc cgccggcaca 1200 ctcctgctgt aa 1212 <210> 49 <211> 1269 <212> DNA <213> Myrmecia forficata <400> 49 atgaagatcc cagcgataat cgcaacgtcc cttctcctct ggggtttcgc cagcgccagc 60 gggccgcgct tactcggcgg cagatcggcc gcgtccgcgt cggcttccgc ttcggctgag 120 gcgtcggcgg gcggttggag gaaaagcggc gcatccgctt ccgcttccgc taaggctggt 180 agcagcaaca tcctcagccg cgtgggagct tcgagggcgg ccgcgacgtt ggtcgcttcc 240 gccgcggtgg aggccaaggc gggtctccgt gccggcaagg caaccgccga ggagcagagg 300 gaggctttgg aaatgctcac cttgtccgcc gacaagaatg ccgaggcgcg tatcctggcc 360 gacgacacgg ccgttctggt tcaaggcagc gccgaggcac agtcggtcgc cgccgcgaag 420 accgtcgcgg tcgaggaaga gtccgcttcc ttggatgcgg ccgcagttga agcggaggtc 480 gcagccgcca cgtcgaaatc gtcggctggc caagcactcc agtccgcaca gaccgccgca 540 tctgctctca gaacttccgc caggagcgcc ttgacggccc tcaagctggc acgcctccaa 600 ggcgcggctt ctagcaacgc tgccaggatg atggaaaagg cgctggccgc cacccaggac 660 gcaaatgccg ccgcccagca agctatggcg gccgagagtg cagccgcaga agcagcggct 720 atcgcggcag cgaaacaatc ggaggcgaga gacgccggcg ccgaggccaa ggccgccatg 780 gcagcactca tcaccgccca gaggaatctc gtgcaggcca atgccagggc ggaaatggca 840 agcgaggaag ccgaattgga ttcgaagtct agagcgtccg acgccaaggt gaacgccgtt 900 gctcgtgcgg cctccaagtc cagcatacgc agagatgaac ttatcgagat cggcgctgag 960 ttcggcaagg ccagcggcga ggtgatttcc accggcacgc gttccaacgg cggtcaagac 1020 gccatcgcca ccgccgaggc atcgagtagc gcgtccgccg tcggcatcaa gaaaacaagc 1080 ggacactggg ggagcggaaa atggagtcgt gtctccaagg gtaaaggatg ggcttcctcg 1140 aatgcggacg ctgacgccag cagcagcagc atcatcatcg gcggtctcaa acgcggcggc 1200 ctcggttcgg aagcctctgc ggcagcttcc gcagaagcgg aagcttccgc cggcacactc 1260 ctgctgtaa 1269 <210> 50 <211> 1179 <212> DNA <213> Myrmecia forficata <400> 50 cgggtcatcg agtccagctc gtcggcttcc gcacaggcgt cggcatcggc cggctcgaga 60 ggcctgctcg gtaaacggcc gattggcaag ctcgagtggg gcaaggagga gaagaaactc 120 gaagaactcg acgaggaatc gctcaatgag gccgctctga aggtcggcat caagaacggc 180 ggattggatg tcgcgaaggg cgcggcagtc ctcgaggcag cgatgagcga cgtcgcgacc 240 cttacggatc agcgttctct tgtggatctc ggtctcggcc cggtcgcgaa cgaggccgag 300 atcctggcgg aggcgcaggc cgccacgagc gcccaagctg gcgctgtcgc taatagcgcc 360 gcggagcgtg cgatcgcggc gatggagatg gccgacagaa ccgaatatat tgcggcactt 420 gtcaccacca aagccgccaa agctgccgag gccactatgg ccgctactgc ccgtgccacc 480 gccgccgcct cagcctccaa gatatccagt caggaatcag ccgcatcggc cgctaacgcc 540 gccaacgccg aagccaaggc caacgccgct tccataatcg ctaacaaggc gaacgccgtc 600 ctggctgagg ccgccgccgt actcgcagcc actgctgcca aggccaagga atcggcgatg 660 aaatcgctta gcgccgctca ggccgccgcc aaggcacaag ccaggaacgc cgaggcctcc 720 gccgaagctc agatcaaact ttcccaggcc agggccgccg tggcacgcgc tgcagccgat 780 caggccgtct gttcctccca ggctcaggcc gcaagtcaga tacaatcgag ggcatccgca 840 tccgaatccg cggcatcggc acaatcagag accaacaccg ccgcggccga agcggtcgcc 900 accgctgacg ccgaagcggc cgcgcaagct gaagcgtggg tcatgtcgct gaagaacgat 960 ctgtggctgc atctcaacat gaagggtgag gccaaggccg aaggcgaggc cgtttcgatc 1020 agcaaaggac atcgcggcgg tatcaggtcg ggcagcatct cggaagccag cgccgaggca 1080 agcagcaacg tttccatggg cggacgtcat ggacggaagg acctcgtctc tgaagcgtta 1140 gcgggagcat cagcgggcag cagtgccgac tccctttga 1179 <210> 51 <211> 1236 <212> DNA <213> Myrmecia forficata <400> 51 atgaagattc cagcgatact cgtgacgtct ctcctcgcct ggggattagc cagcggccgg 60 gtcatcgagt ccagctcgtc ggcttccgca caggcgtcgg catcggccgg ctcgagaggc 120 ctgctcggta aacggccgat tggcaagctc gagtggggca aggaggagaa gaaactcgaa 180 gaactcgacg aggaatcgct caatgaggcc gctctgaagg tcggcatcaa gaacggcgga 240 ttggatgtcg cgaagggcgc ggcagtcctc gaggcagcga tgagcgacgt cgcgaccctt 300 acggatcagc gttctcttgt ggatctcggt ctcggcccgg tcgcgaacga ggccgagatc 360 ctggcggagg cgcaggccgc cacgagcgcc caagctggcg ctgtcgctaa tagcgccgcg 420 gagcgtgcga tcgcggcgat ggagatggcc gacagaaccg aatatattgc ggcacttgtc 480 accaccaaag ccgccaaagc tgccgaggcc actatggccg ctactgcccg tgccaccgcc 540 gccgcctcag cctccaagat atccagtcag gaatcagccg catcggccgc taacgccgcc 600 aacgccgaag ccaaggccaa cgccgcttcc ataatcgcta acaaggcgaa cgccgtcctg 660 gctgaggccg ccgccgtact cgcagccact gctgccaagg ccaaggaatc ggcgatgaaa 720 tcgcttagcg ccgctcaggc cgccgccaag gcacaagcca ggaacgccga ggcctccgcc 780 gaagctcaga tcaaactttc ccaggccagg gccgccgtgg cacgcgctgc agccgatcag 840 gccgtctgtt cctcccaggc tcaggccgca agtcagatac aatcgagggc atccgcatcc 900 gaatccgcgg catcggcaca atcagagacc aacaccgccg cggccgaagc ggtcgccacc 960 gctgacgccg aagcggccgc gcaagctgaa gcgtgggtca tgtcgctgaa gaacgatctg 1020 tggctgcatc tcaacatgaa gggtgaggcc aaggccgaag gcgaggccgt ttcgatcagc 1080 aaaggacatc gcggcggtat caggtcgggc agcatctcgg aagccagcgc cgaggcaagc 1140 agcaacgttt ccatgggcgg acgtcatgga cggaaggacc tcgtctctga agcgttagcg 1200 ggagcatcag cgggcagcag tgccgactcc ctttga 1236 <210> 52 <211> 1128 <212> DNA <213> Myrmecia forficata <400> 52 aatctcctta aggagtcgaa agcttccgcg tccgcgtccg cgtccgcttc cgcgagggcc 60 agcggcaaga agaatcttca cgtgttgcca ttaccgaaga aaagcgagca tggcatcgtg 120 atcgacaagt cggtgttcga catcaaggat gtagtgctga gcgcggtcga cgagatcaac 180 ggcgccccga aactcggcct gggatggaag aaggtcagca tgggggtgga gcgcgccgag 240 gcgaacgcag ccgctgccgc cgaggcattg gcgatgatca agaagattgc catggcccgc 300 agcagtgcat acgtccaggc ggcctgggca tcggcccagg catcagctga cgcattggct 360 agcgccaggg tggcacaggc gtctcaggag gctgcggagg caaagggtag agcggcttcc 420 gaggcgctct ccagagccat cgaagcatcc tcgcgagccg atgcggcagc cgctgcgacg 480 ctggacgcga tggaccgcac catggagaac gcgagggcgg caaatgccgc gcaaacgcag 540 gccagcggcc aagctgagaa cgcaaatcgc agcgctgctg ccatcctcgc agctctgcta 600 cgtatcgcgg aggcatccgc gttgaacaac gaggccgcgg tcaacgcggc cgcggccgca 660 gccgcagcgt ctgcccttca ggccaaggct aacgcggctt ctcaagcaac cgccagagcc 720 gcaggacagg cgtcgacggc cgccgaagag gcgcaatccg cccaagaagc cgccgataag 780 aacgcggagc tgaccacggt catgctcgaa aaggctagtg ctgatcaaca ggcggcatcc 840 gctagggctg actactacac cgcctcaacc gaggccgaag ccgctgcaca ggcgtctgct 900 atcaacgcac tcagggacgg aatagttgtc ggaatgggaa atgacgctgg cgcatcggcc 960 caagcgatgg cacaggtaga agctctcgct cgcgccagcg agcacaaggc gttaggcgag 1020 aagaagaagg gcctggtttg gggctacgga agcaagggca gtagctccgc cagcgcatcc 1080 gccagcgcct ccgccgaagc atcctcgaga ctcggaaagg actggtag 1128 <210> 53 <211> 1185 <212> DNA <213> Myrmecia forficata <400> 53 atgaagatac cagcgatact cgtgacgtcc ttcctcgcct ggggactggc cagcgggaat 60 ctccttaagg agtcgaaagc ttccgcgtcc gcgtccgcgt ccgcttccgc gagggccagc 120 ggcaagaaga atcttcacgt gttgccatta ccgaagaaaa gcgagcatgg catcgtgatc 180 gacaagtcgg tgttcgacat caaggatgta gtgctgagcg cggtcgacga gatcaacggc 240 gccccgaaac tcggcctggg atggaagaag gtcagcatgg gggtggagcg cgccgaggcg 300 aacgcagccg ctgccgccga ggcattggcg atgatcaaga agattgccat ggcccgcagc 360 agtgcatacg tccaggcggc ctgggcatcg gcccaggcat cagctgacgc attggctagc 420 gccagggtgg cacaggcgtc tcaggaggct gcggaggcaa agggtagagc ggcttccgag 480 gcgctctcca gagccatcga agcatcctcg cgagccgatg cggcagccgc tgcgacgctg 540 gacgcgatgg accgcaccat ggagaacgcg agggcggcaa atgccgcgca aacgcaggcc 600 agcggccaag ctgagaacgc aaatcgcagc gctgctgcca tcctcgcagc tctgctacgt 660 atcgcggagg catccgcgtt gaacaacgag gccgcggtca acgcggccgc ggccgcagcc 720 gcagcgtctg cccttcaggc caaggctaac gcggcttctc aagcaaccgc cagagccgca 780 ggacaggcgt cgacggccgc cgaagaggcg caatccgccc aagaagccgc cgataagaac 840 gcggagctga ccacggtcat gctcgaaaag gctagtgctg atcaacaggc ggcatccgct 900 agggctgact actacaccgc ctcaaccgag gccgaagccg ctgcacaggc gtctgctatc 960 aacgcactca gggacggaat agttgtcgga atgggaaatg acgctggcgc atcggcccaa 1020 gcgatggcac aggtagaagc tctcgctcgc gccagcgagc acaaggcgtt aggcgagaag 1080 aagaagggcc tggtttgggg ctacggaagc aagggcagta gctccgccag cgcatccgcc 1140 agcgcctccg ccgaagcatc ctcgagactc ggaaaggact ggtag 1185 <210> 54 <211> 1269 <212> DNA <213> Myrmecia forficata <400> 54 agcgagctcg aatcggaagc gagtgcggcg gcgtctgcgc aagcggaagc gtcctcgtct 60 ggtcgctccg gcaaactgtc cgcgtctcag gcttccgcca gcgcgtccgc cagcgcgtca 120 gccggcagca gaggtggcag caaaggtggc tggggccagc tccgccgtgg tgatgttaag 180 agcgaggcga agagcgccgc cgcgatcgcg gtcgaaggag ctaaaatcgg caccggaatc 240 ggaaataccg cgtccgcatc cgcggaggcg ctctcacgag gactcggcat cggacaggcg 300 gccgcggagg cgcaagccgc agccgcaggt caggcagagg tcgccgcgaa atcgtgcgaa 360 cttgccgaca agaccaccgc caaagcggtc gccatggtcg aagcggcagc cgaggccgaa 420 atcgaggtgg ccaatcagga ggtcgcagcc gtcaaattat cgacttgggc cgctaaagca 480 gcaaggatag tcgaggaaga cagcgccgcc gtgagggcgg ctgccggcaa attgcttttg 540 gccgcgagag ctgccgccgc cgccgagaga cgcgccaacg aggaatccga ggcggccaac 600 gaacttgctc aagcgtcatc tgccgctgcc gccgaggccg aagccaaagc gaacgccggc 660 cgtgaggccg ctgccgctgc cttggctatc gccgaggccg ccgtcgccat cgaacaagaa 720 gccgtcattt tggctcgcaa ggcacaagat gcccgtttga atgctgaagc cgcagccgcc 780 gctgcgatga acgcccgtgt catcgcttcc gccgaatccg aggccagtga agatctggag 840 aatcgcgcta gtgtggcgcg tgccagtgcg gccggtgccg ctgaggcaaa ggctatcgcc 900 accgatgccg gcgccactgc cgagatcgcg gcctacagtt gggccaagaa gggcgaactg 960 atcaaccccg gcccgttgcc gaagatcatc agcgtcaacg ccgatctgtc caagagcgag 1020 gtcgaggcca tgaagatcac ccggggtcaa gtacaggaag tcaagaaaat cagcactcac 1080 aaaggtggct ggggatgggg aaaggaagga aggtcgaagg tatcttccaa cgctagtgcc 1140 agagctagtg ccagcgccaa tgcagccgcc ggtagcctcg gcagcaaatg gggaagacaa 1200 ctatccgcat catccgcgtc ggctgacgcc aacgccgaag ccgacagcca gttgctgaaa 1260 gtgtggtga 1269 <210> 55 <211> 1326 <212> DNA <213> Myrmecia forficata <400> 55 atgaagattc cagcgatact tgcgacgtcc ctcctcatct ggggtcttgt cggcgccagc 60 gagctcgaat cggaagcgag tgcggcggcg tctgcgcaag cggaagcgtc ctcgtctggt 120 cgctccggca aactgtccgc gtctcaggct tccgccagcg cgtccgccag cgcgtcagcc 180 ggcagcagag gtggcagcaa aggtggctgg ggccagctcc gccgtggtga tgttaagagc 240 gaggcgaaga gcgccgccgc gatcgcggtc gaaggagcta aaatcggcac cggaatcgga 300 aataccgcgt ccgcatccgc ggaggcgctc tcacgaggac tcggcatcgg acaggcggcc 360 gcggaggcgc aagccgcagc cgcaggtcag gcagaggtcg ccgcgaaatc gtgcgaactt 420 gccgacaaga ccaccgccaa agcggtcgcc atggtcgaag cggcagccga ggccgaaatc 480 gaggtggcca atcaggaggt cgcagccgtc aaattatcga cttgggccgc taaagcagca 540 aggatagtcg aggaagacag cgccgccgtg agggcggctg ccggcaaatt gcttttggcc 600 gcgagagctg ccgccgccgc cgagagacgc gccaacgagg aatccgaggc ggccaacgaa 660 cttgctcaag cgtcatctgc cgctgccgcc gaggccgaag ccaaagcgaa cgccggccgt 720 gaggccgctg ccgctgcctt ggctatcgcc gaggccgccg tcgccatcga acaagaagcc 780 gtcattttgg ctcgcaaggc acaagatgcc cgtttgaatg ctgaagccgc agccgccgct 840 gcgatgaacg cccgtgtcat cgcttccgcc gaatccgagg ccagtgaaga tctggagaat 900 cgcgctagtg tggcgcgtgc cagtgcggcc ggtgccgctg aggcaaaggc tatcgccacc 960 gatgccggcg ccactgccga gatcgcggcc tacagttggg ccaagaaggg cgaactgatc 1020 aaccccggcc cgttgccgaa gatcatcagc gtcaacgccg atctgtccaa gagcgaggtc 1080 gaggccatga agatcacccg gggtcaagta caggaagtca agaaaatcag cactcacaaa 1140 ggtggctggg gatggggaaa ggaaggaagg tcgaaggtat cttccaacgc tagtgccaga 1200 gctagtgcca gcgccaatgc agccgccggt agcctcggca gcaaatgggg aagacaacta 1260 tccgcatcat ccgcgtcggc tgacgccaac gccgaagccg acagccagtt gctgaaagtg 1320 tggtga 1326 <210> 56 <211> 372 <212> PRT <213> Oecophylla smaragdina <400> 56 Ser Lys Ser Tyr Leu Leu Gly Ser Ser Ala Ser Ala Ser Ala Ser Ala 1 5 10 15 Ser Ala Ser Ala Ser Ala Gly Gly Ser Thr Gly Gly Val Gly Val Gly 20 25 30 Ser Val Ile Ser Gly Gly Asn Asn Ile Ile Arg Gly Ala Ser Thr Thr 35 40 45 Ser Val Thr Leu Ala Ala Ala Ala Ala Glu Ala Lys Ala Ala Leu Asn 50 55 60 Ala Gly Lys Ala Thr Val Glu Glu Gln Arg Glu Ala Leu Gln Leu Leu 65 70 75 80 Thr Ala Ser Ala Glu Lys Asn Ala Glu Ala Arg Ser Leu Ala Asp Asp 85 90 95 Ala Ala Val Leu Val Gln Gly Ala Ala Glu Ala Gln Ser Val Ala Ala 100 105 110 Ala Lys Thr Val Ala Val Glu Gln Gly Ser Asn Ser Leu Asp Ala Ala 115 120 125 Ala Ala Glu Ala Glu Ala Ala Ala Ala Ala Ser Arg Val Ser Ala Gln 130 135 140 Gln Ala Leu Gln Ala Ala Gln Thr Ser Ala Ala Ala Ile Gln Thr Ala 145 150 155 160 Ala Gly Ser Ala Leu Thr Ala Leu Lys Leu Ala Arg Lys Gln Glu Ala 165 170 175 Glu Ser Asn Asn Ala Ala Glu Gln Ala Asn Lys Ala Leu Ala Leu Ser 180 185 190 Arg Ala Ala Ser Ala Ala Thr Gln Arg Ala Val Ala Ala Gln Asn Ala 195 200 205 Ala Ala Ala Ser Ala Ala Ser Ala Gly Ala Ala Gln Ala Glu Ala Arg 210 215 220 Asn Ala Tyr Ala Lys Ala Lys Ala Ala Ile Ala Ala Leu Thr Ala Ala 225 230 235 240 Gln Arg Asn Tyr Ala Ala Ala Lys Ala Ser Ala Ser Ala Gly Ser Val 245 250 255 Val Ala Glu Gln Asp Ala Gln Ser Arg Ala Ala Asp Ala Glu Val Asn 260 265 270 Ala Val Ala Gln Ala Ala Ala Arg Ala Ser Val Arg Asn Gln Glu Ile 275 280 285 Val Glu Ile Gly Ala Glu Phe Gly Asn Ala Ser Gly Gly Val Ile Ser 290 295 300 Thr Gly Thr Arg Ser Ser Gly Gly Lys Gly Val Ser Val Thr Ala Gly 305 310 315 320 Ala Gln Ala Ser Ala Ser Ala Ser Ala Thr Ser Ser Ser Ser Ser Ser 325 330 335 Ser Gly Ile Asn Lys Gly His Pro Arg Trp Gly His Asn Trp Gly Leu 340 345 350 Gly Ser Ser Glu Ala Ser Ala Asn Ala Glu Ala Glu Ser Ser Ala Ser 355 360 365 Ser Tyr Ser Ser 370 <210> 57 <211> 391 <212> PRT <213> Oecophylla smaragdina <400> 57 Met Lys Ile Pro Ala Ile Ile Ala Thr Thr Leu Leu Leu Trp Gly Phe 1 5 10 15 Ala Asp Ala Ser Lys Ser Tyr Leu Leu Gly Ser Ser Ala Ser Ala Ser 20 25 30 Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Gly Ser Thr Gly Gly Val 35 40 45 Gly Val Gly Ser Val Ile Ser Gly Gly Asn Asn Ile Ile Arg Gly Ala 50 55 60 Ser Thr Thr Ser Val Thr Leu Ala Ala Ala Ala Ala Glu Ala Lys Ala 65 70 75 80 Ala Leu Asn Ala Gly Lys Ala Thr Val Glu Glu Gln Arg Glu Ala Leu 85 90 95 Gln Leu Leu Thr Ala Ser Ala Glu Lys Asn Ala Glu Ala Arg Ser Leu 100 105 110 Ala Asp Asp Ala Ala Val Leu Val Gln Gly Ala Ala Glu Ala Gln Ser 115 120 125 Val Ala Ala Ala Lys Thr Val Ala Val Glu Gln Gly Ser Asn Ser Leu 130 135 140 Asp Ala Ala Ala Ala Glu Ala Glu Ala Ala Ala Ala Ala Ser Arg Val 145 150 155 160 Ser Ala Gln Gln Ala Leu Gln Ala Ala Gln Thr Ser Ala Ala Ala Ile 165 170 175 Gln Thr Ala Ala Gly Ser Ala Leu Thr Ala Leu Lys Leu Ala Arg Lys 180 185 190 Gln Glu Ala Glu Ser Asn Asn Ala Ala Glu Gln Ala Asn Lys Ala Leu 195 200 205 Ala Leu Ser Arg Ala Ala Ser Ala Ala Thr Gln Arg Ala Val Ala Ala 210 215 220 Gln Asn Ala Ala Ala Ala Ser Ala Ala Ser Ala Gly Ala Ala Gln Ala 225 230 235 240 Glu Ala Arg Asn Ala Tyr Ala Lys Ala Lys Ala Ala Ile Ala Ala Leu 245 250 255 Thr Ala Ala Gln Arg Asn Tyr Ala Ala Ala Lys Ala Ser Ala Ser Ala 260 265 270 Gly Ser Val Val Ala Glu Gln Asp Ala Gln Ser Arg Ala Ala Asp Ala 275 280 285 Glu Val Asn Ala Val Ala Gln Ala Ala Ala Arg Ala Ser Val Arg Asn 290 295 300 Gln Glu Ile Val Glu Ile Gly Ala Glu Phe Gly Asn Ala Ser Gly Gly 305 310 315 320 Val Ile Ser Thr Gly Thr Arg Ser Ser Gly Gly Lys Gly Val Ser Val 325 330 335 Thr Ala Gly Ala Gln Ala Ser Ala Ser Ala Ser Ala Thr Ser Ser Ser 340 345 350 Ser Ser Ser Ser Gly Ile Asn Lys Gly His Pro Arg Trp Gly His Asn 355 360 365 Trp Gly Leu Gly Ser Ser Glu Ala Ser Ala Asn Ala Glu Ala Glu Ser 370 375 380 Ser Ala Ser Ser Tyr Ser Ser 385 390 <210> 58 <211> 381 <212> PRT <213> Oecophylla smaragdina <400> 58 Gly Val Ile Gly Pro Asp Thr Ser Ser Ser Ser Gln Ala Ser Ala Ser 1 5 10 15 Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Ser Ala Ser Ile Gly 20 25 30 Tyr Asn Glu Leu His Lys Ser Ile Asn Ala Pro Ala Leu Ala Val Gly 35 40 45 Val Lys Asn Gly Gly Val Asp Val Ala Lys Gly Ala Ala Val Val Glu 50 55 60 Ser Ala Ile Ser Asp Val Ser Thr Leu Thr Asp Asp Arg Thr Leu Asn 65 70 75 80 Gly Leu Ala Ile Ile Gly Asn Ser Ala Glu Ser Leu Ala Arg Ala Gln 85 90 95 Ala Ser Ser Ser Ala Ser Ala Gly Ala Lys Ala Asn Ala Leu Ile Lys 100 105 110 Gln Ser Ile Ala Ala Ile Glu Ile Thr Glu Lys Ala Glu Tyr Leu Ala 115 120 125 Ser Ile Val Ala Thr Lys Ala Ala Lys Ala Ala Glu Ala Thr Ala Ala 130 135 140 Ala Thr Ala Arg Ala Thr Ala Val Ala Glu Ala Ala Lys Val Ser Ser 145 150 155 160 Glu Gln Phe Ala Ala Glu Ala Arg Ala Ala Ala Asp Ala Glu Ala Lys 165 170 175 Ala Asn Ala Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala Val Leu Ala 180 185 190 Glu Ala Ala Thr Gly Leu Ser Ala Ser Ala Gly Lys Ala Gln Gln Ser 195 200 205 Ala Thr Arg Ala Leu Gln Ala Ala Arg Ala Ala Ala Lys Ala Gln Ala 210 215 220 Glu Leu Thr Gln Lys Ala Ala Gln Ile Leu Val Leu Ile Ala Glu Ala 225 230 235 240 Lys Ala Ala Val Ser Arg Ala Ser Ala Asp Gln Ser Val Cys Thr Ser 245 250 255 Gln Ala Gln Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser Ala Ala Glu 260 265 270 Ser Ala Ala Ser Ala Gln Ser Glu Ala Asn Thr Ile Ala Ala Glu Ala 275 280 285 Val Ala Arg Ala Asp Ala Glu Ala Ala Ser Gln Ala Gln Ala Trp Ala 290 295 300 Glu Ser Phe Lys Arg Glu Leu Ser Ser Val Val Leu Glu Ala Glu Ala 305 310 315 320 Asn Ala Ser Ala Ser Ala Ser Ala Gly Ala Leu Ala Ser Gly Ser Ser 325 330 335 Ser Ser Gly Ala Ser Ser Ser Ala Asp Ala Ser Ala Gly Ala Ser Ser 340 345 350 Tyr Gly Ser Leu Gly Gly Tyr Arg His Gly Gly Ser Phe Ser Glu Ala 355 360 365 Ser Ala Ala Ala Ser Ala Ala Ser Arg Ala Glu Ala Ala 370 375 380 <210> 59 <211> 400 <212> PRT <213> Oecophylla smaragdina <400> 59 Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Ala Trp Gly Leu 1 5 10 15 Ala Ser Gly Gly Val Ile Gly Pro Asp Thr Ser Ser Ser Ser Gln Ala 20 25 30 Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Ser Ala 35 40 45 Ser Ile Gly Tyr Asn Glu Leu His Lys Ser Ile Asn Ala Pro Ala Leu 50 55 60 Ala Val Gly Val Lys Asn Gly Gly Val Asp Val Ala Lys Gly Ala Ala 65 70 75 80 Val Val Glu Ser Ala Ile Ser Asp Val Ser Thr Leu Thr Asp Asp Arg 85 90 95 Thr Leu Asn Gly Leu Ala Ile Ile Gly Asn Ser Ala Glu Ser Leu Ala 100 105 110 Arg Ala Gln Ala Ser Ser Ser Ala Ser Ala Gly Ala Lys Ala Asn Ala 115 120 125 Leu Ile Lys Gln Ser Ile Ala Ala Ile Glu Ile Thr Glu Lys Ala Glu 130 135 140 Tyr Leu Ala Ser Ile Val Ala Thr Lys Ala Ala Lys Ala Ala Glu Ala 145 150 155 160 Thr Ala Ala Ala Thr Ala Arg Ala Thr Ala Val Ala Glu Ala Ala Lys 165 170 175 Val Ser Ser Glu Gln Phe Ala Ala Glu Ala Arg Ala Ala Ala Asp Ala 180 185 190 Glu Ala Lys Ala Asn Ala Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala 195 200 205 Val Leu Ala Glu Ala Ala Thr Gly Leu Ser Ala Ser Ala Gly Lys Ala 210 215 220 Gln Gln Ser Ala Thr Arg Ala Leu Gln Ala Ala Arg Ala Ala Ala Lys 225 230 235 240 Ala Gln Ala Glu Leu Thr Gln Lys Ala Ala Gln Ile Leu Val Leu Ile 245 250 255 Ala Glu Ala Lys Ala Ala Val Ser Arg Ala Ser Ala Asp Gln Ser Val 260 265 270 Cys Thr Ser Gln Ala Gln Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser 275 280 285 Ala Ala Glu Ser Ala Ala Ser Ala Gln Ser Glu Ala Asn Thr Ile Ala 290 295 300 Ala Glu Ala Val Ala Arg Ala Asp Ala Glu Ala Ala Ser Gln Ala Gln 305 310 315 320 Ala Trp Ala Glu Ser Phe Lys Arg Glu Leu Ser Ser Val Val Leu Glu 325 330 335 Ala Glu Ala Asn Ala Ser Ala Ser Ala Ser Ala Gly Ala Leu Ala Ser 340 345 350 Gly Ser Ser Ser Ser Gly Ala Ser Ser Ser Ala Asp Ala Ser Ala Gly 355 360 365 Ala Ser Ser Tyr Gly Ser Leu Gly Gly Tyr Arg His Gly Gly Ser Phe 370 375 380 Ser Glu Ala Ser Ala Ala Ala Ser Ala Ala Ser Arg Ala Glu Ala Ala 385 390 395 400 <210> 60 <211> 376 <212> PRT <213> Oecophylla smaragdina <400> 60 Gly Val Pro Lys Glu Leu Gly Thr Ser Ile Ser Ser Ala Ser Ala Ser 1 5 10 15 Ala Ser Ala Ser Ala Ser Ala Thr Ala Ser Ser Ser Ser Lys Asn Val 20 25 30 His Leu Leu Pro Leu Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser 35 40 45 Lys Phe Asn Ile Arg Lys Val Val Leu Ser Ala Ile Asp Glu Ile Asn 50 55 60 Gly Ala Pro Asn Ile Gly Leu Gly Leu Lys Gln Val Ser Leu Ala Leu 65 70 75 80 Ala Lys Ala Gln Ala Ser Ala Gln Ser Ser Ala Glu Ala Leu Ala Ile 85 90 95 Ile Lys Lys Ile Val Ala Leu Leu Ile Ser Ala Tyr Val Arg Ala Ala 100 105 110 Glu Ala Ala Ala Arg Ala Ser Ala Glu Ala Leu Ala Thr Val Arg Ala 115 120 125 Ala Glu Gln Ala Gln Lys Ile Ala Glu Ala Lys Gly Arg Ala Ala Ala 130 135 140 Glu Ala Leu Ser Glu Leu Val Glu Ala Ser Gln Lys Ala Asp Ala Ala 145 150 155 160 Ala Ala Gly Thr Thr Asp Ala Ile Glu Arg Thr Tyr Gln Asp Ala Arg 165 170 175 Ala Ala Thr Ser Ala Gln Thr Lys Ala Ser Gly Glu Ala Glu Asn Ala 180 185 190 Asn Arg Asn Ala Ala Ala Thr Leu Ala Ala Val Leu Ser Ile Ala Lys 195 200 205 Ala Ala Ser Gly Gln Gly Gly Thr Arg Ala Ala Val Asp Ala Ala Ala 210 215 220 Ala Ala Ala Ala Ala Ala Ala Leu His Ala Lys Ala Asn Ala Val Ser 225 230 235 240 Gln Ala Thr Ser Lys Ala Ala Ala Glu Ala Arg Val Ala Ala Glu Glu 245 250 255 Ala Ala Ser Ala Gln Ala Ser Ala Ser Ala Ser Ala Gln Leu Thr Ala 260 265 270 Gln Leu Glu Glu Lys Val Ser Ala Asp Gln Gln Ala Ala Ser Ala Ser 275 280 285 Thr Asp Thr Ser Ala Ala Ile Ala Glu Ala Glu Ala Ala Ala Leu Ala 290 295 300 Ser Thr Val Asn Ala Ile Asn Asp Gly Val Val Ile Gly Leu Gly Asn 305 310 315 320 Thr Ala Ser Ser Ser Ala Gln Ala Ser Ala Gln Ala Ser Ala Leu Ala 325 330 335 Arg Ala Lys Asn Ala Arg Pro Lys Ile Lys Gly Trp Tyr Lys Ile Gly 340 345 350 Gly Ala Thr Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Gln 355 360 365 Ser Ser Ser Gln Gly Leu Val Tyr 370 375 <210> 61 <211> 395 <212> PRT <213> Oecophylla smaragdina <400> 61 Met Lys Ile Pro Ala Ile Leu Val Thr Ser Phe Leu Ala Trp Gly Leu 1 5 10 15 Ala Ser Gly Gly Val Pro Lys Glu Leu Gly Thr Ser Ile Ser Ser Ala 20 25 30 Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Thr Ala Ser Ser Ser Ser 35 40 45 Lys Asn Val His Leu Leu Pro Leu Lys Ser Glu His Gly Ile Val Ile 50 55 60 Asp Lys Ser Lys Phe Asn Ile Arg Lys Val Val Leu Ser Ala Ile Asp 65 70 75 80 Glu Ile Asn Gly Ala Pro Asn Ile Gly Leu Gly Leu Lys Gln Val Ser 85 90 95 Leu Ala Leu Ala Lys Ala Gln Ala Ser Ala Gln Ser Ser Ala Glu Ala 100 105 110 Leu Ala Ile Ile Lys Lys Ile Val Ala Leu Leu Ile Ser Ala Tyr Val 115 120 125 Arg Ala Ala Glu Ala Ala Ala Arg Ala Ser Ala Glu Ala Leu Ala Thr 130 135 140 Val Arg Ala Ala Glu Gln Ala Gln Lys Ile Ala Glu Ala Lys Gly Arg 145 150 155 160 Ala Ala Ala Glu Ala Leu Ser Glu Leu Val Glu Ala Ser Gln Lys Ala 165 170 175 Asp Ala Ala Ala Ala Gly Thr Thr Asp Ala Ile Glu Arg Thr Tyr Gln 180 185 190 Asp Ala Arg Ala Ala Thr Ser Ala Gln Thr Lys Ala Ser Gly Glu Ala 195 200 205 Glu Asn Ala Asn Arg Asn Ala Ala Ala Thr Leu Ala Ala Val Leu Ser 210 215 220 Ile Ala Lys Ala Ala Ser Gly Gln Gly Gly Thr Arg Ala Ala Val Asp 225 230 235 240 Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Leu His Ala Lys Ala Asn 245 250 255 Ala Val Ser Gln Ala Thr Ser Lys Ala Ala Ala Glu Ala Arg Val Ala 260 265 270 Ala Glu Glu Ala Ala Ser Ala Gln Ala Ser Ala Ser Ala Ser Ala Gln 275 280 285 Leu Thr Ala Gln Leu Glu Glu Lys Val Ser Ala Asp Gln Gln Ala Ala 290 295 300 Ser Ala Ser Thr Asp Thr Ser Ala Ala Ile Ala Glu Ala Glu Ala Ala 305 310 315 320 Ala Leu Ala Ser Thr Val Asn Ala Ile Asn Asp Gly Val Val Ile Gly 325 330 335 Leu Gly Asn Thr Ala Ser Ser Ser Ala Gln Ala Ser Ala Gln Ala Ser 340 345 350 Ala Leu Ala Arg Ala Lys Asn Ala Arg Pro Lys Ile Lys Gly Trp Tyr 355 360 365 Lys Ile Gly Gly Ala Thr Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala 370 375 380 Ser Ala Gln Ser Ser Ser Gln Gly Leu Val Tyr 385 390 395 <210> 62 <211> 424 <212> PRT <213> Oecophylla smaragdina <400> 62 Ser Glu Leu Val Gly Ser Asp Ala Ser Ala Thr Ala Ser Ala Glu Ala 1 5 10 15 Ser Ala Ser Ser Ser Ala Tyr Gly Ser Lys Tyr Gly Ile Gly Ser Gly 20 25 30 Ala Val Ser Gly Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser 35 40 45 Ala Ser Ala Ser Ser Ala Pro Ala Ile Glu Gly Val Asn Val Gly Thr 50 55 60 Gly Val Ser Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg Gly 65 70 75 80 Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala Gly 85 90 95 Gln Ala Ala Ile Ala Ala Lys Ser Cys Ala Leu Ala Ala Lys Ser Thr 100 105 110 Ala Gln Ala Val Ala Leu Val Glu Lys Val Ala Arg Ala Glu Val Asp 115 120 125 Leu Ala Glu Ser Ala Arg Lys Ala Thr Arg Leu Ser Ala Glu Ala Ala 130 135 140 Lys Ala Ala Ala Glu Val Glu Lys Asp Leu Val Gly Leu Arg Gly Ala 145 150 155 160 Ala Gly Lys Leu Asn Leu Ala Ala Arg Ala Gly Ser Lys Ala Gln Glu 165 170 175 Arg Ala Asn Glu Asp Ser Ile Glu Ala Asn Glu Leu Ala Gln Ala Thr 180 185 190 Ala Ala Ala Gly Ala Glu Ala Glu Ala Lys Ala Asn Ala Ala Gln Glu 195 200 205 Ala Gly Ala Ser Ala Leu Ala Ile Ala Gln Ala Ala Leu Asn Ile Glu 210 215 220 Gln Glu Thr Val Lys Leu Thr Arg Gln Ala Gln Asn Thr Arg Leu Arg 225 230 235 240 Ser Glu Asn Ile Leu Ala Ala Ala Ser Asn Ala Arg Ala Ile Ala Ser 245 250 255 Ala Glu Ala Glu Ala Ser Ser Asp Leu Asn Asn Arg Ala Asn Ala Ala 260 265 270 Arg Ser Asn Ala Arg Ala Ala Ala Glu Thr Arg Ala Val Ala Thr Glu 275 280 285 Ala Ala Ser Thr Ala Glu Ile Ala Ala Tyr Ser Ser Ser Glu Lys Gly 290 295 300 Glu Ile Thr Asn Pro Gly Pro Leu Pro Lys Ile Val Ser Val Thr Ala 305 310 315 320 Gly Leu Thr Gln Asn Glu Ile Ala Gly Ser Gly Ala Ala Ala Ser Ala 325 330 335 Ser Ala Ser Ala Leu Ala Ser Ala Ser Ala Gly Ala Gly Ala Gly Ala 340 345 350 Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Ala Val Ala Gly Ala 355 360 365 Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Ser Ala Gly Ala 370 375 380 Asn Ala Gly Ala Gly Ala Ser Ser Leu Leu Leu Pro Gln Ser Lys Leu 385 390 395 400 His Pro Ile Ser Arg Ser Ser Ala Ser Ala Ser Ala Ser Ala Glu Ala 405 410 415 Glu Ala Asn Ser Ser Ala Tyr Ala 420 <210> 63 <211> 443 <212> PRT <213> Oecophylla smaragdina <400> 63 Met Lys Ile Pro Ala Ile Leu Ala Thr Ser Leu Phe Val Trp Gly Leu 1 5 10 15 Val Gly Ala Ser Glu Leu Val Gly Ser Asp Ala Ser Ala Thr Ala Ser 20 25 30 Ala Glu Ala Ser Ala Ser Ser Ser Ala Tyr Gly Ser Lys Tyr Gly Ile 35 40 45 Gly Ser Gly Ala Val Ser Gly Ala Ser Ala Ser Ala Ser Ala Ser Ala 50 55 60 Ser Ala Ser Ala Ser Ala Ser Ser Ala Pro Ala Ile Glu Gly Val Asn 65 70 75 80 Val Gly Thr Gly Val Ser Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu 85 90 95 Ser Arg Gly Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala 100 105 110 Ala Ala Gly Gln Ala Ala Ile Ala Ala Lys Ser Cys Ala Leu Ala Ala 115 120 125 Lys Ser Thr Ala Gln Ala Val Ala Leu Val Glu Lys Val Ala Arg Ala 130 135 140 Glu Val Asp Leu Ala Glu Ser Ala Arg Lys Ala Thr Arg Leu Ser Ala 145 150 155 160 Glu Ala Ala Lys Ala Ala Ala Glu Val Glu Lys Asp Leu Val Gly Leu 165 170 175 Arg Gly Ala Ala Gly Lys Leu Asn Leu Ala Ala Arg Ala Gly Ser Lys 180 185 190 Ala Gln Glu Arg Ala Asn Glu Asp Ser Ile Glu Ala Asn Glu Leu Ala 195 200 205 Gln Ala Thr Ala Ala Ala Gly Ala Glu Ala Glu Ala Lys Ala Asn Ala 210 215 220 Ala Gln Glu Ala Gly Ala Ser Ala Leu Ala Ile Ala Gln Ala Ala Leu 225 230 235 240 Asn Ile Glu Gln Glu Thr Val Lys Leu Thr Arg Gln Ala Gln Asn Thr 245 250 255 Arg Leu Arg Ser Glu Asn Ile Leu Ala Ala Ala Ser Asn Ala Arg Ala 260 265 270 Ile Ala Ser Ala Glu Ala Glu Ala Ser Ser Asp Leu Asn Asn Arg Ala 275 280 285 Asn Ala Ala Arg Ser Asn Ala Arg Ala Ala Ala Glu Thr Arg Ala Val 290 295 300 Ala Thr Glu Ala Ala Ser Thr Ala Glu Ile Ala Ala Tyr Ser Ser Ser 305 310 315 320 Glu Lys Gly Glu Ile Thr Asn Pro Gly Pro Leu Pro Lys Ile Val Ser 325 330 335 Val Thr Ala Gly Leu Thr Gln Asn Glu Ile Ala Gly Ser Gly Ala Ala 340 345 350 Ala Ser Ala Ser Ala Ser Ala Leu Ala Ser Ala Ser Ala Gly Ala Gly 355 360 365 Ala Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Ala Val 370 375 380 Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Ser 385 390 395 400 Ala Gly Ala Asn Ala Gly Ala Gly Ala Ser Ser Leu Leu Leu Pro Gln 405 410 415 Ser Lys Leu His Pro Ile Ser Arg Ser Ser Ala Ser Ala Ser Ala Ser 420 425 430 Ala Glu Ala Glu Ala Asn Ser Ser Ala Tyr Ala 435 440 <210> 64 <211> 1119 <212> DNA <213> Oecophylla smaragdina <400> 64 agcaagtcgt acctcttagg ctcatccgcg tctgcttccg cttccgcttc cgcctcggca 60 tcagcgggag gaagcaccgg cggcgtcggc gtcggatctg taatatccgg tggcaacaac 120 atcatcagag gagcttcgac cacatccgtg acattggcag ccgccgcagc ggaggccaag 180 gcagctctga atgctggaaa agcgactgtc gaagagcaaa gggaagcgtt acagttgctc 240 accgcgtccg ctgaaaaaaa cgccgaggcg cgttccttgg ccgacgatgc ggccgttcta 300 gttcagggtg ccgctgaggc gcaatcggtc gccgccgcga agacggtcgc ggtcgagcaa 360 ggatccaact ctctggatgc agctgcagcc gaagcggaag ccgccgccgc cgcatccagg 420 gtatcggccc agcaggcact ccaggccgcg cagacctccg ccgccgctat tcaaaccgct 480 gccggtagcg ccctgacggc tctcaaattg gcacgcaaac aggaagcgga atccaataat 540 gccgccgaac aggcaaataa agcattggcc ttaagtcgcg cagccagcgc tgccactcaa 600 cgagccgtgg cagctcagaa cgcggctgcc gcatcagcgg cttcggctgg agccgcacaa 660 gctgaggcaa ggaacgccta cgccaaagcc aaagcagcga tagctgctct tacggccgcc 720 caaagaaatt acgccgcggc caaggctagc gcaagcgcgg gtagcgtggt ggccgaacaa 780 gatgctcaat ctagagcggc cgatgccgag gtgaacgccg ttgcccaagc cgctgcccga 840 gccagcgttc gcaatcagga gatcgttgaa atcggcgcgg aattcggcaa cgccagcggc 900 ggagtgatct cgaccggcac acgttcttcc ggaggcaagg gtgtctccgt taccgctgga 960 gctcaggcta gcgcgtccgc ttccgcgacc tcctcctcct cctcctcctc cggcatcaac 1020 aaaggacatc ccagatgggg gcacaattgg ggtttaggtt cttcggaagc gtcagcaaac 1080 gctgaagccg aaagcagcgc ttcctcttat tcatcttaa 1119 <210> 65 <211> 1176 <212> DNA <213> Oecophylla smaragdina <400> 65 atgaagatcc cagcgataat cgcaacgacc ctccttctct ggggtttcgc cgacgccagc 60 aagtcgtacc tcttaggctc atccgcgtct gcttccgctt ccgcttccgc ctcggcatca 120 gcgggaggaa gcaccggcgg cgtcggcgtc ggatctgtaa tatccggtgg caacaacatc 180 atcagaggag cttcgaccac atccgtgaca ttggcagccg ccgcagcgga ggccaaggca 240 gctctgaatg ctggaaaagc gactgtcgaa gagcaaaggg aagcgttaca gttgctcacc 300 gcgtccgctg aaaaaaacgc cgaggcgcgt tccttggccg acgatgcggc cgttctagtt 360 cagggtgccg ctgaggcgca atcggtcgcc gccgcgaaga cggtcgcggt cgagcaagga 420 tccaactctc tggatgcagc tgcagccgaa gcggaagccg ccgccgccgc atccagggta 480 tcggcccagc aggcactcca ggccgcgcag acctccgccg ccgctattca aaccgctgcc 540 ggtagcgccc tgacggctct caaattggca cgcaaacagg aagcggaatc caataatgcc 600 gccgaacagg caaataaagc attggcctta agtcgcgcag ccagcgctgc cactcaacga 660 gccgtggcag ctcagaacgc ggctgccgca tcagcggctt cggctggagc cgcacaagct 720 gaggcaagga acgcctacgc caaagccaaa gcagcgatag ctgctcttac ggccgcccaa 780 agaaattacg ccgcggccaa ggctagcgca agcgcgggta gcgtggtggc cgaacaagat 840 gctcaatcta gagcggccga tgccgaggtg aacgccgttg cccaagccgc tgcccgagcc 900 agcgttcgca atcaggagat cgttgaaatc ggcgcggaat tcggcaacgc cagcggcgga 960 gtgatctcga ccggcacacg ttcttccgga ggcaagggtg tctccgttac cgctggagct 1020 caggctagcg cgtccgcttc cgcgacctcc tcctcctcct cctcctccgg catcaacaaa 1080 ggacatccca gatgggggca caattggggt ttaggttctt cggaagcgtc agcaaacgct 1140 gaagccgaaa gcagcgcttc ctcttattca tcttaa 1176 <210> 66 <211> 1146 <212> DNA <213> Oecophylla smaragdina <400> 66 ggagtcatag gtcccgacac gtcctcatcg tcccaggcat cggcatcggc atcggcgtca 60 gcatcggcgt cggcatcatc gtcggcatcg atcggttaca acgaactcca taaatcgatc 120 aatgcgcccg ccttggcggt cggcgtcaag aacggcggag tggatgtcgc caagggcgcg 180 gccgttgtcg aatcagcgat atccgacgta tcgactctaa ccgatgatcg tacgttgaac 240 ggtctcgcta tcatcgggaa tagcgccgag agtctggcaa gagcacaggc ttcctcgagc 300 gccagcgccg gcgcaaaagc caatgctctc atcaaacaat cgatagcggc tatagagatc 360 accgaaaagg cagagtacct tgcgtcgatc gtcgccacca aggcagcgaa ggccgccgag 420 gccacagcgg ccgcgaccgc tcgcgccact gccgtcgccg aggctgccaa ggtttccagc 480 gagcaattcg cggccgaggc acgcgcggcc gccgacgccg aagccaaggc caacgccgct 540 tccatcatcg ccaacaaagc gaacgccgtc ctcgcggagg cagccaccgg acttagcgcc 600 agcgctggca aagcccaaca atcggcgacc agggcgttgc aagccgcacg agctgccgct 660 aaggctcaag ccgaacttac ccagaaagcc gctcaaatct tagtcctcat tgctgaagcc 720 aaagccgccg tgagccgagc aagcgccgat caatccgtct gtacgtccca ggcacaagcc 780 gccagtcaga ttcaatcgag agcctccgcg gccgaatccg cggcatcggc tcaatcggaa 840 gccaacacca ttgcggccga ggcggtcgct agagctgacg ccgaggcggc cagtcaagct 900 caagcgtggg ccgaatcctt caaacgcgaa ctctcgagtg tcgttttgga ggccgaggcc 960 aatgcctcgg ctagtgcctc ggctggtgcc ctggccagtg gtagcagcag ctcgggcgcg 1020 agttccagcg cggatgccag cgccggagcg agcagctatg gatccttggg cggatatcga 1080 cacggcggaa gcttcagcga ggcatcggca gccgcgtcag cggccagtcg cgccgaggct 1140 gcgtaa 1146 <210> 67 <211> 1203 <212> DNA <213> Oecophylla smaragdina <400> 67 atgaagattc cagcgatatt cgtgacgtct ctgctcgcct ggggactcgc cagcggcgga 60 gtcataggtc ccgacacgtc ctcatcgtcc caggcatcgg catcggcatc ggcgtcagca 120 tcggcgtcgg catcatcgtc ggcatcgatc ggttacaacg aactccataa atcgatcaat 180 gcgcccgcct tggcggtcgg cgtcaagaac ggcggagtgg atgtcgccaa gggcgcggcc 240 gttgtcgaat cagcgatatc cgacgtatcg actctaaccg atgatcgtac gttgaacggt 300 ctcgctatca tcgggaatag cgccgagagt ctggcaagag cacaggcttc ctcgagcgcc 360 agcgccggcg caaaagccaa tgctctcatc aaacaatcga tagcggctat agagatcacc 420 gaaaaggcag agtaccttgc gtcgatcgtc gccaccaagg cagcgaaggc cgccgaggcc 480 acagcggccg cgaccgctcg cgccactgcc gtcgccgagg ctgccaaggt ttccagcgag 540 caattcgcgg ccgaggcacg cgcggccgcc gacgccgaag ccaaggccaa cgccgcttcc 600 atcatcgcca acaaagcgaa cgccgtcctc gcggaggcag ccaccggact tagcgccagc 660 gctggcaaag cccaacaatc ggcgaccagg gcgttgcaag ccgcacgagc tgccgctaag 720 gctcaagccg aacttaccca gaaagccgct caaatcttag tcctcattgc tgaagccaaa 780 gccgccgtga gccgagcaag cgccgatcaa tccgtctgta cgtcccaggc acaagccgcc 840 agtcagattc aatcgagagc ctccgcggcc gaatccgcgg catcggctca atcggaagcc 900 aacaccattg cggccgaggc ggtcgctaga gctgacgccg aggcggccag tcaagctcaa 960 gcgtgggccg aatccttcaa acgcgaactc tcgagtgtcg ttttggaggc cgaggccaat 1020 gcctcggcta gtgcctcggc tggtgccctg gccagtggta gcagcagctc gggcgcgagt 1080 tccagcgcgg atgccagcgc cggagcgagc agctatggat ccttgggcgg atatcgacac 1140 ggcggaagct tcagcgaggc atcggcagcc gcgtcagcgg ccagtcgcgc cgaggctgcg 1200 taa 1203 <210> 68 <211> 1131 <212> DNA <213> Oecophylla smargdina <400> 68 ggtgtcccta aagagttggg aacttccatt tcttccgcgt ccgcatccgc atccgcatcc 60 gcatccgcga ccgcgtcctc cagtagcaag aatgttcact tattaccatt gaaaagcgag 120 catggcatcg taattgacaa gtcaaaattc aacatcagaa aggtagtgtt gagcgcaatc 180 gatgagatca acggcgcgcc caacatcggt ctgggattga aacaggtcag tttggcgctc 240 gcaaaagccc aggctagtgc tcaatcgagc gccgaggcat tggcaatcat caagaaaatc 300 gtcgcgctcc tcatctcggc ctacgtcaga gcagccgagg ccgcggctcg agcatccgcc 360 gaagctttag ctaccgttag ggctgcggaa caagcgcaaa aaattgctga agcgaagggt 420 agagcggctg ctgaggcgct ctccgagtta gtcgaggcgt cccagaaggc cgatgcggcg 480 gccgcgggaa cgacggacgc gatcgaacgc acctaccagg atgccagagc ggccacttcc 540 gcacagacca aggccagcgg cgaagccgag aatgctaatc gcaatgctgc cgccaccctc 600 gcggcggtct tgagcatcgc taaggccgcc tccggtcaag gaggcactcg agccgctgtc 660 gatgcagctg ctgccgctgc cgccgcagcc gctctgcatg ctaaagctaa cgcggtttcg 720 caagctacca gcaaagcagc cgctgaagct agagtcgcgg ctgaggaggc agcatccgcc 780 caggcatccg cctcagcaag cgcacagctg accgcacaat tagaggagaa agtcagcgcc 840 gatcaacaag cagcctccgc cagtactgat acctccgctg ctatagccga ggctgaagct 900 gccgcgttag cgtccaccgt caacgcgatc aacgacggag tggtcatcgg attaggaaat 960 accgccagtt cttctgccca agcttccgca caggccagtg ctctcgctcg cgcaaaaaat 1020 gcgcgcccta aaataaaggg ctggtacaaa atcggaggcg cgacttccgc ttctgcaagc 1080 gcatcggcca gcgcttccgc ccagtcatcc tcgcaaggac tggtatacta g 1131 <210> 69 <211> 1188 <212> DNA <213> Oecophylla smaragdina <400> 69 atgaagattc cagcgatact cgtgacgtcc ttcctcgcct ggggactggc cagcgggggt 60 gtccctaaag agttgggaac ttccatttct tccgcgtccg catccgcatc cgcatccgca 120 tccgcgaccg cgtcctccag tagcaagaat gttcacttat taccattgaa aagcgagcat 180 ggcatcgtaa ttgacaagtc aaaattcaac atcagaaagg tagtgttgag cgcaatcgat 240 gagatcaacg gcgcgcccaa catcggtctg ggattgaaac aggtcagttt ggcgctcgca 300 aaagcccagg ctagtgctca atcgagcgcc gaggcattgg caatcatcaa gaaaatcgtc 360 gcgctcctca tctcggccta cgtcagagca gccgaggccg cggctcgagc atccgccgaa 420 gctttagcta ccgttagggc tgcggaacaa gcgcaaaaaa ttgctgaagc gaagggtaga 480 gcggctgctg aggcgctctc cgagttagtc gaggcgtccc agaaggccga tgcggcggcc 540 gcgggaacga cggacgcgat cgaacgcacc taccaggatg ccagagcggc cacttccgca 600 cagaccaagg ccagcggcga agccgagaat gctaatcgca atgctgccgc caccctcgcg 660 gcggtcttga gcatcgctaa ggccgcctcc ggtcaaggag gcactcgagc cgctgtcgat 720 gcagctgctg ccgctgccgc cgcagccgct ctgcatgcta aagctaacgc ggtttcgcaa 780 gctaccagca aagcagccgc tgaagctaga gtcgcggctg aggaggcagc atccgcccag 840 gcatccgcct cagcaagcgc acagctgacc gcacaattag aggagaaagt cagcgccgat 900 caacaagcag cctccgccag tactgatacc tccgctgcta tagccgaggc tgaagctgcc 960 gcgttagcgt ccaccgtcaa cgcgatcaac gacggagtgg tcatcggatt aggaaatacc 1020 gccagttctt ctgcccaagc ttccgcacag gccagtgctc tcgctcgcgc aaaaaatgcg 1080 cgccctaaaa taaagggctg gtacaaaatc ggaggcgcga cttccgcttc tgcaagcgca 1140 tcggccagcg cttccgccca gtcatcctcg caaggactgg tatactag 1188 <210> 70 <211> 1275 <212> DNA <213> Oecophylla smaragdina <400> 70 agcgaactcg tcggatcgga cgcgagcgcg acggcatctg ctgaagcgtc agcatcgtca 60 tccgcatacg gtagcaagta tggtattggt agtggtgctg tctccggtgc atcagccagc 120 gcctctgcca gcgcgtctgc tagcgcatca gccagcagtg ctcccgcgat cgaaggagta 180 aacgttggca ccggagtcag taacaccgct tccgcgtccg cagaagctct ctcccgtgga 240 ctcggcatcg gacaagcggc tgccgaagcg caagccgctg ccgctggcca agcggcgatc 300 gctgcgaaat cgtgcgcgct agcggccaag agcaccgctc aagcggttgc cctggttgag 360 aaagtggccc gcgccgaggt agatctggcc gaaagcgcga gaaaggctac aagattatcg 420 gcagaagcag ccaaggcagc ggcggaagtc gagaaggacc tcgtcggtct gagaggggct 480 gccggtaaac tgaatctggc tgcgagagcc ggttctaaag cccaagaacg cgccaacgaa 540 gactctatag aggctaacga acttgcccaa gcaacggccg ccgccggtgc cgaggctgaa 600 gccaaggcga atgccgccca ggaggcaggc gcctccgctt tggccatcgc ccaagccgcc 660 cttaacatcg agcaagagac tgttaaattg acccgccagg cccagaatac tcgtctcaga 720 tctgaaaata ttctcgccgc ggccagcaat gcccgcgcca tcgcttccgc tgaggccgag 780 gccagtagtg atttgaataa tcgtgcgaat gcagcgcgtt ccaatgcccg agctgctgcc 840 gagaccagag ccgtagctac cgaagccgct tctaccgccg agatcgcagc ttatagttca 900 tccgagaaag gcgagatcac caatcccggt cctctgccca agatcgtcag tgttaccgca 960 ggtctgaccc agaacgaaat agcgggatca ggagcggccg ctagtgctag tgccagtgct 1020 cttgccagtg ccagtgccgg tgccggtgcc ggtgcaggtg caggagccgg tgcaagtgca 1080 ggagccggtg cagttgcagg tgcaggagcc ggtgcaggag ccggtgctag tgccggagcg 1140 agtgccggag cgaatgccgg tgccggtgcc agcagtttac tcttgccgca gagtaaactc 1200 catccaatct ccaggtcttc cgcctctgcc tccgcttccg ccgaggccga agctaacagt 1260 tcggcgtatg cgtaa 1275 <210> 71 <211> 1332 <212> DNA <213> Oecophylla smaragdina <400> 71 atgaagattc cagcgatact tgcgacgtcc cttttcgtct ggggtcttgt cggcgccagc 60 gaactcgtcg gatcggacgc gagcgcgacg gcatctgctg aagcgtcagc atcgtcatcc 120 gcatacggta gcaagtatgg tattggtagt ggtgctgtct ccggtgcatc agccagcgcc 180 tctgccagcg cgtctgctag cgcatcagcc agcagtgctc ccgcgatcga aggagtaaac 240 gttggcaccg gagtcagtaa caccgcttcc gcgtccgcag aagctctctc ccgtggactc 300 ggcatcggac aagcggctgc cgaagcgcaa gccgctgccg ctggccaagc ggcgatcgct 360 gcgaaatcgt gcgcgctagc ggccaagagc accgctcaag cggttgccct ggttgagaaa 420 gtggcccgcg ccgaggtaga tctggccgaa agcgcgagaa aggctacaag attatcggca 480 gaagcagcca aggcagcggc ggaagtcgag aaggacctcg tcggtctgag aggggctgcc 540 ggtaaactga atctggctgc gagagccggt tctaaagccc aagaacgcgc caacgaagac 600 tctatagagg ctaacgaact tgcccaagca acggccgccg ccggtgccga ggctgaagcc 660 aaggcgaatg ccgcccagga ggcaggcgcc tccgctttgg ccatcgccca agccgccctt 720 aacatcgagc aagagactgt taaattgacc cgccaggccc agaatactcg tctcagatct 780 gaaaatattc tcgccgcggc cagcaatgcc cgcgccatcg cttccgctga ggccgaggcc 840 agtagtgatt tgaataatcg tgcgaatgca gcgcgttcca atgcccgagc tgctgccgag 900 accagagccg tagctaccga agccgcttct accgccgaga tcgcagctta tagttcatcc 960 gagaaaggcg agatcaccaa tcccggtcct ctgcccaaga tcgtcagtgt taccgcaggt 1020 ctgacccaga acgaaatagc gggatcagga gcggccgcta gtgctagtgc cagtgctctt 1080 gccagtgcca gtgccggtgc cggtgccggt gcaggtgcag gagccggtgc aagtgcagga 1140 gccggtgcag ttgcaggtgc aggagccggt gcaggagccg gtgctagtgc cggagcgagt 1200 gccggagcga atgccggtgc cggtgccagc agtttactct tgccgcagag taaactccat 1260 ccaatctcca ggtcttccgc ctctgcctcc gcttccgccg aggccgaagc taacagttcg 1320 gcgtatgcgt aa 1332 <210> 72 <211> 562 <212> PRT <213> Mallada signata <400> 72 Ala Val Leu Ile Ser Gly Ser Ala Ala Gly Ala Ser Ser His Asn Ala 1 5 10 15 Ala Gly Ala Ala Ala Ala Ala Arg Ala Ala Leu Gly Ala Ser Gly Ala 20 25 30 Ala Gly Leu Gly Ala Ala Ser Gly Ala Ala Arg Arg Asn Val Ala Val 35 40 45 Gly Ala Asn Gly Ala Ala Ala Ala Ser Ala Ala Ala Ala Ala Ala Arg 50 55 60 Arg Ala Gly Ala Ile Gly Leu Asn Gly Ala Ala Gly Ala Asn Val Ala 65 70 75 80 Val Ala Gly Gly Lys Lys Gly Gly Ala Ala Gly Leu Asn Ala Gly Ala 85 90 95 Gly Ala Ser Leu Val Ser Ala Ala Ala Arg Arg Asn Gly Ala Leu Gly 100 105 110 Leu Asn Gly Ala Ala Gly Ala Asn Leu Ala Ala Ala Gly Gly Lys Lys 115 120 125 Gly Gly Ala Ile Gly Leu Asn Ala Gly Ala Ser Ala Asn Val Gly Ala 130 135 140 Ala Ala Ala Lys Lys Asn Gly Ala Ile Gly Leu Asn Ser Ala Ala Ser 145 150 155 160 Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Gly Gly Ala Ile Gly Leu 165 170 175 Asn Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser 180 185 190 Gly Ala Val Gly Leu Asn Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala 195 200 205 Ala Ala Lys Lys Ser Gly Ala Val Ala Ala Asn Ser Ala Ala Ser Ala 210 215 220 Asn Ala Ala Ala Ala Ala Gln Lys Lys Ala Ala Ala Asp Ala Ala Asn 225 230 235 240 Ala Ala Ala Ser Glu Ser Ala Ala Ala Ala Ala Ala Lys Lys Ala Ala 245 250 255 Ala Val Ala Glu Asn Ala Ala Ala Thr Ala Asn Ala Ala Ser Ala Leu 260 265 270 Arg Lys Asn Ala Leu Ala Ile Ala Ser Asp Ala Ala Ala Val Arg Ala 275 280 285 Asp Ala Ala Ala Ala Ala Ala Asp Asp Ala Ala Lys Ala Asn Asn Ala 290 295 300 Ala Ser Arg Gly Ser Asp Gly Leu Thr Ala Arg Ala Asn Ala Ala Thr 305 310 315 320 Leu Ala Ser Asp Ala Ala Arg Arg Ala Ser Asn Ala Ala Thr Ala Ala 325 330 335 Ser Asp Ala Ala Thr Asp Arg Leu Asn Ala Ala Thr Ala Ala Ser Asn 340 345 350 Ala Ala Thr Ala Arg Ala Asn Ala Ala Thr Arg Ala Asp Asp Ala Ala 355 360 365 Thr Asp Ala Asp Asn Ala Ala Ser Lys Ala Ser Asp Val Ser Ala Ile 370 375 380 Glu Ala Asp Asn Ala Ala Arg Ala Ala Asp Ala Asp Ala Ile Ala Thr 385 390 395 400 Asn Arg Ala Ala Glu Ala Ser Asp Ala Ala Ala Ile Ala Ala Asp Ala 405 410 415 Ala Ala Asn Ala Ala Asp Ala Ala Ala Gln Cys Asn Asn Lys Val Ala 420 425 430 Arg Val Ser Asp Ala Leu Ala Leu Ala Ala Asn Ala Ala Ala Arg Gly 435 440 445 Ser Asp Ala Ala Ala Glu Ala Gln Asp Ala Val Ala Arg Ala Ser Asp 450 455 460 Ala Ala Ala Ala Gln Ala Asp Gly Val Ala Ile Ala Val Asn Gly Ala 465 470 475 480 Thr Ala Arg Asp Ser Ala Ile Glu Ala Ala Ala Thr Ala Gly Ala Ala 485 490 495 Gln Ala Lys Ala Ala Gly Arg Ala Gly Ala Ala Ala Ala Gly Leu Arg 500 505 510 Ala Gly Ala Ala Arg Gly Ala Ala Ala Gly Ser Ala Arg Gly Leu Ala 515 520 525 Gly Gly Leu Ala Ala Gly Ser Asn Ala Gly Ile Ala Ala Gly Ala Ala 530 535 540 Ser Gly Leu Ala Arg Gly Ala Ala Ala Glu Val Cys Ala Ala Arg Ile 545 550 555 560 Ala Leu <210> 73 <211> 588 <212> PRT <213> Mallada signata <400> 73 Met Ala Ala Ser Asn Lys Ile Ile Phe Ser Phe Leu Ala Ile Val Leu 1 5 10 15 Leu Gln Leu Ala Thr His Cys Ser Ser Thr Ala Val Leu Ile Ser Gly 20 25 30 Ser Ala Ala Gly Ala Ser Ser His Asn Ala Ala Gly Ala Ala Ala Ala 35 40 45 Ala Arg Ala Ala Leu Gly Ala Ser Gly Ala Ala Gly Leu Gly Ala Ala 50 55 60 Ser Gly Ala Ala Arg Arg Asn Val Ala Val Gly Ala Asn Gly Ala Ala 65 70 75 80 Ala Ala Ser Ala Ala Ala Ala Ala Ala Arg Arg Ala Gly Ala Ile Gly 85 90 95 Leu Asn Gly Ala Ala Gly Ala Asn Val Ala Val Ala Gly Gly Lys Lys 100 105 110 Gly Gly Ala Ala Gly Leu Asn Ala Gly Ala Gly Ala Ser Leu Val Ser 115 120 125 Ala Ala Ala Arg Arg Asn Gly Ala Leu Gly Leu Asn Gly Ala Ala Gly 130 135 140 Ala Asn Leu Ala Ala Ala Gly Gly Lys Lys Gly Gly Ala Ile Gly Leu 145 150 155 160 Asn Ala Gly Ala Ser Ala Asn Val Gly Ala Ala Ala Ala Lys Lys Asn 165 170 175 Gly Ala Ile Gly Leu Asn Ser Ala Ala Ser Ala Asn Ala Ala Ala Ala 180 185 190 Ala Ala Lys Lys Gly Gly Ala Ile Gly Leu Asn Ala Gly Ala Ser Ala 195 200 205 Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser Gly Ala Val Gly Leu Asn 210 215 220 Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser Gly 225 230 235 240 Ala Val Ala Ala Asn Ser Ala Ala Ser Ala Asn Ala Ala Ala Ala Ala 245 250 255 Gln Lys Lys Ala Ala Ala Asp Ala Ala Asn Ala Ala Ala Ser Glu Ser 260 265 270 Ala Ala Ala Ala Ala Ala Lys Lys Ala Ala Ala Val Ala Glu Asn Ala 275 280 285 Ala Ala Thr Ala Asn Ala Ala Ser Ala Leu Arg Lys Asn Ala Leu Ala 290 295 300 Ile Ala Ser Asp Ala Ala Ala Val Arg Ala Asp Ala Ala Ala Ala Ala 305 310 315 320 Ala Asp Asp Ala Ala Lys Ala Asn Asn Ala Ala Ser Arg Gly Ser Asp 325 330 335 Gly Leu Thr Ala Arg Ala Asn Ala Ala Thr Leu Ala Ser Asp Ala Ala 340 345 350 Arg Arg Ala Ser Asn Ala Ala Thr Ala Ala Ser Asp Ala Ala Thr Asp 355 360 365 Arg Leu Asn Ala Ala Thr Ala Ala Ser Asn Ala Ala Thr Ala Arg Ala 370 375 380 Asn Ala Ala Thr Arg Ala Asp Asp Ala Ala Thr Asp Ala Asp Asn Ala 385 390 395 400 Ala Ser Lys Ala Ser Asp Val Ser Ala Ile Glu Ala Asp Asn Ala Ala 405 410 415 Arg Ala Ala Asp Ala Asp Ala Ile Ala Thr Asn Arg Ala Ala Glu Ala 420 425 430 Ser Asp Ala Ala Ala Ile Ala Ala Asp Ala Ala Ala Asn Ala Ala Asp 435 440 445 Ala Ala Ala Gln Cys Asn Asn Lys Val Ala Arg Val Ser Asp Ala Leu 450 455 460 Ala Leu Ala Ala Asn Ala Ala Ala Arg Gly Ser Asp Ala Ala Ala Glu 465 470 475 480 Ala Gln Asp Ala Val Ala Arg Ala Ser Asp Ala Ala Ala Ala Gln Ala 485 490 495 Asp Gly Val Ala Ile Ala Val Asn Gly Ala Thr Ala Arg Asp Ser Ala 500 505 510 Ile Glu Ala Ala Ala Thr Ala Gly Ala Ala Gln Ala Lys Ala Ala Gly 515 520 525 Arg Ala Gly Ala Ala Ala Ala Gly Leu Arg Ala Gly Ala Ala Arg Gly 530 535 540 Ala Ala Ala Gly Ser Ala Arg Gly Leu Ala Gly Gly Leu Ala Ala Gly 545 550 555 560 Ser Asn Ala Gly Ile Ala Ala Gly Ala Ala Ser Gly Leu Ala Arg Gly 565 570 575 Ala Ala Ala Glu Val Cys Ala Ala Arg Ile Ala Leu 580 585 <210> 74 <211> 1689 <212> DNA <213> Mallada signata <400> 74 gctgtattga tttctggttc ggctgctggt gcttcctcac acaatgctgc tggtgcagct 60 gcagcagcca gagctgcctt aggcgcttct ggggctgcag gtttaggtgc tgcatctggt 120 gctgcaagaa gaaacgtagc agttggtgct aacggtgccg ccgccgctag tgctgcagct 180 gcagctgcca gacgagctgg cgctattggc ctaaatggag cagctggagc taatgtagct 240 gtcgctggtg gcaaaaaagg aggtgctgct ggattaaatg ctggcgctgg tgcttcttta 300 gtatctgcag ctgcaagacg aaatggagcc cttggactta acggtgcagc tggagcaaat 360 ctcgcagcag ctggtggcaa aaaaggaggt gctattggat taaacgctgg agcatcagcc 420 aatgttggtg ccgctgctgc caagaaaaat ggagccatag gacttaactc agctgcttca 480 gctaatgctg ccgctgccgc tgctaaaaaa ggtggagcca ttggattgaa tgctggagct 540 tcagcaaatg ctgctgctgc cgctgccaag aagagtggag ctgttggatt aaatgctgga 600 gcttctgcta acgctgctgc tgctgctgcc aagaaaagtg gagctgttgc tgccaattcc 660 gctgcttcag caaatgcagc tgctgctgca caaaagaaag ccgctgctga tgccgcaaat 720 gctgctgctt ctgaaagtgc tgctgctgct gcagccaaga aagccgccgc tgttgctgaa 780 aatgcagctg ccaccgccaa tgccgcttca gctttacgta aaaatgcatt agccattgcc 840 agtgatgcag cagctgtccg tgctgatgcc gctgccgccg ccgctgacga tgctgctaaa 900 gctaacaacg ctgcttcccg tggaagtgat ggtttaactg cccgcgccaa tgccgccact 960 ttagccagtg atgctgcccg tagagctagc aatgcagcaa cagctgccag cgatgctgcc 1020 actgaccgat tgaacgccgc caccgctgct agcaacgctg ccactgctcg tgcaaatgcc 1080 gccacacgtg ccgatgatgc cgccactgat gccgacaatg ctgcttcaaa ggccagtgat 1140 gtatcagcta ttgaagccga caacgctgca cgagctgctg atgctgatgc tatcgctacc 1200 aaccgtgccg ctgaagcaag cgatgctgct gctattgccg ctgatgccgc tgccaatgct 1260 gctgatgccg ctgcccaatg taataacaaa gttgcccgag taagtgatgc cttagctctc 1320 gccgctaatg ctgctgcccg aggatctgat gccgccgctg aagctcaaga tgctgttgcc 1380 agagcaagtg acgctgccgc tgcccaagct gatggtgttg ccattgccgt aaatggagct 1440 actgcgagag actcagcaat tgaagccgct gctactgctg gagctgccca agctaaagcc 1500 gctggacgtg ctggagctgc tgcagctggt ttaagagctg gtgccgctag aggtgctgcc 1560 gctggtagtg cccgcggtct agctggagga ttagctgcag gttccaatgc tggaatcgcg 1620 gctggtgcag cttctggatt agcaagaggc gcagctgctg aagtttgcgc agctagaata 1680 gcattgtaa 1689 <210> 75 <211> 1767 <212> DNA <213> Mallada signata <400> 75 atggcagcgt cgaacaaaat catcttcagc tttttagcta ttgttctatt acaacttgcc 60 acacactgtt catcaacagc tgtattgatt tctggttcgg ctgctggtgc ttcctcacac 120 aatgctgctg gtgcagctgc agcagccaga gctgccttag gcgcttctgg ggctgcaggt 180 ttaggtgctg catctggtgc tgcaagaaga aacgtagcag ttggtgctaa cggtgccgcc 240 gccgctagtg ctgcagctgc agctgccaga cgagctggcg ctattggcct aaatggagca 300 gctggagcta atgtagctgt cgctggtggc aaaaaaggag gtgctgctgg attaaatgct 360 ggcgctggtg cttctttagt atctgcagct gcaagacgaa atggagccct tggacttaac 420 ggtgcagctg gagcaaatct cgcagcagct ggtggcaaaa aaggaggtgc tattggatta 480 aacgctggag catcagccaa tgttggtgcc gctgctgcca agaaaaatgg agccatagga 540 cttaactcag ctgcttcagc taatgctgcc gctgccgctg ctaaaaaagg tggagccatt 600 ggattgaatg ctggagcttc agcaaatgct gctgctgccg ctgccaagaa gagtggagct 660 gttggattaa atgctggagc ttctgctaac gctgctgctg ctgctgccaa gaaaagtgga 720 gctgttgctg ccaattccgc tgcttcagca aatgcagctg ctgctgcaca aaagaaagcc 780 gctgctgatg ccgcaaatgc tgctgcttct gaaagtgctg ctgctgctgc agccaagaaa 840 gccgccgctg ttgctgaaaa tgcagctgcc accgccaatg ccgcttcagc tttacgtaaa 900 aatgcattag ccattgccag tgatgcagca gctgtccgtg ctgatgccgc tgccgccgcc 960 gctgacgatg ctgctaaagc taacaacgct gcttcccgtg gaagtgatgg tttaactgcc 1020 cgcgccaatg ccgccacttt agccagtgat gctgcccgta gagctagcaa tgcagcaaca 1080 gctgccagcg atgctgccac tgaccgattg aacgccgcca ccgctgctag caacgctgcc 1140 actgctcgtg caaatgccgc cacacgtgcc gatgatgccg ccactgatgc cgacaatgct 1200 gcttcaaagg ccagtgatgt atcagctatt gaagccgaca acgctgcacg agctgctgat 1260 gctgatgcta tcgctaccaa ccgtgccgct gaagcaagcg atgctgctgc tattgccgct 1320 gatgccgctg ccaatgctgc tgatgccgct gcccaatgta ataacaaagt tgcccgagta 1380 agtgatgcct tagctctcgc cgctaatgct gctgcccgag gatctgatgc cgccgctgaa 1440 gctcaagatg ctgttgccag agcaagtgac gctgccgctg cccaagctga tggtgttgcc 1500 attgccgtaa atggagctac tgcgagagac tcagcaattg aagccgctgc tactgctgga 1560 gctgcccaag ctaaagccgc tggacgtgct ggagctgctg cagctggttt aagagctggt 1620 gccgctagag gtgctgccgc tggtagtgcc cgcggtctag ctggaggatt agctgcaggt 1680 tccaatgctg gaatcgcggc tggtgcagct tctggattag caagaggcgc agctgctgaa 1740 gtttgcgcag ctagaatagc attgtaa 1767 <210> 76 <211> 975 <212> DNA <213> Artificial <220> <223> Honeybee silk protein (Xenospira4) open reading frame optimized for plant expression (before sub-cloned into pET14b and pVEC8) <400> 76 atggctagag aagaggttga gactagggat aagactaaga cttctactgt ggtgaagtct 60 gagaaggttg aagttgtggc tccagctaag gatgagctta agttgacttc tgagccaatt 120 ttcggaagaa gagtgggaac tggagcttct gaagtggctt cttctagtgg agaggctatt 180 gctatttctc ttggagctgg acaatcagca gcagagtctc aagctcttgc tgcttctcag 240 tctaagactg ctgctaacgc tgctattggt gcttctgagc ttactaacaa ggtggcagct 300 cttgttgctg gtgctactgg tgctcaagct agagctactg ctgcttcttc ttctgctctt 360 aaggcttctc ttgctactga agaggctgct gaagaagctg aagctgctgt tgcagatgct 420 aaagcagctg ctgagaaggc tgagtctctt gctaagaacc ttgcttctgc tagtgctaga 480 gctgctcttt cttctgagag ggctaatgag cttgctcagg ctgaaagtgc tgcagctgct 540 gaagctcaag ctaagaccgc tgctgctgcc aaagcagctg agattgctct taaggtggca 600 gagattgctg taaaagctga ggcagatgct gccgccgcag ccgtggcagc tgcaaaagct 660 agagctgtgg ctgatgcagc agccgccagg gctgctgctg ttaacgctat tgctaaggct 720 gaagaagagg cttcagctca agctgagaac gcagctggtg ttcttcaagc agctgcaagt 780 gctgctgctg agtcaagagc agcagcagcc gctgccgcag ctacttctga agcagcagct 840 gaagcaggac cacttgctgg tgaaatgaag ccaccacatt ggaagtggga gaggattcca 900 gtgaagaaag aagagtggaa aacttctaca aaagaggaat ggaaaactac taacgaagag 960 tgggaggtga agtga 975 <210> 77 <211> 324 <212> PRT <213> Artificial <220> <223> Honeybee silk protein (Xenospira4) encoded by open reading frame optimized for plant expression (without translational fusion) <400> 77 Met Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr Ser Thr 1 5 10 15 Val Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys Asp Glu 20 25 30 Leu Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly Thr Gly 35 40 45 Ala Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile Ser Leu 50 55 60 Gly Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala Ser Gln 65 70 75 80 Ser Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu Thr Asn 85 90 95 Lys Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala Arg Ala 100 105 110 Thr Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr Glu Glu 115 120 125 Ala Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala Ala Ala 130 135 140 Glu Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser Ala Arg 145 150 155 160 Ala Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala Glu Ser 165 170 175 Ala Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys Ala 180 185 190 Ala Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu Ala 195 200 205 Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val Ala 210 215 220 Asp Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys Ala 225 230 235 240 Glu Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val Leu Gln 245 250 255 Ala Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala Ala 260 265 270 Ala Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala Gly Glu 275 280 285 Met Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys Lys Glu 290 295 300 Glu Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu 305 310 315 320 Trp Glu Val Lys

Claims

적어도 일부가 꼬인 코일 구조를 갖는, 실질적으로 정제된 실크 폴리펩티드 및/또는 재조합 실크 폴리펩티드.
제1항에 있어서, 상기 꼬인 코일 구조를 갖는 폴리펩티드의 일부가 헵타드(heptad) 서열 abcdefg를 10 카피 이상 포함하며, 위치 a 및 d에 있는 아미노산 중 25% 이상이 알라닌 잔기인 폴리펩티드.
제1항에 있어서, 상기 꼬인 코일 구조를 갖는 폴리펩티드의 일부가 헵타드 서열 abcdefg를 10 카피 이상 포함하며, 위치 a, d 및 e에 있는 아미노산 중 25% 이상이 알라닌 잔기인 폴리펩티드.
제1항 내지 제3항 중 어느 한 항에 있어서,

i) 서열 번호 1, 서열 번호 2, 서열 번호 22, 서열 번호 23, 서열 번호 40, 서열 번호 41, 서열 번호 56 및 서열 번호 57 중 어느 하나에 제시된 아미노산 서열;

ii) 서열 번호 1, 서열 번호 2, 서열 번호 22, 서열 번호 23, 서열 번호 40, 서열 번호 41, 서열 번호 56 및 서열 번호 57 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및

iii) i) 또는 ii)의 생물학적 활성 단편

으로부터 선택되는 서열을 포함하는 폴리펩티드.
제1항 내지 제3항 중 어느 한 항에 있어서,

i) 서열 번호 3, 서열 번호 4, 서열 번호 24, 서열 번호 25, 서열 번호 42, 서열 번호 43, 서열 번호 58 및 서열 번호 59 중 어느 하나에 제시된 아미노산 서열;

ii) 서열 번호 3, 서열 번호 4, 서열 번호 24, 서열 번호 25, 서열 번호 42, 서열 번호 43, 서열 번호 58 및 서열 번호 59 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및

iii) i) 또는 ii)의 생물학적 활성 단편

으로부터 선택되는 서열을 포함하는 폴리펩티드.
제1항 내지 제3항 중 어느 한 항에 있어서,

i) 서열 번호 5, 서열 번호 6, 서열 번호 26, 서열 번호 27, 서열 번호 44, 서열 번호 45, 서열 번호 60 및 서열 번호 61 중 어느 하나에 제시된 아미노산 서열;

ii) 서열 번호 5, 서열 번호 6, 서열 번호 26, 서열 번호 27, 서열 번호 44, 서열 번호 45, 서열 번호 60 및 서열 번호 61 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및

iii) i) 또는 ii)의 생물학적 활성 단편

으로부터 선택되는 서열을 포함하는 폴리펩티드.
제1항 내지 제3항 중 어느 한 항에 있어서,

i) 서열 번호 7, 서열 번호 8, 서열 번호 28, 서열 번호 29, 서열 번호 46, 서열 번호 47, 서열 번호 62 및 서열 번호 63 중 어느 하나에 제시된 아미노산 서열;

ii) 서열 번호 7, 서열 번호 8, 서열 번호 28, 서열 번호 29, 서열 번호 46, 서열 번호 47, 서열 번호 62 및 서열 번호 63 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및

iii) i) 또는 ii)의 생물학적 활성 단편

으로부터 선택되는 서열을 포함하는 폴리펩티드.
제1항 내지 제3항 중 어느 한 항에 있어서,

i) 서열 번호 72 또는 서열 번호 73에 제시된 아미노산 서열;

ii) 서열 번호 72 및/또는 서열 번호 73에 30% 이상 일치하는 아미노산 서열; 및

iii) i) 또는 ii)의 생물학적 활성 단편

으로부터 선택되는 서열을 포함하는 폴리펩티드.
i) 서열 번호 9, 서열 번호 10 및 서열 번호 30 중 어느 하나에 제시된 아미노산 서열;

ii) 서열 번호 9, 서열 번호 10 및 서열 번호 30 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및

iii) i) 또는 ii)의 생물학적 활성 단편

으로부터 선택되는 서열을 포함하는, 실질적으로 정제된 실크 폴리펩티드 및/또는 재조합 실크 폴리펩티드.
제1항 내지 제9항 중 어느 한 항에 있어서, 벌목(Hymenoptera) 또는 풀잠자리목(Neuroptera) 종으로부터 정제될 수 있는 폴리펩티드.
제10항에 있어서, 상기 벌목 종이 아피스 멜리페라(Apis mellifera), 오에코필라 스마라그디나(Oecophylla smaragdina), 미르메시아 포리카타(Myrmecia foricata) 또는 봄부스 테레스트리스(Bombus terrestris)인 폴리펩티드.
제10항에 있어서, 상기 풀잠자리목 종이 말라다 시그나타(Mallada signata)인 폴리펩티드.
제1항 내지 제12항 중 어느 한 항에 있어서, 1종 이상의 다른 폴리펩티드에 융합되어 있는 폴리펩티드.
적어도 일부가 꼬인 코일 구조를 갖는, 실크 폴리펩티드를 코딩하는 단리된 폴리뉴클레오티드 및/또는 외인성 폴리뉴클레오티드.
제14항에 있어서,

i) 서열 번호 11, 서열 번호 12, 서열 번호 31, 서열 번호 32, 서열 번호 48, 서열 번호 49, 서열 번호 64 및 서열 번호 65 중 어느 하나에 제시된 뉴클레오티드 서열;

ii) 제1항 내지 제4항 또는 제10항 내지 제13항 중 어느 한 항에 따른 폴리펩티드를 코딩하는 뉴클레오티드 서열;

iii) 서열 번호 11, 서열 번호 12, 서열 번호 31, 서열 번호 32, 서열 번호 48, 서열 번호 49, 서열 번호 64 및 서열 번호 65 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및

iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열

로부터 선택되는 서열을 포함하는 폴리뉴클레오티드.
제14항에 있어서,

i) 서열 번호 13, 서열 번호 14, 서열 번호 33, 서열 번호 34, 서열 번호 50, 서열 번호 51, 서열 번호 66 및 서열 번호 67 중 어느 하나에 제시된 뉴클레오티드 서열;

ii) 제1항 내지 제3항, 제5항 또는 제10항 내지 제13항 중 어느 한 항에 따른 폴리펩티드를 코딩하는 뉴클레오티드 서열;

iii) 서열 번호 13, 서열 번호 14, 서열 번호 33, 서열 번호 34, 서열 번호 50, 서열 번호 51, 서열 번호 66 및 서열 번호 67 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및

iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열

로부터 선택되는 서열을 포함하는 폴리뉴클레오티드.
제14항에 있어서,

i) 서열 번호 15, 서열 번호 16, 서열 번호 35, 서열 번호 36, 서열 번호 52, 서열 번호 53, 서열 번호 68 및 서열 번호 69 중 어느 하나에 제시된 뉴클레오티드 서열;

ii) 제1항 내지 제3항, 제6항 또는 제10항 내지 제13항 중 어느 한 항에 따른 폴리펩티드를 코딩하는 뉴클레오티드 서열;

iii) 서열 번호 15, 서열 번호 16, 서열 번호 35, 서열 번호 36, 서열 번호 52, 서열 번호 53, 서열 번호 68 및 서열 번호 69 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및

iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열

로부터 선택되는 서열을 포함하는 폴리뉴클레오티드.
제14항에 있어서,

i) 서열 번호 17, 서열 번호 18, 서열 번호 37, 서열 번호 38, 서열 번호 54, 서열 번호 55, 서열 번호 70, 서열 번호 71 및 서열 번호 76 중 어느 하나에 제시된 뉴클레오티드 서열;

ii) 제1항 내지 제3항, 제7항 또는 제10항 내지 제13항 중 어느 한 항에 따른 폴리펩티드를 코딩하는 뉴클레오티드 서열;

iii) 서열 번호 17, 서열 번호 18, 서열 번호 37, 서열 번호 38, 서열 번호 54, 서열 번호 55, 서열 번호 70, 서열 번호 71 및 서열 번호 76 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및

iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열

로부터 선택되는 서열을 포함하는 폴리뉴클레오티드.
제14항에 있어서,

i) 서열 번호 74 또는 서열 번호 75에 제시된 뉴클레오티드 서열;

ii) 제1항 내지 제3항, 제8항 또는 제10항 내지 제13항 중 어느 한 항에 따른 폴리펩티드를 코딩하는 뉴클레오티드 서열;

iii) 서열 번호 74 및/또는 서열 번호 75에 30% 이상 일치하는 뉴클레오티드 서열; 및

iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열

로부터 선택되는 서열을 포함하는 폴리뉴클레오티드.
i) 서열 번호 19, 서열 번호 20, 서열 번호 21 및 서열 번호 39 중 어느 하나에 제시된 뉴클레오티드 서열;

ii) 제1항 내지 제3항 또는 제9항 내지 제13항 중 어느 한 항에 따른 폴리펩티드를 코딩하는 뉴클레오티드 서열;

iii) 서열 번호 19, 서열 번호 20, 서열 번호 21 및 서열 번호 39 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및

iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열

로부터 선택되는 서열을 포함하는, 단리된 폴리뉴클레오티드 및/또는 외인성 폴리뉴클레오티드.
제14항 내지 제20항 중 어느 한 항에 따른 폴리뉴클레오티드 1종 이상을 포함하는 벡터.
제21항에 있어서, 발현 벡터인 벡터.
제14항 내지 제20항 중 어느 한 항에 따른 폴리뉴클레오티드 1종 이상 및/또는 제21항 또는 제22항의 벡터 1종 이상을 포함하는 숙주 세포.
제23항에 있어서, 박테리아, 효모 또는 식물 세포인 숙주 세포.
제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드를 제조하는 방법으로서, 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드가 발현될 수 있도록 하는 조건하에서 제23항 또는 제24항에 따른 숙주 세포, 또는 제22항의 벡터를 배양하는 단계 및 발현된 폴리펩티드를 회수하는 단계를 포함하는 방법.
제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 1종 이상을 코딩하는 외인성 폴리뉴클레오티드를 포함하는 트랜스제닉(transgenic) 식물.
제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 1종 이상을 코딩하는 외인성 폴리뉴클레오티드를 포함하는, 인간을 제외한 트랜스제닉 동물.
제1항 내지 제12항 중 어느 한 항에 따른 폴리펩티드에 특이적으로 결합하는 항체.
제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 1종 이상을 포함하는 실크 섬유.
제29항에 있어서, 상기 폴리펩티드 중 적어도 일부가 가교 결합된 것인 섬유.
제30항에 있어서, 상기 폴리펩티드의 리신 잔기 중 적어도 일부가 가교 결합된 것인 섬유.
제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 2종 이상을 포함하는 공중합체.
제32항에 있어서, 제4항의 폴리펩티드, 제5항의 폴리펩티드, 제6항의 폴리펩티드 및 제7항의 폴리펩티드를 포함하는 공중합체.
제33항에 있어서, 제9항의 폴리펩티드를 추가로 포함하는 공중합체.
제33항 또는 제34항에 있어서, 상기 폴리펩티드 중 적어도 일부가 가교 결합된 것인 공중합체.
제35항에 있어서, 상기 폴리펩티드의 리신 잔기 중 적어도 일부가 가교 결합된 것인 공중합체.
제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 1종 이상, 제29항 내지 제31항 중 어느 한 항에 따른 실크 섬유 및/또는 제32항 내지 제36항 중 어느 한 항에 따른 공중합체를 포함하는 제품.
제37항에 있어서, 개인 관리 제품, 직물, 플라스틱 및 생체 의학 제품으로 구성된 군으로부터 선택되는 제품.
제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 1종 이상, 제29항 내지 제31항 중 어느 한 항에 따른 실크 섬유 및/또는 제32항 내지 제36항 중 어느 한 항에 따른 공중합체 및 1종 이상의 허용 가능한 담체를 포함하는 조성물.
제39항에 있어서, 약물을 추가로 포함하는 조성물.
제39항에 있어서, 의약, 의료 장치 또는 미용화장품(cosmetic)으로서 사용하기 위한 조성물.
제14항 내지 제20항 중 어느 한 항에 따른 폴리뉴클레오티드 1종 이상 및 허용 가능한 담체 1종 이상을 포함하는 조성물.
질병 치료 또는 예방용 약물 및 약제학적으로 허용 가능한 담체를 포함하는 조성물을 투여하는 단계를 포함하는 질병을 치료 또는 예방하는 방법으로서, 상기 약제학적으로 허용 가능한 담체는 제1항 내지 제13항 중 어느 한 항에 따른 폴리펩 티드 1종 이상, 제29항 내지 제31항 중 어느 한 항에 따른 실크 섬유 및/또는 제32항 내지 제36항 중 어느 한 항에 따른 공중합체로부터 선택되는 것인 방법.
질병 치료 또는 예방용 약제의 제조를 위한, 제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 1종 이상, 제29항 내지 제31항 중 어느 한 항에 따른 실크 섬유 및/또는 제32항 내지 제36항 중 어느 한 항에 따른 공중합체 및 약물의 용도.
제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 1종 이상, 제14항 내지 제20항 중 어느 한 항에 따른 폴리뉴클레오티드 1종 이상, 제21항 또는 제22항의 벡터 1종 이상, 제29항 내지 제31항 중 어느 한 항에 따른 실크 섬유 1종 이상 및/또는 제32항 내지 제36항 중 어느 한 항에 따른 공중합체를 포함하는 키트.