KR20180012247A - 리간드 유도성 폴리펩티드 결합제 시스템 - Google Patents

리간드 유도성 폴리펩티드 결합제 시스템 Download PDF

Info

Publication number
KR20180012247A
KR20180012247A KR1020177030658A KR20177030658A KR20180012247A KR 20180012247 A KR20180012247 A KR 20180012247A KR 1020177030658 A KR1020177030658 A KR 1020177030658A KR 20177030658 A KR20177030658 A KR 20177030658A KR 20180012247 A KR20180012247 A KR 20180012247A
Authority
KR
South Korea
Prior art keywords
polypeptide
seq
leu
alkyl
amino acid
Prior art date
Application number
KR1020177030658A
Other languages
English (en)
Inventor
대니얼 피. 베드나리크
찰스 씨. 리드
비노드바부 쿠렐라
Original Assignee
인트렉손 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인트렉손 코포레이션 filed Critical 인트렉손 코포레이션
Publication of KR20180012247A publication Critical patent/KR20180012247A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6845Methods of identifying protein-protein interactions in protein mixtures
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/01DNA viruses
    • C07K14/03Herpetoviridae, e.g. pseudorabies virus
    • C07K14/035Herpes simplex virus I or II
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43563Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70567Nuclear receptors, e.g. retinoic acid receptor [RAR], RXR, nuclear orphan receptors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/71Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
    • C07K2319/715Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16 containing a domain for ligand dependent transcriptional activation, e.g. containing a steroid receptor domain

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Toxicology (AREA)
  • Virology (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Cell Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Insects & Arthropods (AREA)
  • High Energy & Nuclear Physics (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

본 발명은 신규의 리간드 유도성 폴리펩티드 결합 시스템 및 세포 신호전달 경로 및 기타의 세포간 및 세포외 단백질-단백질 상호작용을 조정하는 방법에 관한 것이다.

Description

리간드 유도성 폴리펩티드 결합제 시스템 {LIGAND INDUCIBLE POLYPEPTIDE COUPLER SYSTEM}
서열 목록
본원은 ASCII 포맷으로 전자제출 및 그의 내용 전체를 본원에 참조로서 인용한 서열목록을 포함한다. 2016년 3월 24일에 생성된 상기 ASCII 사본의 파일명은 0100-0013 WO1_SL.txt이며 크기는 192,837 바이트이다.
본 발명의 분야는 세포 및 분자생물학이다. 특히, 본 발명의 분야는 세포 신호전달 및 유전공학적 방법이나 그의 변형이다. 보다 상세하게는, 본 발명은 신규의 핵 수용체-기반 리간드 유도성 폴리펩티드 결합제 및 숙주 세포내 단백질-단백질 상호작용의 조정방법에 관한 것이다.
유전공학 및 의학 분야에서, 세포 신호발생 경로의 정확한 제어 및 조정은 중요한 가치가 있으며, 발생 및 기타 생리학적 과정(가령, 병리학적 조건)을 연구, 조작 및 제어하기 위한 툴에 대해 연구한다. 신호발생 경로는 증식, 분화 및 세포자살을 포함한 광범위한 세포과정과 기능을 조절하는 것으로 공지되어 있다. 신호발생 경로는 다수의 메커니즘, 예를 들어 번역후 변형(가령, 포스포릴화, 유비퀴틴화 등) 및 단백질-단백질 상호작용 등을 통해 조절할 수 있다. 신호발생 경로 활성화나 조절을 위한 통상적인 하나의 메커니즘으로는 단백질-단백질 상호작용을 거쳐 다중-단백질 복합체(가령, 이량체, 삼량체 및 올리고머)의 형성을 이용하는 것이 있다. 이러한 착체는 동일한 단백질의 복수의 복제물(동종-복합체) 또는 서로 다른 단백질의 복제물(이종-복합체)를 포함할 수 있다. 단백질-단백질 상호작용의 유도 및 복합체의 형성은 경우에 따라 리간드를 하나 이상의 단백질 일원(가령, 수용체 분자)에 결합시켜 트리거된다. 이와 같은 수많은 세포 신호발생 경로가 발견 및 특징화되었으나, 약제학적 수용가능하고 이용가능한 활성화 리간드를 이용하는 신속하고, 효율적이며, 신뢰할 수 있는 방식으로 위와 같은 경로를 타겟화 및 조작할 수 있는 기술이 여전히 필요하다.
세포 신호발생 경로의 조정 시스템이 상대적으로 희귀한 것과는 대조적으로, 전사인자들 간의 단백질-단백질 상호작용의 유도를 통해 유전자 발현을 조절하는 방법이 개발되어 이용되고 있다. 단백질 합성의 제 1단계에서 필요한 RNA를 생성하도록 유전자 발현을 트리거하기 위하여, 전사 활성체는 유전자 전사를 제어하는 프로모터(촉진 유전자)에 근접해야 한다. 전형적으로, 전사 활성체 자체는 유전자의 프로모터 영역에 존재하는 DNA 결합 부위에 결합되는 하나 이상의 DNA 결합 도메인을 가진 단백질과 조합된다. 따라서, 유전자 발현이 일어날 경우, DNA 결합 도메인 및 DNA 결합 도메인으로부터 적절한 간격을 두고 위치한 활성화 도메인은 유전자의 프로모터 영역의 정확한 위치로 이동해야 한다.
단백질-단백질 상호작용을 유도하는 하나의 방법은 FK506, 라파마이신 및 시클로스포린 A 같이, 면역글로불린, FKBP12, 시클로필린 등에 결합될 수 있는 면역억제 분자에 의존한다. FK506을 2종의 단백질 각각에 제공하거나, 단백질 중 하나에는 FK506을 나머지 하나에는 시클로스포린 A를 제공함으로써, 이들 두 단백질을 화합시키는 보편적인 전략을 고안하였다. FK506(FK1012) 또는 FK506-시클로스포린(FKCsA)의 융합으로 형성된 화합물의 합성 동종이량체를 사용하여 이들 분자의 이량화를 유도할 수 있다(Spencer et al., 1993, Science 262: 1019-24; Belshaw et al., 1996 Proc Natl Acad Sci USA 93: 4604-7). FKBP12에 융합된 Gal4 DNA 결합 도메인, 시클로필린에 융합된 VP16 활성체 도메인, 및 FKCsA 화합물을 사용하여 Gal4 결합 부위를 포함한 프로모터의 제어하에 정보제공 유전자의 이종이량화 및 활성화를 나타냈다. 불행히도, 이 시스템은 원치않는 부작용을 수반할 수 있는 면역억제제를 포함하므로, 다양한 포유동물의 응용분야에 사용하는 것은 제한적이다.
스테로이드 호르몬 수용체 시스템 같은 진핵세포 전사 활성화 시스템 역시 유전자 발현의 조절에 이용되어 왔다. 스테로이드 호르몬 수용체는 핵 수용체 서브패밀리의 일원으로서 척추동물과 무척추동물의 세포에서 발견된다. 불행히도, 유전자 발현 조절용 수용체를 특히 식물 및 포유동물 내에서 활성화시키는 스테로이드 화합물의 용도는, 이러한 유기체의 기타 다른 많은 생물학적 경로를 동반하는 탓에 제한적이다. 이러한 난점을 극복하고자 곤충 엑디손 수용체(EcR)를 사용하여 또 다른 시스템을 개발했다.
곤충의 성장, 탈피 및 발달은 엑디손 스테로이드 호르몬(탈피 호르몬) 및 유충 호르몬에 의해 조절된다(Dhadialla, et al., 1998, Annu. Rev. Entomol. 43: 545-569). 곤충 엑디손의 분자 타겟은 적어도 엑디손 수용체(EcR)와 초기문 단백질(USP)로 구성된다. EcR은 서명 DNA와 리간드 결합 도메인, 및 활성화 도메인을 특징으로 하는 핵 스테로이드 수퍼 패밀리의 일원이다(Koelle et al. 1991, Cell, 67:59-77). EcR 수용체는 포나스테론 A, 무리스테론 A 같은 다수의 스테로이드 화합물에 대해 반응성이다. 시판 중인 살충제, 테부페노자이드 및 메톡시페노자이드 등을 포함하여, 엑디스테로이드 길항제 활성을 갖는 비-스테로이드성 화합물도 또한 기술되었다(국제특허출원 PCT/EP96/00686 및 US 특허 제 5,530,028호 참조, 이들 각각의 내용 전체를 본원에 참조로서 인용한다). 양쪽 유사체 모두 다른 유기체에서 뛰어난 안전 프로파일을 갖는다.
곤충 엑디손 수용체(EcR)는 초기문(USP)으로 이종이량화하고, 포유동물 레티노이드 X 수용체(RXR)의 곤충 동종체는 엑디스테로이드를 그의 리간드 결합을 통해 결합시키고, 또한 엑디손 수용체 반응 요소를 결합시켜 엑디소 반응 유저자의 전사를 활성화한다(Riddiford et al., 2000).
EcR은 5개의 모듈 도메인, 즉, A/B(분산), C(DNA 결합, 이종이량화), D(힌지, 이종이량화), E(리간드 결합, 이종이량화 및 분산) 및 F(분산) 도메인을 갖는다. A/B, C 및 E 와 같은 이들 일부 도메인은 다른 단백질에 융합될 때 자신의 기능을 유지한다. EcR은 핵 수용체 수퍼패밀리의 일원이며 제 1서브패밀리의 H 그룹(이후 "H 그룹 핵 수용체"라고 칭함)으로 분류된다. 각 그룹의 일원은 E(리간드 결합) 도메인에서 40 내지 60%의 아미노산 동일성을 공유한다(Laudet et al. 핵 수용체 서브패밀리의 통합 명명 시스템, 1999; Cell 97: 161-163). 엑디손 수용체에 추가하여, 핵 수용체 제 1서브패밀리 H 그룹의 다른 일원들은: 유비퀴틴 수용체(UR), 오르판 수용체 1(OR-1), 스테로이드 호르몬 핵 수용체 1(NER-1), RXR 상호작용 단백질-15(RIP-15), 간 x 수용체 β(LXRβ), 스테로이드 호르몬 수용체 유사 단백질(RLD-1), 간 x 수용체(LXR), 간 x 수용체 α(LXRα), 파르네소이드 x 수용체(FXR), 수용체 상호작용 단백질 14(RIP-14), 및 파르네솔 수용체(HRR-1) 등을 포함한다.
포유동물 세포에서. 곤충 엑디손 수용체(EcR)를 포유동물 레티노이드 X 수용체(RXR)로 이종이량화할 수 있음을 보였으며, 이는 리간드 의존 방식으로 타겟 유전자의 발현을 조절하는데 사용할 수 있다. 그러나, 이러한 발현 시스템 성분들을 단백질-단백질 상호작용의 조절 또는, 예컨대, 세포외 및 세포내 신호전달 경로와 단백질-단백질 조합의 조절, 제어, 유도 또는 억제에 사용하는 것은 고려되거나 입증 또는 응용된 적이 없었다.
다른 유전자 발현 시스템이 개발되었으나, 식물과 동물 양측에서 단백질-단백질 상호작용을 통해 세포 신호발생 경로를 정확히 조정할 수 있게 하는 시스템이 여전히 필요하다.
다양한 종류의 공보를 본원에서 인용하였으며, 그의 개시 내용 전체를 본원에 참조로서 인용한다.
일부 구현예에서, 본 발명은 핵 수용체 단백질의 절편이나 도메인을 포함한 제 1비-자연발생 폴리펩티드 및 핵 수용체 단백질의 또 다른 절편이나 도메인을 포함한 제 2비-자연발생 폴리펩티드를 포함하는 2개의 폴리펩티드로서, 제 1폴리펩티드는 활성화 리간드를 결합시키며, 제 2폴리펩티드는 활성화 리간드의 존재시에, 제 1폴리펩티드와 조합되고, 제 1 및 제 2폴리펩티드의 활성화 리간드 유도된 조합(association)이 기능적, 생물학적 또는 세포 신호전달 조건을 형성하도록 제 1 및 제 2폴리펩티드 각각은 이종유래 아미노산이나 폴리펩티드 서열을 포함한다.
본 발명의 어떤 구현예에서, 하나, 또는 양쪽 핵 수용체 단백질 절편이나 도메인이 절지동물 핵 수용체 아미노산 서열을 포함한다.
본 발명의 일부 구현예에서, 하나, 또는 양쪽 핵 수용체 단백질 절편이나 도메인이 H그룹 핵 수용체 아미노산 서열을 포함한다.
본 발명의 어떤 구현예에서, 제 1 폴리펩티드의 핵 수용체 아미노산 서열은 엑디손 수용체(EcR) 리간드 결합 도메인, 폴리펩티드 절편, 또는 그의 치환 돌연변이체를 포함한다.
본 발명의 일부 구현예에서, 제 2폴리펩티드 핵 수용체 단백질 절편이나 도메인은 포유동물 핵 수용체 아미노산 서열을 포함한다.
본 발명의 어떤 구현예에서, 포유동물 핵 수용체 단백질 절편이나 도메인은 RXR 핵 수용체 폴리펩티드 절편이나 그의 치환 돌연변이체를 포함한다.
본 발명의 일부 구현예에서, 제 2폴리펩티드 핵 수용체 단백질 절편이나 도메인은 무척추동물 및 포유동물 핵 수용체 아미노산 서열의 키메라, 또는 그의 치환 돌연변이체를 포함한다.
본 발명의 어떤 구현예에서, 제 2 폴리펩티드 핵 수용체 단백질 절편이나 도메인은 무척추동물 USP(RXR 동종체) 및 포유동물 RXR 핵 수용체 아미노산 서열의 키메라, 또는 그의 치환 돌연변이체를 포함한다.
일부 구현예에서, 본 발명은 리간드 유도성 폴리펩티드 결합(LIPC) 시스템으로서, a) 절지동물 핵 수용체 단백질의 절편이나 도메인을 포함한 제 1비-자연발생 폴리펩티드; 및 b) 절지동물 및/또는 포유동물 핵 수용체 단백질의 절편이나 도메인을 포함한 제 2비-자연발생 폴리펩티드를 포함하고, 제 1 및 제 2폴리펩티드는 활성화 리간드와 접촉하여 활성화된 기능적, 생물학적 또는 세포 신호전달 조건을 형성하는 추가의 이종유래 서열을 포함한다.
본 발명의 일부 구현예에서, LIPC의 하나, 또는 양쪽의 핵 수용체 단백질 절편이나 도메인은 H 그룹 핵 수용체 아미노산 서열을 포함한다.
본 발명의 어떤 구현예에서, LIPC의 제 1폴리펩티드는 엑디손 수용체(EcR) 리간드 결합 도메인, 폴리펩티드 절편, 또는 그의 치환 돌연변이체를 포함한다.
본 발명의 일부 구현예에서, LIPC의 제 2폴리펩티드는 포유동물 핵 수용체 아미노산 서열을 포함한다.
본 발명의 어떤 구현예에서, LIPC의 제 2 폴리펩티드는 RXR 핵 수용체 폴리펩티드 절편, 또는 그의 치환 돌연변이체를 포함한다.
본 발명의 일부 구현예에서, LIPC의 제 2폴리펩티드는 무척추동물 및 포유동물 핵 수용체 아미노산 서열의 키메라, 또는 그의 치환 돌연변이체를 포함한다.
본 발명의 어떤 구현예에서, LIPC의 제 2폴리펩티드는 무척추동물USP(RXR 동종체) 및 포유동물 RXR 핵 수용체 아미노산 서열의 키메라, 또는 그의 치환 돌연변이체를 포함한다.
본 발명의 일부 구현예에서, LIPC를 포함한 본 발명의 제 1 및 제 2폴리펩티드의 핵 수용체 단백질 절편은 가문비나무 모충(Choristoneura fumiferana) EcR("CfEcR") LBD, 딱정벌레(Tenebrio molitor) EcR("TmEcR") LBD, 박각시나방(Manduca sexta) EcR("MsEcR") LBD, 담배나방(Heliothies virescens) EcR("HvEcR") LBD, 깔따구(Chironomus tentans) EcR("CfEcR") LBD, 누에나방(Bombyx mori) EcR("BmEcR") LBD, 초파리(Drosophila melanogaster) EcR("DmEcR") LBD, 모기(Aedes aegypti) EcR("AaEcR") LBD, 검정파리(Lucilia capitata) EcR("LcEcR") LBD, 검정파리(Lucilia cuprina) EcR("LucEcR") LBD, 지중해 초파리(Ceratitis capitata) EcR("CcEcR") LBD, 메뚜기(Locusta migratoria) EcR("LmEcR") LBD, 진딧물(Myzus persicae) EcR("MpEcR") LBD, 농게(Celuca pugilator) EcR("CpEcR") LBD, 가루이(Bamecia argentifoli) EcR(BaEcR) LBD, 매미충(Nephotetix cincticeps) EcR(NcEcR) LBD, 및 참진드기(Amblyomma americanum) EcR("AmaEcR") LBD로 이루어진 군에서 선택된 엑디손 수용체 폴리펩티드로부터 유래된다.
본 발명의 어떤 구현예에서, LIPC를 포함한 본 발명의 제 1 및 제 2폴리펩티드의 핵 수용체 단백질 절편은 핵산 서열 SEQ ID NO: 1(CfEcR-DEF), SEQ ID NO: 2(CfEcR-CDEF), SEQ ID NO: 3(DmEcR-DEF), SEQ ID NO: 4(TmEcR-DEF) SEQ ID NO: 5(AmaEcR-DEF)를 포함하는 폴리뉴클레오티드, 또는 실질적으로 그와 동일한 기능성 변이체를 코딩하는 폴리뉴클레오티드에 의해 코딩되는 엑디손 수용체 폴리펩티드로부터 유래된다.
본 발명의 어떤 구현예에서, 엑디손 수용체 폴리펩티드 중 하나 이상은 폴리펩티드 서열SEQ ID NO: 6(CfEcR-DEF), SEQ ID NO: 7(DmEcR-DEF), SEQ ID NO: 8(CfEcR-CDEF), SEQ ID NO: 9(TmEcR-DEF), SEQ ID NO: 10(AmaEcR-DEF) 또는 실질적으로 그와 동일한 폴리펩티드 서열을 포함한다.
본 발명의 어떤 구현예에서, 엑디손 수용체 폴리펩티드 서열은 약 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 상응하는 야생형 엑디손 수용체 폴리펩티드에 대한 치환 돌연변이를 포함한다.
본 발명의 어떤 구현예에서, 엑디손 수용체 폴리펩티드는 아미노산 잔사가 치환되는 결과를 가져오는 코돈 돌연변이를 포함한 폴리뉴클레오티드에 의해 코딩되고, 이때의 아미노산 잔사는 a) SEQ ID NO: 17의 아미노산 잔사 20, 21, 48, 51, 52, 55, 58, 59, 61, 62, 92, 93, 95, 96, 107, 109, 110, 120, 123, 125, 175, 218, 219, 223, 230, 234 또는 238, b) SEQ ID NO: 17의 아미노산 잔사 95 및 110, c) SEQ ID NO: 17의 아미노산 잔사 218 및 219, d) SEQ ID NO: 17의 아미노산 잔사 107 및 175, e) SEQ ID NO: 17의 아미노산 잔사 127 및 175, f) SEQ ID NO: 17의 아미노산 잔사 107 및 127, g) SEQ ID NO: 17의 아미노산 잔사 107, 127 및 175, h) SEQ ID NO: 17의 아미노산 잔사 52, 107 및 175, i) SEQ ID NO: l7의 아미노산 잔사 96, 107 및 175, j) SEQ ID NO: l7의 아미노산 잔사 107, 110 및 175, k) SEQ ID NO: 18의 아미노산 잔사 107, 121, 213 또는 217, 또는 l) SEQ ID NO: 19의 아미노산 잔사 91 또는 105와 동등하거나 유사한 위치에 있다.
본 발명의 어떤 구현예에서, 치환 돌연변이는 a) SEQ ID NO: 17의 E20A, Q21A, F48A, I51A, T52A, T52V, T52I, T52L, T55A, T58A, V59A, L61A, I62A, M92A, M93A, R95A, V96A, V96T, V96D, V96M, V107I, F109A, A110P, A110S, A110M, A110L, Y120A, A123F, M125A, R175E, M218A, C219A, L223A, L230A, L234A, W238A, R95A/A110P, M218A/C219A, V107I/R175E, Y127E/R175E, V107I/Y127E, V107I/Y127E/R175E, T52V/V107I/R175E, V96A/V107I/R175E, T52A/V107I/R175E, V96T/V107I/R175E 또는 V107I/A110P/R175E 치환 돌연변이, b) SEQ ID NO: 18의 A107P, G121R, G121L, N213A, C217A 또는 C217S 치환 돌연변이, 및 c) SEQ ID NO: 19의 G91A 또는 A105P 치환 돌연변이로 이루어진 군에서 선택된다.
본 발명의 일부 구현예에서, 레티노이드 X 수용체 폴리펩티드는 척추동물 레티노이드 X 수용체 폴리펩티드, 무척추동물 레티노이드 X 수용체 폴리펩티드(USP), 및 척추동물과 무척추동물 RXR로부터 얻은 폴리펩티드를 포함한 키메릭 레티노이드X 폴리펩티드로 이루어진 군에서 선택된 폴리펩티드를 포함한다.
본 발명의 어떤 구현예에서, 키메릭 레티노이드 X 수용체 폴리펩티드는 척추동물종 레티노이드 X 수용체 폴리펩티드 절편, 무척추동물종 레티노이드 X 수용체 폴리펩티드 절편 및 비-쌍시류/비-인시류 무척추동물종 레티노이드 X 수용체 폴리펩티드 절편으로 이루어진 군에서 선택된 2개 이상의 상이한 레티노이드 X 수용체 폴리펩티드 절편을 포함한다.
본 발명의 일부 구현예에서, 키메릭 레티노이드 X 수용체 폴리펩티드는 EF-도메인 제 1나선 1, EF-도메인 제 2나선, EF-도메인 제 3나선, EF-도메인 제 4나선, EF-도메인 제 5나선, EF-도메인 제 6나선, EF-도메인 제 7나선, EF-도메인 제 8나선, EF-도메인 제 9나선, EF-도메인 제 10나선, EF-도메인 제 11나선, EF-도메인 제 12나선, F-도메인, 및 EF-도메인β-플리트 시트로 이루어진 군에서 선택된 하나 이상의 레티노이드 X 수용체 폴리펩티드 절편을 포함한 레티노이드 X 수용체 폴리펩티드를 포함하고, 이 레티노이드X 수용체 폴리펩티드 절편은 상이한 종의 레티노이드 X 수용체 폴리펩티드 또는 제 2레티노이드 X 수용체 폴리펩티드 절편과는 상이한 이형 레티노이드 X 수용체 폴리펩티드로부터 얻는다.
본 발명의 어떤 구현예에서, 키메릭 레티노이드 X 수용체 폴리펩티드는 a) SEQ ID NO: 11, b) SEQ ID NO: 12의 뉴클레오티드 1 내지 348 및 SEQ ID NO: 13의 뉴클레오티드 268 내지 630, c) SEQ ID NO: 12의 뉴클레오티드 1 내지 408 및 SEQ ID NO: 13의 뉴클레오티드 337 내지 630, d) SEQ ID NO: 12의 뉴클레오티드 1465 및 SEQ ID NO: 13의 뉴클레오티드 403 내지 630, e) SEQ ID NO: 12의 뉴클레오티드 1 내지 555 및SEQ ID NO: 13의 뉴클레오티드 490 내지 630, f) SEQ ID NO: 12의 뉴클레오티드 1 내지 624 및 SEQ ID NO: 13의 뉴클레오티드 547 내지 630, g) SEQ ID NO: 12의 뉴클레오티드 1 내지 645 및 SEQ ID NO: 13의 뉴클레오티드 601 내지 630, 및 h) SEQ ID NO: 12의 뉴클레오티드 1 내지 717 및 SEQ ID NO: 13의 뉴클레오티드 613 내지 630의 핵산 서열을 포함하는 폴리뉴클레오티드, 또는 그와 실질적으로 동일한 기능성 변이체를 코딩하는 폴리뉴클레오티드에 의해 코딩된다.
본 발명의 일부 구현예에서, 키메릭 레티노이드 X 폴리펩티드는, a) SEQ ID NO: 14, b) SEQ ID NO: 15의 아미노산 1 내지 116 및 SEQ ID NO: 16의 아미노산 90 내지 210, c) SEQ ID NO: 15의 아미노산 1 내지 136 및 SEQ ID NO: 16의 아미노산 113 내지 210, d) SEQ ID NO: 15의 아미노산 1 내지 155 및 SEQ ID NO: 16의 아미노산 135 내지 210, e) SEQ ID NO: 15의 아미노산 1 내지 185 및SEQ ID NO: 16의 아미노산 164 내지 210, f) SEQ ID NO: 15의 아미노산 1내지 208 및SEQ ID NO: 16의 아미노산 183 내지 210, g) SEQ ID NO: 15의 아미노산 1 내지 215 및 SEQ ID NO: 16의 201 내지 210, 및 h) SEQ ID NO: 15의 아미노산 1 내지 239, SEQ ID NO: 16의 아미노산 205 내지 210의 폴리뉴클레오티드 서열, 또는 그와 실질적으로 동일한 폴리펩티드 서열을 포함한다.
본 발명의 어떤 구현예에서, 제 1 및 제 2폴리펩티드 또는 LIPC 시스템의 하나, 또는 양쪽의 추가 이종 서열은 막횡단 도메인을 포함한다.
본 발명의 어떤 구현예에서, 제 1 및 제 2폴리펩티드 또는 LIPC 시스템의 하나 이상의 막횡단 도메인은 단일 경로 I형 막횡단 도메인이다.
본 발명의 어떤 구현예에서, LIPC 성분은 리간드-유도된 이량화시 세포 사멸 또는 에너지를 가져오거나 생성하는 이종유래 폴리펩티드에 융합되고; 그러한 시스템은 "자살" 또는 "살해" 스위치라 칭할 수 있다.
일부 구현예에서, 본 발명은 제 1 또는 제 2폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드를 포함한다.
어떤 구현예에서, 본 발명은 제 1폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 1폴리뉴클레오티드, 및 제 2 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 제 2폴리뉴클레오티드를 포함한다.
일부 구현예에서, 본 발명은 상기 폴리뉴클레오티드 중 하나를 포함하는 벡터를 포함한다. 어떤 구현예에서, 본 발명은 본원에 기재된 폴리뉴클레오티드 제 1 및 제 2폴리뉴클레오티드 양쪽을 모두 포함하는 벡터를 포함한다. 일부 구현예에서, 본 발명의 벡터는 발현 벡터이다.
어떤 구현예에서, 본 발명은 상기 벡터 중 하나를 포함하는 숙주세포를 포함한다. 일부 구현예에서, 숙주세포는 포유동물 T-세포이다. 어떤 구현예에서, 숙주세포는 인간 T-세포이다.
일부 구현예에서, 본 발명은 제 1 및 제 2폴리펩티드, LIPC 시스템, 폴리뉴클레오티드, 및/또는 본원에 기재된 벡터 중 하나를 도입하는 단계와, 숙주세포를 활성화 리간드와 접촉시키는 단계를 포함하는 세포 신호전달 유도방법을 포함한다.
본 발명의 어떤 구현예에서, 제 1 및 제 2폴리펩티드, LIPC 시스템, 폴리뉴클레오티드, 벡터, 및/또는 본원에 기재된 방법의 활성화 리간드는
a) 하기 식의 화합물이고:
Figure pct00001
여기서 E는 3차 탄소를 함유한(C4-C6)알킬, 또는 3차 탄소를 함유한 시아노(C3-C5)알킬이고; R1 은 H, Me, Et, i-Pr, F, 포밀, CF3, CHF2, CHCl2, CH2F, CH2Cl, CH2OH, CH2OMe, CH2CN, CN, C≡CH, 1-프로피닐, 2-프로피닐, 비닐, OH, OMe, OEt, 시클로프로필, CF2CF3, CH=CHCN, 알릴, 아지도, SCN 또는 SCHF2이고;
R2 는 H, Me, Et, n-Pr, i-Pr, 포밀, CF3, CHF2, CHCl2, CH2F, CH2Cl, CH2OH, CH2OMe, CH2CN, CN, C≡CH, 1-프로피닐, 2-프로피닐, 비닐, Ac, F, Cl, OH, OMe, OEt, O-n-Pr, OAc, NMe2, NEt2, SMe, SEt, SOCF3, OCF2CF2H, COEt, 시클로프로필, CF2CF3, CH=CHCN, 알릴, 아지도, OCF3, OCHF2, O-i-Pr, SCN, SCHF2, SOMe, NH-CN이거나, 또는 R3 와 결합하고, 이때의 R2 와 R3 이 페닐 탄소에 부착되어 에틸렌디옥시를 형성하고, 페닐 탄소에 인접한 산소를 함유한 디히드로푸릴 고리, 또는 페닐 탄소에 인접한 산소를 함유한 디히드로피릴 고리를 형성하며;
R3 은H, Et이거나, 또는 R2 와 결합하고, 이때의 R2 와 R3 이 페닐 탄소에 부착되어 에틸렌디옥시를 형성하고, 페닐 탄소에 인접한 산소를 함유한 디히드로푸릴 고리, 또는 페닐 탄소에 인접한 산소를 함유한 디히드록피릴 고리를 형성하며;
R4, R5 및 R6 은 독립적으로 H, Me, Et, F, Cl, Br, 포밀, CF3, CHF2, CHC12, CH2F, CH2Cl, CH2OH, CN, C≡CH, 1-프로피닐, 2-프로피닐, 비닐, OMe, OEt, SMe 또는 Set이고; 또는
b) 엑디손, 20-히드록시엑디손, 포나스테론 A, 무리스테론 A, 옥시스테롤, 22(R) 히드록시콜레스테롤, 24(S) 히드록시콜레스테롤, 25-에폭시콜레스테롤, T0901317, 5-알파-6-알파-에폭시콜레스테롤-3-설페이트, 7-케토콜레스테롤-3-설페이트, 파르네솔, 담즙산, 1,1-비포스페이트 에스테르 또는 유충 호르몬(III)이다.
본 발명의 어떤 구현예에서, 제 1 및 제 2폴리펩티드, LIPC 시스템, 폴리뉴클레오티드, 벡터, 및/또는 본원에 기재된 방법의 활성화 리간드는 하기 식의 화합물,
Figure pct00002
또는 하기 식의 화합물이고:
Figure pct00003
여기서 R1, R2, R3 및 R4 는: a) H, (C1-C6)알킬; (C1-C6)할로알킬; (C1-C6)시아노알킬; (C1-C6)히드록시알킬; (C1-C4)알콕시 (C1-C6)알킬; 할로, 시아노, 히드록실 또는(C1-C4)알킬로 임의로 치환된(C2-C6)알케닐; 할로, 시아노, 히드록실 또는(C1-C4)알킬로 임의로 치환된 (C2-C6)알키닐; 할로, 시아노, 히드록실 또는(C1-C4)알킬로 임의로 치환된( C3-C5)시클로알킬; 또는 b) 치환되지 않거나 치환된 벤질로서, 이때의 치환기는 독립적으로 1 내지 5H, 할로, 니트로, 시아노, 히드록실, (C1-C6)알킬, 또는 (Ci-C6)알콕시이고;
R5 는 H; OH; F; Cl; 또는 (C1-C6)알콕시이고;
단, R1, R2, R3 및 R4 가 이소프로필이면, R5 는 히드록실이 아니고;
R5 가 H, 히드록실, 메톡시 또는 플루오로이면, R1, R2, R3 및 R4 중 하나 이상은 H가 아니고;
R1, R2, R3 및 R4 중 하나만 메틸이고 R5 가 H 또는 히드록실이면, R1, R2, R3 및 R4 의 나머지는 H가 아니고;
R4 와 R1, R2 및 R3 중 하나가 모두 메틸이면, R5 는 H도 히드록시도 아니고;
R1, R2, R3 및 R4 가 모두 메틸이면, R5 는 히드록실이 아니고; 또한
R1, R2 및 R3 이 모두 H이고 R5 가 히드록실이면, R4 는 에틸, n-프로필, n-부틸, 알릴 또는 벤질이 아니다.
본 발명의 어떤 구현예에서, 제 1 및 제 2폴리펩티드, LIPC 시스템, 폴리뉴클레오티드, 벡터, 및/또는 본원에 기재된 방법의 활성화 리간드는 하기 식의 화합물이고:
Figure pct00004
여기서 X와 X'는 독립적으로 O 또는 S이고;
Y는:
(a) 치환 또는 치환되지 않은 페닐로서, 이때의 치환체는 독립적으로1-5H, (C1-C4)알킬, (C1-C4)알콕시, (C2-C4)알케닐, 할로(F, Cl, Br, I), (C1-C4)할로알킬, 히드록시, 아미노, 시아노 또는 니트로이고; 또는
(b) 치환 또는 치환되지 않은2-피리딜, 3-피리딜 또는 4-피리딜로서, 이때의 치환체는 독립적으로 1-4H, (C1-C4)알킬, (C1-C4)알콕시, (C2-C4)알케닐, 할로(F, Cl, Br, I), (C1-C4)할로알킬, 히드록시, 아미노, 시아노 또는 니트로이며;
R1 과 R2 는 독립적으로 H; 시아노; 시아노-치환 또는 치환되지 않은 (C1-C7) 분지쇄나 직쇄 알킬; 시아노-치환 또는 치환되지 않은 (C2-C7) 분지쇄나 직쇄 알케닐; 시아노-치환 또는 치환되지 않은 (C3-C7) 분지쇄나 직쇄 알케닐알킬이고; 또는 함께 R1 와 R2 원자가가 (C1-C7) 시아노-치환 또는 치환되지 않은 알킬리덴기 (R a R b C-)를 형성하고, 이때 R a 와 R b 내의 비치환 탄소의 총합이 0 내지6이며;
R3 은 H, 메틸, 에틸, n-프로필, 이소프로필 또는 시아노이고;
R4, R7 및 R8 은 독립적으로 H, (C1-C4)알킬, (C1-C4)알콕시, (C2-C4)알케닐, 할로(F, Cl, Br, I), (C1-C4)할로알킬, 히드록시, 아미노, 시아노 또는 니트로이고; 또한
R5 와 R6 은 독립적으로 H, (C1-C4)알킬, (C2-C4)알케닐, (C3-C4)알케닐알킬l, 할로(F, Cl, Br, I), C1-C4 할로알킬, (C1-C4)알콕시, 히드록시, 아미노, 시아노, 니트로이거나, 함께 (―OCHR9CHR10O―) 형태의 조합으로서 이들이 부착될 페닐 탄소와 함께 고리를 형성하고; 여기서 R9 와 R10 은 독립적으로, H, 할로, (C1-C3)알킬, (C2-C3)알케닐, (C1-C3)알콕시(C1-C3)알킬, 벤조일옥시(C1-C3)알킬, 히드록시(C1-C3)알킬, 할로(C1-C3)알킬, 포밀, 포밀(C1-C3)알킬, 시아노, 시아노(C1-C3)알킬, 카복시, 카복시(C1-C3)알킬, (C1-C3)알콕시카보닐(C1-C3)알킬, (C1-C3)알킬카보닐(C1-C3)알킬, (C1-C3)알카노일옥시(C1-C3)알킬, 아미노(C1-C3)알킬, (C1-C3)알킬아미노(C1-C3)알킬 (―(CH2)nRcRe), 옥시모(―CH-NOH), 옥시모(C1-C3)알킬, (C1-C3)알콕시모(―C-NOR d ), 알콕시모(C1-C3)알킬, (C1-C3)카복사미도(―C(O)NR e R f ), (C1-C3)카복사미도(C1-C3)알킬, (C1-C3)세미카바지도 (―C-NNHC(O)NR e R f ), 세미카바지도(C1-C3)알킬, 아미노카보닐옥시(―OC(O)NHR g ), 아미노카보닐옥시(C1-C3)알킬, 펜타플루오로페닐옥시카보닐(C1-C3)알킬, p-톨루엔술포닐 옥시(C1-C3)알킬, 아릴술포닐 옥시(C1-C3)알킬, (C1-C3)티오(C1-C3)알킬, (C1-C3)알킬술폭시도(C1-C3)알킬, (C1-C3)알킬술포닐(C1-C3)알킬, 또는 (C1-C5)트리 치환-실록시(C1-C3)알킬 (―(CH2) n SiOR d R e R g )이고; 이때 n=1-3, R c 및 R d 는 지정된 길이의 직쇄나 분지쇄 탄화수소 사슬을 나타내고, R e 및 R f 는 H 또는 직쇄나 분지쇄 탄화수소 사슬을 나타내고, R g 는 할로나 (C1-C3)알킬로 임의로 치환된 (C1-C3)알킬, 또는 아릴이고, 또한 R c , R d , R e , R f 및 R g 는 서로 독립적이며;
단,
i) R9 와 R10 이 모두 H이거나,
ii) R9 이나 R10이 할로, (C1-C3)알킬, (C1-C3)알콕시(C1-C3)알킬, 또는 벤조일옥시(C1-C3)알킬인 경우나,
iii) R5 와 R6 이 함께 (―OCHR9CHR10O―) 형태의 조합을 형성하는 경우,
R1 이나 R2 그룹 중 어느 하나, 또는 이들 양측에서 시아노 치환체 내의 탄소 원자수를 제외한 탄소 원자수는 4를 초과하고, R1, R2 및 R3 그룹의 총합에서 시아노 치환기 내의 탄소 원자수를 제외한 탄소 원자수는10, 11 또는 12이다.
후속의 상세한 설명과 연계하여 첨부 도면을 참조하면, 본 발명을 보다 완전하게 이해할 수 있다. 도면에 도시된 구현예는 본 발명을 예시하기 위한 것에 불과하며, 본 발명이 도시된 구현예에 한정되는 것으로 해석하지 않는다. 추가적인 구현예 및 기술구성으로 추가의 유용한 구현예를 제공할 수 있다.
도 1은 EcR 및 RXR 성분을 이용한 예시적인 전사 스위치의 구성과 조작 방식을 나타내는 개략적도이다.
도 2는 리간드 유도성 폴리펩티드 결합제 (ligand inducible polypeptide coupler, LIPC) 성분의 개념을 나타내는 개략도이다. 활성화 리간드의 존재시에, EcR 및 RXR 성분들을 조합하고, 그 결과로서 융합 성분들 (가령, 신호발생 분자, 신호발생 도메인, 상호보완적 ('상보') 단백질 절편 및 단백질 서브유닛 등)이 조합된다.
도 3은 세포내 EcR 및 RXR 성분이 막횡단 도메인을 통해 세포외 성분 (가령, 신호발생 분자나 도메인)에 융합되는 리간드 유도성 폴리펩티드 결합제 (LIPC) 시스템을 나타내는 개략도이다. 리간드의 존재시에, EcR 및 RXR 성분들이 조합되고, 그 결과로서 세포외 융합 성분들이 조합된다.
도 4a 및 4는 세포외 EcR 및 RXR 성분들이 막횡단 도메인을 통해 세포내 성분들 (가령, 신호발생 분자나 도메인)에 융합되는 리간드 유도성 폴리펩티드 결합제 (LIPC) 시스템을 나타내는 개략도이다 (도 4a). 리간드의 존재시에, EcR 및 RXR 성분들이 조합되고, 그 결과로서 세포내 융합 성분들이 조합된다. 또한, 세포내 EcR 및 RXR 성분들이 막에 고정되고, 세포내 성분들 (가령, 신호발생 분자나 도메인)에 융합되는 리간드 유도성 폴리펩티드 결합제 (LIPC) 시스템을 나타내는 개략도이다 (도 4b). 리간드의 존재시에, EcR 및 RXR 성분들이 조합되고, 그 결과로서 세포내 융합 성분들이 조합된다.
도 5는 EcR 또는 RXR 성분이 막에 고정되고, 다른 상보 성분은 세포질 내에서 유리되어 있는 리간드 유도성 폴리펩티드 결합제 (LIPC) 시스템을 나타내는 개략도이다. 리간드의 존재시에, 막-고정된 EcR 및 RXR 성분들이 사이토솔 EcR 또는 RXR 성분과 조합되고, 그 결과로서 융합 성분들이 조합된다 (가령, 신호발생 분자 또는 도메인).
도 6은 분열 루시페라제 (fLuc) 리간드 유도성 폴리펩티드 결합제 (LIPC) 시스템을 나타내는 개략도이다. 리간드의 존재시에만 EcR 및 RXR 성분들이 조합되고, 분열 fLuc 및 후속 활성의 조합을 형성한다.
도 7은 본원에 기재된 리간드 유도성 폴리펩티드 결합제 (LIPC)가 활성화 리간드의 존재시에, 분열 fLuc 신호만 형성하는 것을 나타내는 데이터의 그래프이다.
도 8은 본원에 기재된 바와 같은 리간드 유도성 폴리펩티드 결합제 (LIPC) 시스템의 구성에 이용되는 예시적 구조의 개략도이다.
도 9는 벨레디멕스 리간드를 이용한 RxR_Nluc+Cluc_EcR 및 EcR_Nluc+Cluc_RxR의 리간드 용량 반응 곡선을 나타내는 그래프이다.
도 10은 벨레디멕스 리간드를 이용한 RxR_Nluc+Cluc_EcR 및 EcR_Nluc+Cluc_RxR의 리간드 용량 반응 곡선을 나타내는 그래프이다.
도 11은 벨레디멕스 리간드를 통한 EcR 이량화 유도를 나타내는 그래프이다.
도 12는 벨레디멕스 리간드를 통한 EcR 이량화 유도를 나타내는 그래프이다.
본원에서 제공하는 발명은 EcR-RXR 전사 스위치 시스템의 구성분을 이용하고 (가령, PCT 특허출원 공개 제 WO 2001/070816호, WO 2002/066612호, WO 2002/066613호, WO 2002/066614호, WO 2002/066615호, WO 2003/027266호, WO 2003/027289호, 및 WO 2005/108617호 참조; 이들 각각의 내용 전체를 본원에 참조로서 인용한다), 숙주세포에서 또는 숙주세포에 의해 발현되어 융합 단백질 성분의 조합을 제어, 조절 또는 조정할 수 있다. 단백질-단백질 상호작용의 한가지 역할은, 예컨대, 세포질 및/또는 세포외 신호발생 도메인을 활성화하거나 절편 또는 분열 단백질을 수용체-리간드 결합 상호작용을 통해 기능성을 복구하여 세포 신호전달 과정을 개시하는 것이다. 이에 따라, 자연발생 시스템은 (EcR 리간드의 존재시에,) EcR 및 RXR 성분 사이에 유도된 "브릿지" 형성을 통해 2개의 비활성 신호발생 도메인의 조합을 형성함으로써 인위적으로 조정할 수 있으며, 이때 후자의 성분은 신호발생 도메인 폴리펩티드에 도입 (즉, 이에 융합)되었다.
어떤 구현예에서, 본원은 리간드-유발 폴리펩티드 결합을 통한 세포 신호발생 도메인의 선택적인 활성화에 관련된 방법 및 시스템에 대해 기재한다. 이 시스템 및 방법은 단백질-단백질 상호작용의 유도 (가령, 조정, 제어, 조절) 및 신호발생 도메인의 ("요구별") 활성화 또는 신호발생 도메인의 비활성화/억제를 가능케 하는 리간드-유도 폴리펩티드 결합 시스템을 제공한다.
따라서 본원에서는 (활성화 리간드를 통해) 성분들 간의 물리적 조합을 유도하는 유전자 전사 스위치 시스템의 (숙주세포에 의해 발현된) 단백질 성분을 사용하여 다른 조합된 단백질이나 도메인의 복합체를 형성하는 (가령, 단백질-단백질 상호작용을 유도하는) 방법 및 시스템에 대해 기재한다. 리간드 유도 단백질 조합은, 예를 들어, 세포질 및/또는 세포외 신호발생 도메인을 활성화 리간드의 존재시에, 활성화하는 기능 등을 개시할 수 있다. 따라서, 활성화 리간드의 존재시에, EcR과 USP/RXR 성분들 간 "브릿지"를 통해 통상은 비활성인 2개의 신호발생 도메인을 합쳐서 활성화할 수 있다.
특허청구범위 및/또는 상세한 설명 중 "포함하는"이란 용어와 함께 사용할 때의 "a" 또는 "an"은 "하나"를 의미할 수 있으나 이는 또한 "하나 이상", 적어도 하나" 및 "하나를 초과하는"의 의미와도 상통한다.
용어 "예를 들어" 및 이에 상응하는 약어로서 " 가령(e.g.)" (이탤릭체 여부와 관계없이)을 사용하는 것은 인용된 특정의 용어가 대표적인 예임을 뜻하는 것으로 (즉, 검체, 시료, 예시, 모델 등), 본 발명의 구현예는 별도의 언급이 없는 한 이러한 인용된 특정 예에 한정되지 않는다.
유전자나 폴리펩티드 성분에 관하여 본원에서 사용하는 전방향 사선 부호 ("/")는 (달리 지시하지 않는 한) "및/또는"의 약어이다. 예를 들어, 별도의 언급이 없는 한, 용어 "USP/RXR"은 USP와 RXR 폴리펩티드 성분들이나 그의 절편의 혼합물 (가령, 키메릭 폴리펩티드), USP 폴리펩티드 성분이나 그의 절편 (가령, 도메인) 단독, 또는 RXR 성분이나 그의 절편 (가령, 도메인) 단독을 가질 수 있는 폴리펩티드를 가리킨다.
본원의 상세한 설명 및 특허청구범위에서 사용하는 "포함하는(comprising)" (및 "포함한다 (복수형)", "포함하다 (단수형)" 등의 형태), "가진" (및 "갖다 (복수형)", "갖다 (단수형)" 등의 형태), "포함하는(including)" (및 "포함한다 (단수형)", "포함한다 (복수형)" 등의 형태) 또는 "함유하는" (및 "함유한다 (단수형)", "함유한다 (복수형)" 등의 형태) 는 포괄적이거나 제한을 두지 않는 한편, 언급하지 않은 추가적인 요소나 방법의 단계를 배제하지 않는다. 본 명세서에서 검토한 구현예를 본 발명의 방법, 시스템, 숙주세포, 발현 벡터나 조성물에 관하여 수행할 수 있음을 고려한다. 또한, 본 발명의 시스템, 숙주세포, 발현 벡터 및/또는 조성물을 사용하여 본 발명의 방법을 달성할 수 있다.
본원에서 사용한 바와 같이, "합성"은 자연에서 기원하는 것과 반대로 인간의 주체적 역량 (human agency)에 따른 화학공정을 통해 형성된 화합물을 말한다.
"단리"는 핵산, 펩티드 또는 폴리펩티드를 그의 자연 환경으로부터 제거하는 것을 말한다. "정제"란 자연 (게놈 DNA와 mRNA 포함)으로부터 제거했거나, 또는 합성 (DNA 포함) 및/또는 연구소 조건하에 증폭시킨 핵산, 펩티드 또는 폴리펩티드의 순도를 증가시킨 것을 말하며, "순도"는 "절대 순도"에 대한 상대적인 용어이다. 그러나 핵산, 펩티드 및 폴리펩티드는 희석제나 보조제를 이용해서도 제형화할 수 있으며, 이는 실용적인 목적으로 아직까지 이용되고 있음을 이해해야 한다. 예를 들어, 핵산은 세포내 도입을 위해 사용하는 경우 전형적으로 수용가능한 담체나 희석제와 혼합한다.
"핵산"은 뉴클레오티드라는 공유결합 서브유닛으로 이루어진 고분자 화합물이다. 핵산은 폴리리보핵산 (RNA)와 폴리데옥시리보핵산 (DNA)를 포함하며, 이들 양쪽 모두 단일-가닥 나선이나 이중-가닥 나선 형태이다. DNA는, 제한되지 않으나, cDNA, 게놈 DNA, 플라스미드 DNA, 합성 DNA 및 반합성 DNA를 포함한다. DNA는 선형, 원형 또는 수퍼코일형일 수 있다.
"핵산 분자"는 인산염 에스테르 고분자 형태의 리보뉴클레오시드 (아데노신, 구아노신, 우리딘 또는 사이티딘; "RNA 분자") 또는 데옥시리보뉴클레오시드 (데옥시아데노신, 데옥시구아노신, 데옥시티미딘 또는 데옥시사이티딘; "DNA 분자")이거나, 또는 단일-가닥 나선 형태나 이중-가닥 나선 형태로 포스포로티오에이트와 티오에스테르 같은 포스포에스테르 유사체를 말한다. 이중-가닥 DNA-DNA, DNA-RNA 및 RNA-RNA 나선이 가능하다. 핵산 분자, 특히 DNA나 RNA분자는 단지 분자의 1차 및 2차 구조를 말하며, 이를 특정의 3차 형태로 한정하지 않는다. 따라서, 특히 원형이나 선형 DNA 분자 (가령, 제한(효소) 절편), 플라스미드 및 염색체에서 발견되는 이중-가닥 DNA가 이러한 용어에 포함된다. 특정의 이중-가닥 DNA 분자의 구조를 논의할 때, 본원에서 5' 서열은 비-전사 DNA 가닥, 즉, mRNA에 대한 상보성 서열을 갖는 가닥을 따라 5' 에서 3' 방향으로의 서열만 가리키는 것으로, 종래기술에 따라 기재할 수 있다. "재조합 DNA 분자"는 분자에 생물학적 조작을 가한 DNA 분자이다.
폴리뉴클레오티드를 참조하여, 용어 "절편"은 기준 핵산에 비해 감소된 길이의 뉴클레오티드 서열을 의미하며, 공통 부분에 걸쳐 기준 핵산과 동일한 뉴클레오티드 서열을 포함하는 것으로 이해하면 된다. 본 발명에 따른 핵산 절편은 적합하게는, 이것을 구성 성분으로 하는 더 큰 폴리뉴클레오티드에 포함될 수 있다. 이러한 절편은 본 발명에 따른 핵산의 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 105, 110, 120, 125, 130, 135, 140, 145, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1250, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000 또는 6000 개 이상의 연속 뉴클레오티드의 길이 범위의 올레고뉴클레오티드를 포함하거나 이것으로 이루어진다. 어떤 구현예에서, 이러한 절편은, 예를 들어, 6 내지 6,000개 뉴클레오티드의 정수값 길이 범위의 올리고뉴클레오티드를 포함하거나 이것으로 이루어질 수 있다. 어떤 구현예에서, 이러한 절편은 3으로 균등하게 분할되는 정수값 길이를 가질 수 있다 (가령, 폴리뉴클레오티드가 전체 또는 부분적 폴리펩티드 개방 판독 프레임을 코딩하는 형태로). 어떤 구현예에서, 이러한 부분 폴리펩티드 절편은 (가령, 폴리뉴클레오티드를 PCR 프라이머나 기타 혼성형 절편으로 사용할 수 있는 형태, 또는 합성이나 제한 절편 길이의 폴리뉴클레오티드를 생성하는데 사용할 수 있는 형태로) 정수값의 길이를 가질 수 있다.
본원에서 사용하는 바와 같이, "단리 핵산 절편"은 단일-가닥 또는 이중-가닥형으로서, 선택적으로 합성, 비-자연 또는 수정된 뉴클레오티드 염기를 함유하는 RNA나 DNA의 고분자이다. DNA의 고분자 형태인 단리 핵산 절편은 하나 이상의 cDNA, 게놈 DNA 또는 합성 DNA 세그먼트 (체절)로 이루어질 수 있다.
"유전자"는 폴리펩티드를 코딩하는 뉴클레오티드의 조립체를 말하며, cDNA와 게놈 DNA 핵산을 포함한다. "유전자" 역시 코딩 서열에 선행 (5' 비코딩 서열) 및 후행 (3' 비코팅 서열)하는 조절 서열을 포함한, 특정 단백질이나 폴리펩티드를 발현하는 핵산 절편을 말한다. "자연 유전자"는 자연에서 발견된 자가 조절 서열이 있는 유전자를 말한다. "키메릭(chimeric) 유전자"는 자연 유전자가 아닌 유전자로서, 자연에서 함께 발견되지 않는 조절 및/또는 코딩 유전자를 포함한다. 따라서, 키메릭 유전자는 상이한 공급원에서 유래되는 조절 서열과 코딩 서열, 또는 동일한 공급원에서 유래되지만 자연에서 발견되는 것과 다른 방식으로 배열된 조절 서열과 코딩 서열을 포함할 수 있다. 키메릭 유전자는 상이한 공급원에서 유래된 코딩 서열 및/또는 상이한 공급원에서 유래된 조절 서열을 포함할 수 있다. "내인성 유전자"는 유기체의 게놈 내의 본래 위치에 있는 자연 유전자를 말한다. "외래" 유전자나 "이종유래" 유전자는 숙주 유기체나 세포에서 정상적으로 발견되지 않고 유전자 전달에 의해 숙주 유기체나 세포에 도입되는 유전자를 말한다. 외래 유전자는 제한없이 비자연 유기체와 키메릭 유전자에 삽입되는 자연 유전자를 포함할 수 있다. "이식 유전자"는 숙주 유기체나 세포의 게놈에 도입된 외래 또는 이종유래 유전자이다. "이종유래" DNA는 세포내 또는 세포의 게놈의 염색체 부위에 자연적으로 위치하지 않는 DNA를 말한다. 일부 구현예에서, 이종유래 DNA는 세포에 대해 외래인 유전자를 포함한다.
본원에서 사용한 바와 같이, "폴리뉴클레오티드"나 "올리고뉴클레오티드" 는 소정 길이의 고분자형 뉴클레오티드로서 리보뉴클레오티드나 데옥시리보뉴클레오티드를 말한다. 이 용어는 분자의 1차 구조만 의미한다. 따라서, 이 용어는 이중 및 단일 가닥 DNA, 삼중 DNA뿐만 아니라, 이중 및 단일 가닥 RNA를 포함한다. 또한, 예를 들어, 메틸화 및/또는 캡핑으로 변형된 것, 및 비변형 폴리뉴클레오티드도 포함한다. 이 용어는 또한 비-자연발생 또는 합성 뉴클레오티드와 뉴클레오티드 유사체를 포함하는 분자도 포함한다. 어떤 구현예에서, 올리고뉴클레오티드는 게놈 DNA 분자, cDNA 분자, 플라스미드 DNA 또는 mRNA 분자에 혼성화할 수 있다. 올리고뉴클레오티드는 (가령, 비오틴 같이 라벨이 공유 접합된 32P-뉴클레오티드나 뉴클레오티드를 이용하여) 라벨화할 수 있다. 일부 구현예에서, 라벨화된 올리고뉴클레오티드는 핵산의 존재를 검출하는 프로브로서 사용할 수 있다. 올리고뉴클레오티드 (라벨화될 수 있는 하나, 또는 양쪽)를 핵산 전체 길이나 그의 절편을 클로닝 하거나, 핵산의 존재를 검출하기 위한 PCR 프라이머로서 사용할 수 있다. 올리고뉴클레오티드는 DNA 분자를 갖는 3중 나선을 형성하는데 사용할 수 있다. 어떤 구현예에서, 올리고뉴클레오티드는 예를 들어 핵산 합성기에서 합성 제조한다. 따라서, 올리고뉴클레오티드는 티오에스테르 결합 등의 비-자연발생 포스포에스테르 유사체 결합으로 조제할 수 있다.
핵산 및/또는 핵산 서열은 이들이 자연 또는 인공적으로 공통의 원종 핵산이나 핵산 서열로부터 유래되는 경우 "동종유래"라고 한다. 단백질 및/또는 단백질 서열은 이들의 코딩 DNA가 공통의 원종 핵산이나 핵산 서열로부터 유래되는 경우 동종유래라고 한다. 동종유래 분자들은 동종체라고 할 수 있다. 예를 들어, 본원에 기재된 바와 같이, 자연발생 단백질은 임의의 이용가능한 돌연변이법에 의해 변형될 수 있다. 발현시에, 이 돌연변이화된 핵산은 최초의 핵산에 의해 코딩된 단백질과 동종유래인 폴리펩티드를 코딩한다. 동종화는 일반적으로 2개 이상의 핵산이나 단백질 (또는 그의 서열) 간의 서열 동일성으로부터 추론한다. 서열 간 동일성의 정확한 백분율은 대상이 되는 핵산과 단백질을 확립하는데 유용하나, 일상적으로 25%의 낮은 서열 동일성이 동종화를 확립하는데 이용된다. 서열 동일성이 이보다 높은 수준, 예를 들어, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 99% 이상인 것도 역시 동종성 확립에 이용할 수 있다. 서열 동일성 백분율을 결정하는 방법 (가령, 디폴트 파라미터를 이용하는 BLASTP 및 BLASTN)도 본원에 기재하며, 이것이 일반적으로 이용되는 방법이다.
DNA "코딩 서열"은 적절한 조절 서열의 제어하에 있을 경우 시험관내 또는 생체내 세포의 폴리펩티드로 전사 및 번역되는 이중-가닥 DNA 서열이다. "적절한 조절 서열" 이란 코딩 서열의 상류 (5' 비코딩 서열), 내부 또는 하류 (3' 비코딩 서열)에 위치하는 뉴클레오티드 서열을 말하며, 이들은 조합된 코딩 서열의 전사, RNA 가공이나 안정성 또는 번역에 영향을 미칠 수 있다. 조절 서열은 프로모터, 번역 리더 서열, 인트론(개재 서열), 폴리아데닐화 인지 서열, RNA 가공 위치, 실행 유전자 결합 부위 및 줄기 구조를 포함할 수 있다. 코딩 서열의 경계는 5' (아미노) 말단의 출발 코돈과 3' (카복실) 말단의 번역 종료 코돈에 의해 결정된다. 코딩 서열은 제한되지 않으나, 원핵세포 서열, mRNA에서 나온 cDNA, 게놈 DNA 서열 및 합성 DNA 서열을 포함할 수 있다. 코딩 서열을 진핵세포에서 발현시키고자 할 경우, 폴리아데닐화 신호 및 전사 종료 서열은 일반적으로 코딩 서열 방향의 3'에 위치하게 된다.
"개방 판독 프레임"은 약어로 ORF(open reading frame)이며, ATG 또는 AUG와 같은 번역 출발 신호나 개시 코돈과 종료 코돈을 포함하고, 폴리펩티드 서열로 번역될 가능성이 있는 DNA, cDNA 또는 RNA 핵산 서열의 길이를 말한다.
"동종유래 재조합"은 외래 DNA 서열을 또 다른 DNA 분자에 삽입하는 것을 말한다 (가령, 염색체내 벡터의 삽입). 일부 구현예에서, 벡터는 동종유래 재조합을 위한 특정의 염색체 부위를 타겟으로 한다. 특정의 동종유래 재조합에서, 벡터는 염색체 서열에 대해 충분히 긴 동종성 영역을 함유하므로, 상보 결합 및 염색체 내 벡터 도입을 가능케 한다. 동종성 영역이 길수록, 그리고 서열 유사성 정도가 클수록 동종유래 재조합 효율이 증가할 수 있다.
"벡터"나 "발현 벡터"는 핵산 클로닝 및/또는 숙주세포 내로의 핵산 전달에 관한 일종의 양태이다. 벡터는 또 다른 DNA 세그먼트가 부착될 수 있는 레플리콘 (복제단위)일 수 있으며, 따라서 부착된 세그먼트의 복제를 야기할 수 있다. "레플리콘"은 세포내 DNA 복제의 자율적 유닛으로 기능하는 유전학적 요소 (가령, 플라스미드, 파지, 코스미드, 염색체, 바이러스 등)이다. 용어 "벡터"는 핵산을 세포에 시험관내, 생체외 또는 생체내 도입하기 위한 바이러스성 및 비바이러스성 수단이다.
용어 "플라스미드"는 세포의 중심 대사의 일부가 아닌 유전자를 운반하는 엑스트라 염색체 요소로서 원형 이중-가닥 DNA 분자 형태일 수 있다. 이러한 요소는, 다수의 뉴클레오티드 서열이 결합 또는 하나의 특이적 구조로 재조합되어 있는 어느 공급원으로부터 유도된 것으로서, 자율복제 서열, 게놈 통합 서열, 파지나 뉴클레오티드 서열, 선형, 원형 또는 수퍼코일 형태의 단일- 또는 이중-가닥 DNA나 RNA 등일 수 있으며, 상기의 특이적 구조는 적절한 3' 미번역 서열을 가진 어느 선택된 유전자 산물을 위한 프로모터 절편과 DNA 서열을 세포에 도입할 수 있다.
벡터는 당해 분야에 공지된 방법, 예를 들어, 트랜스펙션, 전기영동, 마이크로인젝션, 형질도입, 세포 융합, DEAE 덱스트란, 인산칼슘 침전, 리포펙선 (리소좀 융합), 유전자총 또는 DNA벡터 전달체의 사용 등에 따라 원하는 숙주세포에 도입할 수 있다 (e.g., Wu et al., 1992, J. Biol. Chem. 267: 963-967; Wu and Wu, 1988, J. Biol. Chem. 263: 14621-14624; and Hartmut et al., 캐나다 특허출원 제 2,012,311호 (1990년 3월 15일 출원) 참조, 이들 각각의 내용 전체를 본원에 참조로서 인용한다).
또한, 벡터를 노출된 DNA 플라스미드로 이용하여 생체내 도입할 수도 있다 (가령, U.S 특허 제 5,693,622호, 제 5,589,466호 및 제 5,580,859호 참조, 이들 각각의 내용 전체를 본원에 참조로서 인용한다). 수용체-매질 DNA 전달 접근법도 사용할 수 있다 (가령, Curel et al., 1992, Hum. Gene Ther 3: 147-154; and Wu and Wu, 1987, J. Biol. Chem 262: 4429-4432 참조, 이들 각각의 내용 전체를 본원에 참조로서 인용한다).
용어 "트랜스펙션"은 세포에 의한 외인성 또는 이종유래 RNA 또는 DNA 흡수를 의미한다. 이러한 외인성 또는 이종유래의 RNA 또는 DNA가 세포 내부에 도입되었을 때, 이들 RNA 또는 DNA에 의해 세포가 "트랜스펙트" 되었다. 이러한 외인성 또는 이종유래의 RNA 또는 DNA가 표현형 변화에 영향을 주는 경우, 이들 RNA 또는 DNA에 의해 세포가 "형질전환"되었다. 형질전환 RNA 또는 DNA는 세포의 게놈을 형성할 염색체 DNA에 통합 (공유결합)될 수 있다.
"형질전환"은 핵산 절편이 숙주 유기체의 게놈속으로 전달되어, 유전학적으로 안정된 유전형질이 얻어지는 것을 말한다. 형질전환된 핵산 절편을 함유하는 숙주 유기체를 "이식 유전자형" "재조합체" 또는 "형질전환된" 유기체라고 칭한다.
용어 "선택성 마커"는 동정 인자, 일반적으로 항생제나 화학적 저항성 유전자를 의미하며, 이는 마커 유전자의 효과, 즉, 항생제에 대한 내성, 제초제에 대한 내성, 비색계 마커, 효소, 형광 마커 등에 근거하도록 선택할 수 있으며, 그 효과를 관심 대상 핵산의 유전형질을 추적하고 및/또는 관심 대상 핵산이 유전된 세포나 유기체를 동정하는데 사용한다. 당해 분야에 공지 및 사용되는 선택성 마커 유전자의 예로는, 제한되지 않으나: 암피실린, 스트렙토마이신, 겐타마이신, 카나마이신, 하이그로마이신, 비알랍포스 제초제, 술폰아미드 등에 대한 내성을 제공하는 유전자; 및 표현형 마커로 사용되는 유전자로서, 예를 들면, 안토시아닌 조절 유전자, 이소펜타닐 트랜스페라제 유전자 등을 포함한다.
용어 "정보제공 (reporter) 유전자"는 정보제공 유전자의 효과에 근거하여 동정될 수 있는 확인 인자를 코딩하는 핵산을 의미하며, 이 효과는 관심 대상의 핵산이 유전된 세포나 유기체를 동정하거나 및/또는 유전자 발현 유도나 전사를 측정하기 위해 상기 관심 대상 핵산의 유전형질을 추적하는데 이용된다. 당해 기술분야에서 공지 및 이용되는 정보제공 유전자의 예로는, 제한되지 않으나: 루시페라제 (Luc), 녹색 형광 단백질 (GFP), 클로르암페니콜 아세틸트랜스페라제 (CAT), β-갈락토시다제 (LacZ), β-글루쿠로니다제 (Gus) 등을 포함한다. 선택가능한 마커 유전자는 정보제공 유전자로 고려할 수도 있다.
본원에서 사용한 바와 같이, "작동적으로 결합되는"이란 세그먼트가 원하는 형태로 기능하도록 하는 방식으로 DNA 세그먼트를 또 다른 DNA 세그먼트에 물리적 및/또는 기능적으로 결합시키는 것을 말한다. DNA 서열의 전사를 직접 또는 간접적으로 조정할 수 있는 방식으로, 유전자 산물을 코딩하는 DNA 서열을 조절 서열, 예를 들어, 프로모터, 인핸서 및/또는 사일런서에 결합되는 경우, 상기 DNA 서열이 조절 서열에 작동적으로 결합된다. 예를 들어, 프로모터의 전사 개시 부위에 관한 정확한 판독 프레임에서, DNA 서열이 상기 전사 개시 부위에 대한 하향의 프로모터에 결찰되고, 전사가 DNA 서열을 통해 연장 진행되도록 허용하는 경우, 상기 DNA 서열은 프로모터에 작동적으로 결합된다. DNA 서열의 전사를 각각 증가 또는 감소시키는 방식으로 인핸서나 사일런서가 DNA 서열에 결찰되는 경우에, 상기 인핸서나 사일런서는 DNA 서열에 작동적으로 결합된다. 인핸서나 사일런서는 DNA 서열의 코딩 영역의 상류나 하류에 위치하거나, 내부에 삽입될 수 있다. 신호 서열용 DNA는, 신호 서열이 폴리펩티드 분비에 일조하는 프리단백질로서 발현되는 경우, 폴리펩티드용 DNA 코딩에 작동적으로 결합된다. "카세트", "발현 카세트" 및 "유전자 발현 카세트"란 용어는 핵산이나 폴리뉴클레오티드에 삽입될 수 있는 (가령, 특이적 제한 부위나 동종유래 재조합에 의한) DNA 세그먼트를 말한다. DNA 세그먼트는 관심 대상의 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하고, 카세트 및 제한 부위는 전사 및 번역을 위한 적절한 판독 프레임 내에 카세트를 삽입하도록 설계할 수 있다. "형질전환 카세트"는 관심 대상의 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 한편, 이 폴리뉴클레오티드에 이외에, 특정 숙주세포의 형질전환을 촉진하는 요소들을 갖는 벡터를 말한다. 본 발명의 카세트, 발현 카세트, 유전자 발현 카세트 및 형질전환 카세트는 또한 숙주세포내 관심 대상의 폴리펩티드를 코딩하는 폴리뉴클레오티드의 발현을 향상시킬 수 있는 요소들도 포함한다. 이들 요소는 제한되지 않으나: 프로모터, 최소 프로모터, 인핸서, 반응 요소, 종결자 서열, 폴리아데닐화 서열 등을 포함할 수 있다. "조절 영역"은 제 2핵산 서열의 발현을 조절하는 핵산 서열을 의미한다. 조절 영역은 특정 핵산을 발현하는 것에 자연적으로 반응할 수 있는 서열을 포함할 수 있으며 (동종유래 영역), 또는 상이한 단백질 또는 합성 단백질의 발현에도 반응할 수 있는 또 다른 기원의 서열을 포함할 수 있다 (이종유래 영역). 특히, 이 서열은 원핵세포, 진핵세포 또는 바이러스성 유전자의 서열, 또는 특이적 혹은 비특이적 방식 및 유도성 또는 비유도성 방식으로 유전자의 전사를 자극하거나 억제하는 유도 서열일 수 있다. 조절 영역은 복제의 기원, RNA 스플라이스(접합절단) 부위, 프로모터, 인핸서, 전사 종결 서열, 및 폴리펩티드를 타겟 세포의 분비 경로 속으로 보내는 신호 서열을 포함한다. "이종유래 공급원"으로부터 나온 조절 영역은 발현 핵산과 자연 조합되지 않은 조절 영역이다. 이종유래 조절 영역 중에는 상이한 종으로부터의 조절 영역, 상이한 유전자로부터의 조절 영역, 혼성(hybrid) 조절 영역 및, 자연에서는 발생하지 않는 조절 영역 등이 포함된다.
본원에서 사용한 "펩티드"는 사슬로 연결된 둘 이상의 아미노산 잔사를 함유하는 화합물을 말한다. "폴리펩티드"는 공유결합 아미노산 잔사로 이루어진 고분자 화합물이다. 아미노산은 다음과 같은 일반적인 구조를 갖는다:
Figure pct00005
아미노산은 측쇄 R에 기초하여 다음의 7개의 그룹으로 분류된다: (1) 지방족 측쇄, (2) 수산기 (OH)를 함유하는 측쇄, (3) 황 원자를 함유하는 측쇄, (4) 산성 또는 아미드기를 함유하는 측쇄, (5) 염기성 기를 함유하는 측쇄, (6) 방향족 고리를 함유하는 측쇄, 및 (7) 측쇄가 아미노 기에 융합되는 이미노산인 프롤린.
"단백질"은 폴리펩티드를 포함한다. "단리 폴리펩티드"나 "단리 단백질"은 정상적으로는, 자연 상태에서 서로 조합되어 있는 (가령, 다른 단백질이나 폴리펩티드, 핵산, 탄수화물, 지질) 실질적으로 이들 화합물이 제거된 폴리펩티드나 단백질이다. "단리"는 다른 화합물을 포함한 인공적 또는 합성 혼합물을 배제하는 것을 의미하지는 않으며, 생물학적 활성도에 지장을 주지않고, 예컨대, 불완전 정제, 안정화제 첨가 또는 약제학적 수용가능한 조제물로 화합처리함으로써 있을 수 있는 불순물이 존재한다.
본원에서 사용한 바와 같이, "치환 돌연변이체 폴리펩티드"나 "치환 돌연변이체"는 야생형이나 자연발생 폴리펩티드에 비해 상이한 아미노산을 갖는 대략 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25개 이상의 야생형이나 자연발생 아미노산을 포함하는 치환물이나 치환물들을 포함한 (또는 치환물이나 치환물들로 이루어진) 폴리펩티드를 말한다. 치환 돌연변이체 폴리펩티드는 야생형 또는 자연발생 폴리펩티드와 비교하여 하나(1)의 아미노산 치환물만 포함할 수 있으며, 이를 "포인트 돌연변이체" 또는 "단일 포인트 돌연변이체"라고 칭할 수 있다.
치환 돌연변이체 폴리펩티드가 하나(1) 이상의 야생형 또는 자연발생 아미노산의 치환물을 포함하거나 이것으로 이루어진 경우, 이 치환물은 치환을 위해 제거된 동등한 수의 야생형 또는 자연발생 아미노산, , 2개의 비야생형 또는 비-자연발생형 아미노산으로 대체된 야생형 또는 자연발생 아미노산, 또는 치환을 위해 제거된 동등하지 않은 수의 야생형 아미노산, 예컨대, 하나의 비야생형 아미노산 (치환 + 제거 돌연변이)으로 대체된 2개의 야생형 아미노산 또는 3개의 비야생형 아미노산 (치환 + 삽입 돌연변이)으로 대체된 2개의 야생형 아미노산을 포함하거나 이것으로 이루어질 수 있다. 치환 돌연변이체는 기준 폴리펩티드 서열 내에서 대체된 아미노산 잔사와 그의 번호 및 새로운 대체 아미노산 잔사를 가리키는 약어 명명 시스템을 이용하여 기재할 수 있다. 예를 들어, 폴리펩티드의 스무번째 (20번째) 아미노산 잔사가 치환된 치환 돌연변이체는 "x20z"로 명명할 수 있으며, 여기서 "x"는 대체될 모체, 정상적으로 발생 또는 자연발생하는 아미노산이며, "20"은 폴리펩티드내의 아미노산 잔사의 위치나 그의 번호이고, "z"은 새롭게 치환된 아미노산이다. 따라서 상호교환적으로 사용되는 약어, "E20A" 또는 "Glu20Ala"의 치환 돌연변이체는, 이 치환 돌연변이체가 폴리펩티드 20번 위치에 글루탐산 (종래 기술에서 통상적으로 "E" 또는 "Glu"로 약칭함) 대신 알라닌 잔사 (종래 기술에서 통상적으로 "A" 또는 "Ala"로 약칭함)을 포함하는 것을 가리킨다.
본원에서 사용한 바와 같이, 폴리펩티드와 관련하여 사용된 "절편"은 아미노산 서열이 기준 폴리펩티드보다 짧고, 이 기준 폴리펩티드의 전체 부분에 걸쳐 동일한 아미노산 서열 (별도로 특별히 언급하지 않는 한, 가령, "절편의 95%가 동일한…")을 포함하거나, 이것으로 이루어진 폴리펩티드를 의미한다. 이러한 절편은 적절하게는, 이들이 일부가 되는 더 큰 폴리펩티드에 포함될 수 있다. 본 발명에 따른 폴리펩티드의 절편은 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 105, 110, 120, 125, 130, 135, 140, 145, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1250, 1500, 2000, 2500, 3000, 3500, 4000, 4500 또는 5000개 이상의 아미노산 잔사로 된 길이 범위의 고분자를 포함하거나 이것으로 이루어질 수 있다. 어떤 구현예에서, 이러한 절편은 예를 들어 4 내지 5,000개 잔사로 된 임의의 정수값 길이 범위의 아미노산 고분자 (즉, 펩티드, 폴리펩티드)를 포함하거나, 또는 이것으로 이루어질 수 있다.
"절단" 또는 "절단된"을 폴리펩티드와 관련하여 사용하는 경우, 이는 (N-말단, C-말단 또는 N-과 C-말단 양측에서) (가령, 아미노산 잔사의 효소처리나 제거에 의해 발생할 수 있는 바와 같이) 아미노산 서열이 기준 폴리펩티드 보다 짧은 폴리펩티드 절편이다.
폴리펩티드나 단백질의 "변이체"는 유사한 폴리펩티드나 단백질로부터 유래되거나 이와 차별화되지만, 본래 또는 기준 폴리펩티드나 단백질의 하나 이상의 생물학적 성질은 유지되는 임의의 유사체, 절편, 단편, 유도체 또는 돌연변이체이다. 폴리펩티드나 단백질의 다양한 변이체가 자연에 존재할 수 있다. 이들 변이체는 자연발생하는 대립유전자 변이체로서 단백질에 대한 구조적 유전자 코딩의 뉴클레오티드 서열 상의 차이를 특징으로 하며, 차등 스플라이싱(splicing)이나, 번역후 변형을 동반할 수 있으며, 또는 인공적으로 (가령, 유전학적으로, 합성적으로, 재조합적으로) 변이체를 가공할 수 있다. 통상의 기술자라면 단일 또는 다중 아미노산 치환물, 단리물, 첨가물 또는 대체물을 가진 변이체를 제조할 수 있다. 이들 변이체는, 특히: (a) 하나 이상의 아미노산 잔사가 보존성 또는 비-보존성 아미노산에 의해 치환되는 변이체; (b) 하나 이상의 아미노산이 폴리펩티드나 단백질에 부가된 변이체; (c) 하나 이상의 아미노산이 치환기를 포함하는 변이체, 및/또는 (d) 폴리펩티드나 단백질이 또 다른 폴리펩티드와 융합되는 변이체를 포함할 수 있다. 유전학적 (억제, 제거, 단리 등), 화학 및 효소학적 기술을 포함하여, 이들 변이체를 수득하기 위한 기술이 당해 분야의 통상의 기술자에게 공지되어 있다. 본원에 개시된 단백질의 "기능적 변이체" 또는 "기능적 절편"은 기준 단백질의 적어도 일부의 기능을 보존 유지한다. 예를 들어, 단백질의 "기능적 변이체"나 "기능적 절편"은 이 단백질의 비교 대상인 기준 단백질의 생물학적 활성이나 기능의 적어도 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% 또는 약 100%를 보존할 수 있다. 또한, 단백질의 "기능적 변이체"나 "기능적 절편"은, 예를 들어, 100개의 보존 아미노산 잔사 당 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 이상의 보존 아미노산 치환물을 갖는 기준 단백질의 아미노산 서열을 포함하거나 이것으로 이루어질 수 있다. "보존 아미노산 치환물" 이나 "보존 돌연변이"는 하나의 아미노산을 공통적 성질 (가령, 소수성, 친수성, 이온전하, 염기성, 산성, 극성, 비극성 등)을 가진 다른 아미노산으로 대체하는 것을 말한다. 각 아미노산 간의 공통적 성질을 정의하는 기능적 방법은 동종유래 유기체의 상응하는 단백질 사이에서의 아미노산 변화의 빈도를 표준화한 값을 분석하는 것이다 (Schulz, G. E. and Schirmer, R. H., Principles of Protein Structure, Springer-Verlag, New York (1979) 참조, 그의 내용 전체를 본원에 참조로서 인용한다). 이러한 분석에 따르면, 아미노산 그룹은 하나의 그룹 내의 아미노산들이 우선적으로 서로 교환되어, 전체 단백질 구조에 미치는 이들의 영향이 서로 가장 유사한 경우로 정의할 수 있다 (Schulz, G. E. 및 Schirmer, R. H., 상기 참조). 보존 돌연변이의 예로는 전술한 서브 그룹내 아미노산들의 아미노산 치환물, 예를 들어, 양전하를 유지할 수 있는 리신 대 아르기닌 및 그의 역; 음전하를 유지할 수 있는 글루타민산 대 아스파르트산 및 그의 역; 자유--OH를 유지할 수 있는 세린 대 트레오닌; 및 자유 --NH2를 유지할 수 있는 글루타민 대 아스파라긴을 포함한다. 일부 경우에, 보존 아미노산 치환물은 기능적 변이체의 생물학적 활성을 방해하거나 저해하지 않는 것이 바람직할 수 있다. 일부 경우에, 보존 아미노산 치환물은 기능적 변이체의 생물학적 활성이 모계 분자와 비교하여 증가되도록 기능적 변이체의 생물학적 활성을 개선할 수 있다. 다른 경우에, 보존 치환물이 적어도 하나 이상의 생물학적 활성을 방해, 배제 또는 감소시키는 것이 바람직할 수 있다.
대안적으로 또는 추가적으로, 기능적 변이체는 하나 이상의 비-보존 아미노산 치환물과 함께 기준 단백질의 아미노산 서열을 포함하거나 이것으로 이루어질 수 있다. "비-보존 돌연변이"는 상이한 그룹들 간의 아미노산 치환물을 수반한다 (즉, 본래의 및 치환된 AA는 상이한 화학적 성질, 예컨대 소수성, 친수성, 이온전하, 극성, 비극성, 산성, 염기성 등과 관련된 특성의 차이를 갖는다). 비-보존 치환물의 소수의 예로는, 리신 (염기성) 대 트립토판 (비극성)이나 글루탐산 (산성), 아스파르트산 (산성) 대 티로신 (극성)이나 히스티딘 (염기성), 또는 페닐알라닌 (비극성) 대 아르기닌 (염기성)이나 세린 (극성) 등이 있다. 일부 경우에, 비-보존 아미노산 치환물은 기능적 변이체의 생물학적 활성을 방해하거나 저해하지 않는 것이 바람직할 수 있다. 일부 경우에, 비-보존 아미노산 치환물은 기능적 변이체의 생물학적 활성이 모계 분자와 비교하여 증가되도록 기능적 변이체의 생물학적 활성을 개선할 수 있다. 다른 경우에, 비-보존 치환물이 하나 이상의 생물학적 활성을 방해, 배제 또는 감소시키는 것이 바람직할 수 있다.
"이종유래의 단백질"은 세포에서 자연적으로 생성되지 않는 단백질을 말한다. "성숙 단백질"은 번역후 가공된 폴리펩티드, 즉, 1차 번역산물에 존재하는 임의의 프리- 또는 프로펩티드가 제거된 것을 말한다. "선구체" 단백질은 mRNA의 번역 1차 산물, 즉, 프리- 및 프로펩티드가 여전히 존재하는 1차 산물을 말한다. 프리- 및 프로펩티드는 제한되지 않으나, 신호 펩티드 또는 세포내 위치지정 신호일 수 있다.
용어 "신호 펩티드"는 분비된 성숙 단백질에 선행하는 아미노산 말단 폴리펩티드를 말한다. 신호 펩티드는 분열되므로, 성숙 단백질에 존재하지 않는다. 신호 펩티드는 분비된 단백질을 세포막을 통해 배향 및 위치이동시키는 기능이 있다. 신호 펩티드는 또한 신호 단백질이라고도 칭한다.
"신호 서열"은 세포의 표면에서 발현되는 단백질의 코딩 서열 시작부에 포함되어 있다. 이 서열은 폴리펩티드를 위치이동시키도록 숙주세포를 배향시키는 신호 펩티드의 성숙 폴리펩티드 쪽 N-말단을 코딩한다. 용어 "위치이동 신호 서열"은 또한 이러한 형태의 신호 서열을 말하는 용어로 사용할 수도 있다. 위치이동 신호 서열은 진핵세포와 원핵세포에서 기원하는 다양한 단백질과 관련하여 발견될 수 있으며, 보통은 이들 양쪽 유기체 모두에서 기능한다.
용어 "동종성"은 2개의 폴리뉴클레오티드 또는 2개의 폴리펩티드 분자 간의 동일성을 백분율로 나타낸 것을 말한다. 하나의 분자와 또 다른 분자의 서열 간 상응성은 당해 분야의 공지 기술에 따라 결정할 수 있다. 예를 들어, 동종성은 2개의 폴리펩티드 분자간 서열 정보를 배열하고 용이하게 이용가능한 컴퓨터 프로그램을 사용하여 이들 정보를 직접 비교하여 결정할 수 있다. 대안적으로, 동종유래 영역 간에 안정된 중복체 (duplex: 2사슬 DNA 분자)를 형성하는 조건하에 폴리뉴클레오티드를 혼성화하고, 단일-가닥 특이적 뉴클레아제(들)로 이를 소화처리 및 소화된 절편의 크기를 측정으로써 동종성을 결정할 수도 있다.
따라서, 모든 문법적 형식에서의 "서열 유사성"이란 용어는 공통의 진화론적 기원을 공유하거나 하지 않을 수 있는 단백질의 핵산이나 아미노산 서열 간의 동일성 정도, 동종성 또는 상응성을 의미한다 (Reeck et al., 1987, Cell 50:667 참조, 그의 내용 전체를 본원에 참조로서 인용한다). 어떤 구현예에서, 2개의 DNA 서열은, 약 50% 이상, 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 약 97% 이상, 약 98% 이상, 약 99% 이상의 뉴클레오티드가 한정된 길이의 DNA 또는 아미노산 서열과 일치할 때 "실질적으로 동종유래" 또는 "실질적으로 유사"하다. 실질적으로 동종유래인 서열은, 예를 들어, 당해 분야의 통상의 기술자가 이해할 수 있는 엄격한 조건하에 서열 데이터뱅크 또는 사우던(Southern) 혼성화 실험에서 사용되는 표준 소프트웨어를 이용하여 서열을 비교함으로써 확인 동정할 수 있다. 예를 들어, 엄격한 혼성화 조건은 타겟, "프로브" 또는 검출-시약 DNA를 혼성화하여 약 45℃의 6×염화나트륨/시트르산 나트륨 (SSC)에서 결합 DNA를 여과하고, 약 50 내지 65℃ 및 0.2×SSC와 0.1% SDS에서 1회 이상 세척하고, 다시 약 68℃ 및 0.1×SSC와 0.2% SDS에서 1회 이상 세척하는 것을 포함하거나 이것으로 이루어질 수 있으며; 또는 당해 분야의 통상의 기술자에게 공지된 다른 엄격한 혼성화 조건일 수 있다 (예를 들어, Ausubel, F. M. et al., eds., 1989 Current Protocols in Molecular Biology, Green publishing associates, Inc., and John Wiley & Sons Inc., New York, at pages 6.3.1-6.3.6 및 2.10.3 참조). 이러한 폴리펩티드를 코딩하는 폴리뉴클레오티드 역시 본 발명에 포함된다.
본 명세서에서 폴리펩티드의 2개의 핵산 서열이나 아미노산 서열의 "동일한" 또는 "서열 동일성"은 특정 비교창에서 최대 상응성과 관련하여 배열시 동일한 2개의 서열내 잔사를 말한다. 본원에서 사용한 바와 같이, "비교창"은 약 10개 이상, 약 20개 이상, 약 50개 이상, 약 100개 이상, 약 200개 이상, 약 300개 이상, 약 500개 이상 또는 약 1000개 이상의 잔사로 된 세그먼트를 말하며, 잔사내 각 서열을 동일한 수의 연속 위치를 가진 기준 서열과 최적으로 배열한 뒤 비교할 수 있다. 비교를 위한 서열의 배열법은 당해 분야에 주지되어 있다. 비교를 위한 최적의 서열 배열은 국소 동일성 알고리즘 (Smith and Waterman (1981) Adv. Appl. Math. 2:482; 그의 내용 전체를 본원에 참조로서 인용한다); 배열 알고리즘 (Needleman and Wunsch (1970) J. Mol. Biol. 48:443; 그의 내용 전체를 본원에 참조로서 인용한다); 유사성 검색법 (Pearson and Lipman (1988) Proc. Nat. Acad. Sci U.S.A. 85:2444; 그의 내용 전체를 본원에 참조로서 인용한다); 및 이들 알고리즘의 컴퓨터처리 실행 (제한되지 않으나, Intelligentics, Mountain View Calif사의 PC/유전자 프로그램의 CLUSTAL, 및 Wisconsin Genetics Software Package Genetics Computer Group (GCG)사의 GAP, BESTFIT, BLAST, FASTA, 및 575 Science Dr., Madison, Wis사의 TFASTA, U.S.A. 등을 포함)으로 수행할 수 있으며; CLUSTAL 프로그램은 Higgins and Sharp (1988) Gene 73:237-244 및 Higgins and Sharp (1989) CABIOS 5:151-153; Corpet et al. (1988) Nucleic Acids Res. 16:10881-10890; Huang et al. (1992) Computer Applications in the Biosciences 8:155-165; and Pearson et al. (1994) Methods in Molecular Biology 24:307-331 등에 잘 기재되어 있으며, 이들 각각의 내용 전체를 본원에 참조로서 인용한다. 컴퓨터 소프트웨어-기반의 배열 이외에, 수동 검사와 수동 배열로도 정렬할 수 있다.
일종의 구현예에서, 디폴트 파라미터를 이용하여 (가령, BLASTP, CLUSTAL 또는 다른 정렬 소프트웨어에 따라 측정시) 폴리펩티드는 기준 폴리펩티드나 그의 절편과 70%, 70% 이상, 75%, 75% 이상, 80%, 80% 이상, 85%, 85% 이상, 90%, 90% 이상, 95%, 95% 이상, 97%, 97% 이상, 98%, 98% 이상, 99%, 99% 이상 또는 100% 동일하다. 마찬가지로, 핵산은 출발 핵산을 기준으로 해서 설명할 수도 있으며, 예컨대, 디폴트 파라미터를 이용하여 (가령, BLASTN, CLUSTAL 또는 다른 정령 소프트웨어에 따라 측정시) 기준 핵산이나 그의 절편에 대해 50%, 50% 이상, 60%, 60% 이상, 70%, 70% 이상, 75%, 75% 이상, 80%, 80% 이상, 85%, 85% 이상, 90%, 90% 이상 95%, 95% 이상, 97%, 97%, 98%, 98% 이상, 99%, 99% 이상 또는 100% 동일하다. 하나의 분자가 더 큰 분자에 대해 특정 백분율의 서열 동일성을 갖는다는 것은, 2개의 분자가 최적으로 배열되는 경우, 더 작은 분자내 잔사의 상기 백분율로 2개의 분자를 최적으로 배열하는 순서에 따라 더 큰 분자내에서 상응하는 잔사를 찾아내는 것을 말하며, "%" (퍼센트) 동일성은 보다 작은 분자의 길이에 따라 계산한다.
핵산이나 아미노산 서열에 적용되는 바와 같이, "실질적으로 동일한"이란 용어는 핵산이나 아미노산 서열이 기준 서열과 비교하여, 70%, 70% 이상, 75%, 75% 이상, 80%, 80% 이상, 85%, 85% 이상, 90%, 90% 이상, 95%, 95% 이상, 97%, 97% 이상, 98%, 98% 이상, 99%나 99% 이상, 또는 100%의 동일성을 갖는 서열을 포함하거나 이것으로 이루어질 수 있는 것을 의미한다. 전술한 바와 같이, 서열의 동일성은 예를 들어 당해 분야의 통상의 기술자에게 주지되고 일상적으로 사용되는 프로그램을 이용하여 계산할 수 있다. 예를 들어, (뉴클레오티드 서열용) BLASTN 프로그램은 디폴트로서 문자 길이(W) 11, 예상값(E) 10, M=5, N=-4 및 양측 가닥의 비교값을 이용한다. 아미노산 서열의 경우, BLASTP 프로그램은 디폴트로서 문자 길이(W) 3, 예상값(E) 10 및 BLOSUM62 기록 매트릭스를 사용한다 (Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 (1992) 참조, 그의 내용 전체를 본원에 참조로서 인용한다). 비교창에서 최적으로 배열된 2개의 서열을 비교함으로써 서열 동일성 백분율을 결정하며, 이때 비교창에서 폴리뉴클레오티드 서열의 일부는 2개의 서열의 최적 배열을 위한 기준 서열 (추가나 제거가 포함되지 않은)과 비교하여 첨가나 제거 (즉, 갭)를 포함할 수 있다. 양측 서열에서 동일한 핵산 염기나 아미노산 잔사가 발생하는 위치의 개수를 측정하여 그와 일치하는 위치의 개수를 구하고, 상기 일치하는 위치의 개수를 비교창내 위치의 전체 개수로 나누고, 그 결과값에 100을 곱해서 서열 동일성의 백분율을 구함으로써, 백분율을 계산한다. 바람직하게, 실질적 동일성은 약 10 이상, 약 20 이상, 약 50 이상, 약 100 이상, 약 200 이상, 약 300 이상, 약 500 이상 또는 약 1000 이상의 잔사로 된 길이를 갖는 서열의 소정 영역에 걸쳐 존재한다. 가장 바람직한 구현예에서, 이 서열은 코딩 영역의 전체 길이에 걸쳐 실질적으로 동일하다.
(이의 기능적 부분 및 기능적 변이체를 포함한) 본원에 기재된 단백질은 하나 이상의 자연발생 아미노산 대신 합성 아미노산을 포함할 수 있다. 이러한 합성 아미노산은 공지되어 있으며, 예를 들어, 제한되지 않으나, 아미노시클로헥산, 카복실산, 노르류신, α-아미노 n-데카노익산, 호모세린, S-아세틸아미노메틸-시스테인, 트랜스-3- 및 트랜스-4-히드록시프롤린, 4-아미노페닐알라닌, 4-니트로페닐알라닌, 4-클로로페닐알라닌, 4-카복시페닐알라닌, β-페닐세린, β-히드록시페닐알라닌, 페닐글리신, α-나프틸알라닌, 시클로헥실알라닌, 시클로헥실글리신, 인돌린-2-카복실산, 1,2,3,4-테트라히드로이소퀴놀린-3-카복실산, 아미노말론산, 아미노말론산 모노아미드, N'-벤질-N'-메틸-리신, N',N'-디벤질-리신, 6-히드록실리신, 오르니틴, α-아미노시클로펜탄 카복실산, α-아미노시클로헥산 카복실산, α-아미노시클로헵탄 카복실산, α-(2-아미노-2-노르보르난)-카복실산, α,γ-디아미노부티르산, α,β-디아미노프로피온산, 호모페닐알라닌 및 α-tert-부틸글리신을 포함할 수 있다.
"실질적으로 정제된"이란 용어는 폴리뉴클레오티드, 단백질, 폴리펩티드 및, 핵산, 폴리펩티드, 단백질 또는 다른 화합물이 자연 조합된 다른 분자들이 실질적으로 제거된, 즉, 50% 이상 제거된, 70% 이상 제거된, 또는 90% 이상 제거된 핵산 서열, 폴리펩티드, 단백질 또는 다른 화합물을 말한다.
"합성 유전자"는 당해 분야의 통상의 기술자에게 공지된 방법을 이용하여 화학적으로 합성되는 올리고뉴클레오티드 구축 블록(building block)을 이용하여 조립할 수 있다. 이러한 구축 블록은 결찰 및 어닐링 처리하여 유전자 세그먼트를 형성하고 이를 다시 효소적으로 조립하여 전체 유전자를 구축한다. DNA 서열과 관련되는 바와 같이, "화학적으로 합성된"이란 성분 뉴클레오티드를 시험관내 조립한 것을 말한다. 수동 방식의 화학적 DNA 합성은 잘 확립된 절차에 따라 수행할 수 있다. 통상의 기술자는 유전자가 발현될 숙주세포나 유기체가 선호하는 코돈쪽으로 코돈의 사용이 치우칠 경우, 유전자 발현의 개선 가능성을 이해할 수 있다. 바람직한 코돈의 결정은 서열 정보를 이용할 수 있는 숙주세포로부터 유도된 유전자의 연구조사에 기초하여 이루어질 수 있다.
폴리펩티드, 뉴클레오티드 또는 이들의 절편과 관련하여 사용하는 경우, 용어 "혼성"은 본원에서 사용하는 바와 같이, 폴리펩티드, 폴리뉴클레오티드 또는 이들의 절편을 말하는 것으로, 그의 아미노산 및/또는 뉴클레오티드 서열은 자연에서 발견되지 않는다. 예를 들어, 2개의 이종유래 단백질이나 폴리펩티드의 융합 단백질 또는 융합 폴리펩티드를 코딩하는 cDNA 등이 있다.
"리간드 유도성 폴리펩티드 결합제"와 "리간드 유도성 폴리펩티드 결합제(들)"을 관계없이 "LIPC"와 "LIPCs"로 상호교환적으로 사용하며, 즉, "LIPC"는 "결합제" (단수형)이나 "결합제들" (복수형)을 의미할 수 있다. 이와 같이, LIPC는 핵 수용체 폴리펩티드 성분을 융합 단백질에 도입함으로써 (가령, H 그룹 핵 수용체와 EcR 수용체 폴리펩티드 성분 (가령, EcR 폴리펩티드 절편이나 도메인)), 소분자 리간드 의존 방식으로 폴리펩티드를 묶는 ("결합", 즉, 올리고머화, 이량화 등) 시스템, 및 이 시스템의 폴리펩티드 성분을 말하며; 이는 본원에 기재된 바와 같은 EcR 리간드 결합 폴리펩티드와 핵 수용체 USP 및/또는 RXR 핵 수용체 폴리펩티드 성분 (가령, 폴리펩티드 절편이나 그의 도메인)을 포함한다.
활성화 리간드의 투여 및 LIPC 성분의 구성을 이용하여 이량화 및 폴리펩티드 결합 활성화의 위치와 타이밍을 조절할 수 있다. LIPC는 숙주에서 기원한 것이 아니라 이종유래 서열이 코딩하는 유전자에 의해 코딩되는 단백질 인자에 의존한다. 숙주계의 폴리펩티드 성분의 공간적 및 시간적인 조합을 제어하는데 이용하는 LIPC는 박테리아, 이스트, 식물, 곤충 또는 바이러스로부터 유래될 수 있다. 따라서, LIPC 핵 수용체 폴리펩티드 성분은 LIPC 성분이 함께 "융합된" (즉, 융합 단백질이 되도록 가공한) 폴리펩티드나 단백질의 조합 (가령, 이량화, 올리고머화)을 제어하는 메커니즘을 제공함으로써, 숙주내에서의 활용성을 부여한다.
"유전 스위치"는 "유전자 스위치"나 "전사 스위치"라고도 칭하며, 유전자 발현을 제어하는데 이용하고, 또한 이식 유전자를 의도한대로 조절하도록 인공적으로 설계되어 있다. 유전자 스위치는 통상적으로 그의 활성을 조절할 수 있는 전사촉진자나 전사억제자 및 관심 대상의 유전자를 제어하기 위한 전사촉진자-반응성 또는 전사억제자-감응성 프로모터를 코딩한다. 이들 인자는 DNA-결합 도메인, 리간드-결합 도메인 및 전사 활성 도메인을 각각 함유하는 리간드-반응성 키메릭 단백질일 수 있다. 이들은, 예를 들어, 테트라사이클린-감지성 전사촉진자 및 전사억제자, 포유동물이나 곤충 스테로이드 수용체-유래의 전사촉진자 및 라파마이신-유래의 전사촉진자에 기초한 항생제 반응성 스위치를 포함한다. 또 다른 유전 스위치는 의도한대로 물리적 단선이나 신호에 의해 활성화될 수 있는 내인성 전사 인자를 사용하며, 이들 인자의 일시적 활성화는 숙주세포에 의해 억제된다. 이러한 형태의 시스템은 예를 들어, 열이나 전리방사선에 의해 활성화될 수 있는 전사 인자를 사용할 수 있는 유전자 스위치를 포함한다. (가령, Auslander, S. and Fussenegger, M. (2012); Trend in Biotechnology (electronic release) pp. 1-14; Vilaboa N, Boellmann F, Voellmy R (2011) Gene Switches for Deliberate Regulation of Transgene Expression: Recent Advances in System Development and Uses. J Genet Syndr Gene Ther 2:107 참조, 이들 각각의 내용 전체를 본원에 참조로서 인용한다).
일 구현예에서, 유전 스위치는 다음의 성분들을 포함한다: 1) 활성체 리간드가 존재하지 않을 때 불안정하고 비생산적인 이종이량체를 형성하는 공통-활성화 파트너 (Co-Activation Partner, CAP) 및 리간드-유도성 전사 인자 (Ligand-inducible Transcription Factor, LTF); 2) 활성체 리간드: 분자 (가령, 엑디손 유사체나 다른 비스테로이드 소분자); 및 3) 유도성 프로모터 (가령, LTF를 결합시키는 맞춤형 프로모터). 일 구현예에서, 유전 스위치는 소분자 활성체 리간드가 스위치 성분 (CAP 및 LTF)와 결합하여 유도성 프로모터로부터의 유전자 전사를 활성화할 때만 형질도입된 유전자의 발현을 허용하며, 궁극적으로 원하는 단백질을 발현하게 된다. 유전 스위치의 타이밍, 위치 및 농도는 활성체 리간드와 함께 용량 의존적 방식으로 조절할 수 있다. 어떤 구현예에서, 출원인이 개발한 EcR-기반 유전 스위치 (예를 들어, 제품명 RHEOSWITCH® 참조)를 본 발명의 리간드 유도성 폴리펩티드 결합제(LIPCs)를 생성하는 성분으로 사용한다 (예를 들어, PCT 특허출원 공개 제 WO 2001/070816호, WO 2002/066612호, WO 2002/066613호, WO 2002/066614호, WO 2002/066615호, WO 2003/027266호, WO 2003/027289호 및 WO 2005/108617호 참조, 이들 각각의 내용 전체를 본원에 참조로서 인용한다).
본 발명에서, EcR-기반 "유전 스위치"의 성분들은 본원의 명세서에 기재하고 구상한 "리간드 유도성 폴리펩티드 결합제"를 제작하는데 이용된다. "엑디손 수용체" 및 "EcR"은 본원에서 상호교환적으로 사용하며, 제 1서브패밀리 H 그룹 (본원에서는 "H 그룹 핵 수용체" 라고 칭함)으로 분류된 핵 수용체의 절지동물 수퍼패밀리의 일원을 말한다. 각 그룹의 일원은 E (리간드 결합) 도메인에서 40 내지 60%의 아미노산 동일성을 공유한다 (Laudet et al., A Unified Nomenclature System for the Nuclear Receptor Subfamily, 1999; Cell 97: 161-163, 이 문헌의 내용 전체를 본원에 참조로서 인용한다). 엑디손 수용체 이외에, 이 핵 수용체 제 1서브패밀리 H 그룹의 다른 일원으로는: 유비쿼터스 수용체 (ubiquitous receptor, UR), 오르판 제 1수용체 (Orphan receptor 1, OR-1), 스테로이드 호르몬 제 1핵 수용체 (NER-1), RXR 상호작용 단백질-15 (RXR interacting protein-15, RIP-15), 간 x 수용체 β (liver x receptor β, LXRβ), 스테로이드 호르몬 수용체 유사 단백질 (RLD-1), 간 x 수용체 (liver x receptor, LXR), 간 x 수용체 α (liver x receptor α, LXRα), 파르네소이드 x 수용체 (farnesoid x receptor, FXR), 수용체 상호작용 단백질 14 (receptor interacting protein 14, RIP-14) 및 파르네솔 수용체 (HRR-1) 등을 포함한다. EcR 단백질은 서명 DNA와 리간드 결합 도메인 (LBD) 및 활성화 도메인을 특징으로 한다 (Koelle et al. 1991, Cell, 67:59-77 참조, 그의 내용 전체를 본원에 참조로서 인용한다). EcR 수용체는 다수의 스테로이드성 및 비스테로이드성 화합물, 즉, 활성화 리간드에 대해 반응성이 있다.
"레티노이드 X 수용체" 및 "RXR"은 본원에서 상호교환적으로 사용하며, 핵 호르몬 수용체 패밀리의 일원, 특히, 스테로이드와 티로이드 호르몬 수용체 수퍼패밀리의 일원을 말한다. 척추동물 RXR은 3개 이상의 서로 구별되는 유전자 (RXR 알파, 베타 및 감마)를 포함하며, 이들은 상이한 프로모터 사용법 및 선택적 스플라이싱을 통해 다수의 단백질 산물을 생성한다. RXR의 무척추동물 동종체 (가령, 초기문(ultraspiracle, USP) 단백질)는 광범위한 종에서 발견되며, 본 발명에서 사용하는 것을 구상하고 있다.
본원에서 사용한 바와 같이, "활성화 리간드"는 핵 스테로이드 수용체 수퍼 패밀리 (가령, EcR 및 RXR)의 일원에 결합하고, 핵 수용체 성분들의 조합 (가령, 이량화, 올리고머화, 또는 단백질-단백질 상호작용)을 유도함으로써 상기 일원을 활성화할 수 있는 화합물을 말한다. 예시적인 본 발명의 활성화 리간드는 아래와 같이 제공된다.
본원에서 사용한 바와 같이, "비활성" 또는 "비활성화된"이란 용어는, 비활성 폴리펩티드, 도메인, 신호발생 분자, 단백질이나 폴리펩티드 절편, 또는 폴리펩티드의 단백질 서브유닛 등과 관련하여, 현재 하나 이상의 고유의 생물학적 기능이나 활성을 모두 또는 실질적으로 모두 생성하지 않는 단백질이나 폴리펩티드를 의미한다. 일부 구현예에서, 비활성이나 비활성화된 단백질 또는 폴리펩티드는 또 다른 단백질이나 폴리펩티드, 즉, 단백질-단백질 상호작용과 조합함으로써 활성화된다. 이러한 활성화는, 예를 들어, 제 1핵 수용체 리간드 결합 단백질 절편을 제 2핵 수용체 단백질 절편과 결합시켜 유도한 올리고머화 반응을 통해 발생할 수 있으며, 이때 제 1 및 제 2핵 수용체 절편은 2개의 단리된 더 큰 제 1 및 제 2이종유래 폴리펩티드의 일부이며, 제 1 및 제 2이종유래 폴리펩티드는 리간드 유도된 올리고머화 반응시에 생물학적 비활성 상태에서 생물학적 활성 상태로 변화한다.
본원에서 사용한 바와 같이, "T 세포"나 "T 림프구"는 세포매개 면역성에 중심 역할을 하는 종류의 림프구이다. 이들은 세포 표면에서 T-세포 수용체 (T-cell receptor, TCR)의 존재에 의해 다른 림프구, 예컨대, B 세포와 자연 킬러 세포 (natural killer (NK) cells)로부터 구별될 수 있다.
본원에서 사용한 바와 같이, "항체"는 단클론 또는 다중클론 항체를 말한다. 본원에서 사용한 바와 같이, "단클론 항체"란 용어는 동일한 에피토프에 결합되는 항체를 말한다 (예를 들어, B-세포의 단일 클론에 의해 생성되는 항체). 대조적으로, "다중클론 항체"는 동일한 항원의 상이한 에피토프에 결합되는 항체의 집단을 말한다 (예를 들어, 상이한 B-세포의 이종유래 혼합물에 의해 생성되는 항체). 리간드 유도성 폴리펩티드 결합제 (LIPC).
본원에 기재한 리간드 유도성 폴리펩티드 결합제 (LIPC)는, 개별 단백질이나 도메인을 합쳐서 이들의 조합을 유도하는 (가령, 이량화, 올리고머화) 상호작용 핵 수용체 단백질쌍의 능력을 활용하는 것이며, (LIPC (즉, 핵 수용체) 성분을 가공하여 융합 단백질을 생성함으로써), 그렇지 않은 경우 단백질이나 도메인 (가령, 통상은 활성 신호발생 복합체를 형성하기 위해 이량화 처리가 필요한 수용체 티로신 키나제 폴리펩티드 (RTKs) 같은 단리된, 생물학적으로 비활성인 폴리펩티드 모노머)은 각각 개별 단리된 상태이다. 어떤 구현예에서, 본 발명의 스위치 시스템은 엑디손 수용체 (EcR)-기반 시스템이다. 엑디손 수용체-기반 리간드 유도성 폴리펩티드 결합제는 "모계" 비-핵 수용체 (LIPC) 폴리펩티드 성분이나 도메인에 있어서 이종이량체나 동종이량체일 수 있다. 한편, 기능적 핵 수용체 (가령, EcR 복합체)는 일반적으로 스테로이드 수용체 패밀리 중 2 이상의 일원을 함유하는 이종이량체 단백질 복합체를 말한다. 예를 들어, 각종 곤충류에서 얻은 엑디손 수용체 단백질, 초기문 (USP) 단백질이나 USP의 척추동물 동종체, 레티노이드 X 수용체 (RXR) 단백질 등이 있다 (가령, Yao, et al. (1993) Nature 366, 476-479 및 Yao, et al., (1992) Cell 71, 63-72 참조, 이들 각각의 내용 전체를 본원에 참조로서 인용한다).
본 발명은, 예컨대, 폴리펩티드나 도메인 (가령, 신호발생 분자, 신호발생 도메인, 상보 단백질 절편, 단백질 서브유닛 및 자연이나 가공된 부분 또는 절단 단백질)을 단리하기 위해 융합된 EcR 및 USP/RXR 성분을 코딩하는 2개 이상의 발현 카세트를 포함할 수 있다. 활성 리간드의 존재시에, EcR-함유 폴리펩티드와 USP/RXR-함유 폴리펩티드의 상호작용에 따라 부착된 (융합) 단백질이나 근접한 도메인을 조합할 수 있다 (단백질-단백질 상호작용). 예를 들어 도 2 내지 6을 참조한다.
엑디손 수용체 복합체는 전형적으로 핵 수용체 수퍼패밀리의 일원인 단백질을 포함하며, 상기 패밀리의 모든 일원은 일반적으로 아미노-말단 전사촉진 도메인, DNA 결합 도메인 (DNA binding domain, "DBD") 및 힌지 영역에 의해 DBD로부터 단리된 리간드 결합 도메인 (ligand binding domain, "LBD")을 특징으로 한다. 핵 수용체 수퍼패밀리의 일원들은 또한 4개 또는 5개의 도메인: A/B, C, D, E, 및 일부 일원의 경우 F 도메인의 존재를 특징으로 한다 (가령, US 특허 제 4,981,784호 및 Evans, Science 240:889-895 (1988) 참조, 이들 각각의 내용 전체를 본원에 참조로서 인용한다). "A/B" 도메인은 전사촉진 도메인에 상응하며, "C"는 DNA 결합 도메인에, "D"는 힌지 영역에, 및 "E"는 리간드 결합 도메인에 상응한다. 패밀리의 일부 일원은 또한 "F"에 상응하는 LBD의 카복시-말단면 상에 또 다른 전사촉진 도메인을 가질 수도 있다.
이러한 도메인은 자연형 (즉, 자연발생형), 변형 또는 상이한 핵 수용체 단백질로부터 얻은 도메인의 키메릭 (즉, 이종유래 융합 단백질)일 수 있다. EcR, USP 및 RXR의 도메인은 모듈형이므로, LBD, DBD 및 전사촉진 도메인을 상호교환할 수 있다.
어떤 구현예에서, 쌍시류 (초파리 Drosophila melanogaster) 나 인시류 (가문비나무 모충 Choristoneura fumiferana) 초기문 단백질 (USP)이 LIPC 시스템의 일부로서 활용된다. 어떤 구현예에서, 척추동물이나 포유동물 레티노이드 X 수용체 (RXR) (가령, 국제 특허출원 공개 제 WO/2001/070816호 참조, 그의 내용 전체를 본원에 참조로서 인용한다)가 LIPC 시스템의 일부로서 활용된다. 어떤 구현예에서, 메뚜기 (Locusta migratoria)의 초기문 단백질 ("LmUSP"), 참진드기 (Amblyomma americanum)의 RXR 제 1동종체 및 RXR 제 2동종체 (각각 "AmaRXRl" 및 "AmaRXR2,") 및 이들의 비-쌍시류, 비-인시류 동종체는, 제한되지 않으나: 농게 (Celuca pugilator) RXR 동종체 ("CpRXR"), 딱정벌레 (Tenebrio molitor) RXR 동종체 ("TmRXR"), 꿀벌 (Apis mellifera) RXR 동종체 ("AmRXR"), 및 진딧물 (Myzus persicae) RXR 동종체 ("MpRXR") 등을 포함하고, 이들은 종합적으로 무척추동물 RXRs 이라고 칭하며, (또한 척추동물 레티노이드 X 수용체 (RXR)와 유사한 기능을 할 수 있고) LIPC 시스템의 일부로서 활용한다.
EcR 성분
본 발명은 엑디손 수용체 (EcR) 폴리펩티드 성분, 예를 들어, 본원에 기재된 리간드 유도성 폴리펩티드 결합제 시스템에 사용되는 EcR 리간드 결합 도메인 (LBD)을 제공한다. 본 발명에서 사용할 수 있는 예시적인 EcR 성분은, 예를 들어, 국제 PCT 공보 제 WO 2001/070816호, WO 2002/066612호, WO 2002/066613호, WO 2002/066614호, WO 2002/066615호, WO 2003/027266호, WO 2003/027289호, WO 2005/108617호 및 WO 2009/114201호에 기술되어 있으며, 이들 각각의 내용 전체를 본원에 참조로서 인용한다.
어떤 구현예에서, LIPC EcR 성분은 EcR 리간드 결합 도메인 (LBD)이거나, 이와 관련된 스테로이드/티로이드 호르몬 핵 수용체 패밀리 일원 LBD, 유사체, 조합, 변형, 또는 그의 절편이다. 일부 구현예에서, LIPC LBD는 절단 EcR 폴리펩티드나 EcR LBD로부터 얻는다. 절단 또는 그의 치환 돌연변이는 당해 분야에서 사용하는 임의의 방법으로, 제한되지 않으나, 제한 엔도뉴클레아제 소화/제거, PCR-매개 올리고뉴클레오티드 배향의 제거, 화학적 순정세대교번 (mutagenesis), DNA 가닥 절단 등을 포함하는 방법에 따라 제작할 수 있다.
LIPC EcR 폴리펩티드 성분은 무척추동물 EcR, 예를 들어 절지동물계에서 선택된다. 일부 구현예에서, LIPC EcR 폴리펩티드 성분 (또는 그의 절편)은 인시류 EcR, 쌍시류 EcR, 메뚜기목 EcR, 동시류 EcR 및 반시류 EcR로 이루어진 군에서 선택된다. 특별한 구현예에서, EcR은 가문비나무 모충 (Choristoneura fumiferana) EcR ("CfEcR"), 딱정벌레 (Tenebrio molitor) EcR ("TmEcR"), 박각시나방 (Manduca sexta) EcR ("MsEcR"), 담배나방 ( Heliothies virescens ) EcR ("HvEcR"), 깔따구 (Chironomus tentans) EcR ("CfEcR"), 누에나방 (Bombyx mori) EcR ("BmEcR"), 초파리 (Drosophila melanogaster) EcR ("DmEcR"), 모기 (Aedes aegypti) EcR ("AaEcR"), 검정파리 (Lucilia capitata) EcR ("LcEcR"), 검정파리 (Lucilia cuprina) EcR ("LucEcR"), 지중해 초파리 (Ceratitis capitata) EcR ("CcEcR"), 메뚜기 (Locusta migratoria) EcR ("LmEcR"), 진딧물 (Myzus persicae) EcR ("MpEcR"), 농게 (Celuca pugilator) EcR ("CpEcR"), 참진드기 (Amblyomma americanurn) EcR ("AmaEcR"), 가루이 (Bamecia argentifoli) EcR ("BaEcR", SEQ ID NO: 20) 또는 매미충 (Nephotetix cincticeps) EcR ("NcEcR", SEQ ID NO: 21) 중에서 선택된다. 일 구현예에서, LIPC LBD (또는 그의 절편)은 가문비나무 모충 (Choristoneura fumiferana) EcR ("CfEcR")이나 초파리 (Drosophila melanogaster) EcR ("DmEcR") 중에서 선택된다.
일부 구현예에서, LIPC LBD는 절단 EcR 폴리펩티드로부터 얻는다. 어떤 구현예에서, LIPC EcR 폴리펩티드 절단시 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 105, 110, 115, 120, 125, 130, 135, 140, 145, 150, 155, 160, 165, 170, 175, 180, 185, 190, 195, 200, 205, 210, 215, 220, 225, 230, 235, 240, 245, 250, 255, 260 또는 265개 이상의 아미노산이 제거된다. 바람직하게, LIPC EcR 폴리펩티드를 절단하면, 적어도 일부의 폴리펩티드 도메인이 제거된다. 더욱 바람직하게, LIPC EcR 폴리펩티드를 절단하면, 적어도 거의 전체의 폴리펩티드 도메인이 제거된다. 어떤 구현예에서, LIPC EcR 폴리펩티드를 절단하면, 적어도 A/B-도메인, C-도메인, D-도메인, F-도메인, A/B/C-도메인, A/B/l/2-C-도메인, A/B/C/D-도메인, A/B/C/D/F-도메인, A/B/F-도메인, A/B/C/F-도메인, 일부 E 도메인 또는 일부 F 도메인이 제거된다. 수개의 전체 및/또는 일부 도메인의 제거를 조합하여 수행할 수도 있다.
일부 구현예에서, LIPC 엑디손 수용체 폴리펩티드 성분이나 절편은 SEQ ID NO: 22 (CfEcR-EF), SEQ ID NO: 23 (DmEcR-EF), SEQ ID NO: 24 (CfEcR-DE) 또는 SEQ ID NO: 25 (DmEcR-DE)의 핵산 서열을 포함하는 폴리뉴클레오티드나 그의 절편에 의해 코딩된다.
일부 구현예에서, LIPC 엑디손 수용체 폴리펩티드 성분이나 그의 절편은 SEQ ID NO: 1 (CfEcR-DEF), SEQ ID NO: 2 (CfEcR-CDEF), SEQ ID NO: 3 (DmEcR-DEF), SEQ ID NO: 4 (TmEcR-DEF) 또는 SEQ ID NO: 5 (AmaEcR-DEF)의 핵산 서열을 포함하는 폴리뉴클레오티드 또는, 그의 절편에 의해 코딩된다.
어떤 구현예에서, LIPC 엑디손 수용체 폴리펩티드 성분은 SEQ ID NO: 26 (CfEcR-EF), SEQ ID NO: 27 (DmEcR-EF), SEQ ID NO: 28 (CfEcR-DE), 또는 SEQ ID NO: 29 (DmEcR-DE)의 아미노산 서열, 또는 그의 절편을 포함한다. 일부 구현예에서, LIPC 엑디손 수용체 폴리펩티드 성분은 SEQ ID NO: 6 (CfEcR-DEF), SEQ ID NO: 8 (CfEcR-CDEF), SEQ ID NO: 7 (DmEcR-DEF), SEQ ID NO: 9 (TmEcR-DEF) 또는 SEQ ID NO: 10 (AmaEcR-DEF)의 아미노산 서열, 또는 그의 절편을 포함한다.
또한, 엑디손 수용체-기반 유도성 유전자 발현 ("유전자 스위치")에서 리간드 감지도 및 유전자 발현 유도의 크기에 영향을 미치는 H 그룹 핵 수용체 리간드 결합 도메인 (가령, EcR 리간드 결합 도메인)에 대한 리간드 결합에 수반한 아미노산 잔사가 동정되었다 (가령, 국제 특허출원 공개 제 WO 02/066612호 참조, 그의 내용 전체를 본원에 참조로서 인용한다). 이들 치환 돌연변이체 핵 수용체 폴리펩티드, 및 LIPC 시스템에서 이들의 사용으로, 리간드 감지도 및 리간드 유도된 올리고머화 반응 크기를 응용분야에 따라 원하는 범위로 선택 조정 (조정, 제어)할 수 있는, 숙주세포 및 유기물 내에서 리간드 유도 ("활성화된") 폴리펩티드 결합을 개선할 수 있다. 추가로 후술하는 바와 같이, 치환 돌연변이체를 포함하는 H 그룹 핵 수용체 (여기서는 "치환 돌연변이"라고 칭함)를 본 발명의 리간드 유도성 폴리펩티드 결합제 (LIPC)에 이용할 수 있다.
본 발명에서 사용하는 LIPC 엑디손 수용체 (EcR) 폴리펩티드 성분 (EcR 리간드 결합 도메인 (LBD) 포함)은, 예를 들어, 절지동물류 EcR 중에서 선택된 무척추동물 EcR로부터 얻을 수 있다. 어떤 구현예에서, LIPC EcR 폴리펩티드 성분은 인시류 EcRn, 쌍시류 EcR, 직시류 EcR, 동시류 EcR 및 반시류 EcR로 이루어진 군에서 선택된다. 어떤 구현예에서, 본 발명에서 사용하기 위한 EcR 리간드 결합 도메인은 가문비나무 모충 (Choristoneura fumiferana) EcR ("CfEcR"), 딱정벌레 (Tenebrio molitor) EcR ("TmEcR"), 박각시나방 (Manduca sexta) EcR ("MsEcR"), 담배나방 (Heliothies virescens) EcR ("HvEcR"), a 깔따구 (Chironomus tentans) EcR ("CtEcR"), 누에나방 모충 (Bombyx mori) EcR ("BmEcR"), 스퀸팅 부시브라운 나비 (Bicyclus anynana) EcR ("BanEcR"), 남방 공작나비 (Junonia coenia) EcR ("JcEcR"), 초파리 (Drosophila melanogaster) EcR ("DmEcR"), 모기 (Aedes aegypti) EcR ("AaEcR"), 검정파리 (Lucilia capitata) ("LcEcR"), 검정파리 (Lucilia cuprina) EcR ("LucEcR"), 검정파리 (Caliphora vicinia) EcR ("CvEcR"), 지중해 초파리 (Ceratitis capitata) EcR ("CcEcR"), 메뚜기 (Locusta migratoria) EcR ("LmEcR"), 진딧물 (Myzus persicae) EcR ("MpEcR"), 농게 (Celuca pugilator) EcR ("CpEcR"), 참진드기 (Amblyomma americanum) EcR ("AmaEcR"), 가루이 (Bamecia argentifoli) EcR 또는 매미충 (Nephotetix cincticeps) EcR 등으로부터 얻는다. 일부 구현예에서, LIPC 폴리펩티드 성분은 CfEcR, DmEcR 또는 AmaEcR로부터 얻는다.
어떤 구현예에서, LIPC H 그룹 핵 수용체 폴리펩티드 성분은, a) SEQ ID NO: 17의 아미노산 잔사 20, 21, 48, 51, 52, 55, 58, 59, 61, 62, 92, 93, 95, 96, 107, 109, 110, 120, 123, 125, 175, 218, 219, 223, 230, 234 또는 238, b) SEQ ID NO: 17의 아미노산 잔사 95 및 110, c) SEQ ID NO: 17의 아미노산 잔사 218 및 219, d) SEQ ID NO: 17의 아미노산 잔사 107 및 175, e) SEQ ID NO: 17의 아미노산 잔사 127 및 175, f) SEQ ID NO: 17의 아미노산 잔사 107 및 127, g) SEQ ID NO: 17의 아미노산 잔사 107, 127 및 175, h) SEQ ID NO: 17의 아미노산 잔사 52, 107 및 175, i) SEQ ID NO: 17의 아미노산 잔사 96, 107 및 175, j) SEQ ID NO: 17의 아미노산 잔사 107, 110 및 175, k) SEQ ID NO: 18의 아미노산 잔사 107, 121, 213 또는 217, 또는 1) SEQ ID NO: 19의 아미노산 잔사 91 또는 105가 치환되는 결과를 가져오는 코돈 돌연변이를 포함하거나 이것으로 이루어진 폴리뉴클레오티드에 의해 코딩된다. 어떤 구현예에서, 치환 돌연변이를 포함하는 LIPC EcR 폴리펩티드 성분은 야생형 또는 자연발생 EcR 수용체 리간드 결합 도메인 폴리펩티드에 비해 상이한 아미노산을 이용한 대략 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25개 이상의 야생형 또는 자연발생 아미노산의 치환물을 포함하거나 이것으로 이루어질 수 있다.
또 다른 구현예에서, LIPC H 그룹 핵 수용체 리간드 폴리펩티드 성분은, a) SEQ ID NO: 17의 아미노산 잔사 20, 21, 48, 51, 55, 58, 59, 61, 62, 92, 93, 95, 109, 120, 125, 218, 219, 223, 230, 234 또는 238과 동등하거나 유사한 위치에 있는 알라닌 잔사, b) SEQ ID NO: 17의 아미노산 잔사 52와 동등하거나 유사한 위치에 있는 알라닌, 발린, 이소류신 또는 류신 잔사, c) SEQ ID NO: 17의 아미노산 잔사 96과 동등하거나 유사한 위치에 있는 알라닌, 트레오닌, 아스파르트산 또는 메티오닌 잔사, d) SEQ ID NO: 17의 아미노산 잔사 110과 동등하거나 유사한 위치에 있는 프롤린, 세린, 메티오닌 또는 류신 잔사, e) SEQ ID NO: 17의 아미노산 잔사 123과 동등하거나 유사한 위치에 있는 페닐알라닌 잔사, f) SEQ ID NO: 17의 아미노산 잔사 95와 동등하거나 유사한 위치에 있는 알라닌 잔사 및 SEQ ID NO: 17의 아미노산 잔사 110과 동등하거나 유사한 위치에 있는 프롤린 잔사, g) SEQ ID NO: 17의아미노산 잔사 218 및 219와 동등하거나 유사한 위치에 있는 알라닌 잔사, h) SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사, i) SEQ ID NO: 17의 아미노산 잔사 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, j) SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사 및 SEQ ID NO: 17의 아미노산 잔사 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, k) SEQ ID NO: 17의 아미노산 잔사 127 및 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, l) SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사 및 SEQ ID NO: 17의 아미노산 잔사 127과 동등하거나 유사한 위치에 있는 글루타민 잔사, m) SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사 및 SEQ ID NO: 17의 아미노산 잔사 127 및 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, n) SEQ ID NO: 17의 아미노산 잔사와 동등하거나 유사한 위치에 있는 발린 잔사, SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사 및 SEQ ID NO: 17의 아미노산 잔사 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, o) SEQ ID NO: 17의 아미노산 잔사 96과 동등하거나 유사한 위치에 있는 알라닌 잔사, SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사 및 SEQ ID NO: 17의 아미노산 잔사와 동등하거나 유사한 위치에 있는 글루타민 잔사, p) SEQ ID NO: 17의 아미노산 잔사 52와 동등하거나 유사한 위치에 있는 알라닌 잔사, SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사 및 SEQ ID NO: 17의 아미노산 잔사 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, q) SEQ ID NO: 17의 아미노산 잔사 96과 동등하거나 유사한 위치에 있는 트레오닌 잔사, SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사 및 SEQ ID NO: 17의 아미노산 잔사 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, r) SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사, SEQ ID NO: 17의 아미노산 잔사 110과 동등하거나 유사한 위치에 있는 프롤린 잔사 및 SEQ ID NO: 17의 아미노산 잔사 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, s) SEQ ID NO: 18의 아미노산 잔사 107과 동등거나 유사한 위치에 있는 프롤린, t) SEQ ID NO: 18의 아미노산 잔사 121과 동등하거나 유사한 위치에 있는 아르기닌이나 류신, u) SEQ ID NO: 18의 아미노산 잔사 213과 동등하거나 유사한 위치에 있는 알라닌, v) SEQ ID NO: 18의 아미노산 잔사 217과 동등하거나 유사한 위치에 있는 알라닌, w) SEQ ID NO: 19의 아미노산 잔사 91과 동등하거나 유사한 위치에 있는 알라닌, 또는 x) SEQ ID NO: 19의 아미노산 잔사 105와 동등하거나 유사한 위치에 있는 프롤린이 치환되는 결과를 가져오는 코돈 돌연변이를 포함하거나 이것으로 이루어진 폴리뉴클레오티드에 의해 코딩된다. 어떤 구현예에서, LIPC H 그룹 핵 수용체 폴리펩티드 성분은 엑디손 수용체로부터 얻는다.
또 다른 구현예에서, 치환 돌연변이를 가진 LIPC H 그룹 핵 수용체 폴리펩티드 성분은, 코돈 돌연변이를 포함하거나 이것으로 이루어진 폴리뉴클레오티드에 의해 코딩되는 치환 돌연변이를 포함하거나 이것으로 이루어진 엑디손 수용체 리간드 결합 도메인이며, 이에 따라 a) SEQ ID NO: 17의 E20A, Q21A, F48A, I51A, T52A, T52V, T52I, T52L, T55A, T58A, V59A, L61 A, I62A, M92A, M93A, R95A, V96A, V96T, V96D, V96M, V107I, F109A, Al10P, Al10S, A110M, A110L, Y120A, A123F, M125A, R175E, M218A, C219A, L223A, L230A, L234A, W238A, R95A/A110P, M218A/C219A, V107I/R175E, Y127E/R175E, V107I/Y127E, V107I/Y127E/R175E, T52V/V107I/R175E, V96A/V107I/R175E, T52A/V107I/R175E, V96T/V107I/R175E 또는 V107I/A110P/R175E 치환 돌연변이, b) SEQ ID NO: 18의 A107P, G121R, G121L, N213A, C217A 또는 C217S 치환 돌연변이, 및 c) SEQ ID NO: 19의 G91A 또는 A105P 치환 돌연변이로 이루어진 군에서 선택된 치환 돌연변이가 수득된다.
다른 구현예에서, 치환 돌연변이를 가진 LIPC H 그룹 핵 수용체 폴리펩티드 성분은, 500 mM 미만의 염 및 적어도 37℃에서의 혼성화 단계와 2XSSPE 및 적어도 63℃에서의 세정 단계를 포함한 혼성화 조건하에, 코돈 돌연변이 및 결과적으로 a) SEQ ID NO:18의 T58A, A110P, A110L, A110S, 또는 SEQ ID NO:17의 A110M, b) SEQ ID NO:18의 A107P, 및 c) SEQ ID NO: 19의 A105P 로 이루어진 군에서 선택된 치환 돌연변이를 포함한 폴리뉴클레오티드로 혼성화하는 폴리뉴클레오티드에 의해 코딩된 치환 돌연변이를 포함하거나 이것으로 구성된 엑디손 수용체 리간드 결합 도메인 폴리펩티드이다. 어떤 구현예에서, 혼성화 조건은 혼성화 단계서 200 mM 미만의 염 및 37℃ 이상의 온도를 포함한다. 또 다른 구현예에서, 혼성화 조건은 세정 단계에서 2XSSPE 및 63℃ 의 온도를 포함한다. 또 다른 구현예에서, 엑디손 수용체 리간드 결합 도메인은 감소된 스테로이드 결합 활성도, 예컨대, 20-히드록시엑디손 결합 활성도, 포나스테론 A 결합 활성도 또는 무리스테론 A 결합 활성도가 결핍되거나 표현되었다.
또 다른 구현예에서, LIPC H 그룹 수용체 폴리펩티드 성분은 a) SEQ ID NO: 17의 아미노산 잔사, 20, 21, 48, 51, 52, 55, 58, 59, 61, 62, 92, 93, 95, 96, 107, 109, 110, 120, 123, 125, 175, 218, 219, 223, 230, 234, 또는 238, b) SEQ ID NO: 17의 아미노산 잔사 95 및 110, c) SEQ ID NO: 17의 아미노산 잔사 218 내지 219, d) SEQ ID NO: 17의 아미노산 잔사 107 및 175, e) SEQ ID NO: 17의 아미노산 잔사 127 및 175, f) SEQ ID NO: 17의 아미노산 잔사 107 및 127, g) SEQ ID NO: 17의 아미노산 잔사 107, 127 및 175, h) SEQ ID NO: 17의 아미노산 잔사 52, 107 및 175, i) SEQ ID NO: 17의 아미노산 잔사 96, 107 및 175, j) SEQ ID NO: 17의 아미노산 잔사 107, 110, 및 175, k) SEQ ID NO: 18의 아미노산 잔사 107, 121, 213 또는 217, 또는 1) SEQ ID NO: 19의 아미노산 잔사 91 또는 105와 동등하거나 유사한 위치에 치환 돌연변이를 갖는다. 어떤 구현예에서, LIPC H 그룹 핵 수용체 폴리펩티드 성분은 엑디손 수용체로부터 얻는다.
일부 구현예에서, LIPC H 그룹 핵 수용체 폴리펩티드 성분은 a) SEQ ID NO: 17의 아미노산 잔사 20, 21, 48, 51, 55, 58, 59, 61, 62, 92, 93, 95, 109, 120, 125, 218, 219, 223, 230, 234 또는 238과 동등하거나 유사한 위치에 있는 알라닌 잔사, b) SEQ ID NO: 17의 아미노산 잔사 52와 동등하거나 유사한 위치에 있는 알라닌, 발린, 이소류신 또는 류신 잔사, c) SEQ ID NO: 17의 아미노산 잔사 96과 동등하거나 유사한 위치에 있는 알라닌, 트레오닌, 아스파탐산 또는 메티오닌 잔사, d) SEQ ID NO: 17의 아미노산 잔사 110과 동등하거나 유사한 위치에 있는 프롤린, 세린, 메티오닌 또는 류신 잔사, e) SEQ ID NO: 17의 아미노산 잔사 123과 동등하거나 유사한 위치에 있는 페닐알라닌 잔사, f) SEQ ID NO: 17의 아미노산 잔사 95와 동등하거나 유사한 위치에 있는 알라닌 잔사 및 SEQ ID NO: 17의 아미노산 잔사 110과 동등하거나 유사한 위치에 있는 프롤린 잔사, g) SEQ ID NO: 17의 아미노산 잔사 218 및 219와 동등하거나 유사한 위치에 있는 알라닌 잔사, h) SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사, i) SEQ ID NO: 17의 아미노산 잔사 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, j) SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사 및 SEQ ID NO: 17의 아미노산 잔사 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, k) SEQ ID NO: 17의 아미노산 잔사 127 및 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, 1) SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사 및 SEQ ID NO: 17의 아미노산 잔사 127과 동등하거나 유사한 위치에 있는 글루타민 잔사, m) SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사 및 SEQ ID NO: 17의 아미노산 잔사 127 및 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, n) SEQ ID NO: 17의 아미노산 잔사 52와 동등하거나 유사한 위치에 있는 발린 잔사, SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사, 및 SEQ ID NO: 17의 아미노산 잔사 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, o) SEQ ID NO: 17의 아미노산 잔사 96과 동등하거나 유사한 위치에 있는 알라닌 잔사, SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사, 및 SEQ ID NO: 17의 아미노산 잔사 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, p) SEQ ID NO: 17의 아미노산 잔사 52와 동등하거나 유사한 위치에 있는 알라닌 잔사, SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사, 및 SEQ ID NO: 17의 아미노산 잔사 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, q) SEQ ID NO: 17의 아미노산 잔사 96과 동등하거나 유사한 위치에 있는 트레오닌 잔사, SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사, 및 SEQ ID NO: 17의 아미노산 잔사 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, r) SEQ ID NO: 17의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 이소류신 잔사, SEQ ID NO: 17의 아미노산 잔사 110과 동등하거나 유사한 위치에 있는 프롤린 잔사, 및 SEQ ID NO: 17의 아미노산 잔사 175와 동등하거나 유사한 위치에 있는 글루타민 잔사, s) SEQ ID NO: 18의 아미노산 잔사 107과 동등하거나 유사한 위치에 있는 프롤린, t) SEQ ID NO: 18의 아미노산 잔사 121과 동등하거나 유사한 위치에 있는 아르기닌이나 류신, u) SEQ ID NO: 18의 아미노산 잔사 213과 동등하거나 유사한 위치에 있는 알라닌, v) SEQ ID NO: 18의 아미노산 잔사 217과 동등하거나 유사한 위치에 있는 알라닌, w) SEQ ID NO: 19의 아미노산 잔사 91과 동등하거나 유사한 위치에 있는 알라닌, 또는 x) SEQ ID NO: 19의 아미노산 잔사 105와 동등하거나 유사한 위치에 있는 프롤린의 치환물을 갖는다. 어떤 구현예에서, LIPC H 그룹 핵 수용체 폴리펩티드 성분은 엑디손 수용체에서 얻는다.
또 다른 구현예에서, 치환 돌연변이체를 가진 LIPC H 그룹 핵 수용체 폴리펩티드 성분은 치환 돌연변이를 구성하는 엑디손 수용체 결합 도메인 폴리펩티드로서, 치환 돌연변이는 a) SEQ ID NO:17의 E20A, Q21A, F48A, I51A, T52A, T52V, T52I, T52L, T55A, T58A, V59A, L61A, I62A, M92A, M93A, R95A, V96A, V96T, V96D, V96M, V107L F109A, A110P, A110S, A110M, A110L, Y120A, A123F, M125A, R175E, M218A, C219A, L223A, L230A, L234A, W238A, R95A/A110P, M218A C219A, V107I/R175E, Y127E/R175E, V107I/Y127E, V107I/Y127E/R175E, T52V/V107I/R175E, V96A/V107I/R175E, T52A/V107I/R175E, V96T/V107I/R175E, 또는 V107I/A110P/R175E 치환 돌연변이, b) SEQ ID NO: 18의 A107P, G121R, G121L, N213A, C217A, 또는 C217S 치환 돌연변이, 및 c) SEQ ID NO: 19의 G91A 또는 A105P 치환 돌연변이로 이루어진 군에서 선택된다. 어떤 구현예에서, 본 발명의LIPC 단백질에 사용된 EcR 폴리펩티드 성분 (아미노산 서열)은 표 1에 나타낸 치환물로 이루어진 군에서 선택된 하나 이상의 치환 돌연변이를 포함하거나 이것으로 이루어진다.
표1: LIPC 시스템에서 사용할 수 있는EcR 폴리펩티드 치환 돌연변이
Figure pct00006
Figure pct00007
RXR 성분
본 발명은 RXR 리간드 결합 도메인 (LBD)를 포함하고 본원에 기재된 리간드 유도성 폴리펩티드 결합제(LIPCs)에 이용되는 특별한 RXR 성분을 제공한다. 본 발명에서 사용할 수 있는 예시적인 RXR 성분은, 예를 들어, 국제 PCT 공개공보: 제 WO 2001/070816호; WO 2002/066612호; WO 2002/066613호; WO 2002/066614호; WO 2002/066615호; WO 2003/027266호; WO 2003/027289호; WO 2005/108617호 및 WO 2009/114201호에 개시된 것들을 포함하며, 이들 각각의 내용 전체를 본원에 참조로서 인용한다.
어떤 구현예에서, LIPC RXR 성분은 생쥐 (Mus musculus) RXR (MmRXR) 또는 인간 (Homo sapiens) RXR (HsRXR)이다. LIPC RXR 성분은 RXRα, RXRβ 또는 RXRγ 이성체, 또는 그의 절편일 수 있다.
일부 구현예에서, RXR LIPC 성분은 절단 RXR이다. LIPC RXR 폴리펩티드 절단은 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 105, 110, 115, 120, 125, 130, 135, 140, 145, 150, 155, 160, 165, 170, 175, 180, 185, 190, 195, 200, 205, 210, 215, 220, 225, 230, 235, 240, 245, 250, 255, 260, 또는 265개 이상의 아미노산을 제거하는 것을 포함하거나 이것으로 이루어질 수 있다. 어떤 구현예에서, LIPC RXR 폴리펩티드 절단은 적어도 일부의 폴리펩티드 도메인의 제거를 포함하거나 이것으로 이루어진다. 일부 구현예에서, LIPC RXR 폴리펩티드 도메인은 적어도 거의 온전한 폴리펩티드 도메인을 포함하거나 이것으로 이루어진다. 특정 구현예에서, LIPC RXR 폴리펩티드 절단은 적어도 A/B-도메인 제거, C-도메인 제거, D-도메인 제거, E-도메인 제거, F-도메인 제거, A/B/C-도메인 제거, A/B/l/2-C-도메인 제거, A B/C/D-도메인 제거, A/B/C D/F-도메인 제거, A/B/F-도메인 및 A/B/C/F-도메인 제거를 포함하거나 이것으로 이루어진다. 수개의 완전 및/또는 부분적 도메인의 제거를 조합하여 수행할 수 있다.
또 다른 구현예에서, LIPC RXR 폴리펩티드 성분은 SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 32, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 38 및 SEQ ID NO: 39로 이루어진 군에서 선택된 핵산 서열을 포함하거나 이것으로 이루어진 폴리뉴클레오티드 또는, 그의 절편에 의해 코딩된다.
또 다른 구현예에서, LIPC RXR 성분은 SEQ ID NO: 40, SEQ ID NO: 41, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 47, SEQ ID NO: 48 및 SEQ ID NO: 49 중에서 선택된 폴리펩티드 서열, 또는 그의 절편을 포함하거나 이것으로 이루어진다.
어떤 구현예에서, 본 발명의 LIPC는: 1) 척추동물종 RXR 폴리펩티드 절편; 2) 무척추동물종 RXR 폴리펩티드 절편; 및 3) 비-쌍시류/비-인시류 무척추동물종 RXR 폴리펩티드 절편으로 이루어진 군에서 선택된 2개 이상의 폴리펩티드 절편을 포함한 키메릭 RXR 폴리펩티드를 포함한다. 본 발명의 LIPC 키메릭 RXR 폴리펩티드 성분은 2가지 상이한 동물종 RXR 폴리펩티드 절편을 포함하거나 이것으로 이루어질 수 있으며, 또는 동일한 동물종의 경우, 2개 이상의 폴리펩티드 절편은 상기 동물종 RXR 폴리펩티드 절편의 2개 이상의 상이한 이종형태로부터 얻을 수 있다.
일부 구현예에서, 척추동물종 LIPC RXR 폴리펩티드 절편은 생쥐 무스 무스쿨루스 RXR (MmRXR)이나 인간 호모 사피엔스 RXR (HsRXR), 또는 그의 절편을 포함하거나 이것으로 이루어진다. LIPC RXR 폴리펩티드 성분은 RXRα, RXRβ 또는 RXRγ 이성체, 또는 그의 절편을 포함하거나 이것으로 이루어진다.
일부 구현예에서, 척추동물종 LIPC RXR 폴리펩티드 절편은 SEQ ID NO: 62, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66 및 SEQ ID NO: 67로 이루어진 그룹에서 선택된 핵산 서열을 포함하거나 이것으로 이루어진 폴리뉴클레오티드 또는, 그의 절편에 의해 코딩되는 척추동물종 RXR로부터 얻어진다. 또 다른 구현예에서, 척추동물종 LIPC RXR 폴리펩티드 절편은 SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 70, SEQ ID NO: 71, SEQ ID NO: 72 및 SEQ ID NO: 73으로 이루어진 군에서 선택된 아미노산, 또는 그의 절편을 포함하거나 이것으로 이루어진 척추동물종 RXR로부터 얻어진다.
어떤 구현예에서, LIPC 무척추동물종 RXR 폴리펩티드 절편은 메뚜기 (Locusta migratoria) 초기문 폴리펩티드 (LmUSP), 진드기 (Amblyomma americanum) RXR 제 1동종체 (AmaRXRl), 진드기 (Amblyomma americanum) RXR 제 2동종체 (AmaRXR2), 농게 (Celuca pugilator) RXR 동종체 (CpRXR), 딱정벌레 (Tenebrio molitor) RXR 동종체 (TmRXR), 꿀벌 (Apis mellifera) RXR 동종체 (AmRXR) 및 진딧물 (Myzus persicae) RXR 동종체 (MpRXR)로부터 얻는다.
어떤 구현예에서, LIPC 무척추동물종 RXR 폴리펩티드 절편은 SEQ ID NO: 50, SEQ ID NO: 51, SEQ ID NO: 52, SEQ ID NO: 53, SEQ ID NO: 54 또는 SEQ ID NO: 55의 핵산 서열을 갖거나 이것으로 이루어진 폴리뉴클레오티드 또는, 그의 절편에 의해 코딩된 무척추동물종 RXR 폴리펩티드로부터 얻는다. 또 다른 구현예에서, LIPC 무척추동물종 RXR 폴리펩티드 절편은 SEQ ID NO: 56, SEQ ID NO: 57, SEQ ID NO: 58, SEQ ID NO: 59, SEQ ID NO: 60 또는 SEQ ID NO: 61의 아미노산 서열을 포함하거나 이것으로 이루어진 무척추동물종 RXR 폴리펩티드, 또는 그의 절편으로부터 얻는다.
어떤 구현예에서, LIPC 무척추동물종 RXR 폴리펩티드 절편은 비-쌍시류/비-인시류 무척추동물종 RXR 동종체로부터 얻는다.
일부 구현예에서, LIPC 키메릭 RXR 성분은 하나 이상의 척추동물종 RXR 폴리펩티드 절편과 무척추동물종 RXR 폴리펩티드 절편을 포함하거나 이것으로 이루어진다.
또 다른 구현예에서, LIPC 키메릭 RXR 성분은 하나 이상의 척추동물종 RXR 폴리펩티드 절편과 1개의 비-쌍시류/비-연시류 무척추동물종 RXR 동종체 폴리펩티드 절편을 포함하거나 이것으로 이루어진다.
또 다른 구현예에서, LIPC 키메릭 RXR 성분은 하나 이상의 무척추동물종 RXR 폴리펩티드 절편과 비-쌍시류/비-인시류 무척추동물종 RXR 동종체 폴리펩티드 절편을 포함하거나 이것으로 이루어진다.
또 다른 구현예에서, LIPC 키메릭 RXR 성분은 하나 이상의 척추동물종 RXR 폴리펩티드 절편 및 상이한 척추동물종 RXR 폴리펩티드 절편을 포함하거나 이것으로 이루어진다.
또 다른 구현예에서, LIPC 키메릭 RXR 성분은 하나 이상의 무척추동물종 RXR 폴리펩티드 절편 및 상이한 무척추동물종 RXR 폴리펩티드 절편을 포함하거나 이것으로 이루어진다.
또 다른 구현예에서, LIPC 키메릭 RXR 성분은 하나 이상의 비-쌍시류/비-인시류 무척추동물종 RXR 폴리펩티드 절편 및 상이한 비-쌍시류/비-인시류 무척추동물종 RXR 폴리펩티드 절편을 포함하거나 이것으로 이루어진다.
어떤 구현예에서, LIPC 키메릭 RXR 성분은 EF-도메인 제 1나선, EF-도메인 제 2나선, EF-도메인 제 3나선, EF-도메인 제 4나선, EF-도메인 제 5나선, EF-도메인 제 6나선, EF-도메인 제 7나선, EF-도메인 제 8나선, EF-도메인 제 9나선, EF-도메인 제 10나선, EF-도메인 제 11나선, EF-도메인 제 12나선, F-도메인, 및/또는 EF-도메인 β-주름 시트로 이루어진 군에서 선택된 하나 이상의 폴리펩티드 절편을 포함하는 RXR 영역을 갖고, 여기서 2개 이상의 도메인 중 하나 이상은 다른 종의 RXR (가령, 인간 RXR 폴리펩티드 절편 및 뮤린 RXR 폴리펩티드 절편)에서 얻는다.
또 다른 구현예에서, LIPC 키메릭 RXR 성분의 제 1폴리펩티드 절편은 제 1종 RXR의 제 1나선 내지 제 6나선, 제 1나선 내지 제 7나선, 제 1나선 내지 제 8나선, 제 1나선 내지 제 9나선, 제 1나선 내지 제 10나선, 제 1나선 내지 제 11나선 또는 제 1나선 내지 제 12 나선을 포함하거나 이것으로 이루어지고, LIPC 키메릭 RXR 성분의 제 2폴리펩티드 절편은 제 2종 RXR의 제 7나선 내지 제 12나선, 제 8나선 내지 제 12나선, 제 9나선 내지 제 12나선, 제 10나선 내지 제 12나선, 제 11나선 및 제 12나선, 제 12나선 또는 F 도메인을 포함하거나 이것으로 이루어진다.
또 다른 구현예에서, LIPC 키메릭 RXR 성분의 제 1폴리펩티드 절편은 제 1종 RXR의 제 1나선 내지 제 6나선을 포함하거나 이것으로 이루어지고, LIPC 키메릭 RXR 성분의 제 2폴리펩티드 절편은 제 2종 RXR의 제 7나선 내지 제 12 나선을 포함하거나 이것으로 이루어진다.
또 다른 구현예에서, LIPC 키메릭 RXR 성분의 제 1폴리펩티드 절편은 제 1종 RXR의 제 1나선 내지 제 7나선을 포함하거나 이것으로 이루어지고, LIPC 키메릭 RXR 성분의 제 2폴리펩티드 절편은 제 2종 RXR의 제 8나선 내지 제 12 나선을 포함하거나 이것으로 이루어진다.
또 다른 구현예에서, LIPC 키메릭 RXR 성분의 제 1폴리펩티드 절편은 제 1종 RXR의 제 1나선 내지 제 8나선을 포함하거나 이것으로 이루어지며, LIPC 키메릭 RXR 성분의 제 2폴리펩티드 절편은 제 2종 RXR의 제 9나선 내지 제 12 나선을 포함하거나 이것으로 이루어진다.
또 다른 구현예에서, LIPC 키메릭 RXR 성분의 제 1폴리펩티드 절편은 제 1종 RXR의 제 1나선 내지 제 9나선을 포함하거나 이것으로 이루어지며, LIPC 키메릭 RXR 성분의 제 2폴리펩티드 절편은 제 2종 RXR의 제 10나선 내지 제 12 나선을 포함하거나 이것으로 이루어진다
또 다른 구현예에서, LIPC 키메릭 RXR 성분의 제 1폴리펩티드 절편은 제 1종 RXR의 제 1나선 내지 제 10 나선을 포함하거나 이것으로 이루어지며, LIPC 키메릭 RXR 성분의 제 2폴리펩티드 절편은 제 2종 RXR의 제 11나선 및 제 12 나선을 포함하거나 이것으로 이루어진다.
또 다른 구현예에서, LIPC 키메릭 RXR 성분의 제 1폴리펩티드 절편은 제 1종 RXR의 제 1나선 내지 제 11 나선을 포함하거나 이것으로 이루어지며, LIPC 키메릭 RXR 성분의 제 2폴리펩티드 절편은 제 2종 RXR의 제 12 나선을 포함하거나 이것으로 이루어진다.
또 다른 구현예에서, LIPC 키메릭 RXR 성분의 제 1폴리펩티드 절편은 제 1종 RXR의 제 1나선 내지 제 12 나선을 포함하거나 이것으로 이루어지며, LIPC 키메릭 RXR 성분의 제 2폴리펩티드 절편은 제 2종 RXR의 F 도메인을 포함하거나 이것으로 이루어진다
또 다른 구현예에서, LIPC RXR 성분은 절단 키메릭 RXR을 포함하거나 이것으로 이루어진다. 키메릭 RXR 절단은, 1, 2, 3, 4, 5, 6, 8, 10, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 25, 26, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 105, 110, 115, 120, 125, 130, 135, 140, 145, 150, 155, 160, 165, 170, 175, 180, 185, 190, 195, 200, 205, 210, 215, 220, 225, 230, 235 또는 240개 이상의 아미노산의 제거를 포함할 수 있다. 어떤 구현예에서, 키메릭 RXR 절단시 결과적으로 적어도 일부의 폴리펩티드 도메인이 제거된다. 또 다른 구현예에서, 키메릭 RXR 절단시 결과적으로 적어도 폴리펩티드 도메인의 전부가 제거된다. 또 다른 구현예에서, 키메릭 RXR 절단시 적어도 일부의 E-도메인, 전체 E-도메인, 일부의 F-도메인, 전체 F-도메인, EF-도메인 제 1나선, EF-도메인 제 2나선, EF-도메인 제 3나선, EF-도메인 제 4나선, EF-도메인 제 5나선, EF-도메인 제 6나선, EF-도메인 제 7나선, EF-도메인 제 8나선, EF-도메인 제 9나선, EF-도메인 제 10나선, EF-도메인 제 11나선, EF-도메인 제 12나선 및/또는 EF-도메인 β-주름 시트가 제거된다. 수개의 부분 또는 전체 도메인 제거를 조합하여 수행할 수도 있다.
어떤 구현예에서, LIPC 절단 키메릭 RXR 성분은 SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 76, SEQ ID NO: 77, SEQ ID NO: 78 또는 SEQ ID NO: 79의 핵산 서열을 포함하거나 이것으로 이루어진 폴리뉴클레오티드, 또는 그의 절편으로 코딩된다. 또 다른 구현예에서, LIPC 절단 키메릭 RXR 성분은 SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 82, SEQ ID NO: 83, SEQ ID NO: 84 또는 SEQ ID NO: 85의 핵산 서열, 또는 그의 절편을 포함하거나 이것으로 이루어진다.
또 다른 구현예에서, LIPC 키메릭 RXR 성분은, a) SEQ ID NO: 11, b) SEQ BD NO: 12의 뉴클레오티드 1 내지 348 및 SEQ ID NO: 13의 뉴클레오티드 268 내지 630, c) SEQ ID NO: 12 의 뉴클레오티드 1 내지 408 및 SEQ ID NO: 13의 뉴클레오티드 337 내지 630, d) SEQ ID NO: 12의 뉴클레오티드 1 내지 465 및 SEQ ID NO: 13의 뉴클레오티드 403 내지 630, e) SEQ ID NO: 12의 뉴클레오티드 1 내지 555 및 SEQ ID NO: 13의 뉴클레오티드 490 내지 630, f) SEQ ID NO: 12의 뉴클레오티드 1 내지 624 및 SEQ ID NO: 13의 뉴클레오티드 547 내지 630, g) SEQ ID NO: 12의 뉴클레오티드 1 내지 645 및 SEQ ID NO: 13의 뉴클레오티드 601 내지 630, 및 h) SEQ ID NO: 12의 뉴클레오티드 1 내지 717 및/또는 SEQ ID NO: 13의 뉴클레오티드 613 내지 630의 핵산 서열을 포함하거나 이것으로 이루어진 폴리뉴클레오티드, 또는 그의 절편으로 코딩한다.
또 다른 바람직한 구현예에서, LIPC 키메릭 RXR 성분은 a) SEQ ID NO: 14, b) SEQ ID NO: 15의 아미노산 1 내지 116 및 SEQ ID NO: 16의 아미노산 90 내지 210, c) SEQ ID NO: 15의 아미노산 1 내지 136 및 SEQ ID NO: 16의 아미노산 113 내지 210, d) SEQ ID NO: 15의 아미노산 1 내지 155 내지 SEQ ID NO: 16의 아미노산 135 내지 210, e) SEQ ID NO: 15의 아미노산 1 내지 185 및 SEQ ID NO: 16의 아미노산 164 내지 210, f) SEQ ID NO: 15의 아미노산 1 내지 208 및 SEQ ID NO: 16의 아미노산 183 내지 210, g) SEQ ID NO: 15의 아미노산 1 내지 215 및 SEQ ID NO: 16의 아미노산 201 내지 210, 및/또는 h) SEQ ID NO: 15의 아미노산 1 내지 239 또는 SEQ ID NO: 16의 205 내지 210의 아미노산 서열, 또는 그의 절편을 포함하거나 이것으로 이루어진다.
EcR 및/또는 RXR 폴리펩티드 성분
어떤 구현예에서, 본 발명의 LIPC에 사용되는 EcR 및/또는 USP/RXR 폴리펩티드는 국제 PCT 공개 제 WO 2001/070816호, WO 2002/066612호, WO 2002/066613호, WO 2002/066614호, WO 2002/066615호, WO 2003/027266호, WO 2003/027289호 및 WO 2005/108617호의 하나 이상에 기재된 치환 돌연변이체로 이루어진 군에서 선택된 하나 이상의EcR 및/또는 RXR 치환 돌연변이로서, 이들 각각의 전반적인 내용을 본원에 참조로서 수록한다.
본 발명의 유전자 발현 카세트
본 발명의 일 구현예는: a) (i) 핵 수용체 폴리펩티드나 그의 절편; 및 (ii) 제 1 비활성 신호전달 도메인을 포함한 제 1융합 단백질 (폴리펩티드)을 코딩하는 폴리뉴클레오티드를 포함하는 숙주세포에서 발현될 수 있는 제 1발현 카세트; 및 b) (i) 제 2핵 수용체 폴리펩티드나 그의 절편; 및 (ii) 제 2비활성 신호발생 도메인을 포함한 제 2의 또 다른 융합 단백질 (폴리펩티드)를 코딩하는 폴리뉴클레오티드 서열을 포함하는 숙주세포에서 발현될 수 있는 제 2발현 카세트를 포함하는 것으로서, 제 1 및 제 2비활성 신호발생 도메인은 이 두종류의 융합 단백질의 조합하에 활성화되는 리간드 유도성 수용체 폴리펩티드 결합제 (LIPC)를 포함한다.
본 발명의 또 다른 구현예는: a) (i) 핵 수용체 폴리펩티드나 그의 절편; 및 (ii) 제 1 비활성 신호전달 도메인을 포함한 제 1융합 단백질 (폴리펩티드)을 코딩하는 폴리뉴클레오티드를 포함하는 숙주세포에서 발현될 수 있는 제 1발현 카세트; 및 b) (i) 제 2핵 수용체 폴리펩티드나 그의 절편; 및 (ii) 제 2비활성 신호발생 도메인을 포함한 제 2의 또 다른 융합 단백질 (폴리펩티드)를 코딩하는 폴리뉴클레오티드 서열을 포함하는 숙주세포에서 발현될 수 있는 제 2발현 카세트를 포함하는 것으로서, 제 1 및 제 2비활성 신호발생 도메인은 이 두종류의 융합 단백질의 조합하에 활성화되는 리간드 유도성 수용체 폴리펩티드 결합제 (LIPC)를 포함한다. 또 다른 구현예에서, 비절지동물 핵 수용체는 비-쌍시류/비-인시류 핵 수용체 폴리펩티드, 또는 그의 절편을 포함한다. 또 다른 구현예에서, 비-절지동물 핵 수용체는 포유동물 핵 수용체 폴리펩티드나 그의 절편을 포함한다. 또 다른 구현예에서, 비-절지동물 핵 수용체는 인간 핵 수용체 폴리펩티드나 그의 절편을 포함한다. 또 다른 구현예에서, 비-절지동물 핵 수용체는 뮤린 핵 수용체 폴리펩티드나 그의 절편을 포함한다. 또 다른 구현예에서, 비-절지동물 핵 수용체는 키메릭 핵 수용체 폴리펩티드나 그의 절편을 포함하며, 여기서의 키메라는 2 이상의 상이한 종으로부터의 폴리펩티드 성분을 포함한다.
본 발명의 일 구현예는: a) (i) 엑디손 수용체 (EcR) 폴리펩티드나 그의 절편; 및 (ii) 제 1 비활성 신호전달 도메인을 포함한 제 1융합 단백질 (폴리펩티드)을 코딩하는 폴리뉴클레오티드를 포함하는 숙주세포에서 발현될 수 있는 제 1발현 카세트; 및 b) (i) 레티노이드 X 수용체 폴리펩티드나 그의 절편; 및 (ii) 제 2비활성 신호발생 도메인을 포함한 제 2의 또 다른 융합 단백질 (폴리펩티드)를 코딩하는 폴리뉴클레오티드 서열을 포함하는 숙주세포에서 발현될 수 있는 제 2발현 카세트를 포함하는 리간드 유도성 폴리펩티드 결합제 (LIPC) 시스템을 포함하며, 여기서 제 1 및 제 2비활성 신호발생 도메인은 상기 2개의 융합 단백질의 상호 조합시에 활성화된다.
후술하는 바와 같이 선택적으로 본 발명에서 사용하기 위한 리간드는, 본원에 기재된 바와 같이, EcR 리간드 결합 도메인 및 RXR 리간드 결합 도메인과 조합시, 신호발생 도메인의 외부 임시 조정 (활성화 또는 활성화 취소; 즉, 투여 중지나 리간드 접촉 중지 등을 통한 취소) 수단을 제공한다. 리간드를 LIPC EcR 및 RXR 폴리펩티드 성분에 결합시키면, LIPC-융합 단백질의 단백질-단백질 상호작용이 가능해지며, 어떤 구현예에서는 신호발생 도메인이 활성화할 수 있다. 일부 구현예에서, 하나 이상의 LIPC 도메인이 변화하여 혼성 LIPC을 생성한다. 어떤 구현예에서, 혼성 유전자와 결과로 얻은 혼성 단백질은 원하는 활성과 리간드의 상보 결합을 위해 선택된 숙주세포나 유기체에서 최적화된다.
비활성 신호발생 도메인
본 발명의 구현예는, 단백질-단백질 상호작용이나 조합을 통해 비활성 도메인 (가령, 신호발생 분자, 신호발생 도메인, 상보 단백질 절편, 단백질 서브유닛, 및 자연 또는 가공된 부분 또는 절단 단백질)의 맞춤재단된 (가령, 용량 조절, 유도성) 활성화를 가능케 하는 리간드 유도성 폴리펩티드 결합제 시스템을 포함한다.
어떤 구현예에서, 활성 조정 대상인 신호발생 단백질 및/또는 폴리펩티드 도메인은 숙주세포에 대한 동종유래 단백질이나 그의 절편이다. 또 다른 구현예에서, 활성 조정 대상인 신호발생 단백질 및/또는 폴리펩티드 도메인은 숙주세포에 대한 이종유래 단백질이나 그의 절편이다.
본 발명의 구현예는, 질병, 장애, 기능부전, 유전적 결함, 약물 전달 타겟 및 프로테오스 분석과 응용 등에 수반되는 폴리펩티드나 신호발생 도메인을 코딩하는 신호발생 단백질 및 폴리펩티드 도메인의 조성물과 그의 용도를 포함한다.
조합 (가령, 이량화나 올리고머화) 또는 활성화를 위한 단백질-단백질 상호작용을 필요로 하는 수많은 세포 신호발생 폴리펩티드와 도메인 (가령, 신호발생 단백질)이 현재 광범위한 유기체에서 동정되었으며, 이를 본 발명에 사용할 수 있다. 이러한 다수의 신호발생 분자들이 수많은 유기체에 보존되어 있는 신호발생 경로에 관여하고 있다.
예를 들어, 단일 막횡단 도메인을 가진 막 안에 정착되어 있는 다수의 세포 표면 수용체를 내인성 (즉, 자연발생) 리간드-유도된 이량화 또는 올리고머화 처리를 통해 우선적으로 활성화된다. 일반적으로, 이들 분자는 자체 조합되지 않으나, 내인성 세포외 리간드와 상호작용하여 (또는 이들의 결합 파트너에 근접해서) 합쳐진다. 내인성 자연발생 세포 신호 단백질 활성화와 대조적으로, 본 발명은 소분자 핵 수용체 활성화 리간드를 "필요시"에 투여 (또는 투여 취소)함으로써, 세포 신호발생 단백질과 도메인의 활성, 즉, 이량화나 올리고머화를 조정 (즉, 턴온, 턴오프, 증가 또는 감소)하는 소분자형 리간드 유도성 폴리펩티드 결합제 시스템을 제공한다. 활성화를 위한 단백질 이량화나 올리고머화를 활용하는 각종 분자 및 경로는 공지 문헌을 참조하여 검토한다 (가령, Klemm, et al. Annu. Rev. Immunol. 16:569-92 (1998), 그의 내용 전체를 본원에 참조로서 인용한다).
어떤 구현예예서, 세포 표면 수용체, 세포내 신호발생 단백질에서 나온 다음의 신호발생 분자 및/또는 도메인 및 그의 연계된 경로 일원들은, 본 발명의 제 1 및/또는 2 비활성 신호발생 도메인, 신호발생 분자, 상보 단백질 절편, 단백질 서브유닛, 또는 자연이나 가공된 부분 또는 절단 단백질과 함께 사용하는 것을 구상하고 있다.
수용체 티로신 키나제 (receptor tyrosine kinase, RTK) 수용체와 그의 연계된 경로 일원, 즉, RTK I등급 (EGF 수용체 패밀리) (ErbB 패밀리), RTK II등급 (인슐린 수용체 패밀리), RTK III등급 (PDGF 수용체 패밀리), RTK IV등급 (FGF 수용체 패밀리), RTK V등급 (VEGF 수용체 패밀리), RTK VI등급 (HGF 수용체 패밀리), RTK VII등급 (Trk 수용체 패밀리), RTK VIII등급 (Eph 수용체 패밀리), RTK IX등급 (AXL 수용체 패밀리), RTK X등급 (LTK 수용체 패밀리), RTK XI등급 (TIE 수용체 패밀리), RTK XII등급 (ROR 수용체 패밀리), RTK XIII등급 (DDR 수용체 패밀리), RTK XIV등급 (RET 수용체 패밀리), RTK XV등급 (KLG 수용체 패밀리), RTK XVI등급 (RYK 수용체 패밀리), 및 RTK XVII등급 (MuSK 수용체 패밀리).
사이토킨 수용체와 그의 연계된 경로 일원으로서, I형 사이토킨 수용체 (가령, 1형 인터류킨 수용체, 에리드로포이에틴 수용체, GM-CSF 수용체, G-CSF 수용체, 성장 호르몬 수용체, 프로락틴 수용체, 온코스타틴 M 수용체 및 백혈병 억제 인자 수용체), II형 사이토킨 수용체 (가령, II형 인터류킨 수용체, 인터페론-알파/베타 수용체 및 인터페론-감마 수용체), 면역글로불린 수퍼패밀린의 일원들 (가령, 인터류킨-1 수용체, CSF1, C-키트 수용체 및 인터류킨-18 수용체). 종양 괴사 인자 수용체 패밀리 (가령, CD27, CD30, CD40, CD120 및 림포톡신 베타 수용체). 케모킨 수용체 (가령, 인터류킨-8 수용체, CCR1, CXCR4, MCAF 수용체 및 NAP-2 수용체). TGF 베타 수용체 (가령, TGF 베타 제 1수용체 및 TGF 베타 제 2수용체). 항원 수용체 신호발생 수용체 (가령, B 세포 및 T 세포 항원 수용체).
본 발명과 더불어 사용하는 것으로 구상되는 추가적인 신호발생 단백질 및/또는 도메인은 제한되지 않으나, 반딧불이 루시페라제 (fLuc), 신호 전달체와 전사 활성체 (Signal Transducer and Activator of Transcription, STAT) 단백질, NF-κB 단백질, 항체 (항체 절편 포함), 전사 인자, 핵 호르몬 수용체를 포함한 핵 수용체, 14-3-3 단백질, G-단백질 결합 수용체, G 단백질, 키네신, 트리오세포스페이트이소머라제 (triosephosphateisomerase, TIM), 알코올 탈수소효소, XI 인자, XIII 인자, 톨형 수용체, 피브리노겐, Bcl-2 패밀리의 일원, Smad 패밀리의 일원 등을 포함한다.
어떤 구현예에서, 본 발명의 비활성 신호발생 도메인은 막횡단 도메인을 갖는다. 일부 구현예에서, 막횡단 도메인은 단일 경로 막횡단 도메인이다. 어떤 구현예에서, 단일 경로 막횡단 도메인은 단일 경로 I형 막횡단 도메인이다. 또 다른 구현예에서, 막횡단 도메인은 다중 경로 막횡단 도메인이다. 어떤 구현예에서 막횡단 도메인은 친수성 알파 나선 모티프를 갖는다.
활성화 리간드
본 발명에서 사용할 수 있는 수용가능한 활성화 리간드는 스위치 시스템의 신호발생 도메인의 단백질-단백질 상호작용을 조정하는 것으로서, 여기서 리간드가 존재하면 비활성 신호발생 도메인이 활성화되는 결과를 가져온다. 이러한 리간드는 국제 PCT 공개공보 제 WO 2002/066612호, WO 2002/066614호, WO 2003/105849호, WO 2004/072254호, WO 2004/005478호, WO 2004/078924호, WO 2005/017126호, WO 2008/153801호, WO 2009/114201호, WO 2013/036758호, WO 2014/144380 및 미국 특허 제 6258603호 및 제 8748125호에 기술된 것들을 포함하며, 이들 각각의 내용 전체를 본원에 참조로서 인용한다.
리간드의 예로는, 제한되지 않으나, 포나스테론, 무리스테론 A, 9-시스-레티노산, 레티노산의 합성 유사체, 미국 특허 제 6013836호, 제 5117057호, 제 5530028호 및 제 537872호에 개시된 바와 같은 N,N'-디아실히드라진을 포함하며, 상기 문헌의 내용 전체를 본원에 참조로서 인용하고; 유럽출원 제 461809호에 기재된 바와 같은 디벤조알킬 시아노히드라진을 포함하며, 상기 문헌의 내용 전체를 본원에 참조로서 인용하고; 미국 특허 제 5225443호에 기재된 바와 같은 N-알킬-N,N'-디아로일히드라진을 포함하며, 상기 문헌의 내용 전체를 본원에 참조로서 인용하고; 유럽 출원 제 234994호에 기재된 바와 같은 N-아실-N-알킬카보닐히드라진을 포함하며, 상기 문헌의 내용 전체를 본원에 참조로서 인용하고; 미국 특허 제 4985461호에 기재된 바와 같은 N-아로일-N-알킬-N'-아로일히드라진을 포함하며, 상기 문헌의 내용 전체를 본원에 참조로서 인용하고; 또한 3,5-디-tert-부틸-4-히드록시-N-이소부틸-벤즈아미드, 8-O-아세틸하르파기드 등을 포함한 기타의 다른 유사 물질들을 포함한다.
어떤 구현예에서, 본 발명의 방법에 사용하기 위한 리간드는 하기 식의 화합물로서:
Figure pct00008
여기서 E는 3차 탄소를 함유한 (C4-C6)알킬, 또는 3차 탄소를 함유한 시아노(C3-C5)알킬이고; R1 은H, Me, Et, i-Pr, F, 포밀, CF3, CHF2, CHCl2, CH2F, CH2Cl, CH2OH, CH2OMe, CH2CN, CN, C≡CH, 1-프로피닐, 2-프로피닐, 비닐, OH, OMe, OEt, 시클로프로필, CF2CF3, CH=CHCN, 알릴, 아지도, SCN 또는 SCHF2 이고;
R2 는H, Me, Et, n-Pr, i-Pr, 포밀, CF3, CHF2, CHCl2, CH2F, CH2Cl, CH2OH, CH2OMe, CH2CN, CN, C≡CH, 1-프로피닐, 2-프로피닐, 비닐, Ac, F, Cl, OH, OMe, OEt, O-n-Pr, OAc, NMe2, NEt2, SMe, SEt, SOCF3, OCF2CF2H, COEt, 시클로프로필, CF2CF3, CH=CHCN, 알릴, 아지도, OCF3, OCHF2, O-i-Pr, SCN, SCHF2, SOMe, NH-CN, 이거나, 또는 R3 와 결합하여 R2 및 R3 가 페닐탄소에 부착되어 에틸렌디옥시, 페닐탄소에 인접한 산소를 가진 디히드로푸릴 고리 또는 페닐탄소에 인접한 산소를 가진 디히드로피릴 고리를 형성하고;
R3 은 H, Et, 또는 R2 와 결합하고, 이때 R2 와 R3 이 페닐탄소에 부착되어 에틸렌디옥시, 페닐탄소에 인접한 산소를 가진 디히드로푸릴 고리 또는 페닐탄소에 인접한 산소를 가진 디히드록실 고리를 형성하고; R4, R5 및 R6 은 독립적으로 H, Me, Et, F, Cl, Br, 포밀, CF3, CHF2, CHC12, CH2F, CH2Cl, CH2OH, CN, C≡CH, 1-프로피닐, 2-프로피닐, 비닐, OMe, OEt, SMe 또는 Set 이다.
일부 구현예에서, 본 발명의 방법에서 사용하는 리간드는 하기 식의 화합물이다:
Figure pct00009
또는
Figure pct00010
여기서 R1, R2, R3 및 R4 는:
a) H, (C1-C6)알킬; (C1-C6)할로알킬; (C1-C6)시아노알킬; (C1-C6)히드록시알킬; (C1-C4)알콕시(C1-C6)알킬; 할로, 시아노, 히드록실 또는 (C1-C4)알킬로 임의로 치환되는 (C2-C6)알케닐; 할로, 시아노, 히드록실 또는 (C1-C4)알킬로 임의로 치환되는 (C2-C6)알키닐; 할로, 시아노, 히드록실 또는 (C1-C4)알킬로 임의로 치환되는 (C3-C5)시클로알킬; 할로, 시아노 또는 (C1-C4)알킬로 임의로 치환되는 옥시라닐; 또는
b) 치환되지 않거나 치환된 벤질로서, 이때의 치환체는 독립적으로1 내지 5 H, 할로, 니트로, 시아노, 히드록실, (C1-C6)알킬, 또는 (C1-C6)알콕시이고; R5 는H; OH; F; Cl; 또는 (C1-C6)알콕시이다.
일부 구현예에서, R1, R2, R3 및 R4 가 H이면, R5 는 H 또는 히드록시이다.
어떤 구현예에서, R1, R2, R3 및 R4 중 하나 이상은 H가 아니다. 또 다른 구현예에서, R1, R2, R3 및 R4 중 2개 이상은 H가 아니다. 또 다른 구현예에서, R1, R2, R3 및 R4 중 3개 이상은 H가 아니다. 또 다른 구현예에서, 각각의 R1, R2, R3 및 R4 는 H가 아니다.
일부 구현예에서 R1, R2, R3 및 R4 가 H이면, R5 는 메톡시가 아니고, R1, R2, R3 및 R4 가 이소프로필이면, R5 는 히드록시가 아니며, R1, R2 및 R3 이 H 이고 R5 가 히드록시이면, R4 는 메틸이나 에틸이 아니다.
특정 구현예에서, R1, R2, R3 및 R4 는: a) H, (C1-C6)알킬; (C1-C6)할로알킬; (C1-C6)시아노알킬; (C1-C6)히드록시알킬; (C1-C4)알콕시(C1-C6)알킬; (C2-C6)알케닐; (C2-C6)알키닐; 할로, 시아노 또는 (C1-C4)알킬로 임의로 치환되는 옥시라닐; 또는 b) 치환되지 않거나 치환된 벤질로서, 이때 치환체는 독립적으로 1 내지 5 H, 할로, 시아노 또는 (C1-C6)알킬이고; R5 는 H, OH, F, Cl 또는 (C1-C6)알콕시이다.
다른 특정 구현예에서, R1, R2, R3 및 R4 는 H, (C1-C6)알킬; (C2- C6)알케닐; (C2-C6)알키닐; 2'-에틸옥시라닐 또는 벤질이고; R5 는 H; OH; 또는 F 이다.
특정 구현예에서, R1, R2, R3 및 R4 가 이소프로필이면, R5 는 히드록실이 아니고; R5 가 H, 히드록실, 메톡시 또는 플루오르이면, R1, R2, R3 및 R4 중 하나 이상은 H가 아니며; R1, R2, R3 및 R4 중 하나 이상이 메틸이고 R5 가 H 또는 히드록실이면, R1, R2, R3 중 R4 의 나머지는 H가 아니고; R4 와 R1, R2 및 R3 중 하나가 메틸이면, R5 는 H가 아니며 또한 히드록실도 아니고; R1, R2, R3 및 R4 가 모두 메틸이면, R5 는 히드록실이 아니고; 또한 R1, R2 및 R3 이 모두 H이고 R5 가 히드록실이면, R4 는 에틸, n-프로필, n-부틸, 알릴 또는 벤질이 아니다.
본 발명의 어떤 구현예는 다음과 같은 스테로이드 리간드의 사용을 포함한다: 20-히드록시엑디손, 2-메틸에테르; 20-히드록시엑디손, 3-메틸에테르; 20-히드록시엑디손, 14-메틸에테르; 20-히드록시엑디손, 2,22-디메틸에테르; 20-히드록시엑디손, 3,22-디메틸에테르; 20-히드록시엑디손, 14,22-디메틸에테르; 20-히드록시엑디손, 22,25-디메틸에테르; 20-히드록시엑디손, 2,3,14,22-테트라메틸에테르; 20-히드록시엑디손, 22-H-프로필에테르; 20-히드록시엑디손, 22-n-부틸에테르; 20-히드록시엑디손, 22-알릴에테르; 20-히드록시엑디손, 22-벤질에테르; 20-히드록시엑디손, 22-(28R,S)-2'-에틸옥시라닐에테르; 포나스테론 A, 2-메틸에테르; 포나스테론 A, 14-메틸에테르; 포나스테론 A, 22-메틸에테르; 포나스테론 A, 2,22-디메틸에테르; 포나스테론 A, 3,22-디메틸에테르; 포나스테론 A, 14,22-디메틸에테르; 디아크리하이난스테론, 22-메틸에테르 등이다
본 발명의 추가적인 구현예는 다음과 같은 스테로이드성 리간드, 즉: 25,26-다이디히드로고포나스테론 A, (이소-스타치스테론 C (Δ25(26))), 쉬다스테론 (스타치스테론 D), 스타치스테론 C, 22-데옥시-20-히드록시엑디손 (탁시스테론), 포나스테론 A, 다공성 스테론 B, 22-디히드로-20-히드록시 엑디손, 포나스테론 A 22-메틸에테르, 20-히드록시엑디손, 프테로스테론, (25R)-이노코스테론, (25S)-이노코스테론, 핀나타스테론, 25-플루오로포나스테론 A, 24(28)-디히드로마키스테론 A, 24-epi-마키스테론 A, 마키스테론 A, 20-히드록시엑디손-22-메틸에테르, 20-히드록시엑디손-25-메틸에테르, 아부타스테론, 22,23-di-epi-게라디스테론, 20,26-디히드록시엑디손 (포드엑디손 C), 24-epi-아부타스테론, 게라디스테론, 29-노르시아스테론, 아주가스테론 B, 24(28)[Z]-디히드로아마라스테론 B, 아마라스테론 A, 마키스테론 C, 라피스테론 C, 20-히드록시엑디손-22,25-디메틸에테르, 20-히드록시엑디손-22-에틸에테르, 카르타모스테론, 24(25)-디히드로프레시아스테론, 류제아스테론, 시아스테론, 20-히드록시엑디손-22-알릴에테르, 24(28)[Z]-디히드로-29-히드록시마키스테론 C, 20-히드록시엑디손-22-아세테이트, 비티코스테론 E (20-히드록시엑디손 25-아세테이트), 20-히드록시엑디손-22-n-프로필에테르, 24-히드록시엑디손, 20-히드록시엑디손-22-n-부틸에테르, 포나스테론 A 22-헤미숙시네이트, 22-아세토아세틸-20-히드록시엑디손, 20-히드록시엑디손-22-벤질에테르, 카네신스테론, 20-히드록시엑디손-22-헤미숙시네이트, 이노코스테론-26-헤미숙시네이트, 20-히드록시엑디손-22-벤조에이트, 20-히드록시엑디손-22-β-D-글루코피라노시드, 20-히드록시엑디손-25-β-D-글루코피라노시드, 실레네오시드 A (20-히드록시엑디손-22α-갈락토시드), 3-데옥시-1β,20-디히드록시엑디손 (3-데옥시인테그리스테론 A), 2-데옥시인테그리스테론 A, 1-epi-인테그리스테론 A, 인테그리스테론 A, 실레네오시드 C (인테그리스테론 A 22α-갈락토시드), 2,22-디데옥시-20-히드록시엑디손, 2-데옥시-20-히드록시엑디손, 2-데옥시-20-히드록시엑디손-3-아세테이트, 2-데옥시-20,26-디히드록시엑디손, 2-데옥시-20-히드록시엑디손-22-아세테이트, 2-데옥시-20-히드록시엑디손-3,22-디아세테이트, 2-데옥시-20-히드록시엑디손-22-벤조에이트, 포나스테론 A 2-헤미숙시네이트, 20-히드록시엑디손-2-메틸에테르, 20-히드록시엑디손-2-아세테이트, 20-히드록시엑디손-2-헤미숙시네이트, 20-히드록시엑디손-2-β-D-글루코피라노시드, 2-단실-20-히드록시엑디손, 20-히드록시엑디손-2,22-디메틸에테르, 포나스테론 A 3B-D-자일로피라노시드 (림난테오시드 B), 20-히드록시엑디손-3-메틸에테르, 20-히드록시엑디손-3-아세테이트, 20-히드록시엑디손-3β-D-자일로피라노시드 (림난테오시드 A), 20-히드록시엑디손-3-β-D-글루코피라노시드, 실레노시드 D (20-히드록시엑디손-3α-갈락토시드), 20-히드록시엑디손 3β-D-글루코피라노실-[l-3]-β-D-자일로피라노시드 (림난테오시드 C), 20-히드록시엑디손-3,22-디메틸에테르, 시아스테론-3-아세테이트, 2-디히드로-3-epi-20-히드록시엑디손, 3-epi-20-히드록시엑디손 (코로나타스테론), 라피스테론 D, 3-디히드로-20-히드록시엑디손, 5β-히드록시-25,26-다이디히드로포나스테론 A, 5β-히드록시스타치스테론 C, 25-디옥시폴리포다인 B, 폴리포다인 B, 25-플루오로폴리포다인 B, 5β-히드록시아부타스테론, 26-히드록시폴리포다인 B, 29-노르센고스테론, 센고스테론, 6β-히드록시-20-히드록시엑디손, 6α-히드록시-20-히드록시엑디손, 20-히드록시엑디손-6-옥심, 포나스테론 A 6-카복시메틸옥심, 20-히드록시엑디손-6-카복시메틸옥심, 아주가스테론 C, 라피스테론 B, 무리스테론 A, 아트로토스테론 B, 아트로토스테론 A, 투르케스테론-2-아세테이트, 푸니스테론 (라포니티스테론), 투르케스테론, 아트로토스테론 C, 25-히드록시아트로토스테론 B, 25-히드록시아트로토스테론 A, 팍실로스테론, 투르케스테론-2,22-디아세테이트, 투르케스테론-22-아세테이트, 투르케스테론-1lα-아세테이트, 투르케스테론-2,11α-디아세테이트, 투르케스테론-11α-프로피오네이트, 투르케스테론-11α-부타노에이트, 투르케스테론-11α-헥사노에이트, 투르케스테론-11α-데카노에이트, 투르케스테론-11α-라우레이트, 투르케스테론-11α-미리스테이트, 투르케스테론-11α-아라키데이트, 22-디히드로-12β-히드록시노르센고스테론, 22-디히드로-12β-히드록시시아스테론, 22-디히드로-12β-히드록시센고스테론, 14-데옥시(14α-H)-20-히드록시엑디손, 20-히드록시엑디손-14-메틸에테르, 14α-퍼히드록시-20-히드록시엑디손, 20-히드록시엑디손 14,22-디메틸에테르, 20-히드록시엑디손-2,3,14,22-테트라메틸에테르, (20S)-22-데옥시-20,21-디히드록시엑디손, 22,25-다이데옥시엑디손, (22S)-20-(2,2'-디메틸푸라닐)엑디손, (22R)-20-(2,2'-디메틸푸라닐)엑디손, 22-데옥시엑디손, 25-데옥시엑디손, 22-디히드로엑디손, 엑디손, 22-epi-엑디손, 24-메틸엑디손 (20-데옥시마키스테론 A), 엑디손-22-헤미숙시네이트, 25-데옥시엑디손-22-β-D-글루코피라노시드, 엑디손-22-미리스테이트, 22-디히드로-20-iso-엑디손, 20-iso-엑디손, 20-iso-22-epi-엑디손, 2-데옥시엑디손, 실레네오시드 E (2-데옥시엑디손 3β-글루코시드; 블레치노시드 A), 2-데옥시엑디손-22-아세테이트, 2-데옥시엑디손-3,22-디아세테이트, 2-데옥시엑디손-22-β-D-글루코피라노시드, 2-데옥시엑디손 25-β-D-글루코피라노시드, 2-데옥시-21-히드록시엑디손, 3-epi-22-iso-엑디손, 3-디히드로-2-데옥시엑디손 (실레노스테론), 3-디히드로엑디손, 3-디히드로-2-데옥시엑디손-22-아세테이트, 엑디손-6-카복시메틸옥심, 엑디손-2,3-아세토나이드, 14-epi-20-히드록시엑디손-2,3-아세토나이드, 20-히드록시엑디손-2,3-아세토나이드, 20-히드록시엑디손-20,22-아세토나이드, 14-epi-20-히드록시엑디손-2,3,20,22-디아세토나이드, 팍실로스테론-20,22-p-히드록시벤질리덴 아세탈, 포스트스테론, (20S)-디히드로포스트스테론, (20S)디히드로포스트스테론, 포스트스테론-20-단실히드라진, (20S)-디히드로포스트스테론-2,3,20-트리벤조에이트, (20R)-디히드로포스트스테론-2,3,20-트리벤조에이트, (20R)디히드로포스트스테론-2,3-아세토나이드, (20S)디히드로포스트스테론-2,3-아세토나이드, (5α-H)-디히드로루브로스테론, 2,14,22,25-테트라데옥시-5α-엑디손, 5α-케토디올, 봄비코스테롤, 2α,3α,22S,25-테트라히드록시-5α-콜레스탄-6-온, (5α-H)-2-데옥시-21-히드록시엑디손, 카스타스테론, 24-epi-카스타스테론, (5αα-H)-2-데옥시인테그리스테론 A, (5α-H)-22-데옥시인테그리스테론 A, (5α-H)-20-히드록시엑디손, 24,25-다이디히드로다크리하이난스테론, 25,26-다이디히드로다크리하이난스테론, 5-데옥시칼라다스테론 (다크리하이난스테론), (14α-H)-14-데옥시-25-히드록시다크리하이난스테론, 25-히드록시다크리하이난스테론, 루브로스테론, (5β-H)-디히드로루브로스테론, 디히드로루브로스테론-17β-아세테이트, 시디스테론, 20-히드록시엑디손-2,3,22-트리아세테이트, 14-데옥시(14β-H)-20-히드록시엑디손, 14-epi-20-히드록시엑디손, 9α,20-디히드록시엑디손, 말라코스테론, 2-데옥시폴리포다인 B-3-β-D-글루코피라노시드, 아주갈락톤, 케일안톤 B, 2β,3β,6α-트리히드록시-5β-콜레스탄, 2β,3β,6β-트리히드록시-5β-콜레스탄, 14-디히드로쉬다스테론, 스타치스테론 B, 2β,3β,9α,20R,22R,25-헥사히드록시-5β-콜레스트-7, 14-디엔-6-온, 칼라다스테론, (14β-H)-14-데옥시-25-히드록시다크리하이난스테론, 4-디히드로-20-히드록시엑디손, 14-메틸-12-엔-쉴다스테론, 14-메틸-12-엔-15,20-디히드록시엑디손, 포드엑디손 B, 2β,3β,20R,22R-테트라히드록시-25-플루오로-5β-콜레스트-8,14-디엔-6-온 (25- 플루오로포드엑디손 B), 칼로니스테론, 14-데옥시-14,18-시클로-20-히드록시엑디손, 9α,14α-에폭시-20-히드록시엑디손, 9βα,14β-에폭시-20-히드록시엑디손, 9α,14α-에폭시-20-히드록시엑디손 2,3,20,22-디아세토나이드, 28-호모브라시놀라이드, iso-호모브라시놀라이드 등의 용도를 포함한다.
일부 구현예에서, 본 발명의 방법과 함께 사용하는 리간드는 하기 일반식의 화합물이고:
Figure pct00011
여기서 X와 X'는 독립적으로 O 또는 S이고;
Y는:
(a) 치환 또는 치환되지 않은 페닐로서, 이때의 치환체는 독립적으로 1-5H, (C1-C4)알킬, (C1-C4)알콕시, (C2-C4)알케닐, 할로 (F, Cl, Br, I), (C1-C4)할로알킬, 히드록시, 아미노, 시아노 또는 니트로이고; 또는
(b) 치환 또는 치환되지 않은 2-피리딜, 3-피리딜 또는 4-피리딜이며, 이때의 치환체는 독립적으로 1-4H, (C1-C4)알킬, (C1-C4)알콕시, (C2-C4)알케닐, 할로 (F, Cl, Br, I), (C1-C4)할로알킬, 히드록시, 아미노, 시아노 또는 니트로이고;
R1 과 R2 는 독립적으로: H; 시아노, 시아노-치환 또는 치환되지 않은 (C1-C7) 분지쇄 또는 직쇄 알킬; 시아노-치환 또는 치환되지 않은 (C2-C7) 분지쇄 또는 직쇄 알케닐; 시아노-치환 또는 치환되지 않은 (C3-C7) 분지쇄 또는 직쇄 알케닐알킬; 또는 R1 와 R2 의 원자가가 함께 (C1-C7)시아노-치환 또는 치환되지 않은 알킬리덴 그룹 (RaRbC-)을 형성하고, 이때 Ra 및 Rb 의 비-치환 탄소의 합이 0 내지 6이며;
R3 은 H, 메틸, 에틸, n-프로필, 이소프로필 또는 시아노이고,
R4, R7 및 R8 은 독립적으로: H, (C1-C4)알킬, (C1-C4)알콕시, (C2-C4)알케닐, 할로 (F, Cl, Br, I), (C1-C4)할로알킬, 히드록시, 아미노, 시아노 또는 니트로이고; 또한
R5 및 R6 은 독립적으로: H, (C1-C4)알킬, (C2-C4)알케닐, (C3-C4)알케닐알킬, 할로 (F, Cl, Br, I), C1-C4 할로알킬, (C1-C4)알콕시, 히드록시, 아미노, 시아노, 니트로, 또는 함께 (―OCHR9CHR10O―) 형태의 결합으로서 이들이 부착된 페닐 탄소와 함께 고리를 형성하고; 이때의 R9 및 R10 은 독립적으로: H, 할로, (C1-C3)알킬, (C2-C3)알케닐, (C1-C3)알콕시(C1-C3)알킬, 벤조일옥시(C1-C3)알킬, 히드록시(C1-C3)알킬, 할로(C1-C3)알킬, 포밀, 포밀(C1-C3)알킬, 시아노, 시아노(C1-C3)알킬, 카복시, 카복시(C1-C3)알킬, (C1-C3)알콕시카보닐(C1-C3)알킬, (C1-C3)알킬카보닐(C1-C3)알킬, (C1-C3)알카노일옥시(C1-C3)알킬, 아미노(C1-C3)알킬, (C1-C3)알킬아미노(C1-C3)알킬 (―(CH2)nRcRe), 옥시모(―CH-NOH), 옥시모(C1-C3)알킬, (C1-C3)알콕시모 (―C-NORd), 알콕시모(C1-C3)알킬, (C1-C3)카복사미도 (―C(O)NReRf), (C1-C3)카복사미도(C1-C3)알킬, (C1-C3)세미카바지도 (―C-NNHC(O)NReRf), 세미카바지도(C1-C3)알킬, 아미노카보닐옥시 (―OC(O)NHRg), 아미노카보닐옥시(C1-C3)알킬, 펜타플루오로페닐옥시카보닐, 펜타플루오로페닐옥시카보닐(C1-C3)알킬, p-톨루엔술포닐옥시(C1-C3)알킬, 아릴술포닐옥시(C1-C3)알킬, (C1-C3)티오(C1-C3)알킬, (C1-C3)알킬술폭시도(C1-C3)알킬, (C1-C3)알킬술포닐(C1-C3)알킬, 또는 (C1-C5)트리치환-실록시(C1-C3)알킬 (―(CH2)nSiORdReRg)이며; 이때 n=1-3, Rc 및 Rd 는 지정된 길이의 직쇄나 분지쇄 탄화수소 사슬을 나타내고, Re, Rf 는 H 또는 지정된 길이의 직쇄나 분지쇄 탄화수소 사슬을 나타내며, Rg 는 임의로 할로 또는 (C1-C3)알킬로 치환된 (C1-C3)알킬, 또는 아릴이고, 또한 Rc, Rd, Re, Rf 및 Rg 는 서로에 대해 독립적이며;
단,
i) R9 및 R10 이 모두 H이거나,
ii) R9 또는 R10 중 어느 것이 할로, (C1-C3)알킬, (C1-C3)알콕시(C1-C3)알킬, 또는 벤조일옥시(C1-C3)알킬이거나,
iii) R5 및 R6 이 함께 (―OCHR9CHR10O―) 형태의 결합을 형성하지 않는 경우,
R1 이나 R2 그룹 중 어느 것 또는 양쪽에 있어서, 시아노 치환물 중의 탄소원자를 제외한 탄소원자의 수가 4를 초과하고, R1, R2 및 R3 그룹의 총합에 있어서, 시아노 치환물 중의 탄소원자를 제외한 탄소원자의 수가 10, 11 또는 12 이다.
본 발명의 폴리뉴클레오티드
본 발명의 새로운 엑디손 수용체/레티노이드 X 수용체-기반 리간드 유도성 폴리펩티드 결합제 시스템은, EcR 핵 수용체 폴리펩티드 성분과 비활성 신호전달 도메인 또는 RXR 핵 수용체 폴리펩티드 성분과 비활성 신호발생 도메인을 포함한 혼성 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 갖는 발현 카세트를 포함할 수 있다. 폴리뉴클레오티드를 포함하고 혼성 폴리펩티드를 코딩하는 이들 발현 카세트는 숙주세포내 신호발생 도메인의 활성도를 조정하는 EcR/RXR-기반 리간드 유도성 폴리펩티드 결합제 시스템의 성분으로 유용하다.
따라서, 본 발명은 EcR 핵 수용체 폴리펩티드 성분과 비활성 신호발생 도메인 및/또는 RXR 핵 수용체 폴리펩티드와 비활성 신호발생 도메인을 갖는 혼성 폴리펩티드를 코딩하는 단리 폴리뉴클레오티드를 제공한다. 본 발명의 EcR 및/또는 RXR 핵 수용체 폴리펩티드 성분을 코딩하는 단리 폴리뉴클레오티드는 제한되지 않으나, 본원에 기재된 야생형 절단 및 치환 돌연변이-함유 EcR 폴리펩티드 및/또는 본원에 기재된 야생형 절단 및 키메릭 RXR 폴리펩티드를 포함한 전술한 폴리뉴클레오티드 서열, 및 그의 조합을 포함한다.
또한, 본 발명의 단리 폴리뉴클레오티드는 본원에 기재된 것을 포함하여, 신호발생 도메인을 코딩하는 폴리뉴클레오티드 서열을 가질 수 있다. 이러한 신호발생 도메인의 폴리뉴클레오티드 서열은 당해 분야의 통상의 기술자에게 공지되어 공개적으로 이용가능한 데이터베이스를 통해 쉽게 억세스할 수 있다. 이러한 데이터베이스는 제한되지 않으나, 유전자은행 (ncbi.nlm.nih.gov/genbank), 유니프로트 (uniprot.org) 등을 포함한다.
본 발명의 폴리펩티드
본 발명의 새로운 엑디손 수용체/레티노이드 X 수용체-기반 리간드 유도성 폴리펩티드 결합제 시스템은 EcR 폴리펩티드 및/또는 비활성 신호발생 도메인이거나, 또는 RXR 폴리펩티드 및 비활성 신호발생 도메인을 포함하는 혼성 폴리펩티드를 코딩하는 폴리뉴클레오티드를 가진 발현 카세트를 포함할 수 있다. 폴리뉴클레오티드를 포함하고 혼성 폴리펩티드를 코딩하는 이들 발현 카세트는 숙주세포내 신호발생 도메인의 활성을 조정하는 EcR/RXR-기반 리간드 유도성 폴리펩티드 결합제 시스템의 성분으로 유용하다.
그러므로, 본 발명은 또한 본 발명에 따른 EcR 폴리펩티드와 비활성 신호발생 도메인 (가령, 신호발생 분자, 신호발생 도메인, 상보 단백질 절편, 단백질 서브유닛, 및 자연 또는 가공된 부분 또는 절단 단백질) 및/또는 RXR 폴리펩티드와 비활성 신호발생 도메인 (가령, 신호발생 분자, 신호발생 도메인, 상보 단백질 절편, 단백질 서브유닛, 및 자연 또는 가공된 부분 또는 절단 단백질)을 갖는 단리 혼성 폴리펩티드에 관한 것이다. 본 발명의 단리 폴리펩티드의 EcR 및/또는 RXR 도메인은, 제한되지 않으나, 야생형 절단 기능성 절편을 포함한 본원에 기재된 폴리펩티드 서열, 본원에 기재된 치환 돌연변이-함유 EcR 리간드 결합 도메인 및/또는 본원에 기재된 야생형 절단 기능성 절편, 키메릭 RXR 폴리펩티드, 및 이들의 조합을 포함할 수 있다.
또한, 본 발명의 단리 혼성 폴리펩티드는 본원에 기재된 것들을 포함한 신호발생 도메인 (가령, 신호발생 분자, 신호발생 도메인, 상보 단백질 절편, 단백질 서브유닛, 및 자연 또는 가공된 부분 또는 절단 단백질)을 가질 수 있다. 이러한 신호발생 도메인의 아미노산 서열은 당해 분야의 통상의 기술자에게 공지되어 공개적으로 이용가능한 데이터베이스를 통해 쉽게 억세스할 수 있다. 이러한 데이터베이스는 제한되지 않으나, 유전자은행 (ncbi.nlm.nih.gov/genbank), 유니프로트 (uniprot.org) 등을 포함한다.
본 발명의 발현 벡터
본 발명의 새로운 엑디손 수용체/레티노이드 X 수용체-기반 리간드 유도성 폴리펩티드 결합제 시스템은, EcR 리간드 결합 도메인과 비활성 신호발생 도메인 (가령, 신호발생 분자, 신호발생 도메인, 상보 단백질 절편, 단백질 서브유닛 및 자연 또는 가공된 부분 또는 절단 단백질) 및/또는 RXR 폴리펩티드와 비활성 신호발생 도메인 (가령, 신호발생 분자, 신호발생 도메인, 상보 단백질 절편 및 자연 또는 가공된 부분 또는 절단 단백질)을 포함하는 혼성 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함한 발현 카세트를 포함한다. 폴리뉴클레오티드를 포함하고 혼성 폴리펩티드를 코딩하는 이들 발현 카세트는 적절한 발현 벡터를 이용하여 숙주세포 내에서 발현될 수 있다. 적절한 발현 벡터는 당해 분야의 통상의 기술자에게 공지되어 있으며, 바람직한 숙주세포의 관점에서, 발현 벡터와 최적 발현 조건은 통상의 기술자가 용이하게 선택 결정할 수 있다. 본 발명에서 사용할 수 있는 발현 벡터의 예로는, 제한되지 않으나, 본원에 기재된 발현 벡터들을 포함한다.
숙주세포
전술한 바와 같이, 본 발명의 리간드 유도성 폴리펩티드 결합제 시스템은 숙주세포내 단백질-단백질간 상호작용, 예컨대, 조합을 조정하는데 사용할 수 있다. 이식 유전자형 숙주세포 내의 조정은 관심대상이 되는 각종 단백질의 조절에 유용할 수 있다. 따라서, 본 발명은 본 발명에 따른 리간드 유도성 폴리펩티드 결합제 시스템을 포함하는 단리 숙주세포를 제공한다. 본 발명은 또한 본 발명에 따른 하나 이상의 발현 카세트를 포함하는 리간드 유도성 폴리펩티드 결합제 시스템을 포함한 단리 숙주세포도 제공한다. 본발명은 또한 폴리뉴클레오티드나 폴리펩티드를 포함하는 단리 숙주세포도 제공한다. 단리 숙주세포는 진핵 또는 원핵 숙주세포일 수 있다.
어떤 구현예에서, 단리 숙주세포는 원핵 숙주세포 또는 진핵 숙주세포이다. 또 다른 특정 구현예에서, 단리 숙주세포는 무척추동물 숙주세포나 척추동물 숙주세포이다. 이러한 숙주세포는 박테리아 세포, 곰팡이 세포, 이스트 세포, 선형동물 세포, 곤충 세포, 어류 세포, 식물 세포, 조류 세포, 동물 세포 및 포유동물 세포 중에서 선택될 수 있다. 보다 구체적으로, 숙주세포는 이스트 세포, 선형동물 세포, 곤충세포, 식물 세포, 제브라피시 세포, 닭 세포, 햄스터 세포, 생쥐 세포, 래트 세포, 토끼 세포, 고양이 세포, 개의 세포, 소의 세포, 염소 세포, 젖소 세포, 돼지 세포, 말의 세포, 양의 세포, 유인원 세포, 원숭이 세포, 인간 세포이다. 숙주세포의 예로는, 제한되지 않으나, 아스페르길루스 (Aspergillus ), 트리코데르마 (Trichoderma), 사카로마이세스 ( Saccharomyces ), 피키아 ( Pichia ), 칸디다 (Candida), 한세눌라 ( Hansenula ) 등과 같은 곰팡이나 이스트종, 또는 시네코시스테스 ( Synechocystis ), 시네코코쿠스 ( Synechococcus ), 살모넬라 (Salmonella), 바실루스 (Bacillus), 아시네토박테르 ( Acinetobacter ), 로도코쿠스 ( Rhodococcus ), 스트렙토 마이세스 ( Streptomyces ), 에스케리치아 ( Escherichia ), 쉐도우모나스 (Pseudomonas), 메틸로모나스 ( Methylomonas ), 메틸로박테르 ( Methylobacter ), 알카리제네스 ( Alcaligenes ), 시네코시스티스 ( Synechocystis ), 아나바에나 (Anabaena), 티오바실루스 ( Thiobacillus ), 메타노박테리움 ( Methanobacterium )클렙시엘라 ( lebsiella ) 속의 박테리아종, 동물 및 포유동물 숙주세포 등을 포함한다.
어떤 구현예에서, 숙주세포는 사카로마이세스 ( Saccharomyces ), 피치아 (Pichia)C칸디다 ( Candida ) 숙주세포로 이루어진 군에서 선택되는 이스트 세포이다. 특정 구현예에서, 숙주세포는 카에노르합디티스 엘레간스 ( Caenorhabditis elegans ) 선형동물 세포이다. 또 다른 특정 구현예에서, 숙주세포는 햄스터 세포이다. 또 다른 구현예에서, 숙주세포는 뮤린 세포이다. 또 다른 구현예에서, 숙주세포는 원숭이 세포이다. 또 다른 특정 구현예에서, 숙주세포는 인간세포이다.
또 다른 구현예에서, 숙주세포는 햄스터 세포, 생쥐 세포, 래트 세포, 토끼 세포, 고양이 세포, 개의 세포, 소의 세포, 염소 세포, 젖소 세포, 돼지 세포, 말의 세포, 양의 세포, 원숭이 세포, 침팬지 세포 및 인간 세포로 이루어진 군에서 선택된 포유동물 세포이다. 어떤 구현예에서, 숙주세포는 부동화 처리된 세포, 면역 세포, 또는 T-세포이다.
숙주세포 형질전환은 당해 분야에 주지되어 있으며, 이에 제한되지 않으나, 전기영동, 바이러스 감염, 플라스미드/벡터 트랜스펙션, 비-바이러스 벡터 매개 트랜스펙션, 입자충격 등을 포함한 다양한 방법에 의해 달성될 수 있다. 원하는 유전자 산물의 발현은 형질전환된 숙주세포를 적절한 조건하에 배양하고 형질전환된 유전자의 발현을 유발하는 것을 포함한다. 배양 조건 및 진핵제포와 원핵세포내 유전자 발현 프로토콜은 당해 분야에 주지되어 있다. 세포는 수득이 가능하며, 유전자 산물은 이 유전자 산물에 특이적인 프로토콜에 따라 단리할 수 있다.
또한, 삽입된 폴리뉴클레오티드의 발현을 조정하거나 원하는 특정 방식으로 폴리펩티드 산물을 변형 및 가공하는 숙주세포를 선택할 수 있다.
본 발명은 또한 본 발명에 따른 단리 숙주세포를 포함하는 비-인간 유기체에 관한 것이다. 어떤 구현예에서, 비-인간 유기체는 박테리아, 곰팡이, 이스트, 동물 및 포유동물로 이루어진 군에서 선택된다. 일부 구현예에서, 비-인간 유기체는 이스트, 생쥐, 래트, 토끼, 고양이, 개, 소, 염소, 돼지, 말, 양, 원숭이 또는 침팬지이다.
어떤 구현예에서, 비-인간 유기체는 사카로마이세스, 피치아 및 칸디다로 이루어진 군에서 선택된 이스트이다. 또 다른 구현예에서, 비-인간 유기체는 무스 무스쿨루스(Mus musculus) 생쥐이다.
번역후 활성도 조정 방법
본 출원인의 발명은 숙주세포내 신호발생 도메인의 활성도를 조정하기 위해 폴리펩티드에 LIPC를 도입하는 (이종유래 폴리펩티드 생성) 방법을 포함한다. 특히, 본 출원인의 발명은 숙주세포 내에서 발현된 폴리펩티드를 활성화 또는 억제하는 신호내 LIPC 성분의 삽입을 통해 단백질의 활성과 경로를 유도 또는 억제하고, 숙주세포를 리간드와 접촉시킴으로써, 신호전달 활성화 또는 억제를 달성하는 방법을 제공한다.
일 구현예에서, 세포 신호전달은 신호전달 도메인 (가령, 신호발생 분자, 신호발생 도메인, 상보 단백질 절편, 단백질 서브유닛, 자연 또는 가공된 부분 또는 절단 단백질)의 LIPC-유도 이량화나 올리고머화에 의해 활성화된다.
또 다른 구현예에서, 세포 신호전달 (활성화) 경로에 대한 세포 신호전달은 억제 폴리펩티드의 LIPC-유도 이량화에 의해 억제된다. 일 구현예에서, LIPC 단독 성분 (가령, EcR이나 RxR/USP 폴리펩티드)은 억제 폴리펩티드이다.
일 구현예에서, LIPC 폴리펩티드는 세포내 단백질-단백질 상호작용을 조정하는데 (즉, 활성화 또는 억제하는데) 이용된다. 또 다른 구현예에서, LIPC 폴리펩티드는 세포외 단백질-단백질 상호작용을 조정하는데 (즉, 활성화 또는 억제하는데) 이용된다. 또 다른 구현예에서, LIPC 폴리펩티드는 막횡단 단백질-단백질 상호작용을 조정하는데 (즉, 활성화 또는 억제하는데) 이용된다.
숙주세포내 LIPC를 통한 활성도 발현 및 조정을 위한 유전자 및 단백질은 내인성 유전자나 이종유래 유전자일 수 있다. 원하는 유전자나 단백질에 관한 핵산 또는 아미노산 서열 정보는 다수의 공개 억세스가능 데이터베이스, 예를 들어, GenBank, EMBL, Swiss-Prot 및 PIR이거나, 또는 수많은 생물학 관련 잡지 간행물에 존재할 수 있다. 따라서, 당해 분야의 통상의 기술자는 모든 공지의 유전자 및 단백질에 관한 핵산 서열 및/또는 아미노산 서열 정보에 사실상 억세스할 수 있다. 이러한 정보는 다음에, 본원에 기재된 출원인의 방법에서 사용한 발현 카세트 내의 관심 대상 단백질 (가령, 신호발생 도메인)의 원하는 구조물을 구성할 수 있다.
본 출원인의 방법에 따라 숙주세포 내에서 발현하는 단백질 및 유전자의 예로는, 제한되지 않으나, 효소, 정보제공 유전자, 구조 단백질, 막횡단 수용체, 핵 수용체, 폴리펩티드 코딩 유전자 또는 질병, 질환, 유전자 손상 등에 수반된 신호발생 도메인, 항체, 약물 전달 타겟, 및 단백질 유전정보학 분석 및 응용 등을 포함한다.
본 발명의 리간드 유도성 폴리펩티드 결합제 (LIPC)를 활용 및 생물학적 세포신호 전달 시스템의 제어나 이에 대한 효과에 도입할 수 있는 다수 다종의 방식 중에서, 한가지 일반적인 예로는 다른 리간드 유도성 이량화 또는 다량화 (multimerization) 시스템 (FK506이나 라파마이신을 활용하는 시스템 등)을 본 발명의 LIPC 성분으로 대체하는 것이 있다.
본 발명의 리간드 유도성 폴리펩티드 결합제(LIPC)를 생물학적 세포신호 전달 시스템에 활용 및 도입할 수 있는 특별한 실시예는 유도성 세포 "살해 스위치"나 "자살 스위치" 생성에 이용되며, 예컨대 유전학적 변형된 T세포의 파괴에 대한 사용이 이미 제안된 바 있다 (가령, 키메릭 항원 수용체 (CAR) T 세포).
상기 참조한 시스템의 예시를 다음과 같이 검토 및 기재한다.
특허 공보 제 WO2015157252호 (PCT/US2015/024671) "Treatment of Cancer Using Anti-CD19 Chimeric Antigen Receptor";
특허 공보 제 WO2011146862호 (PCT/US2011/037381) "Methods For Inducing Selective Apoptosis";
특허 공보 제 WO2014164348호 (PCT/US2014/022004) "Modified Caspase Polypeptides And Uses Thereof";
특허 공보 제 WO2014151960호 (PCT/US2014/026734) "Methods For Controlling T cell Proliferation";
특허 공보 제 WO2014127261호 (PCT/US2014/016527) "Chimeric Antigen Receptor And Methods of Use Therefore";
Auslander et al., "From gene switches to mammalian designer cells: Present and future prospects", Trends in Biotechnology, vol. 31, no. 3 pp. 155-168 (2013);
Chakravarti, et al., "Synthetic biology in cell-based cancer immunotherapy", Trends in Biotechnology, vol. 33, issue 8, pp. 449-461 (2015);
Ciceri, et al., "Infusion of suicide-gene-engineered donor lymphocytes after family haploidentical haemopoietic stem-cell transplantation for leukaemia (the TK007 trial): A non-randomised phase I-II study", Lancet Oncol . 10, 489-500 (2009); Medline doi:10.1016/S1470-2045(09)70074-9;
Wu, et al. "Remote control of therapeutic T cells through a small molecule-gated chimeric receptor", 10.1126/science. aab4077 (2015);
Vilaboa, et al., "Gene switches for deliberate regulation of transgene rxpression: Recent advances in system development and uses", J Genet Syndr Gene Ther 2:107. doi:10.4172/2157-7412.1000107;
Stieger, et al., "In vivo regulation using tetracycline-regulatable systems", Adv Drug Deliv Rev 61: 527- 541 (2009);
전술한 각 참고문헌을 본원에 참조로서 수록한다.
실시예 1 - LIPC 활성화 루시페라제
본 출원인의 RheoSwitch® 유전 스위치 기술은 활성화 리간드의 존재시에, 전사를 수행한다. 리간드는 GAL4-EcR 융합 단백질의 EcR 리간드-결합 도메인 부분에 결합되며, 이는 RXR-VP16 성분을 사용한다 (가령, 도 1 참조). 발명자들은 EcR 및 RXR 도메인, 예컨대 RheoSwitch® 시스템에 사용되는 도메인들이 EcR 및 RXR 도메인에 융합된 다른 단백질과 조합을 형성하여 리간드 유도성 폴리펩티드 결합제로서 역할을 할 수 있다고 판단하였다.
리간드 유도성 폴리펩티드 결합제는 전사 유전자 스위치와 다르게 작용한다. LIPC 시스템으로 단백질-단백질 상호작용을 제어하며 유전자 발현은 없다. 활성화 레벨은, 소분자 리간드 투여 농도와 양을 통해 제어하는 바와 같이, 용량 의존 방식으로 조절할 수 있다.
본원에 기재된 바와 같이, 분열 반딧불이 루시페라제 시스템을 이용하여 리간드-유도성 EcR-RXR 융합 단백질 조합을 입증하였다. 이 시스템은 단백질 스위치 성분을 사용하는 신규의 방법을 나타낸다. 이러한 스위치는 단백질 발현을 제어하기 위한 유전자 전사 활성화 스위치와는 근본적으로 상이하다. 단백질-단백질 상호작용, 즉, 조합을 제어하기 위해서는 신중하고 특별한 가공절차가 필요하며, 이는 조합될 (가령, 이량화나 올리고머화될) 분자들이 조합됨에 따라, 다소 상이한 기능을 수반하고 제한되어야 하며, 또는 비-리간드 조건하에서 서로에 대한 자연 친화력을 갖지 않아야 하기 때문이다.
방법 및 분석 접근
일련의 EcR 및 RXR 융합물 (분열 반딧불이 루시페라제(fLuc)를 가진 것) 단백질을 구상 설계했다 (도 2 내지 6 참조). 분열 루시페라제 시스템을 이용하여 다른 세포 시스템에서의 단백질-단백질 상호작용을 연구 조사했다 (e.g., Luker, et al., Proc. Natl. Acad. Sci. U.S.A. 101(33): 12288-93 (2004), Paulmurugan and Gambhir, Anal. Chem. 75(5):1295-302 (2005), Fujikawa and Kato, Plant J. 52(1):185-95 (2007), and Leng, et al., PLos One 8(4):e62230 (2013) 참조, 이들 각각의 내용 전체를 본원에 참조로서 인용한다). 분열 루시페라제 시스템은 조합시 성분들이 공유결합하지 않는 점에서 분열 GFP 시스템보다 유리하며, 오프-비율 분석이 가능하다.
fLuc 단백질은 서로에 대해 고유 친화력이 없는 (융합 단백질 요소에 의해 밀착 조합될 때까지 비활성인 형태로) 2개의 단편으로 분할되었으며, 이는 단백질-단백질 조합을 테스트하는 시스템으로 이용된다. HEK293 세포는 아래와 같이, EcR 및 RXR 도메인에 융합된 분열 fLuc로 트랜스펙션 처리했다:
트랜스펙션 (세포내 유전자 도입)
트랜스펙션 1일 전, 10,000개의 세포 (293T 세포)를 항생제 없이 100㎕의 성장배지 (10% 태아소혈청을 함유한 둘베코 변형 이글 배지)를 함유한 96 웰 플레이트의 각 웰에 담았다. 플라스미드쌍, Clu_EcR 함유 RxR_Nluc 및 Clu_RxR 함유 EcR_Nluc (도 8 참조; 도 8에 도시한 구조의 아미노산 서열은 각각 SEQ ID NOs: 87 내지 92로 공급된다. SEQ ID NOs: 91 및 92는 각각 EcR 및 RXR 아미노산 서열에 해당하고 도 8의 구조에 사용된다)을 제조회사의 사양에 따라 Lipofectamine® 2000으로 트랜스펙션 처리했다. 요약하면, 각 플라스미드 DNA (0.2㎍)와 0.5㎕의 리포펙타민 2000®을 25.0㎕의 Opti-MEM® I 환원 혈청 배지로 희석하여 실온에서 5분간 배양했고 그 부피는 공통-트랜스펙션에서 2배에 달했다. 희석된 플라스미드 DNA를 희석된 리포펙타민® 2000과 조합한 뒤 실온에서 20분간 배양했다. 50㎕의 DNA/리포펙타민® 2000 착염을 96 웰 플레이트의 각 웰에 첨가했다. 37℃의 5% CO2 배양기에서 24시간 세포 배양한 뒤에 활성화 리간드 벨레디멕스를 첨가했다.
생체발광 분석
스물네(24) 시간-트랜스펙션 후, 96-웰 플레이트의 각 플레이트로부터 얻은 세포 배양 배지를 100 nM 벨레디멕스 활성화 리간드 및 디메틸 술폭시드-DMSO로 대체했다 (음성 대조군). 각 성분을 100% 태아소 혈청을 포함한 둘베코 변형 이글 배지 1000배 희석한 뒤, 37℃의 5% CO2 배양기에서 6시간 동안 배양했다. ONE-Glo™ 루시페라제 분석 완충액을 5'-플루오로루시페린 (루시페린 유사체)를 함유하는 ONE-Glo™ 루시페라제 분석 기질과 조합하였다. 이 시약을 재구성후 동결 및 사용 전까지 -20℃에서 보관했다. 루시페라제 ONE-Glo™ 루시페라제 기질을 수조에서 실온으로 해동했다. 96-웰 플레이트를 배양기에서 단리하고, 기질 첨가전, Corning® 96 웰 마이크로플레이트 알루미늄 밀봉 테이프로 덮은 플레이트 바닥을 실온에서 약 1시간 동안 평형화했다. 100㎕의 ONE-Glo™ 루시페라제 시약 완충액을 96-웰 플레이트 각각에 첨가했다. 실온에서 3분간 배양하여 세포 용리를 완료한 뒤, 96-웰 플레이트를 GloMax™ 96 마이크로플레이트 광측정기에 넣고 각 웰에서 생체발광값을 측정했다.
활성화 리간드의 부재시, 배경 신호만 관측되었다. fLuc 신호는 활성화 리간드를 첨가한 후에 검출되었다 (도 7; RXR-EcR 리간드 - 및 +, 우측의 먼 위치). fLuc 분석은 활성화 리간드 첨가뒤 6시간 후에 수행했다. 동일한 분열 fLuc 시스템을 이용하여 동종이량화하는 것을 보여준 단백질인 STAT1을 이용한 구조물 (가령, Luker, et al., (2004) 참조)을 양성 대조군으로 했다 (표 2 참조). 양성 대조군의 신호는 활성화 리간드의 영향을 받지 않은 것을 나타낸다 (도 7; 양성 대조군, STAT1. 리간드 - 및 +). 음성 대조군으로는, eGFP 및 활성 리간드 단독 (비히클만) 시료가 배경 판독값을 제공했다 (도 7; eGFP, 리간드 -, 및 리간드 +). 이 실험에서 리간드 + 웰은 다른 웰보다 다소 적은 세포수를 갖는 점을 주목해야 한다 (도 7; 리간드 + *). 평균 배경값에 대해 데이터를 표준화하였으며 광의 유닛에 대한 상대값으로 기록했다. 표준 fLuc을 추가의 대조군으로 실험에 사용했다.
활성화 리간드 첨가시, 뚜렷한 EcR 및 RXR LIPC 시스템을 이용하여 fLuc 신호를 생성한다. 리간드 부재시 배경만 관측된다 (도 7 참조).
표 2: 분열 루시페라제 시스템의 실험적 설정
Figure pct00012
양성 신호는 활성화 리간드에 노출된 벡터쌍의 보상, EcR 및 RXR 성분의 조합 형성 및 fLuc 활성도의 복구시에 관측되어야 한다. 도 9 및 도 10에는 리간드 용량반응 곡선이 도시되어 있다. 이 작업은 리간드 유도성 폴리펩티드 결합, 가령, 리간드-매개 조합 또는 올리고머화를 수행하여 단백질-단백질 상호작용 및 번역후 레벨에서의 조합을 제어할 수 있는 EcR 및 RXR의 능력을 입증하는데 도움을 준다.
도 11 및 12에는 벨레디멕스 리간드 결과를 통한 EcR 이량화 유도가 도시되어 있다.
본 시스템에서 생성된 데이터를 이용하여 장차 추가적인 시스템을 위한 분자 설계에 대한 정보를 알아낸다. 이러한 시스템의 추가적인 용도는 제한되지 않으나, 단백질-단백질 상호작용을 통해 활성화되는 신호발생 도메인 (가령, 신호발생 분자, 신호발생 도메인, 상보 단백질 절편, 단백질 서브유닛, 및 자연 또는 가공된 부분 또는 절단 단백질)을 포함한다.
세포내 분열 fLuc 리포터 (정보제공 유전자)를 포함하는 실험 및 그 결과에 기초하여, 새로운 LIPC 시스템의 설계에 착수하기로 한다. EcR, RXR 및 분열 fLuc 요소의 추가적인 구성을 분석하여 추가적인 페어링을 확인하기로 한다. 이러한 모든 정보는 단백질 비교 모델의 생성에 대한 정보를 찾아내는데 이용할 수 있으며, 이에 따라 미래의 설계에 대한 가이드라인을 제공할 수 있다. 현재의 분열 fLuc 벡터 역시 일관적인 활성도를 위한 다른 중요한 세포류에서 시험하기로 한다. 단백질이 본 실시예에서 본질적으로 발현되므로, 활성화 리간드가 투여될 때 이량화 현상은 신속해야 한다. 환언하면, fLuc 이등분들은 서로 친화력이 없으며, 공유결합적인 상호작용을 하지 않을 경우, 이 시스템은 활성화 리간드의 제거후 오프-비율 반응속도를 시험하는데 사용할 수 있다. 신호 개시와 쇠락 실험 모두를 예측 및 수행한다.
또한, 추가의 LIPC 설계를 수행하기로 한다. 설계의 일부는 상기 fLuc 시스템과 유사하며 차이점은, 예를 들어, 상호작용에 수반된 분자들이 단일 경로 I형 막횡단 단백질일 수 있는 것이다. 초기 설계 및 실험은 세포밖에 위치한 융합 단백질의 적어도 일부와 함께 세포내 국소화된 EcR 및 RXR를 이용하여 수행하기로 한다 (도 3 참조). 그러나, 실제의 분석 판독값에 따라 수개의 추가적인 구성도 가능할 수 있다. 추가적인 설계는, 제한되지 않으나, 세포외 국소화된 EcR 및 RXR과 세포내 위치한 융합 단백질과 함께 EcR 및 RXR에 융합된 막횡단 도메인을 갖는 분자들을 포함한다 (도 4 참조). 또 다른 구성은 EcR 및 RXR 성분이 막횡단 도메인에 융합되어 있을 때 EcR, RXR 및 융합된 신호발생 도메인이 모두 세포내에 위치하는 것이다 (도 5 참조). fLuc로부터 떨어진 추가적인 신호발생 도메인을 상기에서 개략적으로 기술한 다양한 구성에 사용할 수 있다.
온-비율 및 오프-비율, 원하는 활성화 효과를 얻는데 필요한 최적의 발현 강도 등을 이해하고, (필요시) 잠재적 배경 (가령, 리간드의 부재시 비파트너 단백질의 생물학적 효과)을 감소시키는 실험들을 추가의 연구에 포함시키기로 한다.
실시예 2 -핵 수용체 성분의 리간드-유도 이량화
핵 수용체 도메인 (즉, EcR 및 RxR 폴리펩티드)이 유도되어 리간드 첨가시 동종이량화할 수 있는지 확인하기 위해 실험을 수행하였다 (도 11 및 12). 리간드 첨가 여부에 관계없이 자체 이량화하는 것으로 보고된 STAT1을 폴리펩티드 대조군으로 이용하였다. 도면의 약어는 다음과 같다:
"EcR"은 엑디손 수용체이고;
"EcR-EcR"은 "EcR_Nluc + Cluc_EcR"을 의미하며, 이는 2개로 분열된 루시페라제 폴리펩티드로서, EcR 폴리펩티드는 루시페라제 폴리펩티드 절편의 N-말단에 융합되고 (EcR_Nluc), 루시페라제의 또 다른 절편은 그의 C-말단에 융합된 EcR 폴리펩티드를 갖고 (Cluc_EcR); 이에 따라 EcR 동종이량화시에 루시페라제를 활성화 하며 (생체발광 실현);
"RxR"은 레티노이드 X 수용체이고;
"Mock" 은 벡터 무첨가를 의미하고;
"eGFP"는 개량된 GFP 이고 (음성 대조군으로 사용됨);
"RxR_EcR"은 "EcR_Nluc + Cluc_RXR"을 의미하며, 이는 2개로 분열된 루시페라제 폴리펩티드로서, EcR 폴리펩티드는 루시페라제 폴리펩티드 절편의 N-말단에 융합되고 (EcR_Nluc), 루시페라제의 또 다른 절편은 그의 C-말단에 융합된 EcR 폴리펩티드를 갖고 (Cluc_EcR); 이에 따라 EcR 동종이량화시에 루시페라제를 활성화한다 (생체발광 실현).
예시한 결과는 (도 11 및 12) EcR 도메인이 유도되어 리간드 첨가시 동종이량화할 수 있음을 나타낸다. 그러나, 생체발광 신호의 차이는 비교적 작으며, 이는 EcR 도메인 간의 친화력이 낮은 탓일 수 있다. 생체발광 출력에 기초하여, 리간드 추가시에 EcR 도메인의 동종이량화는 통계학적으로 유의미했다. 이와 대조적으로, RxR 도메인은 리간드와 무관하게 동종이량화하는 놀라운 사실이 관측되었다. 게다가, 가장 강한 신호 (생체발광)는 리간드에 의해 유도된 RxR 및 EcR 도메인의 이종이량화를 통해 관측되었다. 따라서, 이들 결과는 리간드에 의해 유도된 이종이량화를 통해 RxR과 EcR 도메인 간의 상호작용이 비교적 강하다는 것을 나타낸다. 사실상 각 도메인의 동종이량화가 보다 제한적인 친화도를 갖지만, 놀랍게도 RxR 도메인의 리간드-독립 동종이량화를 관찰 및 발견하였다.
별도의 정의가 없는 한, 본원에 사용된 모든 기술적 및 과학적 용어와 약어는 본 발명이 속한 분야의 통상의 기술자가 주지관용하는 것과 동일한 의미를 갖는다.
본원에서 언급한 모든 문헌은 법적으로 허락하는 이들의 내용 전체를 본원에 참조로서 인용한다. 이들 문헌의 검토는 각 문헌의 저자가 주장하는 내용을 요약하기 위한 것에 불과하다. 문헌 (또는 그 내용의 일부)을 본원의 관련기술로 이용할 수 없다. 본 출원인은 인용문헌의 정확성과 적합성을 시험할 권한이 있다.
APPENDIX I - SEQUENCES
<210> SEQ ID NO: 1
<211> LENGTH: 1054
<212> TYPE: DNA
<213> ORGANISM: Choristoneura fumiferana
<400> SEQUENCE: 1
cctgagtgcg tagtacccga gactcagtgc gccatgaagc ggaaagagaa gaaagcacag 60
aaggagaagg acaaactgcc tgtcagcacg acgacggtgg acgaccacat gccgcccatt 120
atgcagtgtg aacctccacc tcctgaagca gcaaggattc acgaagtggt cccaaggttt 180
ctctccgaca agctgttgga gacaaaccgg cagaaaaaca tcccccagtt gacagccaac 240
cagcagttcc ttatcgccag gctcatctgg taccaggacg ggtacgagca gccttctgat 300
gaagatttga agaggattac gcagacgtgg cagcaagcgg acgatgaaaa cgaagagtct 360
gacactccct tccgccagat cacagagatg actatcctca cggtccaact tatcgtggag 420
ttcgcgaagg gattgccagg gttcgccaag atctcgcagc ctgatcaaat tacgctgctt 480
aaggcttgct caagtgaggt aatgatgctc cgagtcgcgc gacgatacga tgcggcctca 540
gacagtgttc tgttcgcgaa caaccaagcg tacactcgcg acaactaccg caaggctggc 600
atggcctacg tcatcgagga tctactgcac ttctgccggt gcatgtactc tatggcgttg 660
gacaacatcc attacgcgct gctcacggct gtcgtcatct tttctgaccg gccagggttg 720
gagcagccgc aactggtgga agaaatccag cggtactacc tgaatacgct ccgcatctat 780
atcctgaacc agctgagcgg gtcggcgcgt tcgtccgtca tatacggcaa gatcctctca 840
atcctctctg agctacgcac gctcggcatg caaaactcca acatgtgcat ctccctcaag 900
ctcaagaaca gaaagctgcc gcctttcctc gaggagatct gggatgtggc ggacatgtcg 960
cacacccaac cgccgcctat cctcgagtcc cccacgaatc tctagcccct gcgcgcacgc 1020
atcgccgatg ccgcgtccgg ccgcgctgct ctga 1054
<210> SEQ ID NO: 2
<211> LENGTH: 1288
<212> TYPE: DNA
<213> ORGANISM: Choristoneura fumiferana
<400> SEQUENCE: 2
aagggccctg cgccccgtca gcaagaggaa ctgtgtctgg tatgcgggga cagagcctcc 60
ggataccact acaatgcgct cacgtgtgaa gggtgtaaag ggttcttcag acggagtgtt 120
accaaaaatg cggtttatat ttgtaaattc ggtcacgctt gcgaaatgga catgtacatg 180
cgacggaaat gccaggagtg ccgcctgaag aagtgcttag ctgtaggcat gaggcctgag 240
tgcgtagtac ccgagactca gtgcgccatg aagcggaaag agaagaaagc acagaaggag 300
aaggacaaac tgcctgtcag cacgacgacg gtggacgacc acatgccgcc cattatgcag 360
tgtgaacctc cacctcctga agcagcaagg attcacgaag tggtcccaag gtttctctcc 420
gacaagctgt tggagacaaa ccggcagaaa aacatccccc agttgacagc caaccagcag 480
ttccttatcg ccaggctcat ctggtaccag gacgggtacg agcagccttc tgatgaagat 540
ttgaagagga ttacgcagac gtggcagcaa gcggacgatg aaaacgaaga gtctgacact 600
cccttccgcc agatcacaga gatgactatc ctcacggtcc aacttatcgt ggagttcgcg 660
aagggattgc cagggttcgc caagatctcg cagcctgatc aaattacgct gcttaaggct 720
tgctcaagtg aggtaatgat gctccgagtc gcgcgacgat acgatgcggc ctcagacagt 780
gttctgttcg cgaacaacca agcgtacact cgcgacaact accgcaaggc tggcatggcc 840
tacgtcatcg aggatctact gcacttctgc cggtgcatgt actctatggc gttggacaac 900
atccattacg cgctgctcac ggctgtcgtc atcttttctg accggccagg gttggagcag 960
ccgcaactgg tggaagaaat ccagcggtac tacctgaata cgctccgcat ctatatcctg 1020
aaccagctga gcgggtcggc gcgttcgtcc gtcatatacg gcaagatcct ctcaatcctc 1080
tctgagctac gcacgctcgg catgcaaaac tccaacatgt gcatctccct caagctcaag 1140
aacagaaagc tgccgccttt cctcgaggag atctgggatg tggcggacat gtcgcacacc 1200
caaccgccgc ctatcctcga gtcccccacg aatctctagc ccctgcgcgc acgcatcgcc 1260
gatgccgcgt ccggccgcgc tgctctga 1288
<210> SEQ ID NO: 3
<211> LENGTH: 1650
<212> TYPE: DNA
<213> ORGANISM: Drosophila melanogaster
<400> SEQUENCE: 3
cggccggaat gcgtcgtccc ggagaaccaa tgtgcgatga agcggcgcga aaagaaggcc 60
cagaaggaga aggacaaaat gaccacttcg ccgagctctc agcatggcgg caatggcagc 120
ttggcctctg gtggcggcca agactttgtt aagaaggaga ttcttgacct tatgacatgc 180
gagccgcccc agcatgccac tattccgcta ctacctgatg aaatattggc caagtgtcaa 240
gcgcgcaata taccttcctt aacgtacaat cagttggccg ttatatacaa gttaatttgg 300
taccaggatg gctatgagca gccatctgaa gaggatctca ggcgtataat gagtcaaccc 360
gatgagaacg agagccaaac ggacgtcagc tttcggcata taaccgagat aaccatactc 420
acggtccagt tgattgttga gtttgctaaa ggtctaccag cgtttacaaa gataccccag 480
gaggaccaga tcacgttact aaaggcctgc tcgtcggagg tgatgatgct gcgtatggca 540
cgacgctatg accacagctc ggactcaata ttcttcgcga ataatagatc atatacgcgg 600
gattcttaca aaatggccgg aatggctgat aacattgaag acctgctgca tttctgccgc 660
caaatgttct cgatgaaggt ggacaacgtc gaatacgcgc ttctcactgc cattgtgatc 720
ttctcggacc ggccgggcct ggagaaggcc caactagtcg aagcgatcca gagctactac 780
atcgacacgc tacgcattta tatactcaac cgccactgcg gcgactcaat gagcctcgtc 840
ttctacgcaa agctgctctc gatcctcacc gagctgcgta cgctgggcaa ccagaacgcc 900
gagatgtgtt tctcactaaa gctcaaaaac cgcaaactgc ccaagttcct cgaggagatc 960
tgggacgttc atgccatccc gccatcggtc cagtcgcacc ttcagattac ccaggaggag 1020
aacgagcgtc tcgagcgggc tgagcgtatg cgggcatcgg ttgggggcgc cattaccgcc 1080
ggcattgatt gcgactctgc ctccacttcg gcggcggcag ccgcggccca gcatcagcct 1140
cagcctcagc cccagcccca accctcctcc ctgacccaga acgattccca gcaccagaca 1200
cagccgcagc tacaacctca gctaccacct cagctgcaag gtcaactgca accccagctc 1260
caaccacagc ttcagacgca actccagcca cagattcaac cacagccaca gctccttccc 1320
gtctccgctc ccgtgcccgc ctccgtaacc gcacctggtt ccttgtccgc ggtcagtacg 1380
agcagcgaat acatgggcgg aagtgcggcc ataggaccca tcacgccggc aaccaccagc 1440
agtatcacgg ctgccgttac cgctagctcc accacatcag cggtaccgat gggcaacgga 1500
gttggagtcg gtgttggggt gggcggcaac gtcagcatgt atgcgaacgc ccagacggcg 1560
atggccttga tgggtgtagc cctgcattcg caccaagagc agcttatcgg gggagtggcg 1620
gttaagtcgg agcactcgac gactgcatag 1650
<210> SEQ ID NO: 4
<211> LENGTH: 894
<212> TYPE: DNA
<213> ORGANISM: Tenebrio molitor
<400> SEQUENCE: 4
aggccggaat gtgtggtacc ggaagtacag tgtgctgtta agagaaaaga gaagaaagcc 60
caaaaggaaa aagataaacc aaacagcact actaacggct caccagacgt catcaaaatt 120
gaaccagaat tgtcagattc agaaaaaaca ttgactaacg gacgcaatag gatatcacca 180
gagcaagagg agctcatact catacatcga ttggtttatt tccaaaacga atatgaacat 240
ccgtctgaag aagacgttaa acggattatc aatcagccga tagatggtga agatcagtgt 300
gagatacggt ttaggcatac cacggaaatt acgatcctga ctgtgcagct gatcgtggag 360
tttgccaagc ggttaccagg cttcgataag ctcctgcagg aagatcaaat tgctctcttg 420
aaggcatgtt caagcgaagt gatgatgttc aggatggccc gacgttacga cgtccagtcg 480
gattccatcc tcttcgtaaa caaccagcct tatccgaggg acagttacaa tttggccggt 540
atgggggaaa ccatcgaaga tctcttgcat ttttgcagaa ctatgtactc catgaaggtg 600
gataatgccg aatatgcttt actaacagcc atcgttattt tctcagagcg accgtcgttg 660
atagaaggct ggaaggtgga gaagatccaa gaaatctatt tagaggcatt gcgggcgtac 720
gtcgacaacc gaagaagccc aagccggggc acaatattcg cgaaactcct gtcagtacta 780
actgaattgc ggacgttagg caaccaaaat tcagagatgt gcatctcgtt gaaattgaaa 840
aacaaaaagt taccgccgtt cctggacgaa atctgggacg tcgacttaaa agca 894
210> SEQ ID NO: 5
<211> LENGTH: 948
<212> TYPE: DNA
<213> ORGANISM: Amblyomma americanum
<400> SEQUENCE: 5
cggccggaat gtgtggtgcc ggagtaccag tgtgccatca agcgggagtc taagaagcac 60
cagaaggacc ggccaaacag cacaacgcgg gaaagtccct cggcgctgat ggcgccatct 120
tctgtgggtg gcgtgagccc caccagccag cccatgggtg gcggaggcag ctccctgggc 180
agcagcaatc acgaggagga taagaagcca gtggtgctca gcccaggagt caagcccctc 240
tcttcatctc aggaggacct catcaacaag ctagtctact accagcagga gtttgagtcg 300
ccttctgagg aagacatgaa gaaaaccacg cccttccccc tgggagacag tgaggaagac 360
aaccagcggc gattccagca cattactgag atcaccatcc tgacagtgca gctcattgtg 420
gagttctcca agcgggtccc tggctttgac acgctggcac gagaagacca gattactttg 480
ctgaaggcct gctccagtga agtgatgatg ctgagaggtg cccggaaata tgatgtgaag 540
acagattcta tagtgtttgc caataaccag ccgtacacga gggacaacta ccgcagtgcc 600
agtgtggggg actctgcaga tgccctgttc cgcttctgcc gcaagatgtg tcagctgaga 660
gtagacaacg ctgaatacgc actcctgacg gccattgtaa ttttctctga acggccatca 720
ctggtggacc cgcacaaggt ggagcgcatc caggagtact acattgagac cctgcgcatg 780
tactccgaga accaccggcc cccaggcaag aactactttg cccggctgct gtccatcttg 840
acagagctgc gcaccttggg caacatgaac gccgaaatgt gcttctcgct caaggtgcag 900
aacaagaagc tgccaccgtt cctggctgag atttgggaca tccaagag 948
<210> SEQ ID NO: 6
<211> LENGTH: 334
<212> TYPE: PRT
<213> ORGANISM: Choristoneura fumiferana
<400> SEQUENCE: 6
Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys Glu
Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr Thr
Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro Pro
Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp Lys
Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala Asn
Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr Glu
Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln Gln
Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile Thr
Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly
Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu Leu
Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg Tyr
Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln Ala Tyr Thr
Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile Glu Asp Leu
Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile His
Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly Leu
Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn Thr
Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser Ser
Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu
Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn Arg
Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met Ser
His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn Leu
<210> SEQ ID NO: 7
<211> LENGTH: 549
<212> TYPE: PRT
<213> ORGANISM: Drosophila melanogaster
<400> SEQUENCE: 7
Arg Pro Glu Cys Val Val Pro Glu Asn Gln Cys Ala Met Lys Arg Arg
Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Met Thr Thr Ser Pro Ser
Ser Gln His Gly Gly Asn Gly Ser Leu Ala Ser Gly Gly Gly Gln Asp
Phe Val Lys Lys Glu Ile Leu Asp Leu Met Thr Cys Glu Pro Pro Gln
His Ala Thr Ile Pro Leu Leu Pro Asp Glu Ile Leu Ala Lys Cys Gln
Ala Arg Asn Ile Pro Ser Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr
Lys Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp
Leu Arg Arg Ile Met Ser Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp
Val Ser Phe Arg His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu
Ile Val Glu Phe Ala Lys Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln
Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met
Leu Arg Met Ala Arg Arg Tyr Asp His Ser Ser Asp Ser Ile Phe Phe
Ala Asn Asn Arg Ser Tyr Thr Arg Asp Ser Tyr Lys Met Ala Gly Met
Ala Asp Asn Ile Glu Asp Leu Leu His Phe Cys Arg Gln Met Phe Ser
Met Lys Val Asp Asn Val Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile
Phe Ser Asp Arg Pro Gly Leu Glu Lys Ala Gln Leu Val Glu Ala Ile
Gln Ser Tyr Tyr Ile Asp Thr Leu Arg Ile Tyr Ile Leu Asn Arg His
Cys Gly Asp Ser Met Ser Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile
Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ala Glu Met Cys Phe
Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile
Trp Asp Val His Ala Ile Pro Pro Ser Val Gln Ser His Leu Gln Ile
Thr Gln Glu Glu Asn Glu Arg Leu Glu Arg Ala Glu Arg Met Arg Ala
Ser Val Gly Gly Ala Ile Thr Ala Gly Ile Asp Cys Asp Ser Ala Ser
Thr Ser Ala Ala Ala Ala Ala Ala Gln His Gln Pro Gln Pro Gln Pro
Gln Pro Gln Pro Ser Ser Leu Thr Gln Asn Asp Ser Gln His Gln Thr
Gln Pro Gln Leu Gln Pro Gln Leu Pro Pro Gln Leu Gln Gly Gln Leu
Gln Pro Gln Leu Gln Pro Gln Leu Gln Thr Gln Leu Gln Pro Gln Ile
Gln Pro Gln Pro Gln Leu Leu Pro Val Ser Ala Pro Val Pro Ala Ser
Val Thr Ala Pro Gly Ser Leu Ser Ala Val Ser Thr Ser Ser Glu Tyr
Met Gly Gly Ser Ala Ala Ile Gly Pro Ile Thr Pro Ala Thr Thr Ser
Ser Ile Thr Ala Ala Val Thr Ala Ser Ser Thr Thr Ser Ala Val Pro
Met Gly Asn Gly Val Gly Val Gly Val Gly Val Gly Gly Asn Val Ser
Met Tyr Ala Asn Ala Gln Thr Ala Met Ala Leu Met Gly Val Ala Leu
His Ser His Gln Glu Gln Leu Ile Gly Gly Val Ala Val Lys Ser Glu
His Ser Thr Thr Ala
<210> SEQ ID NO: 8
<211> LENGTH: 401
<212> TYPE: PRT
<213> ORGANISM: Choristoneura fumiferana
<400> SEQUENCE: 8
Cys Leu Val Cys Gly Asp Arg Ala Ser Gly Tyr His Tyr Asn Ala Leu
Thr Cys Glu Gly Cys Lys Gly Phe Phe Arg Arg Ser Val Thr Lys Asn
Ala Val Tyr Ile Cys Lys Phe Gly His Ala Cys Glu Met Asp Met Tyr
Met Arg Arg Lys Cys Gln Glu Cys Arg Leu Lys Lys Cys Leu Ala Val
Gly Met Arg Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys
Arg Lys Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser
Thr Thr Thr Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro
Pro Pro Pro Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu
Ser Asp Lys Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu
Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp
Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr
Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg
Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe
Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile
Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala
Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln
Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile
Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp
Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg
Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr
Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala
Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu
Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu
Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala
Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn
Leu
<210> SEQ ID NO: 9
<211> LENGTH: 298
<212> TYPE: PRT
<213> ORGANISM: Tenebrio molitor
<400> SEQUENCE: 9
Arg Pro Glu Cys Val Val Pro Glu Val Gln Cys Ala Val Lys Arg Lys
Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Pro Asn Ser Thr Thr Asn
Gly Ser Pro Asp Val Ile Lys Ile Glu Pro Glu Leu Ser Asp Ser Glu
Lys Thr Leu Thr Asn Gly Arg Asn Arg Ile Ser Pro Glu Gln Glu Glu
Leu Ile Leu Ile His Arg Leu Val Tyr Phe Gln Asn Glu Tyr Glu His
Pro Ser Glu Glu Asp Val Lys Arg Ile Ile Asn Gln Pro Ile Asp Gly
Glu Asp Gln Cys Glu Ile Arg Phe Arg His Thr Thr Glu Ile Thr Ile
Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Arg Leu Pro Gly Phe
Asp Lys Leu Leu Gln Glu Asp Gln Ile Ala Leu Leu Lys Ala Cys Ser
Ser Glu Val Met Met Phe Arg Met Ala Arg Arg Tyr Asp Val Gln Ser
Asp Ser Ile Leu Phe Val Asn Asn Gln Pro Tyr Pro Arg Asp Ser Tyr
Asn Leu Ala Gly Met Gly Glu Thr Ile Glu Asp Leu Leu His Phe Cys
Arg Thr Met Tyr Ser Met Lys Val Asp Asn Ala Glu Tyr Ala Leu Leu
Thr Ala Ile Val Ile Phe Ser Glu Arg Pro Ser Leu Ile Glu Gly Trp
Lys Val Glu Lys Ile Gln Glu Ile Tyr Leu Glu Ala Leu Arg Ala Tyr
Val Asp Asn Arg Arg Ser Pro Ser Arg Gly Thr Ile Phe Ala Lys Leu
Leu Ser Val Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ser Glu
Met Cys Ile Ser Leu Lys Leu Lys Asn Lys Lys Leu Pro Pro Phe Leu
Asp Glu Ile Trp Asp Val Asp Leu Lys Ala
<210> SEQ ID NO: 10
<211> LENGTH: 316
<212> TYPE: PRT
<213> ORGANISM: Amblyomma americanum
<400> SEQUENCE: 10
Arg Pro Glu Cys Val Val Pro Glu Tyr Gln Cys Ala Ile Lys Arg Glu
Ser Lys Lys His Gln Lys Asp Arg Pro Asn Ser Thr Thr Arg Glu Ser
Pro Ser Ala Leu Met Ala Pro Ser Ser Val Gly Gly Val Ser Pro Thr
Ser Gln Pro Met Gly Gly Gly Gly Ser Ser Leu Gly Ser Ser Asn His
Glu Glu Asp Lys Lys Pro Val Val Leu Ser Pro Gly Val Lys Pro Leu
Ser Ser Ser Gln Glu Asp Leu Ile Asn Lys Leu Val Tyr Tyr Gln Gln
Glu Phe Glu Ser Pro Ser Glu Glu Asp Met Lys Lys Thr Thr Pro Phe
Pro Leu Gly Asp Ser Glu Glu Asp Asn Gln Arg Arg Phe Gln His Ile
Thr Glu Ile Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ser Lys
Arg Val Pro Gly Phe Asp Thr Leu Ala Arg Glu Asp Gln Ile Thr Leu
Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Gly Ala Arg Lys
Tyr Asp Val Lys Thr Asp Ser Ile Val Phe Ala Asn Asn Gln Pro Tyr
Thr Arg Asp Asn Tyr Arg Ser Ala Ser Val Gly Asp Ser Ala Asp Ala
Leu Phe Arg Phe Cys Arg Lys Met Cys Gln Leu Arg Val Asp Asn Ala
Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile Phe Ser Glu Arg Pro Ser
Leu Val Asp Pro His Lys Val Glu Arg Ile Gln Glu Tyr Tyr Ile Glu
Thr Leu Arg Met Tyr Ser Glu Asn His Arg Pro Pro Gly Lys Asn Tyr
Phe Ala Arg Leu Leu Ser Ile Leu Thr Glu Leu Arg Thr Leu Gly Asn
Met Asn Ala Glu Met Cys Phe Ser Leu Lys Val Gln Asn Lys Lys Leu
Pro Pro Phe Leu Ala Glu Ile Trp Asp Ile Gln Glu
SEQ ID NO: 11
<211> LENGTH: 711
<212> TYPE: DNA
<213> ORGANISM: Artificial Sequence
<220> FEATURE:
<223> OTHER INFORMATION: Chimeric RXR ligand binding domain
<400> SEQUENCE: 11
gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60
actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120
accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180
atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240
aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300
ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360
tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagact 420
gaacttggct gcttgcgatc tgttattctt ttcaatccag aggtgagggg tttgaaatcc 480
gcccaggaag ttgaacttct acgtgaaaaa gtatatgccg ctttggaaga atatactaga 540
acaacacatc ccgatgaacc aggaagattt gcaaaacttt tgcttcgtct gccttcttta 600
cgttccatag gccttaagtg tttggagcat ttgtttttct ttcgccttat tggagatgtt 660
ccaattgata cgttcctgat ggagatgctt gaatcacctt ctgattcata a 711
<210> SEQ ID NO: 12
<211> LENGTH: 720
<212> TYPE: DNA
<213> ORGANISM: Homo sapiens
<400> SEQUENCE: 12
gcccccgagg agatgcctgt ggacaggatc ctggaggcag agcttgctgt ggaacagaag 60
agtgaccagg gcgttgaggg tcctggggga accgggggta gcggcagcag cccaaatgac 120
cctgtgacta acatctgtca ggcagctgac aaacagctat tcacgcttgt tgagtgggcg 180
aagaggatcc cacacttttc ctccttgcct ctggatgatc aggtcatatt gctgcgggca 240
ggctggaatg aactcctcat tgcctccttt tcacaccgat ccattgatgt tcgagatggc 300
atcctccttg ccacaggtct tcacgtgcac cgcaactcag cccattcagc aggagtagga 360
gccatctttg atcgggtgct gacagagcta gtgtccaaaa tgcgtgacat gaggatggac 420
aagacagagc ttggctgcct gagggcaatc attctgttta atccagatgc caagggcctc 480
tccaacccta gtgaggtgga ggtcctgcgg gagaaagtgt atgcatcact ggagacctac 540
tgcaaacaga agtaccctga gcagcaggga cggtttgcca agctgctgct acgtcttcct 600
gccctccggt ccattggcct taagtgtcta gagcatctgt ttttcttcaa gctcattggt 660
gacaccccca tcgacacctt cctcatggag atgcttgagg ctccccatca actggcctga 720
SEQ ID NO: 13
<211> LENGTH: 635
<212> TYPE: DNA
<213> ORGANISM: Locusta migratoria
<400> SEQUENCE: 13
tgcatacaga catgcctgtt gaacgcatac ttgaagctga aaaacgagtg gagtgcaaag 60
cagaaaacca agtggaatat gagctggtgg agtgggctaa acacatcccg cacttcacat 120
ccctacctct ggaggaccag gttctcctcc tcagagcagg ttggaatgaa ctgctaattg 180
cagcattttc acatcgatct gtagatgtta aagatggcat agtacttgcc actggtctca 240
cagtgcatcg aaattctgcc catcaagctg gagtcggcac aatatttgac agagttttga 300
cagaactggt agcaaagatg agagaaatga aaatggataa aactgaactt ggctgcttgc 360
gatctgttat tcttttcaat ccagaggtga ggggtttgaa atccgcccag gaagttgaac 420
ttctacgtga aaaagtatat gccgctttgg aagaatatac tagaacaaca catcccgatg 480
aaccaggaag atttgcaaaa cttttgcttc gtctgccttc tttacgttcc ataggcctta 540
agtgtttgga gcatttgttt ttctttcgcc ttattggaga tgttccaatt gatacgttcc 600
tgatggagat gcttgaatca ccttctgatt cataa 635
<210> SEQ ID NO: 14
<211> LENGTH: 236
<212> TYPE: PRT
<213> ORGANISM: Artificial Sequence
<220> FEATURE:
<223> OTHER INFORMATION: Chimeric RXR ligand binding domain
<400> SEQUENCE: 14
Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala
Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn
Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp
Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe
Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp
Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys
Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala
His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu
Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys
Leu Arg Ser Val Ile Leu Phe Asn Pro Glu Val Arg Gly Leu Lys Ser
Ala Gln Glu Val Glu Leu Leu Arg Glu Lys Val Tyr Ala Ala Leu Glu
Glu Tyr Thr Arg Thr Thr His Pro Asp Glu Pro Gly Arg Phe Ala Lys
Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser Ile Gly Leu Lys Cys Leu
Glu His Leu Phe Phe Phe Arg Leu Ile Gly Asp Val Pro Ile Asp Thr
Phe Leu Met Glu Met Leu Glu Ser Pro Ser Asp Ser
<210> SEQ ID NO: 15
<211> LENGTH: 239
<212> TYPE: PRT
<213> ORGANISM: Homo sapiens
<400> SEQUENCE: 15
Ala Pro Glu Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala
Val Glu Gln Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Gly Thr Gly
Gly Ser Gly Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala
Ala Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro
His Phe Ser Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala
Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp
Val Arg Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn
Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr
Glu Leu Val Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu
Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn Pro Asp Ala Lys Gly Leu
Ser Asn Pro Ser Glu Val Glu Val Leu Arg Glu Lys Val Tyr Ala Ser
Leu Glu Thr Tyr Cys Lys Gln Lys Tyr Pro Glu Gln Gln Gly Arg Phe
Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys
Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile
Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Leu Ala
<210> SEQ ID NO: 16
<211> LENGTH: 210
<212> TYPE: PRT
<213> ORGANISM: Locusta migratoria
<400> SEQUENCE: 16
His Thr Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Lys Arg Val
Glu Cys Lys Ala Glu Asn Gln Val Glu Tyr Glu Leu Val Glu Trp Ala
Lys His Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu
Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His
Arg Ser Val Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Leu Thr
Val His Arg Asn Ser Ala His Gln Ala Gly Val Gly Thr Ile Phe Asp
Arg Val Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp
Lys Thr Glu Leu Gly Cys Leu Arg Ser Val Ile Leu Phe Asn Pro Glu
Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg Glu Lys
Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asp Glu
Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser
Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu Ile Gly
Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ser
Asp Ser
<210> SEQ ID NO: 17
<211> 240
<212> PRT
<213> Choristoneura fumiferana
<400> SEQUENCE: 17
Leu Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln
Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln
Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe
Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu
Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln
Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val
Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn
Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val
Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu
Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp
Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr
Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser
Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu
Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys
Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val
<210> SEQ ID NO: 18
<211> 237
<212> PRT
<213> Drosophila melanogaster
<400> SEQUENCE: 18
Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr Lys Leu Ile Trp Tyr Gln
Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp Leu Arg Arg Ile Met Ser
Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp Val Ser Phe Arg His Ile
Thr Glu Ile Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys
Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln Glu Asp Gln Ile Thr Leu
Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Met Ala Arg Arg
Tyr Asp His Ser Ser Asp Ser Ile Phe Phe Ala Asn Asn Arg Ser Tyr
Thr Arg Asp Ser Tyr Lys Met Ala Gly Met Ala Asp Asn Ile Glu Asp
Leu Leu His Phe Cys Arg Gln Met Phe Ser Met Lys Val Asp Asn Val
Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile Phe Ser Asp Arg Pro Gly
Leu Glu Lys Ala Gln Leu Val Glu Ala Ile Gln Ser Tyr Tyr Ile Asp
Thr Leu Arg Ile Tyr Ile Leu Asn Arg His Cys Gly Asp Ser Met Ser
Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile Leu Thr Glu Leu Arg Thr
Leu Gly Asn Gln Asn Ala Glu Met Cys Phe Ser Leu Lys Leu Lys Asn
Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile Trp Asp Val
<210> SEQ ID NO: 19
<211> 240
<212> PRT
<213> Amblyomma americanum
<400> SEQUENCE: 19
Pro Gly Val Lys Pro Leu Ser Ser Ser Gln Glu Asp Leu Ile Asn Lys
Leu Val Tyr Tyr Gln Gln Glu Phe Glu Ser Pro Ser Glu Glu Asp Met
Lys Lys Thr Thr Pro Phe Pro Leu Gly Asp Ser Glu Glu Asp Asn Gln
Arg Arg Phe Gln His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu
Ile Val Glu Phe Ser Lys Arg Val Pro Gly Phe Asp Thr Leu Ala Arg
Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met
Leu Arg Gly Ala Arg Lys Tyr Asp Val Lys Thr Asp Ser Ile Val Phe
Ala Asn Asn Gln Pro Tyr Thr Arg Asp Asn Tyr Arg Ser Ala Ser Val
Gly Asp Ser Ala Asp Ala Leu Phe Arg Phe Cys Arg Lys Met Cys Gln
Leu Arg Val Asp Asn Ala Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile
Phe Ser Glu Arg Pro Ser Leu Val Asp Pro His Lys Val Glu Arg Ile
Gln Glu Tyr Tyr Ile Glu Thr Leu Arg Met Tyr Ser Glu Asn His Arg
Pro Pro Gly Lys Asn Tyr Phe Ala Arg Leu Leu Ser Ile Leu Thr Glu
Leu Arg Thr Leu Gly Asn Met Asn Ala Glu Met Cys Phe Ser Leu Lys
Val Gln Asn Lys Lys Leu Pro Pro Phe Leu Ala Glu Ile Trp Asp Ile
<210> SEQ ID NO: 20
<211> LENGTH: 1586
<212> TYPE: DNA
<213> ORGANISM: Bamecia argentifoli
<400> SEQUENCE: 20
gaattcgcgg ccgctcgcaa acttccgtac ctctcacccc ctcgccagga ccccccgcca 60
accagttcac cgtcatctcc tccaatggat actcatcccc catgtcttcg ggcagctacg 120
acccttatag tcccaccaat ggaagaatag ggaaagaaga gctttcgccg gcgaatagtc 180
tgaacgggta caacgtggat agctgcgatg cgtcgcggaa gaagaaggga ggaacgggtc 240
ggcagcagga ggagctgtgt ctcgtctgcg gggaccgcgc ctccggctac cactacaacg 300
ccctcacctg cgaaggctgc aagggcttct tccgtcggag catcaccaag aatgccgtct 360
accagtgtaa atatggaaat aattgtgaaa ttgacatgta catgaggcga aaatgccaag 420
agtgtcgtct caagaagtgt ctcagcgttg gcatgaggcc agaatgtgta gttcccgaat 480
tccagtgtgc tgtgaagcga aaagagaaaa aagcgcaaaa ggacaaagat aaacctaact 540
caacgacgag ttgttctcca gatggaatca aacaagagat agatcctcaa aggctggata 600
cagattcgca gctattgtct gtaaatggag ttaaacccat tactccagag caagaagagc 660
tcatccatag gctagtttat tttcaaaatg aatatgaaca tccatcccca gaggatatca 720
aaaggatagt taatgctgca ccagaagaag aaaatgtagc tgaagaaagg tttaggcata 780
ttacagaaat tacaattctc actgtacagt taattgtgga attttctaag cgattacctg 840
gttttgacaa actaattcgt gaagatcaaa tagctttatt aaaggcatgt agtagtgaag 900
taatgatgtt tagaatggca aggaggtatg atgctgaaac agattcgata ttgtttgcaa 960
ctaaccagcc gtatacgaga gaatcataca ctgtagctgg catgggtgat actgtggagg 1020
atctgctccg attttgtcga catatgtgtg ccatgaaagt cgataacgca gaatatgctc 1080
ttctcactgc cattgtaatt ttttcagaac gaccatctct aagtgaaggc tggaaggttg 1140
agaagattca agaaatttac atagaagcat taaaagcata tgttgaaaat cgaaggaaac 1200
catatgcaac aaccattttt gctaagttac tatctgtttt aactgaacta cgaacattag 1260
ggaatatgaa ttcagaaaca tgcttctcat tgaagctgaa gaatagaaag gtgccatcct 1320
tcctcgagga gatttgggat gttgtttcat aaacagtctt acctcaattc catgttactt 1380
ttcatatttg atttatctca gcaggtggct cagtacttat cctcacatta ctgagctcac 1440
ggtatgctca tacaattata acttgtaata tcatatcggt gatgacaaat ttgttacaat 1500
attctttgtt accttaacac aatgttgatc tcataatgat gtatgaattt ttctgttttt 1560
gcaaaaaaaa aagcggccgc gaattc 1586
<210> SEQ ID NO: 21
<211> LENGTH: 1109
<212> TYPE: DNA
<213> ORGANISM: Nephotetix cincticeps
<400> SEQUENCE: 21
caggaggagc tctgcctgtt gtgcggagac cgagcgtcgg gataccacta caacgctctc 60
acctgcgaag gatgcaaggg cttctttcgg aggagtatca ccaaaaacgc agtgtaccag 120
tccaaatacg gcaccaattg tgaaatagac atgtatatgc ggcgcaagtg ccaggagtgc 180
cgactcaaga agtgcctcag tgtagggatg aggccagaat gtgtagtacc tgagtatcaa 240
tgtgccgtaa aaaggaaaga gaaaaaagct caaaaggaca aagataaacc tgtctcttca 300
accaatggct cgcctgaaat gagaatagac caggacaacc gttgtgtggt gttgcagagt 360
gaagacaaca ggtacaactc gagtacgccc agtttcggag tcaaacccct cagtccagaa 420
caagaggagc tcatccacag gctcgtctac ttccagaacg agtacgaaca ccctgccgag 480
gaggatctca agcggatcga gaacctcccc tgtgacgacg atgacccgtg tgatgttcgc 540
tacaaacaca ttacggagat cacaatactc acagtccagc tcatcgtgga gtttgcgaaa 600
aaactgcctg gtttcgacaa actactgaga gaggaccaga tcgtgttgct caaggcgtgt 660
tcgagcgagg tgatgatgct gcggatggcg cggaggtacg acgtccagac agactcgatc 720
ctgttcgcca acaaccagcc gtacacgcga gagtcgtaca cgatggcagg cgtgggggaa 780
gtcatcgaag atctgctgcg gttcggccga ctcatgtgct ccatgaaggt ggacaatgcc 840
gagtatgctc tgctcacggc catcgtcatc ttctccgagc ggccgaacct ggcggaagga 900
tggaaggttg agaagatcca ggagatctac ctggaggcgc tcaagtccta cgtggacaac 960
cgagtgaaac ctcgcagtcc gaccatcttc gccaaactgc tctccgttct caccgagctg 1020
cgaacactcg gcaaccagaa ctccgagatg tgcttctcgt taaactacgc aaccgcaaac 1080
atgccaccgt tcctcgaaga aatctggga 1109
<210> SEQ ID NO: 22
<211> LENGTH: 735
<212> TYPE: DNA
<213> ORGANISM: Choristoneura fumiferana
<400> SEQUENCE: 22
taccaggacg ggtacgagca gccttctgat gaagatttga agaggattac gcagacgtgg 60
cagcaagcgg acgatgaaaa cgaagagtct gacactccct tccgccagat cacagagatg 120
actatcctca cggtccaact tatcgtggag ttcgcgaagg gattgccagg gttcgccaag 180
atctcgcagc ctgatcaaat tacgctgctt aaggcttgct caagtgaggt aatgatgctc 240
cgagtcgcgc gacgatacga tgcggcctca gacagtgttc tgttcgcgaa caaccaagcg 300
tacactcgcg acaactaccg caaggctggc atggcctacg tcatcgagga tctactgcac 360
ttctgccggt gcatgtactc tatggcgttg gacaacatcc attacgcgct gctcacggct 420
gtcgtcatct tttctgaccg gccagggttg gagcagccgc aactggtgga agaaatccag 480
cggtactacc tgaatacgct ccgcatctat atcctgaacc agctgagcgg gtcggcgcgt 540
tcgtccgtca tatacggcaa gatcctctca atcctctctg agctacgcac gctcggcatg 600
caaaactcca acatgtgcat ctccctcaag ctcaagaaca gaaagctgcc gcctttcctc 660
gaggagatct gggatgtggc ggacatgtcg cacacccaac cgccgcctat cctcgagtcc 720
cccacgaatc tctag 735
<210> SEQ ID NO: 23
<211> LENGTH: 1338
<212> TYPE: DNA
<213> ORGANISM: Drosophila melanogaster
<400> SEQUENCE: 23
tatgagcagc catctgaaga ggatctcagg cgtataatga gtcaacccga tgagaacgag 60
agccaaacgg acgtcagctt tcggcatata accgagataa ccatactcac ggtccagttg 120
attgttgagt ttgctaaagg tctaccagcg tttacaaaga taccccagga ggaccagatc 180
acgttactaa aggcctgctc gtcggaggtg atgatgctgc gtatggcacg acgctatgac 240
cacagctcgg actcaatatt cttcgcgaat aatagatcat atacgcggga ttcttacaaa 300
atggccggaa tggctgataa cattgaagac ctgctgcatt tctgccgcca aatgttctcg 360
atgaaggtgg acaacgtcga atacgcgctt ctcactgcca ttgtgatctt ctcggaccgg 420
ccgggcctgg agaaggccca actagtcgaa gcgatccaga gctactacat cgacacgcta 480
cgcatttata tactcaaccg ccactgcggc gactcaatga gcctcgtctt ctacgcaaag 540
ctgctctcga tcctcaccga gctgcgtacg ctgggcaacc agaacgccga gatgtgtttc 600
tcactaaagc tcaaaaaccg caaactgccc aagttcctcg aggagatctg ggacgttcat 660
gccatcccgc catcggtcca gtcgcacctt cagattaccc aggaggagaa cgagcgtctc 720
gagcgggctg agcgtatgcg ggcatcggtt gggggcgcca ttaccgccgg cattgattgc 780
gactctgcct ccacttcggc ggcggcagcc gcggcccagc atcagcctca gcctcagccc 840
cagccccaac cctcctccct gacccagaac gattcccagc accagacaca gccgcagcta 900
caacctcagc taccacctca gctgcaaggt caactgcaac cccagctcca accacagctt 960
cagacgcaac tccagccaca gattcaacca cagccacagc tccttcccgt ctccgctccc 1020
gtgcccgcct ccgtaaccgc acctggttcc ttgtccgcgg tcagtacgag cagcgaatac 1080
atgggcggaa gtgcggccat aggacccatc acgccggcaa ccaccagcag tatcacggct 1140
gccgttaccg ctagctccac cacatcagcg gtaccgatgg gcaacggagt tggagtcggt 1200
gttggggtgg gcggcaacgt cagcatgtat gcgaacgccc agacggcgat ggccttgatg 1260
ggtgtagccc tgcattcgca ccaagagcag cttatcgggg gagtggcggt taagtcggag 1320
cactcgacga ctgcatag 1338
<210> SEQ ID NO: 24
<211> LENGTH: 960
<212> TYPE: DNA
<213> ORGANISM: Choristoneura fumiferana
<400> SEQUENCE: 24
cctgagtgcg tagtacccga gactcagtgc gccatgaagc ggaaagagaa gaaagcacag 60
aaggagaagg acaaactgcc tgtcagcacg acgacggtgg acgaccacat gccgcccatt 120
atgcagtgtg aacctccacc tcctgaagca gcaaggattc acgaagtggt cccaaggttt 180
ctctccgaca agctgttgga gacaaaccgg cagaaaaaca tcccccagtt gacagccaac 240
cagcagttcc ttatcgccag gctcatctgg taccaggacg ggtacgagca gccttctgat 300
gaagatttga agaggattac gcagacgtgg cagcaagcgg acgatgaaaa cgaagagtct 360
gacactccct tccgccagat cacagagatg actatcctca cggtccaact tatcgtggag 420
ttcgcgaagg gattgccagg gttcgccaag atctcgcagc ctgatcaaat tacgctgctt 480
aaggcttgct caagtgaggt aatgatgctc cgagtcgcgc gacgatacga tgcggcctca 540
gacagtgttc tgttcgcgaa caaccaagcg tacactcgcg acaactaccg caaggctggc 600
atggcctacg tcatcgagga tctactgcac ttctgccggt gcatgtactc tatggcgttg 660
gacaacatcc attacgcgct gctcacggct gtcgtcatct tttctgaccg gccagggttg 720
gagcagccgc aactggtgga agaaatccag cggtactacc tgaatacgct ccgcatctat 780
atcctgaacc agctgagcgg gtcggcgcgt tcgtccgtca tatacggcaa gatcctctca 840
atcctctctg agctacgcac gctcggcatg caaaactcca acatgtgcat ctccctcaag 900
ctcaagaaca gaaagctgcc gcctttcctc gaggagatct gggatgtggc ggacatgtcg 960
<210> SEQ ID NO: 25
<211> LENGTH: 969
<212> TYPE: DNA
<213> ORGANISM: Drosophila melanogaster
<400> SEQUENCE: 25
cggccggaat gcgtcgtccc ggagaaccaa tgtgcgatga agcggcgcga aaagaaggcc 60
cagaaggaga aggacaaaat gaccacttcg ccgagctctc agcatggcgg caatggcagc 120
ttggcctctg gtggcggcca agactttgtt aagaaggaga ttcttgacct tatgacatgc 180
gagccgcccc agcatgccac tattccgcta ctacctgatg aaatattggc caagtgtcaa 240
gcgcgcaata taccttcctt aacgtacaat cagttggccg ttatatacaa gttaatttgg 300
taccaggatg gctatgagca gccatctgaa gaggatctca ggcgtataat gagtcaaccc 360
gatgagaacg agagccaaac ggacgtcagc tttcggcata taaccgagat aaccatactc 420
acggtccagt tgattgttga gtttgctaaa ggtctaccag cgtttacaaa gataccccag 480
gaggaccaga tcacgttact aaaggcctgc tcgtcggagg tgatgatgct gcgtatggca 540
cgacgctatg accacagctc ggactcaata ttcttcgcga ataatagatc atatacgcgg 600
gattcttaca aaatggccgg aatggctgat aacattgaag acctgctgca tttctgccgc 660
caaatgttct cgatgaaggt ggacaacgtc gaatacgcgc ttctcactgc cattgtgatc 720
ttctcggacc ggccgggcct ggagaaggcc caactagtcg aagcgatcca gagctactac 780
atcgacacgc tacgcattta tatactcaac cgccactgcg gcgactcaat gagcctcgtc 840
ttctacgcaa agctgctctc gatcctcacc gagctgcgta cgctgggcaa ccagaacgcc 900
gagatgtgtt tctcactaaa gctcaaaaac cgcaaactgc ccaagttcct cgaggagatc 960
tgggacgtt 969
<210> SEQ ID NO: 26
<211> LENGTH: 244
<212> TYPE: PRT
<213> ORGANISM: Choristoneura fumiferana
<400> SEQUENCE: 26
Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile
Thr Gln Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr
Pro Phe Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile
Val Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro
Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu
Arg Val Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala
Asn Asn Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala
Tyr Val Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met
Ala Leu Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe
Ser Asp Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln
Arg Tyr Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser
Gly Ser Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu
Ser Glu Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser
Leu Lys Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp
Asp Val Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser
Pro Thr Asn Leu
<210> SEQ ID NO: 27
<211> LENGTH: 445
<212> TYPE: PRT
<213> ORGANISM: Drosophila melanogaster
<400> SEQUENCE: 27
Tyr Glu Gln Pro Ser Glu Glu Asp Leu Arg Arg Ile Met Ser Gln Pro
Asp Glu Asn Glu Ser Gln Thr Asp Val Ser Phe Arg His Ile Thr Glu
Ile Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly Leu
Pro Ala Phe Thr Lys Ile Pro Gln Glu Asp Gln Ile Thr Leu Leu Lys
Ala Cys Ser Ser Glu Val Met Met Leu Arg Met Ala Arg Arg Tyr Asp
His Ser Ser Asp Ser Ile Phe Phe Ala Asn Asn Arg Ser Tyr Thr Arg
Asp Ser Tyr Lys Met Ala Gly Met Ala Asp Asn Ile Glu Asp Leu Leu
His Phe Cys Arg Gln Met Phe Ser Met Lys Val Asp Asn Val Glu Tyr
Ala Leu Leu Thr Ala Ile Val Ile Phe Ser Asp Arg Pro Gly Leu Glu
Lys Ala Gln Leu Val Glu Ala Ile Gln Ser Tyr Tyr Ile Asp Thr Leu
Arg Ile Tyr Ile Leu Asn Arg His Cys Gly Asp Ser Met Ser Leu Val
Phe Tyr Ala Lys Leu Leu Ser Ile Leu Thr Glu Leu Arg Thr Leu Gly
Asn Gln Asn Ala Glu Met Cys Phe Ser Leu Lys Leu Lys Asn Arg Lys
Leu Pro Lys Phe Leu Glu Glu Ile Trp Asp Val His Ala Ile Pro Pro
Ser Val Gln Ser His Leu Gln Ile Thr Gln Glu Glu Asn Glu Arg Leu
Glu Arg Ala Glu Arg Met Arg Ala Ser Val Gly Gly Ala Ile Thr Ala
Gly Ile Asp Cys Asp Ser Ala Ser Thr Ser Ala Ala Ala Ala Ala Ala
Gln His Gln Pro Gln Pro Gln Pro Gln Pro Gln Pro Ser Ser Leu Thr
Gln Asn Asp Ser Gln His Gln Thr Gln Pro Gln Leu Gln Pro Gln Leu
Pro Pro Gln Leu Gln Gly Gln Leu Gln Pro Gln Leu Gln Pro Gln Leu
Gln Thr Gln Leu Gln Pro Gln Ile Gln Pro Gln Pro Gln Leu Leu Pro
Val Ser Ala Pro Val Pro Ala Ser Val Thr Ala Pro Gly Ser Leu Ser
Ala Val Ser Thr Ser Ser Glu Tyr Met Gly Gly Ser Ala Ala Ile Gly
Pro Ile Thr Pro Ala Thr Thr Ser Ser Ile Thr Ala Ala Val Thr Ala
Ser Ser Thr Thr Ser Ala Val Pro Met Gly Asn Gly Val Gly Val Gly
Val Gly Val Gly Gly Asn Val Ser Met Tyr Ala Asn Ala Gln Thr Ala
Met Ala Leu Met Gly Val Ala Leu His Ser His Gln Glu Gln Leu Ile
Gly Gly Val Ala Val Lys Ser Glu His Ser Thr Thr Ala
<210> SEQ ID NO: 28
<211> LENGTH: 320
<212> TYPE: PRT
<213> ORGANISM: Choristoneura fumiferana
<400> SEQUENCE: 28
Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys Glu
Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr Thr
Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro Pro
Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp Lys
Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala Asn
Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr Glu
Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln Gln
Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile Thr
Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly
Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu Leu
Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg Tyr
Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln Ala Tyr Thr
Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile Glu Asp Leu
Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile His
Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly Leu
Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn Thr
Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser Ser
Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu
Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn Arg
Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met Ser
<210> SEQ ID NO: 29
<211> LENGTH: 323
<212> TYPE: PRT
<213> ORGANISM: Drosophila melanogaster
<400> SEQUENCE: 29
Arg Pro Glu Cys Val Val Pro Glu Asn Gln Cys Ala Met Lys Arg Arg
Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Met Thr Thr Ser Pro Ser
Ser Gln His Gly Gly Asn Gly Ser Leu Ala Ser Gly Gly Gly Gln Asp
Phe Val Lys Lys Glu Ile Leu Asp Leu Met Thr Cys Glu Pro Pro Gln
His Ala Thr Ile Pro Leu Leu Pro Asp Glu Ile Leu Ala Lys Cys Gln
Ala Arg Asn Ile Pro Ser Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr
Lys Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp
Leu Arg Arg Ile Met Ser Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp
Val Ser Phe Arg His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu
Ile Val Glu Phe Ala Lys Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln
Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met
Leu Arg Met Ala Arg Arg Tyr Asp His Ser Ser Asp Ser Ile Phe Phe
Ala Asn Asn Arg Ser Tyr Thr Arg Asp Ser Tyr Lys Met Ala Gly Met
Ala Asp Asn Ile Glu Asp Leu Leu His Phe Cys Arg Gln Met Phe Ser
Met Lys Val Asp Asn Val Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile
Phe Ser Asp Arg Pro Gly Leu Glu Lys Ala Gln Leu Val Glu Ala Ile
Gln Ser Tyr Tyr Ile Asp Thr Leu Arg Ile Tyr Ile Leu Asn Arg His
Cys Gly Asp Ser Met Ser Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile
Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ala Glu Met Cys Phe
Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile
Trp Asp Val
<210> SEQ ID NO: 30
<211> LENGTH: 987
<212> TYPE: DNA
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 30
tgtgctatct gtggggaccg ctcctcaggc aaacactatg gggtatacag ttgtgagggc 60
tgcaagggct tcttcaagag gacagtacgc aaagacctga cctacacctg ccgagacaac 120
aaggactgcc tgatcgacaa gagacagcgg aaccggtgtc agtactgccg ctaccagaag 180
tgcctggcca tgggcatgaa gcgggaagct gtgcaggagg agcggcagcg gggcaaggac 240
cggaatgaga acgaggtgga gtccaccagc agtgccaacg aggacatgcc tgtagagaag 300
attctggaag ccgagcttgc tgtcgagccc aagactgaga catacgtgga ggcaaacatg 360
gggctgaacc ccagctcacc aaatgaccct gttaccaaca tctgtcaagc agcagacaag 420
cagctcttca ctcttgtgga gtgggccaag aggatcccac acttttctga gctgccccta 480
gacgaccagg tcatcctgct acgggcaggc tggaacgagc tgctgatcgc ctccttctcc 540
caccgctcca tagctgtgaa agatgggatt ctcctggcca ccggcctgca cgtacaccgg 600
aacagcgctc acagtgctgg ggtgggcgcc atctttgaca gggtgctaac agagctggtg 660
tctaagatgc gtgacatgca gatggacaag acggagctgg gctgcctgcg agccattgtc 720
ctgttcaacc ctgactctaa ggggctctca aaccctgctg aggtggaggc gttgagggag 780
aaggtgtatg cgtcactaga agcgtactgc aaacacaagt accctgagca gccgggcagg 840
tttgccaagc tgctgctccg cctgcctgca ctgcgttcca tcgggctcaa gtgcctggag 900
cacctgttct tcttcaagct catcggggac acgcccatcg acaccttcct catggagatg 960
ctggaggcac cacatcaagc cacctag 987
<210> SEQ ID NO: 31
<211> LENGTH: 789
<212> TYPE: DNA
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 31
aagcgggaag ctgtgcagga ggagcggcag cggggcaagg accggaatga gaacgaggtg 60
gagtccacca gcagtgccaa cgaggacatg cctgtagaga agattctgga agccgagctt 120
gctgtcgagc ccaagactga gacatacgtg gaggcaaaca tggggctgaa ccccagctca 180
ccaaatgacc ctgttaccaa catctgtcaa gcagcagaca agcagctctt cactcttgtg 240
gagtgggcca agaggatccc acacttttct gagctgcccc tagacgacca ggtcatcctg 300
ctacgggcag gctggaacga gctgctgatc gcctccttct cccaccgctc catagctgtg 360
aaagatggga ttctcctggc caccggcctg cacgtacacc ggaacagcgc tcacagtgct 420
ggggtgggcg ccatctttga cagggtgcta acagagctgg tgtctaagat gcgtgacatg 480
cagatggaca agacggagct gggctgcctg cgagccattg tcctgttcaa ccctgactct 540
aaggggctct caaaccctgc tgaggtggag gcgttgaggg agaaggtgta tgcgtcacta 600
gaagcgtact gcaaacacaa gtaccctgag cagccgggca ggtttgccaa gctgctgctc 660
cgcctgcctg cactgcgttc catcgggctc aagtgcctgg agcacctgtt cttcttcaag 720
ctcatcgggg acacgcccat cgacaccttc ctcatggaga tgctggaggc accacatcaa 780
gccacctag 789
<210> SEQ ID NO: 32
<211> LENGTH: 714
<212> TYPE: DNA
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 32
gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60
actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120
accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180
atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240
aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300
ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360
tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg 420
gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac 480
cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa 540
cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg 600
cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg 660
cccatcgaca ccttcctcat ggagatgctg gaggcaccac atcaagccac ctag 714
<210> SEQ ID NO: 33
<211> LENGTH: 536
<212> TYPE: DNA
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 33
ggatcccaca cttttctgag ctgcccctag acgaccaggt catcctgcta cgggcaggct 60
ggaacgagct gctgatcgcc tccttctccc accgctccat agctgtgaaa gatgggattc 120
tcctggccac cggcctgcac gtacaccgga acagcgctca cagtgctggg gtgggcgcca 180
tctttgacag ggtgctaaca gagctggtgt ctaagatgcg tgacatgcag atggacaaga 240
cggagctggg ctgcctgcga gccattgtcc tgttcaaccc tgactctaag gggctctcaa 300
accctgctga ggtggaggcg ttgagggaga aggtgtatgc gtcactagaa gcgtactgca 360
aacacaagta ccctgagcag ccgggcaggt ttgccaagct gctgctccgc ctgcctgcac 420
tgcgttccat cgggctcaag tgcctggagc acctgttctt cttcaagctc atcggggaca 480
cgcccatcga caccttcctc atggagatgc tggaggcacc acatcaagcc acctag 536
<210> SEQ ID NO: 34
<211> LENGTH: 672
<212> TYPE: DNA
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 34
gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60
actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120
accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180
atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240
aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300
ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360
tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg 420
gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac 480
cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa 540
cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg 600
cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg 660
cccatcgaca cc 672
<210> SEQ ID NO: 35
<211> LENGTH: 1123
<212> TYPE: DNA
<213> ORGANISM: Artificial Sequence
<220> FEATURE:
<221> NAME/KEY: misc_feature
<223> OTHER INFORMATION: Novel Sequence
<400> SEQUENCE: 35
tgcgccatct gcggggaccg ctcctcaggc aagcactatg gagtgtacag ctgcgagggg 60
tgcaagggct tcttcaagcg gacggtgcgc aaggacctga cctacacctg ccgcgacaac 120
aaggactgcc tgattgacaa gcggcagcgg aaccggtgcc agtactgccg ctaccagaag 180
tgcctggcca tgggcatgaa gcgggaagcc gtgcaggagg agcggcagcg tggcaaggac 240
cggaacgaga atgaggtgga gtcgaccagc agcgccaacg aggacatgcc ggtggagagg 300
atcctggagg ctgagctggc cgtggagccc aagaccgaga cctacgtgga ggcaaacatg 360
gggctgaacc ccagctcgcc gaacgaccct gtcaccaaca tttgccaagc agccgacaaa 420
cagcttttca ccctggtgga gtgggccaag cggatcccac acttctcaga gctgcccctg 480
gacgaccagg tcatcctgct gcgggcaggc tggaatgagc tgctcatcgc ctccttctcc 540
caccgctcca tcgccgtgaa ggacgggatc ctcctggcca ccgggctgca cgtccaccgg 600
aacagcgccc acagcgcagg ggtgggcgcc atctttgaca gggtgctgac ggagcttgtg 660
tccaagatgc gggacatgca gatggacaag acggagctgg gctgcctgcg cgccatcgtc 720
ctctttaacc ctgactccaa ggggctctcg aacccggccg aggtggaggc gctgagggag 780
aaggtctatg cgtccttgga ggcctactgc aagcacaagt acccagagca gccgggaagg 840
ttcgctaagc tcttgctccg cctgccggct ctgcgctcca tcgggctcaa atgcctggaa 900
catctcttct tcttcaagct catcggggac acacccattg acaccttcct tatggagatg 960
ctggaggcgc cgcaccaaat gacttaggcc tgcgggccca tcctttgtgc ccacccgttc 1020
tggccaccct gcctggacgc cagctgttct tctcagcctg agccctgtcc ctgcccttct 1080
ctgcctggcc tgtttggact ttggggcaca gcctgtcact gct 1123
<210> SEQ ID NO: 36
<211> LENGTH: 925
<212> TYPE: DNA
<213> ORGANISM: Artificial Sequence
<220> FEATURE:
<221> NAME/KEY: misc_feature
<223> OTHER INFORMATION: Novel Sequence
<400> SEQUENCE: 36
aagcgggaag ccgtgcagga ggagcggcag cgtggcaagg accggaacga gaatgaggtg 60
gagtcgacca gcagcgccaa cgaggacatg ccggtggaga ggatcctgga ggctgagctg 120
gccgtggagc ccaagaccga gacctacgtg gaggcaaaca tggggctgaa ccccagctcg 180
ccgaacgacc ctgtcaccaa catttgccaa gcagccgaca aacagctttt caccctggtg 240
gagtgggcca agcggatccc acacttctca gagctgcccc tggacgacca ggtcatcctg 300
ctgcgggcag gctggaatga gctgctcatc gcctccttct cccaccgctc catcgccgtg 360
aaggacggga tcctcctggc caccgggctg cacgtccacc ggaacagcgc ccacagcgca 420
ggggtgggcg ccatctttga cagggtgctg acggagcttg tgtccaagat gcgggacatg 480
cagatggaca agacggagct gggctgcctg cgcgccatcg tcctctttaa ccctgactcc 540
aaggggctct cgaacccggc cgaggtggag gcgctgaggg agaaggtcta tgcgtccttg 600
gaggcctact gcaagcacaa gtacccagag cagccgggaa ggttcgctaa gctcttgctc 660
cgcctgccgg ctctgcgctc catcgggctc aaatgcctgg aacatctctt cttcttcaag 720
ctcatcgggg acacacccat tgacaccttc cttatggaga tgctggaggc gccgcaccaa 780
atgacttagg cctgcgggcc catcctttgt gcccacccgt tctggccacc ctgcctggac 840
gccagctgtt cttctcagcc tgagccctgt ccctgccctt ctctgcctgg cctgtttgga 900
ctttggggca cagcctgtca ctgct 925
<210> SEQ ID NO: 37
<211> LENGTH: 850
<212> TYPE: DNA
<213> ORGANISM: Artificial Sequence
<220> FEATURE:
<221> NAME/KEY: misc_feature
<223> OTHER INFORMATION: Novel Sequence
<400> SEQUENCE: 37
gccaacgagg acatgccggt ggagaggatc ctggaggctg agctggccgt ggagcccaag 60
accgagacct acgtggaggc aaacatgggg ctgaacccca gctcgccgaa cgaccctgtc 120
accaacattt gccaagcagc cgacaaacag cttttcaccc tggtggagtg ggccaagcgg 180
atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 240
aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 300
ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 360
tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 420
gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 480
ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 540
cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 600
cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 660
cccattgaca ccttccttat ggagatgctg gaggcgccgc accaaatgac ttaggcctgc 720
gggcccatcc tttgtgccca cccgttctgg ccaccctgcc tggacgccag ctgttcttct 780
cagcctgagc cctgtccctg cccttctctg cctggcctgt ttggactttg gggcacagcc 840
tgtcactgct 850
<210> SEQ ID NO: 38
<211> LENGTH: 670
<212> TYPE: DNA
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 38
atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 60
aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 120
ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 180
tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 240
gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 300
ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 360
cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 420
cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 480
cccattgaca ccttccttat ggagatgctg gaggcgccgc accaaatgac ttaggcctgc 540
gggcccatcc tttgtgccca cccgttctgg ccaccctgcc tggacgccag ctgttcttct 600
cagcctgagc cctgtccctg cccttctctg cctggcctgt ttggactttg gggcacagcc 660
tgtcactgct 670
<210> SEQ ID NO: 39
<211> LENGTH: 672
<212> TYPE: DNA
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 39
gccaacgagg acatgccggt ggagaggatc ctggaggctg agctggccgt ggagcccaag 60
accgagacct acgtggaggc aaacatgggg ctgaacccca gctcgccgaa cgaccctgtc 120
accaacattt gccaagcagc cgacaaacag cttttcaccc tggtggagtg ggccaagcgg 180
atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 240
aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 300
ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 360
tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 420
gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 480
ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 540
cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 600
cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 660
cccattgaca cc 672
<210> SEQ ID NO: 40
<211> LENGTH: 328
<212> TYPE: PRT
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 40
Cys Ala Ile Cys Gly Asp Arg Ser Ser Gly Lys His Tyr Gly Val Tyr
Ser Cys Glu Gly Cys Lys Gly Phe Phe Lys Arg Thr Val Arg Lys Asp
Leu Thr Tyr Thr Cys Arg Asp Asn Lys Asp Cys Leu Ile Asp Lys Arg
Gln Arg Asn Arg Cys Gln Tyr Cys Arg Tyr Gln Lys Cys Leu Ala Met
Gly Met Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp
Arg Asn Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met
Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr
Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn
Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr
Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu
Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile
Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu
Ala Thr Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val
Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg
Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val
Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu
Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His
Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu
Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe
Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met
Leu Glu Ala Pro His Gln Ala Thr
325
<210> SEQ ID NO: 41
<211> LENGTH: 262
<212> TYPE: PRT
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 41
Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp Arg Asn
Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met Pro Val
Glu Lys Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr Glu Thr
Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn Asp Pro
Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val
Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp
Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser
Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr
Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala
Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met
Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe
Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu
Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr
Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala
Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys
Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu
Ala Pro His Gln Ala Thr
260
<210> SEQ ID NO: 42
<211> LENGTH: 237
<212> TYPE: PRT
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 42
Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala
Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn
Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp
Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe
Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp
Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys
Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala
His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu
Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys
Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn
Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu
Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys
Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu
Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr
Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Ala Thr
<210> SEQ ID NO: 43
<211> LENGTH: 177
<212> TYPE: PRT
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 43
Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu
Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser
Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His
Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val
Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr
Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys
Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr
Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly
Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr
Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Ala
Thr
<210> SEQ ID NO: 44
<211> LENGTH: 224
<212> TYPE: PRT
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 44
Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala
Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn
Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp
Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe
Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp
Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys
Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala
His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu
Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys
Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn
Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu
Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys
Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu
Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr
<210> SEQ ID NO: 45
<211> LENGTH: 328
<212> TYPE: PRT
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 45
Cys Ala Ile Cys Gly Asp Arg Ser Ser Gly Lys His Tyr Gly Val Tyr
Ser Cys Glu Gly Cys Lys Gly Phe Phe Lys Arg Thr Val Arg Lys Asp
Leu Thr Tyr Thr Cys Arg Asp Asn Lys Asp Cys Leu Ile Asp Lys Arg
Gln Arg Asn Arg Cys Gln Tyr Cys Arg Tyr Gln Lys Cys Leu Ala Met
Gly Met Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp
Arg Asn Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met
Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr
Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn
Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr
Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu
Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile
Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu
Ala Thr Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val
Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg
Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val
Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu
Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His
Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu
Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe
Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met
Leu Glu Ala Pro His Gln Met Thr
<210> SEQ ID NO: 46
<211> LENGTH: 262
<212> TYPE: PRT
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 46
Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp Arg Asn
Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met Pro Val
Glu Arg Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr Glu Thr
Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn Asp Pro
Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val
Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp
Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser
Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr
Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala
Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met
Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe
Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu
Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr
Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala
Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys
Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu
Ala Pro His Gln Met Thr
<210> SEQ ID NO: 47
<211> LENGTH: 237
<212> TYPE: PRT
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 47
Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala
Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn
Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp
Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe
Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp
Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys
Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala
His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu
Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys
Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn
Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu
Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys
Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu
Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr
Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met Thr
<210> SEQ ID NO: 48
<211> LENGTH: 177
<212> TYPE: PRT
<213> ORGANISM: Artificial Sequence
<<221> NAME/KEY: misc_feature
<400> SEQUENCE: 48
Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu
Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser
Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His
Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val
Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr
Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys
Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr
Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly
Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr
Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met
Thr
<210> SEQ ID NO: 49
<211> LENGTH: 224
<212> TYPE: PRT
<213> ORGANISM: Artificial Sequence
<221> NAME/KEY: misc_feature
<400> SEQUENCE: 49
Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala
Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn
Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp
Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe
Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp
Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys
Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala
His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu
Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys
Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn
Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu
Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys
Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu
Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr
<210> SEQ ID NO: 50
<211> LENGTH: 635
<212> TYPE: DNA
<213> ORGANISM: Locusta migratoria
<400> SEQUENCE: 50
tgcatacaga catgcctgtt gaacgcatac ttgaagctga aaaacgagtg gagtgcaaag 60
cagaaaacca agtggaatat gagctggtgg agtgggctaa acacatcccg cacttcacat 120
ccctacctct ggaggaccag gttctcctcc tcagagcagg ttggaatgaa ctgctaattg 180
cagcattttc acatcgatct gtagatgtta aagatggcat agtacttgcc actggtctca 240
cagtgcatcg aaattctgcc catcaagctg gagtcggcac aatatttgac agagttttga 300
cagaactggt agcaaagatg agagaaatga aaatggataa aactgaactt ggctgcttgc 360
gatctgttat tcttttcaat ccagaggtga ggggtttgaa atccgcccag gaagttgaac 420
ttctacgtga aaaagtatat gccgctttgg aagaatatac tagaacaaca catcccgatg 480
aaccaggaag atttgcaaaa cttttgcttc gtctgccttc tttacgttcc ataggcctta 540
agtgtttgga gcatttgttt ttctttcgcc ttattggaga tgttccaatt gatacgttcc 600
tgatggagat gcttgaatca ccttctgatt cataa 635
<210> SEQ ID NO: 51
<211> LENGTH: 687
<212> TYPE: DNA
<213> ORGANISM: Amblyomma americanum
<400> SEQUENCE: 51
cctcctgaga tgcctctgga gcgcatactg gaggcagagc tgcgggttga gtcacagacg 60
gggaccctct cggaaagcgc acagcagcag gatccagtga gcagcatctg ccaagctgca 120
gaccgacagc tgcaccagct agttcaatgg gccaagcaca ttccacattt tgaagagctt 180
ccccttgagg accgcatggt gttgctcaag gctggctgga acgagctgct cattgctgct 240
ttctcccacc gttctgttga cgtgcgtgat ggcattgtgc tcgctacagg tcttgtggtg 300
cagcggcata gtgctcatgg ggctggcgtt ggggccatat ttgatagggt tctcactgaa 360
ctggtagcaa agatgcgtga gatgaagatg gaccgcactg agcttggatg cctgcttgct 420
gtggtacttt ttaatcctga ggccaagggg ctgcggacct gcccaagtgg aggccctgag 480
ggagaaagtg tatctgcctt ggaagagcac tgccggcagc agtacccaga ccagcctggg 540
cgctttgcca agctgctgct gcggttgcca gctctgcgca gtattggcct caagtgcctc 600
gaacatctct ttttcttcaa gctcatcggg gacacgccca tcgacaactt tcttctttcc 660
atgctggagg ccccctctga cccctaa 687
<210> SEQ ID NO: 52
<211> LENGTH: 693
<212> TYPE: DNA
<213> ORGANISM: Amblyomma americanum
<400> SEQUENCE: 52
tctccggaca tgccactcga acgcattctc gaagccgaga tgcgcgtcga gcagccggca 60
ccgtccgttt tggcgcagac ggccgcatcg ggccgcgacc ccgtcaacag catgtgccag 120
gctgccccgc cacttcacga gctcgtacag tgggcccggc gaattccgca cttcgaagag 180
cttcccatcg aggatcgcac cgcgctgctc aaagccggct ggaacgaact gcttattgcc 240
gccttttcgc accgttctgt ggcggtgcgc gacggcatcg ttctggccac cgggctggtg 300
gtgcagcggc acagcgcaca cggcgcaggc gttggcgaca tcttcgaccg cgtactagcc 360
gagctggtgg ccaagatgcg cgacatgaag atggacaaaa cggagctcgg ctgcctgcgc 420
gccgtggtgc tcttcaatcc agacgccaag ggtctccgaa acgccaccag agtagaggcg 480
ctccgcgaga aggtgtatgc ggcgctggag gagcactgcc gtcggcacca cccggaccaa 540
ccgggtcgct tcggcaagct gctgctgcgg ctgcctgcct tgcgcagcat cgggctcaaa 600
tgcctcgagc atctgttctt cttcaagctc atcggagaca ctcccataga cagcttcctg 660
ctcaacatgc tggaggcacc ggcagacccc tag 693
<210> SEQ ID NO: 53
<211> LENGTH: 801
<212> TYPE: DNA
<213> ORGANISM: Celuca pugilator
<400> SEQUENCE: 53
tcagacatgc caattgccag catacgggag gcagagctca gcgtggatcc catagatgag 60
cagccgctgg accaaggggt gaggcttcag gttccactcg cacctcctga tagtgaaaag 120
tgtagcttta ctttaccttt tcatcccgtc agtgaagtat cctgtgctaa ccctctgcag 180
gatgtggtga gcaacatatg ccaggcagct gacagacatc tggtgcagct ggtggagtgg 240
gccaagcaca tcccacactt cacagacctt cccatagagg accaagtggt attactcaaa 300
gccgggtgga acgagttgct tattgcctca ttctcacacc gtagcatggg cgtggaggat 360
ggcatcgtgc tggccacagg gctcgtgatc cacagaagta gtgctcacca ggctggagtg 420
ggtgccatat ttgatcgtgt cctctctgag ctggtggcca agatgaagga gatgaagatt 480
gacaagacag agctgggctg ccttcgctcc atcgtcctgt tcaacccaga tgccaaagga 540
ctaaactgcg tcaatgatgt ggagatcttg cgtgagaagg tgtatgctgc cctggaggag 600
tacacacgaa ccacttaccc tgatgaacct ggacgctttg ccaagttgct tctgcgactt 660
cctgcactca ggtctatagg cctgaagtgt cttgagtacc tcttcctgtt taagctgatt 720
ggagacactc ccctggacag ctacttgatg aagatgctcg tagacaaccc aaatacaagc 780
gtcactcccc ccaccagcta g 801
<210> SEQ ID NO: 54
<211> LENGTH: 690
<212> TYPE: DNA
<213> ORGANISM: Tenebrio molitor
<400> SEQUENCE: 54
gccgagatgc ccctcgacag gataatcgag gcggagaaac ggatagaatg cacacccgct 60
ggtggctctg gtggtgtcgg agagcaacac gacggggtga acaacatctg tcaagccact 120
aacaagcagc tgttccaact ggtgcaatgg gctaagctca tacctcactt tacctcgttg 180
ccgatgtcgg accaggtgct tttattgagg gcaggatgga atgaattgct catcgccgca 240
ttctcgcaca gatctataca ggcgcaggat gccatcgttc tagccacggg gttgacagtt 300
aacaaaacgt cggcgcacgc cgtgggcgtg ggcaacatct acgaccgcgt cctctccgag 360
ctggtgaaca agatgaaaga gatgaagatg gacaagacgg agctgggctg cttgagagcc 420
atcatcctct acaaccccac gtgtcgcggc atcaagtccg tgcaggaagt ggagatgctg 480
cgtgagaaaa tttacggcgt gctggaagag tacaccagga ccacccaccc gaacgagccc 540
ggcaggttcg ccaaactgct tctgcgcctc ccggccctca ggtccatcgg gttgaaatgt 600
tccgaacacc tctttttctt caagctgatc ggtgatgttc caatagacac gttcctgatg 660
gagatgctgg agtctccggc ggacgcttag 690
<210> SEQ ID NO: 55
<211> LENGTH: 681
<212> TYPE: DNA
<213> ORGANISM: Apis mellifera
<400> SEQUENCE: 55
cattcggaca tgccgatcga gcgtatcctg gaggccgaga agagagtcga atgtaagatg 60
gagcaacagg gaaattacga gaatgcagtg tcgcacattt gcaacgccac gaacaaacag 120
ctgttccagc tggtagcatg ggcgaaacac atcccgcatt ttacctcgtt gccactggag 180
gatcaggtac ttctgctcag ggccggttgg aacgagttgc tgatagcctc cttttcccac 240
cgttccatcg acgtgaagga cggtatcgtg ctggcgacgg ggatcaccgt gcatcggaac 300
tcggcgcagc aggccggcgt gggcacgata ttcgaccgtg tcctctcgga gcttgtctcg 360
aaaatgcgtg aaatgaagat ggacaggaca gagcttggct gtctcagatc tataatactc 420
ttcaatcccg aggttcgagg actgaaatcc atccaggaag tgaccctgct ccgtgagaag 480
atctacggcg ccctggaggg ttattgccgc gtagcttggc ccgacgacgc tggaagattc 540
gcgaaattac ttctacgcct gcccgccatc cgctcgatcg gattaaagtg cctcgagtac 600
ctgttcttct tcaaaatgat cggtgacgta ccgatcgacg attttctcgt ggagatgtta 660
gaatcgcgat cagatcctta g 681
<210> SEQ ID NO: 56
<211> LENGTH: 210
<212> TYPE: PRT
<213> ORGANISM: Locusta migratoria
<400> SEQUENCE: 56
His Thr Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Lys Arg Val
Glu Cys Lys Ala Glu Asn Gln Val Glu Tyr Glu Leu Val Glu Trp Ala
Lys His Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu
Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His
Arg Ser Val Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Leu Thr
Val His Arg Asn Ser Ala His Gln Ala Gly Val Gly Thr Ile Phe Asp
Arg Val Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp
Lys Thr Glu Leu Gly Cys Leu Arg Ser Val Ile Leu Phe Asn Pro Glu
Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg Glu Lys
Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asp Glu
Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser
Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu Ile Gly
Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ser
Asp Ser
<210> SEQ ID NO: 57
<211> LENGTH: 228
<212> TYPE: PRT
<213> ORGANISM: Amblyomma americanum
<400> SEQUENCE: 57
Pro Pro Glu Met Pro Leu Glu Arg Ile Leu Glu Ala Glu Leu Arg Val
Glu Ser Gln Thr Gly Thr Leu Ser Glu Ser Ala Gln Gln Gln Asp Pro
Val Ser Ser Ile Cys Gln Ala Ala Asp Arg Gln Leu His Gln Leu Val
Gln Trp Ala Lys His Ile Pro His Phe Glu Glu Leu Pro Leu Glu Asp
Arg Met Val Leu Leu Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala
Phe Ser His Arg Ser Val Asp Val Arg Asp Gly Ile Val Leu Ala Thr
Gly Leu Val Val Gln Arg His Ser Ala His Gly Ala Gly Val Gly Ala
Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met
Lys Met Asp Arg Thr Glu Leu Gly Cys Leu Leu Ala Val Val Leu Phe
Asn Pro Glu Ala Lys Gly Leu Arg Thr Cys Pro Ser Gly Gly Pro Glu
Gly Glu Ser Val Ser Ala Leu Glu Glu His Cys Arg Gln Gln Tyr Pro
Asp Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu
Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu
Ile Gly Asp Thr Pro Ile Asp Asn Phe Leu Leu Ser Met Leu Glu Ala
Pro Ser Asp Pro
<210> SEQ ID NO: 58
<211> LENGTH: 230
<212> TYPE: PRT
<213> ORGANISM: Amblyomma americanum
<400> SEQUENCE: 58
Ser Pro Asp Met Pro Leu Glu Arg Ile Leu Glu Ala Glu Met Arg Val
Glu Gln Pro Ala Pro Ser Val Leu Ala Gln Thr Ala Ala Ser Gly Arg
Asp Pro Val Asn Ser Met Cys Gln Ala Ala Pro Pro Leu His Glu Leu
Val Gln Trp Ala Arg Arg Ile Pro His Phe Glu Glu Leu Pro Ile Glu
Asp Arg Thr Ala Leu Leu Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala
Ala Phe Ser His Arg Ser Val Ala Val Arg Asp Gly Ile Val Leu Ala
Thr Gly Leu Val Val Gln Arg His Ser Ala His Gly Ala Gly Val Gly
Asp Ile Phe Asp Arg Val Leu Ala Glu Leu Val Ala Lys Met Arg Asp
Met Lys Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Val Val Leu
Phe Asn Pro Asp Ala Lys Gly Leu Arg Asn Ala Thr Arg Val Glu Ala
Leu Arg Glu Lys Val Tyr Ala Ala Leu Glu Glu His Cys Arg Arg His
His Pro Asp Gln Pro Gly Arg Phe Gly Lys Leu Leu Leu Arg Leu Pro
Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe
Lys Leu Ile Gly Asp Thr Pro Ile Asp Ser Phe Leu Leu Asn Met Leu
Glu Ala Pro Ala Asp Pro
<210> SEQ ID NO: 59
<211> LENGTH: 266
<212> TYPE: PRT
<213> ORGANISM: Celuca pugilator
<400> SEQUENCE: 59
Ser Asp Met Pro Ile Ala Ser Ile Arg Glu Ala Glu Leu Ser Val Asp
Pro Ile Asp Glu Gln Pro Leu Asp Gln Gly Val Arg Leu Gln Val Pro
Leu Ala Pro Pro Asp Ser Glu Lys Cys Ser Phe Thr Leu Pro Phe His
Pro Val Ser Glu Val Ser Cys Ala Asn Pro Leu Gln Asp Val Val Ser
Asn Ile Cys Gln Ala Ala Asp Arg His Leu Val Gln Leu Val Glu Trp
Ala Lys His Ile Pro His Phe Thr Asp Leu Pro Ile Glu Asp Gln Val
Val Leu Leu Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser
His Arg Ser Met Gly Val Glu Asp Gly Ile Val Leu Ala Thr Gly Leu
Val Ile His Arg Ser Ser Ala His Gln Ala Gly Val Gly Ala Ile Phe
Asp Arg Val Leu Ser Glu Leu Val Ala Lys Met Lys Glu Met Lys Ile
Asp Lys Thr Glu Leu Gly Cys Leu Arg Ser Ile Val Leu Phe Asn Pro
Asp Ala Lys Gly Leu Asn Cys Val Asn Asp Val Glu Ile Leu Arg Glu
Lys Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr Tyr Pro Asp
Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg
Ser Ile Gly Leu Lys Cys Leu Glu Tyr Leu Phe Leu Phe Lys Leu Ile
Gly Asp Thr Pro Leu Asp Ser Tyr Leu Met Lys Met Leu Val Asp Asn
Pro Asn Thr Ser Val Thr Pro Pro Thr Ser
<210> SEQ ID NO: 60
<211> LENGTH: 229
<212> TYPE: PRT
<213> ORGANISM: Tenebrio molitor
<400> SEQUENCE: 60
Ala Glu Met Pro Leu Asp Arg Ile Ile Glu Ala Glu Lys Arg Ile Glu
Cys Thr Pro Ala Gly Gly Ser Gly Gly Val Gly Glu Gln His Asp Gly
Val Asn Asn Ile Cys Gln Ala Thr Asn Lys Gln Leu Phe Gln Leu Val
Gln Trp Ala Lys Leu Ile Pro His Phe Thr Ser Leu Pro Met Ser Asp
Gln Val Leu Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala
Phe Ser His Arg Ser Ile Gln Ala Gln Asp Ala Ile Val Leu Ala Thr
Gly Leu Thr Val Asn Lys Thr Ser Ala His Ala Val Gly Val Gly Asn
Ile Tyr Asp Arg Val Leu Ser Glu Leu Val Asn Lys Met Lys Glu Met
Lys Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Tyr
Asn Pro Thr Cys Arg Gly Ile Lys Ser Val Gln Glu Val Glu Met Leu
Arg Glu Lys Ile Tyr Gly Val Leu Glu Glu Tyr Thr Arg Thr Thr His
Pro Asn Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala
Leu Arg Ser Ile Gly Leu Lys Cys Ser Glu His Leu Phe Phe Phe Lys
Leu Ile Gly Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu
Ser Pro Ala Asp Ala
<210> SEQ ID NO: 61
<211> LENGTH: 226
<212> TYPE: PRT
<213> ORGANISM: Apis mellifera
<400> SEQUENCE: 61
His Ser Asp Met Pro Ile Glu Arg Ile Leu Glu Ala Glu Lys Arg Val
Glu Cys Lys Met Glu Gln Gln Gly Asn Tyr Glu Asn Ala Val Ser His
Ile Cys Asn Ala Thr Asn Lys Gln Leu Phe Gln Leu Val Ala Trp Ala
Lys His Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu
Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His
Arg Ser Ile Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Ile Thr
Val His Arg Asn Ser Ala Gln Gln Ala Gly Val Gly Thr Ile Phe Asp
Arg Val Leu Ser Glu Leu Val Ser Lys Met Arg Glu Met Lys Met Asp
Arg Thr Glu Leu Gly Cys Leu Arg Ser Ile Ile Leu Phe Asn Pro Glu
Val Arg Gly Leu Lys Ser Ile Gln Glu Val Thr Leu Leu Arg Glu Lys
Ile Tyr Gly Ala Leu Glu Gly Tyr Cys Arg Val Ala Trp Pro Asp Asp
Ala Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Ile Arg Ser
Ile Gly Leu Lys Cys Leu Glu Tyr Leu Phe Phe Phe Lys Met Ile Gly
Asp Val Pro Ile Asp Asp Phe Leu Val Glu Met Leu Glu Ser Arg Ser
Asp Pro
<210> SEQ ID NO: 62
<211> LENGTH: 714
<212> TYPE: DNA
<213> ORGANISM: Mus musculus
<400> SEQUENCE: 62
gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60
actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120
accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180
atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240
aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300
ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360
tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg 420
gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac 480
cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa 540
cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg 600
cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg 660
cccatcgaca ccttcctcat ggagatgctg gaggcaccac atcaagccac ctag 714
<210> SEQ ID NO: 63
<211> LENGTH: 720
<212> TYPE: DNA
<213> ORGANISM: Mus musculus
<400> SEQUENCE: 63
gcccctgagg agatgcctgt ggacaggatc ctggaggcag agcttgctgt ggagcagaag 60
agtgaccaag gcgttgaggg tcctggggcc accgggggtg gtggcagcag cccaaatgac 120
ccagtgacta acatctgcca ggcagctgac aaacagctgt tcacactcgt tgagtgggca 180
aagaggatcc cgcacttctc ctccctacct ctggacgatc aggtcatact gctgcgggca 240
ggctggaacg agctcctcat tgcgtccttc tcccatcggt ccattgatgt ccgagatggc 300
atcctcctgg ccacgggtct tcatgtgcac agaaactcag cccattccgc aggcgtggga 360
gccatctttg atcgggtgct gacagagcta gtgtccaaaa tgcgtgacat gaggatggac 420
aagacagagc ttggctgcct gcgggcaatc atcatgttta atccagacgc caagggcctc 480
tccaaccctg gagaggtgga gatccttcgg gagaaggtgt acgcctcact ggagacctat 540
tgcaagcaga agtaccctga gcagcagggc cggtttgcca agctgctgtt acgtcttcct 600
gccctccgct ccatcggcct caagtgtctg gagcacctgt tcttcttcaa gctcattggc 660
gacaccccca ttgacacctt cctcatggag atgcttgagg ctccccacca gctagcctga 720
<210> SEQ ID NO: 64
<211> LENGTH: 705
<212> TYPE: DNA
<213> ORGANISM: Mus musculus
<400> SEQUENCE: 64
agccacgaag acatgcccgt ggagaggatt ctagaagccg aacttgctgt ggaaccaaag 60
acagaatcct acggtgacat gaacgtggag aactcaacaa atgaccctgt taccaacata 120
tgccatgctg cagataagca acttttcacc ctcgttgagt gggccaaacg catcccccac 180
ttctcagatc tcaccttgga ggaccaggtc attctactcc gggcagggtg gaatgaactg 240
ctcattgcct ccttctccca ccgctcggtt tccgtccagg atggcatcct gctggccacg 300
ggcctccacg tgcacaggag cagcgctcac agccggggag tcggctccat cttcgacaga 360
gtccttacag agttggtgtc caagatgaaa gacatgcaga tggataagtc agagctgggg 420
tgcctacggg ccatcgtgct gtttaaccca gatgccaagg gtttatccaa cccctctgag 480
gtggagactc ttcgagagaa ggtttatgcc accctggagg cctataccaa gcagaagtat 540
ccggaacagc caggcaggtt tgccaagctt ctgctgcgtc tccctgctct gcgctccatc 600
ggcttgaaat gcctggaaca cctcttcttc ttcaagctca ttggagacac tcccatcgac 660
agcttcctca tggagatgtt ggagacccca ctgcagatca cctga 705
<210> SEQ ID NO: 65
<211> LENGTH: 850
<212> TYPE: DNA
<213> ORGANISM: Homo sapiens
<400> SEQUENCE: 65
gccaacgagg acatgccggt ggagaggatc ctggaggctg agctggccgt ggagcccaag 60
accgagacct acgtggaggc aaacatgggg ctgaacccca gctcgccgaa cgaccctgtc 120
accaacattt gccaagcagc cgacaaacag cttttcaccc tggtggagtg ggccaagcgg 180
atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 240
aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 300
ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 360
tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 420
gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 480
ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 540
cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 600
cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 660
cccattgaca ccttccttat ggagatgctg gaggcgccgc accaaatgac ttaggcctgc 720
gggcccatcc tttgtgccca cccgttctgg ccaccctgcc tggacgccag ctgttcttct 780
cagcctgagc cctgtccctg cccttctctg cctggcctgt ttggactttg gggcacagcc 840
tgtcactgct 850
<210> SEQ ID NO: 66
<211> LENGTH: 720
<212> TYPE: DNA
<213> ORGANISM: Homo sapiens
<400> SEQUENCE: 66
gcccccgagg agatgcctgt ggacaggatc ctggaggcag agcttgctgt ggaacagaag 60
agtgaccagg gcgttgaggg tcctggggga accgggggta gcggcagcag cccaaatgac 120
cctgtgacta acatctgtca ggcagctgac aaacagctat tcacgcttgt tgagtgggcg 180
aagaggatcc cacacttttc ctccttgcct ctggatgatc aggtcatatt gctgcgggca 240
ggctggaatg aactcctcat tgcctccttt tcacaccgat ccattgatgt tcgagatggc 300
atcctccttg ccacaggtct tcacgtgcac cgcaactcag cccattcagc aggagtagga 360
gccatctttg atcgggtgct gacagagcta gtgtccaaaa tgcgtgacat gaggatggac 420
aagacagagc ttggctgcct gagggcaatc attctgttta atccagatgc caagggcctc 480
tccaacccta gtgaggtgga ggtcctgcgg gagaaagtgt atgcatcact ggagacctac 540
tgcaaacaga agtaccctga gcagcaggga cggtttgcca agctgctgct acgtcttcct 600
gccctccggt ccattggcct taagtgtcta gagcatctgt ttttcttcaa gctcattggt 660
gacaccccca tcgacacctt cctcatggag atgcttgagg ctccccatca actggcctga 720
<210> SEQ ID NO: 67
<211> LENGTH: 705
<212> TYPE: DNA
<213> ORGANISM: Homo sapiens
<400> SEQUENCE: 67
ggtcatgaag acatgcctgt ggagaggatt ctagaagctg aacttgctgt tgaaccaaag 60
acagaatcct atggtgacat gaatatggag aactcgacaa atgaccctgt taccaacata 120
tgtcatgctg ctgacaagca gcttttcacc ctcgttgaat gggccaagcg tattccccac 180
ttctctgacc tcaccttgga ggaccaggtc attttgcttc gggcagggtg gaatgaattg 240
ctgattgcct ctttctccca ccgctcagtt tccgtgcagg atggcatcct tctggccacg 300
ggtttacatg tccaccggag cagtgcccac agtgctgggg tcggctccat ctttgacaga 360
gttctaactg agctggtttc caaaatgaaa gacatgcaga tggacaagtc ggaactggga 420
tgcctgcgag ccattgtact ctttaaccca gatgccaagg gcctgtccaa cccctctgag 480
gtggagactc tgcgagagaa ggtttatgcc acccttgagg cctacaccaa gcagaagtat 540
ccggaacagc caggcaggtt tgccaagctg ctgctgcgcc tcccagctct gcgttccatt 600
ggcttgaaat gcctggagca cctcttcttc ttcaagctca tcggggacac ccccattgac 660
accttcctca tggagatgtt ggagaccccg ctgcagatca cctga 705
<210> SEQ ID NO: 68
<211> LENGTH: 237
<212> TYPE: PRT
<213> ORGANISM: Mus musculus
<400> SEQUENCE: 68
Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala
Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn
Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp
Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe
Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp
Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys
Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala
His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu
Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys
Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn
Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu
Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys
Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu
Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr
Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Ala Thr
<210> SEQ ID NO: 69
<211> LENGTH: 239
<212> TYPE: PRT
<213> ORGANISM: Mus musculus
<400> SEQUENCE: 69
Ala Pro Glu Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala
Val Glu Gln Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Ala Thr Gly
Gly Gly Gly Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala
Ala Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro
His Phe Ser Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala
Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp
Val Arg Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn
Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr
Glu Leu Val Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu
Gly Cys Leu Arg Ala Ile Ile Met Phe Asn Pro Asp Ala Lys Gly Leu
Ser Asn Pro Gly Glu Val Glu Ile Leu Arg Glu Lys Val Tyr Ala Ser
Leu Glu Thr Tyr Cys Lys Gln Lys Tyr Pro Glu Gln Gln Gly Arg Phe
Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys
Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile
Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Leu Ala
<210> SEQ ID NO: 70
<211> LENGTH: 234
<212> TYPE: PRT
<213> ORGANISM: Mus musculus
<400> SEQUENCE: 70
Ser His Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala
Val Glu Pro Lys Thr Glu Ser Tyr Gly Asp Met Asn Val Glu Asn Ser
Thr Asn Asp Pro Val Thr Asn Ile Cys His Ala Ala Asp Lys Gln Leu
Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Asp Leu
Thr Leu Glu Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu
Leu Ile Ala Ser Phe Ser His Arg Ser Val Ser Val Gln Asp Gly Ile
Leu Leu Ala Thr Gly Leu His Val His Arg Ser Ser Ala His Ser Arg
Gly Val Gly Ser Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys
Met Lys Asp Met Gln Met Asp Lys Ser Glu Leu Gly Cys Leu Arg Ala
Ile Val Leu Phe Asn Pro Asp Ala Lys Gly Leu Ser Asn Pro Ser Glu
Val Glu Thr Leu Arg Glu Lys Val Tyr Ala Thr Leu Glu Ala Tyr Thr
Lys Gln Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu
Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu
Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Ser Phe Leu Met
Glu Met Leu Glu Thr Pro Leu Gln Ile Thr
<210> SEQ ID NO: 71
<211> LENGTH: 237
<212> TYPE: PRT
<213> ORGANISM: Homo sapiens
<400> SEQUENCE: 71
Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala
Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn
Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp
Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe
Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp
Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys
Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala
His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu
Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys
Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn
Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu
Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys
Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu
Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr
Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met Thr
<210> SEQ ID NO: 72
<211> LENGTH: 239
<212> TYPE: PRT
<213> ORGANISM: Homo sapiens
<400> SEQUENCE: 72
Ala Pro Glu Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala
Val Glu Gln Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Gly Thr Gly
Gly Ser Gly Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala
Ala Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro
His Phe Ser Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala
Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp
Val Arg Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn
Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr
Glu Leu Val Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu
Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn Pro Asp Ala Lys Gly Leu
Ser Asn Pro Ser Glu Val Glu Val Leu Arg Glu Lys Val Tyr Ala Ser
Leu Glu Thr Tyr Cys Lys Gln Lys Tyr Pro Glu Gln Gln Gly Arg Phe
Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys
Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile
Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Leu Ala
<210> SEQ ID NO: 73
<211> LENGTH: 234
<212> TYPE: PRT
<213> ORGANISM: Homo sapiens
<400> SEQUENCE: 73
Gly His Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala
Val Glu Pro Lys Thr Glu Ser Tyr Gly Asp Met Asn Met Glu Asn Ser
Thr Asn Asp Pro Val Thr Asn Ile Cys His Ala Ala Asp Lys Gln Leu
Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Asp Leu
Thr Leu Glu Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu
Leu Ile Ala Ser Phe Ser His Arg Ser Val Ser Val Gln Asp Gly Ile
Leu Leu Ala Thr Gly Leu His Val His Arg Ser Ser Ala His Ser Ala
Gly Val Gly Ser Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys
Met Lys Asp Met Gln Met Asp Lys Ser Glu Leu Gly Cys Leu Arg Ala
Ile Val Leu Phe Asn Pro Asp Ala Lys Gly Leu Ser Asn Pro Ser Glu
Val Glu Thr Leu Arg Glu Lys Val Tyr Ala Thr Leu Glu Ala Tyr Thr
Lys Gln Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu
Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu
Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met
Glu Met Leu Glu Thr Pro Leu Gln Ile Thr
<210> SEQ ID NO: 74
<211> LENGTH: 516
<212> TYPE: DNA
<213> ORGANISM: Locusta migratoria
<400> SEQUENCE: 74
atccctacct ctggaggacc aggttctcct cctcagagca ggttggaatg aactgctaat 60
tgcagcattt tcacatcgat ctgtagatgt taaagatggc atagtacttg ccactggtct 120
cacagtgcat cgaaattctg cccatcaagc tggagtcggc acaatatttg acagagtttt 180
gacagaactg gtagcaaaga tgagagaaat gaaaatggat aaaactgaac ttggctgctt 240
gcgatctgtt attcttttca atccagaggt gaggggtttg aaatccgccc aggaagttga 300
acttctacgt gaaaaagtat atgccgcttt ggaagaatat actagaacaa cacatcccga 360
tgaaccagga agatttgcaa aacttttgct tcgtctgcct tctttacgtt ccataggcct 420
taagtgtttg gagcatttgt tttctttcgc cttattggag atgttccaat tgatacgttc 480
ctgatggaga tgcttgaatc accttctgat tcataa 516
<210> SEQ ID NO: 75
<211> LENGTH: 528
<212> TYPE: DNA
<213> ORGANISM: Amblyomma americanum
<400> SEQUENCE: 75
attccacatt ttgaagagct tccccttgag gaccgcatgg tgttgctcaa ggctggctgg 60
aacgagctgc tcattgctgc tttctcccac cgttctgttg acgtgcgtga tggcattgtg 120
ctcgctacag gtcttgtggt gcagcggcat agtgctcatg gggctggcgt tggggccata 180
tttgataggg ttctcactga actggtagca aagatgcgtg agatgaagat ggaccgcact 240
gagcttggat gcctgcttgc tgtggtactt tttaatcctg aggccaaggg gctgcggacc 300
tgcccaagtg gaggccctga gggagaaagt gtatctgcct tggaagagca ctgccggcag 360
cagtacccag accagcctgg gcgctttgcc aagctgctgc tgcggttgcc agctctgcgc 420
agtattggcc tcaagtgcct cgaacatctc tttttcttca agctcatcgg ggacacgccc 480
atcgacaact ttcttctttc catgctggag gccccctctg acccctaa 528
<210> SEQ ID NO: 76
<211> LENGTH: 531
<212> TYPE: DNA
<213> ORGANISM: Amblyomma americanum
<400> SEQUENCE: 76
attccgcact tcgaagagct tcccatcgag gatcgcaccg cgctgctcaa agccggctgg 60
aacgaactgc ttattgccgc cttttcgcac cgttctgtgg cggtgcgcga cggcatcgtt 120
ctggccaccg ggctggtggt gcagcggcac agcgcacacg gcgcaggcgt tggcgacatc 180
ttcgaccgcg tactagccga gctggtggcc aagatgcgcg acatgaagat ggacaaaacg 240
gagctcggct gcctgcgcgc cgtggtgctc ttcaatccag acgccaaggg tctccgaaac 300
gccaccagag tagaggcgct ccgcgagaag gtgtatgcgg cgctggagga gcactgccgt 360
cggcaccacc cggaccaacc gggtcgcttc ggcaagctgc tgctgcggct gcctgccttg 420
cgcagcatcg ggctcaaatg cctcgagcat ctgttcttct tcaagctcat cggagacact 480
cccatagaca gcttcctgct caacatgctg gaggcaccgg cagaccccta g 531
<210> SEQ ID NO: 77
<211> LENGTH: 552
<212> TYPE: DNA
<213> ORGANISM: Celuca pugilator
<400> SEQUENCE: 77
atcccacact tcacagacct tcccatagag gaccaagtgg tattactcaa agccgggtgg 60
aacgagttgc ttattgcctc attctcacac cgtagcatgg gcgtggagga tggcatcgtg 120
ctggccacag ggctcgtgat ccacagaagt agtgctcacc aggctggagt gggtgccata 180
tttgatcgtg tcctctctga gctggtggcc aagatgaagg agatgaagat tgacaagaca 240
gagctgggct gccttcgctc catcgtcctg ttcaacccag atgccaaagg actaaactgc 300
gtcaatgatg tggagatctt gcgtgagaag gtgtatgctg ccctggagga gtacacacga 360
accacttacc ctgatgaacc tggacgcttt gccaagttgc ttctgcgact tcctgcactc 420
aggtctatag gcctgaagtg tcttgagtac ctcttcctgt ttaagctgat tggagacact 480
cccctggaca gctacttgat gaagatgctc gtagacaacc caaatacaag cgtcactccc 540
cccaccagct ag 552
<210> SEQ ID NO: 78
<211> LENGTH: 531
<212> TYPE: DNA
<213> ORGANISM: Tenebrio molitor
<400> SEQUENCE: 78
atacctcact ttacctcgtt gccgatgtcg gaccaggtgc ttttattgag ggcaggatgg 60
aatgaattgc tcatcgccgc attctcgcac agatctatac aggcgcagga tgccatcgtt 120
ctagccacgg ggttgacagt taacaaaacg tcggcgcacg ccgtgggcgt gggcaacatc 180
tacgaccgcg tcctctccga gctggtgaac aagatgaaag agatgaagat ggacaagacg 240
gagctgggct gcttgagagc catcatcctc tacaacccca cgtgtcgcgg catcaagtcc 300
gtgcaggaag tggagatgct gcgtgagaaa atttacggcg tgctggaaga gtacaccagg 360
accacccacc cgaacgagcc cggcaggttc gccaaactgc ttctgcgcct cccggccctc 420
aggtccatcg ggttgaaatg ttccgaacac ctctttttct tcaagctgat cggtgatgtt 480
ccaatagaca cgttcctgat ggagatgctg gagtctccgg cggacgctta g 531
<210> SEQ ID NO: 79
<211> LENGTH: 531
<212> TYPE: DNA
<213> ORGANISM: Apis mellifera
<400> SEQUENCE: 79
atcccgcatt ttacctcgtt gccactggag gatcaggtac ttctgctcag ggccggttgg 60
aacgagttgc tgatagcctc cttttcccac cgttccatcg acgtgaagga cggtatcgtg 120
ctggcgacgg ggatcaccgt gcatcggaac tcggcgcagc aggccggcgt gggcacgata 180
ttcgaccgtg tcctctcgga gcttgtctcg aaaatgcgtg aaatgaagat ggacaggaca 240
gagcttggct gtctcagatc tataatactc ttcaatcccg aggttcgagg actgaaatcc 300
atccaggaag tgaccctgct ccgtgagaag atctacggcg ccctggaggg ttattgccgc 360
gtagcttggc ccgacgacgc tggaagattc gcgaaattac ttctacgcct gcccgccatc 420
cgctcgatcg gattaaagtg cctcgagtac ctgttcttct tcaaaatgat cggtgacgta 480
ccgatcgacg attttctcgt ggagatgtta gaatcgcgat cagatcctta g 531
<210> SEQ ID NO: 80
<211> LENGTH: 176
<212> TYPE: PRT
<213> ORGANISM: Locusta migratoria
<400> SEQUENCE: 80
Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu Leu Leu
Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser
Val Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Leu Thr Val His
Arg Asn Ser Ala His Gln Ala Gly Val Gly Thr Ile Phe Asp Arg Val
Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp Lys Thr
Glu Leu Gly Cys Leu Arg Ser Val Ile Leu Phe Asn Pro Glu Val Arg
Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg Glu Lys Val Tyr
Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asp Glu Pro Gly
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser Ile Gly
Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu Ile Gly Asp Val
Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ser Asp Ser
<210> SEQ ID NO: 81
<211> LENGTH: 175
<212> TYPE: PRT
<213> ORGANISM: Amblyomma americanum
<400> SEQUENCE: 81
Ile Pro His Phe Glu Glu Leu Pro Leu Glu Asp Arg Met Val Leu Leu
Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser
Val Asp Val Arg Asp Gly Ile Val Leu Ala Thr Gly Leu Val Val Gln
Arg His Ser Ala His Gly Ala Gly Val Gly Ala Ile Phe Asp Arg Val
Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp Arg Thr
Glu Leu Gly Cys Leu Leu Ala Val Val Leu Phe Asn Pro Glu Ala Lys
Gly Leu Arg Thr Cys Pro Ser Gly Gly Pro Glu Gly Glu Ser Val Ser
Ala Leu Glu Glu His Cys Arg Gln Gln Tyr Pro Asp Gln Pro Gly Arg
Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu
Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro
Ile Asp Asn Phe Leu Leu Ser Met Leu Glu Ala Pro Ser Asp Pro
<210> SEQ ID NO: 82
<211> LENGTH: 176
<212> TYPE: PRT
<213> ORGANISM: Amblyomma americanum
<400> SEQUENCE: 82
Ile Pro His Phe Glu Glu Leu Pro Ile Glu Asp Arg Thr Ala Leu Leu
Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser
Val Ala Val Arg Asp Gly Ile Val Leu Ala Thr Gly Leu Val Val Gln
Arg His Ser Ala His Gly Ala Gly Val Gly Asp Ile Phe Asp Arg Val
Leu Ala Glu Leu Val Ala Lys Met Arg Asp Met Lys Met Asp Lys Thr
Glu Leu Gly Cys Leu Arg Ala Val Val Leu Phe Asn Pro Asp Ala Lys
Gly Leu Arg Asn Ala Thr Arg Val Glu Ala Leu Arg Glu Lys Val Tyr
Ala Ala Leu Glu Glu His Cys Arg Arg His His Pro Asp Gln Pro Gly
Arg Phe Gly Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly
Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr
Pro Ile Asp Ser Phe Leu Leu Asn Met Leu Glu Ala Pro Ala Asp Pro
<210> SEQ ID NO: 83
<211> LENGTH: 183
<212> TYPE: PRT
<213> ORGANISM: Celuca pugilator
<400> SEQUENCE: 83
Ile Pro His Phe Thr Asp Leu Pro Ile Glu Asp Gln Val Val Leu Leu
Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser
Met Gly Val Glu Asp Gly Ile Val Leu Ala Thr Gly Leu Val Ile His
Arg Ser Ser Ala His Gln Ala Gly Val Gly Ala Ile Phe Asp Arg Val
Leu Ser Glu Leu Val Ala Lys Met Lys Glu Met Lys Ile Asp Lys Thr
Glu Leu Gly Cys Leu Arg Ser Ile Val Leu Phe Asn Pro Asp Ala Lys
Gly Leu Asn Cys Val Asn Asp Val Glu Ile Leu Arg Glu Lys Val Tyr
Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr Tyr Pro Asp Glu Pro Gly
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly
Leu Lys Cys Leu Glu Tyr Leu Phe Leu Phe Lys Leu Ile Gly Asp Thr
Pro Leu Asp Ser Tyr Leu Met Lys Met Leu Val Asp Asn Pro Asn Thr
Ser Val Thr Pro Pro Thr Ser
<210> SEQ ID NO: 84
<211> LENGTH: 176
<212> TYPE: PRT
<213> ORGANISM: Tenebrio molitor
<400> SEQUENCE: 84
Ile Pro His Phe Thr Ser Leu Pro Met Ser Asp Gln Val Leu Leu Leu
Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser
Ile Gln Ala Gln Asp Ala Ile Val Leu Ala Thr Gly Leu Thr Val Asn
Lys Thr Ser Ala His Ala Val Gly Val Gly Asn Ile Tyr Asp Arg Val
Leu Ser Glu Leu Val Asn Lys Met Lys Glu Met Lys Met Asp Lys Thr
Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Tyr Asn Pro Thr Cys Arg
Gly Ile Lys Ser Val Gln Glu Val Glu Met Leu Arg Glu Lys Ile Tyr
Gly Val Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asn Glu Pro Gly
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly
Leu Lys Cys Ser Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Val
Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ala Asp Ala
<210> SEQ ID NO: 85
<211> LENGTH: 176
<212> TYPE: PRT
<213> ORGANISM: Apis mellifera
<400> SEQUENCE: 85
Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu Leu Leu
Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser
Ile Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Ile Thr Val His
Arg Asn Ser Ala Gln Gln Ala Gly Val Gly Thr Ile Phe Asp Arg Val
Leu Ser Glu Leu Val Ser Lys Met Arg Glu Met Lys Met Asp Arg Thr
Glu Leu Gly Cys Leu Arg Ser Ile Ile Leu Phe Asn Pro Glu Val Arg
Gly Leu Lys Ser Ile Gln Glu Val Thr Leu Leu Arg Glu Lys Ile Tyr
Gly Ala Leu Glu Gly Tyr Cys Arg Val Ala Trp Pro Asp Asp Ala Gly
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Ile Arg Ser Ile Gly
Leu Lys Cys Leu Glu Tyr Leu Phe Phe Phe Lys Met Ile Gly Asp Val
Pro Ile Asp Asp Phe Leu Val Glu Met Leu Glu Ser Arg Ser Asp Pro
<210> SEQ ID NO: 86
<211> LENGTH: 259
<212> TYPE: PRT
<213> ORGANISM: Choristoneura fumiferana
<400> SEQUENCE: 86
Leu Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln
Asp Gly Tyr Glu Gln Pro ser Asp Glu Asp Leu Lys Arg Ile Thr Gln
Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu ser Asp Thr Pro Phe
Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu
Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile ser Gln Pro Asp Gln
Ile Thr Leu Leu Lys Ala cys ser ser Glu Val Met Met Leu Arg Val
Ala Arg Arg Tyr Asp Ala Ala ser Asp ser Val Leu Phe Ala Asn Asn
Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val
Ile Glu Asp Leu Leu His Phe cys Arg cys Met Tyr ser Met Ala Leu
Asp Asn Ile His Tyr Ala Leu Leu Thr Ala val val Ile Phe ser Asp
Arg Pro Gly Leu Glu Gln Pro Gln Leu val Glu Glu Ile Gln Arg Tyr
Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu ser Gly ser
Ala Arg ser ser Val Ile Tyr Gly Lys Ile Leu ser Ile Leu ser Glu
Leu Arg Thr Leu Gly Met Gln Asn ser Asn Met cys Ile Ser Leu Lys
Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp val
Ala Asp Met ser His Thr Gln Pro Pro Pro Ile Leu Glu ser Pro Thr
Asn Leu Gly
<210> SEQ ID NO: 87
<211> LENGTH: 674
<212> TYPE: PRT
<213> ORGANISM: Artificial
<400> SEQUENCE: 87
Met Asp Tyr Lys Asp Asp Asp Asp Lys Glu Met Pro Val Asp Arg Ile
Leu Glu Ala Glu Leu Ala Val Glu Gln Lys Ser Asp Gln Gly Val Glu
Gly Pro Gly Gly Thr Gly Gly Ser Gly Ser Ser Pro Asn Asp Pro Val
Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val Glu
Trp Ala Lys Arg Ile Pro His Phe Ser Ser Leu Pro Leu Asp Asp Gln
Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe
Ser His Arg Ser Ile Asp Val Arg Asp Gly Ile Leu Leu Ala Thr Gly
Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile
Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Arg
Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn
Pro Glu Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg
Glu Lys Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro
Asp Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu
Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu
Ile Gly Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser
Pro Ser Asp Ser Gln Ile Ser Tyr Ala Ser Arg Gly Gly Gly Ser Ser
Gly Gly Gly Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro Ala Pro Phe
Tyr Pro Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His Lys Ala Met
Lys Arg Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr Asp Ala His
Ile Glu Val Asn Ile Thr Tyr Ala Glu Tyr Phe Glu Met Ser Val Arg
Leu Ala Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn His Arg Ile
Val Val Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro Val Leu Gly
Ala Leu Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp Ile Tyr Asn
Glu Arg Glu Leu Leu Asn Ser Met Asn Ile Ser Gln Pro Thr Val Val
Phe Val Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val Gln Lys Lys
Leu Pro Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys Thr Asp Tyr
Gln Gly Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His Leu Pro Pro
Gly Phe Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp Arg Asp Lys
Thr Ile Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly Leu Pro Lys
Gly Val Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe Ser His Ala
Arg Asp Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr Ala Ile Leu
Ser Val Val Pro Phe His His Gly Phe Gly Met Phe Thr Thr Leu Gly
Tyr Leu Ile Cys Gly Phe Arg Val Val Leu Met Tyr Arg Phe Glu Glu
Glu Leu Phe Leu Arg Ser Leu Gln Asp Tyr Lys Ile Gln Ser Ala Leu
Leu Val Pro Thr Leu Phe Ser Phe Phe Ala Lys Ser Thr Leu Ile Asp
Lys Tyr Asp Leu Ser Asn Leu His Glu Ile Ala Ser Gly Gly Ala Pro
Leu Ser Lys Glu Val Gly Glu Ala Val Ala Lys Arg Phe His Leu Pro
Gly Ile Arg Gln Gly Tyr Gly Leu Thr Glu Thr Thr Ser Ala Ile Leu
Ile Thr Pro Glu Gly Asp Asp Lys Pro Gly Ala Val Gly Lys Val Val
Pro Phe Phe Glu Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr Leu
Gly Val Asn Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile Met
Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp Lys
Asp Gly
<210> SEQ ID NO: 88
<211> LENGTH: 463
<212> TYPE: PRT
<213> ORGANISM: Artificial
<400> SEQUENCE: 88
Gln Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His Pro Asn
Ile Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala Gly Glu
Leu Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met Thr Glu
Lys Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala Lys Lys
Leu Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly Leu Thr
Gly Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys Ala Lys
Lys Gly Gly Lys Ser Lys Leu Gly Gly Gly Ser Ser Gly Gly Gly Gln
Ile Ser Tyr Ala Ser Arg Gly Arg Pro Glu Cys Val Val Pro Glu Thr
Gln Cys Ala Met Lys Arg Lys Glu Lys Lys Ala Gln Lys Glu Lys Asp
Lys Leu Pro Val Ser Thr Thr Thr Val Asp Asp His Met Pro Pro Ile
Met Gln Cys Glu Pro Pro Pro Pro Glu Ala Ala Arg Ile His Glu Val
Val Pro Arg Phe Leu Ser Asp Lys Leu Leu Val Thr Asn Arg Gln Lys
Asn Ile Pro Gln Leu Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu
Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys
Arg Ile Thr Gln Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser
Asp Thr Pro Phe Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln
Leu Ile Val Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser
Gln Pro Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met
Met Leu Arg Val Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Ile Leu
Phe Ala Asn Asn Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly
Met Ala Glu Val Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr
Ser Met Ala Leu Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val
Ile Phe Ser Asp Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu
Ile Gln Arg Tyr Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln
Leu Ser Gly Ser Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser
Ile Leu Ser Glu Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys
Ile Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu
Ile Trp Asp Val Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu
Glu Ser Pro Thr Asn Leu Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
<210> SEQ ID NO: 89
<211> LENGTH: 675
<212> TYPE: PRT
<213> ORGANISM: Artificial
<400> SEQUENCE: 89
Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg
Ile Thr Gln Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp
Thr Pro Phe Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu
Ile Val Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln
Pro Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met
Leu Arg Val Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Ile Leu Phe
Ala Asn Asn Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met
Ala Glu Val Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser
Met Ala Leu Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile
Phe Ser Asp Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile
Gln Arg Tyr Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu
Ser Gly Ser Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile
Leu Ser Glu Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile
Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile
Trp Asp Val Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu
Ser Pro Thr Asn Leu Gln Ile Ser Tyr Ala Ser Arg Gly Gly Gly Ser
Ser Gly Gly Gly Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro Ala Pro
Phe Tyr Pro Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His Lys Ala
Met Lys Arg Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr Asp Ala
His Ile Glu Val Asn Ile Thr Tyr Ala Glu Tyr Phe Glu Met Ser Val
Arg Leu Ala Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn His Arg
Ile Val Val Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro Val Leu
Gly Ala Leu Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp Ile Tyr
Asn Glu Arg Glu Leu Leu Asn Ser Met Asn Ile Ser Gln Pro Thr Val
Val Phe Val Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val Gln Lys
Lys Leu Pro Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys Thr Asp
Tyr Gln Gly Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His Leu Pro
Pro Gly Phe Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp Arg Asp
Lys Thr Ile Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly Leu Pro
Lys Gly Val Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe Ser His
Ala Arg Asp Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr Ala Ile
Leu Ser Val Val Pro Phe His His Gly Phe Gly Met Phe Thr Thr Leu
Gly Tyr Leu Ile Cys Gly Phe Arg Val Val Leu Met Tyr Arg Phe Glu
Glu Glu Leu Phe Leu Arg Ser Leu Gln Asp Tyr Lys Ile Gln Ser Ala
Leu Leu Val Pro Thr Leu Phe Ser Phe Phe Ala Lys Ser Thr Leu Ile
Asp Lys Tyr Asp Leu Ser Asn Leu His Glu Ile Ala Ser Gly Gly Ala
Pro Leu Ser Lys Glu Val Gly Glu Ala Val Ala Lys Arg Phe His Leu
Pro Gly Ile Arg Gln Gly Tyr Gly Leu Thr Glu Thr Thr Ser Ala Ile
Leu Ile Thr Pro Glu Gly Asp Asp Lys Pro Gly Ala Val Gly Lys Val
Val Pro Phe Phe Glu Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr
Leu Gly Val Asn Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile
Met Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp
Lys Asp Gly
<210> SEQ ID NO: 90
<211> LENGTH: 412
<212> TYPE: PRT
<213> ORGANISM: Artificial
<400> SEQUENCE: 90
Met Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp
Lys Asp Gly Trp Leu His Ser Gly Asp Ile Ala Tyr Trp Asp Glu Asp
Glu His Phe Phe Ile Val Asp Arg Leu Lys Ser Leu Ile Lys Tyr Lys
Gly Tyr Gln Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His
Pro Asn Ile Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala
Gly Glu Leu Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met
Thr Glu Lys Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala
Lys Lys Leu Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly
Leu Thr Gly Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys
Ala Lys Lys Gly Gly Lys Ser Lys Leu Gly Gly Gly Ser Ser Gly Gly
Gly Gln Ile Ser Tyr Ala Ser Arg Gly Glu Met Pro Val Asp Arg Ile
Leu Glu Ala Glu Leu Ala Val Glu Gln Lys Ser Asp Gln Gly Val Glu
Gly Pro Gly Gly Thr Gly Gly Ser Gly Ser Ser Pro Asn Asp Pro Val
Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val Glu
Trp Ala Lys Arg Ile Pro His Phe Ser Ser Leu Pro Leu Asp Asp Gln
Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe
Ser His Arg Ser Ile Asp Val Arg Asp Gly Ile Leu Leu Ala Thr Gly
Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile
Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Arg
Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn
Pro Glu Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg
Glu Lys Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro
Asp Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu
Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu
Ile Gly Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser
Pro Ser Asp Ser Asp Tyr Lys Asp Asp Asp Asp Lys
<210> SEQ ID NO: 91
<211> LENGTH: 1189
<212> TYPE: PRT
<213> ORGANISM: Artificial
<400> SEQUENCE: 91
Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gln Trp Tyr Glu Leu
Gln Gln Leu Asp Ser Lys Phe Leu Glu Gln Val His Gln Leu Tyr Asp
Asp Ser Phe Pro Met Glu Ile Arg Gln Tyr Leu Ala Gln Trp Leu Glu
Lys Gln Asp Trp Glu His Ala Ala Asn Asp Val Ser Phe Ala Thr Ile
Arg Phe His Asp Leu Leu Ser Gln Leu Asp Asp Gln Tyr Ser Arg Phe
Ser Leu Glu Asn Asn Phe Leu Leu Gln His Asn Ile Arg Lys Ser Lys
Arg Asn Leu Gln Asp Asn Phe Gln Glu Asp Pro Ile Gln Met Ser Met
Ile Ile Tyr Ser Cys Leu Lys Glu Glu Arg Lys Ile Leu Glu Asn Ala
Gln Arg Phe Asn Gln Ala Gln Ser Gly Asn Ile Gln Ser Thr Val Met
Leu Asp Lys Gln Lys Glu Leu Asp Ser Lys Val Arg Asn Val Lys Asp
Lys Val Met Cys Ile Glu His Glu Ile Lys Ser Leu Glu Asp Leu Gln
Asp Glu Tyr Asp Phe Lys Cys Lys Thr Leu Gln Asn Arg Glu His Glu
Thr Asn Gly Val Ala Lys Ser Asp Gln Lys Gln Glu Gln Leu Leu Leu
Lys Lys Met Tyr Leu Met Leu Asp Asn Lys Arg Lys Glu Val Val His
Lys Ile Ile Glu Leu Leu Asn Val Thr Glu Leu Thr Gln Asn Ala Leu
Ile Asn Asp Glu Leu Val Glu Trp Lys Arg Arg Gln Gln Ser Ala Cys
Ile Gly Gly Pro Pro Asn Ala Cys Leu Asp Gln Leu Gln Asn Trp Phe
Thr Ile Val Ala Glu Ser Leu Gln Gln Val Arg Gln Gln Leu Lys Lys
Leu Glu Glu Leu Glu Gln Lys Tyr Thr Tyr Glu His Asp Pro Ile Thr
Lys Asn Lys Gln Val Leu Trp Asp Arg Thr Phe Ser Leu Phe Gln Gln
Leu Ile Gln Ser Ser Phe Val Val Glu Arg Gln Pro Cys Met Pro Thr
His Pro Gln Arg Pro Leu Val Leu Lys Thr Gly Val Gln Phe Thr Val
Lys Leu Arg Leu Leu Val Lys Leu Gln Glu Leu Asn Tyr Asn Leu Lys
Val Lys Val Leu Phe Asp Lys Asp Val Asn Glu Arg Asn Thr Val Lys
Gly Phe Arg Lys Phe Asn Ile Leu Gly Thr His Thr Lys Val Met Asn
Met Glu Glu Ser Thr Asn Gly Ser Leu Ala Ala Glu Phe Arg His Leu
Gln Leu Lys Glu Gln Lys Asn Ala Gly Thr Arg Thr Asn Glu Gly Pro
Leu Ile Val Thr Glu Glu Leu His Ser Leu Ser Phe Glu Thr Gln Leu
Cys Gln Pro Gly Leu Val Ile Asp Leu Glu Thr Thr Ser Leu Pro Val
Val Val Ile Ser Asn Val Ser Gln Leu Pro Ser Gly Trp Ala Ser Ile
Leu Trp Tyr Asn Met Leu Val Ala Glu Pro Arg Asn Leu Ser Phe Phe
Leu Thr Pro Pro Cys Ala Arg Trp Ala Gln Leu Ser Glu Val Leu Ser
Trp Gln Phe Ser Ser Val Thr Lys Arg Gly Leu Asn Val Asp Gln Leu
Asn Met Leu Gly Glu Lys Leu Leu Gly Pro Asn Ala Ser Pro Asp Gly
Leu Ile Pro Trp Thr Arg Phe Cys Lys Glu Asn Ile Asn Asp Lys Asn
Phe Pro Phe Trp Leu Trp Ile Glu Ser Ile Leu Glu Leu Ile Lys Lys
His Leu Leu Pro Leu Trp Asn Asp Gly Cys Ile Met Gly Phe Ile Ser
Lys Glu Arg Glu Arg Ala Leu Leu Lys Asp Gln Gln Pro Gly Thr Phe
Leu Leu Arg Phe Ser Glu Ser Ser Arg Glu Gly Ala Ile Thr Phe Thr
Trp Val Glu Arg Ser Gln Asn Gly Gly Glu Pro Asp Phe His Ala Val
Glu Pro Tyr Thr Lys Lys Glu Leu Ser Ala Val Thr Phe Pro Asp Ile
Ile Arg Asn Tyr Lys Val Met Ala Ala Glu Asn Ile Pro Glu Asn Pro
Leu Lys Tyr Leu Tyr Pro Asn Ile Asp Lys Asp His Ala Phe Gly Lys
Tyr Tyr Ser Arg Pro Lys Glu Ala Pro Glu Pro Met Glu Leu Asp Gly
Pro Lys Gly Thr Gly Tyr Ile Lys Thr Glu Leu Ile Ser Val Ser Glu
Val His Pro Ser Arg Leu Gln Thr Thr Asp Asn Leu Leu Pro Met Ser
Pro Glu Glu Phe Asp Glu Val Ser Arg Ile Val Gly Ser Val Glu Phe
Asp Ser Met Met Asn Thr Val Gln Ile Ser Tyr Ala Ser Arg Gly Gly
Gly Ser Ser Gly Gly Gly Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro
Ala Pro Phe Tyr Pro Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His
Lys Ala Met Lys Arg Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr
Asp Ala His Ile Glu Val Asn Ile Thr Tyr Ala Glu Tyr Phe Glu Met
Ser Val Arg Leu Ala Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn
His Arg Ile Val Val Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro
Val Leu Gly Ala Leu Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp
Ile Tyr Asn Glu Arg Glu Leu Leu Asn Ser Met Asn Ile Ser Gln Pro
Thr Val Val Phe Val Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val
Gln Lys Lys Leu Pro Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys
Thr Asp Tyr Gln Gly Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His
Leu Pro Pro Gly Phe Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp
Arg Asp Lys Thr Ile Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly
Leu Pro Lys Gly Val Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe
Ser His Ala Arg Asp Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr
Ala Ile Leu Ser Val Val Pro Phe His His Gly Phe Gly Met Phe
Thr Thr Leu Gly Tyr Leu Ile Cys Gly Phe Arg Val Val Leu Met
Tyr Arg Phe Glu Glu Glu Leu Phe Leu Arg Ser Leu Gln Asp Tyr
Lys Ile Gln Ser Ala Leu Leu Val Pro Thr Leu Phe Ser Phe Phe
Ala Lys Ser Thr Leu Ile Asp Lys Tyr Asp Leu Ser Asn Leu His
Glu Ile Ala Ser Gly Gly Ala Pro Leu Ser Lys Glu Val Gly Glu
Ala Val Ala Lys Arg Phe His Leu Pro Gly Ile Arg Gln Gly Tyr
Gly Leu Thr Glu Thr Thr Ser Ala Ile Leu Ile Thr Pro Glu Gly
Asp Asp Lys Pro Gly Ala Val Gly Lys Val Val Pro Phe Phe Glu
Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr Leu Gly Val Asn
Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile Met Ser Gly
Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp Lys Asp
Gly
<210> SEQ ID NO: 92
<211> LENGTH: 926
<212> TYPE: PRT
<213> ORGANISM: Artificial
<400> SEQUENCE: 92
Met Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp
Lys Asp Gly Trp Leu His Ser Gly Asp Ile Ala Tyr Trp Asp Glu Asp
Glu His Phe Phe Ile Val Asp Arg Leu Lys Ser Leu Ile Lys Tyr Lys
Gly Tyr Gln Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His
Pro Asn Ile Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala
Gly Glu Leu Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met
Thr Glu Lys Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala
Lys Lys Leu Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly
Leu Thr Gly Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys
Ala Lys Lys Gly Gly Lys Ser Lys Leu Gly Gly Gly Ser Ser Gly Gly
Gly Gln Ile Ser Tyr Ala Ser Arg Gly Ser Gln Trp Tyr Glu Leu Gln
Gln Leu Asp Ser Lys Phe Leu Glu Gln Val His Gln Leu Tyr Asp Asp
Ser Phe Pro Met Glu Ile Arg Gln Tyr Leu Ala Gln Trp Leu Glu Lys
Gln Asp Trp Glu His Ala Ala Asn Asp Val Ser Phe Ala Thr Ile Arg
Phe His Asp Leu Leu Ser Gln Leu Asp Asp Gln Tyr Ser Arg Phe Ser
Leu Glu Asn Asn Phe Leu Leu Gln His Asn Ile Arg Lys Ser Lys Arg
Asn Leu Gln Asp Asn Phe Gln Glu Asp Pro Ile Gln Met Ser Met Ile
Ile Tyr Ser Cys Leu Lys Glu Glu Arg Lys Ile Leu Glu Asn Ala Gln
Arg Phe Asn Gln Ala Gln Ser Gly Asn Ile Gln Ser Thr Val Met Leu
Asp Lys Gln Lys Glu Leu Asp Ser Lys Val Arg Asn Val Lys Asp Lys
Val Met Cys Ile Glu His Glu Ile Lys Ser Leu Glu Asp Leu Gln Asp
Glu Tyr Asp Phe Lys Cys Lys Thr Leu Gln Asn Arg Glu His Glu Thr
Asn Gly Val Ala Lys Ser Asp Gln Lys Gln Glu Gln Leu Leu Leu Lys
Lys Met Tyr Leu Met Leu Asp Asn Lys Arg Lys Glu Val Val His Lys
Ile Ile Glu Leu Leu Asn Val Thr Glu Leu Thr Gln Asn Ala Leu Ile
Asn Asp Glu Leu Val Glu Trp Lys Arg Arg Gln Gln Ser Ala Cys Ile
Gly Gly Pro Pro Asn Ala Cys Leu Asp Gln Leu Gln Asn Trp Phe Thr
Ile Val Ala Glu Ser Leu Gln Gln Val Arg Gln Gln Leu Lys Lys Leu
Glu Glu Leu Glu Gln Lys Tyr Thr Tyr Glu His Asp Pro Ile Thr Lys
Asn Lys Gln Val Leu Trp Asp Arg Thr Phe Ser Leu Phe Gln Gln Leu
Ile Gln Ser Ser Phe Val Val Glu Arg Gln Pro Cys Met Pro Thr His
Pro Gln Arg Pro Leu Val Leu Lys Thr Gly Val Gln Phe Thr Val Lys
Leu Arg Leu Leu Val Lys Leu Gln Glu Leu Asn Tyr Asn Leu Lys Val
Lys Val Leu Phe Asp Lys Asp Val Asn Glu Arg Asn Thr Val Lys Gly
Phe Arg Lys Phe Asn Ile Leu Gly Thr His Thr Lys Val Met Asn Met
Glu Glu Ser Thr Asn Gly Ser Leu Ala Ala Glu Phe Arg His Leu Gln
Leu Lys Glu Gln Lys Asn Ala Gly Thr Arg Thr Asn Glu Gly Pro Leu
Ile Val Thr Glu Glu Leu His Ser Leu Ser Phe Glu Thr Gln Leu Cys
Gln Pro Gly Leu Val Ile Asp Leu Glu Thr Thr Ser Leu Pro Val Val
Val Ile Ser Asn Val Ser Gln Leu Pro Ser Gly Trp Ala Ser Ile Leu
Trp Tyr Asn Met Leu Val Ala Glu Pro Arg Asn Leu Ser Phe Phe Leu
Thr Pro Pro Cys Ala Arg Trp Ala Gln Leu Ser Glu Val Leu Ser Trp
Gln Phe Ser Ser Val Thr Lys Arg Gly Leu Asn Val Asp Gln Leu Asn
Met Leu Gly Glu Lys Leu Leu Gly Pro Asn Ala Ser Pro Asp Gly Leu
Ile Pro Trp Thr Arg Phe Cys Lys Glu Asn Ile Asn Asp Lys Asn Phe
Pro Phe Trp Leu Trp Ile Glu Ser Ile Leu Glu Leu Ile Lys Lys His
Leu Leu Pro Leu Trp Asn Asp Gly Cys Ile Met Gly Phe Ile Ser Lys
Glu Arg Glu Arg Ala Leu Leu Lys Asp Gln Gln Pro Gly Thr Phe Leu
Leu Arg Phe Ser Glu Ser Ser Arg Glu Gly Ala Ile Thr Phe Thr Trp
Val Glu Arg Ser Gln Asn Gly Gly Glu Pro Asp Phe His Ala Val Glu
Pro Tyr Thr Lys Lys Glu Leu Ser Ala Val Thr Phe Pro Asp Ile Ile
Arg Asn Tyr Lys Val Met Ala Ala Glu Asn Ile Pro Glu Asn Pro Leu
Lys Tyr Leu Tyr Pro Asn Ile Asp Lys Asp His Ala Phe Gly Lys Tyr
Tyr Ser Arg Pro Lys Glu Ala Pro Glu Pro Met Glu Leu Asp Gly Pro
Lys Gly Thr Gly Tyr Ile Lys Thr Glu Leu Ile Ser Val Ser Glu Val
His Pro Ser Arg Leu Gln Thr Thr Asp Asn Leu Leu Pro Met Ser Pro
Glu Glu Phe Asp Glu Val Ser Arg Ile Val Gly Ser Val Glu Phe Asp
Ser Met Met Asn Thr Val Asp Tyr Lys Asp Asp Asp Asp Lys
<210> SEQ ID NO: 93
<211> LENGTH: 335
<212> TYPE: PRT
<213> ORGANISM: Artificial
<400> SEQUENCE: 93
<223> artificial
Arg Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys
Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr
Thr Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro
Pro Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp
Lys Leu Leu Val Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala
Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr
Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln
Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile
Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys
Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu
Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg
Tyr Asp Ala Ala Ser Asp Ser Ile Leu Phe Ala Asn Asn Gln Ala Tyr
Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Glu Val Ile Glu Asp
Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile
His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly
Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn
Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser
Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr
Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn
Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met
Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn Leu
<210> SEQ ID NO: 94
<211> LENGTH: 235
<212> TYPE: PRT
<213> ORGANISM: Artificial
<400> SEQUENCE: 94
Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala Val Glu Gln
Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Gly Thr Gly Gly Ser Gly
Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp Lys
Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser
Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn
Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp Val Arg Asp
Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala His
Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu Val
Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu Gly Cys Leu
Arg Ala Ile Ile Leu Phe Asn Pro Glu Val Arg Gly Leu Lys Ser Ala
Gln Glu Val Glu Leu Leu Arg Glu Lys Val Tyr Ala Ala Leu Glu Glu
Tyr Thr Arg Thr Thr His Pro Asp Glu Pro Gly Arg Phe Ala Lys Leu
Leu Leu Arg Leu Pro Ser Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu
His Leu Phe Phe Phe Arg Leu Ile Gly Asp Val Pro Ile Asp Thr Phe
Leu Met Glu Met Leu Glu Ser Pro Ser Asp Ser
<110> INTREXON CORPORATION <120> LIGAND INDUCIBLE POLYPEPTIDE COUPLER SYSTEM <130> 0100-0013WO1 <150> 62/140,380 <151> 2015-03-30 <160> 94 <170> PatentIn version 3.5 <210> 1 <211> 1054 <212> DNA <213> Choristoneura fumiferana <400> 1 cctgagtgcg tagtacccga gactcagtgc gccatgaagc ggaaagagaa gaaagcacag 60 aaggagaagg acaaactgcc tgtcagcacg acgacggtgg acgaccacat gccgcccatt 120 atgcagtgtg aacctccacc tcctgaagca gcaaggattc acgaagtggt cccaaggttt 180 ctctccgaca agctgttgga gacaaaccgg cagaaaaaca tcccccagtt gacagccaac 240 cagcagttcc ttatcgccag gctcatctgg taccaggacg ggtacgagca gccttctgat 300 gaagatttga agaggattac gcagacgtgg cagcaagcgg acgatgaaaa cgaagagtct 360 gacactccct tccgccagat cacagagatg actatcctca cggtccaact tatcgtggag 420 ttcgcgaagg gattgccagg gttcgccaag atctcgcagc ctgatcaaat tacgctgctt 480 aaggcttgct caagtgaggt aatgatgctc cgagtcgcgc gacgatacga tgcggcctca 540 gacagtgttc tgttcgcgaa caaccaagcg tacactcgcg acaactaccg caaggctggc 600 atggcctacg tcatcgagga tctactgcac ttctgccggt gcatgtactc tatggcgttg 660 gacaacatcc attacgcgct gctcacggct gtcgtcatct tttctgaccg gccagggttg 720 gagcagccgc aactggtgga agaaatccag cggtactacc tgaatacgct ccgcatctat 780 atcctgaacc agctgagcgg gtcggcgcgt tcgtccgtca tatacggcaa gatcctctca 840 atcctctctg agctacgcac gctcggcatg caaaactcca acatgtgcat ctccctcaag 900 ctcaagaaca gaaagctgcc gcctttcctc gaggagatct gggatgtggc ggacatgtcg 960 cacacccaac cgccgcctat cctcgagtcc cccacgaatc tctagcccct gcgcgcacgc 1020 atcgccgatg ccgcgtccgg ccgcgctgct ctga 1054 <210> 2 <211> 1288 <212> DNA <213> Choristoneura fumiferana <400> 2 aagggccctg cgccccgtca gcaagaggaa ctgtgtctgg tatgcgggga cagagcctcc 60 ggataccact acaatgcgct cacgtgtgaa gggtgtaaag ggttcttcag acggagtgtt 120 accaaaaatg cggtttatat ttgtaaattc ggtcacgctt gcgaaatgga catgtacatg 180 cgacggaaat gccaggagtg ccgcctgaag aagtgcttag ctgtaggcat gaggcctgag 240 tgcgtagtac ccgagactca gtgcgccatg aagcggaaag agaagaaagc acagaaggag 300 aaggacaaac tgcctgtcag cacgacgacg gtggacgacc acatgccgcc cattatgcag 360 tgtgaacctc cacctcctga agcagcaagg attcacgaag tggtcccaag gtttctctcc 420 gacaagctgt tggagacaaa ccggcagaaa aacatccccc agttgacagc caaccagcag 480 ttccttatcg ccaggctcat ctggtaccag gacgggtacg agcagccttc tgatgaagat 540 ttgaagagga ttacgcagac gtggcagcaa gcggacgatg aaaacgaaga gtctgacact 600 cccttccgcc agatcacaga gatgactatc ctcacggtcc aacttatcgt ggagttcgcg 660 aagggattgc cagggttcgc caagatctcg cagcctgatc aaattacgct gcttaaggct 720 tgctcaagtg aggtaatgat gctccgagtc gcgcgacgat acgatgcggc ctcagacagt 780 gttctgttcg cgaacaacca agcgtacact cgcgacaact accgcaaggc tggcatggcc 840 tacgtcatcg aggatctact gcacttctgc cggtgcatgt actctatggc gttggacaac 900 atccattacg cgctgctcac ggctgtcgtc atcttttctg accggccagg gttggagcag 960 ccgcaactgg tggaagaaat ccagcggtac tacctgaata cgctccgcat ctatatcctg 1020 aaccagctga gcgggtcggc gcgttcgtcc gtcatatacg gcaagatcct ctcaatcctc 1080 tctgagctac gcacgctcgg catgcaaaac tccaacatgt gcatctccct caagctcaag 1140 aacagaaagc tgccgccttt cctcgaggag atctgggatg tggcggacat gtcgcacacc 1200 caaccgccgc ctatcctcga gtcccccacg aatctctagc ccctgcgcgc acgcatcgcc 1260 gatgccgcgt ccggccgcgc tgctctga 1288 <210> 3 <211> 1650 <212> DNA <213> Drosophila melanogaster <400> 3 cggccggaat gcgtcgtccc ggagaaccaa tgtgcgatga agcggcgcga aaagaaggcc 60 cagaaggaga aggacaaaat gaccacttcg ccgagctctc agcatggcgg caatggcagc 120 ttggcctctg gtggcggcca agactttgtt aagaaggaga ttcttgacct tatgacatgc 180 gagccgcccc agcatgccac tattccgcta ctacctgatg aaatattggc caagtgtcaa 240 gcgcgcaata taccttcctt aacgtacaat cagttggccg ttatatacaa gttaatttgg 300 taccaggatg gctatgagca gccatctgaa gaggatctca ggcgtataat gagtcaaccc 360 gatgagaacg agagccaaac ggacgtcagc tttcggcata taaccgagat aaccatactc 420 acggtccagt tgattgttga gtttgctaaa ggtctaccag cgtttacaaa gataccccag 480 gaggaccaga tcacgttact aaaggcctgc tcgtcggagg tgatgatgct gcgtatggca 540 cgacgctatg accacagctc ggactcaata ttcttcgcga ataatagatc atatacgcgg 600 gattcttaca aaatggccgg aatggctgat aacattgaag acctgctgca tttctgccgc 660 caaatgttct cgatgaaggt ggacaacgtc gaatacgcgc ttctcactgc cattgtgatc 720 ttctcggacc ggccgggcct ggagaaggcc caactagtcg aagcgatcca gagctactac 780 atcgacacgc tacgcattta tatactcaac cgccactgcg gcgactcaat gagcctcgtc 840 ttctacgcaa agctgctctc gatcctcacc gagctgcgta cgctgggcaa ccagaacgcc 900 gagatgtgtt tctcactaaa gctcaaaaac cgcaaactgc ccaagttcct cgaggagatc 960 tgggacgttc atgccatccc gccatcggtc cagtcgcacc ttcagattac ccaggaggag 1020 aacgagcgtc tcgagcgggc tgagcgtatg cgggcatcgg ttgggggcgc cattaccgcc 1080 ggcattgatt gcgactctgc ctccacttcg gcggcggcag ccgcggccca gcatcagcct 1140 cagcctcagc cccagcccca accctcctcc ctgacccaga acgattccca gcaccagaca 1200 cagccgcagc tacaacctca gctaccacct cagctgcaag gtcaactgca accccagctc 1260 caaccacagc ttcagacgca actccagcca cagattcaac cacagccaca gctccttccc 1320 gtctccgctc ccgtgcccgc ctccgtaacc gcacctggtt ccttgtccgc ggtcagtacg 1380 agcagcgaat acatgggcgg aagtgcggcc ataggaccca tcacgccggc aaccaccagc 1440 agtatcacgg ctgccgttac cgctagctcc accacatcag cggtaccgat gggcaacgga 1500 gttggagtcg gtgttggggt gggcggcaac gtcagcatgt atgcgaacgc ccagacggcg 1560 atggccttga tgggtgtagc cctgcattcg caccaagagc agcttatcgg gggagtggcg 1620 gttaagtcgg agcactcgac gactgcatag 1650 <210> 4 <211> 894 <212> DNA <213> Tenebrio molitor <400> 4 aggccggaat gtgtggtacc ggaagtacag tgtgctgtta agagaaaaga gaagaaagcc 60 caaaaggaaa aagataaacc aaacagcact actaacggct caccagacgt catcaaaatt 120 gaaccagaat tgtcagattc agaaaaaaca ttgactaacg gacgcaatag gatatcacca 180 gagcaagagg agctcatact catacatcga ttggtttatt tccaaaacga atatgaacat 240 ccgtctgaag aagacgttaa acggattatc aatcagccga tagatggtga agatcagtgt 300 gagatacggt ttaggcatac cacggaaatt acgatcctga ctgtgcagct gatcgtggag 360 tttgccaagc ggttaccagg cttcgataag ctcctgcagg aagatcaaat tgctctcttg 420 aaggcatgtt caagcgaagt gatgatgttc aggatggccc gacgttacga cgtccagtcg 480 gattccatcc tcttcgtaaa caaccagcct tatccgaggg acagttacaa tttggccggt 540 atgggggaaa ccatcgaaga tctcttgcat ttttgcagaa ctatgtactc catgaaggtg 600 gataatgccg aatatgcttt actaacagcc atcgttattt tctcagagcg accgtcgttg 660 atagaaggct ggaaggtgga gaagatccaa gaaatctatt tagaggcatt gcgggcgtac 720 gtcgacaacc gaagaagccc aagccggggc acaatattcg cgaaactcct gtcagtacta 780 actgaattgc ggacgttagg caaccaaaat tcagagatgt gcatctcgtt gaaattgaaa 840 aacaaaaagt taccgccgtt cctggacgaa atctgggacg tcgacttaaa agca 894 <210> 5 <211> 948 <212> DNA <213> Amblyomma americanum <400> 5 cggccggaat gtgtggtgcc ggagtaccag tgtgccatca agcgggagtc taagaagcac 60 cagaaggacc ggccaaacag cacaacgcgg gaaagtccct cggcgctgat ggcgccatct 120 tctgtgggtg gcgtgagccc caccagccag cccatgggtg gcggaggcag ctccctgggc 180 agcagcaatc acgaggagga taagaagcca gtggtgctca gcccaggagt caagcccctc 240 tcttcatctc aggaggacct catcaacaag ctagtctact accagcagga gtttgagtcg 300 ccttctgagg aagacatgaa gaaaaccacg cccttccccc tgggagacag tgaggaagac 360 aaccagcggc gattccagca cattactgag atcaccatcc tgacagtgca gctcattgtg 420 gagttctcca agcgggtccc tggctttgac acgctggcac gagaagacca gattactttg 480 ctgaaggcct gctccagtga agtgatgatg ctgagaggtg cccggaaata tgatgtgaag 540 acagattcta tagtgtttgc caataaccag ccgtacacga gggacaacta ccgcagtgcc 600 agtgtggggg actctgcaga tgccctgttc cgcttctgcc gcaagatgtg tcagctgaga 660 gtagacaacg ctgaatacgc actcctgacg gccattgtaa ttttctctga acggccatca 720 ctggtggacc cgcacaaggt ggagcgcatc caggagtact acattgagac cctgcgcatg 780 tactccgaga accaccggcc cccaggcaag aactactttg cccggctgct gtccatcttg 840 acagagctgc gcaccttggg caacatgaac gccgaaatgt gcttctcgct caaggtgcag 900 aacaagaagc tgccaccgtt cctggctgag atttgggaca tccaagag 948 <210> 6 <211> 334 <212> PRT <213> Choristoneura fumiferana <400> 6 Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys Glu 1 5 10 15 Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr Thr 20 25 30 Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro Pro 35 40 45 Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp Lys 50 55 60 Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala Asn 65 70 75 80 Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr Glu 85 90 95 Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln Gln 100 105 110 Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile Thr 115 120 125 Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly 130 135 140 Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu Leu 145 150 155 160 Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg Tyr 165 170 175 Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln Ala Tyr Thr 180 185 190 Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile Glu Asp Leu 195 200 205 Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile His 210 215 220 Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly Leu 225 230 235 240 Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn Thr 245 250 255 Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser Ser 260 265 270 Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu 275 280 285 Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn Arg 290 295 300 Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met Ser 305 310 315 320 His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn Leu 325 330 <210> 7 <211> 549 <212> PRT <213> Drosophila melanogaster <400> 7 Arg Pro Glu Cys Val Val Pro Glu Asn Gln Cys Ala Met Lys Arg Arg 1 5 10 15 Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Met Thr Thr Ser Pro Ser 20 25 30 Ser Gln His Gly Gly Asn Gly Ser Leu Ala Ser Gly Gly Gly Gln Asp 35 40 45 Phe Val Lys Lys Glu Ile Leu Asp Leu Met Thr Cys Glu Pro Pro Gln 50 55 60 His Ala Thr Ile Pro Leu Leu Pro Asp Glu Ile Leu Ala Lys Cys Gln 65 70 75 80 Ala Arg Asn Ile Pro Ser Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr 85 90 95 Lys Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp 100 105 110 Leu Arg Arg Ile Met Ser Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp 115 120 125 Val Ser Phe Arg His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu 130 135 140 Ile Val Glu Phe Ala Lys Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln 145 150 155 160 Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met 165 170 175 Leu Arg Met Ala Arg Arg Tyr Asp His Ser Ser Asp Ser Ile Phe Phe 180 185 190 Ala Asn Asn Arg Ser Tyr Thr Arg Asp Ser Tyr Lys Met Ala Gly Met 195 200 205 Ala Asp Asn Ile Glu Asp Leu Leu His Phe Cys Arg Gln Met Phe Ser 210 215 220 Met Lys Val Asp Asn Val Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile 225 230 235 240 Phe Ser Asp Arg Pro Gly Leu Glu Lys Ala Gln Leu Val Glu Ala Ile 245 250 255 Gln Ser Tyr Tyr Ile Asp Thr Leu Arg Ile Tyr Ile Leu Asn Arg His 260 265 270 Cys Gly Asp Ser Met Ser Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile 275 280 285 Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ala Glu Met Cys Phe 290 295 300 Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile 305 310 315 320 Trp Asp Val His Ala Ile Pro Pro Ser Val Gln Ser His Leu Gln Ile 325 330 335 Thr Gln Glu Glu Asn Glu Arg Leu Glu Arg Ala Glu Arg Met Arg Ala 340 345 350 Ser Val Gly Gly Ala Ile Thr Ala Gly Ile Asp Cys Asp Ser Ala Ser 355 360 365 Thr Ser Ala Ala Ala Ala Ala Ala Gln His Gln Pro Gln Pro Gln Pro 370 375 380 Gln Pro Gln Pro Ser Ser Leu Thr Gln Asn Asp Ser Gln His Gln Thr 385 390 395 400 Gln Pro Gln Leu Gln Pro Gln Leu Pro Pro Gln Leu Gln Gly Gln Leu 405 410 415 Gln Pro Gln Leu Gln Pro Gln Leu Gln Thr Gln Leu Gln Pro Gln Ile 420 425 430 Gln Pro Gln Pro Gln Leu Leu Pro Val Ser Ala Pro Val Pro Ala Ser 435 440 445 Val Thr Ala Pro Gly Ser Leu Ser Ala Val Ser Thr Ser Ser Glu Tyr 450 455 460 Met Gly Gly Ser Ala Ala Ile Gly Pro Ile Thr Pro Ala Thr Thr Ser 465 470 475 480 Ser Ile Thr Ala Ala Val Thr Ala Ser Ser Thr Thr Ser Ala Val Pro 485 490 495 Met Gly Asn Gly Val Gly Val Gly Val Gly Val Gly Gly Asn Val Ser 500 505 510 Met Tyr Ala Asn Ala Gln Thr Ala Met Ala Leu Met Gly Val Ala Leu 515 520 525 His Ser His Gln Glu Gln Leu Ile Gly Gly Val Ala Val Lys Ser Glu 530 535 540 His Ser Thr Thr Ala 545 <210> 8 <211> 401 <212> PRT <213> Choristoneura fumiferana <400> 8 Cys Leu Val Cys Gly Asp Arg Ala Ser Gly Tyr His Tyr Asn Ala Leu 1 5 10 15 Thr Cys Glu Gly Cys Lys Gly Phe Phe Arg Arg Ser Val Thr Lys Asn 20 25 30 Ala Val Tyr Ile Cys Lys Phe Gly His Ala Cys Glu Met Asp Met Tyr 35 40 45 Met Arg Arg Lys Cys Gln Glu Cys Arg Leu Lys Lys Cys Leu Ala Val 50 55 60 Gly Met Arg Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys 65 70 75 80 Arg Lys Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser 85 90 95 Thr Thr Thr Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro 100 105 110 Pro Pro Pro Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu 115 120 125 Ser Asp Lys Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu 130 135 140 Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp 145 150 155 160 Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr 165 170 175 Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg 180 185 190 Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe 195 200 205 Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile 210 215 220 Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala 225 230 235 240 Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln 245 250 255 Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile 260 265 270 Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp 275 280 285 Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg 290 295 300 Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr 305 310 315 320 Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala 325 330 335 Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu 340 345 350 Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu 355 360 365 Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala 370 375 380 Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn 385 390 395 400 Leu <210> 9 <211> 298 <212> PRT <213> Tenebrio molitor <400> 9 Arg Pro Glu Cys Val Val Pro Glu Val Gln Cys Ala Val Lys Arg Lys 1 5 10 15 Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Pro Asn Ser Thr Thr Asn 20 25 30 Gly Ser Pro Asp Val Ile Lys Ile Glu Pro Glu Leu Ser Asp Ser Glu 35 40 45 Lys Thr Leu Thr Asn Gly Arg Asn Arg Ile Ser Pro Glu Gln Glu Glu 50 55 60 Leu Ile Leu Ile His Arg Leu Val Tyr Phe Gln Asn Glu Tyr Glu His 65 70 75 80 Pro Ser Glu Glu Asp Val Lys Arg Ile Ile Asn Gln Pro Ile Asp Gly 85 90 95 Glu Asp Gln Cys Glu Ile Arg Phe Arg His Thr Thr Glu Ile Thr Ile 100 105 110 Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Arg Leu Pro Gly Phe 115 120 125 Asp Lys Leu Leu Gln Glu Asp Gln Ile Ala Leu Leu Lys Ala Cys Ser 130 135 140 Ser Glu Val Met Met Phe Arg Met Ala Arg Arg Tyr Asp Val Gln Ser 145 150 155 160 Asp Ser Ile Leu Phe Val Asn Asn Gln Pro Tyr Pro Arg Asp Ser Tyr 165 170 175 Asn Leu Ala Gly Met Gly Glu Thr Ile Glu Asp Leu Leu His Phe Cys 180 185 190 Arg Thr Met Tyr Ser Met Lys Val Asp Asn Ala Glu Tyr Ala Leu Leu 195 200 205 Thr Ala Ile Val Ile Phe Ser Glu Arg Pro Ser Leu Ile Glu Gly Trp 210 215 220 Lys Val Glu Lys Ile Gln Glu Ile Tyr Leu Glu Ala Leu Arg Ala Tyr 225 230 235 240 Val Asp Asn Arg Arg Ser Pro Ser Arg Gly Thr Ile Phe Ala Lys Leu 245 250 255 Leu Ser Val Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ser Glu 260 265 270 Met Cys Ile Ser Leu Lys Leu Lys Asn Lys Lys Leu Pro Pro Phe Leu 275 280 285 Asp Glu Ile Trp Asp Val Asp Leu Lys Ala 290 295 <210> 10 <211> 316 <212> PRT <213> Amblyomma americanum <400> 10 Arg Pro Glu Cys Val Val Pro Glu Tyr Gln Cys Ala Ile Lys Arg Glu 1 5 10 15 Ser Lys Lys His Gln Lys Asp Arg Pro Asn Ser Thr Thr Arg Glu Ser 20 25 30 Pro Ser Ala Leu Met Ala Pro Ser Ser Val Gly Gly Val Ser Pro Thr 35 40 45 Ser Gln Pro Met Gly Gly Gly Gly Ser Ser Leu Gly Ser Ser Asn His 50 55 60 Glu Glu Asp Lys Lys Pro Val Val Leu Ser Pro Gly Val Lys Pro Leu 65 70 75 80 Ser Ser Ser Gln Glu Asp Leu Ile Asn Lys Leu Val Tyr Tyr Gln Gln 85 90 95 Glu Phe Glu Ser Pro Ser Glu Glu Asp Met Lys Lys Thr Thr Pro Phe 100 105 110 Pro Leu Gly Asp Ser Glu Glu Asp Asn Gln Arg Arg Phe Gln His Ile 115 120 125 Thr Glu Ile Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ser Lys 130 135 140 Arg Val Pro Gly Phe Asp Thr Leu Ala Arg Glu Asp Gln Ile Thr Leu 145 150 155 160 Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Gly Ala Arg Lys 165 170 175 Tyr Asp Val Lys Thr Asp Ser Ile Val Phe Ala Asn Asn Gln Pro Tyr 180 185 190 Thr Arg Asp Asn Tyr Arg Ser Ala Ser Val Gly Asp Ser Ala Asp Ala 195 200 205 Leu Phe Arg Phe Cys Arg Lys Met Cys Gln Leu Arg Val Asp Asn Ala 210 215 220 Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile Phe Ser Glu Arg Pro Ser 225 230 235 240 Leu Val Asp Pro His Lys Val Glu Arg Ile Gln Glu Tyr Tyr Ile Glu 245 250 255 Thr Leu Arg Met Tyr Ser Glu Asn His Arg Pro Pro Gly Lys Asn Tyr 260 265 270 Phe Ala Arg Leu Leu Ser Ile Leu Thr Glu Leu Arg Thr Leu Gly Asn 275 280 285 Met Asn Ala Glu Met Cys Phe Ser Leu Lys Val Gln Asn Lys Lys Leu 290 295 300 Pro Pro Phe Leu Ala Glu Ile Trp Asp Ile Gln Glu 305 310 315 <210> 11 <211> 711 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic Chimeric RXR ligand binding domain <400> 11 gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60 actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120 accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180 atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240 aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300 ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360 tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagact 420 gaacttggct gcttgcgatc tgttattctt ttcaatccag aggtgagggg tttgaaatcc 480 gcccaggaag ttgaacttct acgtgaaaaa gtatatgccg ctttggaaga atatactaga 540 acaacacatc ccgatgaacc aggaagattt gcaaaacttt tgcttcgtct gccttcttta 600 cgttccatag gccttaagtg tttggagcat ttgtttttct ttcgccttat tggagatgtt 660 ccaattgata cgttcctgat ggagatgctt gaatcacctt ctgattcata a 711 <210> 12 <211> 720 <212> DNA <213> Homo sapiens <400> 12 gcccccgagg agatgcctgt ggacaggatc ctggaggcag agcttgctgt ggaacagaag 60 agtgaccagg gcgttgaggg tcctggggga accgggggta gcggcagcag cccaaatgac 120 cctgtgacta acatctgtca ggcagctgac aaacagctat tcacgcttgt tgagtgggcg 180 aagaggatcc cacacttttc ctccttgcct ctggatgatc aggtcatatt gctgcgggca 240 ggctggaatg aactcctcat tgcctccttt tcacaccgat ccattgatgt tcgagatggc 300 atcctccttg ccacaggtct tcacgtgcac cgcaactcag cccattcagc aggagtagga 360 gccatctttg atcgggtgct gacagagcta gtgtccaaaa tgcgtgacat gaggatggac 420 aagacagagc ttggctgcct gagggcaatc attctgttta atccagatgc caagggcctc 480 tccaacccta gtgaggtgga ggtcctgcgg gagaaagtgt atgcatcact ggagacctac 540 tgcaaacaga agtaccctga gcagcaggga cggtttgcca agctgctgct acgtcttcct 600 gccctccggt ccattggcct taagtgtcta gagcatctgt ttttcttcaa gctcattggt 660 gacaccccca tcgacacctt cctcatggag atgcttgagg ctccccatca actggcctga 720 720 <210> 13 <211> 635 <212> DNA <213> Locusta migratoria <400> 13 tgcatacaga catgcctgtt gaacgcatac ttgaagctga aaaacgagtg gagtgcaaag 60 cagaaaacca agtggaatat gagctggtgg agtgggctaa acacatcccg cacttcacat 120 ccctacctct ggaggaccag gttctcctcc tcagagcagg ttggaatgaa ctgctaattg 180 cagcattttc acatcgatct gtagatgtta aagatggcat agtacttgcc actggtctca 240 cagtgcatcg aaattctgcc catcaagctg gagtcggcac aatatttgac agagttttga 300 cagaactggt agcaaagatg agagaaatga aaatggataa aactgaactt ggctgcttgc 360 gatctgttat tcttttcaat ccagaggtga ggggtttgaa atccgcccag gaagttgaac 420 ttctacgtga aaaagtatat gccgctttgg aagaatatac tagaacaaca catcccgatg 480 aaccaggaag atttgcaaaa cttttgcttc gtctgccttc tttacgttcc ataggcctta 540 agtgtttgga gcatttgttt ttctttcgcc ttattggaga tgttccaatt gatacgttcc 600 tgatggagat gcttgaatca ccttctgatt cataa 635 <210> 14 <211> 236 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic Chimeric RXR ligand binding domain <400> 14 Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala 1 5 10 15 Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn 20 25 30 Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp 35 40 45 Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe 50 55 60 Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp 65 70 75 80 Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys 85 90 95 Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala 100 105 110 His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu 115 120 125 Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys 130 135 140 Leu Arg Ser Val Ile Leu Phe Asn Pro Glu Val Arg Gly Leu Lys Ser 145 150 155 160 Ala Gln Glu Val Glu Leu Leu Arg Glu Lys Val Tyr Ala Ala Leu Glu 165 170 175 Glu Tyr Thr Arg Thr Thr His Pro Asp Glu Pro Gly Arg Phe Ala Lys 180 185 190 Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser Ile Gly Leu Lys Cys Leu 195 200 205 Glu His Leu Phe Phe Phe Arg Leu Ile Gly Asp Val Pro Ile Asp Thr 210 215 220 Phe Leu Met Glu Met Leu Glu Ser Pro Ser Asp Ser 225 230 235 <210> 15 <211> 239 <212> PRT <213> Homo sapiens <400> 15 Ala Pro Glu Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala 1 5 10 15 Val Glu Gln Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Gly Thr Gly 20 25 30 Gly Ser Gly Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala 35 40 45 Ala Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro 50 55 60 His Phe Ser Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala 65 70 75 80 Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp 85 90 95 Val Arg Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn 100 105 110 Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr 115 120 125 Glu Leu Val Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu 130 135 140 Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn Pro Asp Ala Lys Gly Leu 145 150 155 160 Ser Asn Pro Ser Glu Val Glu Val Leu Arg Glu Lys Val Tyr Ala Ser 165 170 175 Leu Glu Thr Tyr Cys Lys Gln Lys Tyr Pro Glu Gln Gln Gly Arg Phe 180 185 190 Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys 195 200 205 Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile 210 215 220 Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Leu Ala 225 230 235 <210> 16 <211> 210 <212> PRT <213> Locusta migratoria <400> 16 His Thr Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Lys Arg Val 1 5 10 15 Glu Cys Lys Ala Glu Asn Gln Val Glu Tyr Glu Leu Val Glu Trp Ala 20 25 30 Lys His Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu 35 40 45 Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His 50 55 60 Arg Ser Val Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Leu Thr 65 70 75 80 Val His Arg Asn Ser Ala His Gln Ala Gly Val Gly Thr Ile Phe Asp 85 90 95 Arg Val Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp 100 105 110 Lys Thr Glu Leu Gly Cys Leu Arg Ser Val Ile Leu Phe Asn Pro Glu 115 120 125 Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg Glu Lys 130 135 140 Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asp Glu 145 150 155 160 Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser 165 170 175 Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu Ile Gly 180 185 190 Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ser 195 200 205 Asp Ser 210 <210> 17 <211> 240 <212> PRT <213> Choristoneura fumiferana <400> 17 Leu Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln 1 5 10 15 Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln 20 25 30 Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe 35 40 45 Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu 50 55 60 Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln 65 70 75 80 Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val 85 90 95 Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn 100 105 110 Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val 115 120 125 Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu 130 135 140 Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp 145 150 155 160 Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr 165 170 175 Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser 180 185 190 Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu 195 200 205 Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys 210 215 220 Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val 225 230 235 240 <210> 18 <211> 237 <212> PRT <213> Drosophila melanogaster <400> 18 Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr Lys Leu Ile Trp Tyr Gln 1 5 10 15 Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp Leu Arg Arg Ile Met Ser 20 25 30 Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp Val Ser Phe Arg His Ile 35 40 45 Thr Glu Ile Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys 50 55 60 Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln Glu Asp Gln Ile Thr Leu 65 70 75 80 Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Met Ala Arg Arg 85 90 95 Tyr Asp His Ser Ser Asp Ser Ile Phe Phe Ala Asn Asn Arg Ser Tyr 100 105 110 Thr Arg Asp Ser Tyr Lys Met Ala Gly Met Ala Asp Asn Ile Glu Asp 115 120 125 Leu Leu His Phe Cys Arg Gln Met Phe Ser Met Lys Val Asp Asn Val 130 135 140 Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile Phe Ser Asp Arg Pro Gly 145 150 155 160 Leu Glu Lys Ala Gln Leu Val Glu Ala Ile Gln Ser Tyr Tyr Ile Asp 165 170 175 Thr Leu Arg Ile Tyr Ile Leu Asn Arg His Cys Gly Asp Ser Met Ser 180 185 190 Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile Leu Thr Glu Leu Arg Thr 195 200 205 Leu Gly Asn Gln Asn Ala Glu Met Cys Phe Ser Leu Lys Leu Lys Asn 210 215 220 Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile Trp Asp Val 225 230 235 <210> 19 <211> 240 <212> PRT <213> Amblyomma americanum <400> 19 Pro Gly Val Lys Pro Leu Ser Ser Ser Gln Glu Asp Leu Ile Asn Lys 1 5 10 15 Leu Val Tyr Tyr Gln Gln Glu Phe Glu Ser Pro Ser Glu Glu Asp Met 20 25 30 Lys Lys Thr Thr Pro Phe Pro Leu Gly Asp Ser Glu Glu Asp Asn Gln 35 40 45 Arg Arg Phe Gln His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu 50 55 60 Ile Val Glu Phe Ser Lys Arg Val Pro Gly Phe Asp Thr Leu Ala Arg 65 70 75 80 Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met 85 90 95 Leu Arg Gly Ala Arg Lys Tyr Asp Val Lys Thr Asp Ser Ile Val Phe 100 105 110 Ala Asn Asn Gln Pro Tyr Thr Arg Asp Asn Tyr Arg Ser Ala Ser Val 115 120 125 Gly Asp Ser Ala Asp Ala Leu Phe Arg Phe Cys Arg Lys Met Cys Gln 130 135 140 Leu Arg Val Asp Asn Ala Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile 145 150 155 160 Phe Ser Glu Arg Pro Ser Leu Val Asp Pro His Lys Val Glu Arg Ile 165 170 175 Gln Glu Tyr Tyr Ile Glu Thr Leu Arg Met Tyr Ser Glu Asn His Arg 180 185 190 Pro Pro Gly Lys Asn Tyr Phe Ala Arg Leu Leu Ser Ile Leu Thr Glu 195 200 205 Leu Arg Thr Leu Gly Asn Met Asn Ala Glu Met Cys Phe Ser Leu Lys 210 215 220 Val Gln Asn Lys Lys Leu Pro Pro Phe Leu Ala Glu Ile Trp Asp Ile 225 230 235 240 <210> 20 <211> 1586 <212> DNA <213> Bamecia argentifoli <400> 20 gaattcgcgg ccgctcgcaa acttccgtac ctctcacccc ctcgccagga ccccccgcca 60 accagttcac cgtcatctcc tccaatggat actcatcccc catgtcttcg ggcagctacg 120 acccttatag tcccaccaat ggaagaatag ggaaagaaga gctttcgccg gcgaatagtc 180 tgaacgggta caacgtggat agctgcgatg cgtcgcggaa gaagaaggga ggaacgggtc 240 ggcagcagga ggagctgtgt ctcgtctgcg gggaccgcgc ctccggctac cactacaacg 300 ccctcacctg cgaaggctgc aagggcttct tccgtcggag catcaccaag aatgccgtct 360 accagtgtaa atatggaaat aattgtgaaa ttgacatgta catgaggcga aaatgccaag 420 agtgtcgtct caagaagtgt ctcagcgttg gcatgaggcc agaatgtgta gttcccgaat 480 tccagtgtgc tgtgaagcga aaagagaaaa aagcgcaaaa ggacaaagat aaacctaact 540 caacgacgag ttgttctcca gatggaatca aacaagagat agatcctcaa aggctggata 600 cagattcgca gctattgtct gtaaatggag ttaaacccat tactccagag caagaagagc 660 tcatccatag gctagtttat tttcaaaatg aatatgaaca tccatcccca gaggatatca 720 aaaggatagt taatgctgca ccagaagaag aaaatgtagc tgaagaaagg tttaggcata 780 ttacagaaat tacaattctc actgtacagt taattgtgga attttctaag cgattacctg 840 gttttgacaa actaattcgt gaagatcaaa tagctttatt aaaggcatgt agtagtgaag 900 taatgatgtt tagaatggca aggaggtatg atgctgaaac agattcgata ttgtttgcaa 960 ctaaccagcc gtatacgaga gaatcataca ctgtagctgg catgggtgat actgtggagg 1020 atctgctccg attttgtcga catatgtgtg ccatgaaagt cgataacgca gaatatgctc 1080 ttctcactgc cattgtaatt ttttcagaac gaccatctct aagtgaaggc tggaaggttg 1140 agaagattca agaaatttac atagaagcat taaaagcata tgttgaaaat cgaaggaaac 1200 catatgcaac aaccattttt gctaagttac tatctgtttt aactgaacta cgaacattag 1260 ggaatatgaa ttcagaaaca tgcttctcat tgaagctgaa gaatagaaag gtgccatcct 1320 tcctcgagga gatttgggat gttgtttcat aaacagtctt acctcaattc catgttactt 1380 ttcatatttg atttatctca gcaggtggct cagtacttat cctcacatta ctgagctcac 1440 ggtatgctca tacaattata acttgtaata tcatatcggt gatgacaaat ttgttacaat 1500 attctttgtt accttaacac aatgttgatc tcataatgat gtatgaattt ttctgttttt 1560 gcaaaaaaaa aagcggccgc gaattc 1586 <210> 21 <211> 1109 <212> DNA <213> Nephotetix cincticeps <400> 21 caggaggagc tctgcctgtt gtgcggagac cgagcgtcgg gataccacta caacgctctc 60 acctgcgaag gatgcaaggg cttctttcgg aggagtatca ccaaaaacgc agtgtaccag 120 tccaaatacg gcaccaattg tgaaatagac atgtatatgc ggcgcaagtg ccaggagtgc 180 cgactcaaga agtgcctcag tgtagggatg aggccagaat gtgtagtacc tgagtatcaa 240 tgtgccgtaa aaaggaaaga gaaaaaagct caaaaggaca aagataaacc tgtctcttca 300 accaatggct cgcctgaaat gagaatagac caggacaacc gttgtgtggt gttgcagagt 360 gaagacaaca ggtacaactc gagtacgccc agtttcggag tcaaacccct cagtccagaa 420 caagaggagc tcatccacag gctcgtctac ttccagaacg agtacgaaca ccctgccgag 480 gaggatctca agcggatcga gaacctcccc tgtgacgacg atgacccgtg tgatgttcgc 540 tacaaacaca ttacggagat cacaatactc acagtccagc tcatcgtgga gtttgcgaaa 600 aaactgcctg gtttcgacaa actactgaga gaggaccaga tcgtgttgct caaggcgtgt 660 tcgagcgagg tgatgatgct gcggatggcg cggaggtacg acgtccagac agactcgatc 720 ctgttcgcca acaaccagcc gtacacgcga gagtcgtaca cgatggcagg cgtgggggaa 780 gtcatcgaag atctgctgcg gttcggccga ctcatgtgct ccatgaaggt ggacaatgcc 840 gagtatgctc tgctcacggc catcgtcatc ttctccgagc ggccgaacct ggcggaagga 900 tggaaggttg agaagatcca ggagatctac ctggaggcgc tcaagtccta cgtggacaac 960 cgagtgaaac ctcgcagtcc gaccatcttc gccaaactgc tctccgttct caccgagctg 1020 cgaacactcg gcaaccagaa ctccgagatg tgcttctcgt taaactacgc aaccgcaaac 1080 atgccaccgt tcctcgaaga aatctggga 1109 <210> 22 <211> 735 <212> DNA <213> Choristoneura fumiferana <400> 22 taccaggacg ggtacgagca gccttctgat gaagatttga agaggattac gcagacgtgg 60 cagcaagcgg acgatgaaaa cgaagagtct gacactccct tccgccagat cacagagatg 120 actatcctca cggtccaact tatcgtggag ttcgcgaagg gattgccagg gttcgccaag 180 atctcgcagc ctgatcaaat tacgctgctt aaggcttgct caagtgaggt aatgatgctc 240 cgagtcgcgc gacgatacga tgcggcctca gacagtgttc tgttcgcgaa caaccaagcg 300 tacactcgcg acaactaccg caaggctggc atggcctacg tcatcgagga tctactgcac 360 ttctgccggt gcatgtactc tatggcgttg gacaacatcc attacgcgct gctcacggct 420 gtcgtcatct tttctgaccg gccagggttg gagcagccgc aactggtgga agaaatccag 480 cggtactacc tgaatacgct ccgcatctat atcctgaacc agctgagcgg gtcggcgcgt 540 tcgtccgtca tatacggcaa gatcctctca atcctctctg agctacgcac gctcggcatg 600 caaaactcca acatgtgcat ctccctcaag ctcaagaaca gaaagctgcc gcctttcctc 660 gaggagatct gggatgtggc ggacatgtcg cacacccaac cgccgcctat cctcgagtcc 720 cccacgaatc tctag 735 <210> 23 <211> 1338 <212> DNA <213> Drosophila melanogaster <400> 23 tatgagcagc catctgaaga ggatctcagg cgtataatga gtcaacccga tgagaacgag 60 agccaaacgg acgtcagctt tcggcatata accgagataa ccatactcac ggtccagttg 120 attgttgagt ttgctaaagg tctaccagcg tttacaaaga taccccagga ggaccagatc 180 acgttactaa aggcctgctc gtcggaggtg atgatgctgc gtatggcacg acgctatgac 240 cacagctcgg actcaatatt cttcgcgaat aatagatcat atacgcggga ttcttacaaa 300 atggccggaa tggctgataa cattgaagac ctgctgcatt tctgccgcca aatgttctcg 360 atgaaggtgg acaacgtcga atacgcgctt ctcactgcca ttgtgatctt ctcggaccgg 420 ccgggcctgg agaaggccca actagtcgaa gcgatccaga gctactacat cgacacgcta 480 cgcatttata tactcaaccg ccactgcggc gactcaatga gcctcgtctt ctacgcaaag 540 ctgctctcga tcctcaccga gctgcgtacg ctgggcaacc agaacgccga gatgtgtttc 600 tcactaaagc tcaaaaaccg caaactgccc aagttcctcg aggagatctg ggacgttcat 660 gccatcccgc catcggtcca gtcgcacctt cagattaccc aggaggagaa cgagcgtctc 720 gagcgggctg agcgtatgcg ggcatcggtt gggggcgcca ttaccgccgg cattgattgc 780 gactctgcct ccacttcggc ggcggcagcc gcggcccagc atcagcctca gcctcagccc 840 cagccccaac cctcctccct gacccagaac gattcccagc accagacaca gccgcagcta 900 caacctcagc taccacctca gctgcaaggt caactgcaac cccagctcca accacagctt 960 cagacgcaac tccagccaca gattcaacca cagccacagc tccttcccgt ctccgctccc 1020 gtgcccgcct ccgtaaccgc acctggttcc ttgtccgcgg tcagtacgag cagcgaatac 1080 atgggcggaa gtgcggccat aggacccatc acgccggcaa ccaccagcag tatcacggct 1140 gccgttaccg ctagctccac cacatcagcg gtaccgatgg gcaacggagt tggagtcggt 1200 gttggggtgg gcggcaacgt cagcatgtat gcgaacgccc agacggcgat ggccttgatg 1260 ggtgtagccc tgcattcgca ccaagagcag cttatcgggg gagtggcggt taagtcggag 1320 cactcgacga ctgcatag 1338 <210> 24 <211> 960 <212> DNA <213> Choristoneura fumiferana <400> 24 cctgagtgcg tagtacccga gactcagtgc gccatgaagc ggaaagagaa gaaagcacag 60 aaggagaagg acaaactgcc tgtcagcacg acgacggtgg acgaccacat gccgcccatt 120 atgcagtgtg aacctccacc tcctgaagca gcaaggattc acgaagtggt cccaaggttt 180 ctctccgaca agctgttgga gacaaaccgg cagaaaaaca tcccccagtt gacagccaac 240 cagcagttcc ttatcgccag gctcatctgg taccaggacg ggtacgagca gccttctgat 300 gaagatttga agaggattac gcagacgtgg cagcaagcgg acgatgaaaa cgaagagtct 360 gacactccct tccgccagat cacagagatg actatcctca cggtccaact tatcgtggag 420 ttcgcgaagg gattgccagg gttcgccaag atctcgcagc ctgatcaaat tacgctgctt 480 aaggcttgct caagtgaggt aatgatgctc cgagtcgcgc gacgatacga tgcggcctca 540 gacagtgttc tgttcgcgaa caaccaagcg tacactcgcg acaactaccg caaggctggc 600 atggcctacg tcatcgagga tctactgcac ttctgccggt gcatgtactc tatggcgttg 660 gacaacatcc attacgcgct gctcacggct gtcgtcatct tttctgaccg gccagggttg 720 gagcagccgc aactggtgga agaaatccag cggtactacc tgaatacgct ccgcatctat 780 atcctgaacc agctgagcgg gtcggcgcgt tcgtccgtca tatacggcaa gatcctctca 840 atcctctctg agctacgcac gctcggcatg caaaactcca acatgtgcat ctccctcaag 900 ctcaagaaca gaaagctgcc gcctttcctc gaggagatct gggatgtggc ggacatgtcg 960 960 <210> 25 <211> 969 <212> DNA <213> Drosophila melanogaster <400> 25 cggccggaat gcgtcgtccc ggagaaccaa tgtgcgatga agcggcgcga aaagaaggcc 60 cagaaggaga aggacaaaat gaccacttcg ccgagctctc agcatggcgg caatggcagc 120 ttggcctctg gtggcggcca agactttgtt aagaaggaga ttcttgacct tatgacatgc 180 gagccgcccc agcatgccac tattccgcta ctacctgatg aaatattggc caagtgtcaa 240 gcgcgcaata taccttcctt aacgtacaat cagttggccg ttatatacaa gttaatttgg 300 taccaggatg gctatgagca gccatctgaa gaggatctca ggcgtataat gagtcaaccc 360 gatgagaacg agagccaaac ggacgtcagc tttcggcata taaccgagat aaccatactc 420 acggtccagt tgattgttga gtttgctaaa ggtctaccag cgtttacaaa gataccccag 480 gaggaccaga tcacgttact aaaggcctgc tcgtcggagg tgatgatgct gcgtatggca 540 cgacgctatg accacagctc ggactcaata ttcttcgcga ataatagatc atatacgcgg 600 gattcttaca aaatggccgg aatggctgat aacattgaag acctgctgca tttctgccgc 660 caaatgttct cgatgaaggt ggacaacgtc gaatacgcgc ttctcactgc cattgtgatc 720 ttctcggacc ggccgggcct ggagaaggcc caactagtcg aagcgatcca gagctactac 780 atcgacacgc tacgcattta tatactcaac cgccactgcg gcgactcaat gagcctcgtc 840 ttctacgcaa agctgctctc gatcctcacc gagctgcgta cgctgggcaa ccagaacgcc 900 gagatgtgtt tctcactaaa gctcaaaaac cgcaaactgc ccaagttcct cgaggagatc 960 tgggacgtt 969 <210> 26 <211> 244 <212> PRT <213> Choristoneura fumiferana <400> 26 Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile 1 5 10 15 Thr Gln Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr 20 25 30 Pro Phe Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile 35 40 45 Val Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro 50 55 60 Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu 65 70 75 80 Arg Val Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala 85 90 95 Asn Asn Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala 100 105 110 Tyr Val Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met 115 120 125 Ala Leu Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe 130 135 140 Ser Asp Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln 145 150 155 160 Arg Tyr Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser 165 170 175 Gly Ser Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu 180 185 190 Ser Glu Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser 195 200 205 Leu Lys Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp 210 215 220 Asp Val Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser 225 230 235 240 Pro Thr Asn Leu <210> 27 <211> 445 <212> PRT <213> Drosophila melanogaster <400> 27 Tyr Glu Gln Pro Ser Glu Glu Asp Leu Arg Arg Ile Met Ser Gln Pro 1 5 10 15 Asp Glu Asn Glu Ser Gln Thr Asp Val Ser Phe Arg His Ile Thr Glu 20 25 30 Ile Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly Leu 35 40 45 Pro Ala Phe Thr Lys Ile Pro Gln Glu Asp Gln Ile Thr Leu Leu Lys 50 55 60 Ala Cys Ser Ser Glu Val Met Met Leu Arg Met Ala Arg Arg Tyr Asp 65 70 75 80 His Ser Ser Asp Ser Ile Phe Phe Ala Asn Asn Arg Ser Tyr Thr Arg 85 90 95 Asp Ser Tyr Lys Met Ala Gly Met Ala Asp Asn Ile Glu Asp Leu Leu 100 105 110 His Phe Cys Arg Gln Met Phe Ser Met Lys Val Asp Asn Val Glu Tyr 115 120 125 Ala Leu Leu Thr Ala Ile Val Ile Phe Ser Asp Arg Pro Gly Leu Glu 130 135 140 Lys Ala Gln Leu Val Glu Ala Ile Gln Ser Tyr Tyr Ile Asp Thr Leu 145 150 155 160 Arg Ile Tyr Ile Leu Asn Arg His Cys Gly Asp Ser Met Ser Leu Val 165 170 175 Phe Tyr Ala Lys Leu Leu Ser Ile Leu Thr Glu Leu Arg Thr Leu Gly 180 185 190 Asn Gln Asn Ala Glu Met Cys Phe Ser Leu Lys Leu Lys Asn Arg Lys 195 200 205 Leu Pro Lys Phe Leu Glu Glu Ile Trp Asp Val His Ala Ile Pro Pro 210 215 220 Ser Val Gln Ser His Leu Gln Ile Thr Gln Glu Glu Asn Glu Arg Leu 225 230 235 240 Glu Arg Ala Glu Arg Met Arg Ala Ser Val Gly Gly Ala Ile Thr Ala 245 250 255 Gly Ile Asp Cys Asp Ser Ala Ser Thr Ser Ala Ala Ala Ala Ala Ala 260 265 270 Gln His Gln Pro Gln Pro Gln Pro Gln Pro Gln Pro Ser Ser Leu Thr 275 280 285 Gln Asn Asp Ser Gln His Gln Thr Gln Pro Gln Leu Gln Pro Gln Leu 290 295 300 Pro Pro Gln Leu Gln Gly Gln Leu Gln Pro Gln Leu Gln Pro Gln Leu 305 310 315 320 Gln Thr Gln Leu Gln Pro Gln Ile Gln Pro Gln Pro Gln Leu Leu Pro 325 330 335 Val Ser Ala Pro Val Pro Ala Ser Val Thr Ala Pro Gly Ser Leu Ser 340 345 350 Ala Val Ser Thr Ser Ser Glu Tyr Met Gly Gly Ser Ala Ala Ile Gly 355 360 365 Pro Ile Thr Pro Ala Thr Thr Ser Ser Ile Thr Ala Ala Val Thr Ala 370 375 380 Ser Ser Thr Thr Ser Ala Val Pro Met Gly Asn Gly Val Gly Val Gly 385 390 395 400 Val Gly Val Gly Gly Asn Val Ser Met Tyr Ala Asn Ala Gln Thr Ala 405 410 415 Met Ala Leu Met Gly Val Ala Leu His Ser His Gln Glu Gln Leu Ile 420 425 430 Gly Gly Val Ala Val Lys Ser Glu His Ser Thr Thr Ala 435 440 445 <210> 28 <211> 320 <212> PRT <213> Choristoneura fumiferana <400> 28 Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys Glu 1 5 10 15 Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr Thr 20 25 30 Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro Pro 35 40 45 Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp Lys 50 55 60 Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala Asn 65 70 75 80 Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr Glu 85 90 95 Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln Gln 100 105 110 Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile Thr 115 120 125 Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly 130 135 140 Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu Leu 145 150 155 160 Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg Tyr 165 170 175 Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln Ala Tyr Thr 180 185 190 Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile Glu Asp Leu 195 200 205 Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile His 210 215 220 Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly Leu 225 230 235 240 Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn Thr 245 250 255 Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser Ser 260 265 270 Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu 275 280 285 Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn Arg 290 295 300 Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met Ser 305 310 315 320 <210> 29 <211> 323 <212> PRT <213> Drosophila melanogaster <400> 29 Arg Pro Glu Cys Val Val Pro Glu Asn Gln Cys Ala Met Lys Arg Arg 1 5 10 15 Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Met Thr Thr Ser Pro Ser 20 25 30 Ser Gln His Gly Gly Asn Gly Ser Leu Ala Ser Gly Gly Gly Gln Asp 35 40 45 Phe Val Lys Lys Glu Ile Leu Asp Leu Met Thr Cys Glu Pro Pro Gln 50 55 60 His Ala Thr Ile Pro Leu Leu Pro Asp Glu Ile Leu Ala Lys Cys Gln 65 70 75 80 Ala Arg Asn Ile Pro Ser Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr 85 90 95 Lys Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp 100 105 110 Leu Arg Arg Ile Met Ser Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp 115 120 125 Val Ser Phe Arg His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu 130 135 140 Ile Val Glu Phe Ala Lys Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln 145 150 155 160 Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met 165 170 175 Leu Arg Met Ala Arg Arg Tyr Asp His Ser Ser Asp Ser Ile Phe Phe 180 185 190 Ala Asn Asn Arg Ser Tyr Thr Arg Asp Ser Tyr Lys Met Ala Gly Met 195 200 205 Ala Asp Asn Ile Glu Asp Leu Leu His Phe Cys Arg Gln Met Phe Ser 210 215 220 Met Lys Val Asp Asn Val Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile 225 230 235 240 Phe Ser Asp Arg Pro Gly Leu Glu Lys Ala Gln Leu Val Glu Ala Ile 245 250 255 Gln Ser Tyr Tyr Ile Asp Thr Leu Arg Ile Tyr Ile Leu Asn Arg His 260 265 270 Cys Gly Asp Ser Met Ser Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile 275 280 285 Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ala Glu Met Cys Phe 290 295 300 Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile 305 310 315 320 Trp Asp Val <210> 30 <211> 987 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 30 tgtgctatct gtggggaccg ctcctcaggc aaacactatg gggtatacag ttgtgagggc 60 tgcaagggct tcttcaagag gacagtacgc aaagacctga cctacacctg ccgagacaac 120 aaggactgcc tgatcgacaa gagacagcgg aaccggtgtc agtactgccg ctaccagaag 180 tgcctggcca tgggcatgaa gcgggaagct gtgcaggagg agcggcagcg gggcaaggac 240 cggaatgaga acgaggtgga gtccaccagc agtgccaacg aggacatgcc tgtagagaag 300 attctggaag ccgagcttgc tgtcgagccc aagactgaga catacgtgga ggcaaacatg 360 gggctgaacc ccagctcacc aaatgaccct gttaccaaca tctgtcaagc agcagacaag 420 cagctcttca ctcttgtgga gtgggccaag aggatcccac acttttctga gctgccccta 480 gacgaccagg tcatcctgct acgggcaggc tggaacgagc tgctgatcgc ctccttctcc 540 caccgctcca tagctgtgaa agatgggatt ctcctggcca ccggcctgca cgtacaccgg 600 aacagcgctc acagtgctgg ggtgggcgcc atctttgaca gggtgctaac agagctggtg 660 tctaagatgc gtgacatgca gatggacaag acggagctgg gctgcctgcg agccattgtc 720 ctgttcaacc ctgactctaa ggggctctca aaccctgctg aggtggaggc gttgagggag 780 aaggtgtatg cgtcactaga agcgtactgc aaacacaagt accctgagca gccgggcagg 840 tttgccaagc tgctgctccg cctgcctgca ctgcgttcca tcgggctcaa gtgcctggag 900 cacctgttct tcttcaagct catcggggac acgcccatcg acaccttcct catggagatg 960 ctggaggcac cacatcaagc cacctag 987 <210> 31 <211> 789 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 31 aagcgggaag ctgtgcagga ggagcggcag cggggcaagg accggaatga gaacgaggtg 60 gagtccacca gcagtgccaa cgaggacatg cctgtagaga agattctgga agccgagctt 120 gctgtcgagc ccaagactga gacatacgtg gaggcaaaca tggggctgaa ccccagctca 180 ccaaatgacc ctgttaccaa catctgtcaa gcagcagaca agcagctctt cactcttgtg 240 gagtgggcca agaggatccc acacttttct gagctgcccc tagacgacca ggtcatcctg 300 ctacgggcag gctggaacga gctgctgatc gcctccttct cccaccgctc catagctgtg 360 aaagatggga ttctcctggc caccggcctg cacgtacacc ggaacagcgc tcacagtgct 420 ggggtgggcg ccatctttga cagggtgcta acagagctgg tgtctaagat gcgtgacatg 480 cagatggaca agacggagct gggctgcctg cgagccattg tcctgttcaa ccctgactct 540 aaggggctct caaaccctgc tgaggtggag gcgttgaggg agaaggtgta tgcgtcacta 600 gaagcgtact gcaaacacaa gtaccctgag cagccgggca ggtttgccaa gctgctgctc 660 cgcctgcctg cactgcgttc catcgggctc aagtgcctgg agcacctgtt cttcttcaag 720 ctcatcgggg acacgcccat cgacaccttc ctcatggaga tgctggaggc accacatcaa 780 gccacctag 789 <210> 32 <211> 714 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 32 gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60 actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120 accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180 atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240 aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300 ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360 tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg 420 gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac 480 cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa 540 cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg 600 cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg 660 cccatcgaca ccttcctcat ggagatgctg gaggcaccac atcaagccac ctag 714 <210> 33 <211> 536 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 33 ggatcccaca cttttctgag ctgcccctag acgaccaggt catcctgcta cgggcaggct 60 ggaacgagct gctgatcgcc tccttctccc accgctccat agctgtgaaa gatgggattc 120 tcctggccac cggcctgcac gtacaccgga acagcgctca cagtgctggg gtgggcgcca 180 tctttgacag ggtgctaaca gagctggtgt ctaagatgcg tgacatgcag atggacaaga 240 cggagctggg ctgcctgcga gccattgtcc tgttcaaccc tgactctaag gggctctcaa 300 accctgctga ggtggaggcg ttgagggaga aggtgtatgc gtcactagaa gcgtactgca 360 aacacaagta ccctgagcag ccgggcaggt ttgccaagct gctgctccgc ctgcctgcac 420 tgcgttccat cgggctcaag tgcctggagc acctgttctt cttcaagctc atcggggaca 480 cgcccatcga caccttcctc atggagatgc tggaggcacc acatcaagcc acctag 536 <210> 34 <211> 672 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 34 gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60 actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120 accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180 atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240 aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300 ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360 tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg 420 gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac 480 cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa 540 cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg 600 cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg 660 cccatcgaca cc 672 <210> 35 <211> 1123 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic Novel polynucleotide sequence <400> 35 tgcgccatct gcggggaccg ctcctcaggc aagcactatg gagtgtacag ctgcgagggg 60 tgcaagggct tcttcaagcg gacggtgcgc aaggacctga cctacacctg ccgcgacaac 120 aaggactgcc tgattgacaa gcggcagcgg aaccggtgcc agtactgccg ctaccagaag 180 tgcctggcca tgggcatgaa gcgggaagcc gtgcaggagg agcggcagcg tggcaaggac 240 cggaacgaga atgaggtgga gtcgaccagc agcgccaacg aggacatgcc ggtggagagg 300 atcctggagg ctgagctggc cgtggagccc aagaccgaga cctacgtgga ggcaaacatg 360 gggctgaacc ccagctcgcc gaacgaccct gtcaccaaca tttgccaagc agccgacaaa 420 cagcttttca ccctggtgga gtgggccaag cggatcccac acttctcaga gctgcccctg 480 gacgaccagg tcatcctgct gcgggcaggc tggaatgagc tgctcatcgc ctccttctcc 540 caccgctcca tcgccgtgaa ggacgggatc ctcctggcca ccgggctgca cgtccaccgg 600 aacagcgccc acagcgcagg ggtgggcgcc atctttgaca gggtgctgac ggagcttgtg 660 tccaagatgc gggacatgca gatggacaag acggagctgg gctgcctgcg cgccatcgtc 720 ctctttaacc ctgactccaa ggggctctcg aacccggccg aggtggaggc gctgagggag 780 aaggtctatg cgtccttgga ggcctactgc aagcacaagt acccagagca gccgggaagg 840 ttcgctaagc tcttgctccg cctgccggct ctgcgctcca tcgggctcaa atgcctggaa 900 catctcttct tcttcaagct catcggggac acacccattg acaccttcct tatggagatg 960 ctggaggcgc cgcaccaaat gacttaggcc tgcgggccca tcctttgtgc ccacccgttc 1020 tggccaccct gcctggacgc cagctgttct tctcagcctg agccctgtcc ctgcccttct 1080 ctgcctggcc tgtttggact ttggggcaca gcctgtcact gct 1123 <210> 36 <211> 925 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic Novel polynucleotide sequence <400> 36 aagcgggaag ccgtgcagga ggagcggcag cgtggcaagg accggaacga gaatgaggtg 60 gagtcgacca gcagcgccaa cgaggacatg ccggtggaga ggatcctgga ggctgagctg 120 gccgtggagc ccaagaccga gacctacgtg gaggcaaaca tggggctgaa ccccagctcg 180 ccgaacgacc ctgtcaccaa catttgccaa gcagccgaca aacagctttt caccctggtg 240 gagtgggcca agcggatccc acacttctca gagctgcccc tggacgacca ggtcatcctg 300 ctgcgggcag gctggaatga gctgctcatc gcctccttct cccaccgctc catcgccgtg 360 aaggacggga tcctcctggc caccgggctg cacgtccacc ggaacagcgc ccacagcgca 420 ggggtgggcg ccatctttga cagggtgctg acggagcttg tgtccaagat gcgggacatg 480 cagatggaca agacggagct gggctgcctg cgcgccatcg tcctctttaa ccctgactcc 540 aaggggctct cgaacccggc cgaggtggag gcgctgaggg agaaggtcta tgcgtccttg 600 gaggcctact gcaagcacaa gtacccagag cagccgggaa ggttcgctaa gctcttgctc 660 cgcctgccgg ctctgcgctc catcgggctc aaatgcctgg aacatctctt cttcttcaag 720 ctcatcgggg acacacccat tgacaccttc cttatggaga tgctggaggc gccgcaccaa 780 atgacttagg cctgcgggcc catcctttgt gcccacccgt tctggccacc ctgcctggac 840 gccagctgtt cttctcagcc tgagccctgt ccctgccctt ctctgcctgg cctgtttgga 900 ctttggggca cagcctgtca ctgct 925 <210> 37 <211> 850 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic Novel polynucleotide sequence <400> 37 gccaacgagg acatgccggt ggagaggatc ctggaggctg agctggccgt ggagcccaag 60 accgagacct acgtggaggc aaacatgggg ctgaacccca gctcgccgaa cgaccctgtc 120 accaacattt gccaagcagc cgacaaacag cttttcaccc tggtggagtg ggccaagcgg 180 atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 240 aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 300 ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 360 tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 420 gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 480 ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 540 cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 600 cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 660 cccattgaca ccttccttat ggagatgctg gaggcgccgc accaaatgac ttaggcctgc 720 gggcccatcc tttgtgccca cccgttctgg ccaccctgcc tggacgccag ctgttcttct 780 cagcctgagc cctgtccctg cccttctctg cctggcctgt ttggactttg gggcacagcc 840 tgtcactgct 850 <210> 38 <211> 670 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 38 atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 60 aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 120 ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 180 tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 240 gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 300 ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 360 cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 420 cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 480 cccattgaca ccttccttat ggagatgctg gaggcgccgc accaaatgac ttaggcctgc 540 gggcccatcc tttgtgccca cccgttctgg ccaccctgcc tggacgccag ctgttcttct 600 cagcctgagc cctgtccctg cccttctctg cctggcctgt ttggactttg gggcacagcc 660 tgtcactgct 670 <210> 39 <211> 672 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 39 gccaacgagg acatgccggt ggagaggatc ctggaggctg agctggccgt ggagcccaag 60 accgagacct acgtggaggc aaacatgggg ctgaacccca gctcgccgaa cgaccctgtc 120 accaacattt gccaagcagc cgacaaacag cttttcaccc tggtggagtg ggccaagcgg 180 atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 240 aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 300 ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 360 tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 420 gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 480 ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 540 cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 600 cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 660 cccattgaca cc 672 <210> 40 <211> 328 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 40 Cys Ala Ile Cys Gly Asp Arg Ser Ser Gly Lys His Tyr Gly Val Tyr 1 5 10 15 Ser Cys Glu Gly Cys Lys Gly Phe Phe Lys Arg Thr Val Arg Lys Asp 20 25 30 Leu Thr Tyr Thr Cys Arg Asp Asn Lys Asp Cys Leu Ile Asp Lys Arg 35 40 45 Gln Arg Asn Arg Cys Gln Tyr Cys Arg Tyr Gln Lys Cys Leu Ala Met 50 55 60 Gly Met Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp 65 70 75 80 Arg Asn Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met 85 90 95 Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr 100 105 110 Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn 115 120 125 Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr 130 135 140 Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu 145 150 155 160 Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile 165 170 175 Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu 180 185 190 Ala Thr Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val 195 200 205 Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg 210 215 220 Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val 225 230 235 240 Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu 245 250 255 Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His 260 265 270 Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu 275 280 285 Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe 290 295 300 Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met 305 310 315 320 Leu Glu Ala Pro His Gln Ala Thr 325 <210> 41 <211> 262 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 41 Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp Arg Asn 1 5 10 15 Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met Pro Val 20 25 30 Glu Lys Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr Glu Thr 35 40 45 Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn Asp Pro 50 55 60 Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val 65 70 75 80 Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp 85 90 95 Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser 100 105 110 Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr 115 120 125 Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala 130 135 140 Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met 145 150 155 160 Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe 165 170 175 Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu 180 185 190 Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr 195 200 205 Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala 210 215 220 Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys 225 230 235 240 Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu 245 250 255 Ala Pro His Gln Ala Thr 260 <210> 42 <211> 237 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 42 Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala 1 5 10 15 Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn 20 25 30 Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp 35 40 45 Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe 50 55 60 Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp 65 70 75 80 Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys 85 90 95 Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala 100 105 110 His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu 115 120 125 Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys 130 135 140 Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn 145 150 155 160 Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu 165 170 175 Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys 180 185 190 Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu 195 200 205 Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr 210 215 220 Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Ala Thr 225 230 235 <210> 43 <211> 177 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 43 Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu 1 5 10 15 Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser 20 25 30 Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His 35 40 45 Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val 50 55 60 Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr 65 70 75 80 Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys 85 90 95 Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr 100 105 110 Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly 115 120 125 Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly 130 135 140 Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr 145 150 155 160 Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Ala 165 170 175 Thr <210> 44 <211> 224 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 44 Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala 1 5 10 15 Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn 20 25 30 Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp 35 40 45 Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe 50 55 60 Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp 65 70 75 80 Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys 85 90 95 Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala 100 105 110 His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu 115 120 125 Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys 130 135 140 Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn 145 150 155 160 Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu 165 170 175 Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys 180 185 190 Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu 195 200 205 Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr 210 215 220 <210> 45 <211> 328 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 45 Cys Ala Ile Cys Gly Asp Arg Ser Ser Gly Lys His Tyr Gly Val Tyr 1 5 10 15 Ser Cys Glu Gly Cys Lys Gly Phe Phe Lys Arg Thr Val Arg Lys Asp 20 25 30 Leu Thr Tyr Thr Cys Arg Asp Asn Lys Asp Cys Leu Ile Asp Lys Arg 35 40 45 Gln Arg Asn Arg Cys Gln Tyr Cys Arg Tyr Gln Lys Cys Leu Ala Met 50 55 60 Gly Met Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp 65 70 75 80 Arg Asn Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met 85 90 95 Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr 100 105 110 Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn 115 120 125 Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr 130 135 140 Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu 145 150 155 160 Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile 165 170 175 Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu 180 185 190 Ala Thr Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val 195 200 205 Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg 210 215 220 Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val 225 230 235 240 Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu 245 250 255 Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His 260 265 270 Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu 275 280 285 Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe 290 295 300 Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met 305 310 315 320 Leu Glu Ala Pro His Gln Met Thr 325 <210> 46 <211> 262 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 46 Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp Arg Asn 1 5 10 15 Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met Pro Val 20 25 30 Glu Arg Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr Glu Thr 35 40 45 Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn Asp Pro 50 55 60 Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val 65 70 75 80 Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp 85 90 95 Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser 100 105 110 Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr 115 120 125 Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala 130 135 140 Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met 145 150 155 160 Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe 165 170 175 Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu 180 185 190 Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr 195 200 205 Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala 210 215 220 Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys 225 230 235 240 Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu 245 250 255 Ala Pro His Gln Met Thr 260 <210> 47 <211> 237 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 47 Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala 1 5 10 15 Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn 20 25 30 Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp 35 40 45 Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe 50 55 60 Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp 65 70 75 80 Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys 85 90 95 Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala 100 105 110 His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu 115 120 125 Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys 130 135 140 Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn 145 150 155 160 Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu 165 170 175 Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys 180 185 190 Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu 195 200 205 Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr 210 215 220 Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met Thr 225 230 235 <210> 48 <211> 177 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 48 Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu 1 5 10 15 Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser 20 25 30 Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His 35 40 45 Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val 50 55 60 Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr 65 70 75 80 Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys 85 90 95 Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr 100 105 110 Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly 115 120 125 Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly 130 135 140 Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr 145 150 155 160 Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met 165 170 175 Thr <210> 49 <211> 224 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 49 Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala 1 5 10 15 Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn 20 25 30 Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp 35 40 45 Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe 50 55 60 Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp 65 70 75 80 Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys 85 90 95 Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala 100 105 110 His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu 115 120 125 Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys 130 135 140 Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn 145 150 155 160 Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu 165 170 175 Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys 180 185 190 Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu 195 200 205 Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr 210 215 220 <210> 50 <211> 635 <212> DNA <213> Locusta migratoria <400> 50 tgcatacaga catgcctgtt gaacgcatac ttgaagctga aaaacgagtg gagtgcaaag 60 cagaaaacca agtggaatat gagctggtgg agtgggctaa acacatcccg cacttcacat 120 ccctacctct ggaggaccag gttctcctcc tcagagcagg ttggaatgaa ctgctaattg 180 cagcattttc acatcgatct gtagatgtta aagatggcat agtacttgcc actggtctca 240 cagtgcatcg aaattctgcc catcaagctg gagtcggcac aatatttgac agagttttga 300 cagaactggt agcaaagatg agagaaatga aaatggataa aactgaactt ggctgcttgc 360 gatctgttat tcttttcaat ccagaggtga ggggtttgaa atccgcccag gaagttgaac 420 ttctacgtga aaaagtatat gccgctttgg aagaatatac tagaacaaca catcccgatg 480 aaccaggaag atttgcaaaa cttttgcttc gtctgccttc tttacgttcc ataggcctta 540 agtgtttgga gcatttgttt ttctttcgcc ttattggaga tgttccaatt gatacgttcc 600 tgatggagat gcttgaatca ccttctgatt cataa 635 <210> 51 <211> 687 <212> DNA <213> Amblyomma americanum <400> 51 cctcctgaga tgcctctgga gcgcatactg gaggcagagc tgcgggttga gtcacagacg 60 gggaccctct cggaaagcgc acagcagcag gatccagtga gcagcatctg ccaagctgca 120 gaccgacagc tgcaccagct agttcaatgg gccaagcaca ttccacattt tgaagagctt 180 ccccttgagg accgcatggt gttgctcaag gctggctgga acgagctgct cattgctgct 240 ttctcccacc gttctgttga cgtgcgtgat ggcattgtgc tcgctacagg tcttgtggtg 300 cagcggcata gtgctcatgg ggctggcgtt ggggccatat ttgatagggt tctcactgaa 360 ctggtagcaa agatgcgtga gatgaagatg gaccgcactg agcttggatg cctgcttgct 420 gtggtacttt ttaatcctga ggccaagggg ctgcggacct gcccaagtgg aggccctgag 480 ggagaaagtg tatctgcctt ggaagagcac tgccggcagc agtacccaga ccagcctggg 540 cgctttgcca agctgctgct gcggttgcca gctctgcgca gtattggcct caagtgcctc 600 gaacatctct ttttcttcaa gctcatcggg gacacgccca tcgacaactt tcttctttcc 660 atgctggagg ccccctctga cccctaa 687 <210> 52 <211> 693 <212> DNA <213> Amblyomma americanum <400> 52 tctccggaca tgccactcga acgcattctc gaagccgaga tgcgcgtcga gcagccggca 60 ccgtccgttt tggcgcagac ggccgcatcg ggccgcgacc ccgtcaacag catgtgccag 120 gctgccccgc cacttcacga gctcgtacag tgggcccggc gaattccgca cttcgaagag 180 cttcccatcg aggatcgcac cgcgctgctc aaagccggct ggaacgaact gcttattgcc 240 gccttttcgc accgttctgt ggcggtgcgc gacggcatcg ttctggccac cgggctggtg 300 gtgcagcggc acagcgcaca cggcgcaggc gttggcgaca tcttcgaccg cgtactagcc 360 gagctggtgg ccaagatgcg cgacatgaag atggacaaaa cggagctcgg ctgcctgcgc 420 gccgtggtgc tcttcaatcc agacgccaag ggtctccgaa acgccaccag agtagaggcg 480 ctccgcgaga aggtgtatgc ggcgctggag gagcactgcc gtcggcacca cccggaccaa 540 ccgggtcgct tcggcaagct gctgctgcgg ctgcctgcct tgcgcagcat cgggctcaaa 600 tgcctcgagc atctgttctt cttcaagctc atcggagaca ctcccataga cagcttcctg 660 ctcaacatgc tggaggcacc ggcagacccc tag 693 <210> 53 <211> 801 <212> DNA <213> Celuca pugilator <400> 53 tcagacatgc caattgccag catacgggag gcagagctca gcgtggatcc catagatgag 60 cagccgctgg accaaggggt gaggcttcag gttccactcg cacctcctga tagtgaaaag 120 tgtagcttta ctttaccttt tcatcccgtc agtgaagtat cctgtgctaa ccctctgcag 180 gatgtggtga gcaacatatg ccaggcagct gacagacatc tggtgcagct ggtggagtgg 240 gccaagcaca tcccacactt cacagacctt cccatagagg accaagtggt attactcaaa 300 gccgggtgga acgagttgct tattgcctca ttctcacacc gtagcatggg cgtggaggat 360 ggcatcgtgc tggccacagg gctcgtgatc cacagaagta gtgctcacca ggctggagtg 420 ggtgccatat ttgatcgtgt cctctctgag ctggtggcca agatgaagga gatgaagatt 480 gacaagacag agctgggctg ccttcgctcc atcgtcctgt tcaacccaga tgccaaagga 540 ctaaactgcg tcaatgatgt ggagatcttg cgtgagaagg tgtatgctgc cctggaggag 600 tacacacgaa ccacttaccc tgatgaacct ggacgctttg ccaagttgct tctgcgactt 660 cctgcactca ggtctatagg cctgaagtgt cttgagtacc tcttcctgtt taagctgatt 720 ggagacactc ccctggacag ctacttgatg aagatgctcg tagacaaccc aaatacaagc 780 gtcactcccc ccaccagcta g 801 <210> 54 <211> 690 <212> DNA <213> Tenebrio molitor <400> 54 gccgagatgc ccctcgacag gataatcgag gcggagaaac ggatagaatg cacacccgct 60 ggtggctctg gtggtgtcgg agagcaacac gacggggtga acaacatctg tcaagccact 120 aacaagcagc tgttccaact ggtgcaatgg gctaagctca tacctcactt tacctcgttg 180 ccgatgtcgg accaggtgct tttattgagg gcaggatgga atgaattgct catcgccgca 240 ttctcgcaca gatctataca ggcgcaggat gccatcgttc tagccacggg gttgacagtt 300 aacaaaacgt cggcgcacgc cgtgggcgtg ggcaacatct acgaccgcgt cctctccgag 360 ctggtgaaca agatgaaaga gatgaagatg gacaagacgg agctgggctg cttgagagcc 420 atcatcctct acaaccccac gtgtcgcggc atcaagtccg tgcaggaagt ggagatgctg 480 cgtgagaaaa tttacggcgt gctggaagag tacaccagga ccacccaccc gaacgagccc 540 ggcaggttcg ccaaactgct tctgcgcctc ccggccctca ggtccatcgg gttgaaatgt 600 tccgaacacc tctttttctt caagctgatc ggtgatgttc caatagacac gttcctgatg 660 gagatgctgg agtctccggc ggacgcttag 690 <210> 55 <211> 681 <212> DNA <213> Apis mellifera <400> 55 cattcggaca tgccgatcga gcgtatcctg gaggccgaga agagagtcga atgtaagatg 60 gagcaacagg gaaattacga gaatgcagtg tcgcacattt gcaacgccac gaacaaacag 120 ctgttccagc tggtagcatg ggcgaaacac atcccgcatt ttacctcgtt gccactggag 180 gatcaggtac ttctgctcag ggccggttgg aacgagttgc tgatagcctc cttttcccac 240 cgttccatcg acgtgaagga cggtatcgtg ctggcgacgg ggatcaccgt gcatcggaac 300 tcggcgcagc aggccggcgt gggcacgata ttcgaccgtg tcctctcgga gcttgtctcg 360 aaaatgcgtg aaatgaagat ggacaggaca gagcttggct gtctcagatc tataatactc 420 ttcaatcccg aggttcgagg actgaaatcc atccaggaag tgaccctgct ccgtgagaag 480 atctacggcg ccctggaggg ttattgccgc gtagcttggc ccgacgacgc tggaagattc 540 gcgaaattac ttctacgcct gcccgccatc cgctcgatcg gattaaagtg cctcgagtac 600 ctgttcttct tcaaaatgat cggtgacgta ccgatcgacg attttctcgt ggagatgtta 660 gaatcgcgat cagatcctta g 681 <210> 56 <211> 210 <212> PRT <213> Locusta migratoria <400> 56 His Thr Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Lys Arg Val 1 5 10 15 Glu Cys Lys Ala Glu Asn Gln Val Glu Tyr Glu Leu Val Glu Trp Ala 20 25 30 Lys His Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu 35 40 45 Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His 50 55 60 Arg Ser Val Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Leu Thr 65 70 75 80 Val His Arg Asn Ser Ala His Gln Ala Gly Val Gly Thr Ile Phe Asp 85 90 95 Arg Val Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp 100 105 110 Lys Thr Glu Leu Gly Cys Leu Arg Ser Val Ile Leu Phe Asn Pro Glu 115 120 125 Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg Glu Lys 130 135 140 Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asp Glu 145 150 155 160 Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser 165 170 175 Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu Ile Gly 180 185 190 Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ser 195 200 205 Asp Ser 210 <210> 57 <211> 228 <212> PRT <213> Amblyomma americanum <400> 57 Pro Pro Glu Met Pro Leu Glu Arg Ile Leu Glu Ala Glu Leu Arg Val 1 5 10 15 Glu Ser Gln Thr Gly Thr Leu Ser Glu Ser Ala Gln Gln Gln Asp Pro 20 25 30 Val Ser Ser Ile Cys Gln Ala Ala Asp Arg Gln Leu His Gln Leu Val 35 40 45 Gln Trp Ala Lys His Ile Pro His Phe Glu Glu Leu Pro Leu Glu Asp 50 55 60 Arg Met Val Leu Leu Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala 65 70 75 80 Phe Ser His Arg Ser Val Asp Val Arg Asp Gly Ile Val Leu Ala Thr 85 90 95 Gly Leu Val Val Gln Arg His Ser Ala His Gly Ala Gly Val Gly Ala 100 105 110 Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met 115 120 125 Lys Met Asp Arg Thr Glu Leu Gly Cys Leu Leu Ala Val Val Leu Phe 130 135 140 Asn Pro Glu Ala Lys Gly Leu Arg Thr Cys Pro Ser Gly Gly Pro Glu 145 150 155 160 Gly Glu Ser Val Ser Ala Leu Glu Glu His Cys Arg Gln Gln Tyr Pro 165 170 175 Asp Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu 180 185 190 Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu 195 200 205 Ile Gly Asp Thr Pro Ile Asp Asn Phe Leu Leu Ser Met Leu Glu Ala 210 215 220 Pro Ser Asp Pro 225 <210> 58 <211> 230 <212> PRT <213> Amblyomma americanum <400> 58 Ser Pro Asp Met Pro Leu Glu Arg Ile Leu Glu Ala Glu Met Arg Val 1 5 10 15 Glu Gln Pro Ala Pro Ser Val Leu Ala Gln Thr Ala Ala Ser Gly Arg 20 25 30 Asp Pro Val Asn Ser Met Cys Gln Ala Ala Pro Pro Leu His Glu Leu 35 40 45 Val Gln Trp Ala Arg Arg Ile Pro His Phe Glu Glu Leu Pro Ile Glu 50 55 60 Asp Arg Thr Ala Leu Leu Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala 65 70 75 80 Ala Phe Ser His Arg Ser Val Ala Val Arg Asp Gly Ile Val Leu Ala 85 90 95 Thr Gly Leu Val Val Gln Arg His Ser Ala His Gly Ala Gly Val Gly 100 105 110 Asp Ile Phe Asp Arg Val Leu Ala Glu Leu Val Ala Lys Met Arg Asp 115 120 125 Met Lys Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Val Val Leu 130 135 140 Phe Asn Pro Asp Ala Lys Gly Leu Arg Asn Ala Thr Arg Val Glu Ala 145 150 155 160 Leu Arg Glu Lys Val Tyr Ala Ala Leu Glu Glu His Cys Arg Arg His 165 170 175 His Pro Asp Gln Pro Gly Arg Phe Gly Lys Leu Leu Leu Arg Leu Pro 180 185 190 Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe 195 200 205 Lys Leu Ile Gly Asp Thr Pro Ile Asp Ser Phe Leu Leu Asn Met Leu 210 215 220 Glu Ala Pro Ala Asp Pro 225 230 <210> 59 <211> 266 <212> PRT <213> Celuca pugilator <400> 59 Ser Asp Met Pro Ile Ala Ser Ile Arg Glu Ala Glu Leu Ser Val Asp 1 5 10 15 Pro Ile Asp Glu Gln Pro Leu Asp Gln Gly Val Arg Leu Gln Val Pro 20 25 30 Leu Ala Pro Pro Asp Ser Glu Lys Cys Ser Phe Thr Leu Pro Phe His 35 40 45 Pro Val Ser Glu Val Ser Cys Ala Asn Pro Leu Gln Asp Val Val Ser 50 55 60 Asn Ile Cys Gln Ala Ala Asp Arg His Leu Val Gln Leu Val Glu Trp 65 70 75 80 Ala Lys His Ile Pro His Phe Thr Asp Leu Pro Ile Glu Asp Gln Val 85 90 95 Val Leu Leu Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser 100 105 110 His Arg Ser Met Gly Val Glu Asp Gly Ile Val Leu Ala Thr Gly Leu 115 120 125 Val Ile His Arg Ser Ser Ala His Gln Ala Gly Val Gly Ala Ile Phe 130 135 140 Asp Arg Val Leu Ser Glu Leu Val Ala Lys Met Lys Glu Met Lys Ile 145 150 155 160 Asp Lys Thr Glu Leu Gly Cys Leu Arg Ser Ile Val Leu Phe Asn Pro 165 170 175 Asp Ala Lys Gly Leu Asn Cys Val Asn Asp Val Glu Ile Leu Arg Glu 180 185 190 Lys Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr Tyr Pro Asp 195 200 205 Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg 210 215 220 Ser Ile Gly Leu Lys Cys Leu Glu Tyr Leu Phe Leu Phe Lys Leu Ile 225 230 235 240 Gly Asp Thr Pro Leu Asp Ser Tyr Leu Met Lys Met Leu Val Asp Asn 245 250 255 Pro Asn Thr Ser Val Thr Pro Pro Thr Ser 260 265 <210> 60 <211> 229 <212> PRT <213> Tenebrio molitor <400> 60 Ala Glu Met Pro Leu Asp Arg Ile Ile Glu Ala Glu Lys Arg Ile Glu 1 5 10 15 Cys Thr Pro Ala Gly Gly Ser Gly Gly Val Gly Glu Gln His Asp Gly 20 25 30 Val Asn Asn Ile Cys Gln Ala Thr Asn Lys Gln Leu Phe Gln Leu Val 35 40 45 Gln Trp Ala Lys Leu Ile Pro His Phe Thr Ser Leu Pro Met Ser Asp 50 55 60 Gln Val Leu Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala 65 70 75 80 Phe Ser His Arg Ser Ile Gln Ala Gln Asp Ala Ile Val Leu Ala Thr 85 90 95 Gly Leu Thr Val Asn Lys Thr Ser Ala His Ala Val Gly Val Gly Asn 100 105 110 Ile Tyr Asp Arg Val Leu Ser Glu Leu Val Asn Lys Met Lys Glu Met 115 120 125 Lys Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Tyr 130 135 140 Asn Pro Thr Cys Arg Gly Ile Lys Ser Val Gln Glu Val Glu Met Leu 145 150 155 160 Arg Glu Lys Ile Tyr Gly Val Leu Glu Glu Tyr Thr Arg Thr Thr His 165 170 175 Pro Asn Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala 180 185 190 Leu Arg Ser Ile Gly Leu Lys Cys Ser Glu His Leu Phe Phe Phe Lys 195 200 205 Leu Ile Gly Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu 210 215 220 Ser Pro Ala Asp Ala 225 <210> 61 <211> 226 <212> PRT <213> Apis mellifera <400> 61 His Ser Asp Met Pro Ile Glu Arg Ile Leu Glu Ala Glu Lys Arg Val 1 5 10 15 Glu Cys Lys Met Glu Gln Gln Gly Asn Tyr Glu Asn Ala Val Ser His 20 25 30 Ile Cys Asn Ala Thr Asn Lys Gln Leu Phe Gln Leu Val Ala Trp Ala 35 40 45 Lys His Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu 50 55 60 Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His 65 70 75 80 Arg Ser Ile Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Ile Thr 85 90 95 Val His Arg Asn Ser Ala Gln Gln Ala Gly Val Gly Thr Ile Phe Asp 100 105 110 Arg Val Leu Ser Glu Leu Val Ser Lys Met Arg Glu Met Lys Met Asp 115 120 125 Arg Thr Glu Leu Gly Cys Leu Arg Ser Ile Ile Leu Phe Asn Pro Glu 130 135 140 Val Arg Gly Leu Lys Ser Ile Gln Glu Val Thr Leu Leu Arg Glu Lys 145 150 155 160 Ile Tyr Gly Ala Leu Glu Gly Tyr Cys Arg Val Ala Trp Pro Asp Asp 165 170 175 Ala Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Ile Arg Ser 180 185 190 Ile Gly Leu Lys Cys Leu Glu Tyr Leu Phe Phe Phe Lys Met Ile Gly 195 200 205 Asp Val Pro Ile Asp Asp Phe Leu Val Glu Met Leu Glu Ser Arg Ser 210 215 220 Asp Pro 225 <210> 62 <211> 714 <212> DNA <213> Mus musculus <400> 62 gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60 actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120 accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 180 atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg 240 aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300 ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc 360 tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg 420 gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac 480 cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa 540 cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg 600 cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg 660 cccatcgaca ccttcctcat ggagatgctg gaggcaccac atcaagccac ctag 714 <210> 63 <211> 720 <212> DNA <213> Mus musculus <400> 63 gcccctgagg agatgcctgt ggacaggatc ctggaggcag agcttgctgt ggagcagaag 60 agtgaccaag gcgttgaggg tcctggggcc accgggggtg gtggcagcag cccaaatgac 120 ccagtgacta acatctgcca ggcagctgac aaacagctgt tcacactcgt tgagtgggca 180 aagaggatcc cgcacttctc ctccctacct ctggacgatc aggtcatact gctgcgggca 240 ggctggaacg agctcctcat tgcgtccttc tcccatcggt ccattgatgt ccgagatggc 300 atcctcctgg ccacgggtct tcatgtgcac agaaactcag cccattccgc aggcgtggga 360 gccatctttg atcgggtgct gacagagcta gtgtccaaaa tgcgtgacat gaggatggac 420 aagacagagc ttggctgcct gcgggcaatc atcatgttta atccagacgc caagggcctc 480 tccaaccctg gagaggtgga gatccttcgg gagaaggtgt acgcctcact ggagacctat 540 tgcaagcaga agtaccctga gcagcagggc cggtttgcca agctgctgtt acgtcttcct 600 gccctccgct ccatcggcct caagtgtctg gagcacctgt tcttcttcaa gctcattggc 660 gacaccccca ttgacacctt cctcatggag atgcttgagg ctccccacca gctagcctga 720 720 <210> 64 <211> 705 <212> DNA <213> Mus musculus <400> 64 agccacgaag acatgcccgt ggagaggatt ctagaagccg aacttgctgt ggaaccaaag 60 acagaatcct acggtgacat gaacgtggag aactcaacaa atgaccctgt taccaacata 120 tgccatgctg cagataagca acttttcacc ctcgttgagt gggccaaacg catcccccac 180 ttctcagatc tcaccttgga ggaccaggtc attctactcc gggcagggtg gaatgaactg 240 ctcattgcct ccttctccca ccgctcggtt tccgtccagg atggcatcct gctggccacg 300 ggcctccacg tgcacaggag cagcgctcac agccggggag tcggctccat cttcgacaga 360 gtccttacag agttggtgtc caagatgaaa gacatgcaga tggataagtc agagctgggg 420 tgcctacggg ccatcgtgct gtttaaccca gatgccaagg gtttatccaa cccctctgag 480 gtggagactc ttcgagagaa ggtttatgcc accctggagg cctataccaa gcagaagtat 540 ccggaacagc caggcaggtt tgccaagctt ctgctgcgtc tccctgctct gcgctccatc 600 ggcttgaaat gcctggaaca cctcttcttc ttcaagctca ttggagacac tcccatcgac 660 agcttcctca tggagatgtt ggagacccca ctgcagatca cctga 705 <210> 65 <211> 850 <212> DNA <213> Homo sapiens <400> 65 gccaacgagg acatgccggt ggagaggatc ctggaggctg agctggccgt ggagcccaag 60 accgagacct acgtggaggc aaacatgggg ctgaacccca gctcgccgaa cgaccctgtc 120 accaacattt gccaagcagc cgacaaacag cttttcaccc tggtggagtg ggccaagcgg 180 atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg 240 aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc 300 ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc 360 tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg 420 gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac 480 ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag 540 cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg 600 cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca 660 cccattgaca ccttccttat ggagatgctg gaggcgccgc accaaatgac ttaggcctgc 720 gggcccatcc tttgtgccca cccgttctgg ccaccctgcc tggacgccag ctgttcttct 780 cagcctgagc cctgtccctg cccttctctg cctggcctgt ttggactttg gggcacagcc 840 tgtcactgct 850 <210> 66 <211> 720 <212> DNA <213> Homo sapiens <400> 66 gcccccgagg agatgcctgt ggacaggatc ctggaggcag agcttgctgt ggaacagaag 60 agtgaccagg gcgttgaggg tcctggggga accgggggta gcggcagcag cccaaatgac 120 cctgtgacta acatctgtca ggcagctgac aaacagctat tcacgcttgt tgagtgggcg 180 aagaggatcc cacacttttc ctccttgcct ctggatgatc aggtcatatt gctgcgggca 240 ggctggaatg aactcctcat tgcctccttt tcacaccgat ccattgatgt tcgagatggc 300 atcctccttg ccacaggtct tcacgtgcac cgcaactcag cccattcagc aggagtagga 360 gccatctttg atcgggtgct gacagagcta gtgtccaaaa tgcgtgacat gaggatggac 420 aagacagagc ttggctgcct gagggcaatc attctgttta atccagatgc caagggcctc 480 tccaacccta gtgaggtgga ggtcctgcgg gagaaagtgt atgcatcact ggagacctac 540 tgcaaacaga agtaccctga gcagcaggga cggtttgcca agctgctgct acgtcttcct 600 gccctccggt ccattggcct taagtgtcta gagcatctgt ttttcttcaa gctcattggt 660 gacaccccca tcgacacctt cctcatggag atgcttgagg ctccccatca actggcctga 720 720 <210> 67 <211> 705 <212> DNA <213> Homo sapiens <400> 67 ggtcatgaag acatgcctgt ggagaggatt ctagaagctg aacttgctgt tgaaccaaag 60 acagaatcct atggtgacat gaatatggag aactcgacaa atgaccctgt taccaacata 120 tgtcatgctg ctgacaagca gcttttcacc ctcgttgaat gggccaagcg tattccccac 180 ttctctgacc tcaccttgga ggaccaggtc attttgcttc gggcagggtg gaatgaattg 240 ctgattgcct ctttctccca ccgctcagtt tccgtgcagg atggcatcct tctggccacg 300 ggtttacatg tccaccggag cagtgcccac agtgctgggg tcggctccat ctttgacaga 360 gttctaactg agctggtttc caaaatgaaa gacatgcaga tggacaagtc ggaactggga 420 tgcctgcgag ccattgtact ctttaaccca gatgccaagg gcctgtccaa cccctctgag 480 gtggagactc tgcgagagaa ggtttatgcc acccttgagg cctacaccaa gcagaagtat 540 ccggaacagc caggcaggtt tgccaagctg ctgctgcgcc tcccagctct gcgttccatt 600 ggcttgaaat gcctggagca cctcttcttc ttcaagctca tcggggacac ccccattgac 660 accttcctca tggagatgtt ggagaccccg ctgcagatca cctga 705 <210> 68 <211> 237 <212> PRT <213> Mus musculus <400> 68 Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala 1 5 10 15 Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn 20 25 30 Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp 35 40 45 Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe 50 55 60 Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp 65 70 75 80 Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys 85 90 95 Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala 100 105 110 His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu 115 120 125 Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys 130 135 140 Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn 145 150 155 160 Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu 165 170 175 Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys 180 185 190 Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu 195 200 205 Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr 210 215 220 Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Ala Thr 225 230 235 <210> 69 <211> 239 <212> PRT <213> Mus musculus <400> 69 Ala Pro Glu Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala 1 5 10 15 Val Glu Gln Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Ala Thr Gly 20 25 30 Gly Gly Gly Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala 35 40 45 Ala Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro 50 55 60 His Phe Ser Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala 65 70 75 80 Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp 85 90 95 Val Arg Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn 100 105 110 Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr 115 120 125 Glu Leu Val Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu 130 135 140 Gly Cys Leu Arg Ala Ile Ile Met Phe Asn Pro Asp Ala Lys Gly Leu 145 150 155 160 Ser Asn Pro Gly Glu Val Glu Ile Leu Arg Glu Lys Val Tyr Ala Ser 165 170 175 Leu Glu Thr Tyr Cys Lys Gln Lys Tyr Pro Glu Gln Gln Gly Arg Phe 180 185 190 Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys 195 200 205 Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile 210 215 220 Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Leu Ala 225 230 235 <210> 70 <211> 234 <212> PRT <213> Mus musculus <400> 70 Ser His Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala 1 5 10 15 Val Glu Pro Lys Thr Glu Ser Tyr Gly Asp Met Asn Val Glu Asn Ser 20 25 30 Thr Asn Asp Pro Val Thr Asn Ile Cys His Ala Ala Asp Lys Gln Leu 35 40 45 Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Asp Leu 50 55 60 Thr Leu Glu Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu 65 70 75 80 Leu Ile Ala Ser Phe Ser His Arg Ser Val Ser Val Gln Asp Gly Ile 85 90 95 Leu Leu Ala Thr Gly Leu His Val His Arg Ser Ser Ala His Ser Arg 100 105 110 Gly Val Gly Ser Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys 115 120 125 Met Lys Asp Met Gln Met Asp Lys Ser Glu Leu Gly Cys Leu Arg Ala 130 135 140 Ile Val Leu Phe Asn Pro Asp Ala Lys Gly Leu Ser Asn Pro Ser Glu 145 150 155 160 Val Glu Thr Leu Arg Glu Lys Val Tyr Ala Thr Leu Glu Ala Tyr Thr 165 170 175 Lys Gln Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu 180 185 190 Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu 195 200 205 Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Ser Phe Leu Met 210 215 220 Glu Met Leu Glu Thr Pro Leu Gln Ile Thr 225 230 <210> 71 <211> 237 <212> PRT <213> Homo sapiens <400> 71 Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala 1 5 10 15 Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn 20 25 30 Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp 35 40 45 Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe 50 55 60 Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp 65 70 75 80 Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys 85 90 95 Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala 100 105 110 His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu 115 120 125 Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys 130 135 140 Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn 145 150 155 160 Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu 165 170 175 Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys 180 185 190 Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu 195 200 205 Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr 210 215 220 Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met Thr 225 230 235 <210> 72 <211> 239 <212> PRT <213> Homo sapiens <400> 72 Ala Pro Glu Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala 1 5 10 15 Val Glu Gln Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Gly Thr Gly 20 25 30 Gly Ser Gly Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala 35 40 45 Ala Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro 50 55 60 His Phe Ser Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala 65 70 75 80 Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp 85 90 95 Val Arg Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn 100 105 110 Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr 115 120 125 Glu Leu Val Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu 130 135 140 Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn Pro Asp Ala Lys Gly Leu 145 150 155 160 Ser Asn Pro Ser Glu Val Glu Val Leu Arg Glu Lys Val Tyr Ala Ser 165 170 175 Leu Glu Thr Tyr Cys Lys Gln Lys Tyr Pro Glu Gln Gln Gly Arg Phe 180 185 190 Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys 195 200 205 Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile 210 215 220 Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Leu Ala 225 230 235 <210> 73 <211> 234 <212> PRT <213> Homo sapiens <400> 73 Gly His Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala 1 5 10 15 Val Glu Pro Lys Thr Glu Ser Tyr Gly Asp Met Asn Met Glu Asn Ser 20 25 30 Thr Asn Asp Pro Val Thr Asn Ile Cys His Ala Ala Asp Lys Gln Leu 35 40 45 Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Asp Leu 50 55 60 Thr Leu Glu Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu 65 70 75 80 Leu Ile Ala Ser Phe Ser His Arg Ser Val Ser Val Gln Asp Gly Ile 85 90 95 Leu Leu Ala Thr Gly Leu His Val His Arg Ser Ser Ala His Ser Ala 100 105 110 Gly Val Gly Ser Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys 115 120 125 Met Lys Asp Met Gln Met Asp Lys Ser Glu Leu Gly Cys Leu Arg Ala 130 135 140 Ile Val Leu Phe Asn Pro Asp Ala Lys Gly Leu Ser Asn Pro Ser Glu 145 150 155 160 Val Glu Thr Leu Arg Glu Lys Val Tyr Ala Thr Leu Glu Ala Tyr Thr 165 170 175 Lys Gln Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu 180 185 190 Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu 195 200 205 Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met 210 215 220 Glu Met Leu Glu Thr Pro Leu Gln Ile Thr 225 230 <210> 74 <211> 516 <212> DNA <213> Locusta migratoria <400> 74 atccctacct ctggaggacc aggttctcct cctcagagca ggttggaatg aactgctaat 60 tgcagcattt tcacatcgat ctgtagatgt taaagatggc atagtacttg ccactggtct 120 cacagtgcat cgaaattctg cccatcaagc tggagtcggc acaatatttg acagagtttt 180 gacagaactg gtagcaaaga tgagagaaat gaaaatggat aaaactgaac ttggctgctt 240 gcgatctgtt attcttttca atccagaggt gaggggtttg aaatccgccc aggaagttga 300 acttctacgt gaaaaagtat atgccgcttt ggaagaatat actagaacaa cacatcccga 360 tgaaccagga agatttgcaa aacttttgct tcgtctgcct tctttacgtt ccataggcct 420 taagtgtttg gagcatttgt tttctttcgc cttattggag atgttccaat tgatacgttc 480 ctgatggaga tgcttgaatc accttctgat tcataa 516 <210> 75 <211> 528 <212> DNA <213> Amblyomma americanum <400> 75 attccacatt ttgaagagct tccccttgag gaccgcatgg tgttgctcaa ggctggctgg 60 aacgagctgc tcattgctgc tttctcccac cgttctgttg acgtgcgtga tggcattgtg 120 ctcgctacag gtcttgtggt gcagcggcat agtgctcatg gggctggcgt tggggccata 180 tttgataggg ttctcactga actggtagca aagatgcgtg agatgaagat ggaccgcact 240 gagcttggat gcctgcttgc tgtggtactt tttaatcctg aggccaaggg gctgcggacc 300 tgcccaagtg gaggccctga gggagaaagt gtatctgcct tggaagagca ctgccggcag 360 cagtacccag accagcctgg gcgctttgcc aagctgctgc tgcggttgcc agctctgcgc 420 agtattggcc tcaagtgcct cgaacatctc tttttcttca agctcatcgg ggacacgccc 480 atcgacaact ttcttctttc catgctggag gccccctctg acccctaa 528 <210> 76 <211> 531 <212> DNA <213> Amblyomma americanum <400> 76 attccgcact tcgaagagct tcccatcgag gatcgcaccg cgctgctcaa agccggctgg 60 aacgaactgc ttattgccgc cttttcgcac cgttctgtgg cggtgcgcga cggcatcgtt 120 ctggccaccg ggctggtggt gcagcggcac agcgcacacg gcgcaggcgt tggcgacatc 180 ttcgaccgcg tactagccga gctggtggcc aagatgcgcg acatgaagat ggacaaaacg 240 gagctcggct gcctgcgcgc cgtggtgctc ttcaatccag acgccaaggg tctccgaaac 300 gccaccagag tagaggcgct ccgcgagaag gtgtatgcgg cgctggagga gcactgccgt 360 cggcaccacc cggaccaacc gggtcgcttc ggcaagctgc tgctgcggct gcctgccttg 420 cgcagcatcg ggctcaaatg cctcgagcat ctgttcttct tcaagctcat cggagacact 480 cccatagaca gcttcctgct caacatgctg gaggcaccgg cagaccccta g 531 <210> 77 <211> 552 <212> DNA <213> Celuca pugilator <400> 77 atcccacact tcacagacct tcccatagag gaccaagtgg tattactcaa agccgggtgg 60 aacgagttgc ttattgcctc attctcacac cgtagcatgg gcgtggagga tggcatcgtg 120 ctggccacag ggctcgtgat ccacagaagt agtgctcacc aggctggagt gggtgccata 180 tttgatcgtg tcctctctga gctggtggcc aagatgaagg agatgaagat tgacaagaca 240 gagctgggct gccttcgctc catcgtcctg ttcaacccag atgccaaagg actaaactgc 300 gtcaatgatg tggagatctt gcgtgagaag gtgtatgctg ccctggagga gtacacacga 360 accacttacc ctgatgaacc tggacgcttt gccaagttgc ttctgcgact tcctgcactc 420 aggtctatag gcctgaagtg tcttgagtac ctcttcctgt ttaagctgat tggagacact 480 cccctggaca gctacttgat gaagatgctc gtagacaacc caaatacaag cgtcactccc 540 cccaccagct ag 552 <210> 78 <211> 531 <212> DNA <213> Tenebrio molitor <400> 78 atacctcact ttacctcgtt gccgatgtcg gaccaggtgc ttttattgag ggcaggatgg 60 aatgaattgc tcatcgccgc attctcgcac agatctatac aggcgcagga tgccatcgtt 120 ctagccacgg ggttgacagt taacaaaacg tcggcgcacg ccgtgggcgt gggcaacatc 180 tacgaccgcg tcctctccga gctggtgaac aagatgaaag agatgaagat ggacaagacg 240 gagctgggct gcttgagagc catcatcctc tacaacccca cgtgtcgcgg catcaagtcc 300 gtgcaggaag tggagatgct gcgtgagaaa atttacggcg tgctggaaga gtacaccagg 360 accacccacc cgaacgagcc cggcaggttc gccaaactgc ttctgcgcct cccggccctc 420 aggtccatcg ggttgaaatg ttccgaacac ctctttttct tcaagctgat cggtgatgtt 480 ccaatagaca cgttcctgat ggagatgctg gagtctccgg cggacgctta g 531 <210> 79 <211> 531 <212> DNA <213> Apis mellifera <400> 79 atcccgcatt ttacctcgtt gccactggag gatcaggtac ttctgctcag ggccggttgg 60 aacgagttgc tgatagcctc cttttcccac cgttccatcg acgtgaagga cggtatcgtg 120 ctggcgacgg ggatcaccgt gcatcggaac tcggcgcagc aggccggcgt gggcacgata 180 ttcgaccgtg tcctctcgga gcttgtctcg aaaatgcgtg aaatgaagat ggacaggaca 240 gagcttggct gtctcagatc tataatactc ttcaatcccg aggttcgagg actgaaatcc 300 atccaggaag tgaccctgct ccgtgagaag atctacggcg ccctggaggg ttattgccgc 360 gtagcttggc ccgacgacgc tggaagattc gcgaaattac ttctacgcct gcccgccatc 420 cgctcgatcg gattaaagtg cctcgagtac ctgttcttct tcaaaatgat cggtgacgta 480 ccgatcgacg attttctcgt ggagatgtta gaatcgcgat cagatcctta g 531 <210> 80 <211> 176 <212> PRT <213> Locusta migratoria <400> 80 Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu Leu Leu 1 5 10 15 Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser 20 25 30 Val Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Leu Thr Val His 35 40 45 Arg Asn Ser Ala His Gln Ala Gly Val Gly Thr Ile Phe Asp Arg Val 50 55 60 Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp Lys Thr 65 70 75 80 Glu Leu Gly Cys Leu Arg Ser Val Ile Leu Phe Asn Pro Glu Val Arg 85 90 95 Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg Glu Lys Val Tyr 100 105 110 Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asp Glu Pro Gly 115 120 125 Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser Ile Gly 130 135 140 Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu Ile Gly Asp Val 145 150 155 160 Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ser Asp Ser 165 170 175 <210> 81 <211> 175 <212> PRT <213> Amblyomma americanum <400> 81 Ile Pro His Phe Glu Glu Leu Pro Leu Glu Asp Arg Met Val Leu Leu 1 5 10 15 Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser 20 25 30 Val Asp Val Arg Asp Gly Ile Val Leu Ala Thr Gly Leu Val Val Gln 35 40 45 Arg His Ser Ala His Gly Ala Gly Val Gly Ala Ile Phe Asp Arg Val 50 55 60 Leu Thr Glu Leu Val Ala Lys Met Arg Glu Met Lys Met Asp Arg Thr 65 70 75 80 Glu Leu Gly Cys Leu Leu Ala Val Val Leu Phe Asn Pro Glu Ala Lys 85 90 95 Gly Leu Arg Thr Cys Pro Ser Gly Gly Pro Glu Gly Glu Ser Val Ser 100 105 110 Ala Leu Glu Glu His Cys Arg Gln Gln Tyr Pro Asp Gln Pro Gly Arg 115 120 125 Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu 130 135 140 Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro 145 150 155 160 Ile Asp Asn Phe Leu Leu Ser Met Leu Glu Ala Pro Ser Asp Pro 165 170 175 <210> 82 <211> 176 <212> PRT <213> Amblyomma americanum <400> 82 Ile Pro His Phe Glu Glu Leu Pro Ile Glu Asp Arg Thr Ala Leu Leu 1 5 10 15 Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser 20 25 30 Val Ala Val Arg Asp Gly Ile Val Leu Ala Thr Gly Leu Val Val Gln 35 40 45 Arg His Ser Ala His Gly Ala Gly Val Gly Asp Ile Phe Asp Arg Val 50 55 60 Leu Ala Glu Leu Val Ala Lys Met Arg Asp Met Lys Met Asp Lys Thr 65 70 75 80 Glu Leu Gly Cys Leu Arg Ala Val Val Leu Phe Asn Pro Asp Ala Lys 85 90 95 Gly Leu Arg Asn Ala Thr Arg Val Glu Ala Leu Arg Glu Lys Val Tyr 100 105 110 Ala Ala Leu Glu Glu His Cys Arg Arg His His Pro Asp Gln Pro Gly 115 120 125 Arg Phe Gly Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly 130 135 140 Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr 145 150 155 160 Pro Ile Asp Ser Phe Leu Leu Asn Met Leu Glu Ala Pro Ala Asp Pro 165 170 175 <210> 83 <211> 183 <212> PRT <213> Celuca pugilator <400> 83 Ile Pro His Phe Thr Asp Leu Pro Ile Glu Asp Gln Val Val Leu Leu 1 5 10 15 Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser 20 25 30 Met Gly Val Glu Asp Gly Ile Val Leu Ala Thr Gly Leu Val Ile His 35 40 45 Arg Ser Ser Ala His Gln Ala Gly Val Gly Ala Ile Phe Asp Arg Val 50 55 60 Leu Ser Glu Leu Val Ala Lys Met Lys Glu Met Lys Ile Asp Lys Thr 65 70 75 80 Glu Leu Gly Cys Leu Arg Ser Ile Val Leu Phe Asn Pro Asp Ala Lys 85 90 95 Gly Leu Asn Cys Val Asn Asp Val Glu Ile Leu Arg Glu Lys Val Tyr 100 105 110 Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr Tyr Pro Asp Glu Pro Gly 115 120 125 Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly 130 135 140 Leu Lys Cys Leu Glu Tyr Leu Phe Leu Phe Lys Leu Ile Gly Asp Thr 145 150 155 160 Pro Leu Asp Ser Tyr Leu Met Lys Met Leu Val Asp Asn Pro Asn Thr 165 170 175 Ser Val Thr Pro Pro Thr Ser 180 <210> 84 <211> 176 <212> PRT <213> Tenebrio molitor <400> 84 Ile Pro His Phe Thr Ser Leu Pro Met Ser Asp Gln Val Leu Leu Leu 1 5 10 15 Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser 20 25 30 Ile Gln Ala Gln Asp Ala Ile Val Leu Ala Thr Gly Leu Thr Val Asn 35 40 45 Lys Thr Ser Ala His Ala Val Gly Val Gly Asn Ile Tyr Asp Arg Val 50 55 60 Leu Ser Glu Leu Val Asn Lys Met Lys Glu Met Lys Met Asp Lys Thr 65 70 75 80 Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Tyr Asn Pro Thr Cys Arg 85 90 95 Gly Ile Lys Ser Val Gln Glu Val Glu Met Leu Arg Glu Lys Ile Tyr 100 105 110 Gly Val Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asn Glu Pro Gly 115 120 125 Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly 130 135 140 Leu Lys Cys Ser Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Val 145 150 155 160 Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ala Asp Ala 165 170 175 <210> 85 <211> 176 <212> PRT <213> Apis mellifera <400> 85 Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gln Val Leu Leu Leu 1 5 10 15 Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser 20 25 30 Ile Asp Val Lys Asp Gly Ile Val Leu Ala Thr Gly Ile Thr Val His 35 40 45 Arg Asn Ser Ala Gln Gln Ala Gly Val Gly Thr Ile Phe Asp Arg Val 50 55 60 Leu Ser Glu Leu Val Ser Lys Met Arg Glu Met Lys Met Asp Arg Thr 65 70 75 80 Glu Leu Gly Cys Leu Arg Ser Ile Ile Leu Phe Asn Pro Glu Val Arg 85 90 95 Gly Leu Lys Ser Ile Gln Glu Val Thr Leu Leu Arg Glu Lys Ile Tyr 100 105 110 Gly Ala Leu Glu Gly Tyr Cys Arg Val Ala Trp Pro Asp Asp Ala Gly 115 120 125 Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Ile Arg Ser Ile Gly 130 135 140 Leu Lys Cys Leu Glu Tyr Leu Phe Phe Phe Lys Met Ile Gly Asp Val 145 150 155 160 Pro Ile Asp Asp Phe Leu Val Glu Met Leu Glu Ser Arg Ser Asp Pro 165 170 175 <210> 86 <211> 259 <212> PRT <213> Choristoneura fumiferana <400> 86 Leu Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln 1 5 10 15 Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln 20 25 30 Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe 35 40 45 Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu 50 55 60 Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln 65 70 75 80 Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val 85 90 95 Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn 100 105 110 Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val 115 120 125 Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu 130 135 140 Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp 145 150 155 160 Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr 165 170 175 Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser 180 185 190 Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu 195 200 205 Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys 210 215 220 Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val 225 230 235 240 Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr 245 250 255 Asn Leu Gly <210> 87 <211> 674 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 87 Met Asp Tyr Lys Asp Asp Asp Asp Lys Glu Met Pro Val Asp Arg Ile 1 5 10 15 Leu Glu Ala Glu Leu Ala Val Glu Gln Lys Ser Asp Gln Gly Val Glu 20 25 30 Gly Pro Gly Gly Thr Gly Gly Ser Gly Ser Ser Pro Asn Asp Pro Val 35 40 45 Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val Glu 50 55 60 Trp Ala Lys Arg Ile Pro His Phe Ser Ser Leu Pro Leu Asp Asp Gln 65 70 75 80 Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe 85 90 95 Ser His Arg Ser Ile Asp Val Arg Asp Gly Ile Leu Leu Ala Thr Gly 100 105 110 Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile 115 120 125 Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Arg 130 135 140 Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn 145 150 155 160 Pro Glu Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg 165 170 175 Glu Lys Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro 180 185 190 Asp Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu 195 200 205 Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu 210 215 220 Ile Gly Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser 225 230 235 240 Pro Ser Asp Ser Gln Ile Ser Tyr Ala Ser Arg Gly Gly Gly Ser Ser 245 250 255 Gly Gly Gly Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro Ala Pro Phe 260 265 270 Tyr Pro Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His Lys Ala Met 275 280 285 Lys Arg Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr Asp Ala His 290 295 300 Ile Glu Val Asn Ile Thr Tyr Ala Glu Tyr Phe Glu Met Ser Val Arg 305 310 315 320 Leu Ala Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn His Arg Ile 325 330 335 Val Val Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro Val Leu Gly 340 345 350 Ala Leu Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp Ile Tyr Asn 355 360 365 Glu Arg Glu Leu Leu Asn Ser Met Asn Ile Ser Gln Pro Thr Val Val 370 375 380 Phe Val Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val Gln Lys Lys 385 390 395 400 Leu Pro Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys Thr Asp Tyr 405 410 415 Gln Gly Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His Leu Pro Pro 420 425 430 Gly Phe Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp Arg Asp Lys 435 440 445 Thr Ile Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly Leu Pro Lys 450 455 460 Gly Val Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe Ser His Ala 465 470 475 480 Arg Asp Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr Ala Ile Leu 485 490 495 Ser Val Val Pro Phe His His Gly Phe Gly Met Phe Thr Thr Leu Gly 500 505 510 Tyr Leu Ile Cys Gly Phe Arg Val Val Leu Met Tyr Arg Phe Glu Glu 515 520 525 Glu Leu Phe Leu Arg Ser Leu Gln Asp Tyr Lys Ile Gln Ser Ala Leu 530 535 540 Leu Val Pro Thr Leu Phe Ser Phe Phe Ala Lys Ser Thr Leu Ile Asp 545 550 555 560 Lys Tyr Asp Leu Ser Asn Leu His Glu Ile Ala Ser Gly Gly Ala Pro 565 570 575 Leu Ser Lys Glu Val Gly Glu Ala Val Ala Lys Arg Phe His Leu Pro 580 585 590 Gly Ile Arg Gln Gly Tyr Gly Leu Thr Glu Thr Thr Ser Ala Ile Leu 595 600 605 Ile Thr Pro Glu Gly Asp Asp Lys Pro Gly Ala Val Gly Lys Val Val 610 615 620 Pro Phe Phe Glu Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr Leu 625 630 635 640 Gly Val Asn Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile Met 645 650 655 Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp Lys 660 665 670 Asp Gly <210> 88 <211> 463 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 88 Gln Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His Pro Asn 1 5 10 15 Ile Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala Gly Glu 20 25 30 Leu Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met Thr Glu 35 40 45 Lys Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala Lys Lys 50 55 60 Leu Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly Leu Thr 65 70 75 80 Gly Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys Ala Lys 85 90 95 Lys Gly Gly Lys Ser Lys Leu Gly Gly Gly Ser Ser Gly Gly Gly Gln 100 105 110 Ile Ser Tyr Ala Ser Arg Gly Arg Pro Glu Cys Val Val Pro Glu Thr 115 120 125 Gln Cys Ala Met Lys Arg Lys Glu Lys Lys Ala Gln Lys Glu Lys Asp 130 135 140 Lys Leu Pro Val Ser Thr Thr Thr Val Asp Asp His Met Pro Pro Ile 145 150 155 160 Met Gln Cys Glu Pro Pro Pro Pro Glu Ala Ala Arg Ile His Glu Val 165 170 175 Val Pro Arg Phe Leu Ser Asp Lys Leu Leu Val Thr Asn Arg Gln Lys 180 185 190 Asn Ile Pro Gln Leu Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu 195 200 205 Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys 210 215 220 Arg Ile Thr Gln Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser 225 230 235 240 Asp Thr Pro Phe Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln 245 250 255 Leu Ile Val Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser 260 265 270 Gln Pro Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met 275 280 285 Met Leu Arg Val Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Ile Leu 290 295 300 Phe Ala Asn Asn Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly 305 310 315 320 Met Ala Glu Val Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr 325 330 335 Ser Met Ala Leu Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val 340 345 350 Ile Phe Ser Asp Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu 355 360 365 Ile Gln Arg Tyr Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln 370 375 380 Leu Ser Gly Ser Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser 385 390 395 400 Ile Leu Ser Glu Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys 405 410 415 Ile Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu 420 425 430 Ile Trp Asp Val Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu 435 440 445 Glu Ser Pro Thr Asn Leu Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 450 455 460 <210> 89 <211> 675 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 89 Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg 1 5 10 15 Ile Thr Gln Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp 20 25 30 Thr Pro Phe Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu 35 40 45 Ile Val Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln 50 55 60 Pro Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met 65 70 75 80 Leu Arg Val Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Ile Leu Phe 85 90 95 Ala Asn Asn Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met 100 105 110 Ala Glu Val Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser 115 120 125 Met Ala Leu Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile 130 135 140 Phe Ser Asp Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile 145 150 155 160 Gln Arg Tyr Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu 165 170 175 Ser Gly Ser Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile 180 185 190 Leu Ser Glu Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile 195 200 205 Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile 210 215 220 Trp Asp Val Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu 225 230 235 240 Ser Pro Thr Asn Leu Gln Ile Ser Tyr Ala Ser Arg Gly Gly Gly Ser 245 250 255 Ser Gly Gly Gly Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro Ala Pro 260 265 270 Phe Tyr Pro Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His Lys Ala 275 280 285 Met Lys Arg Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr Asp Ala 290 295 300 His Ile Glu Val Asn Ile Thr Tyr Ala Glu Tyr Phe Glu Met Ser Val 305 310 315 320 Arg Leu Ala Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn His Arg 325 330 335 Ile Val Val Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro Val Leu 340 345 350 Gly Ala Leu Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp Ile Tyr 355 360 365 Asn Glu Arg Glu Leu Leu Asn Ser Met Asn Ile Ser Gln Pro Thr Val 370 375 380 Val Phe Val Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val Gln Lys 385 390 395 400 Lys Leu Pro Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys Thr Asp 405 410 415 Tyr Gln Gly Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His Leu Pro 420 425 430 Pro Gly Phe Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp Arg Asp 435 440 445 Lys Thr Ile Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly Leu Pro 450 455 460 Lys Gly Val Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe Ser His 465 470 475 480 Ala Arg Asp Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr Ala Ile 485 490 495 Leu Ser Val Val Pro Phe His His Gly Phe Gly Met Phe Thr Thr Leu 500 505 510 Gly Tyr Leu Ile Cys Gly Phe Arg Val Val Leu Met Tyr Arg Phe Glu 515 520 525 Glu Glu Leu Phe Leu Arg Ser Leu Gln Asp Tyr Lys Ile Gln Ser Ala 530 535 540 Leu Leu Val Pro Thr Leu Phe Ser Phe Phe Ala Lys Ser Thr Leu Ile 545 550 555 560 Asp Lys Tyr Asp Leu Ser Asn Leu His Glu Ile Ala Ser Gly Gly Ala 565 570 575 Pro Leu Ser Lys Glu Val Gly Glu Ala Val Ala Lys Arg Phe His Leu 580 585 590 Pro Gly Ile Arg Gln Gly Tyr Gly Leu Thr Glu Thr Thr Ser Ala Ile 595 600 605 Leu Ile Thr Pro Glu Gly Asp Asp Lys Pro Gly Ala Val Gly Lys Val 610 615 620 Val Pro Phe Phe Glu Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr 625 630 635 640 Leu Gly Val Asn Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile 645 650 655 Met Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp 660 665 670 Lys Asp Gly 675 <210> 90 <211> 412 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 90 Met Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp 1 5 10 15 Lys Asp Gly Trp Leu His Ser Gly Asp Ile Ala Tyr Trp Asp Glu Asp 20 25 30 Glu His Phe Phe Ile Val Asp Arg Leu Lys Ser Leu Ile Lys Tyr Lys 35 40 45 Gly Tyr Gln Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His 50 55 60 Pro Asn Ile Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala 65 70 75 80 Gly Glu Leu Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met 85 90 95 Thr Glu Lys Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala 100 105 110 Lys Lys Leu Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly 115 120 125 Leu Thr Gly Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys 130 135 140 Ala Lys Lys Gly Gly Lys Ser Lys Leu Gly Gly Gly Ser Ser Gly Gly 145 150 155 160 Gly Gln Ile Ser Tyr Ala Ser Arg Gly Glu Met Pro Val Asp Arg Ile 165 170 175 Leu Glu Ala Glu Leu Ala Val Glu Gln Lys Ser Asp Gln Gly Val Glu 180 185 190 Gly Pro Gly Gly Thr Gly Gly Ser Gly Ser Ser Pro Asn Asp Pro Val 195 200 205 Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val Glu 210 215 220 Trp Ala Lys Arg Ile Pro His Phe Ser Ser Leu Pro Leu Asp Asp Gln 225 230 235 240 Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe 245 250 255 Ser His Arg Ser Ile Asp Val Arg Asp Gly Ile Leu Leu Ala Thr Gly 260 265 270 Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile 275 280 285 Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Arg 290 295 300 Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Phe Asn 305 310 315 320 Pro Glu Val Arg Gly Leu Lys Ser Ala Gln Glu Val Glu Leu Leu Arg 325 330 335 Glu Lys Val Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro 340 345 350 Asp Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu 355 360 365 Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu 370 375 380 Ile Gly Asp Val Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser 385 390 395 400 Pro Ser Asp Ser Asp Tyr Lys Asp Asp Asp Asp Lys 405 410 <210> 91 <211> 1189 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 91 Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gln Trp Tyr Glu Leu 1 5 10 15 Gln Gln Leu Asp Ser Lys Phe Leu Glu Gln Val His Gln Leu Tyr Asp 20 25 30 Asp Ser Phe Pro Met Glu Ile Arg Gln Tyr Leu Ala Gln Trp Leu Glu 35 40 45 Lys Gln Asp Trp Glu His Ala Ala Asn Asp Val Ser Phe Ala Thr Ile 50 55 60 Arg Phe His Asp Leu Leu Ser Gln Leu Asp Asp Gln Tyr Ser Arg Phe 65 70 75 80 Ser Leu Glu Asn Asn Phe Leu Leu Gln His Asn Ile Arg Lys Ser Lys 85 90 95 Arg Asn Leu Gln Asp Asn Phe Gln Glu Asp Pro Ile Gln Met Ser Met 100 105 110 Ile Ile Tyr Ser Cys Leu Lys Glu Glu Arg Lys Ile Leu Glu Asn Ala 115 120 125 Gln Arg Phe Asn Gln Ala Gln Ser Gly Asn Ile Gln Ser Thr Val Met 130 135 140 Leu Asp Lys Gln Lys Glu Leu Asp Ser Lys Val Arg Asn Val Lys Asp 145 150 155 160 Lys Val Met Cys Ile Glu His Glu Ile Lys Ser Leu Glu Asp Leu Gln 165 170 175 Asp Glu Tyr Asp Phe Lys Cys Lys Thr Leu Gln Asn Arg Glu His Glu 180 185 190 Thr Asn Gly Val Ala Lys Ser Asp Gln Lys Gln Glu Gln Leu Leu Leu 195 200 205 Lys Lys Met Tyr Leu Met Leu Asp Asn Lys Arg Lys Glu Val Val His 210 215 220 Lys Ile Ile Glu Leu Leu Asn Val Thr Glu Leu Thr Gln Asn Ala Leu 225 230 235 240 Ile Asn Asp Glu Leu Val Glu Trp Lys Arg Arg Gln Gln Ser Ala Cys 245 250 255 Ile Gly Gly Pro Pro Asn Ala Cys Leu Asp Gln Leu Gln Asn Trp Phe 260 265 270 Thr Ile Val Ala Glu Ser Leu Gln Gln Val Arg Gln Gln Leu Lys Lys 275 280 285 Leu Glu Glu Leu Glu Gln Lys Tyr Thr Tyr Glu His Asp Pro Ile Thr 290 295 300 Lys Asn Lys Gln Val Leu Trp Asp Arg Thr Phe Ser Leu Phe Gln Gln 305 310 315 320 Leu Ile Gln Ser Ser Phe Val Val Glu Arg Gln Pro Cys Met Pro Thr 325 330 335 His Pro Gln Arg Pro Leu Val Leu Lys Thr Gly Val Gln Phe Thr Val 340 345 350 Lys Leu Arg Leu Leu Val Lys Leu Gln Glu Leu Asn Tyr Asn Leu Lys 355 360 365 Val Lys Val Leu Phe Asp Lys Asp Val Asn Glu Arg Asn Thr Val Lys 370 375 380 Gly Phe Arg Lys Phe Asn Ile Leu Gly Thr His Thr Lys Val Met Asn 385 390 395 400 Met Glu Glu Ser Thr Asn Gly Ser Leu Ala Ala Glu Phe Arg His Leu 405 410 415 Gln Leu Lys Glu Gln Lys Asn Ala Gly Thr Arg Thr Asn Glu Gly Pro 420 425 430 Leu Ile Val Thr Glu Glu Leu His Ser Leu Ser Phe Glu Thr Gln Leu 435 440 445 Cys Gln Pro Gly Leu Val Ile Asp Leu Glu Thr Thr Ser Leu Pro Val 450 455 460 Val Val Ile Ser Asn Val Ser Gln Leu Pro Ser Gly Trp Ala Ser Ile 465 470 475 480 Leu Trp Tyr Asn Met Leu Val Ala Glu Pro Arg Asn Leu Ser Phe Phe 485 490 495 Leu Thr Pro Pro Cys Ala Arg Trp Ala Gln Leu Ser Glu Val Leu Ser 500 505 510 Trp Gln Phe Ser Ser Val Thr Lys Arg Gly Leu Asn Val Asp Gln Leu 515 520 525 Asn Met Leu Gly Glu Lys Leu Leu Gly Pro Asn Ala Ser Pro Asp Gly 530 535 540 Leu Ile Pro Trp Thr Arg Phe Cys Lys Glu Asn Ile Asn Asp Lys Asn 545 550 555 560 Phe Pro Phe Trp Leu Trp Ile Glu Ser Ile Leu Glu Leu Ile Lys Lys 565 570 575 His Leu Leu Pro Leu Trp Asn Asp Gly Cys Ile Met Gly Phe Ile Ser 580 585 590 Lys Glu Arg Glu Arg Ala Leu Leu Lys Asp Gln Gln Pro Gly Thr Phe 595 600 605 Leu Leu Arg Phe Ser Glu Ser Ser Arg Glu Gly Ala Ile Thr Phe Thr 610 615 620 Trp Val Glu Arg Ser Gln Asn Gly Gly Glu Pro Asp Phe His Ala Val 625 630 635 640 Glu Pro Tyr Thr Lys Lys Glu Leu Ser Ala Val Thr Phe Pro Asp Ile 645 650 655 Ile Arg Asn Tyr Lys Val Met Ala Ala Glu Asn Ile Pro Glu Asn Pro 660 665 670 Leu Lys Tyr Leu Tyr Pro Asn Ile Asp Lys Asp His Ala Phe Gly Lys 675 680 685 Tyr Tyr Ser Arg Pro Lys Glu Ala Pro Glu Pro Met Glu Leu Asp Gly 690 695 700 Pro Lys Gly Thr Gly Tyr Ile Lys Thr Glu Leu Ile Ser Val Ser Glu 705 710 715 720 Val His Pro Ser Arg Leu Gln Thr Thr Asp Asn Leu Leu Pro Met Ser 725 730 735 Pro Glu Glu Phe Asp Glu Val Ser Arg Ile Val Gly Ser Val Glu Phe 740 745 750 Asp Ser Met Met Asn Thr Val Gln Ile Ser Tyr Ala Ser Arg Gly Gly 755 760 765 Gly Ser Ser Gly Gly Gly Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro 770 775 780 Ala Pro Phe Tyr Pro Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His 785 790 795 800 Lys Ala Met Lys Arg Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr 805 810 815 Asp Ala His Ile Glu Val Asn Ile Thr Tyr Ala Glu Tyr Phe Glu Met 820 825 830 Ser Val Arg Leu Ala Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn 835 840 845 His Arg Ile Val Val Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro 850 855 860 Val Leu Gly Ala Leu Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp 865 870 875 880 Ile Tyr Asn Glu Arg Glu Leu Leu Asn Ser Met Asn Ile Ser Gln Pro 885 890 895 Thr Val Val Phe Val Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val 900 905 910 Gln Lys Lys Leu Pro Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys 915 920 925 Thr Asp Tyr Gln Gly Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His 930 935 940 Leu Pro Pro Gly Phe Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp 945 950 955 960 Arg Asp Lys Thr Ile Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly 965 970 975 Leu Pro Lys Gly Val Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe 980 985 990 Ser His Ala Arg Asp Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr 995 1000 1005 Ala Ile Leu Ser Val Val Pro Phe His His Gly Phe Gly Met Phe Thr 1010 1015 1020 Thr Leu Gly Tyr Leu Ile Cys Gly Phe Arg Val Val Leu Met Tyr Arg 1025 1030 1035 1040 Phe Glu Glu Glu Leu Phe Leu Arg Ser Leu Gln Asp Tyr Lys Ile Gln 1045 1050 1055 Ser Ala Leu Leu Val Pro Thr Leu Phe Ser Phe Phe Ala Lys Ser Thr 1060 1065 1070 Leu Ile Asp Lys Tyr Asp Leu Ser Asn Leu His Glu Ile Ala Ser Gly 1075 1080 1085 Gly Ala Pro Leu Ser Lys Glu Val Gly Glu Ala Val Ala Lys Arg Phe 1090 1095 1100 His Leu Pro Gly Ile Arg Gln Gly Tyr Gly Leu Thr Glu Thr Thr Ser 1105 1110 1115 1120 Ala Ile Leu Ile Thr Pro Glu Gly Asp Asp Lys Pro Gly Ala Val Gly 1125 1130 1135 Lys Val Val Pro Phe Phe Glu Ala Lys Val Val Asp Leu Asp Thr Gly 1140 1145 1150 Lys Thr Leu Gly Val Asn Gln Arg Gly Glu Leu Cys Val Arg Gly Pro 1155 1160 1165 Met Ile Met Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu 1170 1175 1180 Ile Asp Lys Asp Gly 1185 <210> 92 <211> 926 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 92 Met Ser Gly Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp 1 5 10 15 Lys Asp Gly Trp Leu His Ser Gly Asp Ile Ala Tyr Trp Asp Glu Asp 20 25 30 Glu His Phe Phe Ile Val Asp Arg Leu Lys Ser Leu Ile Lys Tyr Lys 35 40 45 Gly Tyr Gln Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His 50 55 60 Pro Asn Ile Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala 65 70 75 80 Gly Glu Leu Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met 85 90 95 Thr Glu Lys Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala 100 105 110 Lys Lys Leu Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly 115 120 125 Leu Thr Gly Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys 130 135 140 Ala Lys Lys Gly Gly Lys Ser Lys Leu Gly Gly Gly Ser Ser Gly Gly 145 150 155 160 Gly Gln Ile Ser Tyr Ala Ser Arg Gly Ser Gln Trp Tyr Glu Leu Gln 165 170 175 Gln Leu Asp Ser Lys Phe Leu Glu Gln Val His Gln Leu Tyr Asp Asp 180 185 190 Ser Phe Pro Met Glu Ile Arg Gln Tyr Leu Ala Gln Trp Leu Glu Lys 195 200 205 Gln Asp Trp Glu His Ala Ala Asn Asp Val Ser Phe Ala Thr Ile Arg 210 215 220 Phe His Asp Leu Leu Ser Gln Leu Asp Asp Gln Tyr Ser Arg Phe Ser 225 230 235 240 Leu Glu Asn Asn Phe Leu Leu Gln His Asn Ile Arg Lys Ser Lys Arg 245 250 255 Asn Leu Gln Asp Asn Phe Gln Glu Asp Pro Ile Gln Met Ser Met Ile 260 265 270 Ile Tyr Ser Cys Leu Lys Glu Glu Arg Lys Ile Leu Glu Asn Ala Gln 275 280 285 Arg Phe Asn Gln Ala Gln Ser Gly Asn Ile Gln Ser Thr Val Met Leu 290 295 300 Asp Lys Gln Lys Glu Leu Asp Ser Lys Val Arg Asn Val Lys Asp Lys 305 310 315 320 Val Met Cys Ile Glu His Glu Ile Lys Ser Leu Glu Asp Leu Gln Asp 325 330 335 Glu Tyr Asp Phe Lys Cys Lys Thr Leu Gln Asn Arg Glu His Glu Thr 340 345 350 Asn Gly Val Ala Lys Ser Asp Gln Lys Gln Glu Gln Leu Leu Leu Lys 355 360 365 Lys Met Tyr Leu Met Leu Asp Asn Lys Arg Lys Glu Val Val His Lys 370 375 380 Ile Ile Glu Leu Leu Asn Val Thr Glu Leu Thr Gln Asn Ala Leu Ile 385 390 395 400 Asn Asp Glu Leu Val Glu Trp Lys Arg Arg Gln Gln Ser Ala Cys Ile 405 410 415 Gly Gly Pro Pro Asn Ala Cys Leu Asp Gln Leu Gln Asn Trp Phe Thr 420 425 430 Ile Val Ala Glu Ser Leu Gln Gln Val Arg Gln Gln Leu Lys Lys Leu 435 440 445 Glu Glu Leu Glu Gln Lys Tyr Thr Tyr Glu His Asp Pro Ile Thr Lys 450 455 460 Asn Lys Gln Val Leu Trp Asp Arg Thr Phe Ser Leu Phe Gln Gln Leu 465 470 475 480 Ile Gln Ser Ser Phe Val Val Glu Arg Gln Pro Cys Met Pro Thr His 485 490 495 Pro Gln Arg Pro Leu Val Leu Lys Thr Gly Val Gln Phe Thr Val Lys 500 505 510 Leu Arg Leu Leu Val Lys Leu Gln Glu Leu Asn Tyr Asn Leu Lys Val 515 520 525 Lys Val Leu Phe Asp Lys Asp Val Asn Glu Arg Asn Thr Val Lys Gly 530 535 540 Phe Arg Lys Phe Asn Ile Leu Gly Thr His Thr Lys Val Met Asn Met 545 550 555 560 Glu Glu Ser Thr Asn Gly Ser Leu Ala Ala Glu Phe Arg His Leu Gln 565 570 575 Leu Lys Glu Gln Lys Asn Ala Gly Thr Arg Thr Asn Glu Gly Pro Leu 580 585 590 Ile Val Thr Glu Glu Leu His Ser Leu Ser Phe Glu Thr Gln Leu Cys 595 600 605 Gln Pro Gly Leu Val Ile Asp Leu Glu Thr Thr Ser Leu Pro Val Val 610 615 620 Val Ile Ser Asn Val Ser Gln Leu Pro Ser Gly Trp Ala Ser Ile Leu 625 630 635 640 Trp Tyr Asn Met Leu Val Ala Glu Pro Arg Asn Leu Ser Phe Phe Leu 645 650 655 Thr Pro Pro Cys Ala Arg Trp Ala Gln Leu Ser Glu Val Leu Ser Trp 660 665 670 Gln Phe Ser Ser Val Thr Lys Arg Gly Leu Asn Val Asp Gln Leu Asn 675 680 685 Met Leu Gly Glu Lys Leu Leu Gly Pro Asn Ala Ser Pro Asp Gly Leu 690 695 700 Ile Pro Trp Thr Arg Phe Cys Lys Glu Asn Ile Asn Asp Lys Asn Phe 705 710 715 720 Pro Phe Trp Leu Trp Ile Glu Ser Ile Leu Glu Leu Ile Lys Lys His 725 730 735 Leu Leu Pro Leu Trp Asn Asp Gly Cys Ile Met Gly Phe Ile Ser Lys 740 745 750 Glu Arg Glu Arg Ala Leu Leu Lys Asp Gln Gln Pro Gly Thr Phe Leu 755 760 765 Leu Arg Phe Ser Glu Ser Ser Arg Glu Gly Ala Ile Thr Phe Thr Trp 770 775 780 Val Glu Arg Ser Gln Asn Gly Gly Glu Pro Asp Phe His Ala Val Glu 785 790 795 800 Pro Tyr Thr Lys Lys Glu Leu Ser Ala Val Thr Phe Pro Asp Ile Ile 805 810 815 Arg Asn Tyr Lys Val Met Ala Ala Glu Asn Ile Pro Glu Asn Pro Leu 820 825 830 Lys Tyr Leu Tyr Pro Asn Ile Asp Lys Asp His Ala Phe Gly Lys Tyr 835 840 845 Tyr Ser Arg Pro Lys Glu Ala Pro Glu Pro Met Glu Leu Asp Gly Pro 850 855 860 Lys Gly Thr Gly Tyr Ile Lys Thr Glu Leu Ile Ser Val Ser Glu Val 865 870 875 880 His Pro Ser Arg Leu Gln Thr Thr Asp Asn Leu Leu Pro Met Ser Pro 885 890 895 Glu Glu Phe Asp Glu Val Ser Arg Ile Val Gly Ser Val Glu Phe Asp 900 905 910 Ser Met Met Asn Thr Val Asp Tyr Lys Asp Asp Asp Asp Lys 915 920 925 <210> 93 <211> 335 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 93 Arg Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys 1 5 10 15 Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr 20 25 30 Thr Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro 35 40 45 Pro Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp 50 55 60 Lys Leu Leu Val Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala 65 70 75 80 Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr 85 90 95 Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln 100 105 110 Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile 115 120 125 Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys 130 135 140 Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu 145 150 155 160 Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg 165 170 175 Tyr Asp Ala Ala Ser Asp Ser Ile Leu Phe Ala Asn Asn Gln Ala Tyr 180 185 190 Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Glu Val Ile Glu Asp 195 200 205 Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile 210 215 220 His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly 225 230 235 240 Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn 245 250 255 Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser 260 265 270 Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr 275 280 285 Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn 290 295 300 Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met 305 310 315 320 Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn Leu 325 330 335 <210> 94 <211> 235 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 94 Glu Met Pro Val Asp Arg Ile Leu Glu Ala Glu Leu Ala Val Glu Gln 1 5 10 15 Lys Ser Asp Gln Gly Val Glu Gly Pro Gly Gly Thr Gly Gly Ser Gly 20 25 30 Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp Lys 35 40 45 Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser 50 55 60 Ser Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn 65 70 75 80 Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Asp Val Arg Asp 85 90 95 Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala His 100 105 110 Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu Val 115 120 125 Ser Lys Met Arg Asp Met Arg Met Asp Lys Thr Glu Leu Gly Cys Leu 130 135 140 Arg Ala Ile Ile Leu Phe Asn Pro Glu Val Arg Gly Leu Lys Ser Ala 145 150 155 160 Gln Glu Val Glu Leu Leu Arg Glu Lys Val Tyr Ala Ala Leu Glu Glu 165 170 175 Tyr Thr Arg Thr Thr His Pro Asp Glu Pro Gly Arg Phe Ala Lys Leu 180 185 190 Leu Leu Arg Leu Pro Ser Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu 195 200 205 His Leu Phe Phe Phe Arg Leu Ile Gly Asp Val Pro Ile Asp Thr Phe 210 215 220 Leu Met Glu Met Leu Glu Ser Pro Ser Asp Ser 225 230 235

Claims (41)

  1. 핵 수용체 단백질의 절편이나 도메인을 포함한 제 1 비-자연발생 폴리펩티드 및 핵 수용체 단백질의 또 다른 절편이나 도메인을 포함한 제 2 비-자연발생 폴리펩티드를 포함하는 2개의 폴리펩티드로서,
    상기 제 1폴리펩티드는 활성화 리간드를 결합시키며, 상기 제 2폴리펩티드는 활성화 리간드의 존재시에 제 1폴리펩티드와 조합되고, 상기 제 1 및 제 2폴리펩티드 각각은 이종유래 아미노산이나 폴리펩티드 서열을 포함하여, 상기 제 1 및 제 2폴리펩티드의 활성화 리간드 유도된 조합이 기능적, 생물학적 또는 세포 신호전달 조건을 형성하는 제 1 및 제 2폴리펩티드.
  2. 제 1항에 있어서,
    하나 또는 양쪽 핵 수용체 단백질 절편이나 도메인이 절지동물 핵 수용체 아미노산 서열을 포함하는 제 1 및 제 2폴리펩티드.
  3. 제 1항 또는 제 2항에 있어서,
    하나 또는 양쪽 핵 수용체 단백질 절편이나 도메인이 H그룹 핵 수용체 아미노산 서열을 포함하는 제 1 및 제 2폴리펩티드.
  4. 제 1항 내지 제 3항 중 어느 한 항에 있어서,
    제 1 폴리펩티드의 핵 수용체 아미노산 서열은 엑디손 수용체(EcR) 리간드 결합 도메인, 폴리펩티드 절편 또는 그의 치환 돌연변이체를 포함하는 제 1 및 제 2폴리펩티드.
  5. 제 1항 내지 제 4항 중 어느 한 항에 있어서,
    제 2폴리펩티드 핵 수용체 단백질 절편이나 도메인은 포유동물 핵 수용체 아미노산 서열을 포함하는 제 1 및 제 2폴리펩티드.
  6. 제 5항에 있어서,
    포유동물 핵 수용체 단백질 절편이나 도메인은 RXR 핵 수용체 폴리펩티드 절편이나 그의 치환 돌연변이체를 포함하는 제 1 및 제 2폴리펩티드.
  7. 제 1항 내지 제 6항 중 어느 한 항에 있어서,
    제 2폴리펩티드 핵 수용체 단백질 절편이나 도메인은 무척추동물 및 포유동물 핵 수용체 아미노산 서열의 키메라 또는 그의 치환 돌연변이체를 포함하는 제 1 및 제 2폴리펩티드.
  8. 제 7항에 있어서,
    상기 제 2 폴리펩티드 핵 수용체 단백질 절편이나 도메인은 무척추동물 USP(RXR 동종체) 및 포유동물 RXR 핵 수용체 아미노산 서열의 키메라 또는 그의 치환 돌연변이체를 포함하는 제 1 및 제 2폴리펩티드.
  9. 리간드 유도성 폴리펩티드 결합(LIPC) 시스템으로서,
    a) 절지동물 핵 수용체 단백질의 절편이나 도메인을 포함한 제 1비-자연발생 폴리펩티드; 및
    b) 절지동물 및/또는 포유동물 핵 수용체 단백질의 절편이나 도메인을 포함한 제 2비-자연발생 폴리펩티드를 포함하고,
    제 1 및 제 2폴리펩티드는 활성화 리간드와 접촉하여 활성화된 기능적, 생물학적 또는 세포 신호전달 조건을 형성하는 추가의 이종유래 서열을 포함하는 LIPC 시스템.
  10. 제 9항에 있어서,
    하나 또는 양쪽의 핵 수용체 단백질 절편이나 도메인은 H 그룹 핵 수용체 아미노산 서열을 포함하는 LIPC 시스템.
  11. 제 9항 또는 제 10항에 있어서,
    제 1폴리펩티드는 엑디손 수용체(EcR) 리간드 결합 도메인, 폴리펩티드 절편 또는 그의 치환 돌연변이체를 포함하는 LIPC 시스템.
  12. 제 9항 내지 제 11항 중 어느 한 항에 있어서,
    제 2폴리펩티드는 포유동물 핵 수용체 아미노산 서열을 포함하는 LIPC 시스템.
  13. 제 12항에 있어서,
    상기 제 2 폴리펩티드는 RXR 핵 수용체 폴리펩티드 절편 또는 그의 치환 돌연변이체를 포함하는 LIPC 시스템.
  14. 제 9항 내지 제 13항 중 어느 한 항에 있어서,
    상기 제 2폴리펩티드는 무척추동물 및 포유동물 핵 수용체 아미노산 서열의 키메라 또는 그의 치환 돌연변이체를 포함하는 LIPC 시스템.
  15. 제 14항에 있어서,
    상기 제 2폴리펩티드는 무척추동물 USP(RXR 동종체) 및 포유동물 RXR 핵 수용체 아미노산 서열의 키메라 또는 그의 치환 돌연변이체를 포함하는 LIPC 시스템.
  16. 제 1항 내지 제 8항 중 어느 한 항에 따른 제 1 및 제 2폴리펩티드,
    또는 제 9항 내지 제 15항 중 어느 한 항에 따른 LIPC 시스템에 있어서,
    상기 핵 수용체 단백질 절편의 하나 이상은, 가문비나무 모충 (Choristoneura fumiferana) EcR ("CfEcR") LBD, 딱정벌레 (Tenebrio molitor) EcR ("TmEcR") LBD, 박각시나방 (Manduca sexta) EcR ("MsEcR") LBD, 담배나방 (Heliothies virescens) EcR ("HvEcR") LBD, 깔따구 (Chironomus tentans) EcR ("CfEcR") LBD, 누에나방 (Bombyx mori) EcR ("BmEcR") LBD, 초파리 (Drosophila melanogaster) EcR ("DmEcR") LBD, 모기 (Aedes aegypti) EcR ("AaEcR") LBD, 검정파리 (Lucilia capitata) EcR ("LcEcR") LBD, 검정파리 (Lucilia cuprina) EcR ("LucEcR") LBD, 지중해 초파리 (Ceratitis capitata) EcR ("CcEcR") LBD, 메뚜기 (Locusta migratoria) EcR ("LmEcR") LBD, 진딧물 (Myzus persicae) EcR ("MpEcR") LBD, 농게 (Celuca pugilator) EcR ("CpEcR") LBD, 가루이 (Bamecia argentifoli) EcR (BaEcR) LBD, 매미충 (Nephotetix cincticeps) EcR (NcEcR) LBD, 및 참진드기 (Amblyomma americanum) EcR ("AmaEcR") LBD로 이루어진 군에서 선택된 엑디손 수용체 폴리펩티드로부터 유래되는 제 1 및 제 2폴리펩티드 또는 LIPC 시스템.
  17. 제 1항 내지 제 8항 중 어느 한 항에 따른 제 1 및 제 2폴리펩티드,
    또는 제 9항 내지 제 15항 중 어느 한 항에 따른 LIPC 시스템에 있어서,
    상기 핵 수용체 단백질 절편 중 하나 이상은, 핵산 서열 SEQ ID NO: 1(CfEcR-DEF), SEQ ID NO: 2(CfEcR-CDEF), SEQ ID NO: 3(DmEcR-DEF), SEQ ID NO: 4(TmEcR-DEF) SEQ ID NO: 5(AmaEcR-DEF)를 포함하는 폴리뉴클레오티드, 또는 실질적으로 그와 동일한 기능성 변이체를 코딩하는 폴리뉴클레오티드에 의해 코딩되는 엑디손 수용체 폴리펩티드로부터 유래되는 제 1 및 제 2폴리펩티드 또는 LIPC 시스템.
  18. 제 16항 또는 제 17항에 있어서,
    엑디손 수용체 폴리펩티드 중 하나 이상은 폴리펩티드 서열 SEQ ID NO: 6(CfEcR-DEF), SEQ ID NO: 7(DmEcR-DEF), SEQ ID NO: 8(CfEcR-CDEF), SEQ ID NO: 9(TmEcR-DEF), SEQ ID NO: 10(AmaEcR-DEF) 또는 실질적으로 그와 동일한 폴리펩티드 서열을 포함하는 제 1 및 제 2폴리펩티드 또는 LIPC 시스템.
  19. 제 16항 내지 제 18항 중 어느 한 항에 있어서,
    상기 엑디손 수용체 폴리펩티드 서열은 약 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 상응하는 야생형 엑디손 수용체 폴리펩티드에 대한 치환 돌연변이를 포함하는 제 1 및 제 2폴리펩티드 또는 LIPC 시스템.
  20. 제 16항 내지 제 19항 중 어느 한 항에 있어서,
    상기 엑디손 수용체 폴리펩티드는 아미노산 잔사가 치환되는 결과를 가져오는 코돈 돌연변이를 포함한 폴리뉴클레오티드에 의해 코딩되고, 이때의 아미노산 잔사는 a) SEQ ID NO: 17의 아미노산 잔사 20, 21, 48, 51, 52, 55, 58, 59, 61, 62, 92, 93, 95, 96, 107, 109, 110, 120, 123, 125, 175, 218, 219, 223, 230, 234 또는 238, b) SEQ ID NO: 17의 아미노산 잔사 95 및 110, c) SEQ ID NO: 17의 아미노산 잔사 218 및 219, d) SEQ ID NO: 17의 아미노산 잔사 107 및 175, e) SEQ ID NO: 17의 아미노산 잔사 127 및 175, f) SEQ ID NO: 17의 아미노산 잔사 107 및 127, g) SEQ ID NO: 17의 아미노산 잔사 107, 127 및 175, h) SEQ ID NO: 17의 아미노산 잔사 52, 107 및 175, i) SEQ ID NO: l7의 아미노산 잔사 96, 107 및 175, j) SEQ ID NO: l7의 아미노산 잔사 107, 110 및 175, k) SEQ ID NO: 18의 아미노산 잔사 107, 121, 213 또는 217, 또는 l) SEQ ID NO: 19의 아미노산 잔사 91 또는 105와 동등하거나 유사한 위치에 있는 제 1 및 제 2폴리펩티드 또는 LIPC 시스템.
  21. 제 16항 내지 제 20항 중 어느 한 항에 있어서,
    상기 치환 돌연변이는 a) SEQ ID NO: 17의 E20A, Q21A, F48A, I51A, T52A, T52V, T52I, T52L, T55A, T58A, V59A, L61A, I62A, M92A, M93A, R95A, V96A, V96T, V96D, V96M, V107I, F109A, A110P, A110S, A110M, A110L, Y120A, A123F, M125A, R175E, M218A, C219A, L223A, L230A, L234A, W238A, R95A/A110P, M218A/C219A, V107I/R175E, Y127E/R175E, V107I/Y127E, V107I/Y127E/R175E, T52V/V107I/R175E, V96A/V107I/R175E, T52A/V107I/R175E, V96T/V107I/R175E 또는 V107I/A110P/R175E 치환 돌연변이, b) SEQ ID NO: 18의 A107P, G121R, G121L, N213A, C217A 또는 C217S 치환 돌연변이, 및 c) SEQ ID NO: 19의 G91A 또는 A105P 치환 돌연변이로 이루어진 군에서 선택되는 제 1 및 제 2폴리펩티드 또는 LIPC 시스템.
  22. 제 16항 내지 제 21항 중 어느 한 항에 있어서,
    레티노이드 X 수용체 폴리펩티드는 척추동물 레티노이드 X 수용체 폴리펩티드, 무척추동물 레티노이드 X 수용체 폴리펩티드(USP), 및 척추동물과 무척추동물 RXR로부터 얻은 폴리펩티드를 포함한 키메릭 레티노이드X 폴리펩티드로 이루어진 군에서 선택된 폴리펩티드를 포함하는 제 1 및 제 2폴리펩티드 또는 LIPC 시스템.
  23. 제 22항에 있어서,
    키메릭 레티노이드 X 수용체 폴리펩티드는 척추동물종 레티노이드 X 수용체 폴리펩티드 절편, 무척추동물종 레티노이드 X 수용체 폴리펩티드 절편 및 비-쌍시류/비-인시류 무척추동물종 레티노이드 X 수용체 폴리펩티드 절편으로 이루어진 군에서 선택된 2개 이상의 상이한 레티노이드 X 수용체 폴리펩티드 절편을 포함하는 제 1 및 제 2폴리펩티드 또는 LIPC 시스템.
  24. 제 23항에 있어서,
    상기 키메릭 레티노이드 X 수용체 폴리펩티드는 EF-도메인 제 1나선 1, EF-도메인 제 2나선, EF-도메인 제 3나선, EF-도메인 제 4나선, EF-도메인 제 5나선, EF-도메인 제 6나선, EF-도메인 제 7나선, EF-도메인 제 8나선, EF-도메인 제 9나선, EF-도메인 제 10나선, EF-도메인 제 11나선, EF-도메인 제 12나선, F-도메인, 및 EF-도메인 β-플리트 시트로 이루어진 군에서 선택된 하나 이상의 레티노이드 X 수용체 폴리펩티드 절편을 포함한 레티노이드 X 수용체 폴리펩티드를 포함하고, 이 레티노이드X 수용체 폴리펩티드 절편은 상이한 종의 레티노이드 X 수용체 폴리펩티드 또는 제 2레티노이드 X 수용체 폴리펩티드 절편과는 상이한 이형 레티노이드 X 수용체 폴리펩티드로부터 얻는 제 1 및 제 2폴리펩티드 또는 LIPC 시스템.
  25. 제 22항에 있어서,
    상기 키메릭 레티노이드 X 수용체 폴리펩티드는 a) SEQ ID NO: 11, b) SEQ ID NO: 12의 뉴클레오티드 1 내지 348 및 SEQ ID NO: 13의 뉴클레오티드 268 내지 630, c) SEQ ID NO: 12의 뉴클레오티드 1 내지 408 및 SEQ ID NO: 13의 뉴클레오티드 337 내지 630, d) SEQ ID NO: 12의 뉴클레오티드 1465 및 SEQ ID NO: 13의 뉴클레오티드 403 내지 630, e) SEQ ID NO: 12의 뉴클레오티드 1 내지 555 및SEQ ID NO: 13의 뉴클레오티드 490 내지 630, f) SEQ ID NO: 12의 뉴클레오티드 1 내지 624 및 SEQ ID NO: 13의 뉴클레오티드 547 내지 630, g) SEQ ID NO: 12의 뉴클레오티드 1 내지 645 및 SEQ ID NO: 13의 뉴클레오티드 601 내지 630, 및 h) SEQ ID NO: 12의 뉴클레오티드 1 내지 717 및 SEQ ID NO: 13의 뉴클레오티드 613 내지 630의 핵산 서열을 포함하는 폴리뉴클레오티드, 또는 그와 실질적으로 동일한 기능성 변이체를 코딩하는 폴리뉴클레오티드에 의해 코딩되는, 제 1 및 2 폴리펩티드 또는 LIPC 시스템.
  26. 제 22항에 있어서,
    키메릭 레티노이드 X 폴리펩티드는, a) SEQ ID NO: 14, b) SEQ ID NO: 15의 아미노산 1 내지 116 및 SEQ ID NO: 16의 아미노산 90 내지 210, c) SEQ ID NO: 15의 아미노산 1 내지 136 및 SEQ ID NO: 16의 아미노산 113 내지 210, d) SEQ ID NO: 15의 아미노산 1 내지 155 및 SEQ ID NO: 16의 아미노산 135 내지 210, e) SEQ ID NO: 15의 아미노산 1 내지 185 및 SEQ ID NO: 16의 아미노산 164 내지 210, f) SEQ ID NO: 15의 아미노산 1 내지 208 및 SEQ ID NO: 16의 아미노산 183 내지 210, g) SEQ ID NO: 15의 아미노산 1 내지 215 및 SEQ ID NO: 16의 201 내지 210, 및 h) SEQ ID NO: 15의 아미노산 1 내지 239, SEQ ID NO: 16의 아미노산 205 내지 210의 폴리뉴클레오티드 서열, 또는 그와 실질적으로 동일한 폴리펩티드 서열을 포함하는 제 1 및 제 2폴리펩티드 또는 LIPC 시스템.
  27. 제 1항 내지 제 26항 중 어느 한 항에 있어서,
    하나 또는 양쪽의 추가 이종 서열은 막횡단 도메인을 포함하는 제 1 및 제 2폴리펩티드 또는 LIPC 시스템.
  28. 제 27항에 있어서,
    하나 이상의 막횡단 도메인은 단일 경로 I형 막횡단 도메인인 제 1 및 제 2폴리펩티드 또는 LIPC 시스템.
  29. 제 1항 내지 제 28항 중 어느 한 항에 따른 제 1 또는 제 2폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드.
  30. 제 1항 내지 제 28항 중 어느 한 항에 따른 제 1폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 제 1폴리뉴클레오티드 및 제 2 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 제 2폴리뉴클레오티드.
  31. 제 29항 또는 제 30항의 폴리뉴클레오티드 중 하나를 포함하는 벡터.
  32. 제 29항 또는 제 30항의 폴리뉴클레오티드 양쪽을 모두 포함하는 벡터.
  33. 제 31항 또는 제 32항에 있어서,
    상기 벡터는 발현 벡터인 벡터.
  34. 제 31항 내지 제 33항 중 어느 한 항에 따른 벡터를 포함하는 숙주세포.
  35. 제 34항에 있어서,
    상기 숙주세포는 포유동물 T-세포인 숙주세포.
  36. 제 34항에 있어서,
    상기 숙주세포는 인간 T-세포인 숙주세포.
  37. 제 1항 내지 제 28항 중 어느 한 항에 따른 제 1 및 제 2폴리펩티드 또는 LIPC 시스템, 제 29항 또는 제 30항의 폴리뉴클레오티드, 또는 제 31항 내지 제 33항 중 어느 한 항에 따른 벡터를 숙주세포에 도입하는 단계와, 이 숙주세포를 활성화 리간드와 접촉시키는 단계를 포함하는 세포 신호전달 유도방법.
  38. 제 1항 내지 제 28항 중 어느 한 항에 따른 제 1 및 제 2폴리펩티드 또는 LIPC 시스템,
    제 29항 또는 제 30항에 따른 폴리뉴클레오티드,
    제 31항 내지 제 33항 중 어느 한 항에 따른 벡터,
    또는 제 34항 내지 제 36항 중 어느 한 항에 따른 유도 방법에 있어서,
    상기 활성화 리간드는
    c) 하기 식의 화합물이거나:
    Figure pct00013

    여기서 E는 3차 탄소를 함유한 (C4-C6)알킬, 또는 3차 탄소를 함유한 시아노(C3-C5)알킬이고; R1 은 H, Me, Et, i-Pr, F, 포밀, CF3, CHF2, CHCl2, CH2F, CH2Cl, CH2OH, CH2OMe, CH2CN, CN, C≡CH, 1-프로피닐, 2-프로피닐, 비닐, OH, OMe, OEt, 시클로프로필, CF2CF3, CH=CHCN, 알릴, 아지도, SCN 또는 SCHF2이고;
    R2 는 H, Me, Et, n-Pr, i-Pr, 포밀, CF3, CHF2, CHCl2, CH2F, CH2Cl, CH2OH, CH2OMe, CH2CN, CN, C≡CH, 1-프로피닐, 2-프로피닐, 비닐, Ac, F, Cl, OH, OMe, OEt, O-n-Pr, OAc, NMe2, NEt2, SMe, SEt, SOCF3, OCF2CF2H, COEt, 시클로프로필, CF2CF3, CH=CHCN, 알릴, 아지도, OCF3, OCHF2, O-i-Pr, SCN, SCHF2, SOMe, NH-CN이거나, 또는 R3 와 결합하고, 이때의 R2 와 R3 이 페닐 탄소에 부착되어 에틸렌디옥시를 형성하고, 페닐 탄소에 인접한 산소를 함유한 디히드로푸릴 고리, 또는 페닐 탄소에 인접한 산소를 함유한 디히드로피릴 고리를 형성하며;
    R3 은 H, Et이거나, 또는 R2 와 결합하고, 이때의 R2 와 R3 이 페닐 탄소에 부착되어 에틸렌디옥시를 형성하고, 페닐 탄소에 인접한 산소를 함유한 디히드로푸릴 고리, 또는 페닐 탄소에 인접한 산소를 함유한 디히드록피릴 고리를 형성하며;
    R4, R5 및 R6은 독립적으로 H, Me, Et, F, Cl, Br, 포밀, CF3, CHF2, CHC12, CH2F, CH2Cl, CH2OH, CN, C≡CH, 1-프로피닐, 2-프로피닐, 비닐, OMe, OEt, SMe 또는 Set이고; 또는
    d) 엑디손, 20-히드록시엑디손, 포나스테론 A, 무리스테론 A, 옥시스테롤, 22(R) 히드록시콜레스테롤, 24(S) 히드록시콜레스테롤, 25-에폭시콜레스테롤, T0901317, 5-알파-6-알파-에폭시콜레스테롤-3-설페이트, 7-케토콜레스테롤-3-설페이트, 파르네솔, 담즙산, 1,1-비포스페이트 에스테르 또는 유충 호르몬(III)인 제 1 및 제 2폴리펩티드 또는 LIPC 시스템, 폴리뉴클레오티드, 벡터 또는 유도 방법.
  39. 제 1항 내지 제 28항 중 어느 한 항에 따른 제 1 및 제 2폴리펩티드 또는 LIPC 시스템,
    제 29항 또는 제 30항에 따른 폴리뉴클레오티드,
    제 31항 내지 제 33항 중 어느 한 항에 따른 벡터,
    또는 제 34항 내지 제 36항 중 어느 한 항에 따른 유도 방법에 있어서,
    상기 활성화 리간드는 하기 식의 화합물,
    Figure pct00014

    또는, 하기 식의 화합물이고:
    Figure pct00015

    여기서 R1, R2, R3 및 R4 는: a) H, (C1-C6)알킬; (C1-C6)할로알킬; (C1-C6)시아노알킬; (C1-C6)히드록시알킬; (C1-C4)알콕시(C1-C6)알킬; 할로, 시아노, 히드록실 또는 (C1-C4)알킬로 임의로 치환된 (C2-C6)알케닐; 할로, 시아노, 히드록실 또는 (C1-C4)알킬로 임의로 치환된 (C2-C6)알키닐; 할로, 시아노, 히드록실 또는 (C1-C4)알킬로 임의로 치환된 (C3-C5)시클로알킬; 또는 b) 치환되지 않거나 치환된 벤질로서, 이때의 치환기는 독립적으로 1 내지 5H, 할로, 니트로, 시아노, 히드록실, (C1-C6)알킬, 또는 (Ci-C6)알콕시이고;
    R5 는 H; OH; F; Cl; 또는 (C1-C6)알콕시이고;
    단, R1, R2, R3 및 R4 가 이소프로필이면, R5 는 히드록실이 아니고;
    R5 가 H, 히드록실, 메톡시 또는 플루오로이면, R1, R2, R3 및 R4 중 하나 이상은 H가 아니고;
    R1, R2, R3 및 R4 중 하나만 메틸이고 R5 가 H 또는 히드록실이면, R1, R2, R3 및 R4 의 나머지는 H가 아니고;
    R4 와 R1, R2 및 R3 중 하나가 모두 메틸이면, R5 는 H도 히드록실도 아니고;
    R1, R2, R3 및 R4 가 모두 메틸이면, R5 는 히드록실이 아니고; 또한
    R1, R2 및 R3 이 모두 H이고 R5 가 히드록실이면, R4 는 에틸, n-프로필, n-부틸, 알릴 또는 벤질이 아닌 제 1 및 제 2폴리펩티드 또는 LIPC 시스템, 폴리뉴클레오티드, 벡터 또는 유도 방법.
  40. 제 1항 내지 제 28항 중 어느 한 항에 따른 제 1 및 제 2폴리펩티드 또는 LIPC 시스템,
    제 29항 또는 제 30항에 따른 폴리뉴클레오티드,
    제 31항 내지 제 33항 중 어느 한 항에 따른 벡터,
    또는 제 34항 내지 제 36항 중 어느 한 항에 따른 유도 방법에 있어서,
    상기 활성화 리간드는 하기 식의 화합물이고:
    Figure pct00016

    여기서 X와 X'는 독립적으로 O 또는 S이고;
    Y는:
    (a) 치환 또는 치환되지 않은 페닐로서, 이때의 치환체는 독립적으로1-5H, (C1-C4)알킬, (C1-C4)알콕시, (C2-C4)알케닐, 할로(F, Cl, Br, I), (C1-C4)할로알킬, 히드록시, 아미노, 시아노 또는 니트로이거나; 또는
    (b) 치환 또는 치환되지 않은 2-피리딜, 3-피리딜 또는 4-피리딜로서, 이때의 치환체는 독립적으로 1-4H, (C1-C4)알킬, (C1-C4)알콕시, (C2-C4)알케닐, 할로(F, Cl, Br, I), (C1-C4)할로알킬, 히드록시, 아미노, 시아노 또는 니트로이며;
    R1 과 R2 는 독립적으로 H; 시아노; 시아노-치환 또는 치환되지 않은 (C1-C7) 분지쇄나 직쇄 알킬; 시아노-치환 또는 치환되지 않은 (C2-C7) 분지쇄나 직쇄 알케닐; 시아노-치환 또는 치환되지 않은 (C3-C7) 분지쇄나 직쇄 알케닐알킬이고; 또는 함께 R1 와 R2 원자가가 (C1-C7) 시아노-치환 또는 치환되지 않은 알킬리덴기 (R a R b C-)를 형성하고, 이때 R a 와 R b 내의 비치환 탄소의 총합이 0 내지6이며;
    R3 은 H, 메틸, 에틸, n-프로필, 이소프로필 또는 시아노이고;
    R4, R7 및 R8 은 독립적으로 H, (C1-C4)알킬, (C1-C4)알콕시, (C2-C4)알케닐, 할로(F, Cl, Br, I), (C1-C4)할로알킬, 히드록시, 아미노, 시아노 또는 니트로이고; 또한
    R5 와 R6 은 독립적으로 H, (C1-C4)알킬, (C2-C4)알케닐, (C3-C4)알케닐알킬l, 할로(F, Cl, Br, I), C1-C4 할로알킬, (C1-C4)알콕시, 히드록시, 아미노, 시아노, 니트로이거나, 함께 (―OCHR9CHR10O―) 형태의 조합으로서 이들이 부착될 페닐 탄소와 함께 고리를 형성하고; 여기서 R9 와 R10은 독립적으로, H, 할로, (C1-C3)알킬, (C2-C3)알케닐, (C1-C3)알콕시(C1-C3)알킬, 벤조일옥시(C1-C3)알킬, 히드록시(C1-C3)알킬, 할로(C1-C3)알킬, 포밀, 포밀(C1-C3)알킬, 시아노, 시아노(C1-C3)알킬, 카복시, 카복시(C1-C3)알킬, (C1-C3)알콕시카보닐(C1-C3)알킬, (C1-C3)알킬카보닐(C1-C3)알킬, (C1-C3)알카노일옥시(C1-C3)알킬, 아미노(C1-C3)알킬, (C1-C3)알킬아미노(C1-C3)알킬 (―(CH2)nRcRe), 옥시모(―CH-NOH), 옥시모(C1-C3)알킬, (C1-C3)알콕시모(―C-NOR d ), 알콕시모(C1-C3)알킬, (C1-C3)카복사미도(―C(O)NR e R f ), (C1-C3)카복사미도(C1-C3)알킬, (C1-C3)세미카바지도 (―C-NNHC(O)NR e R f ), 세미카바지도(C1-C3)알킬, 아미노카보닐옥시(―OC(O)NHR g ), 아미노카보닐옥시(C1-C3)알킬, 펜타플루오로페닐옥시카보닐(C1-C3)알킬, p-톨루엔술포닐 옥시(C1-C3)알킬, 아릴술포닐 옥시(C1-C3)알킬, (C1-C3)티오(C1-C3)알킬, (C1-C3)알킬술폭시도(C1-C3)알킬, (C1-C3)알킬술포닐(C1-C3)알킬, 또는 (C1-C5)트리 치환-실록시(C1-C3)알킬 (―(CH2) n SiOR d R e R g )이고; 이때 n=1-3, R c 및 R d 는 지정된 길이의 직쇄나 분지쇄 탄화수소 사슬을 나타내고, R e 및 R f 는 H 또는 직쇄나 분지쇄 탄화수소 사슬을 나타내고, R g 는 할로나 (C1-C3)알킬로 임의로 치환된 (C1-C3)알킬, 또는 아릴이고, 또한 R c , R d , R e , R f 및 R g 는 서로 독립적이며;
    단,
    i) R9 와 R10 이 모두 H이거나,
    ii) R9 이나 R10이 할로, (C1-C3)알킬, (C1-C3)알콕시(C1-C3)알킬, 또는 벤조일옥시(C1-C3)알킬인 경우나,
    iii) R5 와 R6 이 함께 (―OCHR9CHR10O―) 형태의 조합을 형성하는 경우,
    R1 이나 R2 그룹 중 어느 하나, 또는 이들 양측에서 시아노 치환체 내의 탄소 원자수를 제외한 탄소 원자수는 4를 초과하고, R1, R2 및 R3 그룹의 총합에서 시아노 치환기 내의 탄소 원자수를 제외한 탄소 원자수는 10, 11 또는 12인 제 1 및 제 2폴리펩티드 또는 LIPC 시스템, 폴리뉴클레오티드, 벡터 또는 유도 방법.
  41. 리간드-유도 세포 신호전달의 측정방법으로서,
    a) 제 1항 내지 제 28항 중 어느 한 항에 따른 제 1 및 제 2폴리펩티드 또는 LIPC 시스템, 제 29항 또는 제 30항에 따른 폴리펩티드, 또는 제 31항 내지 제 33항 중 어느 한 항에 따른 벡터를 숙주세포에 도입하는 단계와;
    b) 숙주세포를 활성화 리간드와 접촉시키는 단계와;
    c) 리간드-유도 생물학적 활성이나 폴리펩티드 올리고머화의 절대량 또는 상대량을 정량화하는 단계를 포함하는 방법.
KR1020177030658A 2015-03-30 2016-03-29 리간드 유도성 폴리펩티드 결합제 시스템 KR20180012247A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562140380P 2015-03-30 2015-03-30
US62/140,380 2015-03-30
PCT/US2016/024690 WO2016160791A1 (en) 2015-03-30 2016-03-29 Ligand inducible polypeptide coupler system

Publications (1)

Publication Number Publication Date
KR20180012247A true KR20180012247A (ko) 2018-02-05

Family

ID=57005332

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177030658A KR20180012247A (ko) 2015-03-30 2016-03-29 리간드 유도성 폴리펩티드 결합제 시스템

Country Status (14)

Country Link
US (1) US20180348231A1 (ko)
EP (1) EP3278110A4 (ko)
JP (1) JP2018511602A (ko)
KR (1) KR20180012247A (ko)
CN (1) CN107430128A (ko)
AU (1) AU2016243464A1 (ko)
CA (1) CA2979724A1 (ko)
HK (1) HK1248811A1 (ko)
IL (1) IL254340A0 (ko)
MX (1) MX2017012455A (ko)
PH (1) PH12017501763A1 (ko)
RU (1) RU2017131505A (ko)
SG (1) SG11201707652WA (ko)
WO (1) WO2016160791A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JOP20180027A1 (ar) * 2017-03-28 2019-01-30 Cell Design Labs Inc بوليبيبتيدات مخلطة و طرق لتغيير موضع الغشاء فيها
JP6990369B2 (ja) * 2017-05-19 2022-02-03 国立大学法人 熊本大学 遺伝性腎疾患アルポート症候群治療薬に係る評価系

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10234372A (ja) * 1997-02-27 1998-09-08 Boehringer Mannheim Corp キメラ受容体を有する細胞とその作成方法、並びに その利用
AU5143099A (en) * 1998-07-30 2000-02-21 Universite De Montreal Protein fragment complementation assays for the detection of biological or drug interactions
MXPA02009157A (es) * 2000-03-22 2004-04-05 Rohm & Haas Nuevo sistema de expresion genetica inducible a base del receptor de ecdisona.
MXPA03007492A (es) * 2001-02-20 2004-10-15 Rheogene Holdings Inc Receptores de retinoide x quimerico y su uso en un sistema de expresion de gen inducible basado en receptor de ecdisona novedoso.
US20040102367A1 (en) * 2001-02-23 2004-05-27 Gage Fred H Gene expression system based on chimeric receptors
ATE377644T1 (de) * 2002-03-25 2007-11-15 Applera Corp Systeme und verfahren zum nachweis der funktion nukleärer rezeptoren unter verwendung von reporterenzymmutanten komplementierungen

Also Published As

Publication number Publication date
US20180348231A1 (en) 2018-12-06
IL254340A0 (en) 2017-11-30
RU2017131505A (ru) 2019-05-06
HK1248811A1 (zh) 2018-10-19
AU2016243464A1 (en) 2017-09-28
EP3278110A1 (en) 2018-02-07
CN107430128A (zh) 2017-12-01
SG11201707652WA (en) 2017-10-30
EP3278110A4 (en) 2018-08-29
MX2017012455A (es) 2018-06-27
RU2017131505A3 (ko) 2019-09-19
CA2979724A1 (en) 2016-10-06
JP2018511602A (ja) 2018-04-26
PH12017501763A1 (en) 2018-04-23
WO2016160791A1 (en) 2016-10-06

Similar Documents

Publication Publication Date Title
CA2438119C (en) Chimeric retinoid x receptors and their use in a novel ecdysone receptor-based inducible gene expression system
Zhu et al. The competence factor βFtz-F1 potentiates ecdysone receptor activity via recruiting a p160/SRC coactivator
CA2441444C (en) Novel ecdysone receptor/invertebrate retinoid x receptor-based inducible gene expression system
US20020119521A1 (en) Novel ecdysone receptor-based inducible gene expression system
CA2445796C (en) Novel substitution mutant receptors and their use in a nuclear receptor-based inducible gene expression system
AU751163B2 (en) Rapidly degrading GFP-fusion proteins and methods of use
Palli et al. Improved ecdysone receptor‐based inducible gene regulation system
AU2022221378A1 (en) Humanized SIRPA-IL15 knockin mice and methods of use thereof
Palli et al. Ecdysteroid receptors and their applications in agriculture and medicine
Xu et al. Activation of transcription through the ligand‐binding pocket of the orphan nuclear receptor ultraspiracle
US20040033600A1 (en) Ecdysone receptor-based inducible gene expression system
CN105555948A (zh) 靶向整合
EP1811023A1 (en) Gene expressed specifically in es cells and utilization of the same
JP2016539644A (ja) 光活性化受容体
JP2022516572A (ja) 合成分子フィードバック回路及びその使用方法
KR20180012247A (ko) 리간드 유도성 폴리펩티드 결합제 시스템
JPH06510206A (ja) 新規ヘテロダイマー核レセプタータンパク質、それをコードする遺伝子、およびその使用
US7238782B2 (en) Compositions and methods for regulating RNA stability using polypyrimidine tract proteins
Asa Transgenic and knockout mouse models clarify pituitary development, function and disease
Straub et al. The SPIRE1 actin nucleator coordinates actin/myosin functions in the regulation of mitochondrial motility
JPH08501211A (ja) ウルトラスピラクル受容体とのマルチマー型ステロイド/甲状腺スーパーファミリー受容体メンバー
CA3076371C (en) Non-human animals comprising slc30a8 mutation and methods of use
JP2016054698A (ja) ドーパミン受容体作用物質のスクリーニング方法
US20090221673A1 (en) Compositions and Methods for Regulating RNA Translation via CD154 CA-Dinucleotide Repeat
Ling et al. K+-channel transgenes reduce K+ currents in Paramecium, probably by a post-translational mechanism