PT1456346E - Novo sistema de expressão de genes induzido baseado no recetor de ecdisona / recetor x retinoide invertebrado - Google Patents

Novo sistema de expressão de genes induzido baseado no recetor de ecdisona / recetor x retinoide invertebrado Download PDF

Info

Publication number
PT1456346E
PT1456346E PT02714955T PT02714955T PT1456346E PT 1456346 E PT1456346 E PT 1456346E PT 02714955 T PT02714955 T PT 02714955T PT 02714955 T PT02714955 T PT 02714955T PT 1456346 E PT1456346 E PT 1456346E
Authority
PT
Portugal
Prior art keywords
seq
quot
gene expression
receptor
leu
Prior art date
Application number
PT02714955T
Other languages
English (en)
Inventor
Subba Reddy Palli
Marianna Zinovjevna Kapitskaya
Original Assignee
Intrexon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=26953897&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=PT1456346(E) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Intrexon Corp filed Critical Intrexon Corp
Publication of PT1456346E publication Critical patent/PT1456346E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70567Nuclear receptors, e.g. retinoic acid receptor [RAR], RXR, nuclear orphan receptors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/72Receptors; Cell surface antigens; Cell surface determinants for hormones
    • C07K14/721Steroid/thyroid hormone superfamily, e.g. GR, EcR, androgen receptor, oestrogen receptor

Description

1
DESCRIÇÃO "NOVO SISTEMA DE EXPRESSÃO DE GENES INDUZIDO BASEADO NO RECETOR DE ECDISONA / RECETOR X RETINOIDE INVERTEBRADO"
CAMPO DA INVENÇÃO
Esta invenção está relacionada com o campo da biotecnologia ou engenharia genética. Especificamente, esta invenção está relacionada com o campo da expressão de genes. Mais especificamente, esta invenção está relacionada com um novo sistema de expressão de genes induzido baseado no recetor de ecdisona / recetor X retinoide invertebrado e métodos de modular a expressão de um gene dentro de uma célula hospedeira usando este sistema induzível de expressão de genes.
ANTECEDENTES DA INVENÇÃO Várias citações de qualquer referência aqui não devem ser interpretadas como uma admissão de que tal referência está disponível como "Estado da Arte" para aplicação instantânea.
No campo da engenharia genética, o controlo preciso da expressão de genes constitui uma ferramenta valiosa para estudar, manipular, e controlar o desenvolvimento e outros processos fisiológicos. A expressão de genes é um processo biológico complexo que envolve um número de interacções proteína-proteína específicas. Para que a expressão de genes seja despoletada, de tal maneira que produza o ARN necessário como o primeiro passo na síntese proteica, um activador transcricional deve ser trazido para próximo de um promotor que controla a transcrição génica. Tipicamente, o activador transcricional está, ele próprio, associado com uma proteína que tem, pelo menos, um domínio de ligação ao ADN que se liga a locais de ligação do ADN presentes nas regiões promotoras dos genes. Assim, para que a expressão 2 de genes possa ocorrer, uma proteína que compreende um domínio de ligação ao ADN e um domínio de transativação localizado a uma distância apropriada do domínio de ligação ao ADN deve ser trazida para a posição correcta na região promotora do gene. A abordagem transgénica tradicional utiliza um promotor específico tipo-célula para dirigir a expressão de um transgene designado. Uma construção do ADN que contenha o transgene é inicialmente incorporada num genoma hospedeiro. Quando activado por um activador transcricional, a expressão do transgene ocorre num tipo de célula determinado.
Outra forma de regular a expressão de genes estrangeiros nas células é através de promotores induzidos. Exemplos do uso de tais promotores induzidos incluem o promotor PRl-a, sistemas repressor-operador procarióticos, sistemas imunofilina-imunossupressores, e sistemas de activação da transcrição em eucariontes superiores tais como sistemas recetores da hormona esteroide e são descritos a seguir. 0 promotor PRl-a do tabaco é induzido durante a resposta de resistência adquirida sistémica que se segue ao ataque por um patógeno. 0 uso de PRl-a pode ser limitado porque com frequência responde a materiais endógenos e factores externos tais como patógenos, radiação UV-B, e poluentes. Foram descritos sistemas de regulação de genes baseados nos promotores induzidos por choque térmico, interferão e metais pesados (Wum et al., 1986, Proc. Natl. Acad. Sei. USA 83:5414-5418; Arnheiter et al. , 1990, Cell 62: 51-61; Filmus et al., 1992, Nucleic Acid Research 20: 27550-27560). Contudo, estes sistemas têm limitações devido ao seu efeito na expressão de genes não-alvo. Estes sistemas são também vazantes.
Os sistemas repressor-operador procarióticos utilizam proteínas repressoras bacterianas e as únicas sequências de 3 ADN operadoras a que se ligam. Tanto os sistemas repressor-operador da tetraciclina ("Tet") e lactose ("Lac") da bactéria Escherichia coli foram usados em plantas e animais para controlar a expressão de genes. No sistema Tet, a tetraciclina liga-se à proteína repressora TetR, resultando numa alteração de conformação que liberta a proteína repressora do operador que, como resultado, possibilita que a transcrição ocorra. No sistema Lac, um operão lac é activado em resposta à presença da lactose, ou análogos sintéticos tais como isopropil-b-D-tiogalactosida. Infelizmente, o uso de tais sistemas é restrito pela química instável dos ligandos, isto é, tetraciclina e lactose, pela sua toxicidade, a sua presença natural, ou pelos níveis relativamente elevados necessários para indução ou repressão. Por razões semelhantes, a utilidade de tais sistemas em animais é limitada.
Moléculas imunossupressoras tais como FK506, rapamicina e ciclosporina A podem-se ligar a imunofilinas FKBP12, ciclofilina, etc. Usando esta informação, foi planificada uma estratégia geral para juntar quaisquer duas proteínas simplesmente colocando FK506 em cada uma das duas proteínas ou colocando FK506 numa e ciclosporina A na outra. Um homodímero sintético de FK506 (FK1012) ou um composto resultante da fusão de FK506-ciclosporina (FKCsA) pode então ser usado para induzir a dimerização destas moléculas (Spencer et al., 1993, Science 262:1019-24; Belshaw et al., 1996, Proc Natl Acad Sei USA 93:4604-7). Foram usados domínio de ligação a ADN Gal4 fundido com FKBP12 e domínio de activação de VP16 fundido com ciclofilina, e composto FKCsA para revelar heterodimerização e activação de um gene repórter sob o controlo de um promotor que contém locais de ligação ao Gal4. Infelizmente, este sistema inclui imunossupressores que podem ter efeitos colaterais indesejados e, por isso, limita o seu uso para várias aplicações de trocas de genes 4 em mamíferos.
Os sistemas de activação da transcrição em eucariontes superiores tais como sistemas de recetores da hormona esteroide também têm sido empregues. Os recetores da hormona esteroide são membros da superfamília de recetor nuclear e são encontrados em células de vertebrados e invertebrados. Infelizmente, o uso de compostos esteroidais que activam os recetores para a regulação da expressão de genes, particularmente em plantas e mamíferos, é limitado devido ao seu envolvimento em muitas outras vias biológicas naturais em tais organismos. De maneira a ultrapassar tais dificuldades, foi desenvolvido um sistema alternativo que usa recetores de ecdisona de insecto (EcR). 0 crescimento, a muda, e o desenvolvimento em insectos são regulados pela hormona esteroide ecdisona (hormona da muda) e pelas hormonas juvenis (Dhadialla, et al., 1998, Annu. Rev. Entomol. 43: 545-569) . 0 alvo molecular para a ecdisona em insectos consiste em, pelo menos, recetor de ecdisona (EcR) e proteína ultraspiracle (USP). EcR é um membro da superfamília de recetor esteroide nuclear que é caracterizada pela assinatura dos domínios de ligação ao ADN e ligando, e um domínio de activação (Koelle et al. 1991, Cell, 67: 59-77). Os recetores EcR são responsivos a um número de compostos esteroidais tais como ponasterona A e muristerona A. Recentemente, foram descritos compostos não-esteroidais com atividade agonista ecdisteroide, incluindo os insecticidas tebufenozida e metoxifenozida comercialmente disponíveis que são comercializados mundialmente pela companhia Rohm e Haas (ver Formulário de Patente Internacional N.° PGT/EP96/00686 e Patente U.S. 5,530,028). Ambos análogos têm perfis de segurança excepcionais para outros organismos.
Os pedidos de patentes internacionais N.°s PCT/US97/05330 (WO 97/38117) e PGT/US99/08381 (W099/58155) revelam métodos para modular a expressão de um gene exógeno 5 no qual uma construção de ADN que compreende o qene exógeno e um elemento de resposta à ecdisona é activado por uma segunda construção de ADN que compreende um recetor de ecdisona que, na presença de um seu ligando, e opcionalmente na presença de um recetor capaz de agir como um parceiro silencioso, se liga ao elemento de resposta à ecdisona para induzir a expressão de genes. 0 recetor de ecdisona de eleição foi isolado a partir de Drosophila melanogaster. Tipicamente, tais sistemas requerem a presença de um parceiro silencioso, preferencialmente recetor X retinoide (RXR), de maneira a providenciar activação óptima. Em células de mamíferos, o recetor de ecdisona de insecto (EcR) heterodimeriza com o recetor X retinoide (RXR) e regula a expressão de genes alvo de uma maneira dependente do ligando. 0 pedido de patente internacional N.° PCT/US98/14215 (WO 99/02683) revela que o recetor de ecdisona isolado a partir do bicho-da-seda Bombyx mori é funcional em sistemas de mamíferos mas sem a necessidade de um parceiro dímero exógeno. A patente U.S. N.° 5 880 333 revela um EcR Drosophila melanogaster e um sistema heterodímero ultraspiracle (USP) usado em plantas no qual o domínio de transativação e o domínio de ligação ao ADN são posicionados em duas proteínas híbridas diferentes. Infelizmente, este sistema não é eficaz para induzir a expressão de um gene repórter em células animais (para comparação, ver Exemplo 12, em baixo) .
Em cada um destes casos, o domínio de transativação e o domínio de ligação ao ADN (quer como EcR nativo como no pedido de patente internacional N.° PGT/US98/14215 ou como EcR modificado como no pedido de patente internacional N.° PCT/US97/05330) foram incorporados numa única molécula e os outros parceiros heterodiméricos, quer USP ou RXR, foram usados no seu estado nativo. Inconvenientes dos sistemas de regulação de genes 6 baseados em EcR anteriormente descritos incluem uma atividade de fundo considerável na ausência de ligandos e a não-aplicabilidade destes sistemas para uso tanto em plantas como animais (ver Patente U.S. N.° 5 880 333). Para a maioria das aplicações que contam com a modulação da expressão de genes, estes sistemas baseados em EcR são indesejáveis. Assim, existe uma necessidade na arte de sistemas melhorados para modular com precisão a expressão de genes exógenos tanto em plantas como animais. Tais sistemas melhorados seriam úteis para aplicações tais como terapêutica genética, produção em grande escala de proteínas e anticorpos, testes de classificação de alto rendimento baseados em células, genómica funcional e regulação de características em animais transgénicos. Sistemas melhorados que são simples, compactos e dependentes de ligandos que são relativamente baratos, estão prontamente disponíveis, e de baixa toxicidade para o hospedeiro seriam úteis para regular sistemas biológicos.
Recentemente, candidatos mostraram que um sistema de expressão de genes induzido baseado num recetor de ecdisona no qual os domínios da transativação e de ligação ao ADN são separados um do outro colocando-os em duas proteínas diferentes resulta numa atividade de fundo grandemente reduzida na ausência de um ligando e numa atividade significativamente aumentada acima do fundo na presença de um ligando (candidatura pendente PCT/US01/09050). Este sistema de duplo-híbrido é um sistema de modulação da expressão de genes induzido significativamente melhorado comparado com os dois sistemas revelados nos formulários PCT7US97/05330 e PCT/US98/14215.
Candidatos previamente demonstraram que um sistema de expressão de genes baseado no recetor de ecdisona em parceria com uma proteína ultraspiracle (USP) de um díptero (Drosophila melanogaster) ou de um lepidóptero (Choristoneura fumiferana) é expresso constitutivamente em 7 células de mamíferos, enquanto que um sistema de expressão de genes baseado no recetor de ecdisona em parceria com um recetor X retinoide (RXR) vertebrado é induzido em células de mamíferos (pedido de patente pendente PCT/USO1/09050) . Candidatos fizeram agora a impressionante descoberta de que um homólogo do RXR invertebrado não-díptero e não-lepidóptero pode funcionar de forma semelhante ao RXR de vertebrado num sistema de expressão de genes induzido baseado no recetor de ecdisona. Como descrito aqui, o novo sistema de expressão de genes induzido baseado no recetor X retinoide invertebrado / recetor de ecdisona do candidato providencia um sistema de expressão de genes induzido melhorado em leveduras e células de mamíferos que é caracterizado por uma sensibilidade aumentada ao ligando e pela magnitude da transativação.
SUMÁRIO DA INVENÇÃO A presente invenção refere-se a um novo sistema de expressão de genes induzido baseado no recetor X retinoide invertebrado / recetor de ecdisona, novos recetores de polinucleótidos e polipéptidos para uso no novo sistema de expressão de genes induzido, e métodos para modular a expressão de um gene dentro de uma célula hospedeira usando este sistema de expressão de genes induzido. Em particular, a invenção do candidato está relacionada com um sistema de modulação de expressão de genes melhorado que compreende um polinucleótido que codifica um domínio de ligação a um ligando de um polipéptido do recetor X retinoide (RXR) invertebrado.
Especificamente, a presente invenção refere-se a um sistema de modulação de expressão de genes que compreende: a) uma primeira cassete de expressão de genes que seja capaz de ser expressa numa célula hospedeira que compreende um polinucleótido que codifica um primeiro polipéptido híbrido que compreende: i) um domínio de ligação ao ADN que reconhece um elemento de resposta associado com um gene cuja expressão deverá ser modulada; e ii) um domínio de ligação a um ligando do recetor de ecdisona; e b) uma segunda cassete de expressão de genes que seja capaz de ser expressa na célula hospedeira que compreende uma sequência polinucleotídica que codifica um segundo polipéptido híbrido que compreende: i) um domínio de transativação; e ii) um domínio de ligação ao ligando do recetor X retinoide invertebrado. A presente invenção tembém se refere a um sistema de modulação de expressão de genes que compreende: a) uma primeira cassete de expressão de genes que seja capaz de ser expressa numa célula hospedeira que compreende um polinucleótido que codifica um primeiro polipéptido híbrido que compreende: i) um domínio de ligação ao ADN que reconhece um elemento de resposta associado com um gene cuja expressão deverá ser modulada; e ii) um domínio de ligação ao ligando do recetor X retinoide invertebrado; e b) a uma segunda cassete de expressão de genes que seja capaz de ser expressa na célula hospedeira que compreende uma sequência polinucleotídica que codifica um segundo polipéptido híbrido que compreende: i) um domínio de transativação; e ii) um domínio de ligação ao ligando do recetor de ecdisona. A presente invenção também se refere a um sistema de modulação de expressão de genes de acordo com a invenção que compreende ainda c) uma terceira cassete de expressão de genes que compreende: i) um elemento de resposta ao qual o domínio de ligação ao ADN do primeiro polipéptido híbrido se liga; ii) um promotor que é activado pelo domínio de transativação do segundo polipéptido híbrido; e iii) um gene cuja expressão deverá ser modulada. A presente invenção também se refere a uma cassete de expressão de genes que é capaz de ser expressa numa célula hospedeira, em que a cassete de expressão de genes 9 compreende um polinucleótido que codifica um polipéptido híbrido que compreende quer i) um domínio de ligação ao ADN que reconhece um elemento de resposta associado com um gene cuja expressão deverá ser modulada, ou ii) um domínio de transativação; e um domínio de ligação ao ligando do recetor X retinoide invertebrado. A presente invenção também se refere a um polinucleótido isolado que codifica um polipéptido híbrido que compreende quer i) um domínio de ligação ao ADN que reconhece um elemento de resposta associado com um gene cuja expressão será modulada, ou ii) um domínio de transativação; e um domínio de ligação ao ligando do recetor X retinoide invertebrado. A presente invenção também se refere a um polinucleótido isolado que codifica um polipéptido RXR invertebrado truncado, em que a mutação de truncagem afecta a activação de ligação ao ligando ou sensibilidade ao ligando do polipéptido RXR invertebrado. A presente invenção também se refere a um polinucleótido isolado que codifica um polipéptido RXR invertebrado truncado que compreende uma mutação de truncagem que aumenta a sensibilidade ao ligando de um heterodímero que compreende o polipéptido RXR invertebrado truncado e um parceiro de dimerização. Numa modalidade específica, o parceiro de dimerização é um polipéptido recetor de ecdisona. A presente invenção também se refere a um polipéptido isolado codificado por um polinucleótido de acordo com a invenção do candidato. A presente invenção também se refere a um polipéptido híbrido isolado que compreende quer i) um domínio de ligação ao ADN que reconhece um elemento de resposta associado com um gene cuja expressão será modulada, ou ii) um domínio de transativação; e um domínio de ligação ao ligando do recetor X retinoide invertebrado. 10 A presente invenção refere-se a um polipéptido RXR invertebrado isolado truncado que compreende uma mutação de truncagem, em que o polipéptido RXR invertebrado é codificado por um polinucleótido de acordo com a invenção.
Assim, a presente invenção também se refere a um polipéptido RXR invertebrado isolado truncado que compreende uma mutação de truncagem que afecta a atividade de ligação ao ligando ou a sensibilidade ao ligando de dito polipéptido RXR invertebrado. A presente invenção também se refere a um polipéptido RXR invertebrado isolado truncado que compreende uma mutação de truncagem que aumenta a sensibilidade ao ligando de um heterodímero que compreende o polipéptido RXR invertebrado truncado e um parceiro de dimerização. Numa modalidade especifica, o parceiro de dimerização é um polipéptido recetor de ecdisona. A invenção do candidato também se refere a métodos de modular a expressão de genes numa célula hospedeira usando um sistema de modulação da expressão de genes de acordo com a invenção. Especificamente, a invenção do candidato providencia um método para modular a expressão de um gene numa célula hospedeira que compreende as etapas de: a) introduzir na célula hospedeira sistema de modulação da expressão de genes de acordo com a invenção; b) introduzir na célula hospedeira uma cassete de expressão de genes que compreende i) um elemento de resposta que compreende um domínio ao qual o domínio de ligação ao ADN do primeiro polipéptido híbrido do sistema de modulação da expressão de genes se liga; ii) um promotor que é activado por um domínio de transativação do segundo polipéptido híbrido do sistema de modulação da expressão de genes; e iii) um gene suja expressão deverá ser modulada; e c) introduzir na célula hospedeira um ligando; em que após introdução do ligando na célula hospedeira, a expressão do gene é modulada. 11 A invenção do candidato também providencia um método de modular a expressão de um gene numa célula hospedeira que compreende uma cassete de expressão de genes que compreende um elemento de resposta que compreende um domínio ao qual o domínio de ligação ao ADN do primeiro polipéptido híbrido do sistema de modulação da expressão de genes se liga; um promotor que é activado pelo domínio de transativação do segundo polipéptido híbrido do sistema de modulação da expressão de genes; e um gene cuja expressão deverá ser modulada; em que o método compreende as etapas de: a) introduzir na célula hospedeira um sistema de modulação da expressão de genes de acordo com a invenção; e b) introduzir na célula hospedeira um ligando; em que após introdução do ligando no hospedeiro, a expressão do gene é modulada. A invenção do candidato também providencia uma célula hospedeira isolada que compreende um sistema de expressão de genes induzido de acordo com a invenção. A presente invenção também se refere a uma célula hospedeira isolada que compreende uma cassete de expressão de genes, um polinucleotídeo, ou um polipéptido de acordo com a invenção. Em conformidade, a invenção do candidato também se refere a um organismo não-humano que compreende uma célula hospedeira de acordo com a invenção.
BREVE DESCRIÇÃO DOS DESENHOS
Figura 1: Transativação de genes repórteres através de construções VP16MmRXRDEF, VP16MmRXREF, VPlôLmUSP, e VP16CfUSP transfetadas em células NIH3T3 juntamente com plasmídeos ADN GAL4CfEcRCDEF, pFRLuc e pTKRL por um ligando não-esteroide.
Figura 2: Transativação de genes repórteres através de construções VP16NUnRXRDEF, VP16MmRXREF, VP16LmUSP, e VP16CfUSP transfetadas em células NIH3T3 juntamente com plasmídeos ADN GAL4CfEcRDEF, pFRLuc e pTKRL por um ligando 12 não-esteroide.
Figura 3: Alinhamento da sequência de aminoácidos dos domínios EF de seis RXR vertebrados (A) e seis RXR invertebrados (B) . As hélices 1-12 são indicadas como Hl-H12 e folhas β-plissadas são indicadas como SI e S2. F indica a junção do domínio F.
Figura 4: Dados da expressão de várias truncagens de CfEcR, GAL4CfEcRA/BCDEF, GAL4CfEcRCDEF, GAL4CfEcRl/2CDEF, 0AL4CfEcRDEF, GAL4CfEcREF, GAL4CfEcRDE transfetadas em células NIH3T3 juntamente com plasmídeos ADN VPlôMmRXRDEF, pFRLUc e pTKRL na presença de ligando não-esteroide ou ligando PonA.
Figura 5: Dados da expressão de várias truncagens de CfEcR, GAL4CfEcRA/BCDEF, GAL4CfEcRCDEF, GAL4CfEcRl/2CDEF, GAL4CfEcRDEF, GAL4CfEcREF, GAL4CfEcRDE transfetadas em células NIH3T3 juntamente com plasmídeos ADN VPlôMmRXREF, pFRLUc e pTKRL na presença de ligando não-esteroide ou ligando PonA.
Figura 6: Dados da expressão de várias truncagens de CfEcR, GAL4CfEcRA/BCDEF, GAL4CfEcRCDEF, GAL4CfEcRl/2CDEF, GAL4CtEcRDEF, GAL4CfEcREF, GAL4CfEcRDE transfetados em células NIH3T3 juntamente com plasmídeos ADN VP16LmUSPDEF, pFRLUc e pTKRL na presença de ligando não-esteroide ou ligando PonA.
Figura 7: Dados da expressão de várias truncagens de CfEcR, GAL4CfEcRA/BCDEF, GAL4CfEcRCDEF, GALACfEcRl/2CDEF, GAL4CfEcRDEF, GALACfEcREF, GAL4CfEcRDE transfetados em células NIH3T3 juntamente com plasmídeos ADN VP16LmUSPEF, pFRLUc e pTKRL na presença de ligando não-esteroide ou ligando PonA.
Figura 8: Dados da expressão de várias truncagens de construções de recetor MmRXR/LmUSP transfetados em células NIH3T3 juntamente com plasmídeos ADN GALACfEcRDEF, pFRLUc e pTKRL na presença de ligando não-esteroide ou ligando PonA. Figura 9: Dados da expressão de domínios de ligação ao 13 ligando CfLJSP-EF, DmUSP-EF, LmUSP-EF, MmRXRá-EF, AmaRXRl-EF e AmaRXR2-EF fundidos com VP16 juntamente com GAL4/CfEcR-DEF e pFRLuc em células NIH3T3 na presença de ligando não-esteroide (GSE) ou ligando PonA.
Figura 10: Dados da expressão de GAL4:CfEcR-DEF/VPl6:LmUSP-EF em células CHO transfetadas de forma estável que compreendem um plasmideo repórter pFRLuc na presença de ligando não-esteroide ou ligando PonA.
Figura 11: Dados da expressão de uma construção de recetor LexA:CfEcR-CDEF transfetado em células NIH3T3 juntamente com 8XLexAopFRLuc e VP16:CfUSP-EF, VP16:LmUSP-EF, VP16:MmRXRá-EF ou VP16:DmUSP-EF na presença de ligando não-esteroide ou ligando PonA.
Figura 12: Células NIH3T3 foram transfetadas com diferentes combinações de GAL4:CfEcR-CDEF ou LexA:CfEcR-CDEF, 8XLexAopFRLuc e VP16:LmUSP-EF ou B42:LmUSP-EF na presença de ligando não-esteroide.
Figura 13: Efeito de ácido 9-cis-retinóico na transativação potencial do gene de troca GAL4CWcR-DEF/VPl6LmUSP-EF juntamente com pFRLuc em células NIH 3T3 na presença de não-esteroide (GSE) e ácido 9-cis-retinóico (9Cis) durante 48 horas.
DESCRIÇÃO DETALHADA DA INVENÇÃO
Os candidatos desenvolveram um novo sistema de expressão de genes induzido baseado no recetor de ecdisona que compreende um polipéptido do recetor X retinoide invertebrado. Os candidatos também demostraram que as truncagens de um polipéptido RXR invertebrado são também funcionais dentro deste sistema de expressão de genes e que estes efeitos mutacionais podem aumentar ou reduzir a atividade de ligação ao ligando ou sensibilidade ao ligando e podem ser específicos do esteroide ou não-esteroide. Assim, a invenção do candidato proporciona um sistema de expressão de genes induzido baseado no recetor de ecdisona 14 /RXR invertebrado útil para modular a expressão de um gene de interesse numa célula hospedeira. Numa modalidade particularmente desejável, a invenção do candidato proporciona um sistema de expressão de genes induzido gue tem um nível reduzido de expressão de genes de fundo e responde a concentrações submicromolares de ligando não-esteroide. Assim, o novo sistema de expressão de genes induzido do candidato e o seu uso em métodos para modular a expressão de genes numa célula hospedeira ultrapassa as limitações dos sistemas de expressão induzidos actualmente disponíveis e providencia ao artesão habilitado com um meio eficaz para controlar a expressão de genes. A presente invenção é útil para aplicações tais como a terapia de genes, produção em grande escala de proteínas e anticorpos, testes de classificação de alto rendimento baseados em células, genómica funcional, proteómica, metabolómica, e regulação de características em organismos transgénicos, em que o controlo dos níveis de expressão de genes é desejável. Uma vantagem da invenção do candidato é que proporciona um meio para regular a expressão de genes e para talhar os níveis de expressão de maneira a ajustá-los aos requisitos do usuário.
DEFINIÇÕES
Nesta revelação, são usados um número de termos e abreviaturas. As definições seguintes são providenciadas e deverão ser úteis na compreensão do âmbito e prática da presente invenção.
Numa modalidade específica, o termo "cerca de" ou "aproximadamente" significa dentro de 20%, preferencialmente dentro de 10%, mais preferencialmente dentro de 5%, e ainda mais preferencialmente dentro de 1% de um dado valor ou intervalo. O termo "substancialmente livre" significa que uma composição que compreende "A" (em que "A" é uma única 15 proteína, molécula de ADN, vector, célula hospedeira recombinante, etc.) é substancialmente livre de "B" (em que "B" compreende uma ou mais proteínas, moléculas de ADN, vectores, etc. contaminantes) quando, pelo menos, cerca de 75% por peso das proteínas, ADN, vectores (dependendo da categoria de espécie a que A e B pertencem) na composição é "A". Preferencialmente, "A" compreende, pelo menos, cerca de 90% por peso de espécie A + B na composição, mais preferencialmente, pelo menos, acerca de 99% por peso. É também preferido que uma composição, que é substancialmente livre de contaminação, contenha apenas uma espécie com peso molecular único tendo a atividade ou caracteristica da espécie de interesse. O termo "isolado" para os fins da presente invenção designa um material biológico (ácido nucleico ou proteína) que foi removido do seu ambiente original (o ambiente em que está naturalmente presente). Por exemplo, um polinucleótido presente no estado natural numa planta ou num animal não está isolado, contudo o mesmo polinucleótido separado dos ácidos nucleicos adjacentes nos quais está naturalmente presente, é considerado "isolado". O termo "purificado" não requer que o material esteja presente numa forma exibindo pureza absoluta, exclusiva da presença de outros compostos. É, em vez disso, uma definição relativa.
Um polinucleótido é, no estado "purificado" após purificação do material de partida ou do material natural até, pelo menos, uma ordem de magnitude, preferencialmente 2 ou 3 e preferencialmente 4 ou 5 ordens de magnitude.
Um "ácido nucleico" é um composto polimérico compreendido por subunidades ligadas de forma covalente designadas nucleótidos. Ácido nucleico inclui ácido ribonucleico (ARN) e ácido desoxirribonucleico (ADN), ambos os quais podem ser de cadeia simples ou de cadeia dupla. O ADN inclui, mas não se limita a, cADN, ADN genómico, plasmídeos de ADN, ADN sintético, e ADN semi-sintético. O 16 ADN pode ser linear, circular, ou superenrolado.
Uma "molécula de ácido nucleico" refere-se a uma forma polimérica de éster de fosfato de ribonucleosideos (adenosina, guanosina, uridina ou citidina; "moléculas de ARN") ou desoxirribonucleosideos (desoxiadenosina, desoxiguanosina, desoxitimidina, ou desoxicitidina; "moléculas de ADN"), ou quaisquer análogos de fosfoéster dos mesmos, tais como fosforotioatos e tioésteres, tanto em forma de cadeia simples, ou em hélice de cadeia dupla. São possíveis hélices ADN-ADN, ADN-ARN e ARN-ARN de cadeia dupla. 0 termo molécula de ácido nucleico, e em particular molécula de ADN ou ARN, refere-se apenas à estrutura primária e secundária da molécula, e não a limita a nenhuma forma terciária particular. Assim, este termo inclui ADN de cadeia dupla encontrado, entre outras coisas, em moléculas lineares ou circulares de ADN (por exemplo, fragmentos de restrição), plasmídeos, e cromossomas. Ao discutir a estrutura de moléculas de ADN de cadeia dupla particulares, as sequências podem ser descritas aqui de acordo com a convenção normal de dar apenas a sequência na direção 5' a 3' ao longo da cadeia de ADN não-transcrita (isto é, a cadeia que tem uma sequência homóloga ao ARNm). Uma "molécula de ADN recombinante" é uma molécula de ADN que foi submetida a uma manipulação biológica molecular. 0 termo "fragmento" será entendido como uma sequência de nucleótidos de comprimento reduzido relativamente ao ácido nucleico de referência e compreende, sobre a porção comum, uma sequência de nucleótidos idêntica à do ácido nucleico de referência. Tal fragmento de ácido nucleico de acordo com a invenção pode ser, onde apropriado, incluído em polinucleótidos maiores dos quais seja um constituinte. Tais fragmentos compreendem, ou em alternativa consistem em, oligonucleótidos que variam em comprimento de, pelo menos, 6, 8, 9, 10, 12, 15, 18, 20, 21, 22, 23, 24, 25, 30, 39, 40, 42, 45, 48, 50, 51, 54, 57, 60, 63, 66, 70, 75, 78, 17 80, 90, 100, 105, 120, 135, 150, 200, 300, 500, 720, 900, 1000 ou 1500 nucleótidos consecutivos de um ácido nucleico de acordo com a invenção.
Como usado aqui, um "fragmento de ácido nucleico isolado" é um polímero de ARN ou ADN que e de cadeia simples ou dupla, contendo opcionalmente bases de nucleótideos sintéticas, não-naturais ou alteradas. Um fragmento de ácido nucleico isolado na forma de um polímero de ADN pode ser compreendido por um ou mais segmentos de ADNc, ADN genómico ou ADN sintético.
Um "gene" refere-se a um conjunto de nucleótidos que codificam um polipéptido, e inclui ácido nucleicos ADNc e ADN genómico. "Gene" também se refere a um fragmento de ácido nucleico que expressa uma proteína ou polipéptido específico, incluindo sequências reguladoras que precedem (sequências não-codificantes 5') e seguem (sequências não-codificantes 3') a sequência codificante. "Gene nativo" refere-se a um gene como encontrado na natureza com as suas próprias sequências reguladoras. "Gene quimérico" refere-se a qualquer gene que não é um gene nativo, que compreende sequências reguladoras e/ou codificantes que não são encontradas juntas na natureza. Em conformidade, um gene quimérico pode compreender sequências reguladoras e sequências codificantes que são derivadas de diferentes fontes, ou sequências reguladoras e sequências codificantes derivadas da mesma fonte, mas organizadas de uma maneira diferente do que aquela que é encontrada na natureza. Um gene quimérico pode compreender sequências codificantes derivadas de diferentes fontes e/ou sequências reguladoras derivadas de diferentes fontes. "Gene endógeno" refere-se a um gene nativo na sua localização natural no genoma de um organismo. Um gene "estrangeiro" ou gene "heterólogo" refere-se a um gene não normalmente encontrado no organismo hospedeiro, mas que é introduzido no organismo hospedeiro por transferência de genes. Os genes estrangeiros podem 18 compreender genes nativos inseridos num organismo não-nativo, ou genes quiméricos. Um "transgene" é um gene que foi introduzido no genoma através de um procedimento de transformação. ADN "heterólogo" refere-se a ADN não localizado naturalmente na célula, ou num local do cromossoma da célula. Preferencialmente, o ADN heterólogo inclui um gene estrangeiro à célula. 0 termo "genoma" inclui ADN ou ARN de cromossomas, bem como de mitocôndrias, de cloroplastos e virais.
Uma molécula de ácido nucleico é "hibridizável" com outra molécula de ácido nucleico, tal como um ADNc, ADN genómico, ou ARN, quando uma forma de cadeia simples da molécula de ácido nucleico pode formar um anel com a outra molécula de ácido nucleico sob as condições de temperatura apropriadas e de força iónica da solução (ver Sambrook et al., 1989 infra). As condições de hibridação e de lavagem são bem conhecidas e exemplificadas em Sambrook, J., Fritsch, E. F. e Maniatis, T. "Molecular Cloning: A Laboratory Manual", Segunda Edição, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (1989), em particular no Capitulo 11 e Quadro 11.1 nele contidos. As condições de temperatura e de força iónica determinam a "restringência" da hibridação.
As condições de restringência podem ser ajustadas para classificar fragmentos moderadamente semelhantes, tais como sequências homólogas a partir de organismos pouco aparentados, a fragmentos altamente semelhantes, tais como genes que duplicam enzimas funcionais a partir de organismos intimamente aparentados. Para uma classificação preliminar de ácido nucleicos homólogos, as condições de baixa restringência de hibridação, correspondendo a uma Tm de 55°, podem ser usadas, por exemplo, 5x SSC, 0,1% SDS, 0,25% leite, e sem formamida; ou 30% formamida, 5x SSC, 0,5% SDS). Condições moderadas de restringência de 19 hibridação correspondem a Tm mais elevadas, por exemplo, 40% formamida, com 5x ou 6x SCC. Condições de elevada restringência de hibridação correspondem à mais alta Tm, por exemplo, 50% formamida, 5x ou 6x SCC. A hibridação requer que dois ácidos nucleicos contenham sequências complementares, apesar de depender da restringência da hibridação, os desemparelhamentos entre bases são possíveis. O termo "complementar" é usado para descrever a relação entre as bases de nucleótidos que são capazes de hibridar umas com as outras. Por exemplo, em relação ao ADN, a adenosina é complementar à timina e a citosina é complementar à guanina. Em conformidade, a invenção instantânea também inclui fragmentos de ácido nucleico isolados que são complementares às sequências completas como revelado ou usado aqui bem como aquelas sequências substancialmente semelhantes de ácidos nucleicos.
Numa modalidade específica, o termo "condições de hibridação padrão" refere-se a uma Tm de 55°C, e utiliza condições tais como estabelecidas anteriormente. Numa modalidade preferida, a Tm é 60°C; numa modalidade mais preferida, a Tm é 65°C.
As lavagens pós-hibridação também determinam as condições de restringência. Um conjunto de condições preferidas usa uma série de lavagens que começam com 6X SSC, 0,5% SDS à temperatura ambiente durante 15 minutos (min), depois repetida com 2X SSC, 0,5% SDS a 45°C durante 30 minutos, e depois repetida duas vezes com 0,2X SSC, 0,5% SDS a 50°C durante 30 minutos. Um conjunto de condições de restringência mais preferido usa temperaturas mais elevadas nas quais as lavagens são idênticas às anteriores com exceção da temperatura das duas lavagens de 30 min finais em 0,2X SSC, 0,5% SDS foi aumentada para 60°C. Um outro conjunto preferido de condições de elevada restringência usa duas lavagens finais em 0,1X SSC, 0,1% SDS a 65°C. A 20 hibridação requer que dois ácidos nucleicos compreendam sequências complementares, apesar de depender da restrinqência da hibridação, os desemparelhamentos entre bases são possíveis. A restrinqência apropriada para hibridar ácidos nucleicos depende do comprimento dos ácidos nucleicos e do grau de complementação, variáveis bem conhecidas na arte. Quanto maior o grau de semelhança ou homologia entre duas sequências de nucleótidos, maior o valor de Tm para híbridos de ácidos nucleicos que têm essas sequências. A estabilidade relativa (correspondendo a Tm mais elevadas) de hibridizações de ácido nucleico diminui na seguinte ordem: ARN:ARN, ADN:ARN, ADN:ADN. Para híbridos com mais de 100 nucleótidos de comprimento, as equações para calular a Tm foram derivadas (ver Sambrook et al., supra, 9.50-0.51). Para hibridação com ácidos nucleicos mais curtos, isto é, oligonucleótidos, a posição dos desemparelhamentos torna-se mais importante, e o comprimento dos oligonucleótidos determina a sua especificidade (ver Sambrook et al., supra, 11. 7-11.8) .
Numa modalidade o comprimento para um ácido nucleico hibridizável é, pelo menos, cerca de 10 nucleótidos. Preferencialmente um comprimento mínimo para um ácido nucleico hibridizável é, pelo menos, cerca de 15 nucleótidos; mais preferencialmente, pelo menos, cerca de 20 nucleótidos; e mais preferencialmente o comprimento é, pelo menos, 30 nucleótidos. Além disso, o artesão habilitado reconhecerá que a temperatura e a concentração de sal da solução de lavagem podem ser ajustadas conforme necessário em função de factores tais como comprimento da sonda. O termo "sonda" refere-se a uma molécula de ácido nucleico de cadeia simples que pode ser um par de bases com um ácido nucleico alvo complementar de cadeia simples para formar uma molécula de cadeia dupla. Como usado aqui, o 21 termo "oligonucleotídeo" refere-se a um ácido nucleico, geralmente de, pelo menos, 18 nucleótidos, que é hibridizável com uma molécula de ADN genómico, uma molécula de ADNc, um plasmídeo de ADN ou uma molécula de ARNm. Oligonucleótidos podem ser rotulados, por exemplo, com nucleótidos 32P ou nucleótidos aos quais um rótulo, tal como biotina, foi conjugado de forma covalente. Um oligonucleótido rotulado pode ser usado como uma sonda para detetar a presença de um ácido nucleico. Oligonucleótidos (um ou ambos os quais podem estar rotulados) podem ser usados como primers de PCR, tanto para clonar a totalidade ou um fragmento de um ácido nucleico, ou para detetar a presença de um ácido nucleico. Um oligonucleótido também pode ser usado para formar uma hélice tripla com uma molécula de ADN. Em geral, oligonucleótidos são preparados sinteticamente, preferencialmente num sintetizador de ácido nucleico. Em conformidade, oligonucleótidos podem ser preparados com combinações análogas de fosfoéster que não ocorrem naturalmente, tal como combinações de tioéster, etc.
Um "primer" é um oligonucleótido que hibridiza com uma sequência alvo de ácidos nucleicos para criar uma região de ácido nucleico de cadeia dupla que pode servir como um ponto de partida para a síntese de ADN sob condições adequadas. Tais primers podem ser usados numa reação em cadeia da polimerase.
"Reação em cadeia da polimerase" é abreviada PCR e significa um método in vitro para amplificar enzimaticamente sequências de ácidos nucleicos específicas. PCR envolve series repetitivas de ciclos de temperatura com cada ciclo compreendendo três fases: desnaturação do ácido nucleico molde para separar as cadeias da molécula alvo, hibridação entre o primer oligonucleótido PCR de cadeia simples com o ácido nucleico molde, e extensão do(s) primer(s) hibridado(s) pela polimerase de ADN. PCR 22 proporciona um meio para detetar a presença da molécula alvo e, em condições quantitativas ou semiquantitativas, para determinar a quantidade relativa dessa molécula alvo dentro do pool inicial de ácidos nucleicos. "Reação em cadeia da polimerase via transcriptase reversa" é abreviada RT-PCR e significa um método in vitro para produzir enzimaticamente uma molécula ou moléculas de ADNc alvo a partir de molécula ou molécula de ARN, seguido de amplificação enzimática de uma sequência ou sequências especifica(s) de ácidos nucleicos dentro da molécula ou moléculas de ADNc alvo tal como descrito anteriormente. RT-PCR também proporciona um método para detetar a presença da molécula alvo e, em condições quantitativas ou semiquantitativas, para determinar a quantidade relativa dessa molécula alvo dentro do pool inicial de ácidos nucleicos.
Uma "sequência codificante" de ADN é uma sequência de ADN de cadeia dupla que é transcrita e traduzida num polipéptido numa célula in vitro ou in vivo quando colocada sob o controlo das sequências reguladoras adequadas. "Sequências reguladoras adequadas" referem-se a sequências de nucleótidos localizadas a montante (sequências não-codificantes 5'), dentro de, ou a jusante (sequências não-codificantes 3') de uma sequência codificante, e que influenciam a transcrição, processamento ou estabilidade do ARN, ou translação da sequência codificante associada. Sequências reguladoras podem incluir promotores, sequências lideres de translação, intrões, sequências de reconhecimento de poliadenilação, local de processamento do ARN, local de ligação do efeito efetor e estrutura de haste e ansa. Os limites da sequência codificante são determinados por um codão de iniciação no N-terminal 5' e por um codão de terminação de translação no terminal-3' (carboxi). Uma sequência codificante pode incluir, mas não se limita a, sequências procarióticas, ADNc a partir de 23 ARNm, sequências de ADN genómico, e até sequências de ADN sintéticas. Se se pretende que a sequência codificante seja para expressão numa célula eucarionte, um sinal de poliadenilação e sequência de terminação de transcrição serão normalmente localizados 3' na sequência codificante. "Estrutura de leitura aberta" é abreviada ORF e significa um comprimento de uma sequência de ácidos nucleicos, seja ADN, ADNc ou ARN, que compreende um sinal de iniciação de translação ou codão de iniciação, tal como um ATG ou AUG, e um codão de terminação e pode ser potencialmente traduzida numa sequência de polipéptidos. 0 termo "head-to-head" é usado aqui para descrever a orientação de duas sequências de polinucleótidos uma em relação à outra. Dois polinucleótidos são posicionados numa orientação head-to-head quando a extremidade 5' da cadeia codificante de um polinucleótido é adjacente à extremidade 5' da cadeia codificante do outro polinucleotídeo, de tal maneira que a direção da transcrição de cada polinucleótido prossegue para o lado oposto à extremidade 5' do outro polinucleotídeo. 0 termo "head-to-head" pode ser abreviado para (5')-para-(5') e pode também ser indicado pelos símbolos (<—►) ou (3 '<-5'5 '-»3 ') . 0 termo "tail-to-tail" é usado aqui para descrever a orientação de duas sequências de polinucleótidos uma em relação à outra. Dois polinucleótidos são posicionados numa orientação tail-to-tail quando a extremidade 3' da cadeia codificante de um polinucleótido é adjacente à extremidade 3' da cadeia codificante do outro polinucleotídeo, de tal maneira que a direção de transcrição de cada polinucleótido prossegue em direção ao outro polinucleotídeo. 0 termo "tail-to-tail" pode ser abreviado (3 ')-para-(3') e pode também ser indicado pelos símbolos (-> <-) ou (5 '->3'3 '<-5 ') . 0 termo "head-to-tail" é usado aqui para descrever a orientação de duas sequências de polinucleótidos uma em relação à outra. Dois polinucleótidos são posicionados numa orientação head-to-tail quando a extremidade 5' da cadeia codificante de um polinucleótido é adjacente à extremidade 3' da cadeia codificante do outro polinucleotídeo, de tal maneira que a direção de transcrição de cada polinucleótido prosseque na mesma direção da do outro polinucleotídeo. 0 termo "head-to-tail" pode ser abreviado (5')-para-(3') e pode também ser indicado pelos símbolos (-► -»·) ou (5'-3'5'-3'). 0 termo "a jusante" refere-se a uma sequência de nucleótidos que está localizada 3' em relação à sequência de nucleótidos de referência. Em particular, as sequências de nucleótidos a jusante qeralmente estão relacionadas com sequências que sequem o ponto de partida da transcrição. Por exemplo, o codão de iniciação da translação de um qene está localizado a jusante do local de partida da transcrição. 0 termo "a montante" refere-se a uma sequência de nucleótidos que está localizada 5' em relação à sequência de nucleótidos de referência. Em particular, as sequências de nucleótidos a montante geralmente estão relacionadas com sequências que estão localizadas na extremidade 5' da sequência codificante ou ponto de partida da transcrição. Por exemplo, a maioria dos promotores estão localizados a montante do local de partida da transcrição.
Os termos "endonuclease de restrição" e "enzima de restrição" referem-se a uma enzima que se liga e corta dentro de uma sequência de nucleótidos específica dentro da cadeia dupla de ADN. "Recombinação homóloga" refere-se à inserção de uma sequência de ADN estranha numa outra molécula de ADN, por exemplo, inserção de um vector num cromossoma. Preferencialmente, o vector aponta para um local específico do cromossoma para a recombinação homóloga. Para recombinação homóloga específica, o vector conterá regiões de homologia suficientemente longas para as sequências do 25 cromossoma para permitir a ligação complementar e incorporação do vector no cromossoma. Regiões de homologia mais longas, e graus superiors de semelhança de seguências, podem aumentar a eficiência da recombinação homóloga. Vários métodos conhecidos na arte podem ser usados para propagar um polinucleótido de acordo com a invenção. Assim que um sistema hospedeiro adequado e as condições de crescimento estejam estabelecidos, os vectores de expressão recombinante podem ser propagados e preparados em quantidade. Como descrito aqui, os vectores de expressão que podem ser usados incluem, mas não se limitam a, os seguintes vectores ou seus derivados: vírus humanos ou animais tais como vaccinia virus ou adenovirus; vírus de insectos tais como baculovirus; vectores de levedura; vectores bacteriófagos (por exemplo, lambda), e vectores de plasmídeo e cosmídeo de ADN, para designar uns poucos.
Um "vector" é qualquer meio que serve para clonar e/ou transferir um ácido nucleico para uma célula hospedeira. Um vector pode ser um replicão ao qual outro segmente de ADN pode ser anexado de forma a causar a replicação do segmento anexado. Um "replicão" é qualquer elemento genético (por exemplo, plasmídeo, fago, cosmídeo, cromossoma, vírus) que funciona como uma unidade autónoma da replicação do ADN in vivo, isto é, capaz de replicação sob o seu próprio controlo. 0 termo "vector" inclui tanto meios virais como não-virais para introduzir o ácido nucleico na célula in vitro, ex vivo ou in vivo. Um grande número de vectores conhecidos na arte podem ser usados para manipular ácidos nucleicos, incorporar elementos de resposta e promotores em genes, etc. Possíveis vectores incluem, por exemplo, plasmídeos ou vírus modificados incluindo, por exemplo bacteriófagos tal como derivados do lambda, ou plasmídeos tal como PBR322 ou derivados dos plasmídeos pUC, ou o vector Bluescript. Por exemplo, a inserção dos fragmentos de ADN correspondendo a elementos de resposta e promotores 26 num vector adequado podem ser conseguidos ligando os fragmentos de ADN apropriados num vector selecionado que tenha terminais coesivos complementares. Em alternativa, as extremidades das moléculas de AND podem ser modificadas enzimaticamente ou qualquer local pode ser produzido ligando as sequências de nucleótidos (linkers) aos terminais de ADN. Tais vectores podem ser alterados por engenharia genética para conter genes marcadores selecionáveis que possibilitam a seleção de células que incorporaram o marcador no genoma celular. Tais marcadores permitem a identificação e/ou seleção de células hospedeiras que incorporam e expressam as proteínas codificadas pelo marcador.
Os vectores virais, e particularmente os vectores retrovirais, têm sido usados numa grande variedade de aplicações de entrega de genes em células, bem como em sujeitos animais vivos. Os vectores virais que podem ser usados incluem, mas não se limitam a, vectores de retrovírus, vírus adenoassociados, vírus da varíola, baculovírus, vaccinia, herpes simplex, Epstein-Barr, adenovírus, geminivírus, e caulimovírus. Os vectores não-virais incluem plasmídeos, lipossomas, lípidos carregados electricamente (citofectinas) , complexos ADN-proteína, e biopolímeros. Além disso, para um ácido nucleico, um vector também pode compreender uma ou mais regiões reguladoras, e/ou marcadores selecionáveis úteis para selecionar, medir, e monitorizar os resultados de transferência de ácido nucleico (transferência para que tecidos, duração da expressão, etc.). 0 termo "plasmídeo" refere-se a um elemento extra cromossoma que frequentemente carrega um gene que não é parte do metabolismo central da célula, e normalmente na forma de moléculas de ADN de cadeia dupla circulares. Tais elementos podem ser sequências de replicação autónoma, sequências de integração no genoma, fagos ou sequências de 27 nucleótidos, linear, circular, ou superenroladas, de um ADN ou ARN de cadeia simples ou dupla, derivado de qualquer fonte no qual um número de sequências de nucleótidos foram combinadas ou recombinadas numa construção única que é capaz de introduzir um fraqmento promotor e uma sequência de ADN para um produto de qene selecionado juntamente com a sequência não traducida 3' apropriada numa célula.
Um "vector de clonaqem" é um "replicão", que é uma unidade de comprimento de um ácido nucleico, preferencialmente ADN, que se replica sequencialmente e que compreende uma oriqem de replicação, tal como um plasmídeo, faqo ou cosmideo, ao qual outro seqmento de ácido nucleico pode ser anexado de maneira a causar a replicação do seqmento anexado. Os vectores de clonaqem podem ser capazes de replicação num tipo de célula e expressão num outro ("vector de vai-vem").
Os vectores podem ser introduzidos nas células hospedeiras desejadas através de métodos conhecidos na arte, por exemplo, transfeção, electroporação, microinjeção, transdução, fusão de células, DEAE dextran, precipitação de fosfato de cálcio, lipofeção (fusão de lisossomas), uso de uma pistola de genes, ou um transportador de vector ADN (ver, por exemplo, Wu et al., 1992, J. Biol. Chem. 267: 963-967; Wu e Wu, 1988, J. Biol. Chem. 263: 14621-14624; e Hartmut et al., Formulário da Patente Canadiana N.° 2,012,311, preenchido em 15 de Março de 1990).
Um polinucleótido, de acordo com a invenção, também pode ser introduzido in vivo por lipofeção. Ao longo da última década, tem havido um uso crescente de lipossomas para encapsulação e transfeção de ácidos nucleicos in vitro. Lipidos catiónicos sintéticos designados para limitar as dificuldades e perigos encontrados com a transfeção mediada por lipossomas podem ser usados para preparar lipossomas para transfeção in vivo de um gene que 28 codifica um marcador (Felgner et al., 1987, PNAS 84: 7413; Mackey, et al., 1988, Proc. Natl. Acad. Sei. U.S.A 85: 8027-8031; e Ulmer et al., 1993, Science 259: 1745-1748). O uso de lípidos catiónicos pode promover a encapsulação de ácidos nucleicos carregados negativamente, e também promover a fusão com membranas celulares carregadas negativamente (Felgner e Ringold, 1989, Science 337: 387-388). Compostos e composições de lípidos particularmente úteis para transferir ácidos nucleicos são descritas nos Formulários das Patentes Internacionais W095/18863 e W096/17823, e na Patente U.S. N.° 5, 459,127. O uso de lipofeção para introduzir genes exógenos nos órgãos específicos in vivo tem certas vantagens práticas. Apontar, de forma molecular, os lipossomas a células específicas representa uma área de benefício. É evidente gue dirigir a transfeção para tipos de célula particulares seria particularmente preferido num tecido com heterogeneidade celular, tal como pâncreas, fígado, rim, e o cérebro. Os lípidos podem ser ligados guimicamente a outras moléculas com o fim de dirigi-los (Mackey, et al., 1988, supra). Os péptidos dirigidos, por exemplo, hormonas ou neurotransmissores, e proteínas tais como anticorpos, ou moléculas não-péptidos podem ser ligadas a lipossomas quimicamente.
Outras moléculas são também úteis para facilitar a transfeção de um ácido nucleico in vivo, tal como um oligopéptido catiónico (por exemplo, W095/21931), péptidos derivados a partir de proteínas de ligação ao ADN (por exemplo, WO96/25508), ou um polímero catiónico (por exemplo, W095/21931).
Também é possível introduzir um vector in vivo como um plasmídeo de ADN nú (ver Patentes U.S. 5,693,622, 5,589,466 e 5,580,859). Abordagens de entrega do ADN mediadas por recetores também podem ser usadas (Curiel et al., 1992, Hum. Gene Ther. 3: 147-154; e Wu e Wu, 1987, J. Biol. Chem 29 262 : 4429-4432) . 0 termo "transfeção" significa a absorção de ADN ou ARN heterólogo ou exógeno por uma célula. Uma célula foi "transfetada" por ADN ou ARN heterólogo ou exógeno quando tal ARN ou ADN foi introduzido dentro da célula. Uma célula foi "transformada" por um ADN ou ARN heterólogo ou exógeno quando o ARN ou ADN transfetado provoca uma alteração fenotipica. 0 ARN ou ADN transformado pode ser integrado (ligado de forma covalente) em ADN de cromossoma fazendo parte do genoma da célula. "Transformação" refere-se à transferência de um fragmento de ácido nucleico para o genoma de um organismo hospedeiro, resultando numa herança geneticamente estável. Os organismos hospedeiros que contêm os fragmentos de ácidos nucleicos transformados designam-se como organismos "transgénicos" ou "recombinantes" ou "transformados". 0 termo "região genética" referir-se-á a uma região de uma molécula de ácido nucleico ou a uma sequência de nucleótidos que compreende um gene que codifica um polipéptido.
Além disso, o vector recombinante que compreende um polinucleótido, de acordo com a invenção, pode incluir uma ou mais origens para replicação nos hospedeiros celulares nas quais a sua amplificação ou a sua expressão é procurada, marcadores ou marcadores selecionáveis. 0 termo "marcador selecionável" significa um factor identificador, normalmente um antibiótico ou gene de resistência química, que é capaz de ser selecionado com base no efeito do gene marcador, isto é, resistência a um antibiótico, resistência a um herbicida, marcadores colorimétricos, enzimas, marcadores fluorescentes, e afins, em que o efeito é usado para seguir a herança de um ácido nucleico de interesse e/ou para identificar uma célula ou organismo que herdou o ácido nucleico de interesse. Exemplos de genes marcadores selecionáveis conhecidos e 30 usados na arte incluem: genes que providenciam resistência à ampicilina, streptomicina, gentamicina, canamicina, higromicina, herbicida bialafos, sulfonamida, e afins; e genes que são usados como marcadores fenotipicos, isto é, genes reguladores da antocianina, gene da transferase isopentanil, e afins. O termo "gene repórter" significa um ácido nucleico que codifica um factor identificador que é capaz de ser identificado com base no efeito do gene repórter, em que o efeito é usado para seguir a herança de um ácido nucleico de interesse, para identificar uma célula ou organismo que herdou o ácido nucleico de interesse, e/ou para medir a indução ou transcrição da expressão de genes. Exemplos de genes repórteres conhecidos e usados na arte incluem: luciferase (Luc), proteína verde fluorescente (GFP), acetiltransferase cloramfenicol (CAT), β-galactosidase (LacZ), β-glucuronidase (Gus), e afins. Genes marcadores selecionáveis também podem ser considerados genes repórteres. "Promotor" refere-se a uma sequência de ADN capaz de controlar a expressão de uma sequência codificante ou ARN funcional. Em geral, uma sequência codificante está localizada em 3' para uma sequência promotora. Promotores podem ser derivados na sua totalidade de um gene nativo, ou ser compostos por diferentes elementos derivados de diferentes promotores encontrados na natureza, ou mesmo compreender segmentos de ADN sintéticos. É entendido por aqueles habilitados na arte que diferentes promotores podem dirigir a expressão de um gene em diferentes tecidos ou tipos de células, ou em diferentes fases do desenvolvimento, ou em resposta a diferentes condições ambientais ou fisiológicas. Os promotores que causam a expressão de um gene na maioria dos tipos de células na maioria das vezes são normalmente designados como "promotores constitutivos". Os promotores que causam a 31 expressão de um gene num tipo de célula específico são normalmente designados por "promotores específicos de célula" ou "promotores específicos de tecido". Os promotores que causam a expressão de um gene numa fase específica do desenvolvimento ou diferenciação de uma célula são normalmente referenciados como "promotores específicos do desenvolvimento" ou "promotores específicos da diferenciação da célula". Os promotores que são induzidos e que causam a expressão de um gene após a exposição ou tratamento da célula com um agente, molécula biológica, químico, ligando, luz, ou afins que induz o promotor são normalmente designados como "promotores induzidos" ou "promotores reguláveis". É, ainda, reconhecido que, uma vez que na maioria dos casos os limites exactos das sequências reguladoras não foram completamente definidos, os fragmentos de ADN de diferentes comprimentos podem ter uma atividade do promotor idêntica.
Uma "sequência promotora" é uma região do ADN reguladora capaz de se ligar à polimerase do ARN numa célula e iniciar a transcrição a jusante (direção 3') de uma sequência codificante. Com o fim de definir a presente invenção, a sequência do promotor está atada ao seu terminal 3' pelo local de iniciação da transcrição e estende-se a montante (direção 5') para incluir o número mínimo de bases ou elementos necessários para iniciar a transcrição a níveis detetáveis acima do fundo. Dentro da sequência promotora será encontrado um local de iniciação da transcrição (convenientemente definido, por exemplo, por mapeamento com nuclease Sl), bem como domínios de ligação a proteínas (sequências de consenso) responsável pela ligação da polimerase de ARN.
Uma sequência codificante está "sob o controlo" de sequências de controlo transcricionais e translacionais numa célula quando a polimerase de ARN transcreve a sequência codificante em ARNm, que é depois cortado em 32 trans-RNA (se a sequência codificante contém intrões) e traduzida na proteína codificada pela sequência codificante. "Sequências de controlo transcricionais e translacionais" são sequências reguladoras de ADN, tais como promotores, potenciadores, terminadores, e afins, que providenciam a expressão de uma sequência codificante numa célula hospedeira. Em células eucariontes, os sinais de poliadenilação são sequências de controlo. 0 termo "elemento de resposta" significa um ou mais elementos de ADN cis-actuantes que conferem capacidade de resposta num promotor mediado através da interacção com o domínio de ligação ao ADN do primeiro gene quimérico. Este elemento de ADN pode ser tanto palindrómico (perfeito ou imperfeito) na sua sequência ou composto por motivos de sequência ou metades de locais separados por um número variável de nucleótidos. As metades de locais podem ser semelhantes ou idênticas e organizadas como repetições quer directas quer invertidas ou como uma metade única de local ou multímeros de metades de locais adjacentes em tandem. 0 elemento de resposta pode compreender um promotor mínimo isolado a partir de diferentes organismos dependendo da natureza da célula ou organismo no qual o elemento de resposta será incorporado. 0 domínio de ligação ao ADN da primeira proteína híbrida liga-se, na presença ou ausência de um ligando, à sequência de ADN de um elemento de resposta para iniciar ou suprimir a transcrição a jusante de um gene(s) sob a regulação deste elemento de resposta. Exemplos de sequências de ADN para elementos de resposta do recetor de ecdisona natural incluem: RRGG/TTCANTGAC/ACYY (ver Cherbas L., et. al., (1991), Genes Dev. 5: 120-131); AGOTCAN(n)AGGTCA, onde N(n) pode ser um ou mais nucleótidos espaçadores (ver D'Avino PP., et. al., (1995), Mol. Cell Endocrinol 113: 1-9); e GGGTTGAATGAATTT (ver Antoniewski C., et. al., (1994), Mol. Cell Biol. 14:4465-4474). 33 0 termo "ligado de modo funcional" refere-se à associação da sequência de ácidos nucleicos com um único fragmento de ácido nucleico de maneira que a função de um é afetada pelo outro. Por exemplo, um promotor está ligado de modo funcional com uma sequência codificante quando é capaz de afetar a expressão dessa sequência codificante (isto é, que a sequência codificante está sob o controlo transcricional do promotor). As sequências codificantes podem estar ligadas de modo funcional a sequências reguladoras em orientação senso ou anti-senso. 0 termo "expressão", como usado aqui, refere-se à transcrição e acumulação estável de ARN senso (ARNm) ou anti-senso derivado a partir de um ácido nucleico ou polinucleotideo. A expressão pode também referir-se à translação de ARNm numa proteína ou polipéptido. uma
Os termos "cassete", "cassete de expressão" e "cassete de expressão de genes" referem-se a um segmento de ADN que pode ser inserido num ácido nucleico ou polinucleótido em locais de restrição específicos ou por recombinação homóloga. 0 segmento de ADN compreende um polinucleótido que codifica um polipéptido de interesse, e a cassete e locais de restrição são designados para assegurar a inserção da cassete na estrutura de leitura adequada para a transcrição e translação. "Cassete de transformação" refere-se a um vector específico que compreende um polinucleótido que codifica um polipéptido de interesse e tem elementos além do polinucleótido que facilita a transformação de uma célula hospedeira particular. Cassetes, cassetes de expressão, cassetes de expressão de genes e cassete de transformação da invenção também podem compreender elementos que possibilitam uma expressão potenciada de um polinucleótido que codifica um polipéptido de interesse numa célula hospedeira. Estes elementos podem incluir, mas não se limitam a: um promotor, um promotor mínimo, um potenciador, um elemento de resposta, 34 sequência de terminação, uma sequência de poliadenilação, e afins.
Para o objetivo desta invenção, o termo "troca de genes" refere-se a combinação de um elemento de resposta associado com um promotor, e um sistema baseado em EcR que, na presença de um ou mais ligandos, modula a expressão de um gene no qual o elemento de resposta e promotor são incorporados.
Os termos "modular" e "modula" significam induzir, reduzir ou inibir a expressão de um ácido nucleico ou de um gene, resultando na respectiva indução, redução ou inibição da produção da proteína ou polipéptido.
Os plasmídeos ou vectores de acordo com a invenção podem, ainda, compreender, pelo menos, um promotor adequado para dirigir a expressão de um gene numa célula hospedeira. 0 termo "vector de expressão" significa um vector, plasmideo ou veículo designado para permitir a expressão de uma sequência inserida de ácidos nucleicos seguido de transformação no hospedeiro. 0 gene clonado, isto é a sequência de ácido nucleico inserida, é normalmente colocada sob o controlo de elementos de controlo tais como um promotor, um promotor mínimo, um potenciador, ou afins. As regiões de controlo de iniciação ou promotores, que são úteis para dirigir a expressão de um ácido nucleico na célula hospedeira desejada são numerosas e familiares àqueles habilitados na arte. Virtualmente qualquer promotor capaz de dirigir estes genes é adequado para a presente invenção incluindo, mas não limitado a: promotores virais, promotores bacterianos, promotores animais, promotores de mamíferos, promotores sintéticos, promotores constitutivos, promotor especifico de tecido, promotores específicos do desenvolvimento, promotores induzidos, promotores regulados pela luz; CYC1, HIS3, GALl, GAL4, GAL10, ADH1, PGK PH05, GAPDH, ADC1, TRPl, URA3, LEU2, ENO, TPI, promotores da fosfatase alcalina (úteis para expressão em Saccharomyces); 35 promotor A0X1 (útil para expressão em Pichia); β-lactamase, promotores lac, ara, tet, trp, 1PL, 1PR, T7, tac, e trc (úteis para expressão em Escherichia coli); promotores regulados pela luz; promotores animais e de mamíferos conhecidos na arte incluem, mas não se limitam a, região de promotor inicial SV40 (SV40e), o promotor continha long terminal repeats (LTR) em 3' do vírus do sarcoma de Rous (RSV), os promotores do EIA ou genes do promotor tardio principal (MLP) de adenovírus (Ad), o promotor inicial de citomegalovírus (CMV), o virus de herpes simplex (HSV) promotor da timidina quinase (TK), um promotor de factor de alongamento 1 alfa (EF1), um promotor da fosfoglicerato quinase (PGK), um promotor da ubiquitina (Ubc), um promotor da albumina, o promotor das sequências reguladoras do rato metalotioneina-L e regiões de controlo transcricionais, os promotores ubíquos (HPRT, vimentina, α-actina, tubulina e afins), os promotores dos filamentos intermediários (desmina, neurofilamentos, queratina, GFAP, e afins), os promotores de genes terapêuticos (de tipo MDR, CFTR ou factor VIII, e afins), promotores relacionados com patogénese ou doença, e promotores que exibem especificidade ao tecido e que têm sido utilizados em animais transgénicos, tais como a região de controlo do gene da elastase I que está activo nas células acinares do pâncreas; região de controlo do gene da insulina activa nas células beta do pâncreas, região de controlo do gene da imunoglobulina activa em células linfoides, região de controlo do vírus do tumor mamário de rato activa em células testiculares, mamárias, linfoides e do mastro; regiões de controlo do gene da albumina, Apo AI e Apo AII activas no fígado, região de controlo do gene a-fetoproteína activa no fígado, região de controlo do gene cx 1-antitripsina activa no fígado, região de controlo do gene da β-globina activa em células mieloides, região de controlo do gene da proteína básica da mielina activa em 36 células oligodendrocíticas no cérebro, região de controlo do gene de cadeia leve-2 da miosina activo no músculo esquelético e região de controlo do gene da hormona libertadora de gonadotropinas activa no hipotálamo, promotor da piruvato quinase, promotor da vilina, promotor da proteína intestinal de ligação ao ácido gordo, promotor da cx-actina da célula do músculo liso, e afins. Além disso, estas sequências de expressão podem ser modificadas adicionando um potenciador ou sequências reguladoras e afins.
Os potenciadores que podem ser usados nas modalidades da invenção incluem, mas não se limitam a: um potenciador de SV40, um potenciador do citomegalovírus (CMV), um potenciador do factor de alongamento 1 (EFl), potenciadores de levedura, potenciadores de gene virai, e afins.
As regiões de controlo da terminação, isto é, sequências de terminação ou de poliadenilação, também podem ser derivadas a partir de vários genes nativos aos seus hospedeiros preferidos. Opcionalmente, um local de terminação pode ser desnecessário, contudo, é mais preferido se incluído. Numa modalidade preferida da invenção, a região de controlo da terminação pode ser compreendida ou pode ser derivada a partir de uma sequência sintética, sinal de poliadenilação sintético, um sinal de poliadenilação tardio de SV40, um sinal de poliadenilação de SV40, um sinal de poliadenilação da hormona de crescimento bovina (BGH), sequências de terminação virais, e afins.
Os termos "sequências 3' não-codificantes" ou "região não traduzida 3' (UTR)" referem-se a sequências de ADN localizadas a jusante (3') de uma sequência codificante e podem compreender sequências de reconhecimento de poliadenilação [poli(A)] e outras sequências que codificam sinais de regulação capazes de afetar o processamento do ARNm ou a expressão de genes. 0 sinal de poliadenilação é 37 normalmente caracterizado por afetar a adição de partes de ácido poliadenílico à extremidade 3' do precursor do ARNm. "Região reguladora" significa uma sequência de ácidos nucleicos que regula a expressão de uma segunda sequência de ácidos nucleicos. Uma região reguladora pode incluir sequências que são naturalmente responsáveis por expressar um ácido nucleico particular (uma região homóloga) ou podem incluir sequências com origem diferente que são responsáveis por expressar diferentes proteínas ou mesmo proteínas sintéticas (uma região heteróloga). Em particular, as sequências podem ser sequências de genes virais, eucariontes ou procariontes ou sequências derivadas que estimulam ou reprimem a transcrição de um gene de uma maneira específica ou não-específica e de uma maneira induzida ou não-induzida. Regiões reguladoras incluem origens de replicação, locais de corte do ARN, promotores, potenciadores, sequências de terminação transcricional, e sequências de sinal que dirigem o polipéptido nas vias secretoras da célula alvo. A região reguladora de uma "fonte heteróloga" é uma região reguladora que não está naturalmente associada com o ácido nucleico expresso. Incluídas nas regiões reguladoras heterólogas estão as regiões reguladoras de uma espécie diferente, regiões reguladoras de um gene diferente, sequências reguladoras híbridas, e sequências reguladoras que não ocorrem na natureza, mas que são designadas por alguém com habilitação comum na arte. "Transcrito do ARN" refere-se ao produto que resulta da transcrição catalizada pela polimerase do ARN de uma sequência de ADN. Quando o transcrito do ARN é uma cópia complementar perfeita da sequência de ADN, é referido como o primeiro transcrito ou pode ser uma sequência de ARN derivada do processamento pós-transcricional do primeiro transcrito e é referido por ARN maduro. "ARN mensageiro (ARNm)" refere-se ao ARN que não tem intrões e que pode ser 38
traduzido em proteína pela célula. "ADNc" refere-se a um ADN de cadeia dupla que é complementar ao derivado do ARNm. ARN "senso" refere-se ao transcrito do ARN que inclui o ARNm e, por isso, pode ser traduzido em proteína pela célula. "ARN anti-senso" refere-se a um transcrito do ARN que é complementar a todo ou parte de um primeiro transcrito alvo ou ARNm e que bloqueia a expressão do gene alvo. A complementariedade de um ARN anti-senso pode ser com qualquer parte do transcrito do gene específico, isto é, a 5' da sequência não-codif icante, a 3' da sequência não-codificante, ou a sequência codificante. "ARN funcional" refere-se a ARN anti-senso, ARN ribozima, ou outro ARN que não é traduzido, mas que tem um efeito nos processos celulares.
Um "polipéptido" é um composto polimérico compreendido de resíduos de aminoácidos ligados de forma covalente. Os aminoácidos têm a seguinte estrutura geral:
H
I
R-C-COOH NHj
Os aminoácidos estão classificados em sete grupos com base na cadeia lateral grupo-R: (1) cadeias laterias alifáticas, (2) cadeias laterais que contêm um grupo hidroxílico (OH), (3) cadeias laterais que contêm átomos de enzofre, (4) cadeias laterais que contêm um grupo acídico ou amido, (5) cadeias laterais que contêm um grupo básico, (6) cadeias laterais que contêm um anel aromático, e (7) prolina, um aminoácido no qual a cadeia lateral é fundida com o grupo amino. Um polipéptido da invenção preferencialmente compreende, pelo menos, cerca de 14 aminoácidos. 39
Uma "proteína" é um polipéptido que desempenha um papel estrutural ou funcional na célula viva.
Um "polipéptido isolado" ou "proteína isolada" é um polipéptido ou proteína que é substancialmente livre desses compostos que estão normalmente associados com isso no seu estado natural (por exemplo, outras proteínas ou polipéptidos, ácidos nucleicos, carbohidratos, lípidos). "Isolado" não se pretende que exclua misturas artificiais ou sintéticas com outros compostos, ou a presença de impurezas que não interferem com a atividade biológica, e que podem estar presentes, por exemplo, devido a purificação incompleta, adição de estabilizadores, ou combinação numa preparação farmaceuticamente aceitável. "Fragmento" de um polipéptido, de acordo com a invenção, será entendido como um polipéptido cuja sequência de aminoácidos é mais curta do que a do polipéptido de referência e que compreende, sobre a porção inteira destes polipéptidos de referência, uma sequência de aminoácidos idêntica. Tais fragmentos podem, quando apropriado, ser incluídos num polipéptido maior do qual fazem parte. Tais fragmentos de um polipéptido, de acordo com a invenção, podem ter um comprimento de, pelo menos, 2, 3, 4, 5, 6, 8, 10,13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 25, 26, 30, 35, 40, 45, 50, 100, 200, 240, ou 300 aminoácidos.
Uma "variante" de um polipéptido ou proteína é qualquer análogo, fragmento, derivado, ou mutante que é derivado de um polipéptido ou proteína e que retém, pelo menos, uma propriedade biológica do polipéptido ou proteína. Dferentes variantes do polipéptido ou proteína podem existir na natureza. Estas variantes podem ser variações alélicas caracterizadas por diferenças nas sequências de nucleótidos do gene estrutural que codifica a proteína, ou podem envolver junção diferencial ou modificação pós-translacional. 0 artesão habilitado pode produzir variantes que têm substituições, deleções, adições 40 ou reposições únicas ou múltiplas de aminoácidos. Estas variantes podem incluir, entre outras coisas: (a) variantes em que um ou mais residuos de aminoácidos são substituídos com aminoácidos conservativos ou não-conservativos, (b) variantes em que um ou mais aminoácidos são adicionados ao polipéptido ou proteína, (c) variantes em que um ou mais dos aminoácidos inclui um grupo substituinte, e (d) variantes em que o polipéptido ou proteína é fundido com outro polipéptido tal como soro de albumina. As técnicas para obter estas variantes, incluindo técnicas genéticas (supressões, deleções, mutações, etc.), químicas, e enzimáticas, são conhecidas por pessoas com habilitação comum na arte. Um polipéptido variante preferencialmente compreende, pelo menos, cerca de 14 aminoácidos.
Uma "proteína heteróloga" refere-se a uma proteína não naturalmente produzida pela célula.
Uma "proteína madura" refere-se a um polipéptido processado pós-translação; isto é, um do qual qualquer pré-ou pró-péptidos presentes no produto primário da translação foram removidos. "Proteína precursora" refere-se a um produto primário da translação de ARNm; isto é, com pré- e pró-péptidos ainda presentes. Pré- e pró-péptidos podem ser, mas não se limitam a, sinais de localização intracelulares. O termo "péptido sinal" refere-se a um polipéptido N-terminal que precede a proteína madura segregada. O péptido sinal é dividido a partir de, e por isso não está presente na proteína madura. Os péptidos sinal têm a função de dirigir e translocar as proteínas segregadas ao longo das membranas das células. O péptido sinal também é designado por proteína sinal.
Uma "sequência sinal" está incluída no início da sequência codificante de uma proteína a ser expressa na superfície de uma célula. Esta sequência codifica um péptido sinal, N-terminal para o polipéptido maduro, que 41 dirige a célula hospedeira a translocar o polipéptido. 0 termo "sequência sinal de translocação" é usado aqui para se referir a este tipo de sequência sinal. As sequências sinal de translocação podem ser encontradas associadas com uma variedade de proteínas nativas aos eucariontes e procariontes, e são frequentemente funcionais em ambos tipos de organismos. 0 termo "homologia" refere-se à percentagem de identidade entre dois polinucleótidos ou duas metades de polipéptidos. A correspondência entre a sequência de uma metade e outra pode ser determinada através de técnicas conhecidas na arte. Por exemplo, a homologia pode ser determinada através da comparação directa da informação da sequência entre duas moléculas polipéptídicas por alinhamento da informação da sequência e usando programas de computador prontamente disponíveis. Em alternativa, a homologia pode ser determinada através de hibridação de polinucleótidos sob condições que formam duplexes estáveis entre regiões homólogas, seguida de digestão com nuclease(s) específicas de cadeia simples e da determinação do tamanho dos fragmentos digeridos.
Como usado aqui, o termo "homólogo" em todas as suas formas gramaticais e variações de soletração refere-se à relação entre proteínas que possuem uma "origem evolutivamente comum," incluindo proteínas de superfamílias (por exemplo, a superfamília das imunoglobulinas) e proteínas homólogas de diferentes espécies (por exemplo, cadeias leves de miosina, etc.) (Reeck et al., 1987, Cell 50: 667.). Tais proteínas (e os seus genes codificantes) têm homologia de sequência, tal como é reflectido pelos seus elevados graus de semelhança de sequências. Contudo, no uso comum e na aplicação instantânea, o termo "homóloga," quando modificado com um advérbio tal como "altamente, " pode referir-se à semelhança de sequências e não a uma origem evolutivamente comum. 42
Em conformidade, o termo "semelhança de sequências" em todas as suas formas gramaticais refere-se a um grau de identidade ou correspondência entre sequências de ácidos nucleicos ou aminoácidos de proteínas que podem ou não partilhar uma origem evolutivamente comum (ver Reeck et al., 1987, Cell 50:667).
Numa modalidade específica, duas sequências de ADN são "substancialmente homólogas" ou "substancialmente semelhantes" quando, pelo menos, cerca de 50% (preferencialmente, pelo menos, cerca de 75%, e mais preferencialmente, pelo menos, cerca de 90 ou 95%) dos nucleótidos concordam ao longo do comprimento definido das sequências de ADN. As sequências que são substancialmente homólogas podem ser identificadas através da comparação das sequências usando software padrão disponível em bancos de dados de sequências, ou num ensaio de hibridação Southern sob, por exemplo, condições de restringência como definidas para aquele sistema particular. Definir as condições de hibridação apropriadas está dentro da habilitação na arte. Ver, por exemplo, Sambrook et al., 1989, supra.
Como usado aqui, "substancialmente semelhante" refere-se a fragmentos de ácido nucleico em que alterações em uma ou mais bases de nucleótidos resultam na substituição de um ou mais aminoácidos, mas não afetam as propriedades funcionais da proteína codificada pela sequência de ADN. "Substancialmente semelhante" também se refere a fragmentos de ácido nucleico em que alterações de um ou mais bases de nucleótidos não afetam a capacidade do fragmento de ácido nucleico mediar a alteração da expressão de genes por tecnologia anti-senso ou co-supressão. "Substancialmente semelhante" também se refere a modificações de fragmentos de ácido nucleico da invenção instantânea tais como deleção ou inserção de uma ou mais bases de nucleótidos que não afetam substancialmente as propriedades funcionais do transcrito resultante. Entende-se, assim, qie a invenção 43 abrange mais do que as sequências exemplificativas específicas. Cada uma das modificações propostas está bem dentro da habilitação de rotina da arte, tal como está a determinação da retenção da atividade biológica dos produtos codificados.
Além disso, o artesão habilitado reconhece que sequências substancialmente semelhantes abrangidas por esta invenção são também definidas pela sua capacidade em hibridar, sob condições de restringência (0,1X SSC, 0,1% SDS, 65°C e lavada com 2X SSC, 0,1% SDS seguido de 0,1X SSC, 0,1% SDS), com as sequências exemplificadas aqui. Fragmentos de ácido nucleico substancialmente semelhantes da invenção instantânea são aqueles fragmentos de ácido nucleico cujas sequências de ADN são, pelo menos, 70% idênticas à sequência de ADN dos fragmentos de ácido nucleico reportados aqui. Fragmentos de ácido nucleico substancialmente preferidos da invenção instantânea são aqueles fragmentos de ácido nucleico cujas sequências de ADN são pelo menos 80% idênticas à sequência de ADN dos fragmentos de ácido nucleico reportados aqui. Fragmentos de ácido nucleico mais preferidos são pelo menos 90% idênticos à sequência de ADN dos fragmentos de ácido nucleico reportados aqui. Ainda mais preferidos são os fragmentos de ácido nucleico que são pelo menos 95% idênticos à sequência de ADN dos fragmentos de ácido nucleico reportados aqui.
Duas sequências de aminoácidos são "substancialmente homólogas" ou "substancialmente semelhantes" quando mais do que cerca de 40% dos aminoácidoss são idênticos, ou mais de 60% são semelhantes (funcionalmente idênticos). Preferencialmente, as sequências homólogas ou semelhantes são identificadas por alinhamento usando, por exemplo, o programa de acumulação GCG (Grupo de Computador Genético, Manual do Programa para GCG Package, Versão 7, Madison, Wisconsin). O termo "correspondendo a" é usado aqui para se 44 referir a sequências homólogas ou semelhantes, seja a posição exacta idêntica ou diferente da da molécula para a qual a semelhança ou homologia é medida. Um ácido nucleico ou alinhamento da sequência de aminoácidos pode incluir espaços. Assim, o termo " correspondendo a" refere-se à semelhada da sequência, e não à numeração dos resíduos de aminoácidos ou bases de nucleótidos.
Uma "porção substancial" de uma sequência de aminoácidos ou de nucleótidos compreende suficientes aminoácidos da sequência de um polipéptido ou da sequência de nucleótidos de um gene para identificar putativamente que polipéptido ou gene, seja por avaliação manual da sequência por alguém habilitado na arte, ou por comparação e identificação automatizada de sequências por computador usando algoritmos tais como BLAST (Basic Local Alignment Search Tool; Altschul, S. F., et al., (1993) J. Mol. Biol. 215: 403-410; ver também www.ncbi.nlm.nlh.gov/BLAST/). Em geral, uma sequência de dez ou mais aminoácidos contíguos ou trinta ou mais nucleótidos é necessária de maneira a poder identificar putativamente um polipéptido ou sequência de ácidos nucleicos como homólogos para uma proteína ou gene conhecidos. Além diso, em relação à sequência de nucleótidos, sondas de oligonucleótidos específicas de genes que compreendem 20-30 nucleótidos contíguos podem ser usadas em métodos dependentes de sequências de identificação de genes (por exemplo, hibridação Southern) e isolamento (por exemplo, hibridação in situ de colónias bacterianas ou placas de bacteriofagos). Além disso, oligonucleótidos curtos com 12-15 bases podem ser usados como primers de amplificação em PCR de maneira a obter um fragmento particular de ácido nucleico que compreende os primers. Em conformidade, uma "porção substancial" de uma sequência de nucleótidos compreende suficientes de uma sequência para identificar especificamente e/ou isolar um fragmento de ácido nucleico que compreende a sequência. 45 0 termo "percentage de identidade", como conhecido na arte, é uma relação entre duas ou mais sequências de polipéptidos ou duas ou mais sequências de polinucleótidos, como determinado por comparação das sequências. Na arte, "identidade" também significa o grau de parentesco da sequência entre sequências de polipéptidos ou polinucleótidos, conforme o caso, como determinado pela concordância entre séries de tais sequências. "Identidade" e "semelhança" podem ser calculadas prontamente por métodos conhecidos, incluindo, mas não limitado a, aqueles descritos em: "Computational Molecular Biology" (Lesk, A. M. , ed.) Oxford University Press, New York (1988); "Biocomputing: Informatics and Genoma Projects" (Smith, D. W., ed.) Academic Press, New York (1993); "Computer Analysis of Sequence Data, Part I" (Griffin, A. M., e Griffin, H. G., eds.) Humana Press, New Jersey (1994); "Sequence Analysis in Molecular Biology" (von Heinje, G., ed.) Academic Press (1987); e "Sequence Analysis Primer" (Gribskov, M. e Devereux, J., eds.) Stockton Press, New York (1991). Métodos preferidos para determinar a identidade são designados para dar a melhor concordância entre sequências testadas. Métodos para determinar a identidade e semelhança são codificados em programas de computador publicamente disponíveis. Os cálculos de alinhamentos de sequências e percentagem de identidade podm ser realizados usando o programa Megalign da empresa de computação bioinformática LASERGENE (DNASTAR Inc., Madison, WI) . 0 alinhamento múltiplo das sequências pode ser realizado usando o método de alinhamento Clustal (Higgins e Sharp (1989) CABIOS. 5:151-153) com os parâmetros predefinidos (PENALIZAÇÃO ESPAÇO=10, PENALIZAÇÃO DE COMPRIMENTO ESPAÇO=10). Os parâmetros predefinidos para alinhamentos emparelhados usando o método Clustal podem ser selecionados: KTUPLE 1, PENALIZAÇÃO ESPAÇO =3, JANELA=5 e DIAGONAIS GUARDADAS=5. 46 0 termo "software de análise de sequências" refere-se a qualquer algoritmo de computador ou programa de software que é útil para a análise de sequências de nucleótidos ou aminoácidos. "Software de análise de sequências" pode estar comercialmente disponível ou ser desenvolvido independentemente. 0 software de análise de sequências típico incluirá, mas não se limitará a, ao conjunto de programas GCG (Wisconsin Package Versão 9.0, Genetics Computer Group (GCG), Madison, WI), BLASTP, BLASTN, BLASTX (Altschul et al., J. Mol. Biol. 215:403-410 (1990), end DNASTAR (DNASTAR, Inc. 1228 S. Park St. Madison, WI 53715 USA). No contexto desta aplicação, será entendido que onde o software de análise de sequências é usado para análise, os resultados da análise serão baseados nos "valores predefinidos" do programa referenciado, a menos que o contrário seja especificado. Como usado aqui "valores predefinidos" significará quaisquer conjuntos de valores ou parâmetros que se carregam originalmente com o software quando este é inicializado pela primeira vez. "Genes sintéticos" podem ser reunidos a partir de blocos de construção de oligonucleótidos que são sintetizados quimicamente usando procedimentos conhecidos por aqueles habilitados na arte. Estes blocos de construção estão ligandos e anelados para formar segmentos de genes que são depois reunidos enzimaticamente para construir o gene inteiro. "Quimicamente sintetizados", como relacionado com uma sequência de ADN, significa que os nucleótidos componentes foram reunidos in vitro. A síntese química manual do ADN pode ser conseguida usando procedimentos bem estabelecidos, ou síntese química automatizada pode ser realizada usando um de um número de máquinas comercialmente disponíveis. Em conformidade, os genes podem ser talhados para expressão óptima de genes baseada na optimização da sequência de nucleótidos para reflectir o erro sistemático do codão da célula hospedeira. O artesão habilitado aprecia 47 a probabilidade de expressão de genes bem sucedida se o uso do codão é sistematicamente desviado em direcção aos codões favorecidos pelo hospedeiro. A determinação de codões preferidas pode ser baseada numa pesquisa dos genes derivados da célula hospedeira em que a informação da sequência está disponível.
SISTEMA DE MODULAÇÃO DA EXPRESSÃO DE GENES DA INVENÇÃO
Candidatos mostraram previamente que separar a transativação e o domínio de ligação ao ADN colocando-os em duas proteínas diferentes resulta numa atividade de fundo grandemente reduzida na ausência de um ligando e atividade significativamente aumentada acima do fundo na presença de um ligando (aplicação pendente PCT7US01/09050) . Este sistema de duplo-híbrido é um sistema de modulação de expressão de genes induzido significativamente melhorado comparado com os dois sistemas revelados nos Formulários de Patentes Internacionais PGT/US97/05330 e PCT/US98/14215. 0 sistema de duplo-híbrido explora a capacidade de um par de proteínas interactivas de trazer o domínio de ativação da transcrição para uma posição mais favorável relativamente ao domínio de ligação ao ADN de tal maneira que quando o domínio de ligação ao ADN se liga ao local de ligação ao ADN no gene, o domínio de transativação activa de frma mais efetiva o promotor (ver, por exemplo, Patente U.S. N.° 5,283,173). Brevemente, o sistema de expressão de genes de duplo-híbrido compreende duas cassetes de expressão de genes; a primeira codifica um domínio de ligação ao ADN fundido com um polipéptido de recetor nuclear, e a segunda codifica um domínio de transativação fundido com um polipéptido de recetor nuclear diferente. Na presença de um ligando, a interação do primeiro polipéptido com o segundo polipéptido amarra eficazmente o domínio de ligação ao ADN ao domínio de transativação. Uma vez que os domínios de ligação ao ADN e de transativação residem em duas moléculas 48 diferentes, a atividade de fundo na ausência de ligando é grandemente reduzida. 0 sistema de modulação de expressão de genes de duplo-híbrido baseado num recetor de ecdisona pode ser heterodimeroico e homodimérico. Um complexo EcR functional geralmente refere-se a um complexo de proteína heterodimeroico que consiste em dois membros da família de recetores de esteroide, uma proteína recetor de ecdisona obtida de vários insectos, e uma proteína ultraspiracle (USP) ou o homólogo vertebrado de USP, proteína recetor X retinoide (ver Yao, et al. (1993) Nature 366, 476-479; Yao, et al., (1992) Cell 71, 63-72). Contudo, o complexo pode também ser um homodímero tal como detalhado mais a seguir. 0 complexo recetor de ecdisteroide funcional também pode incluir proteína(s) adicionais tais como imunofilinas. Membros adicionais da família de receptores esteroides de proteínas, conhecidos como factores transcricionais (tal como DHR38 ou betaFTZ-1), também podem ser parceiros dependentes ou independentes do ligando para EcR, USP, e/ou RXR. Adicionalmente, outros co-factores podem ser necessaries tais como proteínas geralmente conhecidas como co-activadoras (também designadas adaptadoras ou mediadoras). Estas proteínas não se ligam especificamente à sequência de ADN e não estão envolvidas na transcrição basal. Elas podem execer o seu efeito na ativação da transrcição através de vários mecanismos, incluindo a estimulação de activadores de ligação ao ADN, afetando a estrutura da cromatina, ou mediando as interações do complexo activador-iniciação. Exemplos de tais co-activadores incluem RIP140, TIF1, RAP46/Bag 1, ARA70, SRGl/NCoA-1, TIF2/GRIP/NCoA-2, ACTR/AIB1/R.AC3/pCIP bem como a proteína de ligação B ao elemento de resposta ao co-activador promíscuo C, CBP/p300 (para revisão ver Glass et al. , Curr. Opin. Célula Biol. 9: 222-232, 1997).
Igualmente, os co-factores de proteína geralmente 49 conhecidos como co-repressores (também conhecidos como repressores, silenciadores, ou mediadores de silêncio) podem ser necessários para inibir eficazmente a ativação transcricional na ausência de ligando. Estes co-repressores podem interagir com o recetor de ecdisona não ligado para silenciar a atividade no elemento de resposta. A evidência actual sugere que a ligação do ligandos altera a conformação do recetor, que reuslta na libertação do co-repressor e recrutamento dos co-activadores anteriormente descritos, abolindo assim a sua atividade silenciadora. Exemplos de co-repressores incluem N-CoR e SMRT (para revisão, ver Horwitz et al. Mol Endocrinol. 10: 1167-1177, 1996) . Estes co-factores podem ser tanto endógenos dentro da célula ou organismo, ocomo podem ser adicionados exogenamente como transgenes para serem expressos de uma forma tanto regulada como não regulada. Complexos homodímeros da proteína recetor de ecdisona, USP, ou RXR também podem ser funcionais em determinadas circunstâncias. O complexo recetor de ecdisona tipicamente inclui proteínas que são memebros da superfamília de recetor nuclear em que todos os membros são geralmentecaracterizados pela presença de um domínio de transativação amino-terminal, um domínio de ligação ao ADN ("DBD"), e um domínio de ligação ao ligando ("LBD") separados do DBD por uma região dobradiça. Como usado aqui, o termo "domínio de ligação ao ADN" compreende uma sequência de polipéptido mínima de uma proteína de ligação ao ADN, até ao comprimento total de proteína de ligação ao ADN, tão longa até o domínio de ligação ao ADN funcionar para associar com um elemento de resposta particular. Membros da superfamília de recetor nuclear também se caracterizam pela presença de quatro ou cinco domínios: A/B, C, D, E, e em alguns membros F (ver patente US 4,981,784 e Evans, Science 240: 889-895 (1988)). O domínio "AB" corresponde a um domínio de transativação, o "C" 50 corresponde ao domínio de ligação ao ADN, o "D" corresponde à região dobradiça, e o "E" corresponde ao domínio de ligação ao ligando. Alguns membros da família podem também ter outro domínio de transativação no lado carboxi-terminal do LBD correspondendo a "F". O DBD é caracterizado pela presença de dois dedos de zinco de cisteína entre os quais estão dois motivos de aminoácidos, o P-box e o D-box, que conferem especificidade aos elementos de resposta à ecdisona. Estes domínios podem ser tanto nativas, modificadas, ou quimeras de diferentes domínios de proteínas recetor heterólogas. Este receptor EcR, como um subconjunto da família de recetor esteroide, também possui regiões menos bem conhecidas responsáveis por propriedades de heterodimerização. Porque os domínios de EcR, USP, e RXR são modulares por natureza, os domínios LBD, DBD, e de transativação podem ser intercambiados.
Os sistemas de troca de genes são conhecidos que incorporam componentes do complexo recetor de ecdisona. Contudo, nestes sistemas conhecidos, sempre que o EcR é usado é associado com domínios de ligação ao ADN nativos ou modificados e domínios de transativação na mesma molécula. USP ou RXR são tipicamente usados como parceiros silenciosos. Os candidates mostraram previamente que quando os domínios de ligação ao AND e os domínios de transativação estão na mesma molécula a atividade de fundo na ausência de ligando é alta e que tal atividade é dramaticamente reduzida quando os domínios de ligação ao ADN e os domínios de transativação estão em moléculas diferentes, ou seja, em cada um dos dois parceiros de um complexo heterodimeroico ou homodimérico (ver PCT/US01/09050) . Este sistema de duplo-híbrido também providencia uma sensibilidade melhorada aos ligandos não-esteroides, por exemplo, diacilhidrazinas, quando comparados com ligandos esteroides, por exemplo, ponasterona A ("PonA") ou muristerona A ("MurA"). Ou seja, 51 quando comparado com esteroides, os ligandos não-esteroides providenciam maior atividade a mais baixa concentração. Além disso, uma vez que a transativação baseada em trocas de genes EcR é frequentemente dependente la linha celular, é mais fácil talhar sistemas de troca para obter uma capacidade máxima de transativação para cada aplicação. Além disso, o sistema de duplo-híbrido evita alguns efeitos colaterais devido à sobre-expressão de RXR que ocorre com frequência uando o RXR não-modifiçado é usado como um parceiro de troca. Numa modalidade específica do sistema de duplo-híbrido, os domínios de ligação ao ADN nativo e de transativação do EcR ou RXR são eliminados e como resultado, estas moléculas híbridas têm menos hipóteses de interagir com outros recetores de hormonas esteroides presentes na célula resultando numa redução dos efeitos colaterais.
Os candidates mostraram previamente que um recetor de ecdisona em parceria com a proteína ultraspiracle (USP) de um Díptero (mosca da fruta Drosophila melanogaster) ou de um Lepidóptero (larva Choristonieura fumiferana) é expressa constitutivamente em células de mamíferos, enquanto que um recetor de ecdisona em parceria com recetor X retinoide vertebrado (RXR) é induzido em células de mamíferos (aplicação pendente PCT/US01/09050). Os candidates fizeram agora a descoberta surpreendente de que a proteína ultraspiracle de gafanhoto Locusta migratória ("LmUSP") e os homólogo 1 de RXR e o homólogo 2 de RXR da carraça Ixodidae Amblyonuna americanum ("AmaRXRl" e "AmaRXR2", respectivamente) podem funcionar de forma semelhante ao recetor X retinoide (RXR) vertebrado num sistema induzido de expressão de genes baseado no recetor de ecdisona. Assim, as descobertas do candidato de que LmUSP, AmaRXRl, AmaRXR2, e os seus homólogos não-Dípteros, não-Lepidópteros incluindo, mas não limitado a: homólogo do RXR do caranguejo-violinista Celuca pugilator ("CpRXR"), homólogo 52 do RXR do escaravelho Tenebrio molitor ("TmRXR"), homólogo do RXR da abelha Apis mellifera ("AmRXR"), e homólogo do RXR do afídeo Myzus persicae ("MpRXR"), sendo todos referenciados aqui colectivamente como RXR invertebrados, podem ser substituídos por RXR vertebrado em sistemas de expressão de genes induzidos baseados no recetor de ecdisona podem apenas ser condierados como inesperados e surpreendentes. Como descrito aqui, o novo sistema de expressão de genes induzido baseado no recetor de ecdisona / RXR invertebrado do candidato providencia um sistema de expressão de genes induzido melhorado em leveduras e células de mamíferos que é caracterizado pela sensibilidade ao ligando aumentada e pela magnitude de transativação.
Em particular, os candidatos descrevem aqui um novo sistema de duplo-híbrido que compreende um domínio de ligação ao ligando RXR invertebrado. Este novo sistema de expressão de genes demonstra pela primeira vez que um homólogo do RXR / proteína ultraspiracle invertebrado pode funcionar como uma componente de um sistema de expressão de genes induzido baseado em EcR em leveduras e células de mamíferos. Como discutido aqui, esta descoberta é tanto inesperada como surpreendente.
Especificamente, a invenção do candidato está relacionada com um sistema de modulação de expressão de genes que compreende: a) uma primeira cassete de expressão de genes que é capaz de ser expressa numa célula hospedeira, em que a primeira cassete de expressão de genes compreende um polinucleótido que codifica um primeiro polipéptido hibrido que compreende i) um domínio de ligação ao ADN que reconhece um elemento de resposta associado com um gene cuja expressão deverá ser modulada; e ii) um domínio de ligação ao ligando do recetor de ecdisona; e b) uma segunda cassete de expressão de genes que é capaz de ser expressa na célula hospedeira, em que a segunda cassete de expressão de genes compreende uma sequência de 53 polinucleótidos que codifica um segundo polipéptido híbrido que compreende i) um domínio de transativação; e ii) um domínio de ligação ao ligando do recetor X retinoide invertebrado. A presente invenção também se relaciona com um sistema de modulação de expressão de genes que compreende: a) uma primeira cassete de expressão de genes que é capaz de ser expressa numa célula hospedeira, em que a primeira cassete de expressão de genes compreende um polinucleótido que codifica um primeiro polipéptido híbrido que compreende i) um domínio de ligação ao ADN que reconhece um elemento de resposta associado com um gene cuja expressão deverá ser modulada; eii) domínio de ligação ao ligando do recetor X retinoide invertebrado; e b) uma segunda cassete de expressão de genes que é capaz de ser expressa na célula hospedeira, em que a segunda cassete de expressão de genes compreende uma sequência de polinucleótidos que codifica um segundo polipéptido híbrido que compreende i) um domínio de transativação; e ii) um domínio de ligação ao ligando do recetor de ecdisona. A presente invenção também se relaciona com um sistema de modulação de expressão de genes de acordo com a presente invenção ainda compreendendo c) uma terceira cassete de expressão de genes que compreende: i) um elemento de resposta ao qual o domínio de ligação ao ADN do primeiro polipéptido híbrido se liga; ii) um promotor que é activado pelo domínio de transativação do segundo polipéptido híbrido; e iii) um gene cuja expressão deverá ser modulada.
Numa modalidade específica, o gene cuja expressão deverá ser modulada é um gene homólogo em relação à célula hospedeira. Numa outra modalidade específica, o gene cuja expressão deverá ser modulada é um gene heterólogo em relação à célula hospedeira.
Os ligandos para uso na presente invenção como descritos a seguir, quando combinados com os domínios de 54 ligação ao ligando de um EcR e um RXR invertebrado, que, por sua vez, estão amarrados ao elemento de resposta linligado a um gene, providenciam os meios para a regulação temporal externa da expressão do gene. 0 mecanismo de ligação ou a ordem na qual os vários componentes desta invenção se ligam uns aos outros, ou seja, por exemplo, ligando ao recetor, primeiro polipéptido híbrido ao elemento de resposta, segundo polipéptido híbrido ao promotor, etc., não é crítica. A ligação do ligando aos domínios de ligação ao ligando de um EcR e RXR invertebrado permite a expressão ou supressão do gene. Este mecanismo não exclui o potencial para a ligação do ligando ao EcR ou RXR invertebrado, e a formação resultante de complexos homodímeros activos (por exemplo, EcR+ EcR ou RXR invertebrado+ RXR invertebrado). Preferencialmente, um ou mais domínios do recetor é variado produzindo uma troca de genes quimérica ou híbridos. Tipicamente um ou mais de três domínios, DBD, LBD, e domínio de transativação, podem ser escolhidos de uma fonte diferente da fonte dos outros domínios de maneira que os genes híbridos e as proteínas híbridas resultantes são optimizados numa determinada célula hospedeira ou organismo para atividade transactivadora, ligação complementar do ligande, e reconhecimento de um elemento de resposta específico. Além disso, o próprio elemento de resposta pode ser modificado ou substituído com elementos de resposta para outras proteína de domínios de ligação ao ADN tal como a proteína GAL-4 de levedura (ver Sadowski, et al., (1988) Nature 335: 563-564) ou proteína LexA de Escherichia coli (ver Brent e Ptashne, (1985), Cell 43: 729-736), ou elementos de resposta sintéticos específicos para interações alvo com proteínas designadas, modificadas, e selecionadas para tais interações específicas (ver, por exemplo, Kim, et al. (1997), Proc. Natl. Acad Sei., USA 94: 3616-3620) para acomodar os recetores híbridos. Outra vantagem dos sistemas 55 de duplo-híbrido é que eles permitem a escolha de um promotor usado para dirigir a expressão de genes de acordo com um resultado final desejado. Tal controlo duplo pode ser particularmente importante em áreas da terapia de genes, especialmente quando as proteínas citotóxicas são produzidas, porque tanto o momento da expressão bem como as células em que a expressão ocorre podem ser controlados. Quando os genes, ligados de modo funcional a um promotor adequado, são introduzidos nas células do sujeito, a expressão de genes exógenos é controlada pela presença do sistema desta invenção. Os promotores podem ser regulados constitutivamente ou por indução ou podem ser específicos de tecidos (ou seja, expressos apenas num tipo particular de células) ou específicos de certas fases de desnvolvimento do organismo.
CASSETES DE EXPRESSÃO DE GENES DA INVENÇÃO 0 novo sistema de expressão de genes induzido baseado em EcR/RXR invertebrado da invenção compreende cassetes de expressão de genes que são capazes de ser expressas numa célula hospedeira, em que cada cassete de expressão de genes compreende um polinucleótido que codifica um polipéptido híbrido. Assim, a invenção do candidato também providencia novas cassetes de expressão de genes para uso no sistema de expressão de genes da invenção.
Especificamente, a presente invenção proporciona uma cassete de expressão de genes que compreende um polinucleótido que codifica um polipéptido híbrido. Em particular, a presente invenção providencia uma cassete de expressão de genes que é capaz de ser expressa numa célula hospedeira, em que a cassete de expressão de genes compreende um polinucleótido que codifica um polipéptido híbrido que compreende tanto i) um domínio de ligação ao ADN que reconhece um elemento de resposta, como ii) um domínio de transativação; e um domínio de ligação ao 56 ligando do recetor de ecdisona ou um domínio de ligação ao ligando do recetor X retinoide invertebrado.
Numa modalidade específica, a cassete de expressão de genes codifica um polipéptido híbrido que compreende um domínio de ligação ao ADN que reconhece um elemento de resposta e um domínio de ligação ao ligando do EcR.
Numa outra modalidade específica, a cassete de expressão de genes codifica um polipéptido híbrido que compreende um domínio de ligação ao ADN que reconhece um elemento de resposta e um domínio de ligação ao ligando do RXR invertebrado.
Numa outra modalidade especifica, a cassete de expressão de genes codifica um polipéptido híbrido que compreende um domínio de transativação e um domínio de ligação ao ligando do EcR.
Numa outra modalidade específica, a cassete de expressão de genes codifica um polipéptido híbrido que compreende um domínio de transativação e um domínio de ligação ao ligando do RXR invertebrado.
Numa modalidade preferida, os domínios de ligação ao ligando (LBD) é um LBD do EcR, um LBD do RXR invertebrado, ou um LBD membro da família de recetor nuclear relacionado com a hormona esteroide/tiroide, ou análogos, combinações, ou modificações dos mesmos. Numa modalidade específica, o LBD é de um EcR ou um RXR invertebrado. Numa outra modalidade específica, o LBD é de um LBD do EcR truncado ou um LBD do RXR invertebrado truncado. A mutação de truncagem pode ser feita através de qualquer método usado na arte, incluindo, mas não limitado a, digestão/deleção com endonuclease de restrição, deleção dirigida com oligonucleótido mediada por PCR, mutagénese química, quebra de cadeia de ADN, e afins. 0 EcR pode ser um EcR invertebrado, preferencialmente selecionao da classe Artrópoda. Preferencialmente o EcR é selecionado a partir do grupo que consiste em EcR de 57
Lepidóptero, um EcR de Díptero, um EcR de Ortóptero, um EcR de Homóptero e um EcR de Hemíptero. Mais preferencialmente, o EcR para uso é um EcR de larva Chorisioneura fuiniferana ("CfEcR"), um EcR de escaravelho Tenebrio molitor ("TmEcR"), um EcR da mariposa Manduca sexta ("MsEcR"), a um EcR da mariposa Heliothis virescens ("HvEcR"), um EcR do mosquito Chironomus tentans ("CtEcR"), um EcR do bicho-da-seda Bombyx mori ("BmEcR"), um EcR da mosca da fruta Drosophila melanogaster ("DmEcR"), um EcR do mosquito Aedes aegypti ("AaEcR"), um EcR da varejeira Lucilia capitata ("LcEcR"), um EcR da mosca do Mediterrâneo Ceratitis capitata ("CcEcR"), um EcR do gafanhoto Locusta migratória ("LmEcR"), um EcR do afideo Myzus persicae ("MpEcR"), um EcR do caranguejo-violinista Celuca pugilator ("CpEcR"), um EcR da carraça Ixodidae Amblyomma americanum ("AmaEcR"), um EcR da mosca branca Bainecia argentifoli ("BaBeR", SEQ. ID N.° 57), ou um EcR da cigarrinha-verde Nephotetix cincticeps ("NcEcR", SEQ. ID N.° 58). Mais preferencialmente, o LBD é da larva (Choristoneura fumiferana) EcR ("CfEcR"), mosca da fruta Drosophila melanogaster EcR ("DmEcR"), mosca branca Bamecia argentifoli EcR ("BaEcR"), cigarrinha-verde Nephotettix cincticeps EcR ("NcEcR"), escaravelho Tenebrio molitor EcR ("TmEcR"), ou carraça Ixodidae Amblyomma americanum EcR ("AmaEcR").
Numa modalidade especifica, o LBD é de um polipéptido EcR truncado. A truncagem do polipéptido EcR resulta na deleção de, pelo menos, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 105, 110, 115, 120, 125, 130, 135, 140, 145, 150, 155, 160, 165, 170, 175, 180, 185, 190,195, 200, 205, 210, 215, 220, 225, 230, 235, 240, 245, 250, 255, 260, ou 265 aminoácidos. Preferencialmente, a truncagem do polipéptido EcR resulta numa deleção de, pelo menos, um domínio parcial de polipéptido. Mais preferencialmente, a truncagem do 58 polipéptido EcR resulta numa deleção de, pelo menos, um domínio completo do polipéptido. Numa modalidade específica, a truncagem do polipéptido EcR resulta numa deleção de, pelo menos, um domínio A/B, um domínio C, um domínio D, um domínio F, domínios A/B/C, domínios A/B/l/2-C, domínios AB/C/D, domínios A/B/C/D/F, domínios A/B/F, domínios A/B/C/F, um domínio E parcial, ou um domínio F parcial. Uma combinação de várias deleções parciais e/ou completas de domínio também podem ser realizadas.
Numa modalidade, o domínio de ligação ao ligando do recetor de ecdisona é codificado por um polinucleótido que compreende uma sequência de ácido nucleico selecionada a partir do grupo que consiste em SEQ. ID N.° 2 (DmEcR-EF) , SEQ. ID N.° 3 (CfEcR-DE), e SEQ. ID N.° 4 (DmEcR-DE). Numa modalidade preferida, o domínio de ligação ao ligando do recetor de ecdisona é codificado por um polinucleótido compreendendo uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste em SEQ. ID N.° 1 (CfEcREF), SEQ. ID N.° 53 (CfEcR-DEF), e SEQ. ID N.° 45 (CfEcR-CDEF).
Numa modalidade, o domínio de ligação ao ligando do recetor de ecdisona compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 6 (DmEcR-EF), SEQ. ID N.° 7 (CfEcR-DE), e SEQ. ID N.° 8 (DmEcR-DE). Numa modalidade preferida, o domínio de ligação ao ligando do recetor de ecdisona compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 5 (CfEcR EF), SEQ. ID N.° 43 (CFEcR-DEF), e SEQ. ID N.° 59 (CfEcR-CDEF).
Preferencialmente, o polipéptido RXR invertebrado é um polipéptido ultraspiracle de gafanhoto Locusta migratória ("LmUSP"), um homólogo I do RXR de carraça Ixodidae Amblyomma americanum ("AmaRXRl"), um homólogo 2 do RXR da carraça Ixodidae Amblyomma americanum ("AmaRXR2"), um homólogo do RXR do caranguejo-violinista Celuca pugilator ("CpRXR"), um homólogo do RXR do escaravelho Tenebrio 59 molitor ("TmRXR"), um homólogo do RXR da abelha Apis mellifera ("AmRXR"), um homólogo do RXR do afídeo Myzus persicae ("MpRXR")»· ou um um homólogo do RXR não-Díptero/não-Lepidóptero.
Numa modalidade específica, o LBD é de um RXR invertebrado truncado. A truncagem do polipéptido RXR invertebrado resulta na deleção de, pelo menos, 1, 2, 3, 4, 5, 6, 8, 10, 13, 14, 15, 16,17, 18, 19, 20, 21, 22, 25, 26, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100,105, 110,115, 120,125, 130, 135, 140, 145,150, 155, 160, 165, 170, 175, 180, 185, 190, 195, 200, 205, 210, 215, 220, 225, 230, 235, ou 240 aminoácidos. Preferencialmente, a truncagem do polipéptido RXR invertebrado resulta numa deleção de, pelo menos, um domínio polipéptido parcial.
Mais preferencialmente, a truncagem do polipéptido RXR invertebrado resulta numa deleção de, pelo menos, um domínio polipéptido completo. Numa modalidade específica, a truncagem do polipéptido RXR invertebrado resulta numa deleção de, pelo menos, um domínio E parcial, um domínio E completo, um domínio F parcial, um domínio F completo, uma hélice 1 do domínio EF, uma hélice 2 do domínio EF, uma hélice 3 do domínio EF, uma hélice 4 do domínio EF, uma hélice 5 do domínio EF, uma hélice 6 do domínio EF, uma hélice 7 do domínio EF, uma hélice 8 do domínio EF, e uma hélice 9 do domínio EF, uma hélice 10 do domínio EF, uma hélice 11 do domínio EF, uma hélice 12 do domínio EF, uma folha β-plissada do domínio EF, um domínio AB, um domínio C, um domínio D, domínios A/B/C, domínios AB/1/2-C, domínios A/B/C/D, domínios A/B/C/D/F, domínios A/B/P, ou domínios A/B/C/F. Uma combinação de várias deleções parciais e/ou completas de domínio também podem ser realizadas.
Numa modalidade preferida, os domínios de ligação ao ligando do RXR invertebrado é codificado por um polinucleótido que compreende uma sequência de ácidos 60 nucleicos selecionada a partir do grupo que consiste em SEQ. ID N.° 9 (LmUSP-EF), SEQ. ID N.° 10 (AmaRXRl-EF), SEQ. ID N.° 11 (AmaRXR2-EF), SEQ. ID N.° 12 (CpRXR-EF), SEQ. ID N.° 13 (TmRXR-EF) , SEQ. ID N.° 14 (AmRXR-EF) , SEQ. ID N.° 15 (LmUSP-EF, BamHI-deletada) , SEQ. ID N.° 16 (AmaRXRl-EF, BamHI-deletada), SEQ. ID N.° 17 (AmaRXR2-EF, BamHI-deleted), SEQ. ID N.° 18 (CpRXR-EF, BamHI-deletada), SEQ. ID N.° 19 (TmRXR EF, BamHI-deletada), e SEQ. ID N.° 20 (AmRXR-EF, BamHI-deletada).
Numa outra modalidade preferida, os domínios de ligação ao ligando do RXR invertebrado compreendem uma sequência de polipéptidos selecionada a partir do grupo que consiste em SEQ. ID N. 0 21 (LmUSP-EF), SEQ. ID N. 0 22 (AmaRXRl-EF) , SEQ. ID N. 0 23 (AmaRXR2-EF) , SEQ. ID N. 0 24 (CpRXR-EF), SEQ. ID N. 0 25 (TmRXR-EF), SEQ. ID N. ° 26 (AmRXR-EF), SEQ. ID N. 0 27 (LmUSP-EF, BamHI -deletada), SEQ. ID N.° 28 (AmaRXRl-EF, BamHI -deletada), SEQ. ID N. 0 29 (AmaRXR2-EF, BamHI-deletada), SEQ. ID N.° 30 (CpRXR-EF, BamHI-deletada), SEQ. ID N.° 31 (TmRXR-EF, BamHI-deletada), e SEQ. ID N.° 32 (AmRXR-EF, BamHI-deletada).
Para os objetivos desta invenção, EcR e RXR invertebrado também incluem EcR e RXR invertebrado sintéticos e quiméricos e seus homólogos. O domínio de ligação ao ADN pode ser qualquer domínio de ligação ao ADN com um elemento de resposta conhecido, incluindo domínios de ligação ao ADN sintéticos e quiméricos, ou análogos, combinações, ou modificações das mesmas. Preferencialmente, o DBD é um DBD GAL4, um DBD LexA, um DBD factor de transcrição, um DBD memebro da superfamília de recetor nuclear da hormona esteroide/tiroide, um DBD LacZ bacteriano, ou um DBD put de levedura. Mais preferencialmente, o DBD é um DBD GAL4 [SEQ. ID N.° 33 (polinucleot ídeo) ou SEQ. ID N.° 34 (polipéptido) ] ou um DBD LexA [(SEQ. ID N.° 35 (polinucleotídeo) ou SEQ. ID N.° 36 (polipéptido)]. 61 0 domínio de transativação (abreviado "AD" ou "TA") pode ser qualquer AD recetor nuclear da hormona esteroide/tiroide, AD sintético ou quimérico, AD poliglutamina, AD aminoácidos básicos ou acídicos, um AD VP16, um AD GAL4, um AD NF-κΒ, um AD BP64, um domínio de ativação ácida B42 (B42AD), ou um análogo, combinação, ou modificação dos mesmos. Numa modalidade específica, o AD é um AD sintético ou quimérico, ou é obtido a partir de AD VP16, GAL4, NF-kB, ou domínio ativação ácida B42. Preferencialmente, o AD é um AD VP16 [SEQ. ID N.° 37 (polinucleotídeo) ou SEQ. ID N.° 38 (polipéptido)] ou um AD B42 [SEQ. ID N.° 39 (polinucleot ídeo) ou SEQ. ID N.° 40 (polipéptido)].
Numa modalidade preferida, a cassete de expressão de genes codifica um polipéptido híbrido que compreende um domínio de ligação ao ADN codificado por um polinucleótido que compreende uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste em DBD GAL4 (SEQ m NO: 33) e um DBD LexA (SEQ m NO: 35), e um domínio de ligação ao ligando do EcR codificado por um polinucleótido que compreende uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste em SEQ. ID N.° 1, SEQ. ID N.° 53, e SEQ. ID N.° 45.
Numa outra modalidade preferida, a cassete de expressão de genes codifica um polipéptido híbrido que compreende um domínio de ligação ao ADN que compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em DBD GAL4 (SEQ. ID N.° 34) e um DBD LexA (SEQ. ID N.° 36), e um domínio de ligação ao ligando do EcR que compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 5, SEQ. ID N.° 43, e SEQ. ID N.0 59.
Numa outra modalidade preferida, a cassete de expressão de genes codifica um polipéptido híbrido que compreende um domínio de ligação ao ADN que é codificado 62 por um polinucleótido que compreende uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste em DBD GAL4 (SEQ. ID N.° 33) ou um DBD LexA (SEQ. ID N.° 35) e um domínio de ligação ao ligando do RXR invertebrado codificado por um polinucleótido que compreende uma sequência de ácidos nucleicos selecionada a partir fo grupo que consiste em SEQ. ID N.° 9, SEQ. ID N.° 10, SEQ. ID N.° 11, SEQ. ID N.° 12, SEQ. ID N.° 13, SEQ. ID N.° 14, SEQ. ID N. 0 15, SEQ. ID N.° 16, SEQ. ID N.° 17, SEQ. ID N.° 18, SEQ. ID N.° 19, e SEQ. ID N.° 20.
Numa outra modalidade preferida, a cassete de expressão de genes codifica um polipéptido híbrido que compreende um domínio de ligação ao ADN que compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em DBD GAL4 (SEQ. ID N.° 34) e um DBD LexA (SEQ. ID N.° 36), e um domínio de ligação ao ligando do RXR invertebrado que compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N. ° 21, SEQ. ID N.° 22, SEQ. ID N.0 23, SEQ. ID N. 0 24, SEQ. ID N.° 25, SEQ . ID N.° 26, SEQ. ID N.° 27, SEQ. ID N. 0 28, SEQ. ID N.° 29, SEQ. ID N.° 30, SEQ. ID N. 0 31 , e SEQ. ID N.0 32 . Numa outra modalidade preferida, a cassete de expressão de genes codifica um polipéptido híbrido que compreende um domínio de transativação codificado por um polinucleótido que compreende uma sequência de ácidos nucleicos de SEQ. ID N.° 37 ou SEQ. ID N.° 39, e um domínio de ligação ao ligando do EcR codificado por um polinucleótido que compreende uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste em SEQ. ID N.° 1, SEQ. ID N.° 53, e SEQ. ID N.° 45.
Numa outra modalidade preferida, a cassete de expressão de genes codifica um polipéptido híbrido que compreende um domínio de transativação que compreende uma sequência de aminoácidos de SEQ. ID N.° 38 ou SEQ. ID N.° 63 40, e um domínio de ligação ao ligando do EcR que compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 5, SEQ. ID N.° 43, e SEQ. ID N.0 59.
Numa outra modalidade preferida, a cassete de expressão de genes codifica um polipéptido híbrido que compreende um domínio de transativação codificado por um polinucleótido que compreende uma sequência de ácido nucleico de SEQ. ID N.° 37 ou SEQ. ID N.° 39, e um domínio de ligação ao ligando do RXR invertebrado codificado por um polinucleótido que compreende uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste em SEQ. ID N. 0 9, SEQ. ID N.° 10, SEQ. ID N.° 11, SEQ. ID N.° 12, SEQ. ID N.° 13, SEQ. ID N.° 14, SEQ. ID N.° 15, SEQ. ID N.° 16, SEQ. ID N.° 17, SEQ. ID N.° 18, SEQ. ID N.° 19, e SEQ. ID N.0 20.
Numa outra modalidade preferida, a cassete de expressão de genes codifica um polipéptido híbrido que compreende um domínio de transativação que compreende uma sequência de aminoácidos de SEQ. ID N.° 38 ou SEQ. ID N.° 40 e um domínio de ligação ao ligando do RXR invertebrado que compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 21, SEQ. ID N.° 22, SEQ. ID N.° 23, SEQ. ID N.° 24, SEQ. ID N.° 25, SEQ. ID N.° 26, SEQ. ID N.° 27, SEQ. ID N.° 28, SEQ. ID N.° 29, SEQ. ID N.° 30, SEQ. ID N.° 31, e SEQ. ID N.° 32.
O elemento de resposta ("RE") pode ser qualquer elemento de resposta com um conhecido domínio de ligação ao ADN, ou um análogo, combinação, ou modificação do mesmo. Um único RE pode ser empregue ou múltiplos RE's, quer sejam cópias múltiplas do mesmo RE ou de dois ou mais RE's diferentes, podem ser usados na presente invenção. Numa modalidade específica, o RE é um RE GAL4 ("GAL4RE") , LexA, um RE recetor nuclear da hormona esteroid/tiroide, ou um RE sintético que reconhece um domínio de ligação ao ADN 64 intético. Preferencialmente, o RE é um RE GAL4 que compreende uma sequência de polinucleótidos de SEQ. ID N.° 41 ou um RE LexA (operão, "op") que compreende uma sequência de polinucleótidos de SEQ. ID N.° 42 ("2XLexAopRB")· Preferencialmente, a primeira proteína híbrida é substancialmente livre de um domínio de transativação e a segunda proteína híbrida é substancialmente livre de um domínio de ligação ao ADN. Para os objetivos desta invenção, "substancialmente livre" significa que a proteína em questão não contém uma sequência suficiente do domínio em questão para providenciar atividade de activação ou de ligação.
Assim, a presente invenção também se relaciona com uma cassete de expressão de genes que compreende: i) um elemento de resposta que compreende um domínio ao qual um polipéptido que compreende um domínio de ligação ao ADN se liga; ii) um promotor que é activado por um polipéptido que compreende um domínio de transativação; e iii) um gene cuja expressão deverá ser modulada.
Genes de interesse para uso nas cassetes de expressão de genes do candidato podem ser genes endógenos ou genes heterólogos. Informação sobre sequências de ácidos nucleicos ou de aminoácidos para um gene ou proteína desejados pode ser localizada em uma das muitas bases de dados de acesso público, por exemplo, GENBANK, EMBL, Swiss-Prot, e PIR, ou em muitas publicações em revistas relacionadas com a biologia. Assim, aqueles habilitados na arte têm acesso a informação de sequências de ácidos nucleicos para virtualmente todos os genes conhecidos. Tal informação pode depoiss er usada para construir as construções desejadas para a inserção do gene de interesse dentro das cassetes de expressão de genes usadas nos métodos do candidato descritos aqui.
Exemplos de genes de interesse para uso nas cassetes de expressão de genes do candidato incluem, mas não se 65 limitam a: genes que codificam polipéptidos terapeuticamente desejáveis ou produtos que podem ser usados para tratar uma condição patológica, uma doença, um distúrbio, uma disfunção, um defeito genético, tais como anticorpos monoclonais, enzimas, proteases, citocinas, interferão, insulina, ertropoietina, factores de coagulação, outros factores do sangue ou componentes, vectores virais para terapia de genes, vírus para vacinas, alvos para descoberta de fármacos, genómica funcional, e análises e aplicações proteómicas, e afins.
POLINUCLEÓTIDOS DA INVENÇÃO 0 novo sistema de expressão de genes induzido baseado no recetor de ecdisona / recetor X retinoide invertebrado da invenção compreende uma cassete de expressão de genes que compreende um polinucleótido que codifica um polipéptido híbrido que compreende a) um domínio de ligação ao ADN ou um domínio de transativação, 4 b) um domínio de ligação ao ligando do EcR ou um domínio de ligação ao ligando do RXR invertebrado. Estas cassetes de expressão de genes, os polinucleótidos que elas compreendem, e os polipéptido híbridos que elas codificam são úteis como componentes de um sistema de expressão de genes baseado no EcR para modular a expressão de um gene dentro de uma célula hospedeira.
Assim, a presente invenção proporciona um polinucleótido isolado que codifica um polipéptido híbrido que compreende a) um domínio de ligação ao ADN ou um domínio de transativação de acordo com a invenção, e b) um domínio de ligação ao ligando do EcR ou um domínio de ligação ao ligando do RXR invertebrado de acordo com a invenção. A presente invenção também se relaciona com um polinucleótido isolado que codifica um EcR truncado ou um polipéptido RXR invertebrado truncado que compreende uma 66 mutação de truncagem de acordo com a invenção. Especificamente, a presente invenção relaciona-se com um polinucleótido isolado que codifica um polipéptido do EcR ou do RXR invertebrado que compreende uma mutação de truncagem que afeta a atividade de ligação ao ligando ou sensibilidade ao ligando que é útil na modulação da expressão de genes num célula hospedeira.
Numa modalidade especifica, o polinucleótido do EcR isolado truncado compreende uma sequência de polinucleótidos selecionada a partir do grupo que consiste em SEQ. ID N.° 1, SEQ. ID N.° 53 e SEQ. ID N.° 45.
Numa outra modalidade especifica, o polinucleótido do EcR isolado truncado codifica um polipéptido do recetor de ecdisona truncado que compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 5, SEQ ID NO: 43 e SEQ. ID N.° 59.
Numa outra modalidade especifica, o polinucleótido do RXR invertebrado isolado truncado de acordo com a invenção compreende uma sequência de polinucleótidos selecionada a partir do grupo que consiste em SEQ. ID N.° 15, SEQ. ID N.° 16, SEQ. ID N.° 17, SEQ. ID N.° 18, SEQ. ID N.° 19, e SEQ. ID N.0 20.
Numa outra modalidade especifica, o polinucleótido do RXR invertebrado isolado truncado de acordo com a invenção codifica um polipéptido do RXR invertebrado truncado que compreende uma sequência de aminoácidos que consiste em SEQ. ID N.° 27, SEQ. ID N.° 28, SEQ. ID N.° 29, SEQ. ID N.° 30, SEQ. ID N.° 31, e SEQ. ID N.° 32.
Em particular, a presente invenção relaciona-se com um polinucleótido isolado que codifica um polipéptido do RXR invertebrado que compreende uma mutação de truncagem, em que a mutação reduz a atividade de ligação ao ligando ou sensibilidade ao ligando do polipéptido do RXR invertebrado. Numa modalidade especifica, a presente invenção relaciona-se com um polinucleótido isolado que 67 codifica um polipéptido do RXR invertebrado que compreende uma mutação de truncagem que reduz a atividade de ligação ao esteroide ou sensibilidade ao esteroide do polipéptido do RXR invertebrado.
Numa outra modalidade especifica, a presente invenção reaciona-se com um polinucleótido isolado que codifica um polipéptido do RXR invertebrado que compreende uma mutação de truncagem que reduz a não-atividade de ligação ao esteroide ou não-sensibilidade ao esteroide do polipéptido do RXR invertebrado. A presente invenção também se relaciona com um polinucleótido isolado que codifica um polipéptido do RXR invertebrado que compreende uma mutação de truncagem, em que a mutação potência a atividade de ligação ao ligando ou sensibilidade ao ligando do polipéptido do RXR invertebrado. Numa modalidade especifica, a presente invenção relaciona-se com um polinucleótido isolado que codifica polipéptidos de RXR invertebrado que compreendem uma mutação de truncagem que potência a atividade de ligação ao esteroide ou sensibilidade ao esteroide do polipéptido do RXR invertebrado.
Numa outra modalidade especifica, a presente invenção relaciona-se com um polinucleótido isolado que codifica um polipéptido do RXR invertebrado que compreende uma mutação de truncagem que potência a não-atividade de ligação ao esteroide ou não-sensibilidade ao esteroide do polipéptido do RXR invertebrado. A presente invenção também se relaciona com um polinucleótido isolado que codifica um polipéptido do recetor X retinoide invertebrado que compreende uma mutação de truncagem que aumenta a sensibilidade ao ligando de um heterodimero que compreende o polipéptido do recetor X retinoide invertebrado mutado e um parceiro de dimerização. Preferencialmente, o polinucleótido isolado que codifica um polipéptido do recetor X retinoide invertebrado que 68 compreende uma mutação de truncagem que aumenta a sensibilidade ao ligando de um heterodímero compreende uma sequência de polinucleótidos selecionada a partir do grupo que consiste em SEQ. ID N.° 9 (LmUSP-EF) , SEQ. ID N.° 10 (ArnaRXRl-EF) , SEQ. ID N.° 11 (AmaRXR2-EF) , SEQ. ID N.° 12 (CpRXR-EF) , SEQ. ID N.° 13 (TmRXREF) , e SEQ. ID N.° 14 (AmRXR-EF). Numa modalidade especifica, o parceiro de dimerização é um polipéptido do recetor de ecdisona. Preferencialmente, o parceiro de dimerização é um polipéptido do EcR truncado. Mais preferencialmente, o parceiro de dimerização é um polipéptido do EcR no qual o domínio A/B foi deletado. Ainda mais preferencialmente, o parceiro de dimerização é um polipéptido do EcR que compreende uma sequência de aminoácidos de SEQ. ID N.° 5 (CfEcR-EF), SEQ. ID N.° 43 (Cf EcR-DEF) ou SEQ. ID N.° 59 (CfEcR-CDEF).
POLIPÉPTIDOS DA INVENÇÃO O novo sistema de expressão de genes induzido baseado no recetor de ecdisona / recetor X retinoide invertebrado da invenção compreende uma cassete de expressão de genes que compreende um polinucleótido que codifica um polipéptido híbrido que compreende a) um domínio de ligação ao ADN ou um domínio de transativação, e b) um domínio de ligação ao ligando do EcR ou um domínio de ligação ao ligando do RXR invertebrado. Estas cassetes de expressão de genes, os polinucleótidos que elas compreendem, e os polipéptidos híbridos que elas codificam são úteis como componentes de um sistema de expressão de genes baseado no EcR para modular a expressão de um gene dentro de uma célula hospedeira.
Assim, a presente invenção também se relaciona com um polipéptido híbrido que compreende a) um domínio de ligação ao ADN ou um domínio de transativação de acordo com a invenção, e b) um domínio de ligação ao ligando do EcR ou 69 um domínio de ligação ao ligando do RXR invertebrado de acordo com a invenção. A presente invenção também se relaciona com um polipéptido do EcR isolado truncado ou um polipéptido do RXR invertebrado isolado truncado que compreende uma mutação de truncagem de acordo com a invenção. Especificamente, a presente invenção relaciona-se com um polipéptido do EcR isolado truncado ou um polipéptido do RXR invertebrado isolado truncado que compreende uma mutação de truncagem que afeta a atividade de ligação ao ligando ou sensibilidade ao ligando.
Numa modalidade específica, o polipéptido do EcR isolado truncado é codificado por um polinucleótido que compreende uma sequência de polinucleótidos selecionada a partir do grupo que consiste em SEQ. ID N.° 1, SEQ. ID N.° 53 e SEQ. ID N.0 45.
Numa outra modalidade específica, polipéptido do EcR isolado truncado compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 5, SEQ. ID N.° 43 e SEQ. ID N.° 59.
Numa outra modalidade específica, polipéptido do RXR invertebrado isolado truncado é codificado por um polinucleótido que compreende uma sequência de polinucleótidos selecionada a partir do grupo que consiste em SEQ. ID N.° 15, SEQ. ID N.° 16, SEQ. ID N.° 17, SEQ. ID N.° 18, SEQ. ID N.° 19, e SEQ. ID N.° 20.
Numa outra modalidade especifica, o polipéptido do RXR invertebrado isolado truncado compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 27, SEQ. ID N.° 28, SEQ. ID N.° 29, SEQ. ID N.° 30, SEQ. ID N.° 31, e SEQ. ID N.° 32.
A presente invenção relaciona-se com um polipéptido do RXR invertebrado isolado que compreende uma mutação de truncagem que reduz a atividade de ligação ao ligando ou sensibilidade ao ligando do polipéptido do RXR 70 invertebrado, em que o polipéptido é codificado por um polinucleótido que compreende uma sequência de polinucleótidos selecionada a partir do grupo que consiste em SEQ. ID N.° 15, SEQ. ID N.° 16, SEQ. ID N.° 17, SEQ. ID N.° 18, SEQ. ID N.° 19, e SEQ. ID N.° 20.
Assim, a presente invenção relaciona-se com um polipéptido do RXR invertebrado isolado que compreende uma mutação de truncagem que reduz a atividade de ligação ao ligando ou sensibilidade ao ligando do polipéptido do RXR invertebrado, em que o polipéptido compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 27, SEQ. ID N.° 28, SEQ. ID N.° 29, SEQ. ID N. 0 30, SEQ. ID N.0 31, e SEQ. ID N.° 32.
Numa modalidade especifica, a presente invenção relaciona-se com um polipéptido do RXR invertebrado isolado que compreende uma mutação de truncagem que reduz a atividade de ligação ao esteroide ou sensibilidade ao esteroide do polipéptido do RXR invertebrado.
Numa outra modalidade especifica, a presente invenção relaciona-se com um polipéptido do RXR invertebrado isolado que compreende uma mutação de truncagem que reduz a não-atividade de ligação ao esteroide ou não-sensibilidade ao esteroide do polipéptido do RXR invertebrado.
Além disso, a presente invenção relaciona-se com um polipéptido do RXR invertebrado isolado que compreende uma mutação de truncagem que potência a atividade de ligação ao ligando ou sensibilidade ao ligando do polipéptido do RXR invertebrado. A presente invenção relaciona-se com um polipéptido do RXR invertebrado isolado que compreende uma mutação de truncagem que potência a atividade de ligação ao ligando ou sensibilidade ao ligando do polipéptido do RXR invertebrado. Numa modalidade especifica, a presente invenção relaciona-se com um polipéptido do RXR invertebrado isolado que compreende uma mutação de 71 truncagem que potência a atividade de ligação ao esteroide ou sensibilidade ao esteroide do polipéptido do RXR invertebrado.
Numa outra modalidade específica, a presente invenção relaciona-se com um polipéptido do RXR invertebrado isolado que compreende uma mutação de truncagem que potência a não-atividade de ligação ao esteroide ou não-sensibilidade ao esteroide do polipéptido do RXR invertebrado. A presente invenção também se relaciona com um polipéptido do recetor X retinoide invertebrado isolado que compreende uma mutação de truncagem que aumenta a sensibilidade ao ligando de um heterodimero que compreende o polipéptido do recetor X retinoide invertebrado mutado e um parceiro de dimerização. Preferencialmente, o polipéptido do recetor X retinoide invertebrado isolado que compreende uma mutação de truncagem que aumenta a sensibilidade ao ligando de um heterodimero é codificado por um polinucleótido que compreende uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste em SEQ. ID N.° 9 (LmUSP-EF) , SEQ. ID N.° 10 (AmaRXRl-EF) , SEQ. ID N.° 11 (AmaRXR2-EF) , SEQ. ID N.° 12 (CpRXR-EF) , SEQ. ID N.° 13 (TmRXR-EF), e SEQ. ID N.° 14 (AmRXR-EF) . Mais preferencialmente, o polinucleótido isolado que codifica um polipéptido do recetor X retinoide invertebrado que compreende uma mutação de truncagem que aumenta a sensibilidade ao ligando de um heterodimero compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 21 (LmUSP-EF), SEQ. ID N. 0 22 (AmaRXRl-EF) , SEQ . ID N.° 23 (AmaRXR2-EF) , SEQ. ID N. 0 24 (CpRXR-EF), SEQ. ID N.° 25 (TmRXR-EF), e SEQ. ID N. 0 26 (AmRXR-EF).
Numa modalidade especifica, o parceiro de dimerização é um polipéptido do recetor de ecdisona. Preferencialmente, o parceiro de dimerização é um polipéptido do EcR truncado. Mais preferencialmente, o parceiro de dimerização é um 72 polipéptido do EcRno qual o domínio A/B foi deletado. Ainda mais preferencialmente, o parceiro de dimerização é um polipéptido do EcR que compreende uma sequência de aminoácidos de SEQ. ID N.° 5 (CfEcR-EF) , SEQ. ID N.° 43 (CfEcR DEF) ou SEQ. ID N.° 59 (CtEcR-CDEF).
MÉTODO PARA MODULAR A EXPRESSÃO DE GENES DA INVENÇÃO A invenção do candidato também se relaciona com métodos de modular a expressão de genes numa célula hospedeira usando um sistema de modulação de expressão de genes de acordo com a invenção. Especificamente, a invenção do candidato providencia um método para modular a expressão de um gene numa célula hospedeira que compreende as etapas de: a) introduzir na célula hospedeira um sistema de modulação de expressão de genes de acordo com a invenção; e b) introduzir na célula hospedeira um ligando; em que o gene a ser modulado é um componente de uma cassete de expressão de genes que compreende: i) um elemento de resposta que compreende um domínio reconhecido por um domínio de ligação ao ADN do primeiro polipéptido híbrido; ii) um promotor que é activado pelo domínio de transativação do segundo polipéptido híbrido; e iii) um gene cuja expressão deverá ser modulada, em que após introdução do ligando na célula hospedeira, a expressão do gene seja modulada. A invenção também providencia um método para modular a expressão de um gene numa célula hospedeira que compreende as etapas de: a) introduzir na célula hospedeira um sistema de modulação de expressão de genes de acordo com a invenção; b) introduzir na célula hospedeira a cassete de expressão de genes que compreende i) um elemento de resposta que compreende um domínio reconhecido por um domínio de ligação ao ADN a partir do primeiro polipéptido híbrido; ii) um promotor que é activado pelo domínio de transativação do segundo polipéptido híbrido; e iii) um 73 gene cuja expressão deverá ser modulada; e c) introduzir na célula hospedeira um ligando; em que após introdução do ligando na célula hospedeira, a expressão do gene seja modulada.
Genes de interesse para expressão numa célula hospedeira usando métodos do candidato podem ser genes endógenos ou genes heterólogos. Informação sobre ácidos nucleicos ou sequências de aminoácidos para um gene ou proteína desejados pode ser localizada em uma das muitas bases de dados de acesso público, por exemplo, GENBANK, EMBL, Swiss-Prot, e PIR, ou em muitas publicações em revistas relacionadas com a biologia. Assim, aqueles habilitados na arte têm acesso a informação de sequências de ácidos nucleicos para virtualmente todos os genes conhecidos. Tal informação pode depois ser usada para construer as construções desejadas para a inserção do gene de interesse dentro das cassetes de expressão de genes usadas nos métodos do candidato descritos aqui.
Exemplos de genes de interesse para expressão numa célula hospedeira usando os métodos do candidato incluem, mas não se limitam a: genes que codificam polipéptidos terapeuticamente desejáveis ou produtos que podem ser usados para tratar uma condição patológica, uma doença, um distúrbio, uma disfunção, um defeito genético, tais como anticorpos monoclonais, enzimas, proteases, citocinas, interferões, insulina, ertropoietina, factores de coagulação, outros factores do sangue ou componentes, vectores virais para terapia de genes, vírus para vacinas, alvos para descobertas de fármacos, genómica funcional, e análises e aplicações proteómicas, e afins.
Ligandos aceitáveis são quaisquer que modulem a expressão de um gene quando a ligação do domínio de ligação ao ADN do sistema de duplo-híbrido ao elemento de resposta na presença de ligando resulta na activação ou supressão da expressão dos genes. Ligandos preferidos incluem 74 ponasterona, muristerona A, ácido 9-cis-retinóico, análogos sintéticos do ácido retinóico, N,N'-diacilhidrazinas tais como aquelas reveladas nas Patentes U.S. N.° 6,013,836; 5,117,057; 5,530,028; e 5,378,726; dibenzoilalquil cianohidrazinas tais como aquelas reveladas no Formulário Europeu N.° 461,809; N-alquil-N, N'-diaroilhidrazinas tais como aquelas reveladas na Patente U.S. N.° 5,225,443; N-acil-N-alquilcarbonilhidrazinas tais como aquelas reveladas no Formulário Europeu N.° 234,994; N-aroil-N-alquil-N'-aroilhidrazinas tais como aquelas descritas na Patente U.S. N.° 4,985,461; e outros materiais semelhantes incluindo 3,5-di-tert-butil-4-hidroxi-N-isobutil-benzamida, 8-Oacetilharpagida, e afins.
Numa modalidade preferida, o ligando para uso no método do candidato para modular a expressão de um gene é um composto da fórmula: R4
em que: E é um (C4-C6)alquil que contém um carbono terciário ou um ciano(C3-C5)alquil que contém um carbono terciário; RI é H, Me, Et, i-Pr, F, formil, CF3, CHF2, CHC12, CH2F, CH2C1, CH20H, CH20Me, CH2CN, CN, C°CH, 1-propinil, 2-propinil, vinil, OH, OMe, OEt, ciclopropil, CF2CF3, CH=CHCN, alilo, azido, SCN, ou SCHF; R2 é H, Me, Et, n-Pr, i-Pr, formil, CF3, CHF2, CHC12, CH2F, CH2C1, CH20H, CH20Me, CH2CN, CN, C°CH, 1-propinil, 2- 75 propinil, vinil, Ac, F, Cl, OH, OMe, OEt, O-n-Pr, OAc, NMe2, NEt2, SMe, SEt, SOCF3, OCF2CF2H, COEt, ciclopropil, CF2CF3, CH=CHCN, alilo, azido, 0CF3, OCBF2, O-i-Pr, SCN, SCHF2, SOMe, NH-CN, ou junto com R3 e os carbonos de fenilo aos quais R2 e R3 são anexados para formar um etilenedioxi, um anel dihidrofurilo com o oxigénio adjacente a um carbono de fenilo, ou um anel dihidropirilo com o oxigénio adjacente a um carbono de fenilo; R3 é H, Et, ou junto com R2 e os carbonos de fenilo aos quais R2 e R3 são anexados para formar um etilenedioxi, um anel dihidrofurilo com o oxigénio adjacente a um carbono de fenilo, ou um anel dihidropirilo com o oxigénio adjacente a um carbono de fenilo; R4, R5, e R6 são independentemente H, Me, Et, F, Cl, Br, formil, CF 3, CHF2, CHC12, CH2F, CH2C1, CH20H, CN, C°CH, 1-propinil, 2-propinil, vinil, OMe, OEt, SMe, ou SEt.
Numa outra modalidade preferida, um segundo ligandos pode ser usado. Além disso, ao primeiro ligandos discutido anteriormente no método do candidato para modular a expressão de um gene, em que o segundo ligando é ácido 9-cis-retinóico ou um análogo sintético do ácido retinóico. A invenção do candidato proporciona a modulação da expressão de genes em células hospedeiras eucariontes e procariontes. Assim, a presente invenção também se relaciona com um método para modular a expressão de genes numa célula hospedeira selecionada a partir do grupo que consiste em uma célula bacteriana, uma célula fúngica, uma célula de levedura, uma célula animal, e uma célula de mamifero. Preferencialmente, a célula hospedeira é uma célula de levedura, uma célula de hamster, uma célula de rato, uma célula de macaco, ou uma célula humana. A expressão em células hospedeiras transgénicas pode ser útil para a expressão de vários polipéptidos de interesse incluindo, mas não limitado a, polipéptidos terapêuticos, intermediários de vias; para a modulação das 76 vias já existentes no hospedeiro para a sintese de novos produtos até agora não possivel usando o hospedeiro; ensaios baseados em células; ensaios de genómica funcional, produção de proteína bioterapêutica, ensaios de proteómica, e afins. Adicionalmente, os produtos dos genes podem ser úteis para conferir um rendimento de crescimento do hospedeiro superior ou para permitir um modo de crescimento alternativo a ser utilizado.
CÉLULAS HOSPEDEIRAS E ORGANISMOS NÃO-HUMANOS DA INVENÇÃO
Tal como descrito anteriormente, o sistema de modulação de expressão de genes da presente invenção pode ser usado para modular a expressão de genes numa célula hospedeira. A expressão em células hospedeiras transgénicas pode ser útil para a expressão de vários genes de interesse. Assim, a invenção do candidato proporciona uma célula hospedeira isolada que compreende um sistema de expressão de genes de acordo com a invenção. A presente invenção também proporciona uma célula hospedeira isolada que compreende uma cassete de expressão de genes de acordo com a invenção. A invenção do candidato também providencia uma célula hospedeira isolada que compreende um polinucleótido ou um polipéptido de acordo com a invenção. A célula hospedeira isolada pode ser tanto uma célula hospedeira procarionte como eucarionte.
Preferencialmente, a célula hospedeira é selecionada a partir do grupo que consiste em uma célula bacteriana, uma célula fúngica, uma célula de levedura, uma célula animal, e uma célula de mamífero. Exemplos de células hospedeiras preferidas incluem, mas não se limitam a, espécies de fungos ou leveduras tais como Aspergillus, Trichoderma, Saccharomyces, Pichia, Candida, Hansenula, ou espécies bacterianas tais como aquelas dos géneros Synechocystis, Synechococcus, Salmonella, Bacillus, Acinetobacter, Rhodococcus, Streptomyces, Escherichia, Pseudomonas, 77
Metilomonas, Metilobacter, Alcaligenes, Synechocystis,
Anabaena, Thiobacillus, Methanobacterium e Klebsiella, células hospedeiras animais e de mamífero. que Saccharomyces, de i célula hospedeira i célula hospedeira i célula hospedeira i célula hospedeira hospedeira é bem
Numa modalidade específica, a célula hospedeira é uma célula de levedura selecionada a partir do grupo consiste numa célula hospedeira de Pichia, e de Candida.
Numa outra modalidade específica, é uma célula de hamster.
Numa outra modalidade específica, é uma célula murina.
Numa outra modalidade específica, é uma célula de macaco.
Numa outra modalidade específica, é uma célula humana. A transformação de uma célula conhecida na arte e pode ser conseguida através de uma variedade de métodos incluindo, mas não limitado a, electroporação, infeção virai, transfeção plasmídeo/vector, transfeção mediada por vector não-viral, bombardeamento de partículas, e afins. A expressão dos produtos dos genes desejados envolve cultivar as células hospedeiras transformadas em condições adequadas e induzir a expressão do gene transformado. Os protocolos das condições de cultura e de expressão de genes em células eucariontes e procariontes são bem conhecidos na arte (ver secção dos Métodos Gerais dos Exemplos). As células podem ser colhidas e os produtos dos genes isolados de acordo com os protocolos específicos do produto do gene.
Além disso, a célula hospedeira pode ser escolhida o que modula a expressão do polinucleotídeo inserido, ou modifica e processa o produto do polipéptido da maneira específica desejada. Diferentes células hospedeiras têm mecanismos e caracaterísticas específicos para o processamento e modificação traducional e pós-traducional 78 [por exemplo, glicosilação, divisão (por exemplo, da sequência sinal)] das proteinas. Linhas celulares apropriadas ou sistemas de hospedeiros podem ser escolhidos para assegurar a modificação e processamento desejados da proteína exógena expressa. Por exemplo, a expressão num sistema bacteriano pode ser usada para produzir um produto da proteína nuclear não-glicosilada. Contudo, um polipéptido expresso numa bactéria pode não ser enrolado convenientemente. A expressão numa levedura pode produzir um produto glicosilado. A expressão em células eucariontes pode aumentar a probabilidade de glicosilação e enrolamento "nativa" de uma proteína heteróloga. Além disso, a expressão em células de mamífero pode providenciar uma ferramenta para reconstituir, ou constituir, a atividade do polipéptido. Adicionalmente, sistemas de expressão vector/hospedeiro diferentes podem afetar as reações de processamento, tais como divisões proteolíticas, a um nível diferente. A invenção do candidato também se relaciona com um organismo não-humano que compreende uma célula hospedeira isolada de acordo com a invenção. Preferencialmente, o organismo não-humano é selecionado a partir do grupo que consiste numa bactéria, num fungo, numa levedura, num animal, e num mamífero. Mais preferencialmente, o organismo não-humano é uma levedura, um ratinho, um rato, um coelho, um gato, um cão, um bovino, uma cabra, um porco, um cavalo, uma ovelha, um macaco, ou um chimpanzé.
Numa modalidade específica, o organismo não-humano é uma levedura selecionada a partir do grupo que consiste em Saccharomyces, Pichia, e Candida.
Numa outra modalidade específica, o organismo nao-humano é um ratinho Mus musculus.
MEDIÇÃO DA TRANSCRIÇÃO/EXPRESSÃO DE GENES
Uma medição útil dos métodos da invenção dos 79
Requerentes é a do estado de transcrição da célula, incluindo as identidades e abundâncias de ARN, preferencialmente a espécie de ARNm. Essas medições são realizadas de forma conveniente medindo as abundâncias de ADNc através de qualquer uma das diversas tecnologias de expressão de genes existente. A tecnologia array de ácidos nucleicos é uma técnica útil para determinar a expressão de ARNm diferencial. Esta tecnologia inclui, por exemplo, chips de oligonucleótidos e microarrays de ADN. Estas técnicas baseiam-se em fragmentos de ADN ou oligonucleótidos que correspondem a ADNc ou genes diferentes que são imobilizados num suporte sólido e hibridizados em sondas preparadas a partir de pools de ARNm total extraídos de células, tecidos ou organismos inteiros e convertidos em ADNc. Os chips de oligonucleótidos são arrays de oligonucleótidos sintetizados num substrato utilizando técnicas fotolitográficas. Foram produzidos chips que podem analisar até 1700 genes. Os microarrays de ADN são arrays de amostras de ADN, normalmente produtos de PCR, que são impressos de forma mecânica num diapositivo de microscópio. Cada gene é analisado por uma sequência de ADN alvo de comprimento total ou parcial. Os microarrays com um máximo de 10.000 genes são agora preparados comercialmente de forma regular. A principal diferença entre estas duas técnicas é o facto de os chips de oligonucleótidos utilizarem normalmente oligonucleótidos 25-mer que permitem o fracionamento de pequenas moléculas de ADN, ao passo que os alvos de ADN maiores de microarrays, aproximadamente 1000 pares de base, podem fornecer mais sensibilidade no fracionamento de misturas de ADN complexas.
Outra medição útil dos métodos da invenção dos Requerentes é a da determinação do estado de translação da célula medindo as abundâncias da espécie de proteína constituinte presente na célula utilizando processos bem conhecidos na técnica. 80
Quando for pretendida uma identificação de genes associados a várias funções fisiológicas, pode ser efetuado um ensaio, no qual são medidas as alterações nessas funções, tais como crescimento de células, apoptose, senescência, diferenciação, aderência, ligação a moléculas especificas, ligação a outra célula, organização celular, organogénese, transporte intracelular, facilitação de transporte, conversão de energia, metabolismo, miogénese, neurogénese e/ou hematopoiese.
Além disso, pode ser utilizada a expressão de genes repórteres ou marcadores selecionáveis para medir a modulação da expressão de genes utilizando a invenção dos Requerentes.
Outros métodos para detetar os produtos de expressão de genes são bem conhecidos na técnica e incluem Southern blot (deteção de ADN), Dot/Slot Blot (ADN, ARN), Northern blot (ARN) , RT-PCR (ARN), Western blot (deteção de polipéptidos) e análises de ELISA (polipéptido). Embora seja menos preferível, podem ser utilizadas proteínas classificadas para detetar uma determinada sequência de ácidos nucleicos na qual seja efetuada a hibridação.
Em alguns casos, é necessário amplificar a quantidade de uma sequência de ácidos nucleicos. Isto pode ser realizado utilizando um ou mais dos diversos métodos adequados incluindo, por exemplo, reação em cadeia da polimerase (PCR), reação em cadeia da ligase (LCR), amplificação por deslocamento de cadeia (SDA), amplificação baseada em transcrição, e afins. A PCR é realizada de acordo com técnicas conhecidas nas quais, por exemplo, uma amostra de ácido nucleico é tratada na presença de uma polimerase de ADN termoestável, em condições de hibridação, com um par de primers de oligonucleótidos, em que a hibridação de um primer é efetuada numa cadeia (modelo) da sequência específica a ser detetada. Os primers são suficientemente complementares a cada cadeia de modelo da 81 sequência específica para serem hibridados na mesma. Um produto de extensão de cada primer é sintetizado e é complementar à cadeia de modelo de ácido nucleico na qual foi efetuada a hibridação. 0 produto de extensão sintetizado a partir de cada primer pode servir igualmente de modelo para outra síntese dos produtos de extensão utilizando os mesmos primers. Depois de um número suficiente de sucessões de síntese dos produtos de extensão, a amostra pode ser analisada conforme descrito acima para avaliar se a sequência ou as sequências a serem detetadas estão presentes.
É possível compreender melhor a presente invenção através da referência aos seguintes Exemplos não limitativos, que são fornecidos como exemplo da invenção. EXEMPLOS MÉTODOS GERAIS
As técnicas padrão de clonagem molecular e ADN recombinante aqui utilizadas são bem conhecidas na técnica e são descritas por Sambrook, J., Fritsch, E. F. e Maniatis, T. Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory Press: Cold Spring Harbor, N.Y. (1989) (Maniatis) e por T. J. Silhavy, M. L. Bennan e L. W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1984) e por Ausubel, F. M. et al., Current Protocols in Molecular Biology, Greene Publishing Assoe, e Wiley-Interscience (1987).
Os materiais e métodos adequados para a manutenção e o crescimento de culturas bacterianas são bem conhecidos na técnica. É possível encontrar técnicas adequadas para utilização nos exemplos seguintes, conforme divulgado em Manual of Methods for General Bacteriology (Phillipp Gerhardt, R. G. E. Murray, Ralph N. Costilow, Eugene W. Nester, Willis A. Wood, Noel R. Krieg e G. Briggs Phillips, eds) , American Society for Microbiology, Washington, DC. (1994) ou por Thomas D. Brock em Biotechnology: A Textbook 82 of Industrial Microbiology. Segunda Edição, Sinauer Associates, Inc., Sunderland, MA (1989). Todos os reagentes, enzimas de restrição e materiais utilizados para o crescimento e a manutenção das células hospedeiras foram obtidos a partir de Aldrich Chemicals (Milwaukee, WI), DIFCO Laboratories (Detroit, MI), GIBCO/BRL (Gaithersburg, MD), ou Sigma Chemical Company (St. Louis, MO), salvo especificação em contrário.
As manipulações de sequências genéticas podem ser realizadas utilizando o conjunto de programas disponível a partir de Genetics Computer Group Inc. (Wisconsin Package Versão 9.0, Genetics Computer Group (GCG), Madison, WI) . Quando for utilizado o programa GCG "Pileup", o valor predefinido de criação de espaço de 12 e o valor predefinido de extensão de espaço de 4 podem ser utilizados. Quando for utilizado o programa CGC "Gap" ou "Bestfit", a penalização predefinida de criação de espaço de 50 e a penalização predefinida de extensão de espaço de 3 podem ser utilizadas. Em todo o caso, quando não forem pedidos os parâmetros do programa GCG, nestes ou em quaisquer outros programas GCG, podem ser utilizados os valores predefinidos.
Em seguida, é apresentado o significado das abreviaturas: "h" significa hora(s), "min" significa minuto(s), " seg" significa segundo (s), "d" significa dia (s) , "μΐ" significa microlitro(s), "ml" significa mililitro(s), "L" significa litro (s) , "μΜ" significa micromolar, "mM" significa milimolar, “\xq" significa micrograma(s) , , "mg" significa miligrama(s) , "A" significa adenina ou adenosina, "T" significa timina ou timidina, "G" significa guanina ou guanosina, "C" significa citidina ou citosina, "x g" significa vezes de gravidade, "nt" significa nucleótido(s), "aa" significa aminoácido(s), "bp" significa par(es) de base, "kb" significa quilobase(s), "k" significa quilo, "μ" significa micro e "°C" significa graus 83
Celsius. EXEMPLO 1 0 sistema de modulação de genes induzido baseado em EcR/RXR invertebrado dos Requerentes é útil em várias aplicações, incluindo terapia de genes, expressão de proteínas de interesse em células hospedeiras, produção de organismos transgénicos e ensaios baseados em células. Em vários fundos celulares, incluindo as células de mamífero, o EcR invertebrado heterodimeriza com RXR vertebrado e, na ligação do ligando, transativa os genes sob o controlo de elementos de resposta à ecdisona. Os Requerentes fizeram a surpreendente descoberta de que o RXR invertebrado pode substituir o RXR vertebrado e fornecer um novo sistema de expressão de genes induzido para aplicações de célula animal e de levedura. Este Exemplo descreve a construção de diversas cassetes de expressão de genes para utilização no sistema de expressão de genes induzido baseado em EcR da invenção.
Os Requerentes construíram diversas cassetes de expressão de genes baseadas em EcR com base no insecto Choristoneura fumiferana EcR ("CfEcR"), C.fumiferana
ultraspiracle ("CfUSP"), Drosophila melanogaster USP ("DmUSP") , rato Mus musculus recetor X retinoide cx ("MmRXRa") , gafanhoto Locusta migratória USP ("LmUSP"), um homólogo invertebrado do RXR vertebrado, Amblyomma americanum homólogo 1 do RXR ("AmaRXRl"), um homólogo invertebrado do RXR vertebrado, e Amblyomma americanum homólogo 2 do RXR ("AmaRXR2") , um homólogo invertebrado do RXR vertebrado. As construções de recetor preparadas compreendem um domínio de ligação ao ligando de um EcR, um RXR vertebrado, um USP invertebrado ou um RXR invertebrado; e um domínio de ligação ao ADN (DBD) GAL4 ou LexA ou um domínio de transativação de ativador ácido (AD) VP16 ou B42. As construções de repórter incluem um gene repórter, luciferase ou LacZ, ligados de modo funcional a uma 84 construção de promotor sintético que compreende um elemento de resposta GALA ou um elemento de resposta LexA ao qual o DBD Gal4 ou DBD LexA é ligado, respetivamente. Várias combinações destas construções de recetor e repórter foram cotransfetadas em células de mamífero, conforme descrito nos Exemplos 2 a 9 infra.
Cassetes de Expressão de Genes: as cassetes de expressão de genes baseadas no recetor de ecdisona (trocas) foram construídas como se segue, utilizando métodos de clonagem padrão disponíveis na técnica. Em seguida, é apresentada uma breve descrição da preparação e composição de cada troca nos Exemplos aqui descritos. 1.1 - GALACfEcR-CDEF/VP16MmRXRg-DEF; os domínios C, D, E e F do insecto Choristoneura fumiferana EcR ("CfEcR-CDEF"; SEQ. ID N.° 45) foram fundidos num domínio de ligação ao ADN GAL4 ("Gal4DNABD" ou "Gal4DBD"; SEQ. ID N.° 33) e colocados sob o controlo de um promotor SV40e (SEQ. ID N.° 46). Os domínios DEF do rato (Mus musculus) RXRa ("MmRXRa-DEF"; SEQ. ID N.° 47) foram fundidos no dominio de transativação de VP16 ("VP16AD"; SEQ. ID N.° 37) e colocados sob o controlo de um promotor SV40e (SEQ. ID N.° 46). Cinco locais de ligação ao elemento de resposta GAL4 de consenso ("5XGAL4RE"; compreendendo 5 cópias de um GAL4RE compreendendo SEQ. ID N.° 41) foram fundidos num promotor mínimo Elb sintético (SEQ. ID N.° 48) e colocados a montante do gene luciferase (SEQ. ID N.° 49). 1.2 - GAL4CfEcR-CDEF/VP16MmRXCRg-EF: esta construção foi preparada da mesma forma que na troca 1.1 acima, com a exceção de MmRXRa-DEF ter sido substituído por MmRXRa-EF (SEQ. ID N.° 50). 1.3 - GAL4CfEcR-CDEF/VP16CfUSP-DEF: esta construção foi preparada da mesma forma que na troca 1.1 acima, com a exceção de MmRXRa-DEF ter sido substituído pelos domínios D, E e F da larva USP ("Cf USP-DEF"; SEQ. ID N.° 51). As construções utilizadas neste exemplo são semelhantes às 85 divulgadas na Patente U.S. 5 880 333, com a exceção de ter sido utilizado Choristoneura fumiferana USP em vez de Drosophila melanogaster USP. 1.4 - GAL4CfEcR-CDEF/VP16LmUSP-DEF: esta construção foi preparada da mesma forma que na troca 1.1 acima, com a exceção de MmRXRa-DEF ter sido substituído pelos domínios D, E e F de Locusta migratória ultraspiracle ("LmUSP-DEF"; SEQ. ID N. 0 52) . 1.5 - GALACfEcR-DEF/VP16MmRXRa: esta construção foi preparada da mesma forma que a troca 1.1, com a exceção de CfEcRCDEF ter sido substituído por CfEcR-DEF (SEQ. ID N.° 53) . 1.6 - GAL4CfEcR-DEF/VP16MmRXa-EF: esta construção foi preparada da mesma forma que a troca 1.5, com a exceção de MmRXRa-DEF ter sido substituído por MmRXRa-EF (SEQ. ID N.° 50) . 1.7 - GAL4CfEcR-DEF/VP16CfUSP-DEF: esta construção foi preparada da mesma forma que na troca 1.5 acima, com a exceção de MmRXRa-DEF ter sido substituído pelos domínios D, E e F da larva C fumiferana USP ("CfUSPDEF"; SEQ. ID N.° 51) . 1.8 - GAL4CfEcR-DEF/VP16LmUSP-DEF: esta construção foi preparada da mesma forma que na troca 1.5 acima, com a exceção de MmRXRa-DEF ter sido substituído pelos domínios D, E e F de Locusta migratória ultraspiracle ("LmUSP-DEF"; SEQ. ID N.° 52). 1.9 - Gal4CfEcR-A/BCDEF/VP16LmUSP-DEF: a larva completa de Choristoneura fumiferana EcR ("CfEcR-A/BCDEF"; SEQ. ID N.° 54) foi fundida num domínio de ligação ao ADN GAL4 ("Gal4DNABD" ou "Gal4DBD"; SEQ. ID N.° 33) e colocada sob o controlo de um promotor SV40e (SEQ. ID N.° 46). Os domínios DEF de Locusta migratória ultraspiracle ("LmUSP-DEF"; SEQ. ID N.° 52) foram fundidos no domínio de transativação de VP16 ("VP16AD"; SEQ. ID N.° 37) e colocados sob o controlo de um promotor SV40e (SEQ. ID N.° 86 46) . Cinco locais de ligação ao elemento de resposta GALA de consenso ("5XGAL4RE"; compreendendo 5 cópias de um GALARE compreendendo SEQ. ID N.° 41) foram fundidos num promotor mínimo Elb sintético (SEQ. ID N.° 48) e colocados a montante do gene luciferase (SEQ. ID N.° 49). 1.10 - Gal4CfEcR-l/2CDEF/VP16LmUSP-DEF; esta construção foi preparada da mesma forma que a troca 1.9, com a exceção de CfEcR-A/BCDEF ter sido substituído por CfEcR-1/2CDEF (SEQ. ID N.° 55). 1.11 - GAL4CfEcR-CDEF/VP16LmUSP-DEF: esta construção foi preparada da mesma forma que a troca 1.9, com a exceção de CfEcR-A/BCDEF ter sido substituído por CfEcR-CDEF (SEQ. ID N.0 45). 1.12 - Gal4CfEcR-DEF/VP16LmUSP-DEF: esta construção foi preparada da mesma forma que a troca 1.9, com a exceção de CfEcR-A/BCDEF ter sido substituído por CfEcR-DEF (SEQ. ID N.0 53). 1.13 - Gal4CfEcR-EF/VP16LmUSP-DEF: esta construção foi preparada da mesma forma que a troca 1.9, com a exceção de CfEcR-A/BCDEF ter sido substituído por CfEcR-EF (SEQ. ID N.0 1) . 1.14 - Gal4CfEcR-DE/VP16LmUSP-DEF: esta construção foi preparada da mesma forma que a troca 1.9, com a exceção de CfEcR-CDEF ter sido substituído por CfEcR-DE (SEQ. ID N.° 3) . 1.15 - Gal4CfEcR-A/BCDEF/VP16LmUSP-EF: a larva completa de Choristoneura fumiferana EcR ("CfEcR-A/BCDEF"; SEQ. ID N.° 54) foi fundida num domínio de ligação ao ADN GAL4 ("Gal4DNABD" ou "Gal4DBD"; SEQ. ID N.° 33) e colocada sob o controlo de um promotor SV40e (SEQ. ID N.° 46) . Os domínios EF de Locusta migratória ultraspiracle ("LmUSP-EF"; SEQ. ID N.° 9) foram fundidos no domínio de transativação de VP16 ("VP16AD"; SEQ. ID N.° 37) e colocados sob o controlo de um promotor SV40e (SEQ. ID N.° 46). Cinco locais de ligação ao elemento de resposta GAL4 87 de consenso ("5XGAL4RE"; compreendendo 5 cópias de um GAL4RE compreendendo SEQ. ID N.° 41) foram fundidos num promotor minimo Elb sintético (SEQ. ID N.° 48) e colocados a montante do gene luciferase (SEQ. ID N.° 49). 1.16 - Gal4CfEcR-l/2CDEF/VP16LmUSP-EF: esta construção foi preparada da mesma forma que a troca 1.15, com a exceção de CfEcR-A/BCDEF ter sido substituído por CfEcR-1/2CDEF (SEQ. ID N.° 55). 1.17 - Gal4CfEcR-CDEF/VP16LmUSP-EF: esta construção foi preparada da mesma forma que a troca 1.15, com a exceção de CfEcR-A/BCDEF ter sido substituído por CfEcR-CDEF (SEQ. ID N.0 45). 1.18 - Gal4CfEcR-DEF/VP16LmUSP-EF: esta construção foi preparada da mesma forma que a troca 1.15, com a exceção de CfEcR-A/BCDEF ter sido substituído por CfEcR-DEF (SEQ. ID N.0 53) . 1.19 - Gal4CfEcR-EF/VP16LmUSP-EF: esta construção foi preparada da mesma forma que a troca 1.15, com a exceção de CfEcR-A/BCDEF ter sido substituído por CfEcR-EF (SEQ. ID N.° 1) . 1.20 - Gal4CfEcR-DE/VP16LmUSP-EF: esta construção foi preparada da mesma forma que a troca 1.15, com a exceção de CfEcR-CDEF ter sido substituído por CfEcR-DE (SEQ. ID N.° 3) . 1.21 - Gal4CfEcR-DEF/VP16AmaRXRl-EF: esta construção foi preparada da mesma forma que a troca 1.18, com a exceção de LmUSP-EF ter sido substituído pelos domínios E e F da carraça Ixodidae Amblyomma americanum homólogo 1 do RXR ("AmaRXRl-EF"; SEQ. ID N.° 10). 1.22 - Gal4CfEcR-DEF/VP16AmaRXR2-EF: esta construção foi preparada da mesma forma que a troca 1.21, com a exceção de AmaRXRl-EF ter sido substituído pelos domínios E e F da carraça Ixodidae Amblyomma americanum homólogo 2 do RXR ("AmaRXR2-EF"; SEQ. ID N.° 11). 1.23 - LexACfEcR-CDEF/VPl6CfUSP-EF: os domínios C, D, E e F da larva Choristoneura fumiferana EcR ("CfEcR-CDEF"; SEQ. ID N.° 45) foram fundidos num domínio de ligação ao ADN LexA ("LexADNABD" ou "LexADBD"; SEQ. ID N.° 35) e colocados sob o controlo de um promotor SV40e (SEQ. ID N.° 46). Os domínios E e F da larva C. fumiferana USP ("CfUSP-EF"; SEQ. ID N.° 56) foram fundidos no domínio de transativação de VP16 ("VP16AD"; SEQ. ID N.° 37) e colocados sob o controlo de um promotor SV40e (SEQ. ID N.° 46). Oito locais de ligação ao elemento de resposta LexA de consenso ("8XLexAop"; compreendendo 4 cópias de um local de ligação ao elemento de resposta LexA compreendendo SEQ. ID N.° 42) foram fundidos num promotor mínimo Elb sintético (SEQ. ID N.° 48) e colocados a montante do gene luciferase (SEQ. ID N. 0 49 ) . 1.24 - LexACfEcR-CDEF/VP16LmUSP-EF: esta construção foi preparada da mesma forma que a troca 1.23, com a exceção de CfUSP-EF ter sido substituído por LmUSP-EF (SEQ. ID N.0 9). 1.25 - LexACfEcR-CDEF/VP16MmRXRg-EF: esta construção foi preparada da mesma forma que a troca 1.23, com a exceção de CfUSP-EF ter sido substituído por MmRXRa-EF (SEQ. ID N.0 50) . 1.26 - LexACfEcR-CDEF/VP16DmUSP-EF: esta construção foi preparada da mesma forma que a troca 1.23, com a exceção de CfUSP-EF ter sido substituído pelos domínios EF correspondentes de DmUSP-EF (SEQ. ID N.° 60). 1.27 - Gal4CfEcR-CDEF/BA2LmUSP-EF: os domínios C, D, E e F do insecto Choristoneura fumiferana EcR ("CfEcR-CDEF"; SEQ. ID N.° 45) foram fundidos num domínio de ligação ao ADN GAL4 ("GAL4DNABD" ou "GAL4DBD"; SEQ. ID N.° 33) e colocados sob o controlo de um promotor SV40e (SEQ. ID N.° 46) . Os domínios E e F do gafanhoto Locusta migratória USP ("LmUSP-EF"; SEQ. ID N.° 9) foram fundidos no domínio de transativação de B42 ("B42AD"; SEQ. ID N.° 39) e colocados sob o controlo de um promotor SV40e (SEQ. ID N.° 46). Cinco 89 locais de ligação ao elemento de resposta GAL4 de consenso ("5XGAL4RE"; compreendendo 5 cópias de um GAL4RE compreendendo SEQ. ID N.° 41) foram fundidos num promotor mínimo Elb sintético (SEQ. ID N.° 48) e colocados a montante do gene luciferase (SEQ. ID N.° 49) . 1.28 - LexACfEcR-CDEF/B42LmUSP-EF: esta construção foi preparada da mesma forma que a troca 1.27, com a exceção de o domínio de ligação ao ADN GAL4 ter sido substituído por um domínio de ligação ao ADN LexA (SEQ. ID N.° 35). 1.29 - GAL4CfEcR DEF/VP16DmUSP-EF: esta construção foi preparada da mesma forma que a troca 1.7, com a exceção de CfUSP-DEF ter sido substituído pelos domínios EF correspondentes de DmUSP-EF (SEQ. ID N.° 60). 1.30 - GAL4CfEcR-DEF/VP16CfUSP-EF: esta construção foi preparada da mesma forma que a troca 1.7, com a exceção de CfUSP-DEF ter sido substituído por CfUSP-EF (SEQ. ID N.° 56) . EXEMPLO 2
Num formato de troca de duplo-híbrido, CfUSP e DmUSP em parceria com CfEcR são ativos de forma constitutiva tanto nas células de levedura como de mamífero. Por outro lado, o RXR vertebrado em parceria com CfEcR é um transativador dependente do ligando nas células de mamífero. Os Requerentes testaram um RXR invertebrado, LmUSP num formato de duplo-híbrido em células NIH3T3 de rato para determinar se funcionaria como um USP (de forma constitutiva) ou como um RXR vertebrado (de forma induzida) em células de mamífero. Gal4:CfEcR-CDEF (Figura 1) ou Gal4:CfEcR-DEF (Figura 2) foram emparelhados com VP16:MmRXR-DEF; YP16:MmRXR-EF; VP16:LmUSP-DEF; ou VP16:CfUSP-EF e analisados em células de mamífero. Resumindo, o potencial de indução de genes (magnitude de indução) e a sensibilidade e especificidade do ligando foram examinados utilizando dois ligandos diferentes: um ligando esteroide (Ponasterone A, "PonA") e um ligando não- 90 esteroide [N-(2-etill-3-metoxibenzoil)-N'-(3,5-dimetilbenzoil)-N-tert-butilhidrazina] numa indução dependente da dose da expressão de genes repórteres nas células NIH3T3 transfetadas. As atividades da expressão de genes repórteres foram ensaiadas em 48 horas após a adição do ligando. Os métodos padrão para a cultura e manutenção das células foram seguidos. Transfeções: os ADNs correspondentes às várias construções de troca descritas no Exemplo 1, especif icamente as trocas 1.1 a 1.8, foram transfetados em células NIH3T3 de rato (ATCC) como se segue. As células foram colhidas quando atingiram 50% de confluência e colocadas em placas de 6, 12 ou 24 poços em 125.000, 50.000 ou 25.000 células, respetivamente, em 2,5, 1,0 ou 0,5 ml de meio de crescimento contendo 10% de soro bovino fetal (FBS), respetivamente. No dia seguinte, as células foram enxaguadas com meio de crescimento e transfetadas durante quatro horas. Superfect™ (Qiagen Inc.) foi considerado o melhor reagente de transfeção para células 3T3. Para placas de 12 poços, foram misturados 4 μΐ de Superfec™ com 100 μΐ de meio de crescimento. Foram adicionados 1,0 pg de construção de repórter e 0,25 pg de cada construção de recetor do par recetor a ser analisado à mistura de transfeção. Uma segunda construção de repórter foi adicionada [pTKRL (Promega), 0,1 pg/mistura de transfeção], que compreende um gene luciferase Renilla ligado de modo funcional e colocado sob o controlo de um promotor constitutivo de timidina quinase (TK), e foi utilizada para normalização. Os conteúdos da mistura de transfeção foram misturados num misturador de vórtice e mantidos à temperatura ambiente durante 30 min. No fim da incubação, a mistura de transfeção foi adicionada às células mantidas em 400 pl de meio de crescimento. As células foram mantidas a 37 °C e 5% de CO2 durante quatro horas. No fim da incubação, foram adicionados 500 μΐ de meio de crescimento contendo 20% de FBS, e dimetilsulfóxido 91 (DMSO; controlo) ou uma solução de DMSO de 0,1, 1, 5, 10 e 50 μΜ de ligando esteroide PonA ou ligando não-esteroide N-(2-etil-3-metoxibenzoil)N'-(3,5-dimetilbenzoil)-N'-tert-butilhidrazina, e as células foram mantidas a 37 °C e 5% de CO2 durante 48 horas. As células foram colhidas e a atividade de repórter foi testada. O mesmo procedimento foi seguido igualmente para as placas de 6 e 24 poços, com a exceção de todos os reagentes terem sido duplicados para placas de 6 poços e reduzidos para metade para placas de 24 poços.
Ligandos: o ligando esteroide Ponasterone A (PonA) foi adquirido na Sigma Chemical Company. O ligando não-esteroide N-(2-etil-3-metoxibenzoil)-N'-(3,5- dimetilbenzoil)-N'-t-butilhidrazina (ligando não-esteroide GS™-E) é um ligando ecdisteroide estável e sintético sintetizado na Rohm and Haas Company. Todos os ligandos foram dissolvidos em DMSO e a concentração final de DMSO foi mantida em 0,1% tanto nos controlos como nos tratamentos.
Ensaios de Repórter: as células foram colhidas 48 horas após a adição de ligandos. Foram adicionados 125, 250 ou 500 μΐ de tampão de lise passivo (parte do sistema de ensaio de repórter Dual-luciferase™ de Promega Corporation) a cada poço das placas de 24, 12 ou 6 poços respetivamente. As placas foram colocadas num agitador rotativo durante 15 minutos. Foram ensaiados vinte μΐ de lisado. A atividade de luciferase foi medida utilizando o sistema de ensaio de repórter Dual-luciferase™ de Promega Corporation seguindo as instruções do fabricante. A β-galactosidase foi medida utilizando o kit de ensaio Galacto-Star™ de TROPIX seguindo as instruções do fabricante. Todas as atividades de luciferase e β-galactosidase foram normalizadas utilizando luciferase Renilla como padrão. As atividades de enrolamento foram calculadas dividindo unidades de luz relativa (RLU) normalizadas em células tratadas com ligando 92 com RLU normalizada em células tratadas com DMSO (controlo não tratado). Resultados: conforme ilustrado nas Figuras 1 e 2, LmUSP em parceria com CfEcR funciona como um sistema de expressão de genes induzido por ligando em células de mamifero. Este resultado é surpreendente, uma vez que as experiências anteriores dos Requerentes com CfUSP e DmUSP em parceria com CfEcR demonstraram uma atividade de expressão constitutiva (para obter os resultados de CfUSP, consulte o pedido de patente PCT/US01/09050 e as Figuras 1 e 2; os resultados de DmUSP não são ilustrados). Além disso, LmUSP funcionou melhor do que o RXR vertebrado como parceiro CfEcR. Em particular, tanto a sensibilidade, ou seja a concentração de ligando necessária para transativação, como a magnitude de transativação foram aumentadas com LmUSP em comparação com o RXR vertebrado. Deste modo, os Requerentes demonstraram pela primeira vez que os RXRs invertebrados podem funcionar eficazmente em parceria com um recetor de ecdisona num sistema de expressão de genes induzido em células de mamífero. Este sistema de expressão de genes induzido por EcR/RXR invertebrado é um melhoramento ao sistema de expressão de genes de EcR/RXR vertebrado, uma vez que é necessário menos ligando para a transativação e podem ser alcançados níveis maiores de transativação.
Com base na descoberta do Requerente aqui descrita, um perito na técnica pode prever que outros RXRs invertebrados e respetivos homólogos, com a exceção dos homólogos do RXR Díptero (exemplo DmUSP) e homólogos do RXR Lepidóptero (exemplo CfUSP), irão funcionar igualmente no sistema de expressão de genes induzido baseado em EcR/RXR invertebrado dos Requerentes. Além disso, um perito na técnica também pode prever que o novo sistema de expressão de genes induzido dos Requerentes irá funcionar igualmente para modular a expressão de genes em células de levedura. Uma vez que os sistemas de expressão de genes de homólogo do 93 RXR Díptero/homólogo do RXR Lepidóptero/EcR funcionam de forma constitutiva em células de levedura (não são ilustrados dados), de modo semelhante ao funcionamento em células de mamífero, e os Requerentes demonstraram aqui que os RXRs invertebrados não-Dípteros e não-Lepidópteros funcionam de forma induzida em parceria com um EcR em células de mamífero, é igualmente previsível que o sistema de expressão de genes baseado em EcR/RXR invertebrado funcione de forma induzida em células de levedura. Deste modo, o sistema de expressão de genes induzido por EcR/RXR invertebrado da presente invenção é útil em aplicações em que seja desejada a modulação de níveis de expressão de genes tanto nas células de levedura como de mamífero. Além disso, não existe qualquer razão para não esperar que a presente invenção também funcione noutras células. EXEMPLO 3
Este Exemplo descreve a comparação de sistemas de expressão de genes de duplo-híbrido baseados em RXR vertebrado e RXR invertebrado compreendendo polipéptidos RXR invertebrado, RXR vertebrado e Ecr truncados ou completos. Um alinhamento da sequência de aminoácidos, a comparar os domínios EF de doze RXRs invertebrados e vertebrados diferentes, é ilustrado nas Figuras 3A e 3B. Conforme descrito abaixo, os Requerentes compararam trocas baseadas em GAL4/CfEcR diferentes compreendendo MmRXRa-EF (um RXR vertebrado) , LmUSP-EF (um RXR invertebrado) , AmaRXRl-EF (um RXR invertebrado) e AmaRXR2-EF (um RXR invertebrado) fundidos num domínio de ativação VP16 para identificar os recetores que fornecem uma troca com a) indução máxima na presença de ligando; b) fundo mínimo na ausência de ligando; c) concentração altamente sensível ao ligando; e/ou d) interferência mínima entre ligandos e recetores em células de mamífero.
Resumindo, o Ecr completo e os EcRs truncados foram criados através de uma mutação de truncagem nas junções de 94 domínios A/B, C, D, E e F e fundidos num polinucleótido de codificação do domínio de ligação ao ADN GAL4 (SEQ. ID N.° 33), conforme descrito no Exemplo 1 acima. Um polinucleótido de codificação do domínio de ativação VP16 SEQ. ID N.° 37) foi fundido nos domínios E e F de MmRXRa, LmUSP, AmaRXRl e AmaRXR2, conforme descrito no Exemplo 1. As cassetes de expressão de genes de codificação de Ecr/RXR vertebrado ou invertebrado híbridos resultantes foram ensaiadas em células NIH3T3 em comparações aos pares. 0 plasmídeo pFRLUC (Stratagene) que codifica um polipéptido luciferase foi utilizado como uma construção de genes repórteres, e o pTKRL (Promega) que codifica um polipéptido luciferase Renilla sob o controlo do promotor TK constitutivo foi utilizado para normalizar as transfeções, conforme descrito acima. As células transfetadas cresceram na presença de 0, 1, 5 ou 25 μΜ do não-esteroide N-(2-etil-3-metoxibenzoil)-Ν'-(3,5-dimetilbenzoil)-N'-tert-butilhidrazina ou do esteroide PonA durante 48 horas. As células foram colhidas, decompostas e a atividade de repórter luciferase foi medida nos lisados de células. São apresentadas as unidades de luz relativa totais da mosca de luciferase. O número por cima de cada barra corresponde à indução de enrolamento máximo para esse tratamento. A análise foi efetuada em triplicado e foram determinadas as contagens de luciferase média [unidades de luz relativa (RLU) totais], conforme descrito acima.
Conforme ilustrado nas Figuras 4 a 7, CfEcR-CDEF tem um desempenho melhor do que qualquer outra truncagem de CfEcR. Em particular, Gal4CfEcR-CDEF mostrou uma melhor indução do que Gal4CfEcR-DEF utilizando VP16LmUSP-EF. O domínio EF de CfEcR em conjunto com LmUSP-DEF mostrou níveis induzidos razoavelmente bons com níveis não induzidos muito baixos. A maioria dos domínios EcR-EF descritos nas patentes e publicações incluem domínios D, E e F (cerca de 300 aminoácidos). Esta truncagem específica 95 inclui apenas 230 aminoácidos e pode basear-se no domínio D de LmUSP para heterodimerização.
De todas as truncagens de LmUSP testadas, os resultados dos Requerentes mostram que o polipéptido recetor híbrido VP16LmUSP-EF foi o melhor parceiro para polipéptidos híbridos baseados em Gal4CfEcR, com GAL4CfEcRCDEF/VPl6LmUSP-EF (troca 1.17) com um desempenho melhor do que qualquer outra combinação de recetor e mais sensível a não-esteroides do que a esteroides (Figuras 6 e 7) . Em geral, a troca baseada em CfEcR/LmUSP foi mais sensível ao não-esteroide N-(2-etil-3-metoxibenzoil)-N'-(3,5-dimetilbenzoil)-N'-tert-butilhidrazina do que ao esteroide PonA. Deste modo, o domínio EF de LmUSP é suficiente e tem um desempenho melhor do que os domínios DEF deste recetor em parceria com as construções de CfEcR.
Os resultados dos Requerentes mostram que a magnitude e a indução de enrolamento de MmRXRa e LmUSP são semelhantes, mas LmUSP melhora a sensibilidade ao ligando em, pelo menos, 10 dobras. Deste modo, o sistema
EcR/invertebrado é um melhoramento ao sistema EcR/vertebrado. EXEMPLO 4
Este Exemplo descreve outra análise dos Requerentes de cassetes de expressão de genes que codificam polipéptidos de recetor RXR ou Ecr truncados que afetam a atividade de ligação ao ligando ou a sensibilidade ao ligando, ou ambas. Resumindo, onze combinações diferentes de pares de recetor de duplo-híbrido, construídas conforme descrito no Exemplo 1, foram ainda analisadas numa única experiência em células NIH3T3. Estas onze combinações de pares de recetor e respetivos números de amostra correspondentes são representados no Quadro 1. 96
Quadro 1
Combinações de Recetor de Truncagem CfEcR+MmRXRa/LmUSP em Células NIH3T3 N.s da Amostra do Eixo X da Figura 8 Construção de Polipéptidos CfEcR Construção de Polipéptidos MmRXRa ou LmUSP Amostras 1 e 2 GAL4CfEcR-CDEF VP16MmRXR0í-A/BCDEF Amostras 3 e 4 GAL4CÍEcR-CDEF VP16MmRXRa-DEF Amostras 5 e 6 GAL4CfEcR-CDEF VP16MmRXRa-EF Amostras 7 e 8 GAL4CfEcR-DEF VP16MmRXRa-A/BCDEF Amostras 9 e 10 GAL4CfEcR-DEF VP16MmRXRa-DEF Amostras 11 e 12 GAL4CfEcR-DEF VP16MmRXRa-EF Amostras 13 e 14 GAL4:CfEcR-CDEF VP16:LmUSP-DEF Amostras 15 e 16 GAL4:CfEcR-CDEF VP16:LmUSP-EF Amostras 17 e 18 GAL4:CfEcR-DEF VP16:LmUSP-DEF Amostras 19 e 20 GAL4:CfEcR-DEF VP16:LmUSP-EF Amostras 21 e 22 GAL4:CfEcR-EF VP16:LmUSP-DEF
Os pares de construção de recetor acima, juntamente com o plasmídeo repórter pFRLuc, foram construídos conforme descrito acima, e transfetados em células NIH3T3 conforme descrito acima. As onze combinações de recetor de truncagem CfEcR foram duplicadas em dois grupos e tratadas com esteroide (números ímpares no eixo x da Figura 8) ou não-esteroide (números pares no eixo x da Figura 8). Em particular, as células foram cultivadas em meios contendo 0, 1, 5 ou 25 μΜ de ligando PonA (esteroide) ou N-(2-etil-3-metoxibenzoil)-Ν'-(3,5-dimetilbenzoil)-Ν'-tert-butilhidrazina (não-esteroide). A atividade do gene repórter foi medida e foi mostrada a RLU total. O número por cima de cada barra corresponde à indução de enrolamento máximo para esse tratamento e à média das três replicações.
Conforme ilustrado na Figura 8, a combinação de recetor CfEcR-CDEF/LmUSP-EF (colunas 15 e 16) foi o melhor 97 formato, tanto em termos de RLU total como de indução de enrolamento. Este resultado é consistente com os resultados dos Requerentes apresentados acima no Exemplo 3. Estas onze combinações de pares de recetor foram ensaiadas igualmente numa linha celular humana de carcinoma do pulmão A549 (ATCC) e foram observados resultados semelhantes (não são ilustrados dados). EXEMPLO 5
Este Exemplo descreve a análise dos Requerentes de homólogos do recetor X retinoide invertebrado adicionais para utilização no sistema de expressão de genes induzido baseado em EcR/RXR invertebrado da presente invenção. Resumindo, foram construídas trocas de genes de recetor de duplo-híbrido, conforme descrito no Exemplo 1, compreendendo uma cassete de expressão de genes GAL4/CfEcR-DEF e VP16AmaRXRl-EF ou VP16AmaRXR2-EF. Estas trocas de genes baseadas em AmaRXRl e AmaRXR2 (trocas 1.21 e 1.22 do Exemplo 1) foram comparadas com as trocas de genes GAL4/CÍEcR-DEF compreendendo VP16MmRXRa-EF (troca 1.6), VP16LmUSP-EF (troca 1.18), VP16DmUSP-EF (troca 1.29) e VP16CfUSP-EF (troca 1.30) juntamente com pFRLuc em células NIH3T3.
Os pares de construção de recetor acima, juntamente com o plasmídeo repórter pFRLuc, foram construídos conforme descrito acima, e transfetados em células NIH3T3 conforme descrito acima. O potencial de transativação destas seis trocas de genes baseadas no recetor CfEcR-DEF foi determinado nas células transfetadas na presença de 0, 0,2, 1 ou 10 μΜ de ligando PonA (esteroide) ou de 0, 0,4, 0,2, 1 ou 10 μΜ não-esteroide N-(2-etil-3-metoxibenzoil)-Ν'-(3,5-dimetilbenzoil)-N'-tert-butilhidrazina. A atividade do gene repórter foi medida e foi mostrada a RLU total. O número por cima de cada barra corresponde à indução de enrolamento máximo para esse tratamento e à média das três replicações.
Conforme ilustrado na Figura 9, ambas as trocas 98 baseadas em AmaRXRl-EF e AmaRXR2-EF tiverem um desempenho melhor do que a troca baseada em MmRXRa-EF vertebrado, demonstrando que estes homólogos do RXR invertebrado não-lepidóptero e não-díptero também podem funcionar no sistema de expressão de genes induzido baseado em EcR/RXR invertebrado da presente invenção. Deste modo, com base na descoberta surpreendente dos Requerentes de que um RXR invertebrado (LmUSP) pode substituir um RXR vertebrado e nas conclusões confirmadas neste Exemplo relativamente a RXRs da espécie de invertebrados adicionais, um perito na técnica pode prever que outros homólogos do RXR não-díptero e não-lepidóptero da espécie de invertebrados irão funcionar no sistema de expressão de genes do Requerente. EXEMPLO 6
Este exemplo descreve a construção de células hospedeiras compreendendo o sistema de modulação da expressão de genes baseado em EcR/RXR invertebrado de acordo com a invenção. Para fazer com que células estáveis expressem GAL4:CfEcR-DEF/VP16: LmUSP-EF (troca 1.18, preparada conforme descrito no Exemplo 1), os Requerentes transfetaram as cassetes de expressão de genes que codificam os polipéptidos GAL4:CfEcR-DEF e VP16:LmUSP-EF híbridos em células de ovário de hamster chinês (CHO) compreendendo um plasmídeo repórter pFRLuc transfetado de forma estável. Resumindo, as células CHO foram colhidas quando atingiram 60 a 80% de confluência e colocadas em placas de 6, 12 ou 24 poços em 250.000, 100.000, 50.000 células em 2,5, 1,0 ou 0,5 ml de meio de crescimento contendo 10% de soro bovino fetal, respetivamente. No dia seguinte, as células foram enxaguadas com meio de crescimento e transfetadas durante quatro horas.
LipofectAMINE™ 2000 (Life Technologies Inc,) foi considerado o melhor reagente de transfeção para estas células. Para placas de 12 poços, foram misturados 4 μΐ de Lipof ectAMINE™ 2000 com 100 μΐ de meio de crescimento. 99
Foram adicionados 1,0 pg de construção de repórter e 0,25 pg de cada construção de recetor GAL4:CfEcR-DEF e VP16:LmUSP-EF à mistura de transfeção. Uma segunda construção de repórter foi adicionada (0,1 pg/mistura de transfeção), que compreendia um gene luciferase Renilla ligado de modo funcional e colocado sob o controlo de um promotor constitutivo de timidina quinase (TK), e foi utilizada para normalização. Os conteúdos da mistura de transfeção foram misturados num misturador de vórtice e mantidos à temperatura ambiente durante 30 min. No fim da incubação, a mistura de transfeção foi adicionada às células mantidas em 400 pl de meio de crescimento. As células foram mantidas a 37 °C e 5% de CO2 durante quatro horas. No fim da incubação, foram adicionados 500 pl de meio de crescimento contendo 20% de FBS, e DMSO (controlo) ou uma solução de DMSO de ligandos apropriados, e as células foram mantidas a 37 °C e 5% de C02 durante 24 a 48 horas. As células foram colhidas e foi ensaiada a atividade de repórter. O mesmo procedimento foi seguido igualmente para as placas de 6 e 24 poços, com a exceção de todos os reagentes terem sido duplicados para placas de 6 poços e reduzidos para metade para placas de 24 poços.
As células CHO transfetadas cresceram na presença de 0,1, 5 ou 25 pM de ligando esteroide PonA ou ligando não-esteroide GS™-E durante 48 horas. As células foram colhidas, decompostas e a atividade de repórter foi medida. São apresentadas as unidades de luz relativa (RLU) totais da mosca de luciferase. Os números por cima das barras correspondem à indução de enrolamento máximo para cada tratamento, e foram selecionadas populações em massa de células para resistência ao antibiótico neomicina (vpl6: LmUSP/VP16: as construções de RXR têm o gene de resistência à neomicina incorporado). Diversos clones de cada população foram isolados através de diluição de ponto final. Foram analisados três clones de células AL4:CfEcR- 100 DEF/VP16:LmUSP-EF transfetadas de forma estável (consulte a Figura 10, clone 1A2; os dados relacionados com os outros dois clones não são ilustrados).
Dos três clones analisados, o clone estável 1A2 GAL4:CfEcR-DEF/VP16:LmUSP-EF apresentou a indução de enrolamento mais elevado, 162 dobras, na presença de ligando não-esteroide e uma indução de 42 dobras na presença de esteroide PonA (consulte a Figure 10). EXEMPLO 7
Este Exemplo descreve o desenvolvimento de outra forma de realização do sistema de modulação da expressão de genes de EcR/RXR invertebrado da invenção. Especificamente, os Requerentes construíram trocas de genes de EcR/RXR invertebrado baseadas em domínio de ligação ao ADN (DBD) LexA para utilização no sistema de modulação da expressão de genes da invenção. Esta forma de realização pode ser útil como uma troca alternativa a uma troca baseada em GAL4DBD e pode ser igualmente utilizada em vários formatos de troca. Embora o DBD LexA tenha sido utilizado em sistemas de expressão de leveduras e plantas, os Requerentes não têm conhecimento da respetiva utilização em aplicações de mamífero.
Resumindo, uma cassete de expressão de genes compreendendo o domínio de ligação ao ADN LexA (SEQ. ID N.° 35) fundido nos domínios CfEcRCDEF (SEQ. ID N.° 45) foi preparada conforme descrito no Exemplo 1. A cassete de expressão de genes LexA:CfEcR-CDEF, juntamente com uma cassete de expressão de genes VP16:MmRXRa-EF, VP16:CfUSP-EF, VP16:DmUSP-EF ou VP16:LmUSP-EF, e uma construção de repórter (8opFRLuc) compreendendo um operador 8XLexA (4 cópias do elemento de resposta LexA; SEQ. ID N.° 42), um promotor mínimo (promotor mínimo Elb sintético SEQ. ID N.° 48), e um gene luciferase (SEQ. ID N.° 49) foram transfetados em células NIH3T3 de rato. As células transfetadas foram cultivadas na presença de 0, 0,1, 1,5, 101 10 e 50 μΜ de ligando não-esteroide GS™-E ou ligando esteroide PonA durante 48 horas, conforme descrito acima. As células foram colhidas, decompostas e a atividade de repórter foi medida, e as unidades de luz relativa (RLU) totais são apresentadas na Figura 11. O número por cima de cada barra corresponde à indução de enrolamento máximo de cada tratamento. A construção de LexA:CfEcR-DEF funcionou bem nestas células de mamífero com todos os parceiros examinados (consulte a Figura 11). A indução de enrolamento é comparável ao gue foi observado com o sistema GAL4 dos Requerentes (consulte a Figura 4) . O repórter 8opFRLuc (controlo) mostrou muito pouca atividade nestas células. Os resultados apresentados na Figura 11 mostram que o domínio de ligação ao ADN LexA funciona bem no sistema de duplo-híbrido dos Requerentes, demonstrando que o domínio de ligação ao ADN é portátil nestas cassetes de expressão de genes. EXEMPLO 8
Este Exemplo descreve o desenvolvimento de outra forma de realização do sistema de modulação da expressão de genes de EcR/RXR invertebrado da invenção. Especificamente, os Requerentes construíram cassetes de expressão de genes para utilização no sistema de modulação de genes da invenção compreendendo um domínio de ativador ácido B42 como um domínio de transativação. O domínio de ativador ácido B42 ("B42AD"; consulte Gyuris et al., (1993) Célula 75: 791- 803) funciona bem como um transativator em levedura e, como os Requerentes mostraram, funciona bem em células de mamífero. O domínio de ativador ácido B42 pode ser utilizado nas cassetes de expressão de genes da presente invenção como uma alternativa ao domínio de transativação VP16.
Resumindo, os Requerentes construíram uma cassete de expressão de genes compreendendo um polinucleótido que 102 codifica um B42AD (SEQ. ID N.° 39) fundido num polinucleótido que codifica domínios LmUSP-EF (SEQ. ID N.° 9), conforme descrito no Exemplo 1. Esta cassete de expressão de genes B42AD:LmUSP-EF foi avaliada em células NIH3T3 de rato em parceria com uma cassete de expressão de genes GAL4:CfEcR-CDEF ou LexA:CfEcR-CDEF e comparada com uma troca baseada em VP16:LmUSP-EF. Todas as cassetes de expressão de genes foram preparadas conforme descrito no Exemplo 1. As construções de repórter apropriadas foram transfetadas em células NIH3T3. As células transfetadas foram cultivadas na presença de 0, 0,1, 1, 5, 10 e 50 μΜ de ligando não-esteroide GS™-E durante 48 horas, conforme descrito acima. A atividade de repórter é representada como RLU total (consulte a Figura 12). Os números por cima das barras correspondem à indução de enrolamento máximo observada para essa combinação.
Os resultados mostram que o domínio de ativação ácida B42 funciona bem como o domínio de transativação VP16 no sistema de duplo-híbrido dos Requerentes, demonstrando que o domínio de transativação é igualmente portátil nestas cassetes de expressão de genes. EXEMPLO 9
Este Exemplo demonstra o efeito da introdução de um segundo ligando na célula hospedeira compreendendo um sistema de modulação da expressão de genes induzido baseado em EcR/RXR invertebrado da invenção. Em particular, os Requerentes determinaram o efeito de ácido 9-cis-retinóico no potencial de transativação da troca de genes GAL4CfEcR-DEF/VP16LmUSP-EF (troca 1.18) juntamente com pFRLuc em células NIH3T3 na presença de não-esteroide (GSE) durante 48 horas.
Resumindo, GAL4CfEcR-DEF, pFRLuc e VP16MUSP-EF foram transfetados em células NIH3T3 e as células transfetadas foram tratadas com 0, 0,04, 0,2, 1, 5 e 25 μΜ de ligando não-esteroide (GSE) e 0, 1, 5 e 25 μΜ de ácido 9-cis- 103 retinóico (Sigma Chemical Company). A atividade de repórter foi medida em 48 horas após a adição de ligandos.
Conforme ilustrado na Figura 13, a presença de ácido retinóico aumentou a sensibilidade de CfEcR-DEF ao ligando não-esteroide. Numa concentração de ligando não-esteroide de 1 μΜ ou menos, existe muito pouca indução na ausência de ácido 9-cis-retinóico, mas quando é adicionado 1 μΜ de ácido 9-cis-retinóico além do não-esteroide, a indução aumenta bastante.
LISTA DE SEQUÊNCIAS <110> Rohm and Haas Company
Palli, Subba R.
Kapitskaya, Marianna Z. <120> Sistema de expressão génica induzivel com base em receptor de ecdisona/receptor X retinoide de invertebrado novo <130> A01237 <150> US 60/294.814 <151> 31-05-2001 <16 0 > 6 0 <170> Patentln versão 3.1
<210> 1 <211> 735 <212> ADN <213> Choristoneura fumiferana <400> 1 104 taccaggacg ggtacgagca gccttctgat gaagatttga agaggattac gcagacgtgg 60 cagcaagcgg acgatgaaaa cgaagagtct gacactccct tccgccagat cacagagatg 120 actatcctca cggtccaact tatcgtggag ttcgcgaagg gattgccagg gttcgccaag 180 atctcgcagc ctgatcaaat tacgctgctt aaggcttgct caagtgaggt aatgatgctc 240 cgagtcgcgc gacgatacga tgcggcctca gacagtgttc tgttcgcgaa caaccaagcg 300 tacactcgcg acaactaccg caaggctggc atggcctacg tcatcgagga tctactgcac 360 ttctgccggt gcatgtactc tatggcgttg gacaacatcc attacgcgct gctcacggct 420 gtcgtcatct tttctgaccg gccagggttg gagcagccgc aactggtgga agaaatccag 480 cggtactacc tgaatacgct ccgcatctat atcctgaacc agctgagcgg gtcggcgcgt S40 tcgtccgtca tatacggcaa gatcctctca atcctctctg agctacgcac gctcggcatg 600 caaaactcca acatgtgcat ctccctcaag ctcaagaaca gaaagctgcc gcctttcctc 660 gaggagatct gggatgtggc ggacatgtcg cacacccaac cgccgcctat cctcgagtcc 720 cccacgaatc tctag 735
<210> 2 <211> 1338 <212> ADN <213> Drosophila melanogaster <400> 2 tatgagcagc catctgaaga ggatctcagg cgtataatga gtcaacccga tgagaacgag 60 agccaaacgg acgtcagctt tcggcatafca accgagataa ccatactcac ggtccagttg 120 105 attgttgagt ttgctaaagg tctaccagcg tttacaaaga taccccagga ggaccagatc 180 acgttactaa aggcctgctc gtcggaggtg atgatgctgc gtatggcacg acgctatgac 240 cacagctcgg actcaatatt cttcgcgaat aatagatcat atacgcggga ttcttacaaa 300 atggccggaa tggctgataa cattgaagac ctgctgcatt tctgccgcca aatgttctcg 360 atgaaggtgg acaacgtcga atacgcgctt ctcactgcca ttgcgatctt ctcggaccgg 420 ccgggcctgg agaaggccca actagtcgaa gcgatccaga gctactacat cgacacgcta 480 cgcatttata tactcaaccg ccactgcggc gactcaatga gcctcgtctt ctacgcaaag 540 ctgctctcga tcctcaccga gctgcgtacg ctgggcaacc agaacgccga gatgtgtttc 600 tcactaaagc tcaaaaaccg caaactgccc aagttcctcg aggagatctg ggacgttcat 660 gccatcccgc catcggtcca gtcgcacctt cagattaccc aggaggagaa cgagcgtctc 720 gagcgggctg agcgtatgcg ggcatcggtt gggggcgcca ttaccgccgg cattgattgc 780 gactctgcct ccacttcggc ggcggcagcc gcggcccagc atcagcctca gcctcagccc 840 cagccccaac cctcctccct gacccagaac gattcccagc accagacaca gccgcagcta 900 caacctcagc taccacctca gctgcaaggt caactgcaac cccagctcca accacagctt 960 cagacgcaac tccagccaca gatfccaacca cagccacagc tccttcccgt cfcccgctccc 1020 gtgcccgcct ccgtaaccgc acctggttcc ttgtccgcgg tcagfcacgag cagcgaatac 1080 atgggcggaa gtgcggccat aggacccatc acgccggcaa ccaccagcag tatcacggct 1140 gccgttaccg ctagctccac cacatcagcg gtaccgatgg gcaacggagt tggagtcggt 1200 gttggggtgg gcggcaacgt cagcatgtat gcgaacgccc agacggcgat ggccttgatg 1260 ggtgtagccc tgcattcgca ccaagagcag cttatcgggg gagtggcggt taagtcggag 1320 cactcgacga ctgcatag 1338 <210> 3 <211> 960
<212> ADN <213> Choristoneura fumiferana <400> 3 106 cctgagtgcg tagtacccga gactcagtgc gccatgaagc ggaaagagaa gaaagcacag 60 aaggagaagg acaaactgcc tgtcagcacg acgacggtgg acgaccacat gccgcccatt 120 atgcagtgtg aacctccacc tcctgaagca gcaaggattc acgaagtggt cccaaggttt 180 ctctccgaca agctgttgga gacaaaccgg cagaaaaaca tcccccagtt gacagccaac 240 cagcagttcc ttatcgccag gctcatctgg taccaggacg ggtacgagca gccttctgat 300 gaagatttga agaggattac gcagacgtgg cagcaagcgg acgatgaaaa cgaagagtct 360 gacactccct tccgccagat cacagagatg actatcctca cggtccaact tatcgtggag 420 ttcgcgaagg gattgccagg gttcgccaag atctcgcagc ctgatcaaat tacgctgctt 480 .
aaggcttgct caagtgaggt aatgatgctc cgagtcgcgc gacgatacga tgcggcctca 54O gacagtgttc tgttcgcgaa caaccaagcg tacacCcgcg acaactaccg caaggctggc 600 atggcctacg tcatcgagga tctactgcac ttctgccggt gcatgtactc tatggcgttg 660 gacaacatcc attacgcgct gctcacgget gtcgteatct tttctgaecg gccagggttg 720 gagcagccgc aactggtgga agaaatccag cggtactace tgaatacgct ccgcatctat 780 atcetgaacc agetgagegg gtcggcgegt tcgtccgtca tatacggcaa gatcctctca 840 atcctctctg agctacgcac gctcggcatg caaaactcca acatgtgcat ctccctcaag 900 ctcaagaaca gaaagctgcc gcctttcctc gaggagatct gggatgtggc ggacatgtcg 960
<210> 4 <211> 969 <212> ADN <213> Drosophila melanogaster <400> 4 107 cggccggaat gcgtcgtccc ggagaaccaa tgtgcgatga agcggcgcga aaagaaggcc 60 cagaaggaga aggacaaaat gaccacttcg ccgagctcts agcatggcgg caatggcagc 120 ttggcctctg gcggcggcca agactttgtt aagaaggaga ttcttgacct tatgacatgc 1B0 gagccgcccc agcatgccac tattccgcta ctacctgatg aaatattggc caagtgtcaa 240 gcgcgcaata taccttcctt aacgfcacaat cagttggccg ttatatacaa gttaatttgg 300 taccaggatg gctatgagca gccafcctgaa gaggatctca ggcgtataat gagtcaaccc 360 gatgagaacg agagccaaac ggacgtcagc tttcggcata taaccgagat aaccatactc 420 acggtccagt tgattgttga gtttgctaaa ggtctaccag cgtttacaaa gataccccag 4 S0 gaggaccaga tcacgttact aaaggcctgc tcgtcggagg tgatgatgct gcgfcatggca - 540 cgacgctatg accacagctc ggactcaata ttcttcgcga ataatagatc atatacgcgg 600 gattcttaca aaatggeegg aatggctgat aacattgaag acçtgctgca tttcfcgcegc 660 caaatgttct cgatgaaggt ggacaacgtc gaatacgcgc ttcteactgc cattgtgatc 720 ttctcggacc ggccgggcct ggagaaggcc caactagtcg aagcgatcca gagctactac 780 atcg&cacgc tacgcattta tatactcaac cgccactgcg gcgactcaat gagcctcgtc 840 ttctacgcaa agctgctcte gatcctcacc gagctgcgta cgctgggcaa ccagaacgcc 900 gagatgtgtt tctcactaaa gctcaaaaac cgcaaactgc ccaagttcct cgaggagatc 960 tgggacgtt 969
<210> 5 <211> 244 <212> PRT <213> Choristoneura fumiferana <400> 5 108
Tyr Gin Asp Gly Tyr Glu Gin Pro Ser Asp Glu Aep Leu Lya Arg Ile 15 10 15 tVit Gin Thr Trp Gin Gin Ala Aap Asp Glu Asn Glu Glu Ser Asp Thr 20 25 30
Pro Phe Arg Gin Ile Thr Glu Met Thr Ile Leu Thr Vai Gin Leu Ile 35 40 45
Vai Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gin Pro 50 55 €0
Asp Gin Ile Thr Leu Leu Lys Ala Cya Ser Ser Glu Vai Met Met Leu 65 70 75 80
Arg Vai Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Vai Leu Phe Ala 85 90 95
Asn Asn Gin Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala 100 105 110
Tyr Vai Ile Glu Aap Leu Leu Hia Phe Cya Arg Cya Met Tyr Ser Met 115 120 125
Ala Leu Αβρ Aan Ile His Tyr Ala Leu Leu Thr Ala Vai Vai Ile Phe 130 135 140
Ser Aep Arg Pro Gly Leu Glu Gin Pro Gin Leu Vai Glu Glu Ile Gin 145 150 155 160
Arg Tyr Tyr Leu Aan Thr Leu Arg Ile Tyr Ile Leu Asn Gin Leu Ser 165 170 175
Gly Ser Ala Arg Ser Ser Vai Ile Tyr Gly Lya Ile Leu Ser Ile Leu 180 185 190
Ser Glu Leu Arg Thr Leu Gly Met Gin Aan Ser Asn Met Cya Ile Ser 195 200 205
Leu Lya Leu Lys Asn Arg Lya Leu Pro Pro Phe Leu Glu Glu Ile Trp 109 210 215 220
Asp Vai Ala Asp Met Ser Hls Thr Gin Pro Pro Pro Ile Leu Glu Ser 225 230 235 240
Pro Thr Aan Leu
<210> 6 <211> 445 <212> PRT <213> Drosophila melanogaster <400> 6 110 Tyr Glu Gin Pro Ser Glu Glu Asp Leu Arg Arg X 5 10 ile Met Ser
Asp Glu Asn Glu Ser Gin Thr Asp Vai Ser Phe 20 25
Arg His Ile 30 lie Thr Ile Leu Thr Vai Gin Leu Ile Vai Glu 35 40
Phe Ala Lya 45
Pro Ala Phe Thr Lys Ile Pro Gin Glu Asp Gin 50 55
Ile Thr Leu 60
Gin Pro 15 Thr Glu Gly Leu Leu Lys
Ala Cys Ser Ser Glu Vai Met Met Leu Arg Met 65 70 75
Ala Arg Arg
Tyr Asp Θ0 Híb Ser Ser Asp Ser Ile Phe Phe Ala Asn Asn B5 90
Arg Ser Tyr
Thr Arg 95
Asp Ser Tyr Lys Met Ala Gly Met Ala Asp Asn 100 105
Ile Glu Asp 110
Leu Leu
Hls Phe Cys Arg Gin Met Phe Ser Met Lys Vai 115 120
Asp Asn Vai 125
Glu Tyr
Ala Leu Leu Thr Ala Ile Vai Ile Phe Ser Asp 130 135
Arg Pro Gly 140
Leu Glu
Lys Ala Gin Leu Vai Glu Ala ile Gin Ser Tyr 145 150 155
Tyr Ile Asp
Thr Leu 160
Arg He Tyr Ile Leu Asn Arg His Cys Gly Asp Ser Met Ser Leu Vai 165 170 1?5 111
Phe Tyr Ala Lys Leu Leu Ser lie 180
Leu Thr Glu Leu Arg Thr Leu Gly IBS 190
Asn Gin Asn Ala Glu Met Cya Phe 195 200
Ser Leu Lys Leu Lys Asn Arg Lya 205
Leu Pro Lys Phe Leu Glu Glu Ile 210 215
Trp Asp Val His Ala Ile Pro Pro 220
Ser Vai Gin Ser His Leu Gin Ile 225 230
Thr Gin Glu Glu Asn Glu Arg Leu 235 240
Glu Arg Ala Glu Arg Met Arg Ala 245
Ser Val Gly Gly Ala Ile Thr Ala 250 255
Gly Ile Asp Cys Asp Ser Ala Ser 260
Thr Ser Ala Ala Ala Ala Ala Ala 265 270
Gin His Gin Pro Gin Pro Gin Pro 275 280
Gin Pro Gin Pro Ser Ser Leu Thr 28S
Gin Asn Asp Ser Gin His Gin Thr 290 295
Gin Pro Gin Leu Gin Pro Gin Leu 300 pro pro Gin Leu Gin Gly Gin Leu 305 310
Gin Pro Gin Leu Gin Pro Gin Leu 315 320
Gin Thr Gin Leu Gin Pro Gin Ile 325
Gin Pro Gin Pro Gin Leu Leu Pro 330 335
Vai Ser Ala Pro Vai Pro Ala Ser 340
Val Thr Ala Pro Gly Ser Leu Ser 345 350
Ala Vai Ser Thr Ser Ser Glu Tyr 355 360
Met Gly Gly Ser Ala Ala Ile Gly 365
Pro Ile Thr Pro Ala Thr Thr Ser 370 375
Ser Ile Thr Ala Ala Val Thr Ala 380
Ser Ser Thr Thr Ser Ala Vai Pro 385 390
Met Gly Asn Gly Val Gly Val Gly 395 400
Vai Gly Val Gly Gly Asn Vai Ser 405
Met Tyr Ala Asn Ala Gin Thr Ala 410 415 112
Met Ala Leu Met Gly Vai Ala Leu Hie Ser His Qln Glu Gin Leu Ile 420 425 430
Gly Gly Vai Ala Vai Lya Ser Glu Hls Ser Thr Thr Ala 435 440 445
<210> 7 <211> 320 <212> PRT <213> Choristoneura fumiferana <400> 7 113
Pro Glu Cys Vai Vai Pro Glu Thr Gin cys Ala Met Lys Arg Lys Glu 1 5 10 15
Lys Lys Ala Gin Lys Glu Lys Asp Lye Leu Pro Vai Ser Thr Thr Thr 20 25 30
Vai Aep Asp His Met Pro Pro Ile Met Gin Cys Glu Pro Pro Pro Pro 35 40 45
Glu Ala Ala Arg Xle His Glu Vai Vai Pro Arg Phe Leu Ser Asp Lys 50 55 60
Leu Leu Glu Thr Asn Arg Gin Lys Asn ile Pro Gin Leu Thr Ala Asn 65 70 75 βΟ
Gin Gin Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gin Asp Gly Tyr Glu 85 50 95
Gin Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gin Thr Trp Gin Gin 100 105 110
Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gin Ile Thr 115 120 125
Glu Met Thr Ile Leu Thr Vai Gin Leu Ile Vai Glu Phe Ala Lys Gly 130 135 140
Leu Pro Gly Phe Ala Lys Ile Ser Gin Pro Asp Gin Ile Thr Leu Leu 145 150 155 16°
Lys Ala Cys Ser Ser Glu Vai Met Met Leu Arg Vai Ala Arg Arg Tyr 165 170 175
Asp Ala Ala Ser Asp Ser Vai Leu Phe Ala Asn Asn Gin Ala Tyr Thr 180 185 190 114
Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Vai Ile Glu Asp Leu 195 200 205 Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn He His 210 215 220 Tyr Ala Leu Leu Thr Ala Vai Vai Ile Phe Ser Asp Arg Pro Gly Leu 225 230 235 240 Glu Gin Pro Gin Leu vai Glu Glu Ile Gin Arg Tyr Tyr Leu Asn Thr 245 250 255 Leu Arg lie Tyr Ile Leu Asn Gin Leu Ser Gly Ser Ala Arg Ser Ser 260 265 270 Vai Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu 275 260 2Θ5 Gly Met Gin Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn Arg 290 2 95 300 Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Vai Ala Asp Met Ser 305 310 315 320
<210> 8 <211> 323 <212> PRT <213> Drosophila melanogaster <400> 8 115 Axg Pro Glu Cys Vai Vai Pro Glu Aan 1 5
Gin Cya Ala Met Lye Arg Arg 10 15
Glu Lys Lye Ala Gin Lys Glu Lye Aep 20 25
Lye Met Thr Thr Ser Pro Ser 30
Ser Gin Hie Gly Gly Asn Gly Ser Leu 55 40
Ala Ser Gly Gly Gly Gin Aep 45
Phe Vai Lye Lye Glu Ile Leu Aep Leu 50 55
Met Thr Cys Glu Pro Pro Gin 60
Hie Ala Thr ile Pro Leu Leu Pro Aep 65 70
Glu Ile Leu Ala Lye Cya Gin 75 00 116
Ala Arg Asn Ile Pro Ser Leu Thr 85
Tyr Asn Gin Leu Ala Val ile Tyr 90 95
Lys Leu Ile Trp Tyr Gin Asp Gly 100
Tyr Glu Gin Pro Ser Glu Glu Asp 105 110
Leu Arg Arg Ile Met Ser Gin Pro 11S 120
Asp Glu Asn Glu Ser Gin Thr Asp 125
Vai Ser Phe Arg His Ile Thr Glu 130 135
Ile Thr Ile Leu Thr Val Gin Leu 140
Ile Val Glu Phe Ala Lys Gly Leu 145 150
Pro Ala Phe Thr Lye Ile Pro Gin 155 160
Glu Asp Gin Ile Thr Leu Leu Lys 165
Ala Cys ser Ser Glu Val Met Met 170 175
Leu Arg Met Ala Arg Arg Tyr Asp 180
His ser ser Asp ser ile Phe Phe 185 190
Ala Asn Asn Arg Ser Tyr Thr Arg 195 200
Asp Ser Tyr Lys Met Ala Gly Met 205
Ala Asp Asn Ile Glu Asp Leu Leu 210 215
His Phe cys Arg Gin Met Phe Ser 220
Met Lys Val Asp Asn Val Glu Tyr 225 230
Ala Leu Leu Thr Ala Ile Val Ile 235 240
Phe Ser Asp Arg Pro Gly Leu Glu 245
Lys Ala Gin Leu Val Glu Ala Ile 250 255
Gin Ser Tyr Tyr Ile Asp Thr Leu 260
Arg Ile Tyr Ile Leu Asn Arg His 265 270
Cys Gly Asp Ser Met Ser Leu Val 275 -280
Phe Tyr Ala Lys Leu Leu Ser Ile 285
Leu Thr Glu Leu Arg Thr Leu Gly 290 295
Aen Gin Asn Ala Glu Met Cys Phe 300
Ser Leu Lys Leu Lys Asn Arg Lys 305 310
Leu Pro Lys Phe Leu Glu Glu Ile 315 320
Trp Asp Val 117
<210> 9 <211> 635 <212> ADN <213> Locusta migratória <400> 9 tgcatacaga catgcctgtt gaacgcatac ttgaagctga aaaacgagtg gagtgcaaag 60 cagaaaacca agtggaatat gagctggtgg agtgggctaa acacatcccg cacttcacat 120 ccctacctct ggaggaccag gttctcctcc tcagagcagg ttggaatgaa ctgctaattg _ 180 cagcattttc acatcgatct gtagatgtta aagatggcat agtacttgcc actggtctca 240 cagtgcatcg aaattctgcc catcaagctg gagtcggcac aatatttgac agagttttga 300 cagaactggt agcaaagatg agagaaatga aaatggataa aactgaactt ggctgcttgc 360 gatctgttat tcttttcaat ccagaggtga ggggtttgaa atccgcccag gaagttgaac 420 ttctacgtga aaaagtatat gccgctttgg aagaatatac tagaacaaca catcccgatg 480 aaccaggaag atttgcaaaa cttttgcttc gtctgccttc tttacgttcc ataggcctta S40 agtgtttgga gcatttgttt ttctttcgcc ttattggaga tgttccaatt gatacgttcc 600 tgatggagat gcttgaatca ccttctgatt cataa 635
<210> 10 <211> 687 <212> ADN <213> Amblyomma americanum <40 0> 10 118 cctcctgaga tgcctctgga gcgcatactg gaggcagagc tgcgggttga gbcacagacg 60 gggaccctct cggaaagcgc acagcagcag gatccagtga gcagcatcbg ccaagctgca 120 gaccgacagc tgcaccagct agttcaatgg gccaagcaca ttccacattfc tgaagagctt 160 ccccttgagg accgcatggt gttgctcaag gctggctgga acgagctgct cattgctgct 240 ttctcccacc gttctgttga cgtgcgtgat ggcattgtgc tcgctacagg tcttgtggtg 300 cagcggcata gtgctcatgg ggctggcgtt ggggccatat fctgatagggt tctcactgaa 360 ctggtagcaa agatgcgtga gatgaagatg gaccgcactg agcttggatg cctgcttgct 420 gtggtacttt ttaatcctga ggccaagggg ctgcggacct gcccaagtgg aggccctgag 480 ggagaaagtg tatctgcctt ggaagagcac tgccggcagc agtacccaga ccagcctggg 540 cgctttgcca agctgctgct gcggttgcca gctctgcgca gtattggcet caagtgcctc 600 gaacatctct ttttcttcaa gctcatcggg gacacgccca tcgacaactt tcttctttcc 660 atgctggagg ccccctctga cccctaa 687 <210> 11 <211> 693 <212> ADN <213> Amblyomma americanum <400> 11 tctccggaca tgccactcga acgcattctc gaagccgaga tgcgcgtcga gcagccggca 60 ccgtccgttt tggcgcagac ggccgcatcg ggccgcgacc ccgtcaacag catgtgccag 120 gctgccccgc cacttcacga gctcgtacag tgggcccggc gaattccgca cttcgaagag 180 cttcccatcg aggatcgcac cgcgctgctc aaagccggct ggaacgaact gcttattgcc 240 gccttttcgc accgttctgt ggcggtgcgc gacggcafccg ttctggccac cgggctggtg 300 gtgcagcggc acagcgcaca cggcgcaggc gttggcgaca tcttcgaccg cgtactagcc t 360 gagctggtgg çcaagatgcg cgacatgaag atggacaaaa cggagctcgg ctgcctgcgc 420 gccgtggtgc tcttcaatcc agacgccaag ggfcctccgaa acgccaccag agtagaggcg 480 ctccgcgaga aggtgtatgc ggcgctggag gagcactgcc gtcggcacca cccggaccaa 540 ccgggtcgct tcggcaagct gctgctgcgg ctgcctgcct tgcgcagcat cgggctcaaa 600 tgcctcgagc atctgttctt cttcaagctc atcggagaca ctcccataga cagcttcctg 660 ctcaacatgc tggaggcacc ggcagacccc tag 693 <210> 12 119
<211> 801 <212> ADN <213> Celuca pugilator <400> 12 tcagacatgc caattgccag catacgggag gcagagctca gcgtggatcc catagatgag 60 cagccgctgg accaaggggt gaggcttcag gttccactcg cacctcctga tagtgaaaag 120 tgtagcttta ctttaccttt tcatcccgtc agtgaagtat cctgtgctaa ccctctgcag 180 gatgtggtga gcaacatatg ccaggcagct gacagacatc tggtgcagct ggtggagtgg 240 gccaagcaca tcccacactt cacagacctt cccatagagg accaagtggt attactcaaa 300 gccgggtgga acgagttgct tattgcctca ttctcacacc gtagcatggg cgfcggaggat 360 ggcatcgtgc tggccacagg gctcgtgatc cacagaagta gtgctcacca ggctggagtg 420 ggtgccatat ttgatcgtgt cctctctgag ctggtggcca agatgaagga gatgaagatt 480 gacaagacag agctgggctg ccttcgctcc atcgtcctgt tcaacccaga tgccaaagga 540 ctaaactgcg tcaatgatgt ggagatcttg cgtgagaagg tgtatgctgc cctggaggag 600 tacacacgaa ccacttaccc tgatgaacct ggacgctttg ccaagttgct tctgcgactt 660 cctgcactca ggtctatagg cctgaagtgt cttgagtacc tcttcctgtt taagctgatt 720 ggagacactc ccctggacag ctacttgatg aagatgctcg tagacaaccc aaatacaagc 780 gtcactcccc ccaccagcta g 801
<210> 13 <211> 690 <212> ADN <213> Tenebrio molitor <40 0> 13 120 gccgagatgc ccctcgacag gataatcgag gcggagaaac ggafcagaatg cacacccgct €0 ggtggctctg gtggtgtcgg agagcaacac gacggggtga acaacatctg tcaagccact 120 aacaagcagc tgttccaact ggtgcaatgg gctaagctca tacctcactt tacctcgttg 180 ccgatgtcgg accaggtgct tttattgagg gcaggatgga atgaattgct catcgccgca 240 ttctcgcaca gatctataca ggcgcaggat gccatcgttc tagccacggg gttgacagtt 300 aacaaaacgt cggcgcacgc cgtgggcgtg ggcaacatct acgaccgcgt cctctccgag 360 ctggtgaaca agatgaaaga gatgaagatg gacaagacgg agctgggctg cttgagagcc 420 atcatcctck acaaccccac gtgtcgcggc atcaagtceg tgcaggaagt ggagatgctg 480 cgtgagaaaa tttacggcgt gctggaagag tacaccagga ccacccaece gaacgagccc 540 ggcaggttcg ccaaactgct tctgcgcctc ccggccctca ggtccatcgg gttgaaatgt 600 tccgaacacc tctttttctt caagctgatc ggtgatgttc caatagacac gttcctgatg 660 gagatgctgg agtctccggc ggacgcttag 690
<210> 14 <211> 681 <212> ADN <213> Apis mellifera <400> 14 121 cattcggaca tgccgatcga gcgtatcctg gaggccgaga agagagtcga atgtaagatg 60 gagcaacagg gaaattacga gaatgcagtg tcgcacattt gcaacgccac gaacaaacag 120 ctgttccagc tggtagcatg ggcgaaacac atcccgcatt ttacctcgtt gccactggag 180 gatcaggtac ttctgctcag ggccggttgg aacgagttgc tgatagcctc cttttcccac 240 cgttccatcg acgtgaagga cggtatcgtg ctggcgacgg ggatcaccgt gcatcggaac 300 tcggcgcagc aggccggcgt gggcacgata ttcgaccgtg tcctctcgga gcttgtctcg 360 aaaatgcgtg aaatgaagat ggacaggaca gagcttggct gtctcagatc tataatactc 420 ttcaatcccg aggttcgagg actgaaatcc atccaggaag tgaccctgct ccgtgagaag 480 atctacggcg ccctggaggg ttattgccgc gtagcttggc ccgacgacgc tggaagattc 540 gcgaaattac ttctacgcct gcccgccatc cgctcgatcg gattaaagtg cctcgagtac 600 ctgttcttct tcaaaatgat cggtgacgta ccgatcgacg attttctcgt ggagatgtta 660 gaatcgcgat cagatcctta g 681
<210> 15 <211> 516 <212> ADN <213> Locusta migratória <400> 15 atccctacct ctggaggacc aggttctcct cctcagagca ggttggaatg aactgctaat 60 tgcagcattt tcacatcgat ctgtagatgt taaagatggc atagtacttg ccactggtct 120 cacagtgcat cgaaattctg cccatcaagc tggagtcggc acaatatttg acagagtttt 180 gacagaactg gtagcaaaga tgagagaaat gaaaatggat aaaactgaac ttggctgctt 240 gcgatctgtt attcttttca atccagaggt gaggggtttg aaatccgccc aggaagttga 300 acttctacgt gaaaaagtat atgccgcttt ggaagaatat actagaacaa cacatcccga 360 tgaaccagga agatttgcaa aacttttgct tcgtctgcct tctttacgtt ccataggcct 420 taagtgtttg gagcatttgt tttctttcgc cttattggag atgttccaat tgatacgttc 480 ctgatggaga tgcttgaatc accttctgat tcataa 516
<210> 16 <211> 528 <212> ADN 122 <213> Amblyomma americanum <400> 16 attccacatt ttgaagagct tccccttgag gaccgcatgg tgttgctcaa ggctggctgg 60 aacgagctgc tcattgctgc tttctcccac cgttctgttg acgtgcgtga tggcattgtg 120 ctegotacag gtcttgtggt goagcggcat agtgctcatg gggctggcgt tggggccata 180 tttgataggg ttctcactga actggtagca aagatgcgtg agatgaagat ggaccgcact 240 gagcttggat gcctgcttgc tgtggtactt tttaatcctg aggccaaggg gctgcggacc 300 tgcccaagtg gaggccctga gggagaaagt gtatctgcct tggaagagca ctgccggcag 360 cagtacccag accagcctgg gcgctttgcc aagctgctgc tgcggttgcc agctctgcgc 420 agtajttggcc tcaagtgcct cgaacatctc tttttcttca agctcatcgg ggacacgccc 480 atcgacaact ttcttctttc catgctggag gccccctctg acccctaa 528
<210> 17 <211> 531 <212> ADN <213> Amblyomina americanum <40 0> 17 attccgcact tcgaagagct tcccatcgag gatcgcaccg cgctgctcaa agccggctgg 60 aacgaactgc ttattgccgc cttttcgcac cgttctgtgg cggtgcgcga cggcatcgtt 120 ctggccaccg ggctggtggt gcagcggcac agcgcacacg gcgcaggcgt tggcgacatc 180 ttcgaccgcg tactagccga gctggtggcc aagatgcgcg acatgaagat ggacaaaacg 240 gagctcggct gcctgcgcgc cgtggtgctc ttcaatccag acgccaaggg tctccgaaac 300 gccaccagag tagaggcgct ccgcgagaag gtgtatgcgg cgctggagga gcactgccgt 360 cggcaccacc cggaccaacc gggtcgcttc ggcaagctgc tgctgcggct gcctgccttg 420 cgcagcatcg ggctcaaatg cctcgagcat ctgttcttct tcaagctcat cggagacact 4B0 cccatagaca gcttcctgct caacatgctg gaggcaccgg cagaccccta g 531
<210> 18 <211> 552 <212> ADN <213> Celuca pugilator 123 <400> 18 atcccacact tcacagacct tcccatagag gaccaagtgg tattactcaa agccgggtgg 60 aacgagttgc ttattgcctc attctcacac cgtagcatgg gcgtggagga tggcatcgtg 120 ctggccacag ggctcgtgat ccacagaagt agtgctcaec aggctggagt gggtgccata 180 tttgatcgtg tcctctctga gctggtggcc aagatgaagg agatgaagat tgacaagaca 240 gagctgggct gccttcgctc catcgtcctg ttcaacccag atgccaaagg actaaactgc 300 gtcaatgatg tggagatctt gcgtgagaag gtgtatgctg ccctggagga gtacacacga 360 accacttacc ctgatgaacc tggacgcttt gccaagttgc ttctgcgact tcctgcactc 420 aggtctatag gcctgaagtg tcttgagtac ctcttcctgt ttaagctgat tggagacact 480 cccctggaca gctacttgat gaagatgctc gtagacaacc caaatacaag cgtcactccc 540 cccaccagct ag 552
<210> 19 <211> 531 <212> ADN <213> Tenebrio molitor <40 0> 19 atacctcact ttacctcgtt gccgatgtcg gaccaggtgc ttttattgag ggcaggatgg 60 aatgaattgc tcatcgccgc attctcgcac agatctatac aggcgcagga tgccatcgtt 120 ctagccacgg ggttgacagt taacaaaacg tcggcgcacg ccgtgggcgt gggcaacatc 180 tacgaccgcg tcctctccga gctggtgaac aagatgaaag agatgaagat ggacaagacg 240 gagctgggct gcttgagagc catcatcctc tacaacccca cgtgtcgcgg catcaagtcc 300 gtgcaggaag tggagatgct gcgtgagaaa atttacggcg tgctggaaga gtacaccagg 360 accacccacc cgaacgagcc cggcaggttc gccaaactgc ttctgcgcct cccggccctc 420 aggtccatcg ggttgaaatg ttccgaacac ctctttttct tcaagctgat cggtgatgtt 480 ccaatagaca cgttcctgat ggagatgctg gagtctccgg cggacgctta g 531
<210> 20 <211> 531 <212> ADN 124 <213> Apis mellifera <400> 20 atcccgcatt ttacctcgtt gccactggag gatcaggtac ttctgctcag ggccggttgg 60 aacgagttgc tgatagcctc cttttcccac cgttccatcg acgtgaagga cggtatcgtg 120 ctggcgacgg ggatcaccgb gcatcggaae tcggcgcagc aggccggcgt gggeaegata 180 ttcgaccgtg tcctctcgga gcttgtctcg aaaatgcgtg aaatgaagat ggacaggaca 240 gagcttggct gtctcagatc tataatactc ttcaabcccg aggttcgagg actgaaatce 300 atccaggaag tgaccctgct ccgtgagaag atctacggcg ccctggaggg ttattgccgc 360 gtagcttggc ccgacgacgc tggaagattc gcgaaattac ttctacgcct gcccgccatc 420 cgctcgatcg gattaaagtg cctcgagtac ctgttcttct tcaaaatgat cggtgacgta 480 ccgatcgacg attttctcgt ggagatgtta gaatcgcgat cagatcctta g 531
<210> 21 <211> 210 <212> PRT <213> Locusta migratória <400> 21 125
His Thr Asp Met Pro Vai Olu Arg Ile Leu Glu Ala Glu Lys Arg Vai 1 5 10 15
Glu Cys Lys Ala Glu Asn Gin Vai Glu Tyr Glu Leu Vai Glu Trp Ala 20 25 30
Lya His Ile Pro His Phe Thr Ser Leu Pro Leu Glu Asp Gin Vai Leu 35 40 45
Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His 50 55 60
Arg Ser Vai Asp Vai Lys Asp Gly Ile Vai Leu Ala Thr Gly Leu Thr 6S 70 75 80
Vai His Arg Asn Ser Ala His Gin Ala Gly vai Gly Thr Ile Phe Asp 85 90 95
Arg Vai Leu Thr Glu Leu Vai Ala Lys Met Arg Glu Met Lys Met Asp 100 105 110
Lys Thr Glu Leu Gly Cys Leu Arg Ser Vai Ile Leu Phe Asn Pro Glu 115 120 125
Vai Arg Gly Leu Lys Ser Ala Gin Glu Vai Glu Leu Leu Arg Glu Lys 130 135 140
Vai Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asp Glu 145 ISO 15S 160
Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser 155 170 175
Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Arg Leu Ile Gly 180 IBS 190
Asp Vai Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ser 195 200 205
Asp Ser 210 <210> 22 <211> 228 126
<212> PRT <213> Amblyomma americanum <400> 22 127 Pro Pro Glu Ket Piro Leu Glu Arg lie 1 5
Leu Glu Ala Glu 10 i>eu Arg Vai 15
Glu Ser Gin Thr Gly Thr Leu Ser Glu 20 2S ser Ala Gin Gin
Gin Asp Pro 30
Vai Ser Ser Xle Cya Gin Ala Ala Asp 35 40
Arg Gin Leu His 45
Gin Leu Vai
Gin Trp Ala Lya His Xle Pro His Phe 50 55
Glu Glu Leu Pro 60
Leu Glu Asp
Arg Het Vai Leu Leu Lya Ala Gly Trp 65 70
Asn Glu Leu Leu 75
Ile Ala Ala 80
Phe Ser His Arg Ser Vai Asp Vai Arg 85
Asp Gly Ile Vai Leu Ala Thr 90 95
Gly Leu Vai Vai Gin Arg His Ser Ala 100 105
His Gly Ala Gly Vai Gly Ala 110
Ile Phe Αβρ Arg Vai Leu Thr Glu Leu 115 120
Vai Ala Lys Met Arg Glu Met 125
Lys Met Asp Arg Thr Glu Leu Gly Cys 130 135
Leu Leu Ala Vai Vai Leu Phe 140
Asn Pro Glu Ala Lys Gly Leu Arg Thr Cys Pro Ser Gly Gly pro Glu 145 150 155 160
Gly Glu Ser Vai Ser Ala Leu Glu Glu His Cys Arg Gin Gin Tyr Pro 165 170 175
Asp Gin Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu 180 185 190
Arg Ser lie Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu 195 200 205
Ile Gly Asp Thr 210
Pro ile Asp Asn Phe Leu Leu Ser Met 215 220
Leu Glu Ala
Pro Ser Asp Pro 225 128
<210> 23 <211> 230 <212> PRT <213> Amblyomma americanum <400> 23 ser Pro Asp Met Pro Leu Glu Arg IIe Leu Glu Ala Glu Met Arg Vai 15 10 15
Glu Gin Pro Ala Pro Ser Vai Leu Ala Gin Thr Ala Ala Ser Gly Arg 20 25 30 129 λβρ Pro Val Asn Ser Met Cys Qln Ala Ala Pro Pro Leu Hie Glu Leu 35 40 45
Val Gin Trp Ala Arg Arg Ile Pro His phe Glu Glu Leu Pro Ile Glu 50 55 eo
Asp Arg Thr Ala Leu Leu Lys Ala Gly Txp Aan Glu Leu Leu Ile Ala 65 70 75 80
Ala Phe Ser Hie Arg Ser Val Ala Val Arg Asp Gly Ile Val Leu Ala 85 90 95
Thr Gly Leu Val Val Gin Arg Hie Ser Ala Hie Gly Ala Gly Val Gly 100 105 110
Asp Ile Phe Asp Arg Val Leu Ala Glu Leu Val Ala Lye Met Arg Asp 115 120 125
Met Lys Met Aep Lys Thr Glu Leu Gly Cys Leu Arg Ala Val Val Leu 130 135 140
Phe Asn Pro Asp Ala Lys Gly Leu Arg Asn Ala Thr Arg Val Glu Ala 145 150 155 160
Leu Arg Glu Lys Val Tyr Ala Ala Leu Glu Glu His Cys Arg Arg His 165 170. 175
His Pro Asp Gin Pro Gly Arg Phe Gly Lys Leu Leu Leu Arg Leu Pro 180 185 190
Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe 195 200 205
Lys Leu Ile Gly Asp Thr Pro ile Asp Ser Phe Leu Leu Asn Met Leu 210 215 220
Glu Ala Pro Ala Asp Pro 225 230
<210> 24 <211> 266 <212> PRT <213> Celuca pugilator 130 <400> 24
Ser Asp Met Pro Ile Ala Ser Ile Arg Glu Ala Glu Leu Ser Vai Asp 15 10 15 131
Pro Ile Asp Glu Gin Fro Leu Aap Gin Gly Vai Arg Leu Gin Vai Pro 20 25 30
Leu Ala Pro Pro Asp Ser Glu Lys cys ser Phe Thr Leu Pro Phe His 35 40 4S
Pro Vai Ser Glu Vai Ser Cys Ala Asn Pro Leu Gin Aap Vai Vai Ser 50 55 60
Asn Ile cys Gin Ala Ala Asp Arg His Leu Vai Gin Leu Vai Glu Trp 65 70 75 80
Ala Lys His Ile Pro His Phe Thr Asp Leu Pro Ile Glu Asp Gin Vai 85 90 95
Vai Leu Leu Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser 100 105 110
His Arg Ser Met Gly Vai Glu Asp Gly Ile Vai Leu Ala Thr Gly Leu 115 120 125
Vai Ile His Arg Ser Ser Ala His Gla Ala Gly Vai Gly Ala Ile Phe 130 135 140
Asp Arg Vai Leu Ser Glu Leu Vai Ala Lys Met Lys Glu Met Lys Ile 145 150 155 160
Asp Lys Thr Glu Leu Gly Cys Leu Arg Ser Ile Vai Leu Phe Asn Pro 165 170 175
Asp Ala Lys Gly Leu Asn Cys Vai Asn Asp Vai Glu ile Leu Arg Glu 180 185 190
Lys vai Tyr Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr Tyr Pro Asp 195 200 205
Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg 210 215 220
Ser Ile Gly Leu Lys Cys Leu Glu Tyr Leu Phe Leu Phe Lys Leu Ile 225 ' 230 235 240
Gly Asp Thr Pro Leu Asp 245
Ser Tyr Leu Met Lys Met Leu Vai Asp Asn 250 255 132
Pro Asn Thr Ser Vai Thr Pro Pro Tlir Ser 260 265 <210> 25 <211> 229 <212> PRT <213> Tenebrio molitor <400> 25 133 Ala Glu Met Pro 1
Leu Asp Arg 5
Ile ile Glu Ala Glu Lys Arg Ile Glu 10 15
Cye Thr Pro Ala 20
Gly Gly Ser
Gly Gly Vai Gly Glu Gin Hie Asp Gly 25 30
Vai Asn Agn Ile 35
Cys Gin Ala
Thr Asn Lys Gin Leu Phe Gin Leu Vai 40 45
Gin Trp Ala Lys 50
Leu Ile Pro 55
His Phe Thr Ser Leu Pro Met Ser Asp 60
Gin Vai Leu Leu 65
Leu Arg Ala 70
Gly Trp Asn Glu Leu Leu Ile Ala Ala 75 80
Phe Ser His Arg
Ser Ile Gin Ala Gin Asp Ala Ile Vai Leu Ala Thr 85 90 95
Gly Leu Thr Vai 100
Asn Lys Thr Ser Ala His Ala Vai Gly Vai Gly Asn 105 110
Ile Tyr Asp Arg 115
Vai Leu Ser Glu Leu Vai Asn Lys Met Lys Glu Met 120 125
Lys Met Asp Lys 130
Thr Glu Leu Gly Cys Leu Arg Ala Ile Ile Leu Tyr 135 140
Asn Pro Thr Cys Arg Gly Ile Lys Ser Vai Gin Glu Vai Glu Met Leu 145 150 155 160
Arg Glu Lys Ile Tyr Gly Vai Leu Glu Glu Tyr Thr Arg Thr Thr His 165 170 175
Pro Asn Glu Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala 180 185 190
Leu Arg Ser Ile Gly Leu Lys Cys Ser Glu His Leu Phe Phe Phe Lys 134 195 200 205
Leu Ile Gly Asp Vai Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu 210 215 220
Ser Pro Ala Asp Ala 225
<210> 26 <211> 226 <212> PRT <213> Apis mellifera <400> 26 135
His Ser Asp Met Pro Ile Olu Arg Ile Leu Olu Ala Olu Lys Arg Vai '1 5 10 15
Glu Cys Lye Met Glu Gin Gin Gly Asn Tyr Glu Asn Ala Vai Ser Hls 20 25 30
Ile Cys Asn Ala Thr Asn Lye Gin Leu Phe Gin Leu Vai Ala Trp Ala 35 40 45
Lye His Ile Pro Kis Phe Thr Ser Leu Pro Leu Glu Asp Gin Vai Leu 50 55 60
Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His 65 70 75 80
Arg Ser Ile Aep Vai Lys Asp Gly Ile Va'l Leu Ala Thr Gly Ile Thr 85 90 95
Vai His Arg Asn Ser Ala Gin Gin Ala Gly Vai Gly Thr Ile Phe Asp 100 105 no
Arg Vai Leu Ser Glu Leu Vai Ser Lys Met Arg Glu Met Lys Met Asp 115 120 125
Arg Thr Glu Leu Gly Cys Leu Arg Ser Ile Ile Leu Phe Asn Pro Glu 130 135 140
Vai Arg Gly Leu Lys Ser Ile Gin Glu Vai Thr Leu Leu Arg Glu Lye 145 150 155 160
Ile Tyr Gly Ala Leu Glu Gly Tyr Cys Arg Vai Ala Trp Pro Asp Asp 165 170 175
Ala Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Ile Arg Ser 180 185 190
Ile Gly Leu Lys Cys Leu Glu Tyr Leu Phe Phe Phe Lys Met Ile Gly 195 200 205
Asp Vai Pro Ile Asp Asp Phe Leu Vai Glu Met Leu Glu Ser Arg Ser 210 215 220
Asp ΡΓΟ 225 136
<210> 27 <211> 176 <212> PRT <213> Locusta migratória <400> 27 lie Fro Híb Phe Thr ser Leu Pro Leu Qlu Asp Gin Vai Leu Leu Leu 15 10 15
Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser 20 25 30
Vai Asp Vai Lys Asp Gly Ile Vai Leu Ala Thr Gly Leu Thr Vai His 35 40 45
Arg Asn Ser Ala His Gin Ala Gly Vai Gly Thr Ile Phe Asp Arg Vai 50 55 60
Leu Thr Glu Leu Vai Ala Lys Met Arg Glu Met Lys Met Asp Lys Thr 65 70 75 80
Glu Leu Gly Cye Leu Arg Ser Vai Ile Leu Phe Asn Pro Glu Vai Arg 85 90 95
Gly Leu Lys Ser Ala Gin Glu Vai Glu Leu Leu Arg Glu Lys Vai Tyr 100 105 110
Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asp Glu Pro Gly 115 120 125
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ser Leu Arg Ser Ile Gly 130 135 140
Leu Lys Cye Leu Glu His Leu Phe Phe Phe Arg Leu Ile Gly Asp Vai
145 ISO IS5 ISO
Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ser Aap Ser 165 . 170 175
<210> 28 <211> 175 <212> PRT <213> Amblyomma americanum 137 <4Ο0> 28 IIe Pro Híb Phe Glu Glu Leu Pro 1 5
Lys Ala Gly Trp Aen Glu Leu Leu 20
Vai Aep val Arg Asp Gly Ile Vai 35 40
Arg His Ser Ala Hls Gly Ala Gly 50 55
Leu Thr Glu Leu Val Ala Lys Met 65 70
Glu Leu Gly Cys Leu Leu Ala Val 85
Gly Leu Arg Thr Cys Pro Ser Gly 100
Ala Leu Glu Glu His Cys Arg Gin 115 120
Phe Ala Lys Leu Leu Leu Arg Leu 130 135
Lys Cys Leu Glu His Leu Phe Phe 145 150
Ile Asp Asn Phe Leu Leu Ser Met. 165
<210> 29 <211> 176 <212> PRT <213> Amblyomina americanum <400> 29
Glu Asp Arg Met Val Leu Leu 10 15 Ala Ala Phe Ser His Arg Ser 30 Ala Thr Gly Leu Val Val Gin 45 Gly Ala Ile Phe Asp Arg Val 60 Glu Met Lys Met Asp Arg Thr 75 80 Leu Phe Asn Pro Glu Ala Lys 90 95 Pro Glu Gly Glu Ser Val Ser 110 Tyr Pro Asp Gin Pro Gly Arg 125 Ala Leu Arg Ser Ile Gly Leu 140 Lys Leu Ile Gly Asp Thr Pro 155 160 Glu Ala Pro Ser Asp Pro 170 175 138
Ile Pro His Phe Glu Glu Leu Pro Ile Glu Asp Arg Thr Ala Leu Leu 15 10 15
Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser 20 25 30 val Ala Vai Arg Asp Gly Ile Vai Leu Ala Thr Gly Leu vai Vai Gin 35 40 45
Arg His Ser Ala His Gly Ala Gly Val Gly Asp Ile Phe Asp Arg val 50 55 60
Leu Ala Glu Leu Val Ala Lys Met Arg Asp Met Lys Met Asp Lys Thr 65 70 75 80
Glu Leu Gly Cys Leu Arg Ala Val Val Leu Phe Asn Pro Asp Ala Lys 85 90 95
Gly Leu Arg Asn Ala Thr Arg Val Glu Ala Leu Arg Glu Lys Val Tyr 100 10S 110
Ala Ala Leu Glu Glu Hla Cys Arg Arg His His Pro Asp Gin Pro Gly 115 120 125
Arg Phe Gly Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly 130 135 140
Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr 145 150 155 160
Pro Ile Asp Ser Phe Leu Leu Asn Met Leu Glu Ala Pro Ala Asp Pro 165 170 175 <210> 30 <211> 183 <212> PRT <213> Celuca pugilator <40 0> 30 139
He Pro híb Phe Thr Asp Leu Pro Ile Glu Asp Gin Vai Vai Leu Leu 1 5 10 15
Lys Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser Hls Arg Ser 20 25 30
Met Gly Vai Glu Aap Gly Ile Vai Leu Ala Thr Gly Leu Vai Ile His 35 40 45
Arg Ser Ser Ala Hls Gin Ala Gly Vai Gly Ala Ile Phe Aap Arg Vai 50 55 60
Leu ser Glu Leu Vai Ala Lys Met Lys Glu Met Lys Ile Asp Lys Thr 65 70 75 80
Glu Leu Gly Cys Leu Arg Ser Ile Vai Leu Phe Asn Pro Asp Ala Lys 85 90 95
Gly Leu Aen Cys Vai Asn Asp Vai Glu Ile Leu Arg Glu Lys Vai Tyr 100 105 110
Ala Ala Leu Glu Glu Tyr Thr Arg Thr Thr Tyr Pro Asp Glu Pro Gly 115 120 125
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly 130 135 140
Leu Lys Cys Leu Glu Tyr Leu Phe Leu Phe Lys Leu Ile Gly Asp Thr 145 150 155 160
Pro Asn Thr 175
Pro Leu Asp Ser Tyr Leu Met Lys Met Leu Vai Asp Asn • 165 170
Ser val Thr Pro Pro Thr Ser 180
<210> 31 <211> 176 <212> PRT <213> Tenebrio molitor <400> 31 140
Ile Pro His Phe Thr Ser Leu Pro Met Ser Asp Gin Vai Leu Leu Leu 15 10 15
Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ala Phe Ser His Arg Ser 20 25 30
He Gin Ala Qln Asp Ala Ile Vai Leu Ala Thr Gly Leu Thr Vai Asn 35 40 45
Lya Thr Ser Ala His Ala Vai Gly Vai Gly Asn Ile Tyr Asp Arg Vai 50 55 60 Leu Ser Glu Leu Vai Asn Lys Met Lys Glu Met Lys Met Asp Lys Thr 65 70 75 80 Glu Leu Gly cys Leu Arg Ala Ile Ile Leu Tyr Asn Pro Thr Cys Arg 85 90 95 Gly Ile Lys Ser Vai Gin Glu Vai Glu Met Leu Arg Glu Lys Ile Tyr 100 105 110 Gly Vai Leu Glu Glu Tyr Thr Arg Thr Thr His Pro Asn Glu Pro Gly 115 120 125 Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Atg Ser Ile Gly 130 135 140 Leu Lye Cys Ser Glu His Leu Phe phe Phe Lys Leu Ile Gly Asp val 145 150 155 160 Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ser Pro Ala Asp Ala 165 170 175
<210> 32 <211> 176 <212> PRT <213> Apis mellifera <400> 32 141
Ile Pro His Phe Thr Ser· Leu Pro Leu Glu Aflp Gin Vai Leu Leu Leu 1 5 10 IS
Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser 20 25 30
Ile Asp Vai Lys Asp Gly Ile Vai Leu Ala Thr Gly Ile Thr Vai His 35 40 45
Arg Asn Ser Ala Gin Gin Ala Gly Vai Gly Thr Ile Phe Asp Arg Vai 50 55 60
Leu Ser Glu Leu Vai Ser Lye Met Arg Glu Met Lys Met Asp Arg Thr 65 70 75 80
Glu Leu Gly Cys Leu Arg Ser Ile Ile Leu Phe Asn Pro Glu Vai Arg B5 90 ' 95
Gly Leu Lys Ser Ile Gin Glu Vai Thr Leu Leu Arg Glu Lys Ile Tyr 100 105 110
Gly Ala Leu Glu Gly Tyr Cys Arg Vai Ala Trp Pro Asp Asp Ala Gly 115 120 125
Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala ile Arg Ser Ile Gly 130 135 140
Leu Lys Cys Leu Glu Tyr Leu Phe Phe Phe Lys Met Ile Gly Asp Vai 145 150 155 160
Pro Ile Asp Asp Phe Leu Vai Glu Met Leu Glu Ser Arg Ser Asp Pro 165 170 175
<210> 33 <211> 441 <212> ADN <213> Saccharomyces cerevisiae <400> 33 142 atgaagctac tgtcttctat cgaaeaagca tgcgatattt gccgacttaa aaagctcaag 60 tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120 tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180 ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240 ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300 aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360 acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420 caaagacagt tgactgtatc g 441
<210> 34 <211> 147 <212> PRT <213> Saccharomyces cerevisiae <400> 34
Het Lys Leu Leu Ser Ser Ile Glu Gin Ala Cys Asp Ile Cys Arg Leu 1 S 10 15
Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu
Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro 143 35 40 45
Leu Thr Arg Ala His 50
Leu Thr Glu Vai Glu Ser Arg Leu Glu Arg Leu 55 60
Glu Gin Leu Phe Leu 65
Leu Xle Phe Pro Arg Glu Asp Leu Asp Met Ile 70 75 80
Leu Lys Met Asp Ser 85
Leu Gin Asp Ile Lys Ala Leu Leu Thr Gly Leu 90 95
Phe Vai Gin. Asp Asn 100
Vai Asn Lys Asp Ala Vai Thr Asp Arg Leu Ala 105 110
Ser Vai Glu Thr Asp 115
Met Pro Leu Thr Leu Arg Gin His Arg Ile Ser 120 125
Ala Thr Ser Ser Ser 130
Glu Glu Ser Ser Asn Lys Gly Gin Arg Gin Leu 135 140
Thr Vai Ser 145 <210> 35 <211> 606 <212> ADN <213> Escherichia coli <400> 35 144 atgaaagcgt taacggccag gcaacaagag gtgtttgatc tcatccgtga tcacatcagc 60 cagacaggta tgccgccgac gcgtgcggaa atcgcgcagc gtttggggtt ccgttcccca 120 aacgcggctg aagaacatct gaaggcgctg gcacgcaaag gcgttattga aattgtttcc 180 ggcgcatcac gcgggattcg tctgttgcag gaagaggaag aagggttgcc gctggtaggt 240 egtgtggctg ccggtgaacc acttctggcg caacagcata ttgaaggtca ttatcaggtc 300 gatccttcct tattcaagcc gaatgctgat ttcctgctgc gcgtcagcgg gatgtcgatg 360 aaagatatcg gcattatgga tggtgacttg ctggcagtgc ataaaactca ggatgtacgt 420 aacggtcagg tcgttgtcgc acgtattgat gacgaagtta ccgttaagcg cctgaaaaaa 480 cagggcaata aagtcgaact gttgccagaa aatagcgagt ttaaaccaat tgtcgtagat 540 cttcgtcagc agagcttcac cattgaaggg ctggcggttg gggttattcg caacggcgac 600 tggctg 606
<210> 36 <211> 202 <212> PRT <213> Escherichia coli <400> 36 145 Met Lys Ala Leu 1
Asp His He Ser 20
Thr Ala Arg Gin 5 Gin Thr Gly Met
Gin Glu 10
Val Phe Asp Leu
Pro Pro 25
Thr Arg Ala Glu 30
Gin Arg Leu Gly 35
Phe Arg Ser Pro 40
Asn Ala
Ala Glu Glu His 45
Ala Leu Ala Arg 50
Lys Gly Val Ile 55
Glu He
Val Ser Gly Ala 60
Ile Arg 15 Ile Ala Leu Lys Ser Arg
Gly Ile Arg Leu 65
Leu Gin Glu Glu 70
Glu Glu
Gly Leu Pro Leu 75
Val Gly 80
Arg vai Ala Ala
Gly Glu Pro Leu 85
Leu Ala 90
Gin Gin His Ile
Glu Gly 95
His Tyr Gin vai 100
Asp Pro Ser Leu
Phe Lys 105
Pro Asn Ala Asp 110
Phe Leu
Leu Arg Vai Ser 11S
Gly Met Ser Met 120
Lys Asp
Ile Gly He Met 125
Asp Gly
Asp Leu Leu Ala 130
Val His Lys Thr 135
Gin Asp
Val Arg Asn Gly 140
Vai Vai Ala Arg 145
Ile Asp Asp Glu 150
Val Thr
Val Lys Arg Leu 155
Gin Gly Asn Lys
Val Glu Leu Leu 165
Pro Glu 170
Asn Ser Glu Phe
Ile Vai Vai Asp ISO
Leu Arg Gin Gin
Ser Phe 185
Thr Ile Glu Gly 190
Gin Val Lys Lys 160 Lys Pro 175 Leu Ala
val Gly vai Ile 195 <210> 37 <211> 271 <212> ADN
Arg Asn Gly Asp 200
Trp Leu <213> vírus da herpes simples 146 <400> 37 atgggcccta aaaagaagcg taaagtcgcc cccccgaccg atgtcagcct gggggacgag 60 ctccacttag acggcgagga cgtggcgatg gcgcatgccg acgcgctaga cgatttcgat 120 ctggacatgt tgggggacgg ggattccccg gggccgggat ttacccccca cgactccgcc 180 ccctacggcg ctctggatat ggccgacttc gagtttgagc agatgtttac cgatgccctt 240 ggaattgacg agtacggtgg ggaattcccg g 271
<210> 38 <211> 90 <212> PRT <213> vírus da herpes simples 7 <400> 38
Het Gly Pro Lya Lye Lye Arg Lya Vai Ala Pro Pro Thr Aap Vai Ser 15 10 15
Leu Gly Asp Glu Leu His Leu Aap Gly Glu Aap Vai Ala Met Ala Hia 20 25 30
Ala Asp Ala Leu Aap Aap Phe Aap Leu Aap Met Leu Gly Aap Gly Aap 35 40 45
Ser Pro Gly Pro Gly Phe Thr Pro HIb Asp Ser Ala Pro Tyr Gly Ala 50 55 60
Leu Asp Met Ala Aap Phe Glu Phe Glu Gin Met Phe Thr Aap Ala Leu 65 70 75 80
Gly Ile Aap Glu Tyr Gly Gly Glu Phe Pro 85 90
<210> 39 <211> 307 <212> ADN <213> Saccharomyces cerevisiae <400> 39 147 atgggtgctc ctccaaaaaa gaagagaaag gtagctggta tcaataaaga Catcgaggag 60 tgcaatgcca tcattgagca gtttatcgae tacctgcgca ccggacagga gatgccgatg 120 gaaatggcgg atcaggcgat taacgtggtg ccgggcatga cgccgaaaac cattcttcac 180 gccgggccgc cgatccagcc tgactggctg aaatcgaatg gttttcatga aattgaagcg 240 gatgttaacg ataccagcct cttgctgagt ggagatgcct cctaccctta tgatgtgcca 300 gattatg 307
<210> 40 <211> 102 <212> PRT <213> Saccharomyces cerevisiae <400> 40
Met Gly Ala Pro Pro Lys Lys Lys Arg Lys Vai Ala Gly Ile Asn Lys 15 10 15
Asp Ile Glu Glu Cys Asn Ala Ile Ile Glu Gin Phe Ile Asp Tyr Leu 20 25 50
Arg Thr Gly Gin Glu Met Pro Met Glu Met Ala Asp Gin Ala Ile Asn 35 40 45
Vai Vai Pro Gly Met Thr Pro Lys Thr Ile Leu His Ala Gly Pro Pro 50 55 60
Ile Gin Pro Asp Trp Leu Lys Ser Asn Gly Phe Hls Glu Ile Glu Ala 65 70 75 80 Αβρ Vai Asn Asp Thr Ser Leu Leu Leu Ser Gly Asp Ala Ser Tyr Pro 85 90 95
Tyr Asp Vai Pro Asp Tyr 100
<210> 41 <211> 19 <212> ADN <213> Sequência artificial <22 0> <223> Elemento de resposta GAL4 148 <400> 41 ggagtactgt cctccgagc 19 <210> 42 <211> 36 <212> ADN <213> <220> Secuencia artificial <223> Elemento de resposta 2xLexAop <400> 42 ctgctgtata taaaaccagt ggttatatgt acagta 36 <210> 43 <211> 334 <212> PRT <213> Choristoneura fumiferana <400> 43 149
Pro Glu Cys Vai Vai Pro Glu Thr Gin Cys Ala Met Lye Arg Lys Glu 15 10 15
Lys Lys Ala Gin. Lys Glu Lys Asp Lys Leu Pro Vai Ser Thr Thr Thr 20 25 30
Vai Asp Asp Hls Met Pro Pro lie Met Gin Cys Glu Pro Pro Pro Pro 35 40 45
Glu Ala Ala Arg Ile Hls Glu Vai Vai Pro Arg Phe Leu Ser Asp Lys 50 55 60
Leu Leu Glu Thr Asn Arg Gin Lys Asn Ile Pro Gin Leu Thr Ala Asn 65 70 75 80
Gin Gin Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gin Asp Gly Tyr Glu 85 90 . 95
Gin Pro Ser Asp Glu Asp Leu Lys Arg ile Thr Gin Thr Trp Gin Gin 10O 105 110
Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gin Ile Thr 115 120 125
Glu Met Thr Ile Leu Thr Vai Gin Leu Ile Vai Glu Phe Ala Lys Gly 130 135 140
Leu Pro Gly Phe Ala Lys Ile Ser Gin Pro Asp Gin Ile Thr Leu Leu 145 150 155 160
Lys Ala Cys Ser Ser Glu vai Met Met Leu Arg Vai Ala Arg Arg Tyr 165 170 175
Asp Ala Ala Ser Asp Ser Vai Leu Phe Ala Asn Asn Gin Ala Tyr Thr 180 185 190
Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Vai ile Glu Asp Leu 195 200 205
Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn ile Hls 220 150 220 150 210 215 Tyr Ala Leu Leu Thr Ala Vai val 225 230 Glu Gin Pro Gin Leu Vai Glu Glu 245 Leu Arg Ile Tyr Ile Leu Asn Gin 260 Vai Ile Tyr Gly Lys Ile Leu Ser 275 280 Gly Met Gin Asn Ser Asn Met Cys 290 295 Lys Leu Pro Pro Phe Leu Glu Glu 305 , 310 His Thr Gin Pro Pro Pro Ile Leu 325
Ile Phe Ser Aep Arg Pro Gly Leu 235 240
Ile Gin Arg Tyr Tyr Leu Asn Thr 250 255
Leu Ser Gly Ser Ala Arg Ser Ser 265 270
Ile Leu Ser Glu Leu Arg Thr Leu 285
Ile Ser Leu Lys Leu Lys Asn Arg 300
Ile Trp Asp Vai Ala Asp Met Ser 315 320
Glu Ser Pro Thr Asn Leu 330
<210> 44 <211> 549 <212> PRT <213> Drosophila melanogaster <400> 44 151 Arg Pro Glu Cys Vai Vai Pro 1 5 Glu Lys Lys Ala Gin Lys Glu 20 Ser Gin His Gly Gly Asn Gly 35 Phe Vai Lys Lys Glu Ile Leu 50 55 His Ala Thr Ile Pro Leu Leu 65 70 Ala Arg Asn Ile Pro ser Leu
Asn Gin Cys Ala Met Lys Arg Arg 10 15
Asp Lys Met Thr Thr Ser Pro Ser 25 30
Leu Ala Ser Gly Gly Gly Gin Asp 45
Leu Met Thr Cye Glu Pro Pro Gin 60
Asp Glu Ile Leu Ala Lys Cys Gin 75 80
Tyr Asn Gin Leu Ala vai Ile Tyr 90 95 85 152
Lys Leu Ile Trp Tyr Gin Asp Gly Tyr Glu Gin Pro Ser Glu Glu Asp 100 105 110
Leu Arg Arg Ile Met Ser Gin Pro Asp Glu Aen Glu Ser Gin Thr Aep 115 120 125
Vai Ser Phe Arg His Ile Thr Glu Ile Thr Ile Leu Thr Vai Gin Leu 130 135 140
Ile Vai Glu Phe Ala Lys Gly Leu Pro Ala Phe Thr Lys Ile Pro Gin 145 150 155 160
Glu Asp Gin Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Vai Met Met 165 170 17S
Leu Arg Met Ala Arg Arg Tyr Asp His Ser Ser Asp Ser Ile Phe Phe 180 185 190
Ala Asn Asn Arg Ser Tyr Thr Arg Asp Ser Tyr Lys Met Ala Gly Met 195 200 205
Ala Aep Asn Ile Glu Asp Leu Leu His phe Cys Arg Gin Met Phe Ser 210 215 220
Met Lys Vai Asp Asn Vai Glu Tyr Ala Leu Leu Thr Ala ile Vai Ile 225 230 235 240
Phe Ser Asp Arg Pro Gly Leu Glu Lys Ala Gin Leu Vai Glu Ala Ile 245 250 255
Gin Ser Tyr Tyr Ile Asp Thr Leu Arg Ile Tyr Ile Leu Asn Arg His 260 265 270
Cys Gly Asp Ser Met Ser Leu Vai Phe Tyr Ala Lys Leu Leu Ser Ile 275 280 285
Leu Thr Glu Leu Arg Thr Leu Gly Asn Gin Asn Ala Glu Met Cys Phe 290 295 300
Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile 305 310 315 320
Trp Asp Vai His Ala Ile Pro Pro Ser Vai Gin Ser His Leu Gin Ile 325 330 335 153
Thr Gin Glu Glu Asn Glu Arg Leu Glu Arg Ala Glu Arg Met Arg Ala 340 345 350
Ser Val Gly Gly Ala Ile Thr Ala Gly lie Asp Cye Asp Ser Ala Ser 355 360 365
Thr Ser Ala Ala Ala Ala Ala Ala Gin His Gin Pro Gin Pro Gin Pro 370 375 380
Gin Pro Gin Pro Ser Ser Leu Thr Gin Aan Asp Ser Gin His Gin Thr 385 390 395 400
Gin Pro Gin Leu Gin Pro Gin Leu Pro Pro Gin Leu Gin Gly Gin Leu 405 410 415
Gin Pro Gin Leu Gin Pro Gin Leu Gin Thr Gin Leu Gin Pro Gin Ile 420 425 430
Gin Pro Gin Pro Gin Leu Leu Pro Val Ser Ala Pro Val Pro Ala Ser 435 440 445
Val Thr Ala Pro Gly Ser Leu Ser Ala Val Ser Thr Ser Ser Glu Tyr 450 455 460
Met Gly Gly Ser Ala Ala ile Gly Pro ile Thr Pro Ala Thr Thr Ser 465 470 475 480
Ser Ile Thr Ala Ala Val Thr Ala Ser Ser Thr Thr ser Ala Val Pro 485 490 495
Met Gly Asn Gly Val Gly Val Gly Val Gly Val Gly Gly Asn Val Ser 500 SOS S10
Met Tyr Ala Asn Ala Gin Thr Ala Met Ala Leu Met Gly Val Ala Leu 515 520 525
Hia Ser His Gin Glu Gin Leu 530 535
Ile Gly Gly Val Ala Val Lye Ser Glu 540
Hia ser Thr Thr Ala S45 <210> 45 154
<211> 1288 <212> ADN <213> Choristoneura fumiferana <400> 45 aagggccctg cgccccgtca gcaagaggaa ctgtgtctgg tatgcgggga cagagcctcc 60 ggataccact acaatgcgct cacgtgtgaa gggtgtaaag ggttcttcag acggagtgtt 120 aecaaaaatg cggtttatat ttgtaaattc ggtcacgctt gcgaaatgga catgtacatg 180 cgacggaaat gccaggagtg ccgcctgaag aagtgcttag ctgtaggcat gaggcctgag 240 tgcgtagtac ccgagactca gtgcgccatg aagcggaaag agaagaaagc acagaaggag 300 aaggacaaac tgcctgtcag cacgacgacg gtggacgacc acatgccgcc cattatgcag 360 tgtgaacctc cacctcctga agcagcaagg attcacgaag tggtcceaag gtttctctcc 420 gacaagctgt tggagacaaa ccggcagaaa aacatccccc agttgacagc caaccagcag 480 ttcettatcg ccaggctcat ctggtaccag gacgggtacg agcagccttc tgatgaagat 540 ttgaagagga ttacgcagac gtggcagcaa gcggacgatg aaaacgaaga gtctgacact 600 cccttccgcc agatcacaga gatgactatc ctcacggtcc aacttatcgt ggagttcgcg 660 aagggattgc cagggttcgc caagatctcg cagcctgatc aaattacgct gcttaaggct 720 tgctcaagtg aggtaatgat gctccgagtc gcgcgacgat acgatgcggc cfccagacagt 780 gttctgttcg cgaacaacca agcgtacact cgcgacaact accgcaaggc tggcatggcc 840 tacgtcatcg aggatctact gcacttctgc cggtgcatgt actctatggc gttggacaac 900 atccattacg cgctgctcac ggctgtcgtc atcttttctg accggccagg gttggagcag 960 ccgcaactgg tggaagaaat ccagcggtac tacctgaata cgctccgcat ctatatcctg 1020 aaccagctga gcgggtcggc gcgttcgtcc gtcatatacg geaagatcct ctcaatcctc 1080 tctgagctac gcacgctcgg catgcaaaac tccaacatgt gcatctccct caagctcaag 1140 aacagaaagc tgccgccttt cctcgaggag atctgggatg tggcggacat: gtcgcaeacc 1200 caaccgccgc ctatcctcga gtcccccacg aatetctagc ccctgcgegc acgcatcgcc 1260 gatgccgcgt ccggccgcgc tgctctga 1288
<210> 46 <211> 309 <212> ADN <213>Vírus do macaco 40 <400> 46 155 ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 60 agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 120 tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 180 ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt : atttatgcag 240 aggccgaggc cgccbcggcc tctgagctat tccagaagta gtgaggaggc ; ttttttggag 300 gcctaggct 309 <210> 47 <211> 789 <212> ADN <213> Mus musculus <400> 47 aagcgggaag ctgtgcagga ggagcggcag cggggcaagg accggaatga gaacgaggtg 60 gagtccacca gcagtgccaa cgaggacatg cctgtagaga agattctgga agccgagctt 120 getgtcgagc ccaagactga gacatacgfcg gaggcaaaca tggggctgaa ccccagctca 180 ccaaatgacc ctgttaccaa catctgtcaa gcagcagaca agcagctctfc cactcttgtg 240 gagtgggcca agaggatccc acactttbcfc gagcfcgcccc tagacgacca ggtcatcctg 300 ctacgggcag gcfcggaacga gctgctgatc gcctccttct cccaccgctc catagctgtg 360 aaagatggga ttctcctggc caccggcctg cacgtacacc ggaacagcgc tcacagtgct 420 ggggtgggcg ccatctttga cagggtgcta acagagctgg tgtctaagat gcgtgacatg 480 cagatggaca agacggagct gggctgcctg cgagccattg tcctgttcaa ccctgactet 540 aaggggctct caaaccctgc tgaggtggag gogttgaggg agaaggtgta tgcgtcacta 600 gaagcgtact gcaaacacaa gtaccctgag cagccgggca ggtttgccaa gctgctgctc 660 cgcctgcctg cactgcgttc catcgggctc aagtgcctgg agcacctgtt cttcttcaag 720 ctcategggg aeacgcccat cgacaccttc ctcatggaga tgctggaggc accacatcaa 780 gccacctag 789
<210> 48 <211> 24 <212> ADN <213> Sequência artificial <220> 156 <223> promotor mínimo sintético Elb <400> 48
tatataatgg atccccgggt a.C. 24 <210> 49 <211> 1653 <212> ADN <213> Sequência artificial <220> <223> gene luciferase 400> 49 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatcctct agaggatgga 60 157 accgctggag agcaactgca gcttttacag atgcacatat gttcggttgg cagaagctat tgcagtgaaa actctcttca gcagttgcgc ccgcgaacga tcgcagccta ccgtagtgtt aaaaaattac caataatcca tttcagtcga tgtacacgtt tttgtaccag agtccttÇga tctactgggt tacctaaggg catgccagag atcctatttt gttccattcc atcacggttt cgagtcgtct taatgtatag aaaattcaaa gtgcgttgct attgacaaat acgatttatc aaagaagtcg gggaagcggt gggctcactg agactacatc gcggtcggta aagttgttcc acgctgggcg ttaatcagag tatgtaaaca atccggaagc ggagacafcag cttactggga ttaattaaat acaaaggata caccccaaca tcttcgacgc cccgccgccg ttgttgtttt tacgtcgcca gtcaagtaac gaagtaccga aaggtcttac aaggccaaga agggcggaaa <210> 50 <211> 714
<212> ADN <213> Mus musculus taaggctatg aagagatacg cgaggtgaac atcacgtacg gaaacgatat gggctgaata attctttatg ccggtgttgg catttataat gaacgtgaat tgtttccaaa aaggggttgc gaaaattatt atcatggatt cgtcacatct catctacctc tcgtgacaaa acaattgcac tgtggccctt ccgcatagaa tggcaatcaa atcattccgg tggaatgttt actacactcg atttgaagaa gagctgtttt agtaccaaec ctattttcat taatttacac gaaattgctt tgcaaaacgc ttccatcttc agctattctg attacacccg attttttgaa gcgaaggttg aggcgaatta tgtgtcagag gaccaacgcc ttgattgaca cgaagacgaa cacttcttca tcaggtggcc cccgctgaat gggcgtggca ggtcttcccg ggagcacgga aagacgatga aaccgcgaaa aagttgcgcg cggaaaactc gacgcaagaa gtccaaattg taa ccctggttce tggaacaatt 120 cggaatactt cgaaatgtcc 180 caaatcacag aatcgtcgta 240 gcgcgttatt tatcggagtb 300 tgctcaacag tatgaacatt 360 aaaaaatttt gaacgtgcaa 420 etaaaacgga btaccaggga 480 ccggttttaa tgaatacgat ' 540 tgataatgaa ttcctctgga 600 ctgcctgcgt cagattctcg 660 atactgcgat tttaagtgtt 720 gatatttgat atgtggattt 780 tacgatccct tcaggattae 840 tcttcgccaa aagcactatg 900 ctgggggcgc acctctttcg 960 cagggatacg acaaggatat 1020 agggggatga taaaccgggc 1080 tggatctgga taccgggaaa 1140 gacctatgat tatgtceggt 1200 aggatggatg gctacaCtct 1260 tagttgaccg cttgaagtct 1320 tggaatcgat atfcgttacaa 1380 acgatgacgc cggtgaactt 1440 cggaaaaaga gatcgtggat 1500 gaggagttgt gtttgtggac 1560 aaatcagaga gatcctcata 1620 1653 158 <4Ο0> 50 gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag 60 actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt 120 accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg 1Θ0 atcccaeact tttctgagct gcccctagac gaccaggtca tcctgctaçg ggcaggctgg 240 aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc 300 ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgceatc 360 tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg 420 gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac 480 cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa 540 cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg 600 cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg 660 cccatcgaca ccttcctcat ggagatgctg gaggcaccac atcaagccac ctag 714
<210> 51 <211> 867 <212> ADN <213> Choristoneura fumiferana <400> 51 159 aagcgagagg cggtgcaaga ggagcgccag aggaatgctc gcggcgcgga ggatgcgcac 60 ccgagtagct cggtgcaggt aagcgatgag ctgtcaatcg agcgcctaac ggagatggag 120 tctttggtgg cagatcccag cgaggagttc cagttcctcc gcgtggggcc tgacagcaac 1Θ0 gtgcctccac gttaccgcgc gcccgtctce tccctctgcc aaataggcaa caagcaaata 240 Scggcgttgg tggtatgggc gcgcgacatc cctcatttcg ggcagctgga gctggacgat 300 caagtggtac tcatcaaggc ctcctggaat gagctgctac tcttcgccat cgcctggcgc 360 tctatggagt atttggaaga tgagagggag aacggggacg gaacgcggag caccactcag 420 ccacaactga tgtgtctcat gcctggcatg acgttgcacc gcaactcggc gcagcaggcg 480 ggcgtgggcg ccatcttcga cogcgtgctg tccgagctca gtctgaagat gcgcaccttg 540 cgcatggacc aggccgagta cgtcgcgctc aaagccatcg tgctgctcaa ccctgatgtg 600 aaaggactga agaatcggca agaagttgac gttttgcgag aaaaaatgtt ctcttgcctg 660 gacgactact gccggcggtc gcgaagcaac gaggaaggcc ggtttgcgtc cttgctgctg 720 cggctgccag ctctccgctc catetcgctc aagagcttcg aaçaççtcta cttcttccac 780 ctcgtggccg aaggctccat cagcggatac atacgagagg cgctccgaaa ccacgcgcct 840 ccgatcgacg tcaatgccat gatgtaa 867
<210> 52 <211> 711 <212> ADN <213> Locusta migratória <400> 52 160 aagagagaag cagttcagga ggaaaggcag cgaacaaagg agcgtgatca gaatgaagtt 60 gaatcaaeaa gcagcctgca tacagacatg cctgttgaac gcatacttga agctgaaaaa 120 cgagtggagt gcaaagcaga aaaccaagtg gaatatgagc tggtggagtg ggctaaacac 180 atceegcaet tcacatcect acetetggag gaecaggttc tcctcctcag agcaggttgg ’ 240 aatgaacbgc taattgcagc attttcacat cgatctgtag atgttaaaga tggcatagta 300 cttgccactg gtctcacagt gcatcgaaat tctgcccatc aagctggagt cggcacaata 360 tfctgacagag ttttgacaga actggtagca aagatgagag aaatgaaaat ggataaaact 420 gaacttggct gcttgcgatc tgttattctt ttcaatccag aggtgagggg tttgaaatcc 480 gcccaggaag ttgaacttct acgtgaaaaa gtatatgccg ctttggaaga atatactaga 540 acaacacatc ccgatgaacc aggaagattt gcaaaacttt tgcttcgtct gccttcttta 600 cgttccatag gccttaagtg tttggagcat ttgtttttct ttcgccttat tggagatgtt 660 ccaattgata cgttcctgat ggagatgctt gaatcacctt ctgattcata a 711
<210> 53 <211> 1054 <212> ADN <213> Choristoneura fumiferana <400> 53 cctgagtgcg tagtacccga gactcagtgc gccatgaagc ggaaagagaa gaaagcacag 60 aaggagaagg acaaactgcc tgtcagcacg acgacggtgg acgaccacat gccgcccatt 120 atgcagtgtg aacctccacc tcctgaagca gcaaggattc acgaagtggt cccaaggttt 180 ctctccgaca agctgttgga gacaaaccgg cagaaaaaca tcccccagtt gacagccaac 240 cagcagttcc ttatcgccag gcfccatcfcgg taccaggacg ggtacgagca gccttctgat 300 gaagatttga agaggattac gcagacgtgg cagcaagcgg acgatgaaaa cgaagagtct 360 gacactccct tccgccagat cacagagatg actatcctca cggtccaact tatcgtggag 420 ttcgcgaagg gattgccagg gttcgccaag atctcgcagc ctgatcaaat tacgctgctt 480 aaggcttgct caagtgaggt aatgatgctc cgagtcgcgc gacgatacga tgcggcctca 540 gacagtgttc tgttcgcgaa caaccaagcg tacactcgcg acaactacog caaggctggc 600 660 atggcctacg tcatcgagga tctactgcac ttctgccggt gcatgtacte tatggcgttg 161 gacaacatcc attacgcgct gctcacggct gtcgtcatct tttctgaccg gccagggttg 720 gagcagccgc aactggtgga agaaatccag cggtactacc tgaatacgct ccgcatctat 780 atcctgaacc agctgagcgg gtcggcgcgt tcgtccgtca tatacggcaa gatcctctca 840 atcctctctg agctacgcac gctcggcatg caaaactcca acatgtgcat ctccctcaag 900 ctcaagaaca gaaagctgcc gcctttcctc gaggagatct gggatgtggc ggacatgtcg 960 cacacccaac cgccgcctat cctcgagtcc cccacgaatc tctagcccct gcgcgcacgc 1020 atcgccgatg ccgcgtccgg ccgcgctgct ctga 1054
<210> 54 <211> 1542 <212> ADN <213> Choristoneura fumiferana <400> 54 162
Gtggáccfcga aacacgaagfc ggcfcfcaccga ggggtgetcc caggccaggt gaaggccgaa 60 ccgggggtcc acaacggcca ggtcaacggc cacgfcgaggg acfcggatggc aggcggcgct 120 cgccgtctcc gggagcggfcg gctcaacccc agcctaacaa tgggtatfccg 180 Êegceaefcçfc ccfcegggaag cfcacgggccc fcacagtccaa atgggaaaat aggccgtgag 240 gaacfcgtcgc çagcttcaag tataaatggg tgcagtacag atggcgaggc acgacgt.cag 300 aagaagggcc ctgcgccccg tcagcaagag gaactgtgtc tggtatgcgg ggacagagcc 360 tecggatacc acfeacaatgc gctcacgtgt gaagggtgta aagggttctt cagacggagt 420 gttaccaaaa atgcggttta tatttgtaaa ttcggtcacg cttgcgaaat ggacatgfcac 480 atgcgacgga aatgescagga gtgccgcctg aagaagtgct tagctgtagg catgaggcct 540 gagtgcgtag tacccgagac tcagtgcgcc atgaagcgga aagagaagaa agcacagaag 600 gagaagpaqa aacfcgcctgt cagcacgacg aeggtggacg accacatgcc geccattatg 660 cagfcgfcgaac ctccaccfcce tgaagcagca aggattcacg aagtggfcccc aaggttfccfcc 720 fccegacaagc tgttggagac aaaGcggcag aaaaacatcc cccagttgac agccaaccag 780 cagttcctta fccgccagget cafcctggtac caggacgggt acgagcagcc tCctgatgaa S40 gãtítfegaasa ggattacgca gacgtggoag caagcggacg atgaaaacga agagtetgac 000 actcccttcc gocagatcac agagatgact atcctcacgg tccaacttat cgtggagttc 560 gcgaagggat tgccagggtt cgccaagafcc tcgcagcctg atcaaafctac gctgcttaag 1020 gcfcegctOÃa gtgaggtaafc gatgctccga gtcgegcgac gatacgafcgc ggcctcagac 1080 agtgtfecfegt: tcgcgaacaa ccaagcgtac actcgcgaca actaccgcaa ggctggcatg 1140 gcctaegfeca tegaggatct actgcacttc tgccggfcgca tgtactctat ggcgttggac 1200 aacatccatt acgcgctgct cacggctgtc gtcatctttt ctgaccggce agggttggag 1260 cagccgcaac tggtggaaga aatccagegg tacfcacctga atacgctccg catctatatc 1320 ctgaaccagc tgagcgggtc ggcgcgttcg tccgtcatat acggcaagat cctctcaatc 1380 ctctcfcgagc fcacgcacgcfc cggcatgcaa aactccaaca tgtgcatctc cctcaagctc 1440 aagaacagaa agetgccgee tttcctcgag gagatctggg atgtggcgga catgtcgcac 1SQ0 .accOaaeegc cgcctatcct cgagtccccç acgaatctet ag .1342 <210> 55 <211> 1110 163
<212> ADN <213> Choristoneura fumiferana <400> 55 gcggtttata tttgtaaatt cggtcacgct tgcgaaatgg acatgtacat gcgacggaaa 60 tgccaggagt gccgcctgaa gaagtgctta gctgtaggea tgaggcctga gtgcgtagta X20 cccgagactc agtgcgccat gaagcggaaa gagaagaaag cacagaagga gaaggacaaa 180 ctgcctgtca gcacgacgac ggtggacgac cacatgccgc ccattatgca gtgtgaacct 240 ccacctcctg aagcagcaag gattcacgaa gtggtcccaa ggtttctctc cgacaagctg 300 ttggagacaa accggcagaa aaacatcccc cagttgacag cc&accagca gttccttatc 360 gccaggctca tctggtacca ggacgggtac gagcagcctt ctgatgaaga tttgaagagg 420 attacgcaga cgtggcagca agcggacgat gaaaacgaag agtctgacac tcccttccgc 480 cagatcacag agatgactat cctcacggtc eaacttatcg tggagttcgc gaagggattg 540 ccaaaothra --—eaa-·"» Qçaagjtctc gsâgcctgit caaattacgc tgcttaaggc ttgctcaagt 600 gaggtaatga tgctccgagt cgcgcgacga tacgatgcgg cctcagacag tgttctgtte 660 gcgaacaacc aagcgtacac tcgcgacaac taccgcaagg ctggcatggc etacgtcatc 720 gaggatctac tgcacttctg ccggtgcatg tactctatgg cgttggacaa catecattac 780 gcgctgctca cggctgtcgt catcttttct gaccggccag ggttggagca gccgcaactg 840 gtggaagaaa tccagcggta ctacctgaat acgctccgca tctatatcct gaaccagctg 900 agcgggtcgg cgcgttcgtc cgtcatatac ggcaagatcc tctcaatcct ctctgagcta 960 cgcacgctcg gcatgcaaaa ctccaacatg tgcatctccc tcaagctcaa gaacagaaag 1020 ctgccgcctt tcctcgagga gatctgggat gtggcggaca tgtcgcacac ccaaccgccg 10Θ0 cctatcctcg agtcccccac gaatctctag 1110
<210> 56 <211> 798 <212> ADN <213> Choristoneura fumiferana <400> 56 164 tcggtgcagg taagcgatga gctgtcaatc gagcgcctaa cggagatgga gtctttggtg 60 gcagatccca gcgaggagtt ccagttcctc cgcgtggggc ctgacagcaa cgtgcctcca 120 cgttaccgcg cgcccgtctc ctccctctgc caaataggca acaagcaaat agcggcgttg 180 gtggtatggg cgcgegacat ecetcâtttc gggcagctgg agctggacga tcaagtggta 240 ctcatcaagg cctcctggaa tgagctgcta ctcttcgcca tcgcctggcg ctctatggag 300 tattfcggaag atgagaggga gaacggggac ggaacgcgga gcaccactca gccacaactg 360 atgtgtctca tgcctggcat gacgttgcac cgcaactcgg cgcagcaggc gggcgtgggc 420 gccatcttcg accgcgtgct gtccgagctc agtctgaaga tgcgcacett gcgcatggac 480 caggccgagt acgtcgcgct caaagccafcc gfcgcfcgcfcca accctgatgt gaaaggactg 540 aagaatcggc aagaagttga cgttttgcga gaaaaaatgt tctcttgçct ggacgactac 600 tgccggcggt cgcgaagcaa cgaggaaggc cggtttgcgt ccttgctgct gcggctgcca 660 gctctccgct ccatctcgct caagagcttc gaacacctct acttcttcca cctcgtggcc 720 gaaggctcca tcagcggata catacgagag gcgctccgaa accacgcgcc tccgatcgac 780 gfccaatgcca tgatgtaa 798
<210> 57 <211> 1586 <212> ADN <213> Bamecia argentifoli <400> 57 165 gaattcgcgg acttccgt&c ctctcacccc cfccgccagga ccccccgcca 60 wvci*y & wçíeo jHjaaiiw f+m ¥***¥· V# *3 m *# W »· wVt» f· mm « * ^/iwa 4* i» w y ·* actcatcccc catgtcttcg ggeagctacg 12 0 acccttatag tcccaceaat ggaagaatag ggaaagaaga gctttcgecg gcgaatagte ISO tgaacgggta caacgtggat agctgcgafcg egtogcggaa gaagaaggga ggaacgggtc 240 ggcagcagga ggagctgtgt c t ¢- g t c tgog ctccggctac cactacaacg 300 VWWfaWCtbV) WV cgaaggctgc aagggcttct tecgtcggag catcaccaag aatgccgtet 360 accagtgtaa atatggaaat aattgtgaaa ttgacatgta catgaggcga aaatgccaag 420 agtgtegtct caagaagfcgt ctcagcgttg gcatgaggcc agaatgtgta gttcccgaat 480 tccagtgtgc tgtgaagcga aaagagaaaa aagcgcaaaa ggacaaagat aaacctaact 540 caacgacgag ttgttctcca gatggaatca aacaagagat agatcctcaa aggctggata 600 cagattcgca gctattgtct gfcaaafcggag ttaaacacat tactccagag caagaagagc 660 tcatccatag gctagtttat tttcaaaatg aatatgaaca tccatcccca gaggatatea 720 aaaggatagt taatgctgca ccagaagaag aaaatgtagc tgaagaaagg tttaggcata 780 ttacagaaat tacaattctc actgtacagt taattgtgga attttctaag cgattacctg 840 gttttgacaa actaattcgt gaagatcaaa tagctttatt aaaggcatgt agtagtgaag 900 taatgatgtt tagaatggca aggaggtatg atgctgaaac agattcgata ttgtttgcaa 960 ctaaccagcc gtatacgaga gaatcataca ctgtagctgg catgggtgat actgtggagg 1020 atctgctccg attttgtcga catatgtgtg ccatgaaagt cgataacgca gaatatgctc 1080 ttctcactgc cattgtaatt ttttcagaac gaccatctct aagtgaaggc tggaaggttg 1140 agãagãtcca ãgãaatttac átagaagcat caããágcãtã tgbtgaaaat cgããggãaac 1200 catatgcaac aaccattttt gctaagttac tatctgtttt aactgaacta cgaacattag 1260 ggaatatgaa ttcagaaaca tgcttctcat tgaagctgaa gaatagaaag gtgccatcct 1320 tcctcgagga gatttgggat gttgtttcat aaacagtctt acctcaattc catgttactt 1380 ttcatatttg atttatctca gcaggtgget cagtacttat cctcacatta ctgagctcac 1440 ggtatgctca tacaattata acttgtaata tcatatcggt gatgacaaat ttgttacaat 1500 attctttgtt accttaacac aatgttgatc tcataatgat gtatgaattt ttctgttttt 1560 1586 gcaaaaaaaa aagcggccgc gaattc
<210> 58 <211> 1109 <212> ADN 166 <213> Nephotetix cincticeps <400> 58 caggaggagc tctgcctgtt gtgcggagac cgagcgtcgg gataccacta caacgctctc 60 acctgcgaag gatgcaaggg cttctttcgg aggagtatca ccaaaaacgc agtgtaccag 120 tccaaatacg gcaccaattg tgaaatagac atgtatatgc ggcgcaagtg ccaggagtgc 180 cgactcaaga agtgcctcag tgtagggatg aggccagaat gtgtagtacc tgagtatcaa 240 tgtgccgtaa aaaggaaaga gaaaaaagct caaaaggaca aagataaacc tgtctcttca 300 accaatggct cgcctgaaat gagaatagac caggacaacc gttgtgtggt gttgcagagt 360 gaagacaaca ggtacaactc gagtacgccc agtttcggag tcaaacccct cagtccagaa 420 caagaggagc tcatccacag gctcgtctac ttccagaacg agtacgaaca ccctgccgag 480 gaggatctca agcggatcga gaacctcccc tgtgacgacg atgacccgtg tgatgttcgc 540 tacaaacaca ttacggagat cacaatactc acagtccagc tcatcgtgga gtttgcgaaa 600 aaactgcctg gtttcgacaa actactgaga gaggaccaga tcgtgttgct caaggcgtgt 660 tcgagcgagg tgatgafcgct gcggatggcg cggaggtacg acgtccagac agactcgatc 720 ctgttcgcca acaaccagcc gtacacgcga gagtcgtaca cgatggcagg cgtgggggaa 780 gtcatcgaag atctgctgcg gttcggccga ctcatgtgct ccatgaaggt ggacaatgcc 840 gagtatgctc tgctcacggc catcgtcatc ttctccgagc ggccgaacct ggcggaagga 900 tggaaggttg agaagatcca ggagatctac ctggaggcgc tcaagtccta cgtggacaac 960 cgagtgaaac ctcgcagtcc gaccatcttc gccaaactgc tctccgttct caccgagctg 1020 cgaacactcg gcaaccagaa ctccgagatg tgcttctcgt taaactacgc aaccgcaaac 1080 atgccaccgt tcctcgaaga aatctggga 1109
<210> 59 <211> 401 <212> PRT <213> Choristoneura fumiferana <400> 59 167
Cys Leu Vai Cys Gly Asp Arg Ala Ser Gly Tyr His Tyr Asn Ala Leu 1 5 10 15 Thr Cys Glu Gly Cys Lys Gly Phe Phe Arg Arg Ser Val Thr Lys Asn 20 25 30 Ala Vai Tyr Ile Cys Lys Phe Gly His Ala Cys Glu Met Asp Met Tyr 35 40 45 Met Arg Arg Lys Cys Gin Glu Cys Arg Leu Lys Lys Cys Leu Ala Val 50 55 eo Gly Met Arg Pro Glu Cys Val Val Pro Glu Thr Gin Cys Ala Met Lys €5 70 75 BO Arg Lys Glu Lys Lys Ala Gin Lys Glu Lys Asp Lys Leu Pro val Ser 85 90 95 Thr Thr Thr Val Asp Asp Hl s Met Pro Pro Ile Met Gin Cys Glu Pro 100 105 110 Pro Pro Pro Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu 115 120 125 Ser Asp Lys Leu Leu Glu Thr Asn Arg Gin Lys Asn Ile Pro Gin Leu 130 135 140 Thr Ala Asn Gin Gin Phe Leu Ile Ala Arg Leu ile Trp Tyr Gin Asp 145 150 155 160 168
Gly Tyr Glu Gin Pro Ser Asp Glu Asp Leu Lyg Arg lie Thr Gin Thr 165 170 175
Trp Gin Gin Ala Asp Asp Glu Asn Glu Glu Ser- Asp Thr Pro Phe Arg 180 185 190
Gin lie Thr Glu Met Thr Ile Leu Thr Vai Gin Leu Xle Vai Glu Phe 195 200 205
Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gin Pro Asp Gin Ile 210 215 220
Thr Leu Leu Lys Ala Cys Ser Ser Glu Vai Met Met Leu Arg Vai Ala 225 230 235 240
Arg Arg Tyr Asp Ala Ala Ser Asp Ser Vai Leu Phe Ala Asn Asn Gin 245 250 255
Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Vai Ile 260 265 270
Glu Asp Leu Leu Hls Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp 275 280 285
Asn Ile Hls Tyr Ala Leu Leu Thr Ala Vai Vai Ile Phe Ser Asp Arg 290 295 300
Pro Gly Leu Glu Gin Pro Gin Leu Vai Glu Glu Ile Gin Arg Tyr Tyr 305 310 315 320
Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gin Leu Ser Gly Ser Ala 325 330 335
Arg Ser Ser Vai Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu 340 345 350
Arg Thr Leu Gly Met Gin Asn Ser Asn Met Cys Ile Ser Leu Lys Leu 355 360 365
Lys Asn Arg Lys Leu Pro pro Phe Leu Glu Glu Ile Trp Asp Vai Ala 370 375 380
Aep Met ser His Thr Gin Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn 385 390 395 400. 169
Leu
<210> 60 <211> 825 <212> ADN <213> Drosophila melanogaster <400> 60 gtgtccaggg atttctcgat cgagcgcatc atagaggccg agcagcgagc ggagacccaa €0 tgcggcgatc gtgcactgac gtteetgegc gttggtccct attccacagt ceagceggac 120 tacaagggtg cegtgtcggc cctgtgccaa gtggtcaaca aacagctctt ccagatggtc . 180 gaatacgcgc gcatgatgcc gcactttgcc caggtgccgc tggacgacca ggtgattctg 240 ctgaaagccg cttggatcga gctgctcatt gcgaacgtgg cctggtgcag catcgtttcg 300 ctggatgacg gcggtgccgg cggcgggggc ggtggactag gccacgatgg ctcctttgag 360 cgacgatcac cgggccttca gccccagcag ctgttcctca accagagctt ctcgtaccat 420 cgcaacagtg cgabcaaagc cggtgtgtca gccatcttcg accgcatatt gtcggagctg 4ΘΘ agtgtaaaga tgaagcggct gaatctcgac cgacgcgagc tgtcctgctt gaaggccatc 540 atactgtaca acccggacat acgcgggatc aagagccggg cggagatcga gatgtgccgc 600 gagaaggtgt acgcttgcct ggacgagcac tgccgcctgg aacatccggg cgacgatgga 660 cgotttgcgc aactgctgct gcgtctgccc gctttgcgat cgatcagcct gaagtgccag 720 gatcacctgt tcctcttccg cattaccagc gaccggccgc tggaggagct ctttctcgag 780 825 cagctggagg cgccgccgcc acccggcctg gcgatgaaac tggag. 170
DOCUMENTOS REFERIDOS NA DESCRIÇÃO
Esta lista de documentos referidos pelo autor da presente solicitação de patente foi elaborada apenas para informação do leitor. Não é parte integrante do documento de patente europeia. Não obstante o cuidado na sua elaboração, o IEP não assume qualquer responsabilidade por eventuais erros ou omissões.
Documentos de patente referidos na descrição
EP 9600686 us 5530028 us 9705330 wo 9738117 us 9908381 wo 9958155 us 9814215 wo 9902683 us 5880333 us 9814215 us 0109050 us 9705330 CA 2012311 wo 9518863 wo 9617823 us 5459127 A wo 9521931 A wo 9625508 A us 5693622 A us 5589466 A us 5580859 A us 0109050 A PCT [0010] A [0010] [0195] W [0011] [0013] A [0011] PCT [0011] A [0011] [0121] [0225] [0125] [0126] [0226] W [0011] [0015] A [0011] A [0012] [0014] PCT [0013] W [0015] [0016] B [0015] [0073] A [0074] A [0074] [0074] [0075] [0075] [0076] [0076] [0076] [0121] 171 • US 9705330 PCT [0121] • US 5283173 A [0121] • US 4981784 A [0123] • US 6013836 A [0195] • US 5117057 A [0195] • US 5378726 A [0195] • EP 461809 A [0195] • US 5225443 A [0195] • EP 234994 A [0195] • US 4985461 A [0195] • US 60294814 B [0251]
Literatura não relacionada com patentes referida na descrição • WUM et al. Proc. Natl. Acad. Sei. USA, 1986, vol. 83, 5414-5418 [0006] • ARNHEITER et al. Cell, 1990, vol. 62, 51-61 [0006] • FILMUS et al. Nucleic Acids Research, 1992, vol. 20, 27550-27560 [0006] • SPENCER et al. Science, 1993, vol. 262, 1019-24 [0008] • BELSHAW et al. Proc Natl Acad Sei USA, 1996, vol. 93, 4604-7 [0008] • DHADIALLA et al. Annu. Rev. Entomol., 1998, vol. 43, 545-569 [0010] • KOELLE et al. Cell, 1991, vol. 67, 59-77 [0010] • SAMBROOK, J.; FRITSCH, E. F.; MANIATIS, T.Molecular
Cloning: A Laboratory Manual. Cold Spring Harbor
Laboratory Press, 1989 [0048] [0220] • WU et al. J. Biol. Chem., 1992, vol. 267, 963-967 [0073] • WU; WU. J. Biol. Chem., 1988, vol. 263, 14621-14624 [0073] 172 • FELGNER et al. PNAS, 1987, vol. 84, 7413 [0074] • MACKEY et al. Proc. Natl. Acad. Sei. U.S.A, 1988, vol. 85, 8027-8031 [0074] • ULMER et al. Science, 1993, vol. 259, 1745-1748 [0074] • FELGNER; RINGOLD. Science, 1989, vol. 337, 387-388 [0074] • CURIEL et al. Hum. Gene Ther., 1992, vol. 3, 147-154 [0076] • WU; WU. J. Biol. Chem, 1987, vol. 262, 4429-4432 [0076] • CHERBAS L. Genes Dev., 1991, vol. 5, 120-131 [0087] • D'AVINO PP. Mol. Cell. Endocrinol, 1995, vol. 113, 1-9 [0087] • ANTONIEWSKI C. Mol. Cell Biol., 1994, vol. 14, 4465-4474 [0087] • REECK et al. Cell, 1987, vol. 50, 667 [0110] [0111] • ALTSCHUL, S. F. et al. Basic Local Alignment Search Tool. J. Mol. Biol., 1993, vol. 215, 403-410 [0117] Computational Molecular Biology. Oxford University Press, 1988 [0118]
Biocomputing: Informatics and Genome Projects. Academic Press, 1993 [0118]
Computer Analysis of Sequence Data, Part I. Humana Press, 1994 [0118]
Sequence Analysis in Molecular Biology. Academic Press, 1987 [0118] Sequence Analysis Primer. Stockton Press, 1991 [0118] • HIGGINS; SHARP. CABIOS, 1989, vol. 5, 151-153[0118] • ALTSCHUL et al. J. Mol. Biol., 1990, vol. 215, 403-410 [0119] 173 • YAO et al. Nature, 1993, vol. 366, 476-479 [0122] • YAO et al. Cell, 1992, vol. 71, 63-72 [0122] • GLASS et al. Curr. Opin. Cell Biol., 1997, vol. 9, 222-232 [0122] • HORWITZ et al. Mol Endocrlnol., 1996, vol. 10, 1167-1177 [0122] • EVANS. Science, 1988, vol. 240, 889-895 [0123] • SADOWSKI et al. Nature, 1988, vol. 335, 563-564 [0132] • BRENT; PTASHNE. Cell, 1985, vol. 43, 729-736 [0132] • KIM et al. Proc. Natl. Acad Sei., USA, 1997, vol. 94, 3616-3620 [0132] • T. J. SILHAVY; M. L. BENNAN; L. W. ENQUIST.
Experiments with Gene Fusions. Cold Spring Harbor
Laboratory, 1984 [0220] • AUSUBEL, F. M. et al. Current Protocols in Molecular
Biology. Greene Publishing Assoe, and Wi-ley-Interscience, 1987 [0220] • Manual of Methods for General Bacteriology. American
Society for Microbiology, 1994 [0221] • THOMAS D. BROCK. Biotechnology: A Textbook of Industrial Microbiology. Sinauer Associates, Inc, 1989 [0221] • GYURIS et al. Cell, 1993, vol. 75, 791-803 [0245]

Claims (54)

1 REIVINDICAÇÕES 1. Um sistema de modulação da expressão de genes que compreende: a) uma primeira cassete de expressão de genes que pode ser expressa numa célula hospedeira compreendendo um polinucleótido que codifica um primeiro polipéptido híbrido compreendendo: i) um domínio de ligação ao ADN que reconhece um elemento de resposta associado a um gene cuja expressão deve ser modulada; e ii) um domínio de ligação ao ligando do recetor de ecdisona; e b) uma segunda cassete de expressão de genes que pode ser expressa na célula hospedeira compreendendo um polinucleótido que codifica um segundo polipéptido híbrido compreendendo: i) um domínio de transativação; e ii) um domínio de ligação ao ligando do recetor X retinoide invertebrado não-díptero, não-lepidóptero.
2. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 1, que compreende ainda uma terceira cassete de expressão de genes compreendendo: i) um elemento de resposta reconhecido pelo domínio de ligação ao ADN do primeiro polipéptido híbrido; ii) um promotor que é ativado pelo domínio de transativação do segundo polipéptido híbrido; e iii) um gene cuja expressão deve ser modulada.
3. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 1, em que o domínio de ligação ao ligando (LDB) do recetor de ecdisona do primeiro polipéptido híbrido é selecionado a partir do grupo que consiste num LDB do EcR do insecto Choristoneura fumiferana 2 ("CfEcR"), LDB do EcR de escaravelho Tenebrio molitor ("TmEcR") , LDB do EcR de Manduca sexta ("MsEcR") , LDB do EcR de Heliothies virescens ("HvEcR"), LDB do EcR de mosquito Chironomus tentans ("CtEcR"), LDB do EcR de bicho-da-seda Bombyx mori ("BmEcR"), LDB do EcR de mosca da fruta Drosophila melanogaster ("DmEcR"), LDB do EcR de mosquito Aedes aegypti ("AaBeR"), LDB do EcR de varejeira Lucilia capitata ("LcEcR"), LDB do EcR de varejeira Lucilia cuprina ("LucEcR"), LDB do EcR de mosca do Mediterrâneo Ceratisis capitata ("CcEcR"), LDB do EcR de gafanhoto Locusta migratória ("LmEcR"), LDB do EcR de afideo Myzus persicae ("MpEcR"), LDB do EcR de caranguejo-violinista Celuca pugilator ("CpEcR"), LDB do EcR de carraça Ixodidae Amblyomma americanum ("AmaEcR"), LDB do EcR de mosca branca Bamecia argentifoli ("BaEcR") e LDB do EcR de cigarrinha-verde Nephotetix cincticeps ("NcEcR").
4. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 1, em que o domínio de ligação ao ligando do recetor de ecdisona do primeiro polipéptido híbrido é codificado por uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste em SEQ. ID N.° 1, SEQ. ID N.° 53 e SEQ. ID N.° 45.
5. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 1, em que o domínio de ligação ao ligando do recetor de ecdisona do primeiro polipéptido híbrido compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 5, SEQ. ID N. ° 43 e SEQ. ID N.° 59.
6. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 1, em que o domínio de ligação ao ligando do recetor X retinoide invertebrado do segundo polipéptido híbrido é codificado por uma sequência de 3 ácidos nucleicos selecionada a partir do grupo que consiste em SEQ. ID N.° 9, SEQ. ID N.° 10, SEQ. ID N.° 11, SEQ. ID N.° 12, SEQ. ID N.° 13, SEQ. ID N.° 14, SEQ. ID N.° 15, SEQ. ID N.° 16, SEQ. ID N.° 17, SEQ. ID N.° 18, SEQ. ID N.° 19 e SEQ. ID N.° 20.
7. O sistema de modulação da expressão de genes de acordo com a reivindicação 1, em que os domínios de ligação ao ligando do recetor X retinoide invertebrado do segundo polipéptido híbrido compreendem uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 21, SEQ. ID N.° 22, SEQ. ID N.° 23, SEQ. ID N.° 24, SEQ. ID N.° 25, SEQ. ID N.° 26, SEQ. ID N.° 27, SEQ. ID N.° 28, SEQ. ID N.° 29, SEQ. ID N.° 30, SEQ. ID N.° 31 e SEQ. ID N. 0 32.
8. O sistema de modulação da expressão de genes de acordo com a reivindicação 1, em que a primeira cassete de expressão de genes compreende um polinucleótido que codifica um primeiro polipéptido híbrido compreendendo um domínio de ligação ao ADN selecionado a partir do grupo que consiste num domínio de ligação ao ADN GAL4 e num domínio de ligação ao ADN LexA, e um domínio de ligação ao ligando do recetor de ecdisona.
9. O sistema de modulação da expressão de genes de acordo com a reivindicação 1, em que a segunda cassete de expressão de genes compreende um polinucleótido que codifica um segundo polipéptido híbrido compreendendo um domínio de transativação selecionado a partir do grupo que consiste num domínio de transativação VP16 e num domínio de transativação de ativador ácido B42, e um domínio de ligação ao ligando do recetor X retinoide invertebrado.
10. O sistema de modulaçao da expressão de genes de acordo 4 com a reivindicação 1, em que a segunda cassete de expressão de genes compreende um polinucleótido que codifica um segundo polipéptido hibrido compreendendo um dominio de transativação codificado por um polinucleótido compreendendo uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste num AD VP16 (SEQ. ID N.° 37) e num AD B42 (SEQ. ID N.° 39), e um dominio de ligação ao ligando do recetor X retinoide invertebrado codificado por um polinucleótido compreendendo uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste em SEQ. ID N.0 9, SEQ. ID N .° 10, SEQ. ID N. 0 11, SEQ. ID N 0 12, SEQ. ID N.0 13, SEQ. \—1 O s Ω 1—1 SEQ. ID N.0 15, SEQ. ID N.° 16, SEQ. ID N.° 17, SEQ. ID N. oo \—1 o SEQ. ID N.0 19 e SEQ. ID N.0 20.
11. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 1, em que a segunda cassete de expressão de genes compreende um polinucleótido que codifica um segundo polipéptido hibrido compreendendo um domínio de transativação compreendendo uma sequência de aminoácidos selecionada a partir do grupo que consiste num AD VP16 (SEQ. ID N.° 38) e num AD B42 (SEQ. ID N.° 40), e um domínio de ligação ao ligando do recetor X retinoide invertebrado compreendendo uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 21, SEQ. ID N.° 22, SEQ. ID N.° 23, SEQ. ID N.° 24, SEQ. ID N.° 25, SEQ. ID N.° 26, SEQ. ID N.° 27, SEQ. ID N.° 28, SEQ. ID N.° 29, SEQ. ID N.° 30, SEQ. ID N.° 31 e SEQ. ID N.° 32.
12. Um sistema de modulação da expressão de genes, que compreende: a) uma primeira cassete de expressão de genes que pode ser expressa numa célula hospedeira compreendendo um polinucleótido que codifica um primeiro polipéptido híbrido 5 compreendendo : i) um domínio de ligação ao ADN que reconhece um elemento de resposta associado a um gene cuja expressão deve ser modulada; e ii) um domínio de ligação ao ligando do recetor X retinoide invertebrado não-díptero, não-lepidóptero; e b) uma segunda cassete de expressão de genes que pode ser expressa na célula hospedeira compreendendo um polinucleótido que codifica um segundo polipéptido híbrido compreendendo: i) um domínio de transativação; e ii) um domínio de ligação ao ligando do recetor de ecdisona.
13. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 12, que compreende ainda uma terceira cassete de expressão de genes compreendendo: i) um elemento de resposta reconhecido pelo domínio de ligação ao ADN do primeiro polipéptido híbrido; ii) um promotor que é ativado pelo domínio de transativação do segundo polipéptido híbrido; e iii) um gene cuja expressão deve ser modulada.
14. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 12, em que o domínio de ligação ao ligando do recetor X retinoide invertebrado do primeiro polipéptido híbrido é codificado por um polinucleótido compreendendo uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste em SEQ. ID N.° 9, SEQ. ID O i—1 O a SEQ . ID N.° 11, SEQ. ID N.° 12, SEQ. ID N. 0 13, SEQ. ID N.0 14, SEQ. ID N.0
15, SEQ. ID N.0 16, SEQ . ID N.0 17, SEQ. ID N. 0 18, SEQ. ID N.0 19 e SEQ. ID N.0 20 φ 15. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 12, em que o domínio de ligação ao 6 ligando do recetor X retinoide invertebrado do primeiro polipéptido hibrido compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 21, SEQ. ID N.° 22, SEQ. ID N.° 23, SEQ. ID N.° 24, SEQ. ID N.° 25, SEQ. ID N.° 26, SEQ. ID N.° 27, SEQ. ID N.° 28, SEQ. ID N.° 29, SEQ. ID N.° 30, SEQ. ID N.° 31 e SEQ. ID N.0 32 .
16. O sistema de modulação da expressão de genes de acordo com a reivindicação 12, em que o dominio de ligação ao ligando do recetor de ecdisona do segundo polipéptido hibrido é selecionado a partir do grupo que consiste num LDB do EcR do insecto Choristoneura fumiferana ("CfEcR"), LDB do EcR de escaravelho Tenebrio molitor ("TmEcR"), LDB do EcR de Manduca sexta EcR ("MsEcR") , LDB do EcR de Heliothies virescens ("HvEcR"), LDB do EcR do mosquito Chironomus tentans ("CtEcR"), LDB do EcR de bicho-da-seda Bombyx mori ("BmEcR"), LDB do EcR de mosca da fruta Drosophila melanogaster ("DmEcR"), LDB do EcR de mosquito Aedes aegypti ("AaEcR"), LDB do EcR de varejeira Lucilia capitata EcR ("LcEcR"), LDB do EcR de varejeira Lucilia cuprina EcR ("LucEcR"), LDB do EcR de mosca do Mediterrâneo Ceratisis capitala EcR ("CcEcR"), LDB do EcR de gafanhoto Locusta migratória EcR ("LmEcR"), LDB do EcR do afideo Myzus persicae ("MpEcR"), LDB do EcR de caranguejo-violinista Celuca pugilator ("CpEcR"), LDB do EcR de carraça Ixodeae Amblyomma americanum ("AmaEcR"), LDB do EcR de mosca branca Bamecia argentifoli ("BaEcR") e LDB do EcR de cigarrinha-verde Nephotetix cincticeps ("NcEcR").
17. O sistema de modulação da expressão de genes de acordo com a reivindicação 12, em que o dominio de ligação ao ligando do recetor de ecdisona do segundo polipéptido hibrido é codificado por um polinucleótido compreendendo uma sequência de ácidos nucleicos selecionada a partir do 7 grupo que consiste em SEQ. ID N.° 1, SEQ. ID N.° 53 e SEQ. ID N.0 45 .
18. O sistema de modulação da expressão de genes de acordo com a reivindicação 12, em que o domínio de ligação ao ligando do recetor de ecdisona do segundo polipéptido híbrido compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 5, SEQ. ID N. 0 43 e SEQ. ID N. 0 59 .
19. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 12, em que a primeira cassete de expressão de genes compreende um polinucleótido que codifica um primeiro polipéptido híbrido compreendendo um domínio de ligação ao ADN selecionado a partir do grupo que consiste num domínio de ligação ao ADN GAL4 e num domínio de ligação ao ADN LexA, e um domínio de ligação ao ligando do recetor X retinoide invertebrado.
20. O sistema de modulação da expressão de genes de acordo com a reivindicação 12, em que a primeira cassete de expressão de genes compreende um polinucleótido que codifica um primeiro polipéptido híbrido compreendendo um domínio de ligação ao ADN codificado por um polinucleótido compreendendo uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste num DBD GAL4 (SEQ. ID N.° 33) ou num DBD LexA (SEQ. ID N.° 35), e um domínio de ligação ao ligando do recetor X retinoide invertebrado codificado por um polinucleótido compreendendo uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste em SEQ. ID N. 0 9, SEQ. ID N. 0 O \—1 SEQ . ID N.0 \—1 \—1 SEQ. ID N.0 12, SEQ. H U o 13, SEQ. ID N. 0 14, SEQ. ID N.0 15, SEQ. ID N.° 16, SEQ. ID N 1—1 o SEQ. ID 00 \—1 o SEQ. ID N.0 19 e SEQ. ID N. 0 20 8 21. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 12, em que a primeira cassete de expressão de genes compreende um polinucleótido que codifica um primeiro polipéptido híbrido compreendendo um domínio de ligação ao ADN compreendendo uma sequência de aminoácidos selecionada a partir do grupo que consiste num DBD GAL4 (SEQ. ID N.° 34) e num DBD LexA (SEQ. ID N.° 36), e um domínio de ligação ao ligando do recetor X retinoide invertebrado compreendendo uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.°
21. SEQ. ID N.° 22, SEQ. ID N.° 23, SEQ. ID N.° 24, SEQ. ID N.° 25, SEQ. ID N.° 26, SEQ. ID N.° 27, SEQ. ID N.° 28, SEQ. ID N.° 29, SEQ. ID N.° 30, SEQ. ID N.° 31 e SEQ. ID N. 0 32 .
22. O sistema de modulação da expressão de genes de acordo com a reivindicação 12, em que a segunda cassete de expressão de genes compreende um polinucleótido que codifica um segundo polipéptido híbrido compreendendo um domínio de transativação selecionado a partir do grupo que consiste num domínio de transativação VP16 e num domínio de transativação de ativador ácido B42, e um domínio de ligação ao ligando do recetor de ecdisona.
23. Uma cassete de expressão de genes compreendendo um polinucleótido que codifica um polipéptido híbrido compreendendo um domínio de ligação ao ADN e um domínio de ligação ao ligando do recetor X retinoide invertebrado não-díptero, não-lepidóptero, em que o domínio de ligação ao ADN é de um recetor nuclear que não um recetor X retinoide invertebrado.
24. A cassete de expressão de genes de acordo com a reivindicação 23, em que o domínio de ligação ao ADN é um domínio de ligação ao ADN GAL4 ou um domínio de ligação ao 9 ADN LexA.
25. A cassete de expressão de genes de acordo com a reivindicação 23, em que a cassete de expressão de genes compreende um polinucleótido que codifica um polipéptido híbrido compreendendo um domínio de ligação ao ADN codificado por um polinucleótido compreendendo uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste num DBD GAL4 (SEQ. ID N.° 33) e num DBD LexA (SEQ. ID N.° 35), e um domínio de ligação ao ligando do recetor X retinoide invertebrado codificado por um polinucleótido compreendendo uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste em SEQ. ID N.° 9, SEQ. ID N .° 10, SEQ. ID N. i—1 i—1 O SEQ. ID N 0 12, SEQ. ID N.° 13, SEQ. ID N.° 14, SEQ. ID N.0 15, SEQ. ID N. ° 16, SEQ. ID N.° 17, SEQ. ID N. ° 18, SEQ. σ') i—1 O S Ω H e SEQ. ID N.0 20.
26. A cassete de expressão de genes de acordo com a reivindicação 23, em que a cassete de expressão de genes compreende um polinucleótido que codifica um polipéptido híbrido compreendendo um domínio de ligação ao ADN compreendendo uma sequência de aminoácidos selecionada a partir do grupo que consiste num DBD GAL4 (SEQ. ID N.° 34) e num DBD LexA (SEQ. ID N.° 36), e um domínio de ligação ao ligando do recetor X retinoide invertebrado compreendendo uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N. 0 21, SEQ. ID N. 0 22, SEQ . ID N.0 23, SEQ. ID N.0 24, SEQ. ID N. 0 25, SEQ. ID N.° 26, SEQ. ID N. 0 27, SEQ. ID N.° 28, SEQ. ID N . 0 29 . SEQ. ID N.° 30, SEQ. ID N.0 31 e SEQ. ID N. ° 32 .
27. Uma cassete de expressão de genes compreendendo um polinucleótido que codifica um polipéptido híbrido compreendendo um domínio de transativação e um domínio de 10 ligação ao ligando do recetor X retinoide invertebrado não-díptero, não-lepidóptero, em gue o domínio de transativação é de um recetor nuclear que não um recetor X retinoide invertebrado.
28. A cassete de expressão de genes de acordo com a reivindicação 27, em que o domínio de transativação é um domínio de transativação VP16 ou um domínio de transativação de ativador ácido B42.
29. A cassete de expressão de genes de acordo com a reivindicação 27, em que a cassete de expressão de genes compreende um polinucleótido que codifica um polipéptido híbrido compreendendo um domínio de transativação codificado por um polinucleótido compreendendo uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste num AD VP16 (SEQ. ID N.° 37) e num AD B42 (SEQ. ID N.° 39), e um domínio de ligação ao ligando do recetor X retinoide invertebrado codificado por um polinucleótido compreendendo uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste em SEQ. ID N. 0 9, SEQ. ID N .° 10, SEQ . ID N 1—1 \—1 o SEQ. ID N 0 12, SEQ . ID N.0 13, SEQ. \—1 O s Ω 1—1 SEQ. ID N. 0 15, SEQ. ID \—1 o SEQ. ID N.° 17, SEQ. ID N . 0 18, SEQ. ID N.0 19 e SEQ. ID N. 0 20 .
30 . A cassete de expressão de genes de acordo com a reivindicação 29, em que a cassete de expressão de genes compreende um polinucleótido que codifica um polipéptido híbrido compreendendo um domínio de transativação compreendendo uma sequência de aminoácidos selecionada a partir do grupo que consiste num AD VP16 (SEQ. ID N.° 38) e num AD B42 (SEQ. ID N.° 40), e um domínio de ligação ao ligando do recetor X retinoide invertebrado compreendendo uma sequência de aminoácidos selecionada a partir do grupo 11 que consiste em SEQ. ID N '.° 21, SEQ. ID N.0 22, SEQ H U o 23, SEQ. ID N.0 24, SEQ. ID N. 0 25, SEQ. ID N. 0 26, SEQ. ID N. 0 27, SEQ. ID N.° 28, SEQ. ID N.° 29, SEQ. ID N.° 30, SEQ. ID N.0 31 e SEQ. ID N. 0 32 φ
31. Um polinucleótido isolado caracterizado por ser selecionado a partir do grupo que consiste num: (a) polinucleótido que codifica um domínio de ligação ao ligando do recetor X retinoide invertebrado, não-díptero, não-lepidóptero truncado compreendendo uma mutação de truncagem, em que a mutação de truncagem reduz a atividade de ligação ao ligando do domínio de ligação ao ligando do recetor X retinoide invertebrado truncado; (b) polinucleótido que codifica um domínio de ligação ao ligando do recetor X retinoide invertebrado, não-díptero, não-lepidóptero truncado compreendendo uma mutação de truncagem, em que a mutação de truncagem reduz a atividade de ligação ao esteroide do domínio de ligação ao ligando do recetor X retinoide invertebrado truncado; (c) polinucleótido que codifica um domínio de ligação ao ligando do recetor X retinoide invertebrado, não-díptero, não-lepidóptero truncado compreendendo uma mutação de truncagem, em que a mutação de truncagem reduz a atividade de ligação ao não-esteroide do domínio de ligação ao ligando do recetor X retinoide invertebrado truncado; (d) polinucleótido que codifica um domínio de ligação ao ligando do recetor X retinoide invertebrado, não-díptero, não-lepidóptero truncado compreendendo uma mutação de truncagem, em que a mutação de truncagem potência a atividade de ligação ao ligando do domínio de ligação ao ligando do recetor X retinoide invertebrado truncado; (e) polinucleótido que codifica um domínio de ligação ao ligando do recetor X retinoide invertebrado, não-díptero, não-lepidóptero truncado compreendendo uma mutação de truncagem, em que a mutação de truncagem potência a 12 atividade de ligação ao esteroide do dominio de ligação ao ligando do recetor X retinoide invertebrado truncado; (f) polinucleótido que codifica um dominio de ligação ao ligando do recetor X retinoide invertebrado, não-diptero, não-lepidóptero truncado compreendendo uma mutação de truncagem, em que a mutação de truncagem potência a atividade de ligação ao não-esteroide do dominio de ligação ao ligando do recetor X retinoide invertebrado truncado; (g) polinucleótido que codifica um dominio de ligação ao ligando do recetor X retinoide invertebrado, não-diptero, não-lepidóptero truncado compreendendo uma mutação de truncagem, em que a mutação de truncagem aumenta a sensibilidade ao ligando do dominio de ligação ao ligando do recetor X retinoide invertebrado truncado; e (h) polinucleótido que codifica um dominio de ligação ao ligando do recetor X retinoide invertebrado, não-diptero, não-lepidóptero truncado compreendendo uma mutação de truncagem, em que a mutação de truncagem aumenta a sensibilidade ao ligando de um heterodímero, em que o heterodímero compreende o referido dominio de ligação ao ligando do recetor X retinoide invertebrado truncado e um parceiro de dimerização.
32. 0 polinucleótido isolado de acordo com a reivindicação 31, em que o parceiro de dimerização é um polipéptido de recetor de ecdisona.
33. Um polinucleótido isolado que codifica um dominio de ligação ao ligando do recetor X retinoide invertebrado truncado, em que o polinucleótido compreende uma sequência de ácidos nucleicos selecionada a partir do grupo que consiste em SEQ. ID N.° 15, SEQ. ID N.° 16, SEQ. ID N.° 17, SEQ. ID N.° 18, SEQ. ID N.° 19 e SEQ. ID N.° 20.
34. Um polipéptido isolado codificado pelo polinucleótido 13 isolado de acordo com a reivindicação 33.
35. Um domínio de ligação ao ligando do recetor X retinoide invertebrado, truncado e isolado que compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em SEQ. ID N.° 27, SEQ. ID N.° 28, SEQ. ID N.° 29, SEQ. ID N.° 30, SEQ. ID N.° 31 e SEQ. ID N.° 32.
36. Um método de modulação da expressão de um gene numa célula hospedeira, que compreende as etapas de: a) introdução numa célula hospedeira do sistema de modulação da expressão de genes de acordo com a reivindicação 1; e b) introdução numa célula hospedeira de um ligando; em que o gene a ser modulado é um componente de uma cassete de expressão de genes compreendendo: i) um elemento de resposta reconhecido pelo domínio de ligação ao ADN do primeiro polipéptido híbrido; ii) um promotor que é ativado pelo domínio de transativação do segundo polipéptido híbrido; e iii) um gene cuja expressão deve ser modulada; pelo que na introdução do ligando na célula hospedeira, a expressão do gene de b)iii) é modulada.
37. O método de acordo com a reivindicação 36, em que o ligando é um composto da fórmula: 14
em que: E corresponde a um (C4-Ce) alquilo contendo um carbono terciário ou a um ciano (C3-C5) alquilo contendo um carbono terciário; R1 corresponde a H, Me, Et, i-Pr, F, formilo, CF3, CHF2, CHCI2, CH2F, CH3CI, CH2OH, CH2OMe, CH2CN, CN, C°CH, 1- propinilo, 2-propinilo, vinilo, OH, OMe, OEt, ciclopropilo, CF2CF3, CH=CHCN, alilo, azido, SCN ou SCHF2; R2 corresponde a H, Me, Et, n-Pr, i-Pr, formilo, CF3, CHF2, CHC12, CH2F, CH2C1, CH2OH, CH2OMe, CH3CN, CN, C°CH, 1- propinilo, 2-propinilo, vinilo, Ac, F, Cl, OH, OMe, OEt, 0-n-Pr, OAc, NMe2, NEt2, SMe, SEt, S0CF3, OCF2CF2H, GOEt, ciclopropilo, CF2CF3, CH=CN, alilo, azido, 0CF3, 0CHF2, 0-i-Pr, SCN, SCHF2, SOMe, NH-CN, ou está ligado a R3 e aos carbonos de fenilo aos quais R2 e R3 estão ligados para formar um etilenodioxi, um anel dihidrofurilo com o oxigénio adjacente a um carbono do fenilo, ou um anel dihidropirilo com o oxigénio adjacente a um carbono do fenilo; R3 corresponde a H, Et, ou está ligado a R2 e aos carbonos do fenilo aos quais R2 e R3 estão ligados para formar um etilenodioxi, um anel dihidrofurilo com o oxigénio adjacente a um carbono do fenilo, ou um anel dihidropirilo com o oxigénio adjacente a um carbono do fenilo; R4, R5 e R6 correspondem independentemente a H, Me, Et, F, Cl, Br, formilo, CF3, CHF2, CHC12, CH2F, CH2C1, CH20H, CN, 15 C°CH, 1-propinilo, 2-propinilo, vinilo, OMe, OEt, SMe ou SEt.
38. O método de acordo com a reivindicação 36, compreendendo ainda a introdução na célula hospedeira de um segundo ligando, em que o segundo ligando é ácido 9-cis-retinóico ou um análogo sintético de um ácido retinóico.
39. Um método de modulação da expressão de um gene numa célula hospedeira, que compreende as etapas de: a) introdução numa célula hospedeira do sistema de modulação da expressão de genes de acordo com a reivindicação 12; e b) introdução numa célula hospedeira de um ligando; em que o gene a ser modulado é um componente de uma cassete de expressão de genes compreendendo: i) um elemento de resposta reconhecido pelo dominio de ligação ao ADN do primeiro polipéptido híbrido; ii) um promotor que é ativado pelo domínio de transativação do segundo polipéptido híbrido; e iii) um gene cuja expressão deve ser modulada; pelo que na introdução do ligando na célula hospedeira, a expressão do gene de b)iii) é modulada.
40. O método de acordo com a reivindicação 39, em que o ligando é um composto da fórmula: 16
em que: E corresponde a um (C4-C6)alquil contendo um carbono terciário ou a um ciano (C3-C5) alquil contendo um carbono terciário; R1 corresponde a H, Me, Et, i-Pr, F, formilo, CF3, CHF2, CHC12, CH2F, CH2C1, CH2OH, CH2OMe, CH2CN, CN, C°CH, 1- propinilo, 2-propinilo, vinilo, OH, OMe, OEt, ciclopropilo, CF2CF3, CH=CHCN, alilo, azido, SCN ou SCHF2; R2 corresponde a H, Me, Et, n-Pr, i-Pr, formilo, CF3, CHF2, CHC12, CH2F, CH2C1, CH2OH, CH2OMe, CH2CN, CN, C°CH, 1- propinilo, 2-propinilo, vinilo, Ac, F, Cl, OH, OMe, OEt, 0-n-Pr, OAc, NMe2, NEt2, SMe, SEt, S0CF3, OCF2CF2H, COEt, ciclopropilo, CF2CF3, CH=CHCN, alilo, azido, 0CF3, 0CHF2, 0- i-Pr, SCN, SCHF2, SOMe, NH-CN, ou é ligado a R3 e aos carbonos do fenilo aos quais R2 e R3 estão ligados para formar um etilenodioxi, um anel dihidrofurilo com o oxigénio adjacente a um carbono do fenilo, ou um anel dihidropirilo com o oxigénio adjacente a um carbono do fenilo; R3 corresponde a H, Et, ou é ligado a R2 e aos carbonos do fenilo aos quais R2 e R3 estão ligados para formar um etilenodioxi, um anel dihidrofurilo com o oxigénio adjacente a um carbono do fenilo, ou um anel dihidropirilo com o oxigénio adjacente a um carbono do fenilo; R4, R5 e R6 correspondem independentemente a H, Me, Et, F, Cl, Br, formilo, CF3, CHF2, CHC12, CH2F, CH2C1, CH20H, CN, 17 C°CH, 1-propinilo, 2-propinilo, vinilo, OMe, OEt, SMe ou SEt.
41. O método de acordo com a reivindicação 39, compreendendo ainda a introdução na célula hospedeira de um segundo ligando, em que o segundo ligando é ácido 9-cis-retinóico ou um análogo sintético de um ácido retinóico.
42. Uma célula hospedeira isolada caracterizada que compreende o sistema de modulação da expressão de genes de acordo com a reivindicação 1.
43. A célula hospedeira isolada de acordo com a reivindicação 42, em que a célula hospedeira é selecionada a partir do grupo que consiste numa célula bacteriana, numa célula fúngica, numa célula de levedura, numa célula animal e numa célula de mamífero.
44. A célula hospedeira isolada de acordo com a reivindicação 43, caracterizada por a célula de mamífero ser uma célula murina ou uma célula humana.
45. Uma célula hospedeira isolada que compreende o sistema de modulação da expressão de genes de acordo com a reivindicação 12.
46. A célula hospedeira isolada de acordo com a reivindicação 45, em que a célula hospedeira é selecionada a partir do grupo que consiste numa célula bacteriana, numa célula fúngica, numa célula de levedura, numa célula animal e numa célula de mamífero.
47. A célula hospedeira isolada de acordo com a reivindicação 46, em que a célula de mamífero é uma célula murina ou célula humana. 18
48. Um organismo não-humano que compreende a célula hospedeira da reivindicação 45.
49. 0 organismo não-humano de acordo com a reivindicação 48, em que o organismo não-humano é selecionado a partir do grupo que consiste numa bactéria, num fungo, numa levedura, num animal e num mamífero.
50. O organismo não-humano de acordo com a reivindicação 49, em que o mamífero é selecionado a partir do grupo que consiste num ratinho, num rato, num coelho, num gato, num cão, num bovino, numa cabra, num porco, num cavalo, numa ovelha, num macaco e num chimpanzé.
51. Um organismo não-humano que compreende a célula hospedeira da reivindicação 45.
52. 0 organismo não-humano de acordo com a reivindicação 51, em que o organismo não-humano é selecionado a partir do grupo que consiste numa bactéria, num fungo, numa levedura, num animal e num mamífero.
53. O organismo não-humano de acordo com a reivindicação 32, em que o mamífero é selecionado a partir do grupo que consiste num ratinho, numa rato, num coelho, num gato, num cão, num bovino, numa cabra, num porco, num cavalo, numa ovelha, num macaco e num chimpanzé.
54. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 1, em que o referido sistema apresenta uma maior sensibilidade ao ligando em comparação com o sistema equivalente no qual é utilizado um domínio de ligação ao ligando do recetor X retinóico de vertebrado, díptero ou lepidóptero. 19 55. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 1, em que o referido sistema apresenta uma maior sensibilidade aos ligandos não-esteroides em comparação com o sistema equivalente no qual é utilizado um domínio de ligação ao ligando do recetor X retinóico de vertebrado, díptero ou lepidóptero. 56. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 12, em que o referido sistema apresenta uma maior sensibilidade ao ligando em comparação com o sistema equivalente no qual é utilizado um domínio de ligação ao ligando do recetor X retinóico de vertebrado, díptero ou lepidóptero. 57. 0 sistema de modulação da expressão de genes de acordo com a reivindicação 12, em que o referido sistema apresentar uma maior sensibilidade aos ligandos não-esteroides em comparação com o sistema equivalente no qual é utilizado um domínio de ligação ao ligando do recetor X retinóico de vertebrado, díptero ou lepidóptero.
PT02714955T 2001-02-20 2002-02-20 Novo sistema de expressão de genes induzido baseado no recetor de ecdisona / recetor x retinoide invertebrado PT1456346E (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US26979901P 2001-02-20 2001-02-20
US29481401P 2001-05-31 2001-05-31

Publications (1)

Publication Number Publication Date
PT1456346E true PT1456346E (pt) 2012-05-02

Family

ID=26953897

Family Applications (1)

Application Number Title Priority Date Filing Date
PT02714955T PT1456346E (pt) 2001-02-20 2002-02-20 Novo sistema de expressão de genes induzido baseado no recetor de ecdisona / recetor x retinoide invertebrado

Country Status (11)

Country Link
US (2) US9493540B2 (pt)
EP (1) EP1456346B1 (pt)
JP (3) JP4955904B2 (pt)
AT (1) ATE545705T1 (pt)
AU (2) AU2002247184B2 (pt)
CA (1) CA2441444C (pt)
DK (1) DK1456346T3 (pt)
ES (1) ES2385598T3 (pt)
MX (1) MXPA03007493A (pt)
PT (1) PT1456346E (pt)
WO (1) WO2002066613A2 (pt)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040033600A1 (en) 2001-03-21 2004-02-19 Palli Subba Reddy Ecdysone receptor-based inducible gene expression system
US8105825B2 (en) 2000-10-03 2012-01-31 Intrexon Corporation Multiple inducible gene regulation system
WO2002066615A2 (en) 2001-02-20 2002-08-29 Rheogene, Inc. Novel substitution mutant receptors and their use in a nuclear receptor-based inducible gene expression system
EP1373470B1 (en) 2001-02-20 2013-04-24 Intrexon Corporation Novel substitution mutant receptors and their use in a nuclear receptor-based inducible gene expression system
MXPA03007493A (es) * 2001-02-20 2004-10-15 Rheogene Holdings Inc Nuevo sistema de expresion genetica inducible a base de receptor de ecdisona/receptor x retinoide de invertebrado.
DK1572862T3 (da) 2001-02-20 2012-11-26 Intrexon Corp Kimære, retinoide x-receptorer og deres anvendelse i et hidtil ukendt ecdysonrecepttorbaseret inducerbart genekspressionssystem
CA2459807C (en) * 2001-09-26 2013-09-03 Jianzhong Zhang Whitefly ecdysone receptor nucleic acids, polypeptides, and uses thereof
MXPA04002810A (es) * 2001-09-26 2005-06-06 Rheogene Holdings Inc Acidos nucleicos receptores de ecdisona de saltarilla, polipeptidos, y sus usos.
US7304161B2 (en) 2003-02-10 2007-12-04 Intrexon Corporation Diaclhydrazine ligands for modulating the expression of exogenous genes in mammalian systems via an ecdysone receptor complex
US7456315B2 (en) 2003-02-28 2008-11-25 Intrexon Corporation Bioavailable diacylhydrazine ligands for modulating the expression of exogenous genes via an ecdysone receptor complex
US7935510B2 (en) * 2004-04-30 2011-05-03 Intrexon Corporation Mutant receptors and their use in a nuclear receptor-based inducible gene expression system
RU2468820C2 (ru) 2006-07-26 2012-12-10 Интрексон Корпорейшн Способы и композиции для лечения заболевания
CA2689137C (en) 2007-05-29 2017-05-02 Intrexon Corporation Chiral diacylhydrazine ligands for modulating the expression of exogenous genes via an ecdysone receptor complex
MX2010001993A (es) 2007-08-23 2010-03-11 Intrexon Corp Metodos y composiciones para diagnosticar una enfermedad.
EP2205249B1 (en) 2007-09-28 2018-11-07 Intrexon Corporation Therapeutic gene-switch constructs and bioreactors for the expression of biotherapeutic molecules, and uses thereof
RU2484132C2 (ru) 2007-10-08 2013-06-10 Интрексон Корпорейшн Модифицированные дендритные клетки и их применение в лечении злокачественных опухолей
CA2718494C (en) 2008-03-14 2016-05-17 Intrexon Corporation Steroidal ligands and their use in gene switch modulation
JP5272898B2 (ja) 2009-05-29 2013-08-28 ソニー株式会社 信号処理装置、信号処理方法、および受信システム
CN103038343A (zh) 2010-03-23 2013-04-10 英特瑞克斯顿股份有限公司 条件表达治疗蛋白的载体,包含所述载体的宿主细胞,及其应用
WO2012122025A2 (en) 2011-03-04 2012-09-13 Intrexon Corporation Vectors conditionally expressing protein
US20140031418A1 (en) 2011-04-20 2014-01-30 The Trustees Of The University Of Pennsylvania Regimens and Compositions for AAV-Mediated Passive Immunization of Airborne Pathogens
NZ712167A (en) 2013-03-15 2018-05-25 Intrexon Corp Boron-containing diacylhydrazines
WO2015012924A2 (en) 2013-04-29 2015-01-29 The Trustees Of The University Of Pennsylvania Tissue preferential codon modified expression cassettes, vectors containing same, and use thereof
ES2844174T3 (es) 2013-09-18 2021-07-21 Kymab Ltd Métodos, células y organismos
JP6567657B2 (ja) 2014-09-17 2019-08-28 イントレキソン コーポレーション ホウ素含有ジアシルヒドラジン化合物
WO2016200543A2 (en) 2015-05-13 2016-12-15 The Trustees Of The University Of Pennsylvania Aav-mediated expression of anti-inluenza antibodies and methods of use thereof
SG11201802912PA (en) 2015-10-10 2018-05-30 Intrexon Corp Improved therapeutic control of proteolytically sensitive, destabilized forms of interleukin-12
WO2017083750A1 (en) 2015-11-11 2017-05-18 Intrexon Corporation Compositions and methods for expression of multiple biologically active polypeptides from a single vector for treatment of cardiac conditions and other pathologies
AU2017279548A1 (en) 2016-06-08 2018-12-13 Precigen, Inc. Cd33 specific chimeric antigen receptors
UY37343A (es) 2016-07-25 2018-02-28 Intrexon Corp Control del fenotipo en plantas
AU2017359342B2 (en) 2016-11-09 2022-02-17 Intrexon Corporation Frataxin expression constructs
EP3568474A1 (en) 2017-01-10 2019-11-20 Intrexon Corporation Modulating expression of polypeptides via new gene switch expression systems
SG11201907611WA (en) 2017-02-28 2019-09-27 Univ Pennsylvania Influenza vaccines based on aav vectors
JOP20190200A1 (ar) 2017-02-28 2019-08-27 Univ Pennsylvania تركيبات نافعة في معالجة ضمور العضل النخاعي
RS65241B1 (sr) 2017-02-28 2024-03-29 Univ Pennsylvania Vektor adeno-asociranih virusa (aav) iz podgrupe f i njegove upotrebe
CN110997920A (zh) 2017-06-07 2020-04-10 英特拉克森公司 新型细胞标签的表达
CA3092935A1 (en) 2018-03-06 2019-09-12 Precigen, Inc. Hepatitis b vaccines and uses of the same
WO2020206056A1 (en) 2019-04-04 2020-10-08 Greenvenus Llc Peptides and methods of plant protection
AR124216A1 (es) 2020-12-01 2023-03-01 Univ Pennsylvania Composiciones nuevas con motivos selectivos específicos del tejido y composiciones que las contienen
WO2022226263A1 (en) 2021-04-23 2022-10-27 The Trustees Of The University Of Pennsylvania Novel compositions with brain-specific targeting motifs and compositions containing same
WO2023056399A1 (en) 2021-10-02 2023-04-06 The Trustees Of The University Of Pennsylvania Novel aav capsids and compositions containing same
WO2023147304A1 (en) 2022-01-25 2023-08-03 The Trustees Of The University Of Pennsylvania Aav capsids for improved heart transduction and detargeting of liver

Family Cites Families (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4631211A (en) 1985-03-25 1986-12-23 Scripps Clinic & Research Foundation Means for sequential solid phase organic synthesis and methods using the same
US5117057A (en) 1985-10-21 1992-05-26 Rohm And Haas Company Insecticidal N' substituted-N-N'-disubstituted-hydrazines
US4985461A (en) 1985-10-21 1991-01-15 Rohm And Haas Company Insecticidal N'-substituted-N,N'-diacylhydrazines
US5424333A (en) 1985-10-21 1995-06-13 Rohm And Haas Company Anthelmintic N'-substituted-N,N'-disubstitutedhydrazines
FR2593630B1 (fr) 1986-01-27 1988-03-18 Maurice Francois Ecran d'affichage a matrice active a resistance de drain et procedes de fabrication de cet ecran
US4859609A (en) 1986-04-30 1989-08-22 Genentech, Inc. Novel receptors for efficient determination of ligands and their antagonists or agonists
US5225443A (en) 1986-05-01 1993-07-06 Rohm And Haas Company Insecticidal N'-substituted-N'-substituted N,N'-diacylhydrazines
US5071773A (en) 1986-10-24 1991-12-10 The Salk Institute For Biological Studies Hormone receptor-related bioassays
US5171671A (en) 1987-12-02 1992-12-15 The Salk Institute For Biological Studies Retinoic acid receptor composition
US4981784A (en) 1987-12-02 1991-01-01 The Salk Institute For Biological Studies Retinoic acid receptor method
US5429952A (en) 1988-02-02 1995-07-04 Biocode, Inc. Marking of products to establish identity and source
US5010175A (en) 1988-05-02 1991-04-23 The Regents Of The University Of California General method for producing and selecting peptides with specific properties
DE68927438T2 (de) 1988-06-13 1997-03-20 American Biogenetic Sciences Verfahren zur herstellung monoklonaler antikörper mit hilfe eines keimfreien tieres
US4954655A (en) 1989-03-31 1990-09-04 Rohm And Haas Company Preparation of alkylhydrazines
US5283173A (en) 1990-01-24 1994-02-01 The Research Foundation Of State University Of New York System to detect protein-protein interactions
DE69132411T2 (de) 1990-02-09 2001-06-07 Salk Inst For Biolog Studies L Retinoid-rezeptor-zusammensetzungen und verfahren
ES2180529T3 (es) 1990-02-26 2003-02-16 Univ Leland Stanford Junior Identificacion y expresion de secuencias de adn de un receptor de esteroides de insectos.
US5641652A (en) 1990-03-22 1997-06-24 The Salk Institute For Biological Studies Insect retinoid-like receptor compositions and methods
CA2075192A1 (en) 1990-03-22 1991-09-23 Anthony E. Oro Insect retinoid receptor compositions and methods
US7119077B1 (en) 1990-03-22 2006-10-10 The Salk Institute For Biological Studies Multimeric forms of members of the steroid/thyroid superfamily of receptors with the ultraspiracle receptor
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
CA2043775A1 (en) 1990-06-14 1991-12-15 Dat P. Le Dibenzoylakylcyanohydrazines
US5139749A (en) 1990-06-22 1992-08-18 Tas, Inc. Fluidized calcining process
IL100643A (en) 1991-01-25 1996-10-31 Nippon Kayaku Kk History of hydrazine and pesticides containing these histories as an active ingredient
US5668175A (en) 1991-08-23 1997-09-16 The Salk Institute For Biological Studies Use of selective ligands for treatment of disease states responsive to steroid or steroid-like retinoids
WO1993003713A1 (en) 1991-08-23 1993-03-04 The Salk Institute For Biological Studies Use of selective ligands for treatment of disease states responsive to steroid or steroid-like hormones
DE69232537T2 (de) 1991-09-17 2002-10-24 Salk Inst For Biolog Studies L Rezeptoren der steroid/thyroid superfamilie von rezeptoren
CA2121800A1 (en) 1991-12-06 1993-06-10 Ronald M. Evans Multimeric forms of members of the steroid/thyroid superfamily of receptors
JPH06510206A (ja) 1992-01-24 1994-11-17 アンスティテュー・ナシオナル・ドゥ・ラ・サンテ・エ・ドゥ・ラ・ルシェルシュ・メディカル 新規ヘテロダイマー核レセプタータンパク質、それをコードする遺伝子、およびその使用
US6013836A (en) 1992-02-28 2000-01-11 Rohm And Haas Company Insecticidal N'-substituted-N,N'-disubstitutedhydrazines
US5530028A (en) 1992-11-23 1996-06-25 Rohm And Haas Company Insecticidal N'-substituted-N,N'-diacylhydrazines
DE69434998T2 (de) 1993-05-27 2008-03-13 Aventis Pharmaceuticals Inc. Topologisch getrennte, kodierende Festphasen-Bibliotheken
WO1995013373A1 (en) 1993-11-10 1995-05-18 Arch Development Corporation Ubiquitous nuclear receptor: compositions and methods
FR2714830B1 (fr) 1994-01-10 1996-03-22 Rhone Poulenc Rorer Sa Composition contenant des acides nucléiques, préparation et utilisations.
FR2715847B1 (fr) 1994-02-08 1996-04-12 Rhone Poulenc Rorer Sa Composition contenant des acides nucléiques, préparation et utilisations.
FR2727679B1 (fr) 1994-12-05 1997-01-03 Rhone Poulenc Rorer Sa Nouveaux agents de transfection et leurs applications pharmaceutiques
US6326166B1 (en) 1995-12-29 2001-12-04 Massachusetts Institute Of Technology Chimeric DNA-binding proteins
CA2210248A1 (en) 1995-01-13 1996-07-18 Ronald M. Evans Allosteric control of nuclear hormone receptors
FR2730637B1 (fr) 1995-02-17 1997-03-28 Rhone Poulenc Rorer Sa Composition pharmaceutique contenant des acides nucleiques, et ses utilisations
CA2213340C (en) 1995-03-03 2011-07-26 Novartis Ag Control of gene expression in plants by receptor mediated transactivation in the presence of a chemical ligand
JPH11506319A (ja) 1995-05-26 1999-06-08 ゼネカ・リミテッド エクジソンレセプターを含む遺伝子スイッチ
US5939442A (en) 1995-06-07 1999-08-17 The Salk Institute For Biological Studies Modulations of peroxisome proliferator activated receptor-γ, and methods for the use thereof
US6266622B1 (en) 1995-12-13 2001-07-24 Regents Of The University Of California Nuclear receptor ligands and ligand binding domains
GB9606126D0 (en) 1996-03-22 1996-05-22 British Biotech Pharm Biosensors
CA2200423C (en) 1996-03-26 2006-12-19 Sietse Mosselman Novel estrogen receptor
US6723531B2 (en) 1996-04-05 2004-04-20 The Salk Institute For Biological Studies Method for modulating expression of exogenous genes in mammalian systems, and products related thereto
IL126418A0 (en) 1996-04-05 1999-05-09 Salk Inst For Biological Studi Hormone-mediated methods for modulating expression of exogenous genes and pharmaceutical compositions for modulating the same
US6610828B1 (en) 1996-05-24 2003-08-26 Syngenta Limited Heliothis ecdysone receptor
US6025483A (en) 1996-06-05 2000-02-15 The Regents Of The University Of California Maize and cauliflower apetalai gene products and nucleic acid molecules encoding same
US5919667A (en) 1996-06-20 1999-07-06 The Salk Institute For Biological Studies Modular assembly retroviral vectors and uses thereof
US5942444A (en) 1997-01-27 1999-08-24 Biocode, Inc. Marking of products to establish identity, source and fate
WO1998035550A2 (en) 1997-02-14 1998-08-20 New Zealand Pastoral Agriculture Research Institute Limited Insect ecdysteroid receptors
US6300488B1 (en) 1997-07-10 2001-10-09 The Salk Institute For Biological Studies Modified lepidopteran receptors and hybrid multifunctional proteins for use in transcription and regulation of transgene expression
AU738494B2 (en) 1997-07-10 2001-09-20 Salk Institute For Biological Studies, The Modified lepidopteran receptors and hybrid multifunctional proteins for use in regulation of transgene expression
AU9036198A (en) 1997-08-26 1999-03-16 Ariad Gene Therapeutics, Inc. Fusion proteins comprising a dimerization, trimerization or tetramerization domain and an additional heterologous transcription activation, transcription repression, dna binding or ligand binding domain
US7101681B1 (en) 1997-11-21 2006-09-05 Amgen, Inc. Nuclear hormone receptor drug screens
US6756491B2 (en) 1998-01-09 2004-06-29 The Salk Institute For Biological Studies Steroid-activated nuclear receptors and uses therefor
AUPP135698A0 (en) 1998-01-15 1998-02-05 Commonwealth Scientific And Industrial Research Organisation Insectical modalities
US6410245B1 (en) 1998-04-01 2002-06-25 Affymax, Inc. Compositions and methods for detecting ligand-dependent nuclear receptor and coactivator interactions
EP1070257A2 (en) 1998-04-06 2001-01-24 Lerner Pharmaceuticals, Inc. Directed evolution biosensors
US6333318B1 (en) 1998-05-14 2001-12-25 The Salk Institute For Biological Studies Formulations useful for modulating expression of exogenous genes in mammalian systems, and products related thereto
US6258603B1 (en) 1998-06-17 2001-07-10 Rohm And Haas Company Ligands for modulating the expression of exogenous genes via an ecdysone receptor complex
US6117639A (en) 1998-08-31 2000-09-12 Vertex Pharmaceuticals Incorporated Fusion proteins, DNA molecules, vectors, and host cells useful for measuring protease activity
US6504082B1 (en) 1998-09-10 2003-01-07 Pioneer Hi-Bred International, Inc. Ecdysone receptors and methods for their use
AU6501499A (en) 1998-09-29 2000-04-17 Johns Hopkins University, The Inducible genetic suppression of cellular excitability
US5989863A (en) 1998-10-14 1999-11-23 Incyte Pharmaceuticals, Inc. Human ankyrin family protein
US6987573B1 (en) 1999-05-25 2006-01-17 Silverbrook Research Pty Ltd Interface surface printer
WO2000071743A1 (fr) 1999-05-25 2000-11-30 Eisai Co., Ltd. Methode bihybride dans une cellule de mammifere
CA2377804A1 (en) * 1999-07-01 2001-01-11 Commonwealth Scientific And Industrial Research Organisation Novel genetic sequences encoding steroid and juvenile hormone receptor polypeptides and uses therefor
US7057015B1 (en) * 1999-10-20 2006-06-06 The Salk Institute For Biological Studies Hormone receptor functional dimers and methods of their use
AU2001241682A1 (en) * 2000-02-24 2001-09-03 The Salk Institute For Biological Studies Gene expression system based on chimeric receptors
AU2001249315A1 (en) * 2000-03-22 2001-10-03 Rheogene, Inc. Ecdysone receptor-based inducible gene expression system
US20040033600A1 (en) 2001-03-21 2004-02-19 Palli Subba Reddy Ecdysone receptor-based inducible gene expression system
US20020037514A1 (en) * 2000-03-24 2002-03-28 Klein Elliott S. Identification of nuclear receptor-dependent coregulator recruitment
US8105825B2 (en) 2000-10-03 2012-01-31 Intrexon Corporation Multiple inducible gene regulation system
EP1373470B1 (en) 2001-02-20 2013-04-24 Intrexon Corporation Novel substitution mutant receptors and their use in a nuclear receptor-based inducible gene expression system
DK1572862T3 (da) 2001-02-20 2012-11-26 Intrexon Corp Kimære, retinoide x-receptorer og deres anvendelse i et hidtil ukendt ecdysonrecepttorbaseret inducerbart genekspressionssystem
WO2002066615A2 (en) 2001-02-20 2002-08-29 Rheogene, Inc. Novel substitution mutant receptors and their use in a nuclear receptor-based inducible gene expression system
MXPA03007493A (es) * 2001-02-20 2004-10-15 Rheogene Holdings Inc Nuevo sistema de expresion genetica inducible a base de receptor de ecdisona/receptor x retinoide de invertebrado.
MXPA04002810A (es) 2001-09-26 2005-06-06 Rheogene Holdings Inc Acidos nucleicos receptores de ecdisona de saltarilla, polipeptidos, y sus usos.
CA2459807C (en) 2001-09-26 2013-09-03 Jianzhong Zhang Whitefly ecdysone receptor nucleic acids, polypeptides, and uses thereof
WO2003105489A1 (en) 2002-06-07 2003-12-18 The Trustees Of Columbia University Method and device for online dynamic semantic video compression and video indexing
US20050228016A1 (en) 2002-06-13 2005-10-13 Enrique Michelotti Tetrahydroquinolines for modulating the expression of exogenous genes via an ecdysone receptor complex
US7375093B2 (en) 2002-07-05 2008-05-20 Intrexon Corporation Ketone ligands for modulating the expression of exogenous genes via an ecdysone receptor complex
US7304161B2 (en) 2003-02-10 2007-12-04 Intrexon Corporation Diaclhydrazine ligands for modulating the expression of exogenous genes in mammalian systems via an ecdysone receptor complex
US7304162B2 (en) 2003-02-21 2007-12-04 Intrexon Corporation Oxadiazoline ligands for modulating the expression of exogenous genes via an ecdysone receptor complex
US7456315B2 (en) 2003-02-28 2008-11-25 Intrexon Corporation Bioavailable diacylhydrazine ligands for modulating the expression of exogenous genes via an ecdysone receptor complex
US7935510B2 (en) 2004-04-30 2011-05-03 Intrexon Corporation Mutant receptors and their use in a nuclear receptor-based inducible gene expression system
US9034650B2 (en) 2005-02-02 2015-05-19 Intrexon Corporation Site-specific serine recombinases and methods of their use
US8115059B1 (en) 2005-07-22 2012-02-14 University Of Kentucky Research Foundation Gene expression modulation system for use in plants and method for modulating gene expression in plants
US8471890B1 (en) 2009-12-30 2013-06-25 Insors Integrated Communications Adaptive video communication channel

Also Published As

Publication number Publication date
CA2441444C (en) 2013-09-03
WO2002066613A2 (en) 2002-08-29
JP2009131259A (ja) 2009-06-18
AU2008221578B2 (en) 2012-05-03
JP2013236634A (ja) 2013-11-28
EP1456346B1 (en) 2012-02-15
DK1456346T3 (da) 2012-05-29
AU2002247184B2 (en) 2008-06-19
US9493540B2 (en) 2016-11-15
AU2008221578A1 (en) 2008-10-16
EP1456346A2 (en) 2004-09-15
ES2385598T3 (es) 2012-07-27
US20120167239A1 (en) 2012-06-28
JP4955904B2 (ja) 2012-06-20
JP2004533214A (ja) 2004-11-04
JP5887301B2 (ja) 2016-03-16
EP1456346A4 (en) 2006-12-20
CA2441444A1 (en) 2002-08-29
ATE545705T1 (de) 2012-03-15
WO2002066613A3 (en) 2004-07-15
MXPA03007493A (es) 2004-10-15
JP5345372B2 (ja) 2013-11-20
US20170096672A1 (en) 2017-04-06

Similar Documents

Publication Publication Date Title
CA2441444C (en) Novel ecdysone receptor/invertebrate retinoid x receptor-based inducible gene expression system
CA2438119C (en) Chimeric retinoid x receptors and their use in a novel ecdysone receptor-based inducible gene expression system
CA2404253C (en) Novel ecdysone receptor-based inducible gene expression system
CA2445796C (en) Novel substitution mutant receptors and their use in a nuclear receptor-based inducible gene expression system
US20040033600A1 (en) Ecdysone receptor-based inducible gene expression system
AU2002247184A1 (en) Novel ecdysone receptor/invertebrate retinoid X receptor-based inducible gene expression system
AU2012200136B2 (en) Chimeric retinoid X receptors and their use in a novel ecdysone receptor-based inducible gene expression system
IHRE et al. BASED INDUCIBLE GENE EXPRESSION SYSTEM