BRPI0707787A2 - polipeptÍdeos de ligaÇço quimÉricos de planta para reconhecimento molecular universal - Google Patents

polipeptÍdeos de ligaÇço quimÉricos de planta para reconhecimento molecular universal Download PDF

Info

Publication number
BRPI0707787A2
BRPI0707787A2 BRPI0707787-4A BRPI0707787A BRPI0707787A2 BR PI0707787 A2 BRPI0707787 A2 BR PI0707787A2 BR PI0707787 A BRPI0707787 A BR PI0707787A BR PI0707787 A2 BRPI0707787 A2 BR PI0707787A2
Authority
BR
Brazil
Prior art keywords
amino acid
library
sequences
seq
sequence
Prior art date
Application number
BRPI0707787-4A
Other languages
English (en)
Inventor
Jennifer Jones
Original Assignee
Divergence Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Divergence Inc filed Critical Divergence Inc
Publication of BRPI0707787A2 publication Critical patent/BRPI0707787A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1044Preparation or screening of libraries displayed on scaffold proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

POLIPEPTÍDEOS DE LIGAÇçO QUIMÉRICOS DE PLANTA PARA RECONHECIMENTO MOLECULAR UNIVERSAL A presente invenção refere-se a bibliotecas de ácido nucléicos que codificam polipeptídeos de ligação quiméricos baseados em sequências de polipeptídeo de estrutura de planta. Também descritos são métodos para geração das bibliotecas.

Description

Relatório Descritivo da Patente de Invenção para "POLIPEPTÍ-DEOS DE LIGAÇÃO QUIMÉRICOS DE PLANTA PARA RECONHECIMENTOMOLECULAR UNIVERSAL".
Antecedentes
A especificidade e afinidade de ligação de uma proteína para umalvo são determinadas principalmente pela seqüência de aminoácido de pro-teína dentro de uma ou mais regiões de ligação. Conseqüentemente, a vari-ação da seqüência de aminoácido das regiões relevantes reconfigura aspropriedades de ligação da proteína.
Na natureza, mudanças combinatoriais na ligação de proteínasão melhores ilustradas pela vasta série de imunoglobulinas produzidas pelosistema imune. Cada imunoglobulina inclui um conjunto de seqüências deaminoácido curtas, virtualmente únicas, conhecidas como regiões hipervari-áveis (isto é, domínios de ligação de proteína), e outro conjunto de seqüên-cias mais longas, não-variantes, conhecidas como regiões constantes. Asregiões constantes formam folhas β que estabilizam as três estruturas tridi-mensionais da proteína apesar da enorme diversidade de seqüência entreregiões hipervariáveis na população de imunoglobulinas. Cada conjunto deregiões hipervariáveis confere especificidade e afinidade de ligação. O con-junto de duas imunoglobulinas de cadeia pesada e duas imunoglobulinas decadeia leve em um complexo de proteína grande (isto é, um anticorpo)»,au-mentam adicionalmente o número de combinações com atividades cie liga-ção diversas.
A diversidade de ligação de anticorpos tem sido bem-sucedida-mente explorada em muitas aplicações biomédicas e industriais. Por exem-plo, bibliotecas foram construídas que expressam imunoglobulinas suportan-do regiões hipervariáveis artificialmente diversificadas. As bibliotecas de ex-pressão de imunoglobulina são muito úteis para identificar anticorpos de altaafinidade a uma molécula-alvo (por exemplo, um receptor ou um Iigante dereceptor). Um ácido nucléico que codifica a imunoglobulina identificada po-de, então, ser isolado e expresso em células hospedeiras ou organismos.
Contudo, apesar da utilidade de imunoglobulinas e anticorposem geral, sua expressão em plantas transgênicas pode ser problemática. Asimunoglobulinas não podem se desdobrar corretamente em citoplasma deplanta porque elas requerem a formação de ligações de dissulfeto múltiplas.Adicionalmente, o grande tamanho das imunoglobulinas impede seu enten-dimento efetivo por algumas pestes de planta. Desse modo, as imunoglobu-linas não são freqüentemente úteis como pesticidas de proteína ou molécu-las que tem como alvo pesticidas. Finalmente, proteínas que expressammamíferos, tais como imunoglobulinas (por exemplo), conforme assim de-nominadas "anticorpos de planta" em plantas comestíveis também elevam aemissão potencial de aceitação do consumidor e é, desse modo, um impe-dimento à comercialização. Isto pode eficazmente impedir o uso de anticor-pos de planta para muitas traços de entrada e saída em plantas transgêni-cas.
As desvantagens acima mencionadas de imunoglobulinas po-dem ser evitadas pela geração de diversas bibliotecas de proteínas de liga-ção de outras classes de proteínas estruturalmente tolerantes, preferivel-mente proteínas derivadas de planta. Estas bibliotecas podem ser classifica-das para identificar proteínas individuais que se liga com especificidade eafinidade desejadas a um alvo de interesse. Em seguida, as proteínas deligação identificadas podem ser eficazmente expressas em plantas transgê-nicas.
SUMÁRIO
Diversas bibliotecas de ácidos nucléicos que codificam polipep-tídeos de ligação quiméricos de planta, bem como métodos para gerá-las,são aqui descritos. Os polipeptídeos de ligação quiméricos são conceitual-mente análogos a imunoglobulinas em que elas caracterizam domínios deligação altamente variados na estrutura de seqüências não-variantes quecodificam uma proteína estruturalmente robusta. Contudo, os polipeptídeosde ligação quiméricos aqui descritos têm a vantagem considerável de seremderivados de seqüências de proteína de planta, evitando, desse modo, mui-tos dos problemas associados com expressão de imunoglobulina em plan-tas. As seqüências de aminoácido das proteínas de ligação quiméricas deplanta codificada são derivadas de uma seqüência de polipeptídeo de estru-tura principal que inclui subseqüências a serem variadas. As subseqüênciasvariadas correspondem aos domínios de ligação putativos dos polipeptídeosde ligação quiméricos de planta, e são altamente heterogêneos na bibliotecade proteínas de ligação quiméricas de planta codificada. Em contraste, aseqüência das proteínas de ligação quiméricas codificadas fora das subse-qüências variadas é essencialmente a mesma conforme a seqüência de po-lipeptídeo de estrutura principal de origem, e altamente homogênea atravésde toda a biblioteca de proteínas de ligação quiméricas de planta codificada.Tais bibliotecas podem servir como uma plataforma de reconhecimento mo-lecular universal para selecionar proteínas com ligação de alta seletividade eafinidade para expressão em plantas transgênicas.
Conseqüentemente, um aspecto aqui descrito é uma bibliotecade moléculas de ácido nucléico que codificam pelo menos dez (por exemplo,pelo menos 1.000, 105 ou 106) polipeptídeos de ligação quiméricos diferentes.A seqüência de aminoácido de cada polipeptídeo inclui C1-X1-C2-X2-C3-X3-C4,onde CrC4 são subseqüências de estrutura principal selecionadas de fosfa-tase ácida púrpura (isto é, SEQ ID NOs: 1-30, 31-60, 61-90 e 91-120, res-pectivamente) que podem incluir até 30 (por exemplo, 20, 10 ou 5) substitui-ções, retiradas, inserções ou adições de aminoácido simples às seqüênciasde fosfatase ácida púrpura. As subseqüências CrC4 são homogêneas atra-vés de muitos dos polipeptídeos codificados na biblioteca. Em contraste àssubseqüências de estrutura principal CrC4, as subseqüências de XrX3 sãosubseqüências independentes variáveis de 2-20 aminoácidos, e estas sub-seqüências são heterogêneas através de muitos dos polipeptídeos na biblio-teca. Por exemplo, a biblioteca de polipeptídeos quiméricos pode ter a se-qüência de aminoácidos de qualquer uma de SEQ ID Nos: 124-126, incluin-do uma a dez substituições, retiradas, inserções ou adições de aminoácidosimples para posições de aminoácido correspondendo a 23-39, 51-49 e 79-84de SEQ ID Nos:124-126.
Outro aspecto aqui descrito é um método para gerar a bibliotecaaqui descrita. O método inclui provisão de um ácido nucléico parenteral quecodifica uma seqüência de polipeptídeo de estrutura de planta contendoC1-X1-C2-X3-C3-X3-C4, conforme definido acima. O método inclui adicional-mente replicação do ácido nucléico parentera! (por exemplo, pelo menosuma das subseqüências de XrX3 é selecionada de SEQ ID Nos: 121-123)sob condições que introduzem até 10 substituições, retiradas, inserções ouadições de aminoácido simples às subseqüências X1l X2 ou X3 parenterais,pelo que uma população heteróloga de subseqüências aleatoriamente varia-das que codificam X1l X2 ou X3 é gerada. A população de subseqüênciasvariadas é, em seguida, substituída em uma população de ácidos nucléicosparenterais nas posições correspondentes àquelas que codificam X1, X2 ouX3. As substituições, retiradas, inserções ou adições de aminoácido podemser introduzidas nas subseqüências de ácido nucléico parenteral por replica-ção in vitro (por exemplo, usando-se uma polimerase mutagênica purificadaou análogos de nucleotídeo), ou in vivo (por exemplo, em uma cepa muta-gênica de E. coli). A biblioteca antes descrita pode ser introduzida em umsistema de replicação biológico (por exemplo, E. coli ou bacteriófago), e am-plificada.
Um aspecto relacionado aqui descrito é outro método para gerara biblioteca acima descrita de ácidos nucléicos. O método inclui seleção deuma seqüência de aminoácido contendo C1-X1-C2-X2-C3-X3-C4 conforme de-finido acima. O método inclui adicionalmente provisão de um primeiro e umsegundo conjunto de oligonucleotídeos, tendo seqüências complementaresde sobreposição. Os oligonucleotídeos do primeiro conjunto codificam assubseqüências CrC4 e subseqüências XrX3 heterogêneas múltiplas. Osoligonucleotídeos do segundo conjunto são complementares às seqüências denucleotídeo que codificam as subseqüências CrC4 e subseqüências Xi-X3 he-terogêneas múltiplas. Os dois conjuntos de oligonucleotídeos são combina-dos para formar uma primeira mistura e incubados sob condições que permi-tem hibridização das seqüências complementares de sobreposição. As se-qüências hibridizadas resultantes são, em seguida, estendidas para formaruma segunda mistura contendo a biblioteca acima descrita.
Ainda outro aspecto da invenção é uma biblioteca de ácidos nu-cléicos que codificam polipeptídeos de ligação quiméricos, cada um dosquais incluindo uma seqüência de aminoácidos pelo menos 70% (isto é,qualquer percentagem entre 70% e 100%) idêntica a qualquer de SEQ IDNos: 127-129. A seqüência de aminoácidos de cada um dos polipeptídeoscodificados inclui aminoácidos que diferem daqueles de SEQ ID Nos:127-129 nas posições 14, 15, 33, 35-36, 38, 47-48, 66, 68-69, 71, 80, 81, 99,101-102 e 104, e as diferenças de aminoácido são heterogêneas através deuma pluralidade dos polipeptídeos codificados. A seqüência de aminoácidosde cada um dos polipeptídeos codificados fora da posição acima listada éhomogênea através de uma pluralidade dos polipeptídeos quiméricos codifi-cados.
Um aspecto relacionado aqui descrito é um método para gerar abiblioteca aqui descrita. O método inclui seleção de uma seqüência de ami-noácido correspondente a qualquer uma de SEQ ID Nos: 127-129, em que aseqüência selecionada difere de SEQ ID Nos: 127-129 em pelo menos umadas posições acima mencionadas. O método inclui adicionalmente provisãode um primeiro e um segundo conjunto de oligonucleotídeos tendo seqüên-cias complementares de sobreposição. Os oligonucleotídeos do primeiroconjunto codificam subseqüências da seqüência de aminoácido, as subse-qüências sendo heterogêneas nas posições acima mencionadas. Os oligo-nucleotídeos do segundo conjunto são complementares às seqüências denucleotídeo que codificam subseqüências da seqüência de aminoácido sele-cionada, as subseqüências sendo heterogêneas nas posições acima men-cionadas. Os dois conjuntos de oligonucleotídeos são combinados para for-mar uma primeira mistura, e incubada sob condições que permitem hibridi-zação das seqüências complementares de sobreposição. As seqüênciashibridizadas resultantes são, em seguida, estendidas para formar uma se-gunda mistura contendo a biblioteca acima descrita.
Várias implementações da invenção podem incluir um ou maisdos seguintes. Por exemplo, cada ácido nucléico em uma biblioteca podeincluir uma seqüência de vetor. Também caracterizado é qualquer ácido nu-cléico isolado de uma das bibliotecas acima descritas, bem como o polipep-tídeo de ligação quimérico codificado por ela, na forma pura.
Em uma implementação, uma população de células (ou célulasindividuais selecionadas a partir da população de células) é provida que ex-pressa polipeptídeos de ligação quiméricos codificados por uma das bibliote-cas. Outra implementação caracteriza uma biblioteca de polipeptídeos deligação quiméricos codificados por uma das bibliotecas de ácido nucléico.Ainda outra implementação proporciona uma população de fago filamentosorevelando os polipeptídeos de ligação quiméricos codificados por uma dasbibliotecas de ácido nucléico.
Em várias implementações de métodos para geração das biblio-tecas de ácido nucléico acima descritas por conjunto de oligonucleotídeo,um ou mais dos seguintes podem ser incluídos. Por exemplo, o método podeadicionalmente incluir, após a segunda mistura que contém a biblioteca deácido nucléico ser gerada, realização de um ciclo de desnaturação da popu-lação de ácidos nucléicos, seguida por uma hibridização e uma etapa dealongamento. Opcionalmente, este ciclo pode ser repetido (por exemplo, até100 vezes). As bibliotecas de ácido nucléico podem ser uma reação de ca-deia de polimerase que inclui um iniciador de avanço e reverso que hibridizapara as seqüências 5' e 3', respectivamente, de todos os ácidos nucléicos nabiblioteca. Em uma implementação, aminoácidos a serem codificados emposições de seqüência variáveis são selecionados de um subconjunto (porexemplo, somente 4, 6, 8, 10, 12, 14 ou 16) de alanina, arginina, asparagina,aspartato, glutamina, glutamato, glicina, histidina, isoleucina, leucina, lisina,metionina, fenilalanina, prolina, serina, treonina, triptofan, tirosina, cisteína evalina (os 20 aminoácidos ocorrem naturalmente). Em outros casos, 19 dos20 aminoácidos (excluída cisteína). Em outros casos, todos os 20 são usa-dos. Em outra implementação, o subconjunto de aminoácidos inclui pelomenos um aminoácido alifático, pelo menos um aminoácido acídico, pelomenos um aminoácido neutro, e pelo menos um aminoácido aromático (porexemplo, alanina, aspartato, serina e tirosina).
É descrita aqui uma biblioteca de ácidos nucléicos que codificampelo menos dez polipeptídeos diferentes, a seqüência de aminoácidos decada polipeptídeo compreendendo:
C1-X1-C2-X2-C3-X3-C4, no qual (i) subseqüência Ci é selecionadade SEQ ID NOS:1-30, subseqüência C2 é selecionada de SEQ ID NOS:31-60,subseqüência C3 é selecionada de SEQ ID NOS:61-90, subseqüência C4 éselecionada de SEQ ID NOS:91-12C>, e cada uma de CrC4 compreende até10 substituições, retiradas, inserções ou adições de aminoácido simples àsubseqüência selecionada; (ii) CrC4 são homogêneas através de uma plura-lidade dos polipeptídeos codificados; (iii) cada uma de XrX3 é uma subse-qüência independentemente variável consistindo em 2-20 aminoácidos; ecada uma de Xi-X3 são heterogêneas através de uma pluralidade dos poli-peptídeos codificados.
Também é descrita uma biblioteca de ácidos nucléicos que codi-ficam pelo menos dez polipeptídeos diferentes, a seqüência de aminoácidosde cada polipeptídeo compreendendo:
Ci-Xi-C2-X2-C3-X3-C4, no qual: (i) subseqüência Ci é seleciona-da de figura 2 ou figura 4, subseqüência C2 é selecionada de figura 2 ou fi-gura 4, subseqüência C3 é selecionada de figura 2 ou figura 4; subseqüênciaC4 é selecionada de figura 2 ou figura 4, e cada uma de CrC4 compreendeaté 10 substituições, retiradas, inserções ou adições de aminoácido simplesà subseqüência selecionada; (ii) CrC4 são homogêneas através de uma plu-ralidade dos polipeptídeos codificados; (iii) cada uma de Xi-X3 é uma subse-qüência independentemente variável consistindo em 2-20 aminoácidos; ecada uma de XrX3 são heterogêneas através de uma pluralidade dos poli-peptídeos codificados.
Também descrita é uma biblioteca de ácidos nucléicos que codi-ficam pelo menos dez polipeptídeos diferentes, a seqüência de aminoácidosde cada polipeptídeo compreendendo:
CrXi-C2-X2-C3-X3-C4, no qual (i) subseqüência Ci é selecionadade figura 3 ou figura 5, subseqüência C2 é selecionada de figura 3 ou figura 5,subseqüência C3 é selecionada de figura 3 ou figura 5; subseqüência C4 éselecionada de figura 3 XX, e cada uma de Ci-C4 compreende até 30 subs-tituições, retiradas, inserções ou adições de aminoácido simples à subse-qüência selecionada; (ii) CrC4 são homogêneas através de uma pluralidadedos polipeptídeos codificados; (iii) cada uma de XrX3 é uma subseqüênciaindependentemente variável consistindo em 2-20 aminoácidos; e cada umade XrX3 são heterogêneas através de uma pluralidade dos polipeptídeoscodificados.
Em várias concretizações: pelo menos 1.000 polipeptídeos dife-rentes são codificados; pelo menos 100.000 polipeptídeos diferentes sãocodificados; pelo menos 1.000.000 de polipeptídeos diferentes são codifica-dos; cada uma de CrC4 compreende independentemente até 20 substitui-ções, retiradas, inserções ou adições de aminoácido simples à subseqüênciaselecionada; cada uma de CrC4 compreende independentemente até 10substituições, retiradas, inserções ou adições de aminoácido simples à sub-seqüência selecionada; cada uma de CrC4 compreende independentemen-te até 5 substituições, retiradas, inserções ou adições de aminoácido simplesà subseqüência selecionada; nenhuma de C1-C4 compreende substituições,retiradas, inserções ou adições de aminoácido à subseqüência selecionada;aminoácidos de XrX3 são selecionados de pouco menos do que 20 aminoá-cidos geneticamente codificados em plantas; aminoácidos de XrX3 são se-lecionados de todos 20 aminoácidos geneticamente codificados em plantas;os pouco menos do que 20 aminoácidos geneticamente codificados incluempelo menos um aminoácido alifático, pelo menos um aminoácido acídico,pelo menos um aminoácido neutro, e pelo menos um aminoácido aromático;pouco menos do que 20 aminoácidos geneticamente codificados compreen-dem alanina, aspartato, serina e tirosina.
Em alguns casos: a seqüência de aminoácidos de cada polipep-tídeo é selecionada de:
(a) um polipeptídeo compreendendo Ci-XrC2-X2-C3-X3-C4, noqual Ci = SEQ ID NO:1, C2 = SEQ ID NO:31, C3 = SEQ ID NO:61, e C4 =SEQ ID NO:91;
(b) um polipeptídeo compreendendo CrXrCa-X2-C3-X3-C4, noqual Ci = SEQ ID NO:2, C2 = SEQ ID NO:32, C3 = SEQ ID NO:62, e C4 =SEQ ID NO:92; e(c) um polipeptídeo compreendendo C1-X1-C2-X2-C3-X3-C4, noqual C1 = SEQ ID NO:3, C2 = SEQ ID NO:33, C3 = SEQ ID NO:63, e C4 =SEQ ID NO:93.
Em alguns casos: cada polipeptídeo codificado compreendeC1-X1-C2-X2-C3-X3-C4, no qual C1 = SEQ ID NO: X1, C2 = SEQ ID NO: X2, C3= SEQ ID NO: X3, e C4 = SEQ ID NO: X4; SEQ designada. ID N0:130.
Em alguns casos, cada polipeptídeo codificado compreendeC1-X1-C2-X2-C3-X3-C4, no qual C1 = SEQ ID NO: X1, C2 = SEQ ID NO: X2, C3= SEQ ID NO: X3, e C4 = SEQ ID NO: X4; designada SEQ. ID N0:130.
Em algumas concretizações: no qual cada um dos ácidos nu-cléicos compreende uma seqüência de vetor.
Também descritos: são um ácido nucléico isolado selecionado apartir da biblioteca e uma célula isolada que expressa o ácido nucléico, bemcomo uma biblioteca purificada de polipeptídeos purificados codificados pelabiblioteca; e uma população de fago filamentoso que revela os polipeptídeoscodificados pela biblioteca.
É descrito aqui um método de gerar uma biblioteca, compreen-dendo: (i) provisão de um ácido nucléico parenteral que codifica um polipep-tídeo parenteral compreendendo a seqüência de aminoácido: C1-X1-C2-X2-C3-X3-C4, no qual a subseqüência C1 é selecionada de SEQ ID NOS: 1-30, asubseqüência C2 é selecionada de SEQ ID NOS:31 -60, a subseqüência C3 éselecionada de SEQ ID NOS:61-90, a subseqüência C4 é selecionada deSEQ ID NOS:91-120, cada uma de C1-C4 compreende até 10 substituições,retiradas, inserções ou adições de aminoácido simples à subseqüência sele-cionada; e cada X1-X3 é uma subseqüência independente consistindo em 2-20 aminoácidos; (ii) replicação do ácido nucléico parenteral sob condiçõesque introduzem até 10 substituições, retiradas, inserções ou adições de ami-noácido simples às subseqüências X1, X2 ou X3, pelo que uma população deseqüências aleatoriamente variadas que codificam X1', X2' ou X3' é gerada; e(iii) a população de seqüências aleatoriamente variadas X1', X2' ou X3' ésubstituída, em uma população de ácidos nucléicos parenterais nas posi-ções correspondentes àquelas que codificam X1', X2' ou X3'.Em vários exemplos: pelo menos uma das subseqüências X1-X3é selecionada de SEQ ID Nos: 121-123; cada uma de C1-C4 compreende in-dependentemente até 20 substituições, retiradas, inserções ou adições deaminoácido simples à subseqüência selecionada; cada uma de C1-C4 com-preende independentemente até 10 substituições, retiradas, inserções ouadições de aminoácido simples à subseqüência selecionada; cada uma deC1-C4 compreende independentemente até 5 substituições, retiradas, inser-ções ou adições de aminoácido simples à subseqüência selecionada; ne-nhuma de C1-C4 compreende substituições, retiradas, inserções ou adiçõesde aminoácido à subseqüência selecionada; a replicação gera uma popula-ção heterogênea de subseqüências aleatoriamente variadas pela introduçãode até 5 substituições de aminoácido em cada uma de X1, X2 ou X3; o méto-do compreende adicionalmente amplificar a biblioteca pela introdução damesma em um sistema de replicação biológico e proliferação do sistema dereplicação biológico; o sistema de replicação biológico é uma pluralidade decélulas de E. colr, o sistema de replicação biológico é uma pluralidade debacteriófago; a replicação ocorre in vitro; a replicação é realizada com umapolimerase mutagênica purificada; a replicação é realizada na presença deum análogo de nucleotídeo; a replicação ocorre in vivo·, a replicação in vivoocorre em uma espécie mutagênica de E. coii.
Também descrito é um método de gerar a biblioteca de acordocom a reivindicação 1, compreendendo: (i) seleção de uma seqüência deaminoácido compreendendo a seqüência de aminoácido: C1-XrC2-X2-C3-X3-C4 a ser codificada, no qual: (a) a subseqüência Ci é selecionada de SEQ IDNOS: 1-30, a subseqüência C2 é selecionada de SEQ ID NOS:31-60, a sub-seqüência C3 é selecionada de SEQ ID NOS:61-90, a subseqüência C4 éselecionada de SEQ ID NOS:91-120; (b) cada uma de C1-C4 compreendeaté 10 substituições, retiradas, inserções ou adições de aminoácido simplesà subseqüência selecionada; (c) cada X1, X2 e X3 consiste em uma subse-qüência de aminoácido de 2-20 aminoácidos de comprimento; (ii) provisãode uma primeira pluralidade e uma segunda pluralidade de oligonucleotí-deos, no qual (a) oligonucleotídeos da primeira pluralidade codificam as sub-seqüências C1-C4 e subseqüências variantes XrX3 heterogêneas múltiplasXi'-X3'; (b) oligonucleotídeos da segunda pluralidade são complementaresàs seqüências de nucleotídeo que codificam as subseqüências C1-C4 e àsseqüências de nucleotídeo que codificam as subseqüências Xi'-X3' hetero-gêneas múltiplas; e (c) oligonucleotídeos das primeira e segunda plural ida-des têm seqüências de sobreposição uma com a outra; (iii) combinação dapopulação de oligonucleotídeos para formar uma primeira mistura; (iv) incu-bação da mistura sob condições eficazs para hibridização das seqüênciascomplementares de sobreposição para formar uma pluralidade de seqüên-cias complementares hibridizadas; e (v) alongamento da pluralidade de se-qüências complementares hibridizadas para formar uma segunda misturacontendo a biblioteca.
Em várias concretizações: cada uma de C1-C4 compreende in-dependentemente até 20 substituições, retiradas, inserções ou adições deaminoácido simples à subseqüência selecionada; cada uma de C1-C4 com-preende independentemente até 10 substituições, retiradas, inserções ouadições de aminoácido simples à subseqüência selecionada; cada uma deC1-C4 compreende independentemente de zero até 5 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada; o método compreende adicionalmente realizar um ciclo de etapas, ociclo de etapas compreendendo desnaturação da biblioteca pelo aumento datemperatura da segunda mistura a uma temperatura eficaz para desnatura-ção de DNA de filamento duplo, seguida pelas etapas (iv) e (v); o métodocompreende repetição do ciclo de etapas até 100 vezes; o método compre-ende adicionalmente amplificação da biblioteca por uma reação de cadeia depolimerase consistindo essencialmente da biblioteca, um iniciador de avan-ço, e um iniciador reverso, no qual os prímeres de avanço e reverso podemhibridizar para as seqüências terminais 5' e 3', respectivamente, de todos osácido nucléicos na biblioteca; o aminoácido a ser codificado em cada posi-ção das subseqüências X1, X2 ou X3, é selecionado de um subconjunto dealanina, arginina, asparagina, aspartato, cisteína, glutamina, glutamato, glici-na, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, seri-na, treonina, triptofan, tirosina e valina; aqui o aminoácido selecionado paracada substituição de aminoácido simples é selecionado de um grupo de a-minoácidos consistindo em pelo menos um aminoácido alifático, pelo menosum aminoácido acídico, pelo menos um aminoácido neutro, e pelo menosum aminoácido aromático; e o grupo de aminoácidos consiste em alanina,aspartato, serina e tirosina.
Também descrito aqui é um método de gerar uma biblioteca,compreendendo: (i) provisão de um ácido nucléico parenteral que codificaum polipeptídeo parenteral compreendendo a seqüência de aminoácido:C1-X1-C2-X2-C3-X3-C4, no qual C1 é selecionada de figura 2 ou figura 4, asubseqüência C2 é selecionada de figura 2 ou figura 4, a subseqüência C3é selecionada de figura 2 ou figura 4, a subseqüência C4 é selecionada defigura 2 ou figura 4, cada uma de C1-C4 compreende até 10 substituições,retiradas, inserções ou adições de aminoácido simples à subseqüência sele-cionada; e cada uma de XrX2 é uma subseqüência independente consistin-do em 2-10 aminoácidos; (ii) replicação do ácido nucléico parenteral sobcondições que introduzem até 10 substituições, retiradas, inserções ou adi-ções de aminoácido simples às subseqüências de X1, X2, ou X3, pelo queuma população de subseqüências aleatoriamente variadas que codificamX1', X2', ou X3' é gerada; e (iii) a população de subseqüências aleatoriamentevariadas X1', X2', ou X3' é substituída, em uma população de ácidos nucléicosparenterais nas posições correspondentes àquelas que codificam X1, X2, ouX3.
Em várias concretizações: pelo menos uma das subseqüênciasX1-X2 é selecionada de SEQ ID Nos:121-123; cada uma de C1-C4 compre-ende independentemente até 20 substituições, retiradas, inserções ou adi-ções de aminoácido simples à subseqüência selecionada; cada uma de C1-C4 compreende independentemente até 10 substituições, retiradas, inser-ções ou adições de aminoácido simples à subseqüência selecionada; cadauma de C1-C4 compreende independentemente até 5 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada; nenhuma de C1-C4 compreende substituições, retiradas, inserções ouadições de aminoácido; a replicação gera uma população heterogênea desubseqüências aleatoriamente variadas pela introdução de até 5 substitui-ções de aminoácido em cada uma de X1, X2, ou X3, o método compreendeadicionalmente amplificar a biblioteca pela introdução da mesma em um sis-tema de replicação biológico e proliferação do sistema de replicação biológi-co; o sistema de replicação biológico é uma pluralidade de células de E. colr,o sistema de replicação biológico é uma pluralidade de bacteriófago; a repli-cação ocorre in vitro; a replicação é realizada com uma polimerase mutagê-nica purificada; a replicação é realizada na presença de um análogo de nu-cleotídeo; a replicação ocorre in vívo; a replicação in vivo ocorre em umaespécie mutagênica de E. coli.
Também descrito é um método de gerar a biblioteca, compreen-dendo: (i) seleção de uma seqüência de aminoácido compreendendo CrXrC2-X2-C3-X3-C4 a ser codificada, no qual (a) a subseqüência C1 é seleciona-da de figura 2 ou figura 4, a subseqüência C2 é selecionada de figura 2 oufigura 4, a subseqüência C3 é selecionada de figura 2 ou figura 4, a subse-qüência C4 é selecionada de figura 2 ou figura 4; (b) cada uma de CrC4compreende até 10 substituições, retiradas, inserções ou adições de amino-ácido simples à subseqüência selecionada; (c) e cada uma de Xi, X2, e X3consiste em uma seqüência de aminoácido de 2-20 aminoácidos de compri-mento; (ii) provisão de uma primeira pluralidade e um segunda pluralidadede oligonucleotídeos, no qual (a) oligonucleotídeos da primeira pluralidadecodificam as subseqüências C1-C4 e subseqüências variantes XrX3 hetero-gêneas múltiplas Xi'-X3'; (b) oligonucleotídeos da segunda pluralidade sãocomplementares às seqüências de nucleotídeo que codificam as subse-qüências C1-C4 e às seqüências de nucleotídeo que codificam as subse-qüências Xi'-X3' heterogêneas múltiplas; e (c) oligonucleotídeos das primeirae segunda plural idades têm seqüências de sobreposição uma com a outra;(iii) combinação da população de oligonucleotídeos para formar uma primei-ra mistura; (iv) incubação da mistura sob condições eficazs para hibridizaçãodas seqüências complementares de sobreposição para formar uma plurali-dade de seqüências complementares hibridizadas; e (v) alongamento dapluralidade de seqüências complementares hibridizadas para formar umasegunda mistura contendo a biblioteca.
Em vários casos: cada uma de C1-C4 compreende independen-temente até 20 substituições, retiradas, inserções ou adições de aminoácidosimples à subseqüência selecionada; cada uma de C1-C4 compreende inde-pendentemente até 10 substituições, retiradas, inserções ou adições de a-minoácido simples à subseqüência selecionada; cada uma de C1-C4 com-preende independentemente de zero até 5 substituições, retiradas, inserçõesou adições de aminoácido simples à subseqüência selecionada; o métodocompreende adicionalmente realizar um ciclo de etapas, o ciclo de etapascompreendendo desnaturação da biblioteca pelo aumento da temperatura dasegunda mistura a uma temperatura eficaz para desnaturação de DNA defilamento duplo, seguida pelas etapas (iv) e (v); o método compreende adi-cionalmente repetir o ciclo de etapas até 100 vezes; o método compreendeadicionalmente amplificação da biblioteca por uma reação de cadeia de po-limerase consistindo essencialmente da biblioteca, um iniciador de avanço, eum iniciador reverso, no qual os prímeres de avanço e reverso podem hibri-dizar para as seqüências terminais 5' e 3', respectivamente, de todos os áci-do nucléicos na biblioteca; o aminoácido a ser codificado em cada posiçãodas subseqüências X1, X2 ou X3, é selecionado de um subconjunto de alani-na, arginina, asparagina, aspartato, cisteína, glutamina, glutamato, glicina,histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina,treonina, triptofan, tirosina e valina; o aminoácido selecionado para cadasubstituição de aminoácido simples é selecionado de um grupo de aminoá-cidos consistindo em pelo menos um aminoácido alifático, pelo menos umaminoácido acídico, pelo menos um aminoácido neutro, e pelo menos umaminoácido aromático; e o grupo de aminoácidos consiste em alanina, as-partato, serina e tirosina.
Também é descrito um método de gerar a biblioteca, compreen-dendo: (i) provisão de um ácido nucléico parenteral que codifica um polipep-tídeo parenteral compreendendo a seqüência de aminoácido: C1-X1-C2-X2-C3-X3-C4, no qual C1 é selecionada de figura 3 ou figura 5, a subseqüênciaC2 é selecionada de figura 3 ou figura 5, a subseqüência C3 é selecionadade figura 3 ou figura 5, a subseqüência C4 é selecionada de figura 3 oufigura 5, cada uma de C1-C4 compreende até 10 substituições, retiradas,inserções ou adições de aminoácido simples à subseqüência selecionada; ecada uma de XrX3 é uma subseqüência independente consistindo em 2-20aminoácidos; (ii) replicação do ácido nucléico parenteral sob condições queintroduzem até 10 substituições, retiradas, inserções ou adições de aminoá-cido simples às subseqüências de X1, X2, ou X3, pelo que uma população desubseqüências aleatoriamente variadas que codificam X1', X2', ou X3' é gera-da; e (iii) a população de subseqüências aleatoriamente variadas X1', X2', ouX3' é substituída, em uma população de ácidos nucléicos parenterais nasposições correspondentes àquelas que codificam X11 X2, ou X3.
Em vários exemplos: pelo menos uma das subseqüências X1-X3é selecionada de SEQ ID Nos:121-123; cada uma de C1-C4 compreende in-dependentemente até 20 substituições, retiradas, inserções ou adições deaminoácido simples à subseqüência selecionada; cada uma de C1-C4 com-preende independentemente até 10 substituições, retiradas, inserções ouadições de aminoácido simples à subseqüência selecionada; cada uma deC1-C4 compreende independentemente até 5 substituições, retiradas, inser-ções ou adições de aminoácido simples à subseqüência selecionada; ne-nhuma de C1-C4 compreende substituições, retiradas, inserções ou adiçõesde aminoácido; a replicação gera uma população heterogênea de subse-qüências aleatoriamente variadas pela introdução de até 5 substituições deaminoácido em cada uma de X1, X2, ou X3; o método compreende adicional-mente amplificar a biblioteca pela introdução da mesma em um sistema dereplicação biológico e proliferação do sistema de replicação biológico; o sis-tema de replicação biológico é uma pluralidade de células de E. colr, o sis-tema de replicação biológico é uma pluralidade de bacteriófago; a replicaçãoocorre in vitro; a replicação é realizada com uma polimerase mutagênica pu-rificada; a replicação é realizada na presença de um análogo de nucleotídeo;a replicação ocorre in vivo\ a replicação in vivo ocorre em uma espécie mu-tagênica de E. coli.Também descrito é um método de gerar a biblioteca compreen-dendo: (i) seleção de uma seqüência de aminoácido compreendendo CrXrC2-X2-C3-X3-C4 a ser codificada, no qual (a) a subseqüência Ci é seleciona-da de figura 3 ou figura 5, a subseqüência C2 é selecionada de figura 3 oufigura 5, a subseqüência C3 é selecionada de figura 3 ou figura 5, a subse-qüência C4 é selecionada de figura 3 ou figura 5; (b) cada uma de C1-C4compreende até 10 substituições, retiradas, inserções ou adições de amino-ácido simples à subseqüência selecionada; (c) e cada uma de X1, X2, e X3consiste em uma seqüência de aminoácido de 2-20 aminoácidos de compri-mento; (ii) provisão de uma primeira pluralidade e um segunda pluralidadede oligonucleotídeos, no qual (a) oligonucleotídeos da primeira pluralidadecodificam as subseqüências C1-C4 e subseqüências variantes X1-X3 hetero-gêneas múltiplas Xi'-X3'; (b) oligonucleotídeos da segunda pluralidade sãocomplementares às seqüências de nucleotídeo que codificam as subse-qüências C1-C4 e às seqüências de nucleotídeo que codificam as subse-qüências X1'-X3' heterogêneas múltiplas; e (c) oligonucleotídeos das primeirae segunda pluralidades têm seqüências de sobreposição uma com a outra;(iii) combinação da população de oligonucleotídeos para formar uma primei-ra mistura; (iv) incubação da mistura sob condições eficazs para hibridizaçãodas seqüências complementares de sobreposição para formar uma plurali-dade de seqüências complementares hibridizadas; e (v) alongamento dapluralidade de seqüências complementares hibridizadas para formar umasegunda mistura contendo a biblioteca.
Em várias concretizações: cada uma de C1-C4 compreende in-dependentemente até 20 substituições, retiradas, inserções ou adições deaminoácido simples à subseqüência selecionada; cada uma de C1-C4 com-preende independentemente até 10 substituições, retiradas, inserções ouadições de aminoácido simples à subseqüência selecionada; cada uma deC1-C4 compreende independentemente de zero até 5 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada; o método compreende adicionalmente realizar um ciclo de etapas, ociclo de etapas compreendendo desnaturação da biblioteca pelo aumento datemperatura da segunda mistura a uma temperatura eficaz para desnatura-ção de DNA de filamento duplo, seguida pelas etapas (iv) e (v); o métodocompreende adicionalmente repetição do ciclo de etapas até 100 vezes; ométodo compreende adicionalmente amplificação da biblioteca por uma rea-ção de cadeia de polimerase consistindo essencialmente da biblioteca, uminiciador de avanço, e um iniciador reverso, no qual os prímeres de avanço ereverso podem hibridizar para as seqüências terminais 5' e 3', respectiva-mente, de todos os ácido nucléicos na biblioteca; o aminoácido a ser codifi-cado em cada posição das subseqüências X1, X2 ou X3, é selecionado de umsubconjunto de alanina, arginina, asparagina, aspartato, cisteína, glutamina,glutamato, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalani-na, prolina, serina, treonina, triptofan, tirosina e valina; o aminoácido selecio-nado para cada substituição de aminoácido simples é selecionado de umgrupo de aminoácidos consistindo em pelo menos um aminoácido alifático,pelo menos um aminoácido acídico, pelo menos um aminoácido neutro, epelo menos um aminoácido aromático; e o grupo de aminoácidos consisteem alanina, aspartato, serina e tirosina.
Também descrita é uma biblioteca de ácidos nucléicos que codi-ficam pelo menos dez polipeptídeos diferentes, no qual: (i) a seqüência deaminoácido de cada um dos polipeptídeos codificados compreende uma se-qüência de aminoácido pelo menos 70% idêntica a qualquer de SEQ IDNos: 127-129; (ii) a seqüência de aminoácido de cada um dos polipeptídeoscodificados inclui aminoácidos que diferem daquela de SEQ ID Nos:127-129nas posições 14, 15, 33, 35-36, 38, 47-48, 66, 68-69, 71, 80, 81, 99, 101-102, e 104, e as diferenças de aminoácido são heterogênea através de umapluralidade dos polipeptídeos codificados; e (iii) a seqüência de aminoácidode cada um dos polipeptídeos codificados fora dos resíduos correspondemàs posições 14, 15, 33, 35-36, 38, 47-48, 66, 68-69, 71, 80, 81, 99, 101-102,e 104 de SEQ ID Nos:127-129 é homogênea através de uma pluralidade dospolipeptídeos codificados.
Em várias concretizações: a seqüência de aminoácido dos poli-peptídeos tem pelo menos 75% de identidade para qualquer de SEQ IDNos: 127-129; a seqüência de aminoácido dos polipeptídeos tem pelo menos80% de identidade para qualquer de SEQ ID Nos:127-129; e a seqüência deaminoácido dos polipeptídeos tem pelo menos 85% de identidade para qual-quer de SEQ ID Nos: 127-129; cada um dos ácidos nucléicos compreendeuma seqüência de vetor. Também revelado: um ácido nucléico isolado quecodifica um polipeptídeo selecionado a partir da biblioteca; um polipeptídeopurificado codificado pelo ácido nucléico; uma população de células que ex-pressa os polipeptídeos codificados pela biblioteca; uma célula selecionadaa partir da população de células; uma biblioteca purificada de polipeptídeoscodificados pela biblioteca; uma população de fago filamentoso revelando abiblioteca de polipeptídeos codificados pela biblioteca.
Também revelado é um método de gerar a biblioteca, compre-endendo: (i) seleção de uma seqüência de aminoácido correspondente aqualquer uma de SEQ ID Nos:127-129 a ser codificada, no qual a seqüênciaselecionada difere daquelas de SEQ ID Nos: 127-129 em pelo menos uma deposições variáveis 14, 15, 33, 35-36, 38, 47-48, 66, 68-69, 71, 80, 81, 99,101-102, e 104; (ii) provisão quimicamente de uma primeira e uma segundapluralidade de oligonucleotídeos, no qual: (a) oligonucleotídeos da primeirapluralidade codificam subseqüências de aminoácido da seqüência de ami-noácido selecionada; as subseqüências sendo heterogêneas nas posiçõesvariáveis codificadas; (b) oligonucleotídeos da segunda pluralidade sãocomplementares às seqüências de nucleotídeo que codificam as subse-qüências da seqüência de aminoácido selecionada, as subseqüências sendoheterogêneas nas posições variáveis codificadas; e (c) as primeira e segun-da pluralidades compreendem oligonucleotídeos tendo seqüências de so-breposição uma com a outra; (iii) combinação da população de oligonucleo-tídeos para formar uma primeira mistura; (iv) incubação da mistura sob con-dições eficazs para hibridização das seqüências complementares de sobre-posição para formar uma pluralidade de seqüências complementares hibridi-zadas; e (v) alongamento da pluralidade de seqüências complementareshibridizadas para formar uma segunda mistura contendo a biblioteca.
Em vários exemplos: o método compreende adicionalmente rea-lizar um ciclo de desnaturação da biblioteca pelo aumento da temperatura dasegunda mistura a uma temperatura eficaz para desnaturação de DNA defilamento duplo, seguida pelas etapas (iv) e (v); o método compreende adi-cionalmente repetição do ciclo de etapas até 100 vezes; o método compre-ende adicionalmente amplificação da biblioteca por uma reação de cadeia depolimerase consistindo essencialmente da biblioteca, um iniciador de avan-ço, e um iniciador reverso, no qual os prímeres de avanço e reverso podemhibridizar para as seqüências terminais 5' e 3', respectivamente, de todos osácido nucléicos na biblioteca; os aminoácidos a serem codificados para asposições variáveis são selecionados de um subconjunto de alanina, arginina,asparagina, aspartato, cisteína, glutamina, glutamato, glicina, histidina, iso-leucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, trip-tofan, tirosina e valina; os aminoácidos selecionados para as posições variá-veis são selecionados de um grupo consistindo em pelo menos um aminoá-cido alifático, pelo menos um aminoácido acídico, pelo menos um aminoáci-do neutro, e pelo menos um aminoácido aromático; o grupo de aminoácidosconsiste em alanina, aspartato, serina e tirosina.
Os detalhes de uma ou mais concretizações da invenção sãocolocados na descrição abaixo. Outras características, objetivos e vantagensda invenção tornar-se-ão aparentes a partir da descrição e desenhos, e apartir das reivindicações.
DESCRIÇÃO DOS DESENHOS
A figura 1 é uma representação esquemática representando ageração de uma biblioteca de ácidos nucléicos que codifica polipeptídeos deligação quiméricos por diversificação de subseqüências dentro de uma se-qüência de estrutura principal de polipeptídeo codificado.
A figura 2 é um alinhamento das seqüências de um número deproteínas que têm regiões que podem ser usadas como um estrutura princi-pal. Estas proteínas são homólogas a orizacistatin. As C1, C2, C3 e C4 sãocolocadas em caixa e etiquetadas.
A figura 3 é um alinhamento das seqüências de um número deproteínas que têm regiões que podem ser usadas como um estrutura princi-pai. Estas proteínas são homólogas a C2. Os C1, C2, C3 e C4 são coloca-dos em caixa e etiquetados.
A fiaura 4 é um alinhamento das seqüências de um número deproteínas que têm regiões que podem ser usadas como um estrutura princi-pai. Estas proteínas são homólogas a orizacistatin. As C1, C2, C3 e C4 sãocolocadas em caixa e etiquetadas.
A figura 5 é um alinhamento das seqüências de um número deproteínas que têm regiões que podem ser usadas como um estrutura princi-pal. Estas proteínas são homólogas a C2. As C1, C2, C3 e C4 são coloca-das em caixa e etiquetadas.
DESCRIÇÃO DETALHADA
Diversas bibliotecas de ácidos nucléicos (por exemplo, cDNA)que codificam polipeptídeos de ligação quiméricos de planta, bem como mé-todos para gerá-las, são aqui descritos. As seqüências de aminoácido dabiblioteca de proteínas de ligação quiméricas codificadas são derivadas deuma seqüência de polipeptídeo de estrutura principal que inclui subseqüên-cias a serem variadas. As subseqüências variadas correspondem a domí-nios de ligação putativos das proteínas de ligação quiméricas de planta, esão altamente heterogêneas na biblioteca de proteínas de ligação quiméri-cas de planta. Em contraste, a seqüência das proteínas de ligação quiméri-cas codificadas fora das subseqüências variadas é essencialmente a mesmaconforme a seqüência de polipeptídeo de estrutura principal de origem, ealtamente homogênea através de toda a biblioteca de proteínas de ligaçãoquiméricas de planta codificada. Desse modo, bibliotecas de proteínas deligação quiméricas de planta podem servir como uma plataforma de bibliote-ca de reconhecimento molecular universal para seleção de proteínas de li-gação especializadas em plantas transgênicas. Bibliotecas de proteínas deligação quiméricas de planta podem ser expressas por células transfectadas(isto é, como bibliotecas de expressão) e testadas para interação com umalvo molecular de interesse. Por exemplo, bibliotecas de expressão podemser classificadas para identificar polipeptídeos que se ligam com alta especi-ficidade e afinidade à polipeptídeos expressos por pestes de planta, incluin-do nematóides. Por último, proteínas de ligação quiméricas individuais compropriedades de ligação de alvo desejadas podem ser expressas em umaplanta transgênica.
I. Seqüências de Polipeptídeo de Estrutura de planta
Uma seqüência de polipeptídeo de estrutura de planta é umaseqüência de aminoácido baseada em uma proteína de planta que é estrutu-ralmente tolerante de variação extrema de seqüência dentro de uma ou maisregiões. As regiões a serem variadas dentro da seqüência de polipeptídeode estrutura principal são conceitualmente análogas às regiões hipervariá-veis de imunoglobulinas, e formam domínios de ligação putativos em umpolipeptídeo de ligação quimérico. Desse modo, uma biblioteca grande deseqüências de ácido nucléico que codifica polipeptídeos de ligação quiméri-cos de planta diversos é produzida por diversificação de seqüências especí-ficas dentro de uma seqüência de polipeptídeo de estrutura principal, con-forme é descrito em detalhe abaixo.
As seqüências de polipeptídeo de estrutura de planta são sele-cionadas para terem um número de propriedades, por exemplo, elas: (i) sãoderivadas de seqüências que são de origem de planta; (ii) codificam proteí-nas que toleram a introdução de seqüência estruturalmente diversa; (iii) so-mente contêm ligações de dissulfeto que não interferem com desdobramentodo polipeptídeo quando expresso em uma planta; (iv) expressam em altosníveis em tecidos de planta diversos; e (v) podem ser alvo para localizaçõessubcelulares diferentes (por exemplo, citoplasma, mitocôndria, plastídeo), ousecretadas a partir da célula. Baseado nestas propriedades, as seqüênciasde polipeptídeo de estrutura de planta permitem a regeneração de grandesquantidades de polipeptídeos de ligação quiméricos com atividades de liga-ção altamente diversas. Bibliotecas de polipeptídeos de ligação quiméricospodem ser classificadas para ligação a uma molécula-alvo. Proteínas de li-gação quiméricas tendo a atividade de ligação desejada podem subseqüen-temente serem expressas em plantas para conferir traços de entrada (porexemplo, resistência à peste ou patogenia, tolerância à secura), ou traços desaída (por exemplo, composição de lipídeo modificada, ligação de metal pe-sado para fitoremediação, usos medicinais). Tais proteínas de ligação po-dem também serem usadas em várias especificações baseadas em afinida-de, por exemplo, detecção de diagnóstico de um antígeno usando um san-duíche ELISA; detecção histoquímica de antígenos; geração de biochips deproteína; e purificação de afinidade de antígenos.
É proveitoso selecionar seqüência de polipeptídeo de estruturaprincipal baseada na seqüência de uma proteína de planta ou domínio deproteína de estruturas tridimensionais conhecidas (ver, por exemplo, Nygrenet al. (2004) "Proteínas de Ligação de Estruturas principais Alternativos", J.of lmmun. Methods 290:3-28). Contudo, mesmo sem dados estruturais expe-rimentalmente determinados para uma seqüência de polipeptídeo de estrutu-ra principal potencial, inferências valiosas podem ser providas de análiseestrutural computacional de uma seqüência de aminoácido candidata. Pro-gramas úteis para prognóstico de estrutura de uma seqüência de aminoáci-do incluem, por exemplo, o conjunto "SCRATCH Protein Predictor" de pro-gramas disponíveis ao público na web mundial emecs.uci.edu/~baldgi/scratch/index. É importante que a introdução de variaçãode seqüência não desestabilize a estrutura secundária conhecida ou prog-nosticada da seqüência de polipeptídeo de estrutura principal. Conseqüen-temente, a estrutura secundária conhecida ou prognosticada da seqüênciade polipeptídeo de estrutura principal informa a seleção de subseqüênciasde aminoácido que pode ser variada dentro de uma seqüência de polipeptí-deo de estrutura principal para formar domínios de ligação putativos. A ade-quação estrutural de uma seqüência de polipeptídeo de estrutura principalpode ser prontamente testada, por exemplo, por métodos de análise de ex-pressão de revelação de fago que são comumente conhecidos na técnica.Por exemplo, uma seqüência de polipeptídeo de estrutura principal contendo0, 1, 2, 3 ou mais ligações de dissulfeto pode ser testada para sua capacida-de de se desdobrar em uma proteína estável. Desde que as proteínas quenão se desdobram corretamente não serão incorporadas em um revestimen-to de fago, elas não serão reveladas. Desse modo, sem esforço indevido,muitas seqüências de polipeptídeo de estrutura principal candidatas podemser rapidamente classificadas por sua capacidade de se desdobrar em prote-ínas estáveis uma vez expressas.
As seqüências de polipeptídeo de estrutura de planta podem serbaseadas no domínio de acessório de fosfatase ácida púrpura (PAPs). Aestrutura de cristal do domínio de acessório de feijão "kidney", Phaseolusvulgaris, foi determinada (Strater et al. (1995), Science 268 (5216): 1489-1492). Três voltas expostas dentro da proteína são recordativas dos domí-nios hipervariáveis encontrados nas imunoglobulinas. As voltas são trazidosjuntos pela estrutura de folha β anti-paralela rígida da proteína. As subse-qüências que formam cada volta a partir dos domínios de ligação putativosde uma proteína de ligação quimérica derivada de uma PAP. Estas subse-qüências são diversificadas pela substituição, retirada, inserção ou adiçãoaté 10 (por exemplo, até 3, 4, 6, 8) aminoácidos. As voltas que formam osdomínios de ligação putativos são particularmente bem-adequadas para Ii-gação de moléculas-alvo contendo bolsas ou fissuras.
As seqüências de polipeptídeo de estrutura principal baseadasem PAP tomam a fórmula geral:
C1-X1-C2"X2"C3-X3"C4
onde C1, C2, C3 e C4 correspondem às seqüências de "estrutura principal"que podem incluir alguma variação introduzida, mas não são altamente di-versificadas. Por outro lado, Xi, X2 e X3 correspondem às subseqüênciasaltamente variadas que formam os domínios de ligação putativos de cadaproteína de ligação quimérica baseada em PAP. A Tabela 1 mostra uma listade subseqüências de estrutura principal CrC4 adequadas derivadas das se-qüências de aminoácido de 30 PAPs.
C1, C2, C3 e C4Correspondem a SEQ ID NOs: 1-30, 31-60, 61-90e 91-120, respectivamente na Tabela 1.
X1, X2 e X3 podem ser baseados nas variantes que ocorrem na-turalmente de seqüências de PAP correspondentes, por exemplo, aquelasmostradas na Tabela 2 como SEQ ID Nos:121-123. A Tabela 2 mostra a va-riação de faixa de cada posição de aminoácido em subseqüências corres-pondendo, respectivamente, a Xi, X2 e X3, dentro de 30 seqüências de PAPque ocorrem naturalmente. Alternativamente, as subseqüências varáveis deorigem XrX3 podem ser seqüências arbitrárias de 2-20 aminoácidos decomprimento.
Em algumas concretizações, C1, C2, C3 e C4 de uma seqüênciade polipeptídeo de estrutura principal podem ser selecionadas de seqüên-cias de seqüência de polipeptídeo de estrutura principal baseado em PAPlistadas na Tabela 1, em qualquer combinação, por exemplo, Ci(seq id no:5),C2(sec) id no:12), C3(seq id no:7) β C4(sec) id no:19), Ci(seq id no:5), C2(sec) id no:12), C3(seqid no:5), © C4(sec) id no:12), C4(seq id no:22), Ci(seq id no:17), C2(seq id no:17), C3(seq id1 o N0:19), e C4(seq id no: 19)i e assim por diante.
Tabela 1: SPSs Baseadas no Domínio de Acessório de PAPs
<table>table see original document page 25</column></row><table>Tabela 1:-contiriuação
<table>table see original document page 26</column></row><table>
Tabela 2: Variação de Resíduo que Ocorre Naturalmente em Subseqüênciasde PAP Correspondentes a Xi1 X2 e X3 (SEQ ID Nos: 123-123)
<table>table see original document page 26</column></row><table>Após diversificação das subseqüências acima listadas da se-qüência de polipeptídeo de estrutura principal, as subseqüências Xi, X2 e X3são altamente heterogêneas dentro da biblioteca de polipeptídeos de ligaçãoquiméricos de planta codificados, e podem conter cada até 10 (por exemplo,8, 6, 4, 3) substituições, retiradas, inserções e adições de aminoácidos sim-ples com relação à SEQ ID Nos:121-123 listados na Tabela 1, respectiva-mente (ver, por exemplo, Fig. 1). Por exemplo, o comprimento das seqüên-cias de aminoácido correspondente a Xi, X2 e X3 pode ser inalterado, encur-tado ou encompridado em relação à SEQ ID Nos: 121 -123.
As regiões fora dos domínios de ligação putativos são referidascomo regiões de "estrutura principal" (isto é, Ci, C2, C3 e C4). Diferente dasseqüências de aminoácido para Xi, X2 e X3, as seqüências de aminoácidosdas regiões de estrutura principal são geralmente não diversificadas dentroda biblioteca de proteínas de ligação quiméricas codificadas, embora algumavariação de seqüência nestas regiões dentro da biblioteca seja permissível.As regiões de estrutura principal de uma seqüência de polipeptídeo de estru-tura de planta podem ser pelo menos 70% (isto é, 80, 85, 90, 95 ou 100%)idênticas a qualquer de SEQ ID Nos: 1-120. Alternativamente, as regiões deestrutura principal podem conter até 30 (isto é, 28, 26, 24, 22, 20, 18, 17, 16,15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2 ou 1) substituições, retiradas, in-serções e adições de aminoácidos simples. Por exemplo, Ci, C2, C3 e C4 po-dem cada uma incluir 0, 1, 2, 3, 4 ou 5 ou mais mudanças de aminoácidosimples. Se substituições de aminoácidos são para serem introduzidas nasregiões de estrutura principal, é preferível produzir substituições conservati-vas. Uma substituição conservativa é uma que preserva nos substituintes umaminoácido com um que tem propriedades químicas similares (por exemplo,substituição de um aminoácido polar, tal como serina, com outro aminoácidopolar, tal como treonina).
Em uma concretização, a seqüência de polipeptídeo de estrutu-ra de planta é uma de SEQ ID Nos: 124-126 mostrada abaixo. Seqüênciascorrespondentes a Xi, X2 e X3 estão em negrito e sublinhadas.SEQ ID ΝΟ:124
PPOVHITQGDHVGKAVIVSWVTMDEPGSSVWYWSENSKYKKSAEGTVTTYRFYNYTSGYiHHCYI KGLEYDTKYYYVVGIGNTSREFWFRSED ID NO: 125
PQQVHITQGDLVGKAVIVSWVTVDEPGSSEVHYWSENSDKKKIAEGKLVTYRFFNYSSGFIHHTTIRNLEYKTKYYYEVGLGNTTRQFWFVSEQ ID NO: 126
PQQVHITQGDLVGRAMIISWVTMDEPGSSAVRYWSEKNGRKRIAKGKMSTYRFFNYSSGFIHHTTIEKLKYNTKYYYEVGLRNTTRRFSFI
Em outras concretizações, uma seqüência de polipeptídeo deestrutura de planta é baseada na seqüência de aminoácido de proteínas deplanta que tem repetições similares a ankyrin. Repetições similares a ankyrinsão repetições de pequeno giro espiral-espiral (THT) consistindo em aproxi-madamente 33 aminoácidos. O número de repetições de THT dentro de umaseqüência de polipeptídeo de estrutura principal pode variar de 2 a 20. Oslocais de ligação putativos dentro das repetições de THT são tipicamentenão-contíguos, mas agrupados no mesmo lado da proteína da qual eles sãouma parte.
Uma seqüência de polipeptídeo de estrutura principal contendorepetição de THT de planta pode ter uma seqüência de aminoácido que ébaseada em qualquer de SEQ ID NOs: 127-129 listadas abaixo. Altos níveisde variação de seqüência de aminoácido são introduzidos nos resíduos emnegrito/sublinhados. As seqüências de polipeptídeo de estrutura principalcontendo repetição de THT de planta pode conter substituições de até 3 a-minoácidos, ou uma retirada no lugar dos aminoácidos correspondentes aosresíduos 12-13, 33, 35-36, 38, 46-47, 66, 68-69, 71, 79-80, 99, 101-102, 104e 112-113 (resíduos em negrito e sublinhados) de SEQ ID Nos: 127-129.SEQ ID NO: 127
GDDLGKKLHLAASRGHLEIVRVLVEAGADVNALDKFGRTALHIAASRGHLEVVKLLLEAGADVNALDKFGRTALHIAASRGHLEVVKLLLEAGADVNALDKFGDTALHVSIDNGNEDIAEILQSEQ ID NO: 128
GDDLGKKLHLAASRGHLEIVRVLVEAGADVNALDKFGRTPLHIAASKGNEQVVKLLLEAG AD PN ALDKFG RTPLH !AASKG N EQVVKLLLEAG ADPNAQDKFGDTALHVSIDNGNEDIAEILQSEQ ID NO: 129
GSDLGKKLLEAARAGQDDEVRILMANGADVNALDKFGRTPLHIAASKGNE
QVVKLLLEAGADPNALDKFGRTPLHIASKGNEQVVKLLLEAGADPNAQDKF
GKTAFDISIDNGNEDLAEILQ
A seqüência das seqüências de polipeptídeo de estrutura princi-pai pode ser pelo menos 70% (isto é, 80, 85, 90, 95, 98 ou 100%) idênticas àseqüência externa das posições de aminoácido precedentes (em negrito) deSEQ ID Nos: 127-129. Alternativamente, a seqüência das seqüências depolipeptídeo de estrutura principal externas das posições de aminoácidosprecedentes (em negrito) de SEQ ID NOS: 127-129 pode conter até 30 (istoé, 28, 26, 24, 22, 20, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2 OU1) substituições, retiradas, inserções e adições de aminoácidos simples. Emalguns casos, pode ser desejável incluir umidades de repetição adicionais.SEQ ID NOs: 127-129 tem uma capa amino-terminal, duas repetições inter-nas, e uma capa carbóxi-terminal. Pode ser desejável ter-se 1-6 repetiçõesinternas. A seqüência de capa amino-terminal é aa 1-33. A primeira repeti-ção interna é 34-66, e a segunda repetição interna é 67-99. A seqüência decapa carbóxi-terminal é aa 100-123. As primeira ou segunda repetições in-ternas, ou ambas, podem ser independentemente repetidas 1, 2, 3, 4, 5 ou 6vezes.
Os locais de ligação putativos são formados por cadeias de a-minoácido que se projetam a partir da estrutura secundária rígida formadapela seqüência de polipeptídeo de estrutura principal. Estas proteínas po-dem tipicamente formar uma superfície de ligação mais plana maior, e sãoparticularmente úteis para ligação a alvos que não tem fissuras profundas oubolsas.
Outro estrutura principal adequado pode estar baseado em ori-zacistatin (J. Biol. Chem 262:16793 (1987); Biochemistry 39: 14753 (2000)),um membro da Família cistatin/Papaína (Pfam Identifier PF00031), que éidentificado como um inibidor de cisteína proteinase de arroz. A seqüênciade orizacistatin é representada abaixo, Um estrutura principal tendo a se-qüência de aminoácido C1-X1-C2-X2-C3-X3-C4, onde cada uma de X1, X2,X3 e X4 é uma região variável, e C1, C2, C3 e C4 são as regiões de estrutu-ra principal, podem ser criado baseado em orizacistatin.
MSSVGGPVLGGVEPVGNENDLHLVFLARFAVTEHNKKANSLLEFEKLVSVKOOVVAGTLYYFTLEVKEGDAKKLYEAKVWEKPWMDFKELQEFKPVDASAN
C1-MSS (aa 1-3)X1-VGGP (aa 4-7)
C2-VLGGVEPVGNENDLHLVDLARFAVTEHNKKANSLLEFEKLVSV (aa- 8-
50)
X2-KQQVVAGT (aa 51-58)C3-LYYFTLEVKEGDAKKLYEAKVWE (aa 59-81)X3-KPWM (aa 82-85)C4-DFKELQEFKPVDASANA (aa 86-102)
A figura 2 representa as seqüências de um grande número deproteínas de planta alinhadas com orizacistatin. Exemplos de regiões C1-C4adequadas são indicados. A figura 4 representa as seqüências de um pe-queno número de proteínas de planta alinhadas com orizacistatin. Exemplosde regiões C1-C4 adequadas são indicados. Em geral, X1 pode ser uma se-qüência de 2-20 aminoácidos aleatórios (por exemplo, 3 aminoácidos). X2pode ser uma seqüência de 2-20 aminoácidos aleatórios (por exemplo, 4aminoácidos). X3 pode ser uma seqüência de 2-20 aminoácidos aleatórios(por exemplo, 4 aminoácidos).
Ainda outra adequada pode ser baseada na proteína C2 de ar-roz (Biochemistry 42:11625 (2003)), um membro da família de domínio C2(Pfam Identifier PF00168) que é pensada estar envolvida em sistemas desinalização de defesa de planta. A seqüência de C2 de arroz é representadaabaixo. Um estrutura principal tendo a seqüência de aminoácido C1-X1-C2-X2-C3-X3-C4, onde cada um de X1, X2, X3 e X4 é uma região variável e C1,C2, C3 e C4 são as regiões de estrutura principal, pode ser criado baseadona C2 de arroz.
MAGSGVLEVHLVDAKGLTGNDFLGKIDPYVVVQYESQERKSSVARDQGKNPSWNEVFKFQINSTAATGOHKLFLRLMDHDTFSRDDFLGEATINVTDLISLGMEHGTWEEMSESKHRVVLADKTYHGEIRVSLTFTASAKAQDHAEQVGGWAHSFRQ
C1 -MAGSGVLEVHLVDAKG (aa 1-16)X1 -LTGNDFLGKID (aa 17-27)C2-PYVVVQYRSQERK (aa 28-40)X2-SSVARDQGKNP (aa 41-51)
C3-SWNEVFKFQINSTAATGQHKLFLRL (aa 52-76)X3-MDHDTFSRDDFL (aa 77-88)
C4-GEATINVTDLISLGMEHGTWEMSESKWRVVLADKTYHGEIRVSLTFRASAKAQDHAEQVGGWAHSFRQ (aa 89-156)
A figura 3 representa as seqüências de um grande número deproteínas de planta alinhadas com C2 de arroz. Exemplos de regiões C1-C4adequadas são indicados. A Figura 5 representa as seqüências de um pe-queno número de proteínas de planta alinhadas com orizacistatin. Exemplosde regiões C1-C4 adequadas são indicados. Em geral, X1 pode ser uma se-qüência de 2-20 aminoácidos aleatórios (por exemplo, 11 aminoácidos). X2pode ser uma seqüência de 2-20 aminoácidos aleatórios (por exemplo, 11aminoácidos). X3 pode ser uma seqüência de 2-20 aminoácidos aleatórios(por exemplo, 12 aminoácidos).
As seguintes seções representam métodos para geração de bi-bliotecas de ácidos nucléicos que codificam proteínas de ligação quiméricasbaseadas nas seqüências de polipeptídeo de estrutura de planta.II. Geração de Bibliotecas de Ácido Nucléico baseada em uma Seqüência depolipeptídeo de estrutura de planta
Uma grande biblioteca de variantes de seqüência de ácido nu-cléico que codifica a seqüência de polipeptídeo de estrutura de planta é cria-da baseada em uma ou mais seqüências de polipeptídeo de estrutura deplanta. A biblioteca de ácidos nucléicos codificam pelo menos 5 (por exem-pio, 1.000, 105, 106, 107, 109, 1012, 1015 OU mais) seqüências de proteína deligação quimérica diferentes. É reconhecido que nem todo membro de umabiblioteca gerado pelos métodos aqui descritos codificará uma seqüência deaminoácido única. Não obstante, é desejável que pelo menos 10% (por e-xemplo, 25%, 30%, 40%, 50%, 60%, 70% ou 90%) das proteínas de ligaçãoquiméricas codificadas representadas na biblioteca sejam únicas.
Antes da diversificação de uma seqüência de polipeptídeo deestrutura de planta, pode ser útil estimar computacionalmente a diversidadede seqüência esperada a ser gerada com um dado conjunto de parâmetrosde variação de seqüência. Um método de estimar diversidade de seqüênciaé descrito, por exemplo, em Volles et al., (2005), 33(11 ):3667-3677. Por e-xemplo, o número de seqüências diferentes esperadas em uma biblioteca deácidos nucléicos gerada por PCR pode ser estimado baseado na freqüênciade mutação da polimerase mutagênica usada para a amplificação. Algorit-mos úteis para estimar diversidade de seqüência em bibliotecas de codifica-ção de proteína randomizada podem também serem encontrados na webmundial, por exemplo, em guinevere.otago.ac.nz/mlrgd/STATS/index.
Bibliotecas de ácidos nucléicos que codificam proteínas de liga-ção quiméricas de planta podem ser geradas por um número de metodologi-as conhecidas. A diversidade de seqüência é introduzida em uma seqüênciade polipeptídeo de estrutura de planta por substituição, retirada, inserção ouadição de aminoácidos em posições altamente variáveis de uma seqüênciade polipeptídeo de estrutura principal, conforme descrito acima. Desde que oconjunto de 20 aminoácidos que são geralmente codificados em plantas tempropriedades químicas e estruturais um tanto redundantes, um subconjuntode aminoácidos (por exemplo, um subconjunto de 4 tipos de aminoácidos)que envolve esta diversidade estrutural pode ser adotado para substituições.Por exemplo, aminoácidos a serem usados para substituição ou inserçãopodem ser selecionados para incluir um aminoácido acídico, um aminoácidoneutro, um aminoácido alifático, e um aminoácido aromático (ver Tabela 3).Por exemplo, os aminoácidos usados para substituição podem ser limitadosa aspartato, serina, e tirosina. A limitação da redundância de substituiçõesde aminoácido aumentará a diversidade estrutural total e de ligação da bibli-oteca de proteínas de ligação quiméricas.
<table>table see original document page 33</column></row><table>
A biblioteca de ácidos nucléicos pode ser gerada in vitro pelamontagem de conjuntos de oligonucleotídeos com seqüências complementa-res de sobreposição. Primeiro, uma seqüência de seqüência de polipeptídeode estrutura principal é selecionada que é para ser codificada por conjuntosde oligonucleotídeos montados. As seqüências a serem codificadas nas re-giões variáveis de uma dada seqüência de polipeptídeo de estrutura princi-pal incluirão uma multiplicidade de seqüências heterogêneas contendo subs-tituições, inserções, retiradas e adições de acordo com a biblioteca de peptí-deos de ligação quiméricos a ser gerada conforme descrito acima. As se-qüências de polipeptídeo de estrutura principal a serem codificadas incluemsubseqüências CrC4 correspondentes a qualquer de SEQ ID Nos:1-30, 31-60, 61-90 e 91-120, respectivamente.
Um conjunto de oligonucleotídeos codifica regiões da seqüênciade polipeptídeo de estrutura de planta onde diversidade é para ser introduzi-da (por exemplo, em Xi, X2 e X3). Em contraste, regiões da seqüência depolipeptídeo de estrutura principal na qual pouco ou nenhuma variação épara ser introduzida (por exemplo, nos domínios de estrutura principal deseqüências de polipeptídeo de estrutura principal de PAP) são codificadaspor um conjunto de oligonucleotídeos que codificam seqüências de aminoá-cido com não menos do que 70% (isto é, 75%, 80%, 85%, 90%, 95% ou100%) de identidade para qualquer uma das seqüências de polipeptídeo deestrutura principal acima mencionadas. Os detalhes deste método são des-critos, por exemplo, na Patente dos Estados Unidos N0 6.521.453, dessemodo incorporada por referência.
Oligonucleotídeos de seqüência variada usados para gerar bibli-otecas de ácidos nudéicos são tipicamente sintetizados quimicamente deacordo com o método de fosforaramidite triéster de fase sólida descrito porBeaucage e Caruthers (1981), Tetrahedron Metts., 22(20): 1859-1862, porexemplo, usando-se um sintetizador automático, conforme descrito em Nee-dham-VanDevanter et al. (1984) Nucleic Acids Res., 12:6159-6168. Umaampla variedade de equipamento é comercialmente disponível para sínteseautomática de oligonucleotídeo. Aproximações de síntese de multinucleotí-deos (por exemplo, síntese de trinucleotídeos), conforme discutidas supra,são também úteis.
Ácidos nucléicos podem ser ordenados costumeiramente deuma variedade de fontes comerciais, tais como Sigma-Genosys (em sigma-genosys.com/oligo.asp); The Midland Certified Reagent Companyimcrc@aliaos.com), The Great American Gene Company (em genco.com),ExpressGen Inc. (em expressgen.com), Operon Technologies Inc. (Alameda,Calif), e muitos outros.
Os oligonucleotídeos podem ter um uso de códon otimizado pa-ra expressão em um tipo de célula particular (por exemplo, em uma célula deplanta, uma célula de mamífero, uma célula de levedura, ou uma célula bac-terial). Tabelas de freqüência de uso de códon são publicamente disponí-veis, por exemplo, na web mundial em kazusa.or.jp/codon. Inclinação de có-don pode ser usada para otimizar expressão em uma célula ou na superfíciede uma célula em que ligação de uma proteína de ligação quimérica de plan-ta é para ser avaliada, e pode também ser usada para otimizar expressão daproteína de ligação quimérica em um organismo transgênico de interessecomercial (por exemplo, uma planta transgênica). Em geral, códons comuma freqüência de uso de menos do que 10% não são usados. Antes dasíntese de seqüências de oligonucleotídeos serem verificadas para seqüên-cias potencialmente problemáticas, por exemplo, locais de restrição úteispara subclonagem, locais aceptores ou doadores de união de planta (ver,por exemplo, cbs.dtu.dk/services/FeatureExtract/), seqüências de desestabi-lização de mRNA potenciais (por exemplo, "ATTTA"), e extensões de maisdo que quatro ocorrências do mesmo nucleotídeo. Seqüências potencial-mente problemáticas são, Conseqijentementei mudadas=
Populações de oligonucleotídeos são sintetizadas que codificamvariações de aminoácido nas regiões de ligação putativas da seqüência depolipeptídeo de estrutura principal selecionada (por exemplo, nas regiões X1lX2 e X3 de uma seqüência de polipeptídeo de estrutura principal de PAP).
Preferivelmente, todos os oligonucleotídeos de um comprimentoselecionado (por exemplo, cerca de 10, 12, 15, 20, 30, 40, 50, 60, 70, 80, 90ou 100 ou mais nucleotídeos) que correspondem a regiões onde diversidadede seqüência é para ser introduzida na seqüência de polipeptídeo de estru-tura principal codificam todas as variações de aminoácido possíveis de umconjunto diverso de aminoácidos, conforme descrito acima. Isto inclui N oli-gonucleotídeos por N variações de seqüência, onde N é o número de se-qüências diferentes em um local. Os N oligonucleotídeos são idênticos emseqüência, exceto para o(s) nucleotídeo(s) que codifica(m) o(s) aminoáci-do(s) variante(s). Na geração dos oligonucleotídeos de seqüência variada,pode ser vantajoso utilizar estratégias de síntese paralelas ou reunidas nasquais reação de síntese simples ou conjunto de reagentes são usados paraproduzir porções comuns de cada oligonucleotídeo. Isto pode ser realizado,por exemplo, por técnicas de síntese de ácido nucléico de fase sólida bemconhecidas, ou, por exemplo, utilizando métodos sintéticos de oligonucleotí-deo baseados em série (por exemplo, Fodor et al., (1991) Science, 251:767-777; Fodor (1997) "Genes, Chips and the Human Genome" FASEB Journal.11:121-121; Fodor (1997) "Massively Paralell Genomics" Science. 277:393-395; e Chee et al., (1996) "Acessing Genetic Information with High-DensityDNA Arrays" Science 274:610-614).
Em estratégias de síntese típicas, os oligonucleotídeos têm pelomenos cerca de 10 bases de identidade de seqüência em qualquer lado deuma região de diferença para assegurar recombinação razoavelmente efici-ente. Contudo, regiões de flanqueamento com bases idênticas podem terpoucas bases idênticas (por exemplo, 4, 4, 6, 7, 8 ou 9) e podem, natural-mente, ter regiões maiores de identidade (por exemplo, 1, 12, 13, 14, 15, 16,17, 18, 19, 20, 25, 30, 50, ou mais).
Os oügonucleotídeos a serem montados juntos são incubadospara permitir hibridização entre oügonucleotídeos contendo seqüênciascomplementares de sobreposição. Cada conjunto de hibridização de oügo-nucleotídeos de sobreposição forma, desse modo, um ácido nucléico contí-guo interrompido por pequenas folgas. Estas folgas pequenas podem serpreenchidas para formar seqüências de comprimento total usando qualquerde uma variedade de métodos de remontagem mediados por polimerase,por exemplo, conforme descritos aqui, e conforme conhecidos a um técnicono assunto. A maior diversidade de freqüência é introduzida em oügonucleo-tídeos que codificam as regiões e resíduos de ligação putativos de seqüên-cia de polipeptídeo de estrutura de planta. Contudo, oügonucleotídeos quecodificam variações de seqüência específicas podem ser "bloqueados" namistura de recombinação em qualquer concentração selecionada, causando,desse modo, incorporação preferencial de modificações desejáveis nas pro-teínas de ligação quiméricas de planta codificadas em regiões fora dos do-mínios de ligação putativos.
Por exemplo, durante alongamento do oligonucleotídeo, oligo-nucleotídeos hibridizados são incubados na presença de uma polimerase deácido nucléico, por exemplo, Taq, Klenow, ou similares, e dNTPs (isto é,dATP, dCTP, dGTP e dTTP). Se regiões de identidade de seqüência sãograndes, Taq ou outra polimerase de alta temperatura podem ser usadoscom uma temperatura de hibridização de entre cerca de temperatura ambi-ente (isto é, cerca de 25°C) e, por exemplo, cerca de 65°C. Se as áreas deidentidade são pequenas, Klenow, Taq ou polimerases podem ser usadoscom uma temperatura de hibridização de abaixo da temperatura ambiente. Apolimerase pode ser adicionada à reação de montagem antes de, simultane-amente com, ou após hibridização dos oügonucleotídeos. Em seguida, asseqüências de ácido nucléico de filamento duplo resultante são desnatura-das, hibridizadas e alongadas novamente. Este ciclo pode ser repetido porqualquer número desejado de vezes. O ciclo é repetido, por exemplo, decerca de 2 a cerca de 100 vezes.
Opcionalmente, após ciclos múltiplos de montagem de ácidonucléico combinatorial, os produtos resultantes podem ser amplificados, porexemplo, por reação de cadeia polimerase padrão (PCR). Uma porção dovolume da reação de montagem acima descrita é incubada com prímeres deavanço e reverso únicos que hibridizam universalmente para as extremida-des dos ácidos nucléicos, bem como dNTPs e uma polimerase adequada(por exemplo, polimerase pfu). A reação de PCR é, em seguida, efetuadapor cerca de 10 a 40 ciclos.
Para determinar a extensão de incorporação de oligonucleotí-deo, qualquer aproximação que distingue ácidos nucléicos similares podeser usada. Por exemplo, os ácidos nucléicos podem ser clonados e seqüen-ciados, ou amplificados (in vitro, ou por clonagem, por exemplo, em um vetorde clonagem ou expressão padrão), e clivados com uma enzima de restriçãoque reconhece especificamente uma variante de seqüência de oligonucleotí-deo particular.
É útil incluir locais de restrição raros (por exemplo, Not I) nasextremidades 5' dos prímeres 5' e 3' usados, ou na montagem, ou reaçõesde PCR. A inclusão de locais de restrição nestes prímeres facilita subclona-gem dos ácidos nucléicos em um vetor por digestão de restrição e ligaçãosubseqüente. Alternativamente, a reação de montagem ou produtos de PCRpodem também serem clonados, sem serem digeridas por restrição, usando-se métodos padrões, por exemplo, clonagem "TA".
Outros métodos para introdução de diversidade em uma se-qüência de polipeptídeo de estrutura de planta podem também serem usa-dos. Por exemplo, uma seqüência de polipeptídeo de estrutura principal po-de ser codificada em um gabarito de ácido nucléico, por exemplo, uma cons-trução de plasmídeo. Alternativamente, um produto de PCR, mRNA ou DNAgenômico de uma espécie de planta apropriada, tal como feijão-soja, podetambém servir como um gabarito que codifica uma seqüência de polipeptí-deo de estrutura de planta. Uma ou mais subseqüências de seqüência depolipeptídeo de estrutura principal a serem diversificadas (por exemplo, aregião X2 de uma seqüência de polipeptídeo de estrutura principal de PAP)podem ser diversificadas durante ou após amplificação a partir do gabaritode ácido nucléico de seqüência de polipeptídeo de estrutura principal porqualquer de um número de métodos de PCR propensos a erro. Os métodosde PCR propensos a erro podem ser divididos em (a) métodos que reduzema fidelidade da polimerase por concentração de nucleotídeos não-equilibradas e/ou adição de composto quimérico, tais como cloreto de man-ganês (ver, por exemplo, Lin-Goerke et al. (1997) Biotechniques, 23, 409-412), (b) métodos que empregam análogos de nucleotídeo (ver, por exem-pio, Patente dos Estados Unidos N0 6.153.745), (c) métodos que utilizampolimerases 'mutagênicas' (ver, por exemplo, Cline, J. e Hogrefe, Η. H.(2000) Strategies (Stratagene Newsletter), 13, 157-161, e (d) métodos com-binados (ver, por exemplo, Xu, H., Petersen, E.I., Petersen, S.B. e el-Gewely, M. R. (1999) Biotechniques, 27, 1102-1108. Outros métodos basea-dos em PCR incluem aqueles, por exemplo, descritos por Osuna J, Yanes J,Soberon X, e Gaytan P. (2004), Nucieic Acids Res. 2004, 32(17):e136 eWong TS, Tee KL, Hauer B, e Schwaneberg Nucleic Aeids Res. 2004 Fev10; 32(3):e26), e outros conhecidos na técnica.
Após gerar uma população de variantes de seqüência, estaspodem ser substituídas na região apropriada de um ácido de nucléico deseqüência de polipeptídeo de estrutura de planta escolhido (por exemplo, umplasmídeo contendo uma seqüência de polipeptídeo de estrutura principal)por subclonagem que, desse modo, age eficazmente como um vetor para abiblioteca de seqüências diversificadas.
Ainda outra aproximação para mutagênese de regiões de se-qüência de polipeptídeo de estrutura de planta específicas é o uso de umacepa mutagênica de E. co//'(ver, por exemplo, Wu et al., (1999), Plant. MoiBiol., 39(2):381-386). Um vetor de ácido nucléico contendo uma seqüênciaalvo a ser mudado é introduzido na cepa de mudança, que é em seguida,propagada. A replicação de DNA propensa a erro na cepa de mudança de E.eoli introduz mutações na seqüência alvo introduzida. A população de se-qüências alvo alteradas é, em seguida, recuperada e subclonada na posiçãoapropriada de um ácido nucléico que codifica a seqüência de polipeptídeo deestrutura de planta selecionada para gerar uma biblioteca diversa de ácidosnucléicos que codificam proteínas de ligação quiméricas de planta.
III. Expressão e Classificação de Proteínas de ligação auiméricas de planta
A biblioteca de ácidos nucléicos baseada em uma seqüência depolipeptídeo de estrutura de planta, e que codifica polipeptídeos de ligaçãoquiméricos de planta são subclonados em um vetor de expressão e introdu-zidos em um sistema de replicação biológico para gerar uma biblioteca deexpressão. A biblioteca de expressão pode ser propagada e classificada pa-ra identificar proteínas de ligação quiméricas de planta que se ligam a umamolécula-alvo (TM) de interesse (por exemplo, um nematóide, inseto, fun-gos, proteína viral ou de planta).
O sistema de replicação biológico em que classificação de prote-ínas de ligação quiméricas de planta será praticada deve ser capaz de cres-cer em um ambiente adequado, após seleção para ligação a um alvo. Alter-nativamente, o ácido nucléico que codifica a proteína de ligação quiméricade planta selecionada pode ser isolado por amplificação in vitro. Durantepelo menos parte do crescimento do sistema de replicação biológico, o au-mento no número é preferivelmente e aproximadamente exponencial comrelação ao tempo. A freqüência de membros da biblioteca que exibe as pro-priedades de ligação desejadas pode ser muito baixa, por exemplo, uma em106 ou menos.
Os sistemas de replicação biológicos podem ser vírus de DNAbacterial, células bacteriais vegetativas, esporos bacteriais. Células eucarió-ticas (por exemplo, células de levedura) podem também ser usadas comoum sistema de replicação biológico.
Em uma concretização particularmente útil, uma fusão de prote-ína de ligação quimérica-proteína de revestimento de fago é codificada emum constructo de fagos médios. Os constructos de fagos médios são trans-formados em bactérias hospedeiras, que são subseqüentemente infectadascom um fago auxiliador que expressa proteínas de revestimento tipo selva-gem. A progenia de fago resultante tem revestimentos de proteína que inclu-em ambas proteína de fusão e proteínas de revestimento tipo selvagem. Es-ta aproximação tem a vantagem que a viabilidade de fago é maior compara-da à viabilidade de fago que tem exclusivamente proteína de ligação quimé-rica-proteína de fusão de revestimento. Construção de biblioteca de revela-ção baseada em fagos médios e kits de classificação são comercialmentedisponíveis, por exemplo, the EZnet® Phage Display cDNA Library Construc-tion Kit and Screening Kit (Maxim Biotech, Inc., San Francisco, CA).
Não obstante, uma cepa de qualquer célula viva ou vírus é po-tencialmente útil se a cepa pode ser: 1) geneticamente alterada com facili-dade razoável para codificar uma proteína de ligação quimérica de planta, 2)mantida e amplificada na cultura, 3) manipulada para mostrar o domínio deproteína de ligação potencial onde ela pode interagir com o material alvo, e4) selecionada, enquanto retém a informação genética que codifica a proteí-na de ligação quimérica de planta expressa na forma recuperável. Preferi-velmente, o sistema de replicação biológico permanece visível após seleçãobaseada em afinidade.
Quando o sistema de replicação biológico é uma célula bacterialou um fago que é montado no periplasma, o vetor de expressão para revela-ção da proteína de ligação quimérica de planta codifica a própria proteína deligação quimérica fundida a dois componentes adicionais. O primeiro com-ponente é um sinal de secreção que direciona o produto de expressão inicialpara a membrana interna da célula (uma célula hospedeira quando o acon-dicionamento é um fago). Este sinal de secreção é clivado por uma peptida-se de sinal para produzir uma proteína de ligação quimérica de planta pro-cessada madura. O segundo componente é um sinal de transporte de super-fície externa que direciona o sistema de replicação biológico para montar aproteína processada em sua superfície externa. Este sinal de transporte desuperfície externa pode ser derivado de uma proteína de superfície nativa aosistema de replicação biológico (por exemplo, a proteína glll de revestimentode fago M13).
Por exemplo, o vetor de expressão compreende um DNA quecodifica uma proteína de ligação quimérica de planta operavelmente ligada auma seqüência de sinal (por exemplo, as seqüências de sinal do phoA bac-terial ou genes bla, ou a seqüência de sinal de gene Ill de fago M13), e aoDNA que codifica uma proteína de revestimento (por exemplo, o gene NlM13 ou proteínas Vlll de gene) de um fago filamentoso (por exemplo, M13).
O produto de expressão é transportado para a membrana interna (bicamadade lipídeo) da célula hospedeira, onde o peptídeo de sinal é clivado paradeixar uma proteína híbrida processada. O terminal C do componente similarà proteína de revestimento desta proteína híbrida está preso na bicamada delipídeo, de modo que a proteína híbrida não escapa no espaço periplásmico.
À medida que o DNA de filamento simples da partícula de fago nascentepassa no espaço periplásmico, ele coleta ambas a proteína de revestimentotipo selvagem e a proteína híbrida a partir da bicamada de lipídeo. A proteí-na híbrida é, desse modo, acondicionada na blindagem da superfície do fagofilamentoso, deixando a proteína de ligação quimérica de planta exposta emsua superfície externa. Desse modo, o fago filamentoso, não a célula bacte-rial hospedeira, é o sistema de replicação biológico nesta concretização. Seum sinal de secreção é necessário para a revelação da proteína de ligaçãoquimérica de planta, uma cepa bacterial de "secreção permissiva" pode serusada para crescimento do sistema de replicação biológico de fago filamen-toso.
É desnecessário usar um sinal de secreção de membrana inter-na quando o sistema de replicação biológico é um esporo bacterial, ou umfago cujo revestimento é montado intracelularmente. Nestes casos, o meiode revelação é meramente o sinal de transporte de superfície externa, tipi-camente de uma proteína de revestimento de esporo e de fago.
Os fagos filamentosos em geral são atrativos como sistemas dereplicação biológicos para revelação de proteína de ligação quimérica deplanta, e M13 em particular, é especialmente atrativo por que: 1) a estrutura3D do virion é conhecida; 2) o processamento da proteína de revestimento ébem compreendida; 3) o genoma é expansível; 4) o genoma é pequeno; 5) aseqüência do genoma é conhecida; 6) o virion é tipicamente resistente a ci-salhamento, calor, frio, uréia, guanidínio Cl, baixo pH, e alto sal; 7) o fago éum vetor de seqüenciamento de modo que o seqüenciamento é especial-mente fácil; 8) genes resistentes a antibióticos foram clonados no genoma;9) É facilmente cultivado e armazenado, com requerimentos de meio nãousuais e custosos para as células infectadas; 10) tem uma dimensão de rup-tura alta, cada célula infectada produzindo 100 a 1000 progenias de M13após infecção; e 11) é facilmente colhido e concentrado por métodos pa-drões.
Por exemplo, quando o sistema de replicação biológico é M13,as proteínas de gene Ill ou de gene Vlll podem ser usadas como um sinal dealvo de superfície externa. Alternativamente, as proteínas de genes VI, Vll eIX podem também serem usadas.
A proteína de ligação quimérica de planta codificada pode serfundida ao sinal de alvo de superfície (por exemplo, a proteína de revesti-mento de gene Ill M13) em seu carbóxi ou amino terminal. O limite de fusãoentre a proteína de ligação quimérica de planta e o sinal de alvo pode tam-bém incluir uma seqüência Iigadora curta (por exemplo, até 20 aminoácidosde comprimento) para evitar interações indesejáveis entre proteína de liga-ção quimérica e o sinal de alvo fundido. Em algumas concretizações, é van-tajoso incluir dentro da seqüência Iigadora um local de clivagem proteolíticoespecífico. Em adição, o amino terminal ou carbóxi terminal da proteína fun-dida podem incluir uma etiqueta de epítopo curta (por exemplo, etiqueta dehemaglutinina). A inclusão de um local de clivagem proteolítico ou uma eti-queta de epítopo curta é particularmente útil para purificação de uma biblio-teca de proteínas de ligação quiméricas de uma população de células queexpressa a biblioteca. Proteínas de ligação quiméricas etiquetadas de epíto-po podem ser convenientemente purificadas pela clivagem proteolítica deseqüência ligadora, seguida por cromatografia de afinidade utilizando umanticorpo ou outro agente de ligação que reconhece a etiqueta de epítopo.
Muitos métodos existem para classificação de bibliotecas derevelação de fago (ver, por exemplo, Willats (2002), Plant Moi Biol., 50:837-854). Conforme comumente praticado, a molécula-alvo de interesse é adsor-vida em um estrutura principal e,em seguida,exposta a soluções de proteí-nas de ligação quiméricas de planta que revelam fago. A molécula-alvo podeser imobilizada por adsorção passiva em um meio de estrutura principal, porexemplo, tubos, placas, colunas, ou gotas magnéticas. Geralmente, o meiode estrutura principal adsortivo é pré-bloqueado, por exemplo, com albuminade soro bovino, leite, ou gelatina, para reduzir ligação não-específica do fagodurante classificação. Alternativamente, a molécula-alvo pode ser biotinilata-da, de modo que interação entre fago suportando proteína de ligação quimé-rica e a molécula-alvo pode ser efetuada em solução. O fago que se liga aoalvo pode então ser selecionado usando-se avidina ou estreptavidina ligadoa um substrato sólido (por exemplo, gotas ou coluna).
Após os fagos serem permitidos interagirem com a molécula-alvo, os fagos não-interados são removidos por lavagem. Os fagos de liga-ção especificamente remanescentes são, então, eluídos por um de qualquernúmero de tratamento incluindo, por exemplo, abaixamento ou aumento dopH, aplicação de agentes de redução, ou uso de detergentes. Em uma con-cretização, um local de clivagem proteolítico específico é introduzido entre aseqüência de proteína de ligação quimérica de planta e a seqüência de pro-teína de revestimento de fago. Desse modo, eluição de fago pode ser efetu-ada simplesmente pela adição da protease apropriada.
Os fagos eluídos são, então, amplificados pela infecção de célu-las hospedeiras, e podem substancialmente serem reclassificados pelo mé-todo já esboçado para reduzir o número de Iigantes positivos falsos. Durantecada etapa de classificação de fago, cuidado deve ser tomado para incluircrescimento dos fagos em um meio sólido preferivelmente do que exclusi-vãmente em um meio líquido à medida que este minimiza perda de clonesde fagos que crescem subotimamente.
As proteínas de ligação quiméricas de planta podem tambémserem expressas e classificadas para ligação somente in vitro usando-serevelação ribossomal. Uma aproximação exclusivamente in vitro tira vanta-gem do requerimento de introduzir a biblioteca de ácido nucléicos que codifi-ca proteínas de ligação quiméricas de planta em um sistema de replicaçãobiológico. Métodos de classificação de polipeptídeos in vitro por revelação deproteína ribossomal são descritos em detalhes, por exemplo, na Patente dosEstados Unidos N2 6.589.741. Os ácidos nucléicos na seção acima são mo-dificados por adição de uma seqüência promotora de fagos (por exemplo,um promotor T7) que capacita transcrição in vitro, uma seqüência de ligaçãoribossomal a montante ao início de translação da proteína de ligação quimé-rica de planta, e uma seqüência de terminação de transcrição (por exemplo,de fagos T3). A biblioteca modificada de ácidos nucléicos é, então, transcritain vitro para gerar uma população de mRNA correspondente que codificaproteínas de ligação quiméricas de planta. As proteínas de ligação quiméri-cas de planta são, então, expressas in vitro pela translação da população demoléculas de mRNA destituídas de códons de parada na estrutura de leituracorreta em um sistema de translação in vitro, sob condições que permitem aformação de polissomas. Os polissomas assim formados são então trazidosem contato com uma molécula-alvo sob condições que permitem a interaçãode proteínas de ligação quiméricas de planta com a molécula-alvo. Os polis-somas que revelam proteínas de ligação quiméricas que interagem com amolécula-alvo são então separados dos polissomas não-interados que nãorevelam tais (poli)peptídeos; e o mRNA associado com o polissoma de inte-ração é então amplificado (por exemplo, por PCR), e seqüenciado.
A interação de uma proteína de ligação quimérica de planta comuma proteína alvo pode também ser detectada em uma classificação genéti-ca. Na classificação, a proteína alvo funciona como uma "proteína de isca", ecada proteína de ligação quimérica de planta funciona como uma proteína"prey" potencial em um ensaio de ligação que utiliza um ensaio de dois hí-bridos, ou ensaio de três híbridos (ver, por exemplo, Patente dos EstadosUnidos N0 5.283.317; Zervos et al., (1993) Cell 72:223-232; Madura et al.,(1993) J. Biol. Chem. 268:12046-12054; Bartel et al. (1993) Biotechniques14:920-924; Iwabuchi et al., (1993) Oncogene 8:1693-1696; Hubsman et al.,(2001) Nuc. Acids fíes. Fev 15; 29(4): E18, e Brent W094/10300).
Um ensaio de dois híbridos pode ser efetuado usando-se umpolipeptídeo alvo como a proteína de isca. Em resumo, o polipeptídeo alvo éfundido ao domínio de ligação de LexA DNA, e usado como isca. O "prey "ébiblioteca de proteína de ligação quimérica de planta clonada na volta delocal ativo de TrxA como uma proteína de fusão com um sinal de localizaçãonuclear N-terminal, um domínio de ativação LexA, e uma etiqueta de epítopo(Colas et al., 1996 Nature 380:548; e Gyuris et al, Cell 1993 75:791). Célulasde levedura são transformadas com genes de isca e "prey". Quando a prote-ína de fusão alvo se liga a uma proteína de fusão de proteína de ligaçãoquimérica de planta, o domínio de ativação LexA é trazido em proximidadecom o domínio de ligação de LexA DNA e expressão de genes relatores ougenes marcadores selecionáveis tendo um aumento de local de ligação Le-xA apropriadamente posicionado. Genes relatores adequados incluem prote-ínas fluorescentes (por exemplo, EGFP), enzimas (por exemplo, luciferase,β-galactosidase, fosfatase alcalina, etc). Genes marcadores selecionáveisadequados incluem, por exemplo, o gene LEU2 de levedura.
Após identificação de uma ou mais proteínas de ligação quimé-ricas de ligação alvo, os ácidos nucléicos isolados que codificam as proteí-nas de ligação quiméricas podem ser mutagenizados pelos métodos aquidescritos, para gerar bibliotecas de expressão pequenas que expressamproteínas de ligação quiméricas variantes. As proteínas de ligação quiméri-cas-bibliotecas de expressão variantes podem ser classificadas para identifi-car variantes de proteína de ligação quimérica com propriedades de ligaçãoalvo aperfeiçoadas (por exemplo, afinidade ou especificidade aumentadas).
Os seguintes exemplos específicos são para serem construídoscomo meramente ilustrativos, e mão Iimitativos do restante da descrição.Sem elaboração adicional, acredita-se que um técnico no assunto pode, ba-seado na descrição aqui, utilizar a presente invenção na sua extensão maiscompleta. Todas as publicações aqui citadas são, desse modo, incorporadaspor referência em sua totalidade.
EXEMPLOS
Exemplo 1 Desenho e Expressão de Seqüências de Polipeptídeo de Estrutu-ra de planta
Várias famílias de domínio de proteína foram analisadas paraseu uso potencial como estruturas principais. Uma pesquisa de domínios dePFAM (pfam.wustl.edu; ver Bateman et al (2004)), restringindo a saída paraViridiplantae, foi conduzida para limitar domínios somente para aqueles pre-sentes em plantas verdes. Quatro famílias de domínio de proteína foram se-lecionadas para desenvolver bibliotecas de reconhecimento molecular uni-versai de planta; o domínio de acessório de fosfatase ácida púrpura (PAP),domínios C2 de planta, e o motivo de volta espiral-espiral (THT) encontradoem proteínas de repetição de ankyrin.
Três estruturas principais de fosfatase ácida púrpura foram de-signados tendo a seqüência de SEQ ID NOs:34-36. A seqüência de aminoá-cido do domínio de acessório de PAP de feijão "kidney" foi usada como umaseqüência de consulta para BLAST1 à base de dados NCBI. Quando a saídaé restringida às proteínas encontradas em Viridiplanteae, 62 seqüências úni-cas foram identificadas. A partir de um alinhamento destas seqüências, umaseqüência de PAP de planta de consenso foi gerada (SEQ ID NO:34) pelaseleção do aminoácido mais freqüente em cada posição no alinhamento, OPAP de feijão "kidney" (Phaseolus vulgaris) foi selecionado como um estru-tura principal parenteral (SEQ ID NO:35), devido à sua estrutura conhecida.Um PAP de feijão-soja, Glycine max, foi também escolhido (SEQ ID NO:36),conforme esta espécie representa um espécie de colheita comum em queprodutos transgênicos são gerados.
Um conjunto de seqüências de polipeptídeo de estrutura princi-pal que contém repetições similares a ankyrin de planta foi também designa-do. Repetições similares a ankyrin são motivos de volta espiral-espiral (THH)consistindo em aproximadamente 33 aminoácidos. Elas são elementos co-muns de proteínas de todos os organismos, e são freqüentemente encontra-das em séries em tandem de 2 a 20 repetições dentro de uma proteína.
Três estruturas principais de THH foram gerados. Estas proteí-nas são similares na estrutura a proteína de ligação de GA (GABP-β). Estaproteína consiste em capas amino e carbóxi terminal similares a THH com 3repetições internas de THH. Nesta proteína, é pensado que as capas aju-dam a estabilizar a proteína por blindagem dos resíduos hidrofóbicos encon-trados ns repetições internas.Trezentas e doze repetições de ankyrin de Viridiplantae encon-tradas em PFMA foram alinhadas para auxiliar na designação de estruturasprincipais de THH específicos de planta. Uma seqüência de THH de consen-so de planta foi gerada pela seleção do aminoácido que ocorre mais fre-qüentemente em cada posição. Esta seqüência foi denominada a seqüênciade repetição interna de consenso de planta. Esta seqüência foi usada parapesquisar as bases de dados NCBI por alinhamento de BLAST para encon-trar a seqüência de THH natural mais próxima encontrada nas plantas. Umaseqüência de trigo (Triticum aestivum) foi encontrada. A repetição designadabaseada em T. aestivum contém uma substituição de valina para a cisteínasimples que ocorre na seqüência de T. aestivum. Um conjunto consiste emseqüências derivadas de GABP-β e o segundo conjunto foi derivado a partirda seqüência de consenso de THH de planta, e otimizado para assemelhar-se às estruturas de GABP-β. Em particular, a capa N-terminal tem uma es-trutura alfa-espiral estendida, enquanto a capa C-terminal tem uma espiraltruncada comparada à repetição de THH típica.
Três estruturas principais de THH foram designados, um consis-te em capas N e C de consenso de planta e duas repetições de THH inter-nas de consenso (SEQ ID NO:37). Outro consiste em capas N e C de con-senso de planta e duas repetições internas de trigo (SEQ ID NO:38), e o ter-ceiro consiste em capas NeC similares a ankyrin com duas repetições in-ternas de trigo (SEQ ID NO:39).
Os genes que codificam as seqüências de polipeptídeo de estru-tura de planta foram designados para teste de expressão em plantas, bacté-rias, e na superfície de fagos. Os códons foram selecionados para expres-são de planta usando uma tabela de uso de códon Glycina max publicamen-te disponível (em kazusa.or.jp/codon, uso de códon tabulado das bases dedados de seqüência de DNA internacional: estado para o ano 2000. Naka-mura, Y, Gojobori, T e lkemura, T (2000) Nuci Aeids Res. 28:292). A sele-ção de códon foi feita manualmente com o auxílio da freqüência de códonfinal para refletir brutamente a freqüência natural para Glyeine max. Códonsraramente usados (<10% de freqüência) não foram usados. As seqüênciasfinais foram verificadas para seqüências problemáticas potenciais, incluindoremoção de locais de restrição necessários para clonagem, locais receptoresou doadores de união de planta potenciais (ver website em cbs.dtu.dk/ servi-ces/NetPgene/), seqüências de desestabilização potenciais (ATTTA), e ex-tensões de mais do que 4 ocorrências do mesmo nucleotídeo. Quaisquerseqüências problemáticas potenciais foram alteradas nos genes pela modifi-cação de uso de códon. Desde que as seqüências de THH têm 4 seqüênciasde repetição similares dentro de cada proteína, às etapas foram tomadaspara reduzir similaridade de nucleotídeo dentro das repetições; a identidadede repetição média foi reduzida 10-15% por estes meios.
Sete constructos foram produzidas usando-se montagem degene (três baseadas nas seqüências de polipeptídeo de estrutura principalde THH1 duas baseadas nas seqüências de polipeptídeo de estrutura princi-pal de PAP, uma cistatina de planta, e uma proteína de domínio C2 de plan-ta). As três seqüências de polipeptídeo de estrutura principal de THH foramcolocadas em um vetor de fagos médios como seqüências de fusão com aproteína de revestimento Ill de gene (glll) em seu terminal carbóxi (Phage3.2, Maxim Biotech, lnc, South San Francisco, CA). Uma etiqueta 6-His foiincluída na extremidade 5' do gene, bem como uma etiqueta c-Myc entre ogene de estrutura principal e o terminal amino codificado de glll. Os cons-tructos de fagos médios foram então acondicionadas, e os fagos foram tes-tados para expressão e revelação de superfície do estrutura principal deTHH. Um fago ELISA usando ou anti-His e anti-Myc indicou que as proteínasde estrutura principal de THH foram expressas na superfície de fagos emfagos ELISA, sugerindo que todos os três constructos de seqüências de po-lipeptídeo de estrutura principal de THH se desdobraram e expressaram bemna superfície dos fagos. As seqüências de polipeptídeo de estrutura principalselecionadas foram então usadas para gerar vetores de expressão para ava-liar sua expressão em plantas transgênicas por imunomanchamento.
Folhas de tabaco foram injetadas com agrobacterium, LB4404transformadas com vetores de expressão de planta contendo THH. Dois diasdepois, seções de folhas injetadas com agrobacterium foram colhidas, con-geladas em gelo seco, em seguida moídas em um pó fino com um pilão.PBS contendo 0,2% de Tween-20 foi adicionado ao pó fino em uma razão depeso para volume de 1:1, e moagem adiciona! foi feita. O material insolúvelfoi removido por centrifugação, e 10 ul do sobrenadante remanescente foicarregado em 4-12% de gel page SDS de acrilamida (Nupage, Invitrogen).As proteínas foram transferidas para membranas de PVDF. As proteínasforam detectadas usando-se um anticorpo HA-anti-rato (Rochet) e um anti-corpo secundário conjugado HRP anti-rato (Chemicon). HPR foi detectadousando-se reagentes Amerham Lumigen.
Todos os três estruturas principais de THH foram encontradospara serem expressos, com o nível relativo de expressão dos três estruturasprincipais sendo TA-THH> CC-THH> TC-THH.
OUTRAS CONCRETIZAÇÕES
Todas as características reveladas neste relatório podem sercombinadas em qualquer combinação. Cada característica revelada nesterelatório pode ser substituída por uma característica alternativa que servepara a mesma ou proposta equivalente. Desse modo, a menos que expres-samente de outro modo citado, cada característica revelada é somente umexemplo de uma série genérica de características equivalentes ou similares.
A partir da descrição acima, um técnico no assunto pode facil-mente determinar as características essenciais da presente invenção, e semfugir do espírito e escopo da mesma, pode fazer várias mudanças e modifi-cações da invenção para adaptá-la a vários usos e condições. Desse modo,outras concretizações estão também dentro do escopo das reivindicaçõesque se seguem.

Claims (119)

1. Biblioteca de ácidos nucléicos que codificam pelo menos dezpolipeptídeos diferentes, a seqüência de aminoácidos de cada polipeptídeocompreendendo:C1-X1-C2-X2-C3-X3-C4, no qual(i) subseqüência Ci é selecionada de SEQ ID NOS:1-30,subseqüência C2 é selecionada de SEQ ID NOS:31-60, subseqüência C3 éselecionada de SEQ ID NOS:61-90, subseqüência C4 é selecionada de SEQID NOS:91-12C), e cada uma de Ci-C4 compreende até 10 substituições, reti-radas, inserções ou adições de aminoácido simples à subseqüência selecio-nada;(ii) C1-C4 são homogêneas através de uma pluralidade dospolipeptídeos codificados;(iii) cada uma de XrX3 é uma subseqüência independen-temente variável consistindo em 2-20 aminoácidos; e(iv) cada uma de XrX3 são heterogêneas através de umapluralidade dos polipeptídeos codificados.
2. Biblioteca de ácidos nucléicos que codificam pelo menos dezpolipeptídeos diferentes, a seqüência de aminoácidos de cada polipeptídeocompreendendo:C1-X1-C2-X2-C3-X3-C4, no qual(i) subseqüência C1 é selecionada de figura 2 ou figura 4,subseqüência C2 é selecionada de figura 2 ou figura 4, subseqüência C3 éselecionada de figura 2 ou figura 4; subseqüência C4 é selecionada de figura 2 ou figura 4, e cada uma de C1-C4 compreende até 10 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada;(ii) C1-C4 são homogêneas através de uma pluralidade dospolipeptídeos codificados;(iii) cada uma de X1-X3 é uma subseqüência independen-temente variável consistindo em 2-20 aminoácidos; e(iv) cada uma de X1-X3 são heterogêneas através de umapluralidade dos polipeptídeos codificados.
3. Biblioteca de ácidos nucléicos que codificam pelo menos dezpolipeptídeos diferentes, a seqüência de aminoácidos de cada polipeptídeocompreendendo:C1-X1-C2-X2-C3-X3-C4, no qual(i) subseqüência Ci é selecionada de figura 3 ou figura 5,subseqüência C2 é selecionada de figura 3 ou figura 5, subseqüência C3 éselecionada de figura 3 ou figura 5; subseqüência C4 é selecionada de figura 3 XX, e cada uma de C1-C4 compreende até 30 substituições, retiradas, in-serções ou adições de aminoácido simples à subseqüência selecionada;(ii) C1-C4 são homogêneas através de uma pluralidade dospolipeptídeos codificados;(iii) cada uma de X1-X3 é uma subseqüência independen-temente variável consistindo em 2-20 aminoácidos; e(iv) cada uma de X1-X3 são heterogêneas através de umapluralidade dos polipeptídeos codificados.
4. Biblioteca, de acordo com qualquer uma das reivindicações 1a 3, no qual pelo menos 1.000 polipeptídeos diferentes são codificados.
5. Biblioteca, de acordo com qualquer uma das reivindicações 1a 3, no qual pelo menos 100.000 polipeptídeos diferentes são codificados.
6. Biblioteca, de acordo com qualquer uma das reivindicações 1a 3, no qual pelo menos 1.000.000 de polipeptídeos diferentes são codifica-dos.
7. Biblioteca, de acordo com qualquer uma das reivindicações 1a 3, no qual cada uma de CrC4 compreende independentemente até 20substituições, retiradas, inserções ou adições de aminoácido simples à sub-seqüência selecionada.
8. Biblioteca, de acordo com a reivindicação 7, no qual cadauma de CrC4 compreende independentemente até 10 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada.
9. Biblioteca, de acordo com a reivindicação 8, no qual cadauma de C1-C4 compreende independentemente até 5 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada.
10. Biblioteca, de acordo com a reivindicação 7, no qual nenhu-ma de C1-C4 compreende substituições, retiradas, inserções ou adições deaminoácido à subseqüência selecionada.
11. Biblioteca, de acordo com qualquer uma das reivindicações 1 a 3, no qual os aminoácidos de XrX3 são selecionados de pouco menosdo que 20 aminoácidos geneticamente codificados em plantas.
12. Biblioteca, de acordo com a reivindicação 11, no qual ospouco menos do que 20 aminoácidos geneticamente codificados incluempelo menos um aminoácido alifático, pelo menos um aminoácido acídico,pelo menos um aminoácido neutro, e pelo menos um aminoácido aromático.
13. Biblioteca, de acordo com a reivindicação 12, no qual ospouco menos do que 20 aminoácidos geneticamente codificados compreen-dem alanina, aspartato, serina e tirosina.
14. Biblioteca, de acordo com a reivindicação 1, no qual a se-qüência de aminoácidos de cada polipeptídeo é selecionada de:(a) um polipeptídeo compreendendo C1-X1-C2-X2-C3-X3-C4, noqual C1 = SEQ ID NO:1, C2 = SEQ ID NO:31, C3 = SEQ ID NO:61, e C4 =SEQ ID NO:91;(b) um polipeptídeo compreendendo C1-X1-C2-Xa-C3-X3-C4, noqual C1 = SEQ ID NO:2, C2 = SEQ ID NO:32, C3 = SEQ ID NO:62, e C4 =SEQ ID NO:92; e(c) um polipeptídeo compreendendo C1-X1-C2-X2-C3-X3-C4, noqual C1 = SEQ ID NO:3, C2 = SEQ ID NO:33, C3 = SEQ ID NO:63, e C4 =SEQ ID NO:93.
15. Biblioteca, de acordo com a reivindicação 2, no qual cadapolipeptídeo codificado compreende C1-X1-C2-X2-C3-X3-C4, no qual C1 =SEQ ID NO: X1, C2 = SEQ ID NO: X2, C3 = SEQ ID NO: X3, e C4 = SEQ IDNO: X4; SEQ designada. ID NO: 130.
16. Biblioteca, de acordo com a reivindicação 3, no qual cadapolipeptídeo codificado compreende C1-X1-C2-X2-C3-X3-C4, no qual C1 =SEQ ID NO: X1, C2 = SEQ ID NO: X2, C3 = SEQ ID NO: X3, e C4 = SEQ IDNO: X4; designada SEQ ID N0:130.
17. Biblioteca, de acordo com qualquer uma das reivindicações 1 a 3, no qual cada um dos ácidos nucléicos compreende uma seqüência devetor.
18. Ácido nucléico isolado selecionado a partir da biblioteca co-mo definida em qualquer uma das reivindicações 1 a 3.
19. Ácido nucléico isolado selecionado a partir da biblioteca co-mo definida em qualquer uma das reivindicações 14 a 16.
20. Célula que expressa o ácido nucléico isolado como definidona reivindicação 19.
21. Ácido nucléico isolado selecionado a partir da biblioteca co-mo definida em reivindicação 17.
22. Polipeptídeo purificado codificado pelo ácido nucléico isola-do como definido na reivindicação 18.
23. População de células que expressam os polipeptídeos codi-ficados pela biblioteca como definido em qualquer uma das reivindicações 1a 3.
24. Célula selecionada a partir da população como definida nareivindicação 23.
25. Biblioteca de polipeptídeos purificados codificados pela bibli-oteca como definida em qualquer uma das reivindicações 1 a 3.
26. População de fago filamentoso que revela os polipeptídeoscodificados pela biblioteca como definida em qualquer uma das reivindica-ções 1 a 3.
27. Método de gerar a biblioteca como definida na reivindicação 1, compreendendo:(i) provisão de um ácido nucléico parenteral que codificaum polipeptídeo parenteral compreendendo a seqüência de aminoácido: CrX1-C2-X2-C3-X3-C4, no qual a subseqüência C1 é selecionada de SEQ IDNOS: 1-30, a subseqüência C2 é selecionada de SEQ ID NOS:31-6Q, a sub-seqüência C3 é selecionada de SEQ ID NOS:61-90, a subseqüência C4 éselecionada de SEQ ID NOS:91-120, cada uma de C1-C4 compreende até 10 substituições, retiradas, inserções ou adições de aminoácido simples àsubseqüência selecionada; e cada XrX3 é uma subseqüência independenteconsistindo em 2-20 aminoácidos;(ii) replicação do ácido nucléico parenteral sob condiçõesque introduzem até 10 substituições, retiradas, inserções ou adições de ami-noácido simples às subseqüências X1, X2 ou X3, pelo que uma população deseqüências aleatoriamente variadas que codificam X1', X2' ou X3' é gerada; e(iii) a população de seqüências aleatoriamente variadasX1', X2' ou X3' é substituída, em uma população de ácidos nucléicos parente-rais nas posições correspondentes àquelas que codificam X1', X2' ou X3'.
28. Método, de acordo com a reivindicação 27, no qual pelo me-nos uma das subseqüências X1-X3 é selecionada de SEQ ID Nos:121-123.
29. Método, de acordo com a reivindicação 27, no qual cadauma de C1-C4 compreende independentemente até 20 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada.
30. Método, de acordo com a reivindicação 29, no qual cadauma de C1-C4 compreende independentemente até 10 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada.
31. Método, de acordo com a reivindicação 30, no qual cadauma de C1-C4 compreende independentemente até 5 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada.
32. Método, de acordo com a reivindicação 31, no qual cadauma de C1-C4 compreende substituições, retiradas, inserções ou adições deaminoácido à subseqüência selecionada.
33. Método, de acordo com a reivindicação 27, no qual a repli-cação gera uma população heterogênea de subseqüências aleatoriamentevariadas pela introdução de até 5 substituições de aminoácido em cada umade Χ1, X2 ou X3.
34. Método, de acordo com a reivindicação 27, compreendendoadicionalmente amplificar a biblioteca pela introdução da mesma em um sis-tema de replicação biológico e proliferação do sistema de replicação biológico.
35. Método, de acordo com a reivindicação 34, no qual o siste-ma de replicação biológico é uma pluralidade de células de E. coli.
36. Método, de acordo com a reivindicação 34, no qual o siste-ma de replicação biológico é uma pluralidade de bacteriófago.
37. Método de acordo com a reivindicação 27, em que ocorreu areplicação in vitro.
38. Método, de acordo com a reivindicação 37, no qual a repli-cação é realizada com uma polimerase mutagênica purificada.
39. Método, de acordo com a reivindicação 37, no qual a repli-cação é realizada na presença de um análogo de nucleotídeo.
40. Método, de acordo com a reivindicação 27, no qual a repli-cação ocorre in vivo.
41. Método, de acordo com a reivindicação 40, no qual a repli-cação in vivo ocorre em uma espécie mutagênica de E. coli.
42. Método de gerar a biblioteca como definida na reivindicação 1, compreendendo:(i) seleção de uma seqüência de aminoácido compreen-dendo a seqüência de aminoácido: C1-X1-C2-X2-C3-X3-C4 a ser codificada, noqual(a) a subseqüência C1 é selecionada de SEQ ID NOS:1-30, asubseqüência C2 é selecionada de SEQ ID NOS:31 -60, a subseqüência C3 éselecionada de SEQ ID NOS:61-90, a subseqüência C4 é selecionada deSEQ ID NOS:91-120;(b) cada uma de CrC4 compreende até 10 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada;(c) cada Χ1, X2 e X3 consiste em uma subseqüência de aminoá-cido de 2-20 aminoácidos de comprimento;(ii) provisão de uma primeira pluralidade e uma segundapluralidade de oligonucleotídeos, no qual(a) oligonucleotídeos da primeira pluralidade codificam as sub-seqüências C1-C4 e subseqüências variantes X1-X3 heterogêneas múltiplasΧ1'-Χ3';(b) oligonucleotídeos da segunda pluralidade são complementa-res às seqüências de nucleotídeo que codificam as subseqüências C1-C4 eàs seqüências de nucleotídeo que codificam as subseqüências Xi'-X3' hete-rogêneas múltiplas; e(c) oligonucleotídeos das primeira e segunda plural idades têmseqüências de sobreposição uma com a outra;(iii) combinação da população de oligonucleotídeos paraformar uma primeira mistura;(iv) incubação da mistura sob condições eficazs para hibri-dização das seqüências complementares de sobreposição para formar umapluralidade de seqüências complementares hibridizadas; e(v) alongamento da pluralidade de seqüências complemen-tares hibridizadas para formar uma segunda mistura contendo a biblioteca.
43. Método, de acordo com a reivindicação 42, no qual cadauma de C1-C4 compreende independentemente até 20 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada.
44. Método, de acordo com a reivindicação 43, no qual cadauma de C1-C4 compreende independentemente até 10 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada.
45. Método, de acordo com a reivindicação 44, no qual cadauma de CrC4 compreende independentemente de zero até 5 substituições,retiradas, inserções ou adições de aminoácido simples à subseqüência sele-cionada.
46. Método, de acordo com a reivindicação 42, compreendendoadicionalmente realizar um ciclo de etapas, o ciclo de etapas compreenden-do desnaturação da biblioteca pelo aumento da temperatura da segundamistura a uma temperatura eficaz para desnaturação de DNA de filamentoduplo, seguida pelas etapas (iv) e (v).
47. Método, de acordo com a reivindicação 46, compreendendorepetição do ciclo de etapas até 100 vezes.
48. Método, de acordo com a reivindicação 42, compreendendoadicionalmente amplificação da biblioteca por uma reação de cadeia de po-limerase consistindo essencialmente da biblioteca, um iniciador de avanço, eum iniciador reverso, no qual os prímeres de avanço e reverso podem hibri-dizar para as seqüências terminais 5' e 3', respectivamente, de todos os áci-do nucléicos na biblioteca.
49. Método, de acordo com a reivindicação 42, no qual o amino-ácido a ser codificado em cada posição das subseqüências Χ1, X2 ou X3, éselecionado de um subconjunto de alanina, arginina, asparagina, aspartato,cisteína, glutamina, glutamato, glicina, histidina, isoleucina, leucina, lisina,metionina, fenilalanina, prolina, serina, treonina, triptofan, tirosina e valina.
50. Método, de acordo com a reivindicação 49, no qual o amino-ácido selecionado para cada substituição de aminoácido simples é selecio-nado de um grupo de aminoácidos consistindo em pelo menos um aminoá-cido alifático, pelo menos um aminoácido acídico, pelo menos um aminoáci-do neutro, e pelo menos um aminoácido aromático.
51. Método, de acordo com a reivindicação 50, no qual o grupode aminoácidos consiste em alanina, aspartato, serina e tirosina.
52. Método de gerar a biblioteca como definida na reivindicação 2, compreendendo:(i) provisão de um ácido nucléico parenteral que codificaum polipeptídeo parenteral compreendendo a seqüência de aminoácido: C1-X1-C2-X2-C3-X3-C4, no qual C1 é selecionada de figura 2 ou figura 4, a sub-seqüência C2 é selecionada de figura 2 ou figura 4, a subseqüência C3 éselecionada de figura 2 ou figura 4, a subseqüência C4 é selecionada defigura 2 ou figura 4, cada uma de C1-C4 compreende até 10 substituições,retiradas, inserções ou adições de aminoácido simples à subseqüência sele-cionada; e cada uma de XrX2 é uma subseqüência independente consistin-do em 2-10 aminoácidos;(ii) replicação do ácido nucléico parenteral sob condiçõesque introduzem até 10 substituições, retiradas, inserções ou adições de ami-noácido simples às subseqüências de X1, X2, ou X3, pelo que uma populaçãode subseqüências aleatoriamente variadas que codificam X1', X2', ou X3' égerada; e(iii) a população de subseqüências aleatoriamente variadasX1', X2', ou X3' é substituída, em uma população de ácidos nucléicos parente-rais nas posições correspondentes àquelas que codificam X1i X2, ou X3.
53. Método, de acordo com a reivindicação 52, no qual pelo me-nos uma das subseqüências X1-X2 é selecionada de SEQ ID Nos:121-123.
54. Método, de acordo com a reivindicação 52, no qual cadauma de C1-C4 compreende independentemente até 20 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada.
55. Método, de acordo com a reivindicação 54, no qual cadauma de C1-C4 compreende independentemente até 10 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada.
56. Método, de acordo com a reivindicação 55, no qual cadauma de C1-C4 compreende independentemente até 5 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada.
57. Método, de acordo com a reivindicação 56, no qual nenhumade C1-C4 compreende substituições, retiradas, inserções ou adições de ami-noácido.
58. Método, de acordo com a reivindicação 52, no qual a repli-cação gera uma população heterogênea de subseqüências aleatoriamentevariadas pela introdução de até 5 substituições de aminoácido em cada umade X1, X2, ou X3.
59. Método, de acordo com a reivindicação 52, compreendendoadicionalmente amplificar a biblioteca pela introdução da mesma em um sis-tema de replicação biológico e proliferação do sistema de replicação biológico.
60. Método, de acordo com a reivindicação 59, no qual o siste-ma de replicação biológico é uma pluralidade de células de E. coli.
61. Método, de acordo com a reivindicação 59, no qual o siste-ma de replicação biológico é uma pluralidade de bacteriófago.
62. Método, de acordo com a reivindicação 52, no qual a repli-cação ocorre in vitro.
63. Método, de acordo com a reivindicação 62, no qual a repli-cação é realizada com uma polimerase mutagênica purificada.
64. Método, de acordo com a reivindicação 62, no qual a repli-cação é realizada na presença de um análogo de nucleotídeo.
65. Método, de acordo com a reivindicação 52, no qual a repli-cação ocorre in vivo.
66. Método, de acordo com a reivindicação 65, no qual a repli-cação in vivo ocorre em uma espécie mutagênica de E. coli.
67. Método de gerar a biblioteca como definida na reivindicação 2, compreendendo:(i) seleção de uma seqüência de aminoácido compreen-dendo C1-X1-C2-X2-C3-X3-C4 a ser codificada, no qual(a) a subseqüência C1 é selecionada de figura 2 ou figura 4, asubseqüência C2 é selecionada de figura 2 ou figura 4, a subseqüência C3é selecionada de figura 2 ou figura 4, a subseqüência C4 é selecionada defigura 2 ou figura 4;(b) cada uma de C1-C4 compreende até 10 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada;(c) e cada uma de Χ2, X2, e X3 consiste em uma seqüência deaminoácido de 2-20 aminoácidos de comprimento;(ii) provisão de uma primeira pluralidade e um segundapluralidade de oligonucleotídeos, no qual(a) oligonucleotídeos da primeira pluralidade codificam as sub-seqüências C1-C4 e subseqüências variantes XrX3 heterogêneas múltiplasX1'-X3';(b) oligonucleotídeos da segunda pluralidade são complementa-res às seqüências de nucleotídeo que codificam as subseqüências C1-C4 eàs seqüências de nucleotídeo que codificam as subseqüências X1'-X3' hete-rogêneas múltiplas; e(c) oligonucleotídeos das primeira e segunda pluralidades têmseqüências de sobreposição uma com a outra;(iii) combinação da população de oligonucleotídeos paraformar uma primeira mistura;(iv) incubação da mistura sob condições eficazs para hibri-dização das seqüências complementares de sobreposição para formar umapluralidade de seqüências complementares hibridizadas; e(v) alongamento da pluralidade de seqüências complemen-tares hibridizadas para formar uma segunda mistura contendo a biblioteca.
68. Método, de acordo com a reivindicação 67, no qual cadauma de C1-C4 compreende independentemente até 20 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecionada.
69. Método, de acordo com a reivindicação 68, no qual cadauma de C1-C4 compreende independentemente até 10 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada.
70. Método, de acordo com a reivindicação 44, no qual cadauma de C1-C4 compreende independentemente de zero até 5 substituições,retiradas, inserções ou adições de aminoácido simples à subseqüência sele-cionada.
71. Método, de acordo com a reivindicação 67, compreendendoadicionalmente realizar um ciclo de etapas, o ciclo de etapas compreenden-do desnaturação da biblioteca pelo aumento da temperatura da segundamistura a uma temperatura eficaz para desnaturação de DNA de filamentoduplo, seguida pelas etapas (iv) e (v).
72. Método, de acordo com a reivindicação 71, compreendendorepetição do ciclo de etapas até 100 vezes.
73. Método, de acordo com a reivindicação 67, compreendendoadicionalmente amplificação da biblioteca por uma reação de cadeia de po-limerase consistindo essencialmente da biblioteca, um iniciador de avanço, eum iniciador reverso, no qual os prímeres de avanço e reverso podem hibri-dizar para as seqüências terminais 5' e 3', respectivamente, de todos os áci-do nucléicos na biblioteca.
74. Método, de acordo com a reivindicação 67, no qual o amino-ácido a ser codificado em cada posição das subseqüências X1, X2 ou X3, éselecionado de um subconjunto de alanina, arginina, asparagina, aspartato,cisteína, glutamina, glutamato, glicina, histidina, isoleucina, leucina, lisina,metionina, fenilalanina, prolina, serina, treonina, triptofan, tirosina e valina.
75. Método, de acordo com a reivindicação 74, no qual o amino-ácido selecionado para cada substituição de aminoácido simples é selecio-nado de um grupo de aminoácidos consistindo em pelo menos um aminoá-cido alifático, pelo menos um aminoácido acídico, pelo menos um aminoáci-do neutro, e pelo menos um aminoácido aromático.
76. Método, de acordo com a reivindicação 75, no qual o grupode aminoácidos consiste em alanina, aspartato, serina e tirosina.
77. Método de gerar a biblioteca de acordo com a reivindicação 3, compreendendo:(i) provisão de um ácido nucléico parenteral que codificaum polipeptídeo parenteral compreendendo a seqüência de aminoácido: C1-X1-C2-X2-C3-X3-C4, no qual C1 é selecionada de figura 3 ou figura 5, a sub-seqüência C2 é selecionada de figura 3 ou figura 5, a subseqüência C3 éselecionada de figura 3 ou figura 5, a subseqüência C4 é selecionada defigura 3 ou figura 5, cada uma de C1-C4 compreende até 10 substituições,retiradas, inserções ou adições de aminoácido simples à subseqüência sele-cionada; e cada uma de XrX3 é uma subseqüência independente consistin-do em 2-20 aminoácidos;(ii) replicação do ácido nucléico parenteral sob condiçõesque introduzem até 10 substituições, retiradas, inserções ou adições de ami-noácido simples às subseqüências de X1, X2, ou X3, pelo que uma populaçãode subseqüências aleatoriamente variadas que codificam X1', X2', ou X3' égerada; e(iü) a população de subseqüências aleatoriamente variadasX1', X2', ou X3' é substituída, em uma população de ácidos nucléicos parente-rais nas posições correspondentes àquelas que codificam X1lX2, ou X3.
78. Método, de acordo com a reivindicação 77, no qual pelo me-nos uma das subseqüências X1-X3 é selecionada de SEQ ID Nos:121-123.
79. Método, de acordo com a reivindicação 27, no qual cadauma de C1-C4 compreende independentemente até 20 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecionada.
80. Método, de acordo com a reivindicação 79, no qual cadauma de C1-C4 compreende independentemente até 10 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecionada.
81. Método, de acordo com a reivindicação 80, no qual cadauma de C1-C4 compreende independentemente até 5 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecionada.
82. Método, de acordo com a reivindicação 81, no qual nenhumade C1-C4 compreende substituições, retiradas, inserções ou adições de ami-noácido.
83. Método, de acordo com a reivindicação 77, no qual a repli-cação gera uma população heterogênea de subseqüências aleatoriamentevariadas pela introdução de até 5 substituições de aminoácido em cada umade XiiX2, ou X3.
84. Método, de acordo com a reivindicação 77, compreendendoadicionalmente amplificar a biblioteca pela introdução da mesma em um sis-tema de replicação biológico e proliferação do sistema de replicação biológi-co.
85. Método, de acordo com a reivindicação 84, no qual o siste-ma de repücação biológico é uma pluralidade de células de E. coli.
86. Método, de acordo com a reivindicação 84, no qual o siste-ma de replicação biológico é uma pluralidade de bacteriófago.
87. Método, de acordo com a reivindicação 77, no qual a repli-cação ocorre in vitro.
88. Método, de acordo com a reivindicação 87, no qual a repli-cação é realizada com uma polimerase mutagênica purificada.
89. Método, de acordo com a reivindicação 87, no qual a repli-cação é realizada na presença de um análogo de nucleotídeo.
90. Método, de acordo com a reivindicação 77, no qual a repli-cação ocorre in vivo.
91. Método, de acordo com a reivindicação 90, no qual a repli-cação in vivo ocorre em uma espécie mutagênica de E. coli.
92. Método de gerar a biblioteca de acordo com a reivindicação-3, compreendendo:(i) seleção de uma seqüência de aminoácido compreen-dendo C1-X1-C2-X2-C3-X3-C4 a ser codificada, no qual(a) a subseqüência Ci é selecionada de figura 3 ou figura 5, asubseqüência C2 é selecionada de figura 3 ou figura 5, a subseqüência C3é selecionada de figura 3 ou figura 5, a subseqüência C4 é selecionada defigura 3 ou figura 5;(b) cada uma de CrC4 compreende até 10 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecio-nada;(c) e cada uma de X1, X2, e X3 consiste em uma seqüência deaminoácido de 2-20 aminoácidos de comprimento;(ii) provisão de uma primeira pluralidade e um segundapluralidade de oligonucleotídeos, no qual(a) oligonucleotídeos da primeira pluralidade codificam as sub-seqüências CrC4 e subseqüências variantes XrX3 heterogêneas múltiplasΧ1-Χ3';(b) oligonucleotídeos da segunda pluralidade são complementa-res às seqüências de nucleoíídeo que codificam as subseqüências CrC4 eàs seqüências de nucleoíídeo que codificam as subseqüências Xi'-X3 hete-rogêneas múltiplas; e(c) oligonucleotídeos das primeira e segunda pluralidades têmseqüências de sobreposição uma com a outra;(jjj) combinação da população de oligonucleotídeos paraformar uma primeira mistura;(iv) incubação da mistura sob condições eficazs para hibri-dização das seqüências complementares de sobreposição para formar umapluralidade de seqüências complementares hibridizadas; e(v) alongamento da pluralidade de seqüências complemen-tares hibridizadas para formar uma segunda mistura contendo a biblioteca.
93. Método, de acordo com a reivindicação 92, no' qual cadauma de C1-C4 compreende independentemente até 20 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecionada.
94. Método, de acordo com a reivindicação 93, no qual cadauma de Ci-C4 compreende independentemente até 10 substituições, retira-das, inserções ou adições de aminoácido simples à subseqüência selecionada.
95. Método, de acordo com a reivindicação 94, no qual cadauma de C1-C4 compreende independentemente de zero até 5 substituições,retiradas, inserções ou adições de aminoácido simples à subseqüência sele-cionada.
96. Método, de acordo com a reivindicação 92, compreendendoadicionalmente realizar um ciclo de etapas, o ciclo de etapas compreenden-do desnaturação da biblioteca pelo aumento da temperatura da segundamistura a uma temperatura eficaz para desnaturação de DNA de filamentoduplo, seguida pelas etapas (iv) e (v).
97. Método, de acordo com a reivindicação 96, compreendendorepetição do ciclo de etapas até 100 vezes.
98. Método, de acordo com a reivindicação 92, compreendendoadicionalmente amplificação da biblioteca por uma reação de cadeia de po-Iimerase consistindo essencialmente da biblioteca, um iniciador de avanço, eum iniciador reverso, no qual os prímeres de avanço e reverso podem hibri-dizar para as seqüências terminais 5' e 3', respectivamente, de todos os áci-do nucléicos na biblioteca.
99. Método, de acordo com a reivindicação 92, no qual o amino-ácido a ser codificado em cada posição das subseqüências Xi, X2 ou X3, éselecionado de um subconjunto de alanina, arginina, asparagina, aspartato,cisteína, glutamina, glutamato, glicina, histidina, isoleucina, leucina, lisina,metionina, fenilalanina, prolina, serina, treonina, triptofan, tirosina e valina.
100. Método, de acordo com a reivindicação 99, no qual o ami-noácido selecionado para cada substituição de aminoácido simples é sele-cionado de um grupo de aminoácidos consistindo em pelo menos um ami-noácido alifático, pelo menos um aminoácido acídico, pelo menos um ami-noácido neutro, e pelo menos um aminoácido aromático.
101. Método, de acordo com a reivindicação 100, no qual o gru-po de aminoácidos consiste em alanina, aspartato, serina e tirosina.
102. Biblioteca de ácidos nucléicos que codificam pelo menosdez polipeptídeos diferentes, no qual(i) a seqüência de aminoácido de cada um dos polipeptí-deos codificados compreende uma seqüência de aminoácido pelo menos-70% idêntica a qualquer de SEQ ID Nos: 127-129;(ii) a seqüência de aminoácido de cada um dos polipeptí-deos codificados inclui aminoácidos que diferem daquela de SEQ IDNos: 127-129 nas posições 14, 15, 33, 35-36, 38, 47-48, 66, 68-69, 71, 80,-81, 99, 101-102, e 104, e as diferenças de aminoácido são heterogênea a-través de uma pluralidade dos polipeptídeos codificados; e(iii) a seqüência de aminoácido de cada um dos polipeptí-deos codificados fora dos resíduos correspondem às posições 14, 15, 33,-35-36, 38, 47-48, 66, 68-69, 71, 80, 81, 99, 101-102, e 104 de SEQ IDNos: 127-129 é homogênea através de uma pluralidade dos polipeptídeoscodificados.
103. Biblioteca, de acordo com a reivindicação 102, no qual aseqüência de aminoácido dos polipeptídeos tem pelo menos 75% de identi-dade para qualquer de SEQ ID Nos:127-129.
104. Biblioteca, de acordo com a reivindicação 102, no qual aseqüência de aminoácido dos polipeptídeos tem pelo menos 80% de identi-dade para qualquer de SEQ ID Nos:127-129.
105. Biblioteca, de acordo com a reivindicação 102, no qual aseqüência de aminoácido dos polipeptídeos tem pelo menos 85% de identi-dade para qualquer de SEQ ID Nos: 127-129.
106. Biblioteca, de acordo com a reivindicação 102, no qual ca-da um dos ácidos nucléicos compreende uma seqüência de vetor.
107. Ácido nucléico isolado que codifica um polipeptídeo sele-cionado a partir da biblioteca como definido em qualquer uma das reivindica-ções 102-106.
108. Polipeptídeo purificado codificado pelo ácido nucléico comodefinido na reivindicação 107.
109. População de células que expressam os polipeptídeos co-dificados pela biblioteca como definida na reivindicação 102.
110. Célula selecionada a partir da população de células comodefinida na reivindicação 109.
111. Biblioteca purificada de polipeptídeos codificados pela bi-blioteca como definida na reivindicação 102.
112. População de fago filamentoso revelando a biblioteca depolipeptídeos codificados pela biblioteca como definida na reivindicação 102.
113. Método de gerar a biblioteca como definida na reivindica-ção 102, compreendendo:(i) seleção de uma seqüência de aminoácido correspon-dente a qualquer uma de SEQ ID Nos:127-129 a ser codificada, no qual aseqüência selecionada difere daquelas de SEQ ID Nos:127-129 em pelomenos uma de posições variáveis 14, 15, 33, 35-36, 38, 47-48, 66, 68-69,-71,80,81,99, 101-102, e 104;(jj) provisão quimicamente de uma primeira e uma segundapluralidade de oligonucleotídeos, no qua!(a) oligonucleotídeos da primeira pluralidade codificam subse-qüências de aminoácido da seqüência de aminoácido selecionada; as sub-seqüências sendo heterogêneas nas posições variáveis codificadas;(b) oligonucleotídeos da segunda pluralidade são complementa-res às seqüências de nucleotídeo que codificam as subseqüências da se-qüência de aminoácido selecionada, as subseqüências sendo heterogêneasnas posições variáveis codificadas; e(c) a primeira e segunda pluralidades compreendem oligonu-cleotídeos tendo seqüências de sobreposição uma com a outra;(iii) combinação da população de oligonucleotídeos paraformar uma primeira mistura; (iv) incubação da mistura sob condições eficazs para hibri-dização das seqüências complementares de sobreposição para formar umapluralidade de seqüências complementares hibridizadas; e(v) alongamento da pluralidade de seqüências complemen-tares hibridizadas para formar uma segunda mistura contendo a biblioteca.
114. Método, de acordo com a reivindicação 113, compreen-dendo adicionalmente realizar um ciclo de desnaturação da biblioteca peloaumento da temperatura da segunda mistura a uma temperatura eficaz paradesnaturação de DNA de filamento duplo, seguida pelas etapas (iv) e (v).
115. Método, de acordo com a reivindicação 114, compreen-dendo repetição do ciclo de etapas até 100 vezes.
116. Método, de acordo com a reivindicação 115, compreen-dendo adicionalmente amplificação da biblioteca por uma reação de cadeiade polimerase consistindo essencialmente da biblioteca, um iniciador de a-vanço, e um iniciador reverso, no qual os prímeres de avanço e reverso po-dem hibridizar para as seqüências terminais 5' e 3', respectivamente, de to-dos os ácido nucléicos na biblioteca.
117. Método, de acordo com a reivindicação 113, no qual osaminoácidos a serem codificados para as posições variáveis são seleciona-dos de um subconjunto de alanina, arginina, asparagina, aspartato, cisteína,glutamina, glutamato, glicina, histidina, isoleucina, leucina, lisina, metionina,fenilalanina, prolina, serina, treonina, triptofan, tirosina e valina.
118. Método, de acordo com a reivindicação 117, no qual osaminoácidos selecionados para as posições variáveis são selecionados deum grupo consistindo em pelo menos um aminoácido alifático, pelo menosum aminoácido acídico, pelo menos um aminoácido neutro, e pelo menosum aminoácido aromático.
119. Método, de acordo com a reivindicação 118, no qual o gru-po de aminoácidos consiste em alanina, aspartato, serina e tirosina.
BRPI0707787-4A 2006-02-13 2007-02-13 polipeptÍdeos de ligaÇço quimÉricos de planta para reconhecimento molecular universal BRPI0707787A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US77308606P 2006-02-13 2006-02-13
US60/773,086 2006-02-13
PCT/US2007/003937 WO2007095300A2 (en) 2006-02-13 2007-02-13 Plant chimeric binding polypeptides for universal molecular recognition

Publications (1)

Publication Number Publication Date
BRPI0707787A2 true BRPI0707787A2 (pt) 2011-05-10

Family

ID=38372116

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0707787-4A BRPI0707787A2 (pt) 2006-02-13 2007-02-13 polipeptÍdeos de ligaÇço quimÉricos de planta para reconhecimento molecular universal

Country Status (13)

Country Link
US (3) US7951753B2 (pt)
EP (2) EP1984524B8 (pt)
JP (1) JP5220620B2 (pt)
CN (1) CN101495653A (pt)
AR (1) AR059448A1 (pt)
AT (2) ATE557104T1 (pt)
AU (1) AU2007215062B2 (pt)
BR (1) BRPI0707787A2 (pt)
CA (2) CA2911895A1 (pt)
DE (1) DE602007010733D1 (pt)
HK (1) HK1125976A1 (pt)
MX (2) MX2008010389A (pt)
WO (1) WO2007095300A2 (pt)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7662913B2 (en) * 2006-10-19 2010-02-16 E. I. Du Pont De Nemours And Company Cystatin-based peptide tags for the expression and purification of bioactive peptides
PL218313B1 (pl) * 2010-10-28 2014-11-28 Inst Immunologii I Terapii Doświadczalnej Pan Kompetytywna metoda otrzymywania preparatów bakteriofagowych
GB201302597D0 (en) * 2013-02-14 2013-04-03 Univ Leeds Novel Synthetic Proteins
EP2970397A2 (en) * 2013-03-14 2016-01-20 University Of Washington Through Its Center For Commercialization Polypeptides for treating and/or limiting influenza infection
GB201505306D0 (en) * 2015-03-27 2015-05-13 Ipsen Biopharm Ltd Chimeric polypeptides
US11714090B2 (en) 2017-12-15 2023-08-01 Syngenta Participations Ag Non-antibody ligands for detecting target proteins
US11205139B2 (en) 2018-08-06 2021-12-21 Arizona Board Of Regents On Behalf Of Arizona State University Computational analysis to predict molecular recognition space of monoclonal antibodies through random-sequence peptide arrays

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5080891A (en) 1987-08-03 1992-01-14 Ddi Pharmaceuticals, Inc. Conjugates of superoxide dismutase coupled to high molecular weight polyalkylene glycols
CA2148252C (en) 1992-10-30 2007-06-12 Roger Brent Interaction trap system for isolating novel proteins
DE69611102T2 (de) 1995-09-22 2001-06-21 Amersham Pharm Biotech Uk Ltd Verstärkung der mutagenese von nukleinsäuren
CA2289691C (en) 1997-04-23 2008-01-15 Andreas Pluckthun Methods for identifying nucleic acid molecules encoding (poly)peptides that interact with target molecules
US5977435A (en) 1997-10-21 1999-11-02 Performance Plants, Inc. Plant phosphatases
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US20100293669A2 (en) * 1999-05-06 2010-11-18 Jingdong Liu Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
US20110131679A2 (en) * 2000-04-19 2011-06-02 Thomas La Rosa Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
DE60140474D1 (de) * 2000-09-08 2009-12-24 Univ Zuerich Sammlung von proteinen mit sich wiederholenden sequenzen (repeat proteins), die repetitive sequenzmodule enthalten
JP3890402B2 (ja) * 2001-04-24 2007-03-07 独立行政法人農業生物資源研究所 イネ師部における新規タンパク質およびその遺伝子
US20040266993A1 (en) * 2003-06-30 2004-12-30 Evans Glen A. Non-immunoglobulin binding polypeptides
US20050053989A1 (en) 2003-08-27 2005-03-10 Gil Sharon Libraries of recombinant chimeric proteins
WO2005030967A2 (en) * 2003-09-25 2005-04-07 Pioneer Hi-Bred International, Inc. Crop plant cystatin proteinase inhibitors and methods of use
WO2006110508A2 (en) * 2005-04-07 2006-10-19 The Samuel Roberts Noble Foundation, Inc. Plants with increased phosphorous uptake

Also Published As

Publication number Publication date
EP2270208A2 (en) 2011-01-05
EP2270208A3 (en) 2011-02-16
US9090892B2 (en) 2015-07-28
EP2270208B1 (en) 2012-05-09
DE602007010733D1 (de) 2011-01-05
ATE489484T1 (de) 2010-12-15
EP1984524B8 (en) 2011-01-19
WO2007095300A2 (en) 2007-08-23
AR059448A1 (es) 2008-04-09
EP1984524A4 (en) 2009-09-30
CA2641996C (en) 2016-01-19
CA2911895A1 (en) 2007-08-23
US7951753B2 (en) 2011-05-31
EP1984524B1 (en) 2010-11-24
EP1984524A2 (en) 2008-10-29
HK1125976A1 (en) 2009-08-21
AU2007215062B2 (en) 2012-11-29
US20070224622A1 (en) 2007-09-27
MX345294B (es) 2017-01-24
JP2009526525A (ja) 2009-07-23
US20110201525A1 (en) 2011-08-18
ATE557104T1 (de) 2012-05-15
WO2007095300A3 (en) 2008-07-17
AU2007215062A1 (en) 2007-08-23
CN101495653A (zh) 2009-07-29
CA2641996A1 (en) 2007-08-23
MX2008010389A (es) 2008-10-21
US8399385B2 (en) 2013-03-19
JP5220620B2 (ja) 2013-06-26
US20130203633A1 (en) 2013-08-08

Similar Documents

Publication Publication Date Title
Gilmartin et al. Characterization of a gene encoding a DNA binding protein with specificity for a light-responsive element.
AU2007218045B2 (en) Method of constructing and screening libraries of peptide structures
BRPI0707787A2 (pt) polipeptÍdeos de ligaÇço quimÉricos de planta para reconhecimento molecular universal
US20140094595A1 (en) Protein Scaffolds for Antibody Mimics and Other Binding Proteins
US5834184A (en) In vivo selection of RNA-binding peptides
US20030166240A1 (en) DNA &amp; protein binding miniature proteins
AU2015203464B2 (en) Plant chimeric binding polypeptides for universal molecular recognition
JP2017530726A (ja) 抗体様タンパク質
AU2013201171B2 (en) Plant chimeric binding polypeptides for universal molecular recognition
AU757920B2 (en) Genes of the dead box protein family, their expression products and use
JP7453745B2 (ja) 毒性タンパク質の活性を阻害するペプチドのスクリーニング方法及び毒性タンパク質の製造方法
WO2007043715A9 (ja) Rna結合ペプチド

Legal Events

Date Code Title Description
B25A Requested transfer of rights approved

Owner name: MONSANTO COMPANY (US)

B25A Requested transfer of rights approved

Owner name: MONSANTO TECHNOLOGY LLC (US)

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B09X Republication of the decision to grant [chapter 9.1.3 patent gazette]
B11D Dismissal acc. art. 38, par 2 of ipl - failure to pay fee after grant in time