BRPI0613395A2 - ácido nucleico, método de produção de uma planta de cultivo transgênica, cassete de expressão, vetor de expressão recombinante, célula hospedeira, método para aumentar desenvolvimento de raiz de uma planta, produto agrìcola, e, usos de um polinucleotìdeo, do vetor de expressão recombinante ou do cassete de expressão ou do ácido nucleico - Google Patents

ácido nucleico, método de produção de uma planta de cultivo transgênica, cassete de expressão, vetor de expressão recombinante, célula hospedeira, método para aumentar desenvolvimento de raiz de uma planta, produto agrìcola, e, usos de um polinucleotìdeo, do vetor de expressão recombinante ou do cassete de expressão ou do ácido nucleico Download PDF

Info

Publication number
BRPI0613395A2
BRPI0613395A2 BRPI0613395-9A BRPI0613395A BRPI0613395A2 BR PI0613395 A2 BRPI0613395 A2 BR PI0613395A2 BR PI0613395 A BRPI0613395 A BR PI0613395A BR PI0613395 A2 BRPI0613395 A2 BR PI0613395A2
Authority
BR
Brazil
Prior art keywords
gly
wing
val
leu
polynucleotide
Prior art date
Application number
BRPI0613395-9A
Other languages
English (en)
Inventor
Rodrigo Sarria-Millan
Eric R Garr
Jamie Haertel
Damian Allen
Bryan Mckersie
Original Assignee
Basf Plant Science Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Basf Plant Science Gmbh filed Critical Basf Plant Science Gmbh
Publication of BRPI0613395A2 publication Critical patent/BRPI0613395A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • C12N15/8227Root-specific
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1014Hydroxymethyl-, formyl-transferases (2.1.2)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

áCIDO NUCLEICO, MéTODO DE PRODUçãO DE UMA PLANTA DE CULTIVO TRANSGêNICA, CASSETE DE EXPRESSãO, VETOR DE EXPRESSãO RECOMBINANTE, CéLULA HOSPEDEIRA, MéTODO PARA AUMENTAR DESENVOLVIMENTO DE RAIZ DE UMA PLANTA, PRODUTO AGRìCOLA, E, USOS DE UM POLINUCLEOTìDEO, DO VETOR DE EXPRESSãO RECOMBINANTE OU DO CASSETE DE EXPRESSãO OU DO áCIDO NUCLEICO. Uma planta de cultivo transgênica transformada por um ácido nucleico que codifica o Polipeptídeo Relacionado com a Tensão Semelhante à Serina Hidroximetiltransferase (SHSRP), em que a expressão da seqüéncia de ácido nucleico em uma planta de cultivo resulta no desenvolvimento de raiz de planta aumentado e/ou rendimento aumentado e/ou tolerância aumentada a tensão ambiental em comparação com uma variedade do tipo selvagem da planta. Também são fornecidos produtos agrícolas, que incluem sementes, produzidas pelas plantas de cultivo transgénicas. Também são fornecidos novos SHSRPs isolados e os novos ácidos nucleicos isolados que codificam SHSRPs e vetores e planta transgênica contendo o mesmo.

Description

"ÁCIDO NUCLEICO, MÉTODO DE PRODUÇÃO DE UMA PLANTA DECULTIVO TRANSGÊNICA, CASSETE DE EXPRESSÃO, VETOR DEEXPRESSÃO RECOMBINANTE, CÉLULA HOSPEDEIRA, MÉTODOPARA AUMENTAR DESENVOLVIMENTO DE RAIZ DE UMAPLANTA, PRODUTO AGRÍCOLA, E, USOS DE UMPOLINUCLEOTÍDEO, DO VETOR DE EXPRESSÃO RECOMBINANTEOU DO CASSETE DE EXPRESSÃO OU DO ÁCIDO NUCLEICO"REFEREÊNCIA CRUZADA A PEDIDOS RELACIONADOS
Este pedido reivindica o beneficio de prioridade do PedidoCondicional U.S. Série N0 60/700.267 depositado em 18 de julho de 2005,cujo conteúdo total é incorporado neste por referência.
FUNDAMENTOS DA INVENÇÃO
Campo da Invenção
Esta invenção no geral, diz respeito as seqüências de ácido nucleico quecodificam polipeptídeos que estão associados com o desenvolvimento de raiz, que contribuicom o desenvolvimento da planta e afeta, ultimamente a produção vegetal (isto é,rendimento) sob condições de tensão e sem tensões abióticas. Em particular, esta invençãodiz respeito as seqüências de ácido nucleico isoladas que codificam polipeptídeos queconfere na planta desenvolvimento de raiz aumentado, rendimento aumentado, e/ou securaaumentada, tolerância ao frio e/ou sal e o uso de tais ácidos nucleicos isolados.
Fundamentos da Técnica
O rendimento de plantas de cultivo é central para o bem estar deseres humanos e é diretamente afetado pelo desenvolvimento de plantas sob ambientefísico. Tensões ambientais abióticas, tais como tensão por secura, tensão porsaiinidade, tensão por calor e tensão por frio, são os fatores de limitação principal dodesenvolvimento e produtividade vegetal. Perdas na safra e perdas dedesenvolvimento na safra de safras principais tal como soja, arroz, milho, algodão etrigo causadas por estas tensões representam um fator econômico e políticosignificante e contribuem para falta de alimento em muitos países subdesenvolvidos.Biomassa vegetal é o rendimento total de safras de forragemcomo alfafa, milho de silagem e feno. Muitos substitutos para o rendimentoforam usados em safras de grãos. O principal entre estes são as estimativas dotamanho da planta. O tamanho da planta pode ser medido de muitas maneirasdependendo das espécies e do estágio de desenvolvimento, mas incluem umpeso seco de planta total, peso seco de solo acima, peso fresco de solo acima,área da folha, volume do caule, altura da planta, diâmetro de roseta,comprimento da folha, comprimento da raiz, massa da raiz, número de brotose número de folhas. Muitas espécies mantêm uma taxa conservadora entre otamanho de partes diferentes da planta em um dado estágio dedesenvolvimento. Estas relações alométricas são usadas para a extrapolação apartir de um que mede o tamanho do outro. Tamanho da planta em um estágiode desenvolvimento precoce tipicamente, estará relacionado com o tamanhoda planta depois do desenvolvimento. Uma planta grande com uma área defolha maior tipicamente, pode absorver mais luz e dióxido de carbono do queuma planta menor e, portanto, ganhará um peso maior durante o mesmoperíodo. Isto é, além da continuação potencial micro-ambiente ou vantagemgenética que a planta deve atingir o tamanho inicialmente maior, existe umforte componente genético para a taxa de desenvolvimento e tamanho daplanta de modo que uma faixa de tamanho de planta de genótipos diversossob a condição ambiental também está correlacionado com o tamanho um sobo outro. Desta maneira, um ambiente padrão é usado como um substituto paraambientes diversos e dinâmicos encontrados em locais diferentes e tempospara safras no campo.
Indice de coleta, a taxa de rendimento de semente para o pesoseco de solo acima, é relativamente estável sob muitas condições ambientaise, desse modo, uma correlação robusta entre o tamanho da planta e orendimento de grão pode ser freqüentemente obtido. Estes processos estãointrinsecamente ligados por causa da maioria da biomassa de grãos serdependente de produtividade fotossintética corrente ou armazenada pelasfolhas e caule da planta. Portanto, selecionando-se o tamanho da planta,mesmo em estágios precoces de desempenho, foi usado como um indicadorde potencial futuro. Quando testa-se quanto ao impacto de diferençasgenéticas na tolerância à tensão, a capacidade para padronizar as propriedadesdo solo, temperatura, disponibilidade de água e de nutriente e intensidade deluz é uma vantagem intrínseca de ambientes de estufa ou câmara dedesenvolvimento comparado com o campo. Entretanto, limitações artificiaisno rendimento devido a polinização deficiente devido à ausência de vento ouinsetos ou espaço insuficiente para raiz madura ou desenvolvimento decobertura, pode restringir o uso destes ambientes controlados para testardiferenças de rendimento. Portanto, medições de tamanho da planta emdesenvolvimento precoce, sob condições padronizadas em uma câmara dedesenvolvimento ou estufa, são práticas padrão para fornecer indicação devantagens de rendimento genético potencial.
Durante o ciclo de vida, plantas são tipicamente expostas àcondições de teor de água ambiental reduzida. A maioria das plantasenvolveram estratégias para auto-proteção contra estas condições deressecamento. Entretanto, se a severidade e duração das condições de securafor muito grande, os efeitos no desenvolvimento, crescimento, tamanho daplanta e rendimento da maioria plantas de cultivo são profundas. Exposiçãocontínua a condições de secura causa alterações maiores no metabolismovegetal que leva ultimamente à morte celular e conseqüentemente a perdas de rendimento.
Desenvolvimento de plantas tolerantes à tensão é, portanto,uma estratégia que tem o potencial de resolver ou mediar pelo menos algunsdestes problemas. Entretanto, estratégias de criação de plantas tradicionaisdesenvolvem novas linhas de plantas que apresentam resistência e/outolerância a estes tipos de tensão são relativamente lentas e requerem linhasde resistência específicas para o cruzamento com a linha desejada. Recursosde germplasm limitados para tolerância à tensões e incompatibilidade emcruzamentos entre espécies vegetais distantemente relacionadas representaproblemas significantes encontrados na criação convencional.
Adicionalmente, os processos celulares que levam à tolerância à secura, frio esal em modelos de plantas tolerantes a seca, frio e/ou sal são complexosnaturais e envolvem mecanismo múltiplos de adaptação celular e caminhosmetabólicos numerosos. Esta natureza de componente múltiplo de tolerância àtensão não foi realizada a criação quanto à tolerância grandementemalsucedida, mas também limitou a capacidade de projetar geneticamenteplantas tolerantes à tensão usando-se métodos biotecnológicos.
Portanto, é necessária a identificação dos genes e proteínasenvolvidos nestes processos de componentes múltiplos que levam aodesenvolvimento aumentado e/ou tolerância à tensão aumentada. Elucidando-se a função dos genes expressados em plantas tolerantes à pressão não apenasavançarão nosso entendimento da adaptação e da tolerância a tensõesambientais, mas também pode fornecer informação importante para projetarnovas estratégias para a melhora da safra.
Raízes são um órgão importante das plantas superiores.
Sistemas de raiz de plantas são fundamentais para o crescimento e para odesenvolvimento apropriado de todas as espécies vegetais terrestres. Além daabsorção de água e nutrientes e fornece suporte físicos, raízes medeiam umcomplexo mas entendemos precariamente a mudança de comunicação entreos micróbios do solo e outras plantas. Em sistemas agronômicos, produção éimpactada pela disponibilidade de água e nutrientes no solo: desenvolvimentode raiz tem uma influência direta ou indireta no desenvolvimento erendimento de órgão aéreos, particularmente sob condições de limitação denutrientes. Raízes são relevantes para a produção de produtos vegetaissecundários, tais como compostos de defesa e hormônios vegetais.Estabelecimento de arquitetura de raiz apropriada é um fator importante paraa planta usar eficazmente a água e nutrientes disponíveis no ambiente emaximizar o desenvolvimento e a produção vegetal. Além disso, sobcondições de secura, podem adaptar-se para continuar se desenvolvendoenquanto, ao mesmo tempo, produz e envia sinais de aviso precoces aosbrotos inibindo desenvolvimento da planta acima do solo.
Além disso, desenvolvimento melhorado de raiz de plantas decultivo também aumentará a competitividade com plantas daninhas emelhorará o desenvolvimento em áreas áridas, aumentando a acessibilidade ea absorção de água. Desenvolvimento melhorado de raiz também é relevantepara propósitos ecológicos, tais como biomedicação e prevenção/detenção daerosão do solo. Raízes mais longas podem aliviar não apenas os efeitos dadiminuição da quantidade de água do solo mas também melhora a ancorageme a sustentabilidade da planta desta maneira reduzindo a fixação. Também,raízes mais longas têm a capacidade de cobrir um grande volume de solo emelhora a absorção de nutrientes. Portanto, alteração da biomassa da raiz eem particular aumentando o comprimento da raiz, melhorará odesenvolvimento vegetal bem como aumentará o rendimento da safra.
Raízes são órgãos de armazenagem em diversas safrasprincipais importantes, por exemplo, em beterrabas de açúcar, batata,mandioca, inhames e bata doce (batata). Raízes também são o órgão relevantepara o consumo em diversos vegetais (por exemplo, cenouras, rabanete),ervas (por exemplo, gengibre, kukuma) e plantas medicinais (por exemplo,ginseng). Além disso, alguns dos produtos vegetais secundários encontradosnas raízes são de importância econômica para a indústria farmacêutica equímica, por exemplo, as moléculas básicas para a síntese de hormôniosesteroidais são observadas em inhames e as raízes de Lithosperinunerythrorhizon produzem shikonin, que é amplamente usado por causa de suaspropriedades anti-inflamatórias, anti-tumorais e de cura de ferimento.Arquitetura da raiz é uma área que permaneceu amplamenteinexplorada através da produção clássica por causa das dificuldades comestimativa desta peculiaridade no campo. Desta maneira, biotecnologia podeter impacto significante na melhora desta peculiaridade.
A estrutura dos sistemas de raízes resulta de uma combinaçãode predisposição genética e ambiente físico. Diversas raízes mutantes foramisoladas da planta modelo Arabidopsis thaliana e diversas espécies de safrastiveram algum crescimento e desenvolvimento da raiz. Adicionalmente, osgenes envolvidos no caminho de fotorespiratório também podem ter um efeitobenéfico no crescimento de planta, tal como melhorando a fixação de CO2durante a fotossíntese para o aumento da produção de nutrientes e parapromover o desenvolvimento da planta.
Em plantas, serina hidroximetiltransferase (SHMT) desempenha um papel no caminho fotorespiratório além do seu envolvimentono caminho metabólico. Na biossíntese da serina, O SHMT catalisa aconversão reversível da serina e tetra hidrofolato (THF) para glicina e N55N10-metileno THF, uma etapa essencial no metabolismo primário. Na E. coli, 15% de todos os átomos de carbono derivados da glicose passam através docaminho glicina-serina. Em eucariotas, a atividade de SHMT nainterconversão de glicina-serina é uma fonte principal de unidade de carbonosimples por tais processos de biossintético como a biossíntese de metionina,pirimidina e purina. Adicionalmente, serina e glicina são precursores daclorofila, glutationa e fosfolipídeos. Por causa da sua importância nometabolismo primário, as plantas não são capazes de realizar na fotossínteseoxigênica sem SHMT e as reduções na atividade de SHMT levam a defeitosde desenvolvimento nocivo.
Em Arabidopsis, sete genes de SHMT são conhecidos(AtSHMT 1 -AtSHMT7). Diferente dos outros AtSHMTs, o AtSHMT4 émaximamente expressado nas raízes e não é induzido por luz.Adicionalmente, é mostrado que a expressão de AtSHMT4 é regulador porum medidor circadiano (McClung et al., 2000, Plant Physiology 123:381-392;Ho et al., 1999, Journal of Biological Chemistry 274:11007-11012).
Embora alguns genes que estão envolvidos em respostas àtensão em plantas tenham sido caracterizados, a caracterização e a clonagemde genes vegetais que conferem tolerância à tensão permanece grandementeincompleta e fragmentada. Por exemplo, certos estudos indicaram que tensõesà secura e ao sal em algumas plantas pode ser devido à efeitos genéticosaditivos, em contraste com outra pesquisa que indicam genes específicosindicados são transcripcionalmente ativados em tecido vegetativo de plantassob condições de tensão osmótica. Embora seja, no geral, assumido que asproteínas induzidas por tensão têm um papel na tolerância, evidência diretaainda está ausente e as funções de muitos genes responsáveis por tensão sãodesconhecidos.
Portanto, existe uma necessidade de identificar genesadicionais expressados em plantas tolerantes à pressão que tem a capacidadede conferir desenvolvimento de raiz aumentado e/ou rendimento aumentadoe/ou tolerância à tensão a esta planta hospedeira e a outras espécies vegetais.Plantas tolerantes à tensão recentemente geradas terão muitas vantagens, talcomo uma faixa aumentada em que as plantas de cultivo podem sercultivadas, por exemplo, pela diminuição dos requerimentos de água de umaespécie vegetal.
SUMÁRIO DA INVENÇÃO
Esta invenção diz respeito a ácidos nucleicos isolados quecodificam polipeptídeos capazes de modular o desenvolvimento de raiz e/oucrescimento de planta e/ou rendimento e/ou tolerância à tensão sob condiçõesnormais ou de tensão em comparação com uma variedade do tipo selvagem daplanta. Em particular, a invenção diz respeito ao uso dos ácidos nucleicosisolados codificam os polipeptídeos relacionados com a tensão de proteínassemelhantes a Serina Hidroximetiltransferase (SHSRPs) que são importantespara modular desenvolvimento de raiz da planta, rendimento e/ou resposta auma tensão ambientada. Mais particularmente, super-expressão destes ácidosnucleicos que codificam SHSRP em uma planta de cultivo resulta nodesenvolvimento de raiz aumentado e/ou rendimento aumentado sobcondições normais ou de tensão e/ou tolerância aumentada a uma tensãoambientada.
Portanto, em uma primeira forma de realização, a invenção dizrespeito a uma planta de cultivo transgênica transformada com um ácidonucleico isolado, em que o ácido nucleico compreende um polinucleotídeoselecionado do grupo que consiste de: um polinucleotídeo que tem umaseqüência como apresentada em qualquer uma; das SEQ ID N0 comofornecido na Coluna N0 3 da Tabela 1 e Tabela 2; um polinucleotídeo quecodifica um polipeptídeo que tem uma seqüência como apresentada emqualquer uma das SEQ ID N0 como fornecido na Coluna N0 4 da Tabela 1 eTabela 2; um polinucleotídeo que tem pelo menos 70 % de identidade deseqüência a um polinucleotídeo que tem uma seqüência como apresentada emqualquer uma das SEQ ID N0 como fornecido na Coluna N0 3 da Tabela 1 eTabela 2; um polinucleotídeo que codifica um polipeptídeo que tem pelomenos 70 % de identidade de seqüência a um polipeptídeo que tem umaseqüência como apresentada em qualquer uma das SEQ ID N0 comofornecido na Coluna N0 4 da Tabela 1 e Tabela 2 e um polinucleotídeo quehibridiza-se sob condições estringentes ao complemento de qualquer um dospolinucleotídeos de a) até d) acima.
Preferivelmente, a planta de cultivo transgênica expressa talácido nucleico isolado, preferivelmente, a fim de alterar o fenotipo das plantasem relação a plantas do tipo selvagem não transformadas. Em particular, asplantas de cultivo transgênicas apresentarão desenvolvimento de raizmodulado (preferivelmente, desenvolvimento de raiz aumentado) e/oucrescimento de planta e/ou rendimento e/ou tolerância à tensão sob condiçõesnormais ou de tensão em comparação com uma variedade do tipo selvagem daplanta. Preferivelmente, o SHSRP é da Arabidopsis thaliana, canola, soja,arroz, girassol, cevada, trigo, linhaça ou milho. Isto é, descritos nestes são ogenes de Arabidopsis thaliana serina hidroximetiltransferase 4 (AtSHMT4 eAtSHMT4-2) e homólogos destes em canola, soja, arroz, girassol, cevada,trigo, linhaça e milho.
Em uma outra forma de realização, a invenção diz respeito aplantas de cultivo transgênicas que super-expressam o ácido nucleico quecodifica o SHSRP e demonstram um aumento no desenvolvimento de raiz emais preferivelmente, demonstram um aumento no comprimento da raiz sobcondição normal ou de tensão em comparação com uma variedade do tiposelvagem da planta. Em uma forma de realização, a super-expressão do ácidonucleico que codifica o SHSRP em uma planta demonstra uma tolerânciaaumentada a uma tensão ambiental em comparação com uma variedade deplanta do tipo selvagem. Ainda, em uma outra forma de realização, a super-expressão do ácido nucleico que codifica o SHSRP em uma planta demonstrarendimento aumentado em comparação com uma variedade de planta do tiposelvagem. E fornecido que a tensão ambiental pode ser tensões por salinidade,seca, temperatura, metal, química, patogênica e oxidativa ou combinaçõesdestes. Preferivelmente, a tensão ambiental é a tensão por seca.
Ainda, em uma outra forma de realização, a invenção dizrespeito a uma semente produzida por uma planta de cultivo transgênicatransformada por um ácido nucleico que codifica o SHSRP, em que a planta éa criação exata para o desenvolvimento de raiz aumentado e/ou rendimentoaumentado e/ou tolerância aumentada a tensão ambiental em comparação comuma variedade do tipo selvagem da planta.
Em uma outra forma de realização, a invenção diz respeito aum método de desenvolver plantas de cultivo em um local agrícola, em que ométodo compreende obter a planta de cultivo transgênica já mencionada edesenvolvimento de uma planta em um local agrícola.
Ainda, em um outro aspecto, a invenção diz respeito a produtoproduzido por ou a partir das plantas transgênicas, suas partes de plantas ousuas sementes, tais como um gêneros alimentícios, gêneros de nutrição,suplemento alimentar, suplemento de nutrição, produto cosmético oufarmacêutico.
Em uma outra forma de realização, a invenção diz respeito aum método de aumentar o desenvolvimento de raiz e/ou rendimento e/ouaumento da tolerância à tensão a uma tensão ambiental de uma planta decultivo sob condição normal ou de tensão em comparação com uma variedadedo tipo selvagem da planta, em que o método compreende obter a planta decultivo transgênica já mencionada e desenvolvimento de uma planta sob umacondição que o ácido nucleico isolado é expressado.
Ainda, em uma outra forma de realização, a invenção dizrespeito a um método de produzir a planta de cultivo transgênica jámencionada, em quê o método compreende (a) transformar uma célulavegetal com um vetor de expressão que compreende um ácido nucleico quecodifica o SHSRP e (b) gerar, a partir da célula vegetal a planta de cultivotransgênica que expressa o polipeptídeo codificado. Preferivelmente, opolinucleotídeo é operacionalmente ligado a uma ou mais seqüênciasreguladoras e a expressão do polinucleotídeo na planta resulta emdesenvolvimento de raiz aumentado e/ou rendimento aumentado e/outolerância aumentada a tensão ambiental sob condições normais ou de tensãoem comparação com uma variedade do tipo selvagem da planta.
Preferivelmente, a uma ou mais seqüências reguladoras incluem umpromotor. Mais preferivelmente, o promotor é um promotor reguladoespecífico ou de desenvolvimento de tecido.
Em uma outra forma de realização, a invenção diz respeito aum isolado, novo ácido nucleico que codifica o SHSRP, em que o ácidonucleico que compreende um polinucleotídeo selecionado do grupo queconsiste de: um polinucleotídeo que tem uma seqüência como apresentada emqualquer uma das SEQ ID N0 como fornecido na Coluna N0 3 da Tabela 2;um polinucleotídeo que codifica um polipeptídeo que tem uma seqüênciacomo apresentada em qualquer uma das SEQ ID N0 como fornecido naColuna N0 4 da Tabela 2; um polinucleotídeo que tem pelo menos 90 % deidentidade de seqüência a um polinucleotídeo que tem uma seqüência comoapresentada em qualquer uma das SEQ ID N0 como fornecido na Coluna N0 3da Tabela 2; um polinucleotídeo que codifica um polipeptídeo que tem pelomenos 92 % de identidade de seqüência a um polipeptídeo que tem umaseqüência como apresentada em qualquer uma das SEQ ID N0 comofornecido na Coluna N0 4 da Tabela 2; um polinucleotídeo que hibridiza-sesob condições estringentes ao complemento de qualquer um dospolinucleotídeos de a) até d) acima e um polinucleotídeo complementar aqualquer um dos polinucleotídeos de a) até d) acima.
Em uma outra forma de realização, a invenção diz respeito auma planta transgênica transformada por tais ácidos nucleicos isolados e umasemente produzida por tal planta transgênica. Preferivelmente, a plantatransgênica expressa tais ácidos nucleicos isolados, preferivelmente, a fim dealterar o fenotipo das plantas em relação a plantas do tipo selvagem nãotransformadas. Em particular, as plantas transgênicas apresentarãodesenvolvimento modificado (preferivelmente, aumentado) de raiz e/oucrescimento de planta e/ou rendimento e/ou tolerância à tensão sob condiçõesnormais ou de tensão em comparação com uma variedade do tipo selvagem daplanta.
Ainda, em uma outra forma de realização, a invenção dizrespeito a um vetor de expressão recombinante que compreende um isoladoácido nucleico que codifica o SHSRP, em que o ácido nucleico compreendeum polinucleotídeo selecionado do grupo que consiste de: um polinucleotídeoque tem uma seqüência como apresentada em qualquer uma das SEQ ID N0como fornecido na Coluna N0 3 da Tabela 1 e Tabela 2; um polinucleotídeoque codifica um polipeptídeo que tem uma seqüência como apresentada emqualquer uma das SEQ DD N0 como fornecido na Coluna N0 4 da Tabela 1 eTabela 2; um polinucleotídeo que tem pelo menos 90 % de identidade deseqüência a um polinucleotídeo que tem uma seqüência como apresentada emqualquer uma das SEQ ED N0 como fornecido na Coluna N0 3 da Tabela 1 eTabela 2; um polinucleotídeo que codifica um polipeptídeo que tem pelomenos 92 % de identidade de seqüência a um polipeptídeo que tem umaseqüência como apresentada em qualquer uma das SEQ ID N0 comofornecido na Coluna N0 4 da Tabela 1 e Tabela 2; um polinucleotídeo quehibridiza-se sob condições estringentes ao complemento de qualquer um dospolinucleotídeos de a) até d) acima e um polinucleotídeo complementar aqualquer um dos polinucleotídeos de a) até d) acima.
Preferivelmente, o polinucleotídeo é operacionalmente ligadoa uma ou mais seqüências reguladoras. Mais preferivelmente, a uma ou maisseqüências reguladoras incluem um promotor. Ainda preferivelmente, opromotor é um promotor regulado específico ou de desenvolvimento detecido.
Em uma outra forma de realização, a invenção diz respeito auma planta transgênica que compreende o tal vetor recombinante.Preferivelmente, a expressão do ácido nucleico que codifica o SHSRP naplanta resulta em desenvolvimento de raiz aumentado e/ou rendimentoaumentado e/ou tolerância aumentada a tensão ambiental em comparação comuma variedade do tipo selvagem da planta.
Ainda, em uma outra forma de realização, a invenção dizrespeito a um método de identificar um novo SHSRP, que compreende (a)aumentar uma resposta de anticorpo específico para um SHSRP ou fragmentodeste, como descrito abaixo; (b) avaliação putativa de material de SHSRPcom o anticorpo, em que a ligação específica do anticorpo ao material indica apresença de um SHSRP potencialmente novo e (c) identificar, a partir de ummaterial ligado ao novo SHSRP em comparação com o SHSRP conhecido.
Alternativamente, hibridização com sondas de ácido nucleico como descritoabaixo pode ser usada para identificar os ácidos nucleicos de SHSRP novo.
Em uma outra forma de realização, a invenção também dizrespeito a métodos de modificar o desenvolvimento de raiz e/ou rendimentoe/ou tolerância à tensão de uma planta que compreende, modificar a expressãode um ácido nucleico que codifica o SHSRP na planta. Preferivelmente, talmodificação resulta em desenvolvimento aumentado ou diminuído de raize/ou rendimento e/ou tolerância à tensão em comparação com uma variedadedo tipo selvagem da planta. Preferivelmente, o desenvolvimento de raiz e/ourendimento e/ou tolerância à tensão é aumentado em uma planta porintermédio do aumento de um ácido nucleico que codifica o SHSRP.
BREVE DESCRIÇÃO DOS DESENHOS
Figura 1 mostra a seqüência de nucleotídeo de gene deAtSHMT4 (SEQ ID N°: 1; At4gl3930) usado para a transformação deArabidopsis. A região codificadora do gene é 1416 bp de comprimento com ocódon de partida (isto é, ATG) e o códon de interrupção (isto é, TAG)sublinhado.
Figura 2 mostra a seqüência de aminoácido 471 predita dogene AtSHMT4 usado para a transformação de Arabidopsis (SEQ ID N°: 2).
Figura 3 mostra um esquema do T-DNA do vetor bináriousado para a transformação do gene AtSHMT4 (SEQ ID N°: 1). LB, fronteiraesquerda; pAHAS, promotor de Arabidopsis AHAS; 3!AHAS, sinal determinação de AHAS; SP, Superpromotor;. AtSHMT4, cDNA de AtSHMT4(SEQ ID N°: 1); 3'NOS, sinal de terminação; RB, Fronteira direita.
Figuras 4A e 4B mostram uma análise de placa das plantastransgênicas de Arabidopsis AtSHMT4 (SEQ ID N°: 1). 4A demonstram quetodas as linhas apresentaram um comprimento aumentado do fenotipo da raiz.As linhas 3, 6, 7, 8 e 9 mostraram um aumento do comprimento da raiz maissignificante em comparação com os controles do tipo selvagem. 4B mostra aanálise do nível de gene de plantas transgênicas AtSHMT4, confirmando queas plantas AtSHMT4 apresentaram um comprimento aumentado do fenotipoda raiz. Tanto na 4A quanto na 4B as tabelas anexas mostram os valoresmédios reais usados para a geração dos gráficos de barras.
Figura 5 mostra a análise de solo das raízes de plantasAtSHMT4 (SEQ ID N°: 1), quando o comprimento da raiz de linhasAtSHMT4 Arabidopsis foi medido.
Figura 6 mostra a análise ANOVA do nível de gene dasplantas transgênicas AtSHMT4 (SEQ ID N°: 1). Os dados da análise de todasas linhas transgênicas foram combinados para a determinação do desempenhode gene total.
Figura 7 mostra a análise ANOVA do nível de gene de pesossecos de roseta em plantas transgênicas AtSHMT4 (SEQ ID N°: 1).
Figura 8 mostra os resultados da análise tblastn de AtSHMT4(SEQ ID N0: 2) contra os bancos de dados das seqüências de safrasregistrados. A tabela mostra a porcentagem de identidade de seqüência entreas seqüências de aminoácido de AtSHMT4 (SEQ ID N°: 2) e BnSHMT4-l(SEQ ID N°: 136), GmSHMT4-l (SEQ ID N°: 134), HaSHMT4 (SEQ ID N°:140), TaSHMT4-l (SEQ ID N°: 154), ZmSHMT4-l (SEQ ID N°: 138),LuSHMT4-l (SEQ ID N°: 150), OsSHMT4-l (SEQ ID N°: 142) ouHvSHMT4 (SEQ ID N0: 144).
Figura 9 mostra o alinhamento Blast entre as seqüências deaminoácido de AtSHMT4 (SEQ ID N°: 2, "Queiyn) e BnSHMT4-l (SEQ IDN°: 136, "Sbjct").
Figura 10 mostra o alinhamento Blast entre as seqüências deaminoácido de AtSHMT4 (SEQ ID N°: 2, "Query") e GmSHMT4-l (SEQ IDN°: 134, "Sbjct").
Figura 11 mostra o alinhamento Blast entre as seqüências deaminoácido de AtSHMT4 (SEQ ID N°: 2, "Query") e HaSHMT4 (SEQ IDN°: 140, "Sbjct").
Figura 12 mostra o alinhamento Blast entre as seqüências deaminoácido de AtSHMT4 (SEQ ID N°: 2, "Query") e TaSHMT4-l (SEQ IDN°: 154, "Sbjct").
Figura 13 mostra o alinhamento Blast entre as seqüências deaminoácido de AtSHMT4 (SEQ ID N°: 2, "Query") e ZmSHMT4-l (SEQ IDN°: 138, "Sbjct").
Figura 14 mostra o alinhamento Blast entre as seqüências deaminoácido de AtSHMT4 (SEQ ID N°: 2, "Query") e LuSHMT4-l (SEQ IDN°: 150, "Sbjct").
Figura 15 mostra o alinhamento Blast entre as seqüências deaminoácido de AtSHMT4 (SEQ ID N°: 2, "Queiy") e OsSHMT4-l (SEQ IDN°: 142, "Sbjct").
Figura 16 mostra o alinhamento Blast entre as seqüências deaminoácido de AtSHMT4 (SEQ ID N°: 2, "Query") e HvSHMT4 (SEQ IDN°: 144, "Sbjct").
Figura 17 mostra um alinhamento das seqüências deaminoácido de AtSHMT4 (SEQ ID N°: 2), AtSHMT4-2 (SEQ ID N°: 146),BnSHMT4-2 (SEQ ID N°: 148), GmSHMT4-l (SEQ ID N°: 134),HaSHMT4-l (SEQ ID N°: 152), LuSHMT4-l (SEQ ID N°: 150), OsSHMT4-2 (SEQ ID N0: 155) e TaSHMT4-l (SEQ ID N°: 154). Seqüências deconsenso(SEQ ID N°: 156) também são fornecidas.
DESCRIÇÃO DETALHADA DA INVENÇÃO
A presente invenção pode ser entendida mais facilmente porreferência à seguinte descrição detalhada das formas de realização preferidasda invenção e os exemplos incluídos neste. Entretanto, antes dos presentecompostos, composições e métodos serem divulgados e descritos, deve serentendido que esta invenção não é limitada a ácidos nucleicos específicos,polinucleotídeos específicos, tipos celulares específicos, células hospedeirasespecíficas, condições específicas ou métodos específicos, etc., como talpode, é claro, variar e as modificações numerosas e as variações destesestarão evidentes para aqueles habilitados na técnica. Também deve serentendido que a terminologia usada neste é para o propósito de descreverformas de realização específicas apenas e não é pretendido ser limitante. Emparticular, a denominação das seqüências de aminoácido como polipeptídeo"Polipeptídeos relacionados com a tensão semelhantes a SerinaHidroximetiltransferase" (SHSRPs), de maneira alguma limita afuncionalidade daquelas seqüências.
A presente invenção diz respeito aos ácidos nucleicos quecodificam SHSRPs e SHSRP que são importantes no aumento dodesenvolvimento de raiz de planta e/ou rendimento e/ou para modular umaresposta da planta a uma tensão ambientada. Mais particularmente, super-expressão destes ácidos nucleicos que codificam SHSRP em uma planta decultivo resulta em modulação (aumento ou diminuição, preferivelmenteaumento) no desenvolvimento de raiz e/ou rendimento aumentado e/outolerância aumentada a uma tensão ambientada. Membros representativos dogênero SHSRP são AtSHMT4 isolados de Arabidopsis thaliana e homólogosde comprimento total isolados de canola, soja, girassol, milho, arroz, linhaça ecevada. Em uma forma de realização preferida, todos os membros do gênerosão serina hidroximetiltransferases biologicamente ativos.
Conseqüentemente, a presente invenção abrange uma planta decultivo transgênica que compreende SHSRP polinucleotídeo e seqüências depolipeptídeo e um método de produzir tal planta de cultivo transgênica, emque a expressão da SHSRP polipeptídeo na planta resulta emdesenvolvimento de raiz aumentado e/ou rendimento e/ou tolerância a umatensão ambientada. Em uma forma de realização, as seqüências SHSRP sãode uma planta, preferivelmente uma planta de Arabidopsis, uma planta decanola, uma planta de soja, uma planta de arroz, uma planta de girassol, umaplanta de cevada, uma planta de linhaça, ou uma planta de milho. Em umaoutra forma de realização, as seqüências SHSRP são os genes comosumarizados na Tabela 1 e Tabela 2. Preferivelmente, as seqüências deSHSRP divulgadas tiveram identidade percentual significante com relação àserina hidroximetiltransferases conhecida.
Tabela 1. Genes SHSRP, sua origem, seqüência de nucleotídeoe seqüência de aminoácido correspondente e sua porcentagem de identidadedividida com AtSHMT4 (SEQ ID N°: 2) no nível de aminoácido (Needleman-Wunsch algorithm for global sequence alignment, J. Mol. Biol. 48(3):443-53;Matriz: Blosum 62; Penalidade de abertura de fenda: 10.0; Penalidade deextensão de fenda: 2.0).
<table>table see original document page 18</column></row><table><table>table see original document page 19</column></row><table><table>table see original document page 20</column></row><table><table>table see original document page 21</column></row><table>
A presente invenção ainda abrange novos polinucleotídeoSHSRP e seqüências de polipeptídeo e seu uso para aumentar umdesenvolvimento de raiz de planta e/ou rendimento e/ou tolerância a umatensão ambientada. Nesta forma de realização, as seqüências SHSRP são deArabidopsis, canola, soja, arroz, girassol, cevada, linhaça ou milho ouhomólogas a estes. Preferivelmente nesta forma de realização, opolinucleotídeo SHSRP e seqüências de polipeptídeo são aqueles deArabidopsis, canola, soja, arroz, girassol, cevada, linhaça ou milho comoapresentado em qualquer uma das SEQ ID N0 como fornecido na Coluna N0 3e 4 da Tabela 2.
A presente invenção fornece uma planta transgênicatransformada por um ácido nucleico que codifica o SHSRP, em que expressãoda seqüência de ácido nucleico na planta resulta em desenvolvimento de raizaumentado e/ou rendimento aumentado e/ou tolerância aumentada a umatensão ambiental em comparação com uma variedade do tipo selvagem daplanta. Em particular, o desenvolvimento de raiz aumentado é um aumento nocomprimento das raízes. O termo "planta" como usado neste, dependendo docontexto, pode ser entendido referir-se a plantas totais, células vegetais epartes de plantas que incluem sementes. A palavra "planta" também refere-sea qualquer planta, particularmente, à semente da planta e pode incluir, masnão limitado a, plantas de cultivo. Partes de plantas incluem, mas não sãolimitados a, caules, raízes, óvulos, estames, folhas, embriões, regiõesmeristemáticas, tecidos de calo, gametófitos, esporófitos, pólen, microesporose outros. Em uma forma de realização, a planta transgênica é masculinaestéril. Também é fornecida uma semente de planta produzida por uma plantatransgênica transformada por um ácido nucleico que codifica o SHSRP, emque a semente contém o ácido nucleico que codifica o SHSRPe em que aplanta é de procriação verdadeira para desenvolvimento de raiz aumentadoe/ou rendimento aumentado e/ou tolerância aumentada a tensão ambiental emcomparação com uma variedade do tipo selvagem da planta. A invenção aindafornece uma semente produzida por uma planta transgênica que expressamum SHSRP, em que a semente contém o SHSRP e em que a planta é a criaçãoexata para o desenvolvimento de raiz aumentado e/ou rendimento aumentadoe/ou tolerância aumentada a tensão ambiental em comparação com umavariedade do tipo selvagem da planta. A invenção também fornece umproduto produzido por ou a partir das plantas transgênicas que expressam oácido nucleico que codifica o SHSRP, suas partes de plantas ou suassementes. O produto pode ser obtido usando-se vários métodos bemconhecidos na técnica. Como usado aqui, a palavra "produto" inclui, mas nãolimita-se a gêneros alimentícios, gêneros de nutrição, suplemento alimentar,suplemento de nutrição, produto cosmético ou farmacêutico. Gênerosalimentícios são considerados como composição usados para uma nutrição.Estes também incluem composição para complementar a nutrição. Gêneros denutrição animal e suplementos de nutrição animal, em particular, sãoconsiderados como gêneros alimentícios. A invenção ainda fornece umproduto agrícola produzido por qualquer uma das plantas transgênicas, partesde plantas e sementes vegetais. Produtos agrícolas incluem, mas não sãolimitados a, extratos vegetais, proteínas, aminoácidos, carboidratos, gorduras,óleos, polímeros, vitaminas e outros.
Como usado aqui, o termo "variedade" refere-se a um grupo deplantas dentro de uma espécie que compartilha características constantes queas separam da forma típica e de outras variedades possíveis dentro daquelasespécies. Enquanto possui pelo menos um peculiaridade distintiva, umavariedade também é caracterizada por alguma variação entre os indivíduosdentro da variedade, com base, primariamente na segregação de Mendelian detraços entre a progênie de gerações sucessoras. A variedade é considerada"procriação verdadeira" para uma peculiaridade particular se esta forgeneticamente homozigota para aquela peculiaridade ao ponto que, quando avariedade de procriação verdadeira for auto-polinizada, uma quantidadesignificante de segregação independente da peculiaridade entre a progênie nãoé observada. Na presente invenção, as peculiaridades que surgem a partir daexpressão transgênica de uma ou mais seqüências de DNA introduzido emuma variedade de planta.
As plantas de cultivo de acordo com a invenção serãoentendidas incluir plantas de cultivo dicotiledôneas tal como, por exemplo,das famílias das Leguminosa e tais como ervilha, alfafa e soja; a família dasUmbelliferae, particularmente o gênero Daucus (muito particularmente aespécie carota (cenoura)) e Apium (muito particularmente a espéciegraveolens var. dulce (aipo)) e muitas outras; a família das Solanaceae,particularmente o gênero Lycopersicon, muito particularmente a espécieesculentum (tomate) e o gênero Solanum, muito particularmente a espécietuberosum (batata) e melongena (aubergine), tabaco e muitas outras e ogênero Capsicum, muito particularmente a espécie annum (pimenta) e muitasoutras; a família das Leguminosae, particularmente o gênero Glycine, muitoparticularmente a espécie max (soja) e muitas outras e a família dasCruciferae, particularmente o gênero Brassica, muito particularmente aespécie napus (óleo de semente de colza), campestris (beterraba), oleracea cvTastie (repolho), oleracea cv Snowball Y (couve-flor) e oleracea cv Emperor(brócolis) e o gênero Arabidopsis, muito particularmente a espécie thaliana emuitas outras; a família das Compositae, particularmente o gênero Lactuca,muito particularmente a espécie sativa (alface) e muitas outras e a família dasMalvaceae, particularmente o gênero Gossypium, muito particularmente aespécie conhecida como algodão e a família das Fabaceae, particularmente ogênero Arachis, muito particularmente a espécie hypogaea (amendoim).
As plantas de cultivo de acordo com a invenção tambémincluem plantas de cultivo monocotiledônea, tais como, por exemplo, cereaistais como trigo, cevada, sorgo e painço, centeio, triticale, milho, arroz oucevadas e cana de açúcar. Ainda são preferidas árvores tais como macieira,pereira, marmeleiro, ameixeira, cerejeira, pessegueiro, nectarina,damasqueiro, mamoeiro, mangueira e outras espécies de madeiras incluindoárvores coníferas e decíduas tais como álamo, pinheiro, sequóia, cedro,carvalho, etc. São especialmente preferidos Arabidopsis thaliana, Nicotianatabacum, óleo de semente de colza, soja, milho, trigo, linhaça, batata etagetes.
A presente invenção descreve pela primeira vez que o SHSRPé útil para aumentar um desenvolvimento de raiz de planta de cultivo e/ourendimento e/ou tolerância à tensão ambiental. Como usado aqui, o termopolipeptídeo refere-se a uma cadeia de pelo menos quatro aminoácido unidospelas ligações de peptídeo. A cadeia pode ser linear, ramificada, circular oucombinações destes. Conseqüentemente, a presente invenção fornece o uso,em plantas de cultivo de isolados SHSRPs selecionados de qualquer um dosorganismos como fornecido na Coluna N0 2 da Tabela 1 e Tabela 2 ehomólogos destes. Em formas de realização preferidas, o SHSRP éselecionado de: 1) qualquer um dos polipeptídeos SHSRP como fornecido naColuna N0 4 da Tabela 1 e Tabela 2 e 2) homólogos ou ortólogos destes.Homólogos ou ortólogos das seqüências de aminoácido são definidos abaixo.
O SHSRPs da presente invenção são preferivelmenteproduzidos pelas técnicas de DNA recombinantes. Por exemplo, umamolécula de ácido nucleico que codifica o polipeptídeo é clonada em umvetor de expressão (como descrito abaixo), o vetor de expressão é introduzidoem uma célula hospedeira (como descrito abaixo) e o SHSRP é expressado nacélula hospedeira. O SHSRP pode ser então isolado das células por umesquema de purificação apropriado usando-se técnicas de purificação depolipeptídeo padrão. Para os propósitos da invenção, o termo "polinucleotídeorecombinante" refere-se a um polinucleotídeo que foi alterado, rearranjado oumodificado pela engenharia genética. Exemplos incluem qualquerpolinucleotídeo e polinucleotídeos clonados que são ligados ou unidos àsseqüências heterólogas. O termo "recombinante" não refere-se às alteraçõesaos polinucleotídeos que resultam a partir de ocorrência de eventos naturais,tais como mutações espontâneas. Alternativas à expressão recombinante, umSHSRP ou peptídeo deste, pode ser sintetizado quimicamente usando-setécnicas de síntese de peptídeo padrão. Além disso, SHSRP natural pode serisolado das células (por exemplo, células de Arabidopsis thaliana), porexemplo usando-se um anticorpo anti-SHSRP, que pode ser produzido pelastécnicas padrão que utilizam um SHSRP ou fragmento destes.
Como usado aqui, o termo "tensão ambiental" refere-se acondições sub-ótimas associadas com tensões relativas a salinidade, seca,temperatura, metal, produtos químicos, patogênicos e oxidativos, oucombinações deste. Em formas de realização preferidas, a tensão ambientalpodem ser selecionados a partir de um ou mais dos grupos que consiste desalinidade, seca ou temperatura ou combinações destes e em particular, podeser selecionada de um ou mais dos grupos que consiste de salinidade alta,baixo teor de água (seca), ou temperatura baixa. Em uma forma de realizaçãomais preferida, a tensão ambiental tensão à seca. Como também usado neste,o termo "eficiência do uso de água" refere-se à quantidade de matériaorgânica produzida por uma planta dividida pela quantidade de água usadapela planta na produção desta, isto é, o peso seco de uma planta em relação aouso de água nas plantas. Como usado aqui, o termo "peso seco" refere-se atudo em uma planta que não água e inclui, por exemplo, carboidratos,proteínas e nutrientes minerais. Também deve ser entendido que, como usadono relatório descritivo e nas reivindicações, "um" ou "uma" pode significarum ou mais, dependendo do contexto em que este é usado. Desta maneira, porexemplo, referência a "uma célula" pode significar que pelo menos umacélula pode ser utilizada.
Como também usado neste, o termo "ácido nucleico" e"polinucleotídeo" refere-se ao RNA ou DNA que é linear ou ramificado, defilamento simples ou duplo ou um híbrido destes. O termo também abrangehíbridos de RNA/DNA. O termo também abrange a seqüência não traduzidalocalizados tanto na extremidade 3' quanto na 5' da região codificadora dogene: pelo menos cerca de 1000 nucleotídeos da seqüência a montante daextremidade 5' da região codificadora e pelo menos cerca de 200 nucleotídeosda seqüência a jusante da extremidade 3' da região codificadora do gene.Bases menos comuns, tais como inosina, 5-metilcitosina, 6-metiladenina,hipoxantina e outros também podem ser usados para a anti-sentido, dsRNA eribozima em pares. Por exemplo, polinucleotídeos que contém Análogos depropina C-5 de uridina e citidina foi mostrado ligar RNA com alta afinidade eser inibidores anti-sentido potentes de expressão genética. Outrasmodificações, tal como modificação à cadeia principal de fosfodiéster ou o T-hidróxi no grupo açúcar de ribose do RNA também pode ser realizado. Ospolinucleotídeos e as ribozimas anti-sentido podem consistir totalmente deribonucleotídeos ou pode conter ribonucleotídeos e desoxirribonucleotídeosmistos. Os polinucleotídeos da invenção podem ser produzidos por quaisquermeios, incluindo preparações genômicas, preparações de cDNA, síntese invitro, RT-PCR e transcrição in vitro ou in vivo.
Uma molécula "isolada" de ácido nucleico é uma que ésubstancialmente separada de outras moléculas de ácido nucleico, que estãopresentes na fonte natural do ácido nucleico (isto é, seqüências que codificamoutros polipeptídeos). Preferivelmente, um ácido nucleico "isolado" é isentode algumas das seqüências, que flanqueiam naturalmente o ácido nucleico(isto é, seqüências localizadas nas extremidade 5' e 3' do ácido nucleico) emseu replicon de ocorrência natural. Por exemplo, um ácido nucleico clonado éconsiderado isolado. Em várias formas de realização, a molécula de ácidonucleico de SHSRP isolado pode conter menos do que cerca de 5 kb, 4 kb, 3kb, 2 kb, 1 kb, 0,5 kb ou 0,1 kb de seqüência de nucleotídeos que flanqueiamnaturalmente a molécula de ácido nucleico em DNA genômico das células apartir das quais o ácido nucleico é derivado (por exemplo, uma célula deArabidopsis thaliana). Um ácido nucleico também é considerado isolado seeste for alterado pela intervenção humana ou colocado em um local oulocalização que não é o seu local natural ou se este for introduzido em umacélula por agroinfecção. Além disso, uma molécula de ácido nucleico"isolada", tais como uma molécula de cDNA, pode ser isenta de alguns dosoutros materiais celulares com os quais este é naturalmente associado ou meiode cultura quando produzido pelas técnicas recombinantes ou precursoresquímicos ou outros produtos químicos quando quimicamente sintetizados.
Especificamente excluídos da definição de "ácidos nucleicosisolados" estão: cromossomos de ocorrência natural (tais como propagaçõescromossômicas), bibliotecas cromossômicas artificiais, bibliotecas genômicase bibliotecas de cDNA que existe como uma preparação de ácido nucleico invitro como uma preparação de célula hospedeira transfectada/formatada, emque as células hospedeiras são uma preparação heterogênea in vitro oucolocadas nas placas como uma população heterogênea de colônias simples.Também são especificamente excluída as bibliotecas acima em que um ácidonucleico especificado fabrica menos do que 5 % do número de inserções deácido nucleico nas moléculas de vetores. Ainda são especificamente excluídosas preparações de DNA genômico celular total ou RNA celular total(incluindo preparações celulares totais que são divididos mecanicamente ouenzimaticamente digerido). Ainda são especificamente excluídas aspreparações celulares totais encontradas como uma preparação in vitro oucomo uma mistura heterogênea separada por eletroforese em que o ácidonucleico da invenção ainda não foi separado a partir dos ácidos nucleicosheterólogos no meio de eletroforese (por exemplo, ainda, separando-se porexcisão uma faixa simples de uma população de faixa heterogênea em um gelde agarose ou blot de náilon).
Uma molécula de ácido nucleico de acordo com a presenteinvenção; por exemplo, uma molécula de ácido nucleico que tem umaseqüência de nucleotídeo como apresentada em qualquer uma das SEQ ID N0como fornecido na Coluna N0 3 da Tabela 1 e Tabela 2 ou uma porção destes,pode ser isolada usando-se técnicas de biologia molecular padrão e ainformação de seqüência fornecida. Por exemplo, um SHSRP cDNA pode serisolada de qualquer biblioteca de safra usando-se todo ou uma porção dequalquer uma das SEQ ID N0 como fornecido na Coluna N0 3 da Tabela 1 eTabela 2. Além disso, uma molécula de ácido nucleico que abrange todo ouuma porção de qualquer uma das SEQ ID N0 como fornecido na Coluna N0 3da Tabela 1 e Tabela 2 pode ser isolada pela reação da cadeia de polimeraseusando-se iniciadores de oligonucleotídeo . projetados com base nestaseqüência. Por exemplo, mRNA pode ser isolado das células vegetais (porexemplo, pelo procedimento de extração de guanidínio-tiocianato deChirgwin et al., 1979, Biochemistiy 18:5294-5299) e o cDNA pode serpreparado usando-se transcriptase reversa (por exemplo, Moloney MLVtranscriptase reversa, disponível do Gibco/BRL, Bethesda, MD; outranscriptase reversa AMV, disponível do Seikagaku America, Inc., St.Petersburg, FL). Iniciadores sintéticos de oligonucleotídeo para aamplificação da reação da cadeia de polimerase podem ser projetados combase na seqüência de nucleotídeo como apresentada em qualquer uma dasseqüências mostradas na Coluna N0 3 da Tabela 1 e Tabela 2. Uma moléculade ácido nucleico da invenção pode ser amplificada usando-se cDNA ou,alternativamente, DNA genômico, como um padrão e iniciadores deoligonucleotídeo apropriados de acordo com técnicas de amplificação de PCRpadrão. A molécula de ácido nucleico amplificado desta maneira pode serclonado em um vetor apropriado e caracterizado por análise da seqüência deDNA. Além disso, oligonucleotídeos que correspondem a uma seqüência denucleotídeo de SHSRP pode ser preparada por técnicas sintéticas padrão, porexemplo, usando-se um sintetizador de DNA automatizado.
Em uma forma de realização preferida, uma molécula de ácidonucleico isolada de acordo com a invenção compreende a seqüência denucleotídeos como apresentado em qualquer uma das seqüências mostradasna Coluna N0 3 da Tabela 1 e Tabela 2. Estes cDNAs podem compreender asseqüências que codificam o SHSRPs, (isto é, a "região codificadora"), bemcomo seqüências 5' não traduzidas e seqüências 3' não traduzidas.Alternativamente, a moléculas de ácido nucleico de acordo com a presenteinvenção podem compreender apenas a região codificadora de qualquer umadas seqüências como fornecido na Coluna N0 3 da Tabela 1 e Tabela 2 oupode conter fragmentos genômicos totais isolados de DNA genômico. Apresente invenção também inclui ácidos nucleicos que codificam SHSRP quecodificam SHSRPs como descrito neste. É preferido um ácido nucleico quecodifica o SHSRP que codifica SHSRP como mostrado qualquer uma dasSEQ ID N0 como fornecido na Coluna N0 4 da Tabela 1 e Tabela 2.
Além disso, a molécula de ácido nucleico de acordo com ainvenção podem compreender uma porção da região codificadora de qualqueruma das seqüências como fornecido na Coluna N0 3 da Tabela 1 e Tabela 2,por exemplo, um fragmento que pode ser usado como uma sonda ou iniciadorou um fragmento que codifica uma porção biologicamente ativa de umSHSRP. As seqüências de nucleotídeo determinados a partir da clonagem dogene SHSRP a partir de qualquer um dos organismos como fornecido naTabela 1 e Tabela 2 permite a geração de sondas e iniciadores projetados parao uso na identificação e/ou clonagem de homólogos de SHSRP em outrostipos de células e organismos, bem como homólogos de SHSRP das plantasde cultivo e espécies relacionadas. A porção da região codificadora tambémpode codificar um fragmento biologicamente ativo de um SHSRP.
Como usado aqui, o termo "porção biologicamente ativa de"um SHSRP é pretendido incluir uma porção, por exemplo, umdomínio/motivo, de um SHSRP que participa da modulação dedesenvolvimento de raiz e/ou rendimento e/ou tolerância à tensão em umaplanta e mais preferivelmente, tolerância à seca. Para os propósitos dapresente invenção, modulação de desenvolvimento de raiz e/ou rendimentoe/ou tolerância à tensão refere-se a pelo menos a 10 %o aumento oudiminuição no desenvolvimento das raízes e/ou rendimento e/ou tolerância àtensão de uma planta transgênica que compreende um cassete de expressão deSHSRP (ou vetor de expressão) em comparação com o desenvolvimento deraiz e/ou rendimento e/ou tolerância à tensão de uma planta de controle nãotransgênica. Métodos para a quantificação de crescimento e/ou rendimentoe/ou tolerância à tensão são fornecidos pelo menos nos Exemplos 5, 6 e 17 a19 abaixo. Em uma forma de realização preferida, a porção biologicamenteativa de um SHSRP aumenta um desenvolvimento de raiz da planta,preferivelmente aumentando-se o comprimento da raiz.Porções biologicamente ativas de um SHSRP incluempeptídeos que compreende seqüências de aminoácido derivados da seqüênciade aminoácido de um SHSRP, por exemplo, uma seqüência de aminoácido dequalquer uma das SEQ ID N0 como fornecido na Coluna N0 4 da Tabela 1 eTabela 2 ou a seqüência de aminoácido de um polipeptídeo idêntico para umSHSRP, que inclui menos aminoácido do que um comprimento total SHSRPou o polipeptídeo de comprimento total que é idêntico para um SHSRP eapresenta pelo menos uma atividade de um SHSRP. Tipicamente, porçõesbiologicamente ativas (por exemplo, peptídeos que são, por exemplo, 5, 10,15, 20, 30, 35, 36, 37, 38, 39, 40, 50, 100, ou mais aminoácidos decomprimento) compreende um domínio ou motivo com pelo menos umaatividade de um SHSRP. Além disso, outras porções biologicamente ativasem que outras regiões do polipeptídeo são anuladas, pode ser preparada portécnicas recombinantes e avaliadas por uma ou mais das atividades descritasneste. Preferivelmente, a porção biologicamente ativa de um SHSRP incluium ou mais domínios/motivos selecionados ou porções destes que tem umaatividade serina hidroximetiltransferase.
A invenção também fornece polipeptídeos SHSRP quiméricosou de fusão. Como usado aqui, um SHSRP "polipeptídeo quimérico" ou"polipeptídeo de fusão" compreende um SHSRP operacionalmente ligado aum não-SHSRP. Um SHSRP refere-se a um polipeptídeo tendo umaseqüência de aminoácido que correspondem a um SHSRP, visto que um não-SHSRP refere-se a um polipeptídeo tendo uma seqüência de aminoácido quecorrespondem a um polipeptídeo que não é substancialmente idêntico aoSHSRP, por exemplo, um polipeptídeo que é diferente a partir do SHSRP e éderivado do mesmo organismo ou de um diferente. Com respeito aopolipeptídeo de fusão, o termo "operacionalmente ligado" é pretendido indicarque o SHSRP e o não-SHSRP são usados um com o outro de modo queambas as seqüências satisfaçam a função proposta atribuída à seqüênciausada. O não-SHSRP pode ser usado para o terminal N ou terminal C dasSHSRP. Por exemplo, em uma forma de realização, o polipeptídeo de fusão éum polipeptídeo de fusão GST-SHSRP em que as seqüências de SHSRP sãofundidas ao terminal C das seqüências GST. Tais polipeptídeos de fusãopodem facilitar a purificação de recombinante SHSRPs. Em uma outra formade realização, o polipeptídeo de fusão é um SHSRP contendo uma seqüênciasinalizadora heteróloga em seu terminal N. Em certas células hospedeiras (porexemplo, células hospedeiras de mamífero), expressão e/ou secreção de umSHSRP pode ser aumentado através do uso de uma seqüência sinalizadoraheteróloga.
Preferivelmente, um polipeptídeo SHSRP quimérico ou defusão da invenção é produzido por técnicas padrão de DNA recombinantes.Por exemplo, fragmentos de DNA que codificam quanto às seqüências depolipeptídeos diferentes são ligados juntos na estrutura de acordo comtécnicas convencionais, por exemplo utilizando-se terminais de extremidadeabrupta ou de extremidade escalonada para a ligação, digestão de enzima derestrição para fornecer os terminais apropriados, enchendo de extremidadescoesivas quando apropriado, tratamento com fosfatase alcalina para evitar aunião indesejável e a ligação enzimática. Em uma outra forma de realização, ogene de fusão pode ser sintetizado por técnicas convencionais incluindosensibilizadores de DNA automatizados. Alternativamente, amplificação dePCR de fragmentos de gene pode ser realizado usando-se iniciadores âncoraque dão origem uma projeção complementar entre dois fragmentos genéticosconsecutivos que podem ser subseqüentemente recozidos e amplificadosnovamente para a geração de uma seqüência genética quimérica (Ver, porexemplo, Current Protocols in Molecular Biology, Eds. Ausubel et al. JohnWiley & Sons: 1992). Além disso, muitos vetores de expressão que estãocomercialmente disponíveis já codificam uma porção de fusão (por exemplo,um polipeptídeo GST). Um SHSRP que codificam ácido nucleico pode serclonado em um tal vetor de expressão tal que a porção de fusão seja ligado naestrutura ao SHSRP.
Além dos fragmentos e polipeptídeos de fusão do SHSRPsdescritos nestes, a presente invenção inclui homólogos e análogos deocorrência natural SHSRPs e SHSRP que codificam ácidos nucleicos em umaplanta. "Homólogos" são definidos neste como dois ácidos nucleicos oupolipeptídeos que tem seqüências de nucleotídeo ou aminoácido similares ou"idênticas", respectivamente. Homólogos incluem variantes alélicas,ortólogos, parálogos, agonistas e antagonistas e SHSRPs como definido aseguir. O termo "homólogo" ainda abrange moléculas de ácido nucleico quediferem a partir da seqüência de nucleotídeo como apresentada em qualqueruma das SEQ ID N0 como fornecido na Coluna N0 3 da Tabela 1 e Tabela 2(e porções destes) devido à degeneração do código genético e, desta maneira,codifica o mesmo SHSRP como aquela codificada pela seqüência denucleotídeo correspondente como apresentado em uma tal SEQ ID NO comofornecido na Coluna N0 3 da Tabela 1 e Tabela 2, como usado aqui, aocorrência natural" SHSRP refere-se a uma seqüência de aminoácido deSHSRP que ocorre em estado natural. Preferivelmente, a ocorrência naturalSHSRP compreende uma seqüência de aminoácido de qualquer uma das SEQID N0 como fornecido na Coluna N0 4 da Tabela 1 e Tabela 2.
Um agonista do SHSRP pode reter, substancialmente amesma, ou uma sub-série, de atividades biológicas de SHSRP, um antagonistade SHSRP pode inibir uma ou mais das atividades da forma de ocorrêncianatural do SHSRP.
Moléculas de ácido nucleico que correspondem a variantesalélicas naturais e análogos, ortólogos e parálogos de um SHSRP cDNApodem ser isoladas com base em sua identidade dos ácidos nucleicos SHSRPdescritos nestes usando-se SHSRP cDNAs ou uma porção destes, como umasonda de hibridização de acordo com técnicas de hibridização padrão sobcondições de hibridização estringentes. Em uma forma de realizaçãoalternativa, homólogos de SHSRP podem ser identificados por avaliação debibliotecas combinatórias de mutantes, por exemplo, mutantes detruncamento, de SHSRP pela atividade agonista ou antagonista do SHSRP.
Em uma forma de realização, a biblioteca diversificada de variantes deSHSRP é gerada pela mutagênese combinatória no nível de ácido nucleico e écodificado por uma biblioteca genética diversificada. A bibliotecadiversificada de variantes de SHSRP pode ser produzida, por exemplo,enzimaticamente ligando-se uma mistura de oligonucleotídeos sintéticos nasseqüências genéticas tal que uma série degenerada de seqüências de SHSRPpotenciais é expressável como polipeptídeos individuais ou alternativamente,como uma série de polipeptídeos maiores de fusão (por exemplo, para aapresentação de fago) contendo a série de seqüências de SHSRP neste. Existeuma variedade de métodos que pode ser usado para a produção de bibliotecasde homólogos de SHSRP potenciais de uma seqüência de oligonucleotídeodegenerada. A síntese química de uma seqüência genética degenerada podeser realizada em um sintetizador de DNA automático e o gene sintético éentão ligado em um vetor de expressão apropriado. Uso de uma sériedegenerada de genes permite o fornecimento, em uma mistura, de todas asseqüências que codificam a série desejada de seqüências de SHSRPpotenciais. Métodos para sintetizar oligonucleotídeos degenerados sãoconhecidos na técnica.
Além disso, fragmentos de biblioteca de regiões codificadorasde SHSRP podem ser usadas para a geração de uma população diversificadade fragmentos de SHSRP para a avaliação e seleção subsequente dehomólogos de um SHSRP. Em uma forma de realização, uma biblioteca decodificação de fragmentos de seqüência pode ser gerada pelo tratamento deum fragmento de PCR de filamento duplo de uma seqüência que codificaSHSRP com um nuclease sob condições em que corte ocorre apenas cerca deuma vez por molécula, desnaturando o DNA de filamento duplo, renaturandoo DNA para a formação de DNA de filamento duplo, que pode incluir paressentido/anti-sentido de produtos cortados diferentes, removendo porções defilamento simples dos duplexes reformados pelo tratamento com Si nuclease eligando-se a biblioteca de fragmento resultante em um vetor de expressão. Poreste método, uma biblioteca de expressão pode ser derivada que codificaterminal N, terminal C e fragmentos internos de vários tamanhos de SHSRP.
Diversas técnicas são conhecidos na técnica para avaliarprodutos de gene de bibliotecas combinatórias feitas por mutações outruncações de ponto e para a avaliação de bibliotecas de cDNA para produtosgenéticos que tem uma propriedade selecionada. Tais técnicas são adaptáveispara a avaliação rápida das bibliotecas genéticas geradas pela mutagênesecombinatória de homólogos de SHSRP. As técnicas mais amplamente usadas,que são sensíveis à análise de rendimento alta, para a avaliação de bibliotecasde gene grandes tipicamente incluem a clonagem da biblioteca de gene emvetores de expressão replicáveis, transformando as células apropriadas com abiblioteca resultante de vetores e que expressam os genes combinatórios sobcondições em que a detecção de uma atividade desejada facilita o isolamentodo vetor que codifica o gene cujo produto foi detectado. Mutagênese deconjunto recursiva (REM), uma técnica que intensifica a freqüência demutantes funcionais nas bibliotecas, podem ser usados em combinação comos ensaios de avaliação para identificar homólogos de SHSRP (Arkin andYourvan, 1992, PNAS 89:7S11-7815; Delgrave et al., 1993, PolipeptídeoEngineering 6(3)327-331). Em uma outra forma de realização, ensaios combase em células podem ser usados para analisar uma biblioteca diversa deSHSRP, usando-se os métodos bem conhecidos na técnica. A presenteinvenção ainda fornece um método de identificar a novo SHSRP, quecompreende (a) aumentar uma resposta de anticorpo específico para umSHSRP, ou um fragmento deste, como descrito neste; (b) avaliação putativado material SHSRP com o anticorpo, em que a ligação específica do anticorpoao material indica a presença de um SHSRP potencialmente novo e (c)analisar o material de ligação em comparação com o conhecido SHSRP, paradeterminar sua novidade.
Como estabelecido acima, a presente invenção diz respeito aSHSRPs e homólogos destes. Para determinar a identidade de seqüênciapercentual de duas seqüências de aminoácido (por exemplo, a seqüência dequalquer uma das SEQ ID N0 como fornecido na Coluna N0 4 da Tabela 1 eTabela 2 e uma forma mutante deste), as seqüências são alinhadas para ospropósitos de comparação ótima (por exemplo, fendas podem ser introduzidasna seqüência de um polipeptídeo para o alinhamento ótimo com o outropolipeptídeo ou ácido nucleico). Os resíduos de aminoácido em quecorrespondem posições de aminoácido são então comparados. Quando aposição em uma seqüência (por exemplo, a seqüência de qualquer uma dasSEQ ID N0 como fornecido na Coluna N0 4 da Tabela 1 e Tabela 2) éocupada pelo mesmo resíduo de aminoácido como os que correspondem àposição na outra seqüência (por exemplo, a seqüência de uma forma mutanteSEQ ID NO correspondente como fornecido na Coluna N0 4 da Tabela 1 eTabela 2), então as moléculas são idênticas naquela posição. O mesmo tipo decomparação pode ser feito entre as duas seqüências de ácido nucleico.
A identidade de seqüência percentual entre as duas seqüênciasé uma função do número de posições idênticas divididas pelas seqüências(isto é, identidade de seqüência percentual = números de posiçõesidênticas/números totais de posições χ 100). Preferivelmente, os homólogosde aminoácido isolados incluídos na presente invenção são de pelo menoscerca de 50 a 60 %, preferivelmente pelo menos cerca de 60 a 70 % e maispreferivelmente pelo menos cerca de 70 a 75 %, 75 a 80 %, 80 a 85 %, 85 a90 % ou 90 a 95 % e mais preferivelmente pelo menos cerca de 96 %, 97 %,98 %, 99 % ou mais idêntica a uma seqüência de aminoácido inteira mostradaem qualquer uma das seq ID N0 como fornecido na Coluna N0 4 da Tabela 1e Tabela 2. Ainda, em uma outra forma de realização, os homólogos deaminoácido isolados incluídos na presente invenção são de pelo menos cercade 50 a 60 %, preferivelmente pelo menos cerca de 60 a 70 % e maispreferivelmente pelo menos cerca de 70 a 75 %, 75 a 80 %, 80 a 85 %, 85 a90 % ou 90 a 95 % e mais preferivelmente pelo menos cerca de 96 %, 97 %,98 %, 99 % ou mais idêntica a uma seqüência de aminoácido inteiracodificada por uma seqüência de ácido nucleico mostrada em qualquer umadas seq ID n0 como fornecido na Coluna n0 3 da Tabela 1 e Tabela 2.
Em uma forma de realização, o homólogo de aminoácidoisolado compreende pelo menos um dos seguintes dois motivos conservados.
O primeiro motivo é xjtnkyseg (seq ID N°: 157), em que xi é umresíduo de leucina ou metionina de aminoácido. O segundo motivo éDRIMX2LX3X4Ps (seq ID N°: 158), em que x2 é um resíduo de glicina oualanina de aminoácido, X3 é um resíduo de ácido aspártico ou ácido glutâmicoe X4 é um resíduo de treonina, de prolina ou de leucina de aminoácido.
Em uma outra forma de realização preferida, um homólogo deácido nucleico isolado da invenção compreende uma seqüência denucleotídeo que é pelo menos cerca de 40 a 60 %, preferivelmente pelo menoscerca de 60 a 70 %, mais preferivelmente pelo menos cerca de 70 a 75 %, 75a 80 %, 80 a 85 %, 85 a 90 % ou 90 a 95 % e ainda mais preferivelmente pelomenos cerca de 95 %, 96 %, 97 %, 98 %, 99 % ou mais idêntico a umaseqüência de nucleotídeo mostrada em qualquer uma das SEQ ID N0 comofornecido na Coluna No, 3 da Tabela 1 e Tabela 2 ou a uma porção quecompreende pelo menos 60 nucleotídeos consecutivos destes. O comprimentopreferível da comparação de seqüência para ácidos nucleicos é de pelo menos75 nucleotídeos, mais preferivelmente pelo menos 100 nucleotídeos e maispreferivelmente o comprimento total da região codificadora. Ainda é maispreferível que os homólogos de ácido nucleico codificam proteínas tendohomologia com qualquer uma das SEQ ID N0 como fornecido na Coluna N0 4da Tabela 1 e Tabela 2.
Ainda é preferido que o homólogo de ácido nucleico isoladoda invenção codifica um SHSRP ou porção destes, que é de pelo menos 80 %idêntico a uma seqüência de aminoácido de qualquer uma das SEQ ID N0como fornecido na Coluna N0 4 da Tabela 1 e Tabela 2 e que funciona comoum modulador de desenvolvimento de raiz e/ou rendimento e/ou resposta àtensão ambiental em uma planta, em uma forma de realização mais preferida,superexpressão do homólogo de ácido nucleico em uma planta aumenta odesenvolvimento de raiz da planta e/ou rendimento e/ou a tolerância da plantaa uma tensão ambientada. Em uma outra forma de realização preferida, ohomólogo de ácido nucleico codifica um SHSRP que funciona como umaserina hidroximetiltransferase.
Para os propósitos da invenção, a identidade de seqüênciapercentual entre as duas seqüências de ácido nucleico ou polipeptídeo édeterminada usando-se o algoritmo de alinhamento global de Needleman-Wunsch (J. Mol. Biol. 48(3):443-53) implementado no European MolecularBiology Open Software Suite (EMBOSS). Para os propósitos de alinhamentomúltiplo (algoritmo Clustal W), a penalidade de abertura de fenda é 10 e apenalidade de extensão de fenda é de 0.05 com a matriz blosum62. Deve serentendido que para os propósitos de determinar a identidade de seqüênciaquando compara-se uma seqüência de DNA com uma seqüência de RNA, umnucleotídeo de timidina é equivalente a um nucleotídeo de uracila.
Em um outro aspecto a invenção diz respeito a um ácidonucleico isolado que compreende um polinucleotídeo que hibridiza-se aopolinucleotídeo de qualquer uma das SEQ ID N0 como fornecido na ColunaN0 3 da Tabela 1 e Tabela 2 sob condições estringentes. Maisparticularmente, uma molécula de ácido nucleico isolado de acordo com ainvenção é de pelo menos 15 nucleotídeos de comprimento e hibridiza-se sobcondições estringentes a uma molécula de ácido nucleico que compreende aseqüência de nucleotídeo de qualquer uma das SEQ ID N0 como fornecido naColuna N0 3 da Tabela 1 e Tabela 2. Em outras formas de realização, o ácidonucleico é de pelo menos 30, 50, 100, 250 ou mais nucleotídeos decomprimento. Preferivelmente, um homólogo de ácido nucleico isolado dainvenção compreende uma seqüência de nucleotídeo que hibridiza-se sobcondições altamente estringentes à seqüência de nucleotídeo mostrada emqualquer uma das SEQ ID N0 como fornecido na Coluna N0 3 da Tabela 1 eTabela 2 e funciona como um modulador de desenvolvimento de raiz e/ourendimento e/ou tolerância à tensão em uma planta. Em uma outra forma derealização preferida, super expressão do homólogo de ácido nucleico isoladoem uma planta aumenta um desenvolvimento de raiz da planta e/ourendimento e/ou tolerância a uma tensão ambientada. Ainda, em uma outraforma de realização preferida, o homólogo de ácido nucleico isolado codificaum SHSRP que funciona como um serina hidroximetiltransferase.
Como usado aqui com respeito à hibridização do DNA a umamancha de DNA, o termo "condições estringentes" pode referir-se àhibridização durante a noite a 60° C em solução de 10X Denharfs, 6X SSC50,5 % de SDS e 100 μg/ml de DNA de esperma de salmão desnaturado. Asmanchas são lavadas seqüencialmente a 62° C por 30 minutos de cada vez em3X SSC/0,1 % de SDS, seguido por IX SSC/0,1 % de SDS e finalmente 0,1XSSC/0,1 % de SDS. Em uma forma de realização preferida, a frase "condiçõesestringentes" refere-se à hibridização em uma solução de 6X SSC a 65° C.
Como também usado neste, "condições altamente estringentes" refere-se àhibridização durante a noite a 65° C em solução de 10X Denharts, 6X SSC,0,5 % de SDS e 100 μg/ml de DNA de esperma de salmão desnaturado. Asmanchas são lavadas seqüencialmente a 65° C por 30 minutos de cada vez em3X SSC/0,1 % de SDS, seguido por IX SSC/0,1 % de SDS e finalmente 0,1XSSC/0,1 % de SDS. Métodos para hibridizações de ácido nucleico sãodescritos em Meinkoth e Wahl, 1984, Anal. Biochem. 138:267-284; CurrentProtocols in Molecular Biology, Capítulo 2, Ausubel et al. Eds., GreenePublishing and Wiley-Interscience, New York, 1995 e Tijssen, 1993,Laboratory Techniques in Biochemistry and Molecular Biology: Hibridizationwith Probes of Nucleic Acid, Parte I, Capítulo 2, Elsevier, New York, 1993.Preferivelmente, uma molécula de ácido nucleico isolada da invenção quehibridiza-se sob condições estringentes ou altamente estringentes a umaseqüência de qualquer uma das SEQ ID N0 como fornecido na Coluna N0 3da Tabela 1 e Tabela 2 corresponde a uma molécula de ácido nucleico deocorrência natural. Como usado aqui, a molécula de ácido nucleico"ocorrência natural" refere-se a uma molécula de RNA ou de DNA que temuma seqüência de nucleotídeo que ocorre em estado natural (por exemplo,codifica um polipeptídeo natural). Em uma forma de realização, o ácidonucleico codifica um ocorrência natural SHSRP.
Usando-se os métodos descritos acima e outros conhecidos poraqueles habilitados na técnica, um de habilidade comum na técnica podeisolar os homólogos de SHSRPs que compreende seqüências de aminoácidomostrada em qualquer uma das SEQ ID N0 como fornecido na Coluna N0 4da Tabela 1 e Tabela 2. Uma subsérie destes homólogos é variantes alélicas.
Como usado aqui, o termo "variante alélica" refere-se a uma seqüência denucleotídeo contendo polimorfismos que levam a mudanças na seqüências deaminoácido de um SHSRP e que existe dentro de uma população natural (porexemplo, uma espécie ou variedade natural). Tais variações alélicas naturaispodem, tipicamente, resultar em 1 a 5 % de variação em um ácido nucleicoSHSRP. Variantes alélicas podem ser identificadas sequenciando-se aseqüência de ácido nucleico de interesse em diversas plantas diferentes, quepode ser facilmente realizado usando-se sondas de hibridização paraidentificar os mesmos locais genéticos de SHSRP naquelas plantas. Quaisquere todas tais variações de ácido nucleico os polimorfismos de aminoácidoresultantes ou variações em um SHSRP que são o resultado da variaçãoalélica natural e que não altera a atividade funcional de um SHSRP, sãopretendidos estarem dentro do escopo da invenção.
Além disso, moléculas de ácido nucleico que codificamSHSRPs a partir da mesma ou de outras espécies, tais como SHSRP análogos,ortólogos e parálogos, são pretendidos estarem dentro do escopo da presenteinvenção. Como usado aqui, o termo "análogos" refere-se a dois ácidosnucleicos que tem a mesma função ou similar, mas que se desenvolveuseparadamente em organismos não relacionados. Como usado aqui, o termo"ortólogos" refere-se a dois ácidos nucleicos de espécies diferentes, mas quese desenvolveram de um gene ancestral comum por evolução. Normalmente,ortólogos codificam polipeptídeos tendo as mesmas funções ou similares.
Como também usado neste, o termo "parálogos" refere-se a dois ácidosnucleicos que estão relacionados por duplicação dentro de um genoma.Parálogos usualmente têm funções diferentes, mas estas funções podem estarrelacionadas (Tatusov, R.L. et al., 1997, Science 278(5338):631-637).
Análogos, ortólogos e parálogos de a ocorrência natural SHSRP podem diferirdo ocorrência natural SHSRP pelas modificações pós-translacionais, pelasdiferenças de seqüência de aminoácido ou por ambos. Modificações pós-translacionais incluem derivação química in vivo e in vitro de polipeptídeos,por exemplo, acetilação, carboxilação, fosforilação ou glicosilação e taismodificações podem ocorrer durante a síntese ou processamento ou seguintetratamento com enzimas modificadoras isoladas. Em particular, os ortólogosda invenção, no geral, apresentarão pelo menos 80 a 85 %, maispreferivelmente, 85 a 90 % ou 90 a 95 % e mais preferivelmente 95 %, 96 %,97 %, 98 % ou ainda 99 % de identidade ou 100 % de identidade deseqüência, com todo ou parte de uma ocorrência natural SHSRP seqüência deaminoácido e apresentarão uma função similar para um SHSRP.
Preferivelmente, um ortólogo SHSRP da presente invenção funciona comoum modulador de desenvolvimento e/ou resposta à tensão ambiental em umaplanta e/ou funções como uma proteína de tráfego na vesícula. Maispreferivelmente, um ortólogo SHSRP aumenta o desenvolvimento e/outolerância à tensão de uma planta. Em uma forma de realização, o ortólogoSHSRP funciona como uma serina hidroximetiltransferase.
Além das variantes de ocorrência natural de uma seqüência deSHSRP que pode existir na população, o técnico habilitado estimará quemudanças possam ser introduzidas por mutações em uma seqüência denucleotídeo de qualquer uma das SEQ ED N0 como fornecido na Coluna N0 4da Tabela 1 e Tabela 2, desse modo levando a mudanças na seqüência deaminoácido de SHSRP codificado, sem alterar a atividade funcional doSHSRP. Por exemplo, substituições de nucleotídeo que levam a substituiçõesde aminoácido em resíduos "não-essenciais" de aminoácido podem ser feitosem uma seqüência de qualquer uma das SEQ ID N0 como fornecido naColuna N0 3 da Tabela 1 e Tabela 2. O resíduo de aminoácido "não-essenciais" é um resíduo que pode ser alterado a partir da seqüência do tiposelvagem de um dos SHSRPs sem alterar a atividade do dito SHSRP, vistoque um resíduo de aminoácido "essencial" é requerido para atividade deSHSRP. Outros resíduos de aminoácido, entretanto, (por exemplo, aquelesque não são conservados ou apenas semi-conservados no domínio tendoatividades de SHSRP) mas não sendo essenciais para a atividade e destamaneira são provavelmente responsáveis pela alteração sem alterar aatividade de SHSRP.
Conseqüentemente, um outro aspecto da invenção diz respeitoa moléculas de ácido nucleico que codificam SHSRPs que contém mudançasem resíduos de aminoácido que não são essenciais para atividade de SHSRP.
Tal SHSRPs difere da seqüência de aminoácido de uma seqüência contida emqualquer uma das SEQ ID N0 como fornecido na Coluna No, 4 da Tabela 1 eTabela 2, ainda retém pelo menos uma das atividades de SHSRP descritosnestes. Em uma forma de realização, a molécula de ácido nucleico isoladocompreende uma seqüência de nucleotídeo que codifica um polipeptídeo, emque o polipeptídeo compreende uma seqüência de aminoácido pelo menoscerca de 50 a 60 % idêntica a uma seqüência de qualquer uma das SEQ ID N0como fornecido na Coluna N0 4 da Tabela 1 e Tabela 2, mais preferivelmentepelo menos cerca de 60 a 70 % idêntica a uma seqüência de qualquer uma dasSEQ ID N0 como fornecido na Coluna N0 4 da Tabela 1 e Tabela 2, Aindamais preferivelmente pelo menos cerca de 70 a 75 %, 75 a 80 %, 80 a 85 %,85 a 90 % ou 90 a 95 % idêntica a uma seqüência de qualquer uma das SEQID N0 como fornecido na Coluna N0 4 da Tabela 1 e Tabela 2 e maispreferivelmente pelo menos cerca de 96 %, 97 %, 95 % ou 99 % idêntica auma seqüência de qualquer uma das SEQ ID N0 como fornecido na ColunaN0 4 da Tabela 1 e Tabela 2. O homólogo do SHSRP preferido da presenteinvenção preferivelmente participam de um desenvolvimento de raiz de plantae/ou rendimento e/ou a resposta a tolerância à tensão em uma planta ou maisparticularmente, função como uma serina hidroximetiltransferase.
Uma molécula de ácido nucleico isolada que codificam umSHSRP tendo identidade de seqüência com uma seqüência de polipeptídeo dequalquer uma das SEQ ID N0 como fornecido na Coluna N0 4 da Tabela 1 eTabela 2 pode ser criada introduzindo-se uma ou mais substituições, adiçõesou anulações de nucleotídeo em uma seqüência de nucleotídeo de qualqueruma das SEQ ID N0 como fornecido na Coluna N0 3 da Tabela 1 e Tabela 2,tal que uma ou mais substituições, adições ou anulações são introduzidas nopolipeptídeo codificado. As mutações podem ser introduzidas em umaseqüência de qualquer uma das SEQ ID N0 como fornecido na Coluna N0 3da Tabela 1 e Tabela 2 pelas técnicas padrão, tal como mutagênesedirecionada ao local e mutagênese mediada por PCR. Preferivelmente,substituições de aminoácido conservativas são feitas em um ou mais resíduosde aminoácido não essenciais preditos. A "substituição de aminoácidoconservativa" é uma em que as resíduo de aminoácido é substituído por umresíduo de aminoácido que tem uma cadeia secundária similar.
Famílias de resíduos de aminoácido tendo cadeias secundáriassimilares foram definidas na técnica. Estas famílias incluem aminoácidos comcadeias secundárias básicas (por exemplo, lisina, arginina, histidina), cadeiassecundárias ácidas (por exemplo, ácido aspártico, ácido glutâmico), cadeiassecundárias polares não carregadas (por exemplo, glicina, asparagina,glutamina, serina, treonina, tirosina, cisteina), cadeias secundárias não polares(por exemplo, alanina, valina, leucina, isoleucina, prolina, fenilalanina,metionina, triptofano), cadeias secundárias beta-ramificadas (por exemplo,treonina, valina, isoleucina) e cadeias secundárias aromáticas (por exemplo,tirosina, fenilalanina, triptofano, histidina). Desta maneira, um resíduo deaminoácido não essencial predito em um SHSRP é preferivelmentesubstituído por um outro resíduo de aminoácido da mesma família de cadeiade secundária. Alternativamente, em uma outra forma de realização, mutaçõespodem ser introduzidas aleatoriamente junto com todos ou parte de umaseqüência de codificador de SHSRP, tal como pela mutagênese de saturação emutantes resultantes pode ser avaliados por uma atividade SHSRP descritanestes para identificar mutantes que retém atividade SHSRP. Seguindo amutagênese da seqüência de qualquer uma das SEQ ID N0 como fornecido naColuna N0 3 da Tabela 1 e Tabela 2 o polipeptídeo codificado pode serexpressado de maneira recombinante e a atividade do polipeptídeo pode serdeterminada pela análise do desenvolvimento de raiz e/ou rendimento e/outolerância à tensão de uma planta que expressam o polipeptídeo como descritopelo menos nos Exemplos 5, 6 e 17 a 19.
Adicionalmente, otimizado ácidos nucleicos de SHSRP podemser criados. Preferivelmente, um otimizado ácido nucleico de SHSRP codificaum SHSRP que modula um desenvolvimento de raiz de planta e/ourendimento e/ou tolerância a uma tensão ambientada e mais preferivelmenteaumenta um desenvolvimento de raiz de planta e/ou rendimento e/outolerância a uma tensão ambiental em sua super-expressão na planta, Comousado aqui, "otimizado" refere-se a um ácido nucleico que é projetadogeneticamente para aumentar sua expressão em uma dada planta ou animal.
Para fornecer ácidos nucleicos SHSRP otimizado de planta, a seqüência deDNA do gene pode ser modificado a 1) compreende códons preferidos genesvegetais altamente expressados; 2) compreende um teor de A+T nacomposição com base em nucleotídeo àquele substancialmente encontrado emplantas; 3) formar uma seqüência de iniciação de planta ou 4) eliminarseqüências que causem desestabilização, poliadenilação inadequado,degradação e terminação de RNA ou que forma grampos de cabelo deestrutura secundária ou locais de divisão de RNA. Expressão aumentada deácidos nucleicos de SHSRP em plantas pode ser atingida utilizando-se afreqüência de distribuição de uso de códon em plantas no geral ou em umaplanta particular. Métodos de otimizar a expressão de ácido nucleico emplantas podem ser observados no EPA 0359472; EPA 0385962; Pedido PCTN0 WO 91/16432; Patente U. S. N0 5,380,831; Patente U. S. N0 5,436,391;Perlack et al., 1991, Proc. Natl. Acad, Sei. USA 88:3324-3328 e Murray et al.,1989, Nucleic Acid Res. 17:477-498.
Como usado aqui, "freqüência de uso de códon preferido"refere-se a preferência apresentada por uma célula hospedeira específica nouso de códons de nucleotídeo para especificar um dado aminoácido. Paradeterminar a freqüência de uso de um códon particular em um gene, o númerode ocorrências daquele códon no gene é dividido pelo número total deocorrências de todos os códons que especificam o mesmo aminoácido nogene. Similarmente, a freqüência de uso de códon preferido apresentado poruma célula hospedeira pode ser calculada medindo-se a freqüência de uso decódon preferido em um número grande de genes expressados pelas célulashospedeiras. É preferível que esta análise seja limitada a genes que sãoaltamente expressados pelas células hospedeiras. O desvio percentual dafreqüência de uso de códon preferido por um gene sintético daquele utilizadopor uma célula hospedeira é calculado primeiro determinando-se o desviopercentual de uma freqüência de uso de um códon simples daquele da célulahospedeira seguido para obter o desvio médio em todos os códons. Comodefinido neste, este cálculo inclui códons únicos (isto é, ATG e TGG). Emtermos gerais, o desvio médio total do uso de códon de um gene otimizadodaquele de uma célula hospedeira é calculado usando-se a equação 1A = η = 1Z Xn - Yn XnVezeslOO Z onde Xn= freqüência de uso para o códon η na célulahospedeira; Yn = freqüência de uso para o códon no gene sintético; ηrepresenta um códon individual que específica um aminoácido e número totalde códons é Ζ. O desvio total da freqüência do uso de códon, A, para todos osaminoácidos deve ser, preferivelmente menor do que cerca de 25 % e maispreferivelmente menor do que cerca de 10 %.
Em conseqüência, um ácido nucleico de SHSRP pode serotimizado tal que sua freqüência de distribuição de uso de códon desvia-se,preferivelmente, não mais do que 25 % daquele de genes vegetais altamenteexpressados e, mais preferivelmente, não mais do que cerca de 10 %. Alémdisso, consideração é dada à porcentagem de teor de G+C da terceira basedegenerada (monocotiledôneas parecem favorecer G+C nesta posição, vistoque as dicotiledôneas não). Também é reconhecido que o Nucleotídeo XCG(onde X é A, T, C ou G) é o códon menos preferido em dicotiledôneas, vistoque o Códon XTA é evitado tanto em monocotiledôneas quanto emdicotiledôneas. Otimizado ácidos nucleicos de SHSRP desta invençãotambém têm, preferivelmente CG e TA dupleto evitam índices que seaproximam daqueles da planta hospedeira escolhida (por exemplo,Arabidopsis thaliana, Oryza sativa, etc,). Mais preferivelmente estesdesviam-se daquele do hospedeiro por não mais do que cerca de 10 a 15 %.
Além das moléculas de ácido nucleico que codificam oSHSRPs descritos acima, um outro aspecto da invenção diz respeito àmoléculas de ácido nucleico isoladas que são anti-sentido a estas.Polinucleotídeos anti-sentido são pensados inibir a expressão genética de umpolinucleotídeo alvo ligando-se especificamente o polinucleotídeo alvo einterferindo com a transcrição, divisão, transporte, tradução e/ou estabilidadedo polinucleotídeo alvo. Métodos são descritos na técnica anterior paraalvejar o polinucleotídeo anti-sentido ao DNA cromossômico, a umatranscrição de RNA primária ou um mRNA processado. Preferivelmente, asregiões alvo incluem locais de divisão, códons de iniciação de tradução,códons de terminação de tradução e outras seqüências dentro da estrutura deleitura aberta.
O termo "anti-sentido," para os propósitos da invenção, refere-se a um ácido nucleico que compreende um polinucleotídeo que ésuficientemente complementar a todos ou uma porção de um gene, transcriçãoprimária ou mRNA processado, a fim de interferir com a expressão do geneendógeno. "Complementares" polinucleotídeos são aqueles que são capazesde formar pares de base de acordo com as regras de complementaridades deWatson-Crick padrão. Especificamente, as purinas formarão pares de basecom pirimidinas para a formação a combinação de pares de guanina comcitosina (G:C) e pares de adenina com timina (A:T) no caso de DNA ou paresde adenina com uracila (A:U) no caso de RNA. É entendido que doispolinucleotídeos podem hibridizar um ao outro mesmo se estes são foremcompletamente complementares um ao outro, contanto que cada um tenhapelo menos uma região que é substancialmente complementar à outra. Otermo "ácido nucleico anti-sentido" inclui RNA de filamento simples bemcomo cassetes de expressão de DNA de filamento duplo que podem sertranscritos para a produção de um anti-sentido RNA. "Ativo" anti-sentidoácidos nucleicos são moléculas de RNA anti-sentido que são capazes de sehibridizar seletivamente com uma transcrição primária ou mRNA quecodificam um polipeptídeo que tem pelo menos 80 % de identidade deseqüência com o polipeptídeo de qualquer uma das SEQ ID N0 comofornecido na Coluna N0 4 da Tabela 1 e Tabela 2.
O ácido nucleico anti-sentido pode ser complementar a umfilamento que codifica SHSRP inteiro ou apenas a porção destes. Em umaforma de realização, uma molécula de ácido nucleico anti-sentido é anti-sentido a uma "região codificadora" do filamento de codificação de umaseqüência de nucleotídeo que codificam um SHSRP. O termo "regiãocodificadora" refere-se à região da seqüência de nucleotídeo que compreendecódons que são traduzidos em resíduos de aminoácido. Em uma outra formade realização, a molécula de ácido nucleico anti-sentido é anti-sentido a uma"região não codificadora" do filamento de codificação de uma seqüência denucleotídeo que codificam um SHSRP. O termo "região não codificadora"refere-se as seqüências 5' e 3' que flanqueia a região codificadora que não sãotraduzidas em aminoácidos (isto é, também referido como regiões nãotraduzidas 5' e 3'). A molécula de ácido nucleico anti-sentido pode sercomplementar à região codificadora total do SHSRP mRNA, mas, maispreferivelmente é um oligonucleotídeo que é anti-sentido a apenas umaporção da região codificadora ou não codificadora de SHSRP mRNA. Porexemplo, o oligonucleotídeo anti-sentido pode ser complementar à região quecircunda um local de início de tradução de SHSRP mRNA. Umoligonucleotídeo anti-sentido pode ser, por exemplo, cerca de 5, 10, 15, 20,25, 30, 35, 40, 45 ou 50 nucleotídeos de comprimento. Tipicamente, asmoléculas anti-sentido da presente invenção compreendem um RNA tendo de60 a 100 % de identidade de seqüência com pelo menos 14 nucleotídeosconsecutivos da qualquer uma das SEQ ID N0 como fornecido na Coluna N03 da Tabela 1 e Tabela 2 ou um polinucleotídeo que codifica um polipeptídeode qualquer uma das SEQ ED N0 como fornecido na Coluna N0 4 da Tabela 1e Tabela 2. Preferivelmente, a identidade de seqüência será pelo menos 70 %,mais preferivelmente pelo menos 75 %, 80 %, 85 %, 90 %, 95 % ou 98 % emais preferivelmente 99 %,
Um ácido nucleico anti-sentido da invenção pode serconstruído usando-se síntese química e reações de ligação enzimática usando-se procedimentos conhecidos na técnica. Por exemplo, um ácido nucleicoanti-sentido (por exemplo, um oligonucleotídeo anti-sentido) pode serquimicamente sintetizado usando-se ocorrência natural nucleotídeos ounucleotídeos variadamente modificados projetados para aumentar aestabilidade biológica das moléculas ou para aumentar a estabilidade física doduplex formado entre os ácidos nucleicos anti-sentido e sentido, por exemplo,derivados de fosforotioato e nucleotídeos substituídos por acridina podem serusados. Exemplos de nucleotídeos modificados que podem ser usados paragerar o ácido nucleico anti-sentido inclui 5-fluorouracila, 5-bromouracila, 5-clorouracila, 5-iodouracila, hipoxantina, xantina, 4-acetilcitosina, 5-(carboxiidroxilmetil) uracila, 5-carboximetilaminometil-2-tiouridina, 5-carboximetilaminometiluracila, diidrouracila, beta-D-galactosilqueosina,inosina, N6-isopenteniladenina, 1-metilguanina, 1-metilinosina, 2,2-dimetilguanina, 2-metiladenina, 2-metilguanina, 3-metilcitosina, 5-metilcitosina, N6-adenina, 7-metilguanina, 5-metilaminometiluracila, 5metoxiaminometila-2-tiouracila, beta-D-manosilqueosina, 5'-metoxicarboximetiluracila, 5-metoxiuracila, 2-metiltio-N6-isopenteniladenina, ácido uracil-5-oxiacético (v), wibutoxosina,pseudouracila, queosina, 2-tiocitosina, 5-metil-2-tiouracila, 2-tiouracila, 4-tiouracila, 5-metiluracila, éster metílico de ácido uracil-5-oxiacético, ácidouracil-5-oxiacético (v), 5-metil-2-tiouracila, 3-(3-amino-3-N-2-carboxipropila) uracila, (acp3)w e 2,6-diaminopurina. Alternativamente, oácido nucleico anti-sentido pode ser biologicamente produzido usando-se umvetor de expressão em que um ácido nucleico foi sub-clonado em umaorientação anti-sentido (isto é, RNA transcrito a partir do ácido nucleicoinserido será de uma orientação anti-sentido a um ácido nucleico alvo deinteresse, ainda descrito na seguinte sub-seção).
Ainda, em uma outra forma de realização, a molécula de ácidonucleico anti-sentido da invenção é uma molécula de ácido nucleico a-anomérico. Uma molécula de ácido nucleico α-anomérico forma híbridos defilamento duplo específicos com complementaridade de RNA em que,contrário às [3 unidades β usuais, os filamentos correm em paralelo um aooutro (Gaultier et al., 1957, Nucleic Acid Res. 15:6625-6641). A molécula deácido nucleico anti-sentido também pode compreender um 2'-0-metilribonucleotídeo (Inoue et al., 1987, Nucleic Acid Res.l5:6131-6148) ouum análogo de RNA-DNA quimérico (Inoue et al., 1987, FEBS Lett.215:327-330).
As moléculas de ácido nucleico anti-sentido da invenção sãotipicamente administradas a uma célula ou gerada in situ tal que estashibridizem com e liguem-se ao mRNA celular e/ou DNA genômico quecodificam um SHSRP para, desse modo, inibir expressão do polipeptídeo, porexemplo, inibindo a transcrição e/ou tradução. A hibridização pode ocorrerpor complementaridade de nucleotídeo convencional para a formação de umduplex estável, ou, por exemplo, no caso de uma molécula de ácido nucleicoanti-sentido que liga-se aos duplexes de DNA, através de interaçõesespecíficas no sulco principal da hélice dupla. A molécula anti-sentido podeser modificada tal que esta ligue-se especificamente a um receptor ou umantígeno expressado em uma superfície celular selecionada, por exemplo, pelaligação da molécula de ácido nucleico anti-sentido a um peptídeo ouanticorpo que liga-se a um receptor ou antígeno de superfície celular. Amolécula de ácido nucleico anti-sentido pode ser também liberado paracélulas usando-se os vetores descritos nestes. Para atingir concentraçõesintracelulares suficientes das moléculas anti-sentido, construções de vetor emque as molécula de ácido nucleico anti-sentido é colocado sob o controle deum promotor procariótico, viral ou eucariótico forte são preferidos.
Como uma alternativa aos polinucleotídeos anti-sentido,ribozimas, polinucleotídeos anti-sentido ou RNA de filamento duplo (dsRNA)podem ser usados para reduzir a expressão de um SHSRP polipeptídeo. Comousado aqui, o termo "ribozima" refere-se a uma enzima com base em RNAcatalítico com atividade de ribonuclease que é capaz de clivar um ácidonucleico de filamento único, tal como um mRNA, que tem uma regiãocomplementar. Ribozimas (por exemplo, ribozimas cabeça de martelodescrito em Haselhoff and Gerlach, 1988, Nature 334:585-591) podem serusados para clivar cataliticamente as transcrições de mRNA de SHSRP para,desse modo, inibir tradução de mRNA de SHSRP. A ribozima tendoespecificidade para um SHSRP que codifica ácido nucleico podem serprojetados com base na seqüência de nucleotídeo de um cDNA de SHSRP,como divulgado neste (isto é, qualquer uma das SEQ ID N0 como fornecidona Coluna N0 3 da Tabela 1 e Tabela 2) ou na base de uma seqüênciaheteróloga a ser isolada de acordo com métodos explicados nesta invenção.Por exemplo, um derivado de um Tetraliymena L-19 IVS RNA pode serconstruído em que as seqüência de nucleotídeo do local ativo é complementarà seqüência de nucleotídeo pode ser clivado em um SHSRP que codificamRNA. Ver, por exemplo, Patente U. S. N°. 4,987,071 e 5.116.742 concedidoa Cech et al. Alternativamente, mRNA de SHSRP podem ser usados paraselecionar um RNA catalítico que tem uma atividade de ribonucleaseespecífica de um grupo de moléculas de RNA, Ver, por exemplo, Bartel. D.and Szostak, J.W., 1993, Science 261:1411-1418. Em formas de realizaçãopreferidas, a ribozima conterá uma porção que tem pelo menos 7, 8, 9, 10, 12,14, 16, 18 ou 20 nucleotídeos e mais preferivelmente 7 ou 8 nucleotídeos, quetêm 100 % de complementaridade a uma porção da RNA alvo. Métodos parafabricação de ribozimas são conhecidos para aqueles habilitados na técnica.Ver, por exemplo, Patente U. S. N°. 6,025,167; 5,773,260 e 5,496,698.O termo "dsRNA," como usado aqui, refere-se a híbridos deRNA que compreende dois filamentos de RNA. Os dsRNAs podem serlineares ou circulares em estrutura. Em uma forma de realização preferida,dsRNA é específico para um polinucleotídeo que codifica o polipeptídeo dequalquer uma das SEQ ID N0 como fornecido na Coluna N0 4 da Tabela 1 eTabela 2 ou um polipeptídeo que tem pelo menos 80 % de identidade deseqüência com um polipeptídeo de qualquer uma das SEQ ID N0 comofornecido na Coluna N0 4 da Tabela 1 e Tabela 2. Os RNAs de hibridizaçãopodem ser substancial ou complementarmente. Por "substancialmentecomplementares, é entendido que quando os dois RNAs de hibridização sãootimamente alinhados usando-se o Programa BLAST como descrito acima, asporções de hibridização são, pelo menos 95 % complementares.
Preferivelmente, os dsRNA serão pelo menos 100 pares de base decomprimento. Tipicamente, os RNAs de hibridização serão de comprimentoidêntico com nenhuma projeção de extremidades 5' ou 3' e nenhuma festa.
Entretanto, dsRNAs tendo projeções 5' ou 3' de até 100 nucleotídeos podemser usados nos métodos da invenção.
O dsRNA pode compreender ribonucleotídeos,ribonucleotídeo análogos tal como resíduos 2'-0-metil ribosila oucombinações destes. Ver, por exemplo, Patente U. S. N0. 4,130,641 and4,024,222. Um ácido polirriboinosínico: ácido polirribocitidílico de dsRNA édescrito na patente U. S. 4,283,393. Métodos para a fabricação e uso dedsRNA são conhecidos na técnica. Um método compreende uma transcriçãosimultânea de dois filamentos de DNA complementares, in vivo ou em umamistura de reação in vitro simples. Ver, por exemplo, Patente U. S. N05,795,715. Em uma forma de realização, dsRNA podem ser introduzidos emuma planta ou célula vegetal diretamente por procedimentos de transformaçãopadrão. Alternativamente, dsRNA podem ser expressados em uma célulavegetal pela transcrição de dois RNAs complementares.Outros métodos para a inibição da expressão de geneendógeno, tal como formação de hélice tripla (Moser et al.. 1987, Science238:645-650 and Cooney et al., 1958, Science 241:456-459) e co-supressão(Napoli et al., 1990, A plantuma célula 2:279-289) são conhecidos na técnica.CDNAs de comprimento total ou parcial foram usados para a co-supressão degenes vegetais endógenos. Ver, por exemplo, Patente U. S. N0 4.801.340,5.034.323, 5.231.020 e 5.283.184; Van der Kroll et al., 1990, The Cell Plant2:291-299; Smith et al., 1990, Mol. Gen. Genetics 224:477-481 e Napoli etal., 1990, The Cell Plant 2:279-289.
Para a supressão sentido, acredita-se que a introdução de umatranscrição de blocos de polinucleotídeo sentido dos genes alvocorrespondentes. O polinucleotídeo sentido terá pelo menos 65 % deidentidade de seqüência com o gene vegetal alvo ou RNA. Preferivelmente, opercentual de identidade é de pelo menos 80 %, 90 %, 95 % ou mais. Opolinucleotídeo sentido introduzido necessita ser de comprimento total comrelação ao gene alvo ou transcrição. Preferivelmente, o polinucleotídeosentido terá pelo menos 65 % de identidade de seqüência com pelo menos 100nucleotídeos consecutivos da qualquer uma das SEQ ID N0 como fornecidona Coluna N0 3 da Tabela 1 e Tabela 2. As regiões de identidade podemcompreender introns e/ou exons e regiões não traduzidas.
O polinucleotídeo sentido introduzido podem estar presentesem uma célula vegetal transitoriamente ou pode estar estavelmente integradaem um cromossomo vegetal ou replicon extracromossômico.
Alternativamente, expressão do gene SHSRP pode ser inibidaaivejando-se seqüências de nucleotídeo complementares à região reguladorade uma seqüência de nucleotídeo de SHSRP (por exemplo, um promotor deSHSRP e/ou intensificador) para a formação de estruturas hélicas triplas queevitam a transcrição de um gene SHSRP em células alvo. ver, no geral,Helene, C., 1991, Anticancer Drug Des. 6(6):569-84; Helene, C. et al., 1992,Αηη. Ν. Y. Acad, Sei. 660:27-36 e Maher, L.J., 1992, Bioassays 14(12):807-15.
Além disso dos ácidos nucleicos e polipeptídeos de SHSRPdescritos acima, a presente invenção abrange estes ácidos nucleicos epolipeptídeos ligados a uma porção. Estas porções incluem, mas não sãolimitados a, porções de detecção, porções de hibridização, porções depurificação, porções de liberação, porções de reação, porções de ligação eoutros. Um grupo típico de ácidos nucleicos tendo porções ligadas são sondase iniciadores. Sondas e iniciadores tipicamente compreendem umoligonucleotídeo substancialmente isolado. O oligonucleotídeo tipicamentecompreende um região de seqüência de nucleotídeo que hibridiza-se sobcondições estringentes a pelo menos cerca de 12, preferivelmente cerca de 25,mais preferivelmente cerca de 40, 50 ou 75 nucleotídeos consecutivos da umfilamento sentido da seqüência apresentada em qualquer uma das SEQ ID N0como fornecido na Coluna N0 3 da Tabela 1 e Tabela 2; uma seqüência anti-sentido da seqüência apresentada em qualquer uma das SEQ ID N0 comofornecido na Coluna N0 3 da Tabela 1 e Tabela 2 ou mutantes de ocorrêncianatural destes. Iniciadores com base em uma seqüência de nucleotídeo dequalquer uma das SEQ ID N0 como fornecido na Coluna N0 3 da Tabela 1 eTabela 2 podem ser usados em reações de PCR para clonar homólogos deSHSRP. Sondas com base nas seqüências de nucleotídeos de SHSRP podemser usados para detectar transcrições ou seqüências genômicas que codificamos mesmos polipeptídeos ou substancialmente idênticos. Em formas derealização preferidas, a sonda ainda compreende um grupo de rótulo ligado aeste, por exemplo, o grupo de rótulo pode ser um radioisótopo, um compostofluorescente, uma enzima ou um co-fator de enzima, tais sondas podem serusadas as uma parte de um kit de teste de marcador genômico para aidentificação de células que expressam um SHSRP, tal como medindo-se umnível de um ácido nucleico que codifica SHSRP, em uma amostra de células,por exemplo, que detectam níveis de mRNA de SHSRP ou determinando-secomo um gene de SHSRP genômico foi mutado ou anulado.
Em particular, um método útil para determinar o nível detranscrição do gene (um indicador da quantidade de mRNA disponível para atradução ao gene produto) é realizar um Northern blot (para referência, ver,por exemplo, Ausubel et al., 1985, Current Protocols in Molecular Biology,Wiley; New York). A informação de uma Northern blot pelo menosparcialmente demonstra o grau de transcrição do gene transformado. O RNAcelular total pode ser preparado a partir de células, tecidos ou órgãos pordiversos métodos, todos bem conhecidos na técnica, tal como aquelesdescritos em Bormann, E.R. et al., 1992, Mol. Microbiol. 6:317-326. Paraestimar a presença ou a quantidade relativa do polipeptídeo traduzido a partirdeste mRNA, técnicas padrão, tais como um Western blot, podem serutilizados. Estas técnicas são bem conhecidas por uma pessoa habilitada natécnica. (Ver, por exemplo, Ausubel et al.. 1958, Current Protocols inMolecular Biology, Wiley: New York),
A invenção ainda fornece um vetor de expressão recombinanteisolado que compreende um ácido nucleico de SHSRP, em que expressão dovetor em uma célula hospedeira resulta no desenvolvimento de raizaumentado e/ou rendimento e/ou tolerância à tensão ambiental emcomparação com uma variedade do tipo selvagem da célula hospedeira. Comousado aqui, o termo "vetor" refere-se a uma molécula de ácido nucleico capazde transportar um outro ácido nucleico ao qual este foi ligado, Um tipo devetor é um "plasmídeo," que refere-se a um arco de DNA de filamento duplocircular em que segmentos de DNA adicionais pode ser ligados, Um outrotipo de vetor é um vetor viral, em que os segmentos de DNA podem serligados no genoma viral. Certos vetores são capazes de replicação autônomaem uma célula hospedeira em que estes são introduzidos (por exemplo,vetores bacterianos que tem uma origem bacteriana de replicação e vetoresmamíferos epissomais). Outros vetores (por exemplo, vetores mamíferos nãoepissomais) estão integrados no genoma de uma célula hospedeira naintrodução na célula hospedeira e desse modo são replicados junto com ogenoma hospedeiro. Além disso, certos vetores são capazes de direcionar aexpressão de genes ao qual estes são operacionalmente ligado. Tais vetoressão referidos neste as " vetores de expressão". No geral, vetores de expressãode utilidade nas técnicas de DNA recombinantes estão freqüentemente naforma de plasmídeos. No presente relatório descritivo, "plasmídeo" e "vetor"podem ser usados de maneira intercambeável assim como o plasmídeo é aforma mais comumente usada de vetor. Entretanto, a invenção é pretendidaincluir tais outras formas de vetores de expressão, tais como vetores virais(por exemplo, retrovírus imperfeitos de replicação, adenovírus e vírus adeno-associados), que cumprem funções equivalentes.
Os vetores de expressão recombinantes da invençãocompreendem um ácido nucleico da invenção em uma forma adequada paraexpressão do ácido nucleico em uma célula hospedeira, significando que osvetores de expressão recombinantes incluem uma ou mais seqüênciasreguladoras, selecionada na base das células hospedeiras a serem usadas paraa expressão, que é operacionalmente ligada a uma seqüência de ácidonucleico a ser expressado. Como usado aqui com respeito a um vetor deexpressão recombinante, "operacionalmente ligado" é pretendido significarque a seqüência de nucleotídeo de interesse é ligada a uma seqüênciareguladora de uma maneira que permita a expressão do seqüência denucleotídeo (por exemplo, em um sistema de transcrição/tradução in vitro ouem uma célula hospedeira quando o vetor é introduzido na célula hospedeira).O termo "seqüência reguladora" é pretendida incluir promotores,intensificadores e outros elementos de controle de expressão (por exemplo,sinais de poliadenilação). Tais seqüências reguladoras são descritas, porexemplo, in Goeddel, Gene Expression Technology: Methods in Enzymology185, Academic Press, San Diego3 CA (1990) e Gruber and Crosby, em:Methods in Plant Molecular Biology and Biotechnology, eds. Glick andThompson, Capítulo 7, 89-108, CRC Press: Boca Raton, Florida, que incluemas referências neste. Seqüências reguladoras incluem aqueles que direcionama expressão constitutiva da seqüência de nucleotídeo em muitos tipos decélulas hospedeiras e aqueles que direcionam expressão do seqüência denucleotídeo apenas em certas células hospedeiras ou sob certas condições.Será estimado por aqueles habilitados na técnica que o projeto do vetor deexpressão pode depender de tais fatores como a escolha da célula hospedeira aser transformada, o nível de expressão de polipeptídeo desejado, etc. Osvetores de expressão da invenção podem ser introduzidos em célulashospedeiras para desse modo, produzir polipeptídeos ou peptídeos, incluindopolipeptídeos ou peptídeos de fusão, codificada por ácidos nucleicos comodescrito neste (por exemplo, SHSRPs, formas mutantes de SHSRPs,polipeptídeos de fusão, etc.).
Os vetores de expressão recombinantes da invenção podem serprojetados para a expressão de SHSRPs em células procarióticas oueucarióticas. Por exemplo, gene SHSRPs podem ser expressados em célulasbacterianas, tais como C. glutamicum, células de inseto (usando-se vetores deexpressão de baculovírus), leveduras e outras células fungicas (Ver Romanos,M.A. et al., 1992, Foreign gene expression in yeast: a review, Yeast 8:423-488; van den Hondel, C.A.M.J.J. et al., 1991, Heterologous gene expressionin filamentous fungi, in: More Gene Manipulations in Fungi, J.W. Bennet &Lasure, eds., p. 396-428: Academic Press: San Diego e van den Hondel,C.A.M.J.J. & Punt, P.J„ 1991, Gene transfer systems and vetor developmentfor filamentous fungi, in: Applied Molecular Genetics of Fungi, Peberdy, J.F.et al., eds., p. 1-28, Cambridge University Press: Cambridge), algas(Falciatore et al., 1999, Marine Biotechnology 1(3):239-251), ciliados dostipos: Holotrichia, Peritrichia, Spirotrichia, Suctoria, Tetrahymena,Paramecium, Colpidium, Glaucoma, Platyophrya, Potomacus,Pseudocohnilembus, Euplotes, Engelmaniella e Stylonychia, especialmentedo gênero Stylonychia lemnae com vetores que seguem o método detransformação como descrito no Pedido PCT N0 WO 98/01572 e célulasvegetais multicelulares (Ver Schmidt, R. and Willmitzer, L., 1988, Highefficiency Agrobacterium tumefaciens-mediated transformação deArabidopsis thaliana Ieaf and cotyledon explants, Plant Cell Rep. 583-586;Plant Molecular Biology and Biotechnology, C Press, Boca Raton, Florida,capítulo 6/7, S.71-119 (1993); F.F. White, B. Jenes et al., Techniques forGene Transfer, in: Planta transgênicas, Vol. 1, Engineering and Utilization,eds. Kung and R. Wu, 128-43, Academic Press: 1993; Potrykus, 1991, Annu.Rev. Plant Physiol. Plant Molec. Biol. 42:205-225 e referências citadas neste)ou células de mamíferos. Células hospedeiras adequadas ainda são debatidasem Goeddel, Gene Expression Technology: Methods in Enzymology 185,Academic Press: San Diego, CA (1990). Alternativamente, o vetor deexpressão recombinante pode ser transcrito e traduzido in vitro, por exemplousando-se seqüências reguladoras promotoras de T7 e polimerase T7.
Expressão de polipeptídeos em procariotas é maisfreqüentemente realizada com vetores contendo promotores constitutivos ouindutíveis direcionar a expressão de polipeptídeos de fusão ou não fusão. Osvetores de fusão adicionam diversos aminoácidos a um polipeptídeocodificado neste, usualmente ao terminal amino do polipeptídeo recombinantemas também o terminal C ou fundido dentro de regiões adequadas nospolipeptídeos. Tais vetores de fusão tipicamente satisfazem três propósitos: 1)aumentar a expressão de um polipeptídeo recombinante; 2) aumentar asolubilidade de um polipeptídeo recombinante e 3) ajudar na purificação deum polipeptídeo recombinante atuando-se como um ligando na purificaçãopor afinidade. Freqüentemente, em vetores de expressão de fusão, um local declivagem proteolítico é introduzido na junção da porção de fusão e opolipeptídeo recombinante para permitir a separação do polipeptídeorecombinante a partir da porção de fusão subsequente à purificação dopolipeptídeo de fusão. Tais enzimas e seqüências de reconhecimentocognatas, incluem o Fator Xa5 trombina e enterocinase.
Vetores de expressão de fusão típicos incluem pGEX(Pharmacia Biotech Inc; Smith, D.B. and Johnson, K,S., 1988, Gene 67:31-40), pMAL (New England Biolabs, Beverly, MA) e pRIT5 (Pharmacia,Piscataway, NJ) que fundem glutationa S-transferase (GST), polipeptídeo deligação de maltose E ou polipeptídeo A, respectivamente, ao polipeptídeorecombinante alvo. Em uma forma de realização, a seqüência codificadora doSHSRP é clonada em um vetor de expressão pGEX para criar um vetor quecodificam a polipeptídeo de fusão que compreende, do terminal N ao terminalC, polipeptídeo de local X da clivagem de trombina GST-trombina. Opolipeptídeo de fusão pode ser purificada por cromatografia por afinidadeusando-se resina de glutationa-agarose, SHSRP recombinante não fundido aoGST pode ser recuperado por clivagem do polipeptídeo de fusão comtrombina.
Exemplos de vetores de E. coli não indutíveis por fusãoadequados incluem pTrc (Amann et al., 1988, Gene 69:301-315) e pET Iid(Studier et al., Gene Expression Technology: Methods in Enzymology 185,Academic Press, San Diego, Califórnia (1990) 60-89). Expressão do genealvo do vetor de pTrc conta com a transcrição da RNA polimerase dohospedeiro de um promotor de trp-lac híbrido. A expressão do gene alvo dovetor pET Ild conta com a transcrição de um promotor de fusão de T7 gnlO-Iac mediado por uma RNA polimerase viral co-expressada (T7 gnl). Estapolimerase viral é fornecida pelas cepas hospedeiras BL21(DE3) ouHMS174(DE3) de um pró-fago residente que abriga um gene T7 gnl sob ocontrole transcricional do promotor IacUV 5.
Uma estratégia de maximizar expressão recombinante depolipeptídeo é expressar o polipeptídeo em uma bactéria hospedeira com umacapacidade prejudicada para clivar proteoliticamente o polipeptídeorecombinante (Gottesman, S., Gene Expression Technology: Methods inEnzymology 185, Academic Press, San Diego, Califórnia (1990) 119-128).Uma outra estratégia é alterar a seqüência do ácido nucleico a ser inserida noum vetor de expressão de modo que os códons individuais para cadaaminoácido são aqueles preferivelmente utilizados na bactéria escolhida paraa expressão, tais como C. glutamicum (Wada et al., 1992, Nucleic AcidRes.20:2111-2118). Tal alteração de seqüências de ácido nucleico dainvenção pode ser realizada pelas técnicas de síntese de DNA padrão.
Em uma outra forma de realização, o vetor de expressão deSHSRP é um vetor de expressão de levedura; Os vetores para a expressão emlevedura S. cerevisiae incluem pYepSecl (Baldari, et al., 1987, EMBO J.6:229-234), pMFa (Kurian and Herskowitz, 1982, Cell 30:933-943), pJRY88(Schultz et al.; 1987, Gene 54:113-123) e pYES2 (Invitrogen Corporation,San Diego, CA). Vetores e métodos para a construção de vetores apropriadospara o uso em outros fungos, tais como os fungos filamentosos, incluemaqueles detalhados em: van den Hondel, C.A.M.J.J. & Punt, PJ., 1991, "Genetransfer systems and vetor development for filamentous fungi," em: AppliedMolecular Genetics of Fungi, J.F. Peberdy, et al., eds., p. 1-28, CambridgeUniversity Press: Cambridge.
Em uma forma de realização preferida da presente invenção,os SHSRPs são expressados em plantas e células vegetais, tais como célulasvegetais unicelulares (por exemplo, algas) (Ver Falciatore et al., 1999, MarineBiotechnology 1(3):239-251 e referências neste) e células vegetais a partir deplantas superiores (por exemplo, os espermatófitos, tais como plantas decultivo). Um SHSRP pode ser "introduzido" em uma célula vegetal porqualquer meio, incluindo transfecção, transformação ou transdução,eletroporação, bombardeamento de partícula, agroinfecção e outros. Ummétodo de transformação conhecido por aqueles habilitados na técnica é aimersão de uma planta em floração em uma solução de Agrobacteria, em quea Agrobacteria contém o ácido nucleico de SHSRP, seguido pela criação dosgametas transformados.
Outros métodos adequados para transformar ou transfectarcélulas hospedeiras incluindo células vegetais podem ser observados noSambrook, et al. (Molecular Cloning: A Laboratory Manual, última ed., ColdSpring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold SpringHarbor, NY5 1989) e outros manuais de laboratório tais como Methods inMolecular Biology, 1995, Vol. 44, Agrobacterium protocols, ed: Gartland andDavey, Humana Press, Totowa, New Jersey. Como o desenvolvimentoaumentado e tolerância à tensão biótica e abiótica aumentada sãopeculiaridades gerais desejadas serem herdadas em uma ampla variedade deplantas como o milho, trigo, centeio, aveia, triticale, arroz, cevada, sorgo,painço, cana de açúcar, soja, amendoim, algodão, semente de colza e canola,mandioca, pimenta, girassol e tagetes, plantas solanáceas como batata, tabaco,berinjela e tomate, espécies Vicia, ervilha, alfafa, plantas arbustivas (café,cacau, chá), espécies Salix, árvores (dendezeiro, coco), gramas perenes esafras de forragem, estas plantas de cultivo também são plantas alvopreferidas para a engenharia genética como uma outra forma de realização dapresente invenção. Safras de forragem incluem, mas não são limitados a,Trigograss, Canarygrass, Bromegrass, Wildrye Grass, Bluegrass,Orchardgrass, Alfafa, Salfoin, Birdsfoot Trefoil, Alsike Clover, Red Clover eSweet Clover.
Em uma forma de realização da presente invenção, atransfecção de um SHSRP em uma planta é atingido pela transferênciagenética mediada por Agrobacterium. Transformação de planta mediada porAgrobacterium pode ser realizada usando-se por exemplo o GV3101(pMP90)(Koncz and Schell, 1986, Mol. Gen. Genet. 204:383-396) ou LBA4404(Clontech) cepa Agrobacterium tumefaciens. A transformação pode serrealizada pela transformação padrão e técnicas de regeneração (Deblaere etai., 1994, Nucl. Acids. Res. 13:4777-4788; Gelvin, Stanton B. andSchilperoort, Robert A, Plant Molecular Biology Manual, 2nd Ed. - Dordrecht:Kluwer Academic Publ., 1995. - in Sect., Ringbuc Zentrale Signatur: BTll-PISBN 0-7923-2731-4; Glick, Bernard R.; Thompson, John E., Methods inPlant Molecular Biology and Biotechnology, Boca Raton: CRC Press, 1993360 S., ISBN 0-8493-5164-2). Por exemplo, semente de colza pode sertransformada por intermédio da transformação de cotiledônea ou hipocotila(Moloney et al., 1989, Plant Cell 8:238-242; De Block et al., 1989, PlantPhysiol. 91:694-701). O uso de antibióticos contra Agrobacterium e seleçãode plantas depende do vetor binário e da cepa de Agrobacterium usado para atransformação. A seleção da semente de colza é normalmente realizadausando-se canamicina como o marcador vegetal não selecionável.Transferência de gene mediada por Agrobacterium ao linho pode ser realizadausando-se, por exemplo, uma técnica descrita por Mlynarova et al., 1994,Plant Cell Report 13:282-285. Adicionalmente, a transformação de soja podeser realizada usando-se por exemplo uma técnica descrita em PatenteEuropéia N0 0424 047, Patente U. S. N0 5.322.783, Patente Européia N0 0397687, Patente U. S. N0 5.376.543 ou Patente U. S. N0 5,169,770. Atransformação do milho pode ser atingida por bombardeamento de partícula, aabsorção de DNA mediada por polietileno glicol ou por intermédio da técnicada fibra de carbeto de silício. (Ver, por exemplo, Freeling and Walbot "Themaize handbook" Springer Verlag: New York (1993) ISBN 3-540-97826-7),Um exemplo específico da transformação do milho é observado na Patente U.S. N0 5.990.387 e um exemplo específico de transformação de trigo podemser observados no Pedido PCT N0 WO 93/07256.
De acordo com a presente invenção, o SHSRP introduzidopode ser mantido em uma célula vegetal estavelmente se esta for incorporadoem um replicon autônomo não cromossômico ou integrado em umcromossomo vegetal, Alternativamente, o SHSRP introduzido pode estarpresente em um vetor extra-cromossômico não replicante e pode sertransitoriamente expressado ou transitoriamente ativo.
Em uma forma de realização, um microorganismorecombinante homólogo pode ser criado em que um SHSRP é integrado emum cromossomo, um vetor é preparado contendo pelo menos uma porção deum gene SHSRP em que uma anulação, adição ou substituição foiintroduzida, desse modo, para alterar, por exemplo, interromper,funcionalmente, o gene de SHSRP. Preferivelmente, o gene de SHSRP équalquer um dos genes SHSRP como fornecido na Tabela 1 e Tabela 2, maseste pode ser homólogo a partir de uma planta ou levedura relacionadas ouainda a partir de uma fonte de mamífero ou de inseto. Em uma forma derealização, o vetor é projetado, tal que, na recombinação homóloga, o geneSHSRP endógeno seja funcionalmente interrompido (isto é, não codifica maisum polipeptídeo funcional; também referido como um vetor de nocaute).Alternativamente, o vetor pode ser projetado, tal que, na recombinaçãohomóloga, o gene de SHSRP endógeno seja mutado ou de outra maneiraalterado mas que ainda codifica um polipeptídeo funcional (por exemplo, aregião reguladora a montante pode ser alterada deste modo, altera a expressãode SHSRP endógeno). Para criar um ponto de mutação por intermédio darecombinação homóloga, os híbridos de DNA de RNA podem ser usados emuma técnica conhecida como quimeraplastia (Cole-Strauss et al., 1999,Nucleic Acid Research 27(5): 1323-1330 and Kmiec, 1999, Gene TherapyAmerican Scientist 87(3):240-247). Procedimentos de recombinaçãohomóloga de Arabiodopsis thaliana, por exemplo, são bem conhecidos natécnica e são abrangidos para o uso neste.
Visto que no vetor de recombinação homóloga, a porçãoalterada do gene SHSRP é flanqueado em suas extremidades 5' e 3' para umamolécula de ácido nucleico adicional do gene SHSRP para permitir que arecombinação homóloga ocorra entre o gene SHSRP exógeno realizado pelovetor e um gene de SHSRP endógeno, em um microorganismo ou planta. Amolécula de ácido nucleico de SHSRP de flanqueamento adicional é decomprimento suficiente para a recombinação homóloga bem sucedida com ogene endógeno. Tipicamente, diversas centenas de pares de base atéquilobases de DNA de flanqueamento (tanto nas extremidades 5' quanto 3')estão incluídos no vetor (Ver por exemplo, Thomas, K.R. e Capecchi, M.R„1987, Cell 51:503 para uma descrição de vetores de recombinação homóloga).
O vetor é introduzido em um microorganismo ou célula vegetal (por exemplo,por intermédio de DNA mediado por polietileno glicol) e células em que ogene de SHSRP introduzido recombinou homologamente com o gene deSHSRP endógeno são selecionados usando-se técnicas conhecidas na técnica.
Em uma outra forma de realização, microorganismosrecombinantes podem ser produzidos contendo sistemas selecionados que aexpressão regulada do gene introduzido. Por exemplo, a inclusão de um genede SHSRP em um vetor colocando-o sob o controle do operon Iac permiteexpressão do gene SHSRP apenas na presença de IPTG. Tais sistemasreguladores são bem conhecidos na técnica.
Quando presente em um vetor extra-cromossômico nãoreplicante ou um vetor que é integrado em um cromossomo, o polinucleotídeode SHSRP preferivelmente reside em um cassete de expressão vegetal. Umcassete de expressão vegetal preferivelmente contém seqüências reguladorascapazes de conduzir a expressão genética em células vegetais que sãooperacionalmente ligado de modo que cada seqüência possa cumprir suafunção, por exemplo, terminação de transcrição por sinais de poliadenilação.Sinais preferidos de poliadenilação são aqueles que se originam-se de t-DNAde Agrobacterium tumefaciens tal como o gene 3 conhecido como octopinasintase do Ti-plasmídeo pTiACH5 (Gielen et al., 1984, EMBO J. 3:835) ouseus equivalentes funcionais, mas também outros terminadoresfuncionalmente ativos em plantas são adequados. Como a expressão do genevegetal é muito freqüentemente não limitado em níveis de transcrição, umcassete de expressão vegetal preferivelmente contém outras seqüênciasoperacionalmente ligadas como intensificadores de tradução tal como aseqüência de supercondução contendo a seqüência líder não traduzida 5' dovírus mosáico do tabaco que intensifica o polipeptídeo por taxa de RNA(Gallie et al., 1957, Nucl. Acids Research 15:8693-8711). Os exemplos devetores de expressão de planta incluem aqueles detalhados em: Becker, D.,Kemper, E., Schell, J. and Masterson, R., 1992, New plant binary vetores withselectable markers located proximal to the Ieft border, Plant Mol. Biol. 20:1195-1197 e Bevan, M.W., 1984, Binary Agrobacterium vetors for planttransformation, Nucl. Acid. Res. 12:8711-8721; Vetors for Gene Transfer inHigher Plants; em: Transgenic Plants, Vol. 1, Engineering and Utilization,eds.: Kung and R. Wu5 Academic Press, 1993, S. 15-38.
A expressão de gene vegetal dever ser operacionalmenteligada a um promotor apropriado que confere expressão genética de umamaneira específica de célula ou específica de tecido conveniente. Ospromotores úteis nos cassetes de expressão da invenção incluem qualquerpromotor que seja capaz de iniciar a transcrição em uma célula vegetal. Taispromotores incluem, mas não são limitados àqueles que podem ser obtidos apartir de plantas, vírus de plantas e bactérias que contêm genes que sãoexpressados em plantas, tais como Agrobaeterium e Rhizobium.
O promotor pode ser constitutivo, indutível, preferido deestágio de desenvolvimento, preferido do tipo celular, preferido de tecido oupreferido de órgão. Os promotores constitutivos são ativos sob a maioria dascondições. Os exemplos de promotores constitutivos incluem os promotoresCaMV 19S e 35S (Odell et al., 1985, Nature 313:810-812), o promotor do sXCaMV 35S (Kay et al., 1987, Science 236:1299-1302) o promotor Sepl, opromotor da actina do arroz (McElroy et al., 1990, Plant Cell 2:163-171), opromotor de actina de Arabidopsis, o promotor de ubiquitan (Christensen etal., 1989, Plant Molec. Biol. 18:675-689), pEmu (Last et al., 1991, Theor.Appl. Genet. 81:581-588), promotor 35S do vírus mosáico da escrofulária, opromotor Smas (Velten et al., 1984, EMBO J 3:2723-2730), o super-promotor(Patente U. S. N0 5.955.646), o promotor de GRP1-8, o promotor dedesidrogenase de álcool cinamílico (Patente U. S. N0 5.683.439), promotoresdo T-DNA de Agrobacterium, tais como manopina sintase, nopalina sintase eoctopina sintase, a subunidade pequena de promotor de carboxilase debifosfato de ribulose (ssuRUBISCO) e outros.
Promotores indutíveis são preferivelmente ativos sob certascondições ambientais, tais como a presença ou ausência de um nutriente oumetabólito, calor ou frio, luz, ataque de patogênio, condições anaeróbicas eoutros. Por exemplo, o promotor hsp80 do Brassica é induzido pelo choque decalor; o promotor PDDK é induzido por luz; o promotor PR-I do tabaco,Arabidopsis e milho são indutíveis por infecção com um patógeno e opromotor Adhl é induzido por hipoxia e tensão ao frio. A expressão de genevegetal também pode ser facilitada por intermédio de um promotor indutível(Para revisão, ver Gatz, 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol.48:89-108). Promotores quimicamente indutíveis serão especialmenteadequados se for desejado que a expressão genética ocorra em uma maneiraespecífica no tempo. Exemplos de tais promotores são um promotor de ácidosalicílico indutível (Pedido PCT N0 WO 95/19443), um promotor detetraciclina indutível (Gatz et al., 1992, Plant J. 2:397-404) e um promotorindutível de etanol (Pedido PCT N0 WO 93/21334).
Em uma forma de realização preferida da presente invenção, opromotor indutível é um promotor indutível por tensão. Para os propósitos dainvenção, promotores de tensão indutíveis são preferivelmente ativos sob umaou mais das seguintes tensões: condições sub-ótimas associadas com a tensõesa salinidade, seca, temperatura, metal, produtos químicos, patogênicas eoxidativas. Promotores de tensão indutíveis incluem, mas não são limitados a,Cor78 (Chak et al., 2000, Planta 210:875-883; Hovath et al., 1993, PlantPhysiol. 103:1047-1053), Corl5a (Artus et al., 1996, PNAS 93(23):13404-09), Rci2A (Medina et al., 2001, Plant Physiol. 125:1655-66; Nylander et al.,2001, Plant Mol. Biol. 45:341-52; Navarre and Goffeau, 2000, EMBO J.19:2515-24; Capei et al., 1997, Plant Physiol. 115:569-76), Rd22 (Xiong etal., 2001, Plant Cell 13:2063-83; Abe et al., 1997, Célula vegetal 9:1859-68;Iwasaki et al., 1995, Mol, Gen. Genet. 247:391-8), cDet6 (Lang and Palve,1992, Plant Mol. Biol. 20:951-62), ADHl (Hoeren et al., 1998, Genetics149:479-90), KATl (Nakamura et al., 1995, Plant Physiol. 109:371-4), KSTl(Muller-Rober et al., 1995, EMBO 14:2409-16), Rhal (Terryn et al., 1993,Plant Cell 5:1761-9; Terryn et al., 1992.1-EBS Lett. 299(3):287-90), ARSKl(Atkinson et al., 1997, Acessão GenBank # L22302 e Pedido PCT N0 WO97/20057), PtxA (Plesch et al., Acessão GenBank # X67427), SbHRGP3(Ahn et al., 1996, Plant Cell 8:1477-90), GH3 (Liu et al., 1994, Plant Cell6:645-57), o promotor do gene de PRPl indutível por patógeno (Ward et al.,1993, Plant. Mol. Biol. 22:361-366), o promotor de hsp80 indutível por calordo tomate (Patente U. S. N0 5187267), promotor de alfa-amilase indutível porcalor da batata (Pedido PCT N0 WO 96/12814) ou o promotor de pinllindutível por ferimento (Patente Européia N0 375091). Para outros exemplosde promotores indutíveis por seca, frio e sal, tais como o promotor de RD29A,ver Yamaguchi-Shinozalei et al., 1993, Mol. Gen. Genet. 236:331-340.
Os preferidos de promotores de estágio de desenvolvimentosão preferivelmente expressados em certos estágios de desenvolvimento,promotores preferidos de tecido e de órgão incluem aqueles que sãopreferivelmente expressados em certos tecidos e órgãos, tais como folhas,raízes, sementes ou xilema. Os exemplos de promotores preferidos de tecido epreferidos de órgão incluem, mas não são limitados a preferidos de fruta,preferidos de óvulo, preferidos de tecido masculino, preferidos de semente,preferidos de tegumento, preferidos de tubérculo, preferidos de pedúnculo,preferidos de pericárpio e preferidos de folha, preferidos de estigma,preferidos de pólen, preferidos de antera, preferidos de pétala, preferidos desépala, preferidos de pedúnculo, preferidos de síliqua, preferidos de caule,promotores preferidos de raiz e outros. Os promotores preferidos de sementesão preferivelmente expressados durante o desenvolvimento e/ou germinaçãode semente. Por exemplo, promotores preferidos de semente podem serpreferidos de embrião, preferido de endosperma e preferido do revestimentode semente, ver Thompson et al., 1989, BioEssays 10:108. Os exemplos depromotores preferidos de semente incluem, mas não são limitados a, celulosesintase (celA), Ciml, gama-zeína, globulina-1, zeína de 19 kD de milho(cZ19Bl) e outros.
Outros promotores preferidos de tecido ou preferidos de órgãoadequados incluem o promotor de gene de napina de semente de colza(Patente U. S. N0 5,608,152), o promotor de USP de Vicia faba (Baeumlein etal., 1991, Mol. Gen. Genet. 225(3):459-67), o promotor de oleosina deArabidopsis (Pedido PCT N0 WO 98/45461), o promotor de oleosina dePliaseolus vulgaris (Patente U. S. N0 5.504.200), o promotor de Bce4 doBrassica (Pedido PCT N0 WO 91/13980) ou o promotor B4 de legumina(LeB4; Baeumlein et al., 1992, Plant Journal, 2(2):233-9), bem comopromotores que conferem expressão específica de semente em plantas demonocotiledônea como milho, cevada, trigo, centeio, arroz, etc. Ospromotores adequados para a observação são os promotores do gene lpt2 ouIptl de cevada (Pedido PCT N0 WO 95/15359 e Pedido PCT N0 WO95/23230) ou aqueles descritos em Pedido PCT N0 WO 99/16890(promotores do gene de hordeína de cevada, gene de glutelina de arroz, genede orizina de arroz, gene de prolamina de arroz, gene de gliadina de trigo,gene de glutelina de trigo, gene de glutelina de aveia. Gene de casirina desorgo e gene de secalina de arroz).
Outros promotores úteis nos cassetes de expressão da invençãoincluem, mas não são limitados a, o promotor de proteína de ligação alb declorofila principal, promotores de histona, o promotor de Ap3, o promotor deβ-conglicina, o promotor de napina, o promotor de lecitina de soja, opromotor de zeína de 15 kD de milho, o promotor de zeína de 22 kD, opromotor de zeína de 27 kD, o promotor de g-zeína, os promotores cerosos,enrugados 1, enrugados 2 e de bronze, o promotor de Zml3 (Patente U. S. N05,086,169), os promotores de poligalacturonase de milho (PG) (Patente U. S.N0 5.412.085 e 5.545.546) e o promotor de SGB6 (Patente U. S. N05,470,359), bem como promotores sintéticos ou outros naturais.
Flexibilidade adicional em controlar a expressão de geneheterólogo em plantas pode ser obtida usando-se domínios de ligação de DNAe elementos de resposta de fontes heterólogas (isto é, domínios de ligação deDNA de fontes não vegetais). Um exemplo de um tal domínio de ligação deDNA heterólogo é o domínio de ligação de LexA DNA (Brent and Ptashne,1985, Cell 43:729-736).
A invenção ainda fornece um vetor de expressão recombinanteque compreende uma molécula de DNA de SHSRP da invenção clonado novetor de expressão em uma orientação anti-sentido. Isto é, a molécula deDNA é operacionalmente ligada a um seqüência reguladora de uma maneiraque permite a expressão (pela transcrição de uma molécula de DNA) de umamolécula de RNA que é anti-sentido a um mRNA de SHSRP. As seqüênciasreguladoras operacionalmente ligadas a uma molécula de ácido nucleicoclonada na orientação anti-sentido pode ser escolhida direcionando aexpressão contínua da molécula de RNA anti-sentido em uma variedade detipos celulares. Por exemplo, promotores e/ou intensificadores virais ouseqüências reguladoras podem ser escolhidas direcionando expressãoespecífica de tecido ou específica do tipo celular, constitutiva de RNA anti-sentido. O vetor de expressão anti-sentido pode estar na forma de umplasmídeo recombinante, fagomida ou vírus atenuado em que os ácidosnucleicos anti-sentido são produzidos pelo controle de uma região reguladorade alta eficiência. A atividade da região reguladora pode ser determinada pelotipo celular em que um vetor é introduzido. Para o debate da regulação daexpressão genética usando-se genes anti-sentido, ver Weintraub, H. et al.,1986, RNA anti-sentido como uma ferramenta molecular para a análisegenética, Reviews - Trends in Genetics, Vol. 1(1) e Mol et al., 1990, IEBSLetters 268:427-430.
Um outro aspecto da invenção diz respeito a célulashospedeiras em que um vetor de expressão recombinante da invenção foiintroduzido. Os termos "célula hospedeira" e "célula hospedeirarecombinante" são usados de maneira intercambeável neste. É entendido quetais termos referem-se a não apenas à célula de objetivo particular mastambém aplica-se à progênie ou progênie potencial de uma tal célula. Pelarazão de que certas modificações podem ocorrer nas gerações sucessorasdevido à sua mutação ou influências ambientais, tal como a progênie, de fato,pode não ser idêntica à célula precursora, mas ainda está incluída dentro doescopo do termo como usado aqui. Uma célula hospedeira pode ser qualquercélula procariótica ou eucariótica. Por exemplo, um SHSRP pode serexpressados em células bacterianas, tais como C. glutamicum, células deinseto, células fungicas ou células de mamíferos (tais como células de ováriode hamster chinês (CHO) ou células COS), algas, ciliados, células vegetais,fungos ou outros microorganismos como C. glutamicum. Outras célulashospedeiras adequadas são conhecidas por aqueles habilitados na técnica.
Uma célula hospedeira da invenção, tais como uma célulahospedeira procariótica ou eucariótica na cultura, podem ser usados para aprodução de (isto é, expressar) um SHSRP. Conseqüentemente, a invençãoainda fornece métodos para a produção de SHSRPs usando-se as célulashospedeiras da invenção. Em uma forma de realização, o método compreendecultivar a célula hospedeira da invenção (em que um vetor de expressãorecombinante que codificam um SHSRP foi introduzido ou em que o genomafoi introduzido ao gene que codifica a SHSRP do tipo selvagem ou alterado)em um meio adequado até o SHSRP ser produzido. Em uma outra forma derealização, o método ainda compreende isolar SHSRPs a partir do meio ou dacélula hospedeira.
Um outro aspecto da invenção diz respeito a SHSRPs isoladose porções biologicamente ativas destes, Um polipeptídeo "isolado" ou"purificado" ou porção biologicamente ativa deste é isento de alguns dosmateriais celulares quando produzido por técnicas de DNA recombinantes ouprecursores químicos ou outros produtos químicos quando quimicamentesintetizados. A linguagem "substancialmente isento de material celular" incluipreparações de SHSRP em que como polipeptídeo é separado de alguns doscomponentes celulares das células em que este é natural ourecombinantemente produzido. Em uma forma de realização, a linguagem"substancialmente isento de material celular" inclui preparações de umSHSRP tendo menos do que cerca de 30 % (em peso seco) de material quenão SHSRP (também referidos neste como um "polipetídeo contaminante"),mais preferivelmente menor do que cerca de 20 % de material que nãoSHSRP, ainda mais preferivelmente menos do que cerca de 10 % de materialque não SHSRP e mais preferivelmente menor do que cerca de 5 % não-SHSRP material.
A molécula de ácidos nucleicos, polipeptídeos, homólogos depolipeptídeo, polipeptídeos de fusão, iniciadores, vetores e célulashospedeiras descritos nestes podem ser usados em um ou mais dos seguintesmétodos: identificação de qualquer um dos organismos como fornecido naColuna N0 2 da Tabela 1 e Tabela 2 e organismos relacionados; mapeamentode genomas de organismos relacionados com qualquer um dos organismoscomo fornecido na Coluna N0 2 da Tabela 1 e Tabela 2; identificação elocalização das seqüências de interesse de qualquer um dos organismos comofornecido na Coluna N0 2 da Tabela 1 e Tabela 2; estudos evolucionários;determinação de regiões de SHSRP requeridas para a função; modulação deuma atividade de SHSRP; modulação do metabolismo de uma ou maisfunções celulares; modulação do transporte transmembrana de um ou maiscompostos; modulação de resistência à tensão e modulação de expressão deácidos nucleicos de SHSRP. Em uma forma de realização destes métodos, oSHSRP funciona como uma serina hidroximetiltransferase.
As moléculas de SHSRP de ácido nucleico de acordo com ainvenção tem uma variedade de usos. De maneira mais importante, o ácidonucleico e as seqüências de aminoácido da presente invenção podem serusados para transformar plantas, particularmente plantas de cultivo, dessemodo, induzindo a tolerância à tensões, tais como seca, salinidade alta e frio.A presente invenção portanto fornece uma planta transgênica transformadapor um ácido nucleico de SHSRP, em que a expressão da seqüência de ácidonucleico na planta resulta no desenvolvimento de raiz aumentado e/outolerância à tensão ambiental em comparação com uma variedade do tiposelvagem da planta. A planta transgênica pode ser uma monocotiledônea ouuma dicotiledônea. A invenção ainda fornece que a planta transgênica podeser selecionado de milho, trigo, centeio, aveia, triticale, arroz, cevada, sorgo,painço, cana de açúcar, soja, amendoim, algodão, semente de colza, canola,mandioca, pimenta, girassol, tagetes, plantas solanáceas, batata, tabaco,berinjela, tomate, espécies Vicia, ervilha, alfafa, café, cacau, chá, espéciesSalix, dendezeiro, coco, grama perene e safras de forragem, por exemplo.
Em particular, a presente invenção descreve o uso daexpressão de ácidos nucleicos que codificam SHSRP para projetar plantascom o desenvolvimento de raiz aumentado e/ou rendimento aumentado e/ouque são tolerantes à seca, tolerantes ao sal e/ou tolerantes ao frio. Aqui, estaestratégia foi demonstrada usando-se AtSHMT4 (SEQ ID N°: 1) emArabidopsis thaliana e milho, mas esta aplicação não é restrita a este gene oua estas plantas. Conseqüentemente, a invenção fornece uma planta de cultivotransgênica que contém um SHSRP como definido em qualquer uma das SEQID N0 como fornecido na Coluna N0 4 da Tabela 1 e Tabela 2, em que aplanta tem desenvolvimento de raiz aumentado e/ou rendimento aumentadoe/ou tolerância aumentada a uma tensão ambiental selecionada de um ou maisdos grupos que consiste de seca, sal aumentado ou temperatura diminuída ouaumentada. Em formas de realização preferidas, a tensão ambiental é a seca.Em outras formas de realização preferidas, o desenvolvimento de raizaumentado é um aumento no comprimento da raiz, preferivelmente sobcondições limitantes de água.
A invenção também fornece um método de produção de umaplanta de cultivo transgênica que contém um ácido nucleico que codificaSHSRP, em que expressão do ácido nucleico na planta resulta emdesenvolvimento de raiz aumentado e/ou rendimento aumentado e/outolerância aumentada a tensão ambiental em comparação com uma variedadedo tipo selvagem da planta que compreende: (a) introduzir em uma célulavegetal um vetor de expressão que compreende um ácido nucleico de SHSRPe (b) gerar, a partir da célula vegetal uma planta transgênica com umdesenvolvimento de raiz aumentado e/ou rendimento aumentado e/outolerância aumentada a tensão ambiental em comparação com uma variedadedo tipo selvagem da planta. Uma célula vegetal inclui, mas não limita-se a,um protoplasto, célula promotora de gameta e uma célula que regenera-se emuma planta total. Como usado aqui, o termo "transgênico" refere-se aqualquer planta, célula vegetal, calo, tecido vegetal ou parte de planta eucontém todos ou parte de pelo menos um polinucleotídeo recombinante. Emmuitos casos, todos ou parte dos polinucleotídeos recombinantes éestavelmente integrado em um cromossomo ou elemento extra-cromossômicoestável, de modo que este seja passado a gerações sucessivas. Em formas derealização preferidas, o ácido nucleico de SHSRP codifica uma proteína quecompreende o polipeptídeo de qualquer uma das SEQ ID N0 como fornecidona Coluna N0 4 da Tabela 1 e Tabela 2.
A presente invenção também fornece um método de modularum desenvolvimento de raiz de planta e/ou rendimento e/ou tolerância a umatensão ambiental que compreende, modificar a expressão de um ácidonucleico que codifica SHSRP na planta. O desenvolvimento de raiz de plantae/ou rendimento e/ou tolerância à tensão ambiental pode ser aumentado oudiminuído quando atingido pelo aumento ou diminuição de um SHSRP,respectivamente. Preferivelmente, o desenvolvimento de raiz de planta e/ourendimento e/ou tolerância à tensão ambiental é aumentado pelo aumento daexpressão de um SHSRP. A expressão de um SHSRP pode ser modificada porqualquer método conhecido por aqueles habilitados na técnica. Os métodos deaumentar a expressão de SHSRPs podem ser usados em que a planta étransgênico ou não transgênico. Em casos quando a planta é transgênica, aplanta pode ser transformada com um vetor contendo qualquer um dos ácidosnucleicos de SHSRP descritos acima ou a planta pode ser transformada comum promotor que direciona expressão do SHSRP na planta, por exemplo. Ainvenção fornece que um tal promotor pode ser preferido de tecido, reguladade acordo com o desenvolvimento, indutível por tensão ou uma combinaçãodestes. Alternativamente, plantas não transgênicas podem ter expressão deSHSRP nativo modificada pela indução de um promotor natural. A expressãode SHSRP como definido em qualquer uma das SEQ ID N0 como fornecidona Coluna N0 4 da Tabela 1 e Tabela 2 em plantas alvo pode ser realizada por,mas não limita-se a, um dos seguintes exemplos: (a) promotor constitutivo,(b) promotor de tensão indutível, (c) promotor induzido por produto químicoe (d) super-expressão de promotor projetada com, por exemplo, fatores detranscrição derivados de dedo de zinco (Greisman and Pabo, 1997, Science275:657).
Em uma forma de realização preferida, a transcrição doSHSRP é modulado usando-se fatores de transcrição derivados de dedo dezinco (ZFPs) como descrito em Greisman and Pabo, 1997, Science 275:657 efabricado por Sangamo Biosciences, Inc. Estes ZFPs compreendem tanto umdomínio de recognição quanto um funcional que causa a ativação ourepressão de um ácido nucleico alvo tal como um ácido nucleico de SHSRP.Portanto, ativação e repressão ZFPs podem ser criados reconhecendoespecificamente que os promotores de SHSRP descritos acima e usados paraaumentar ou diminuir a expressão do SHSRP em uma planta, desse modo,modulando o rendimento e/ou tolerância à tensão da planta. A presenteinvenção também inclui a identificação dos homólogos de ácidos nucleicosque codificam SHSRP como definido em qualquer uma das SEQ ID N0 comofornecido na Coluna N0 3 da Tabela 1 e Tabela 2 em uma planta alvo, bemcomo o promotor do homólogo. A invenção também fornece um método deaumentar a expressão de um gene de interesse dentro de uma célulahospedeira em comparação com uma variedade do tipo selvagem da célulahospedeira, em que o gene de interesse é transcrito em resposta a um SHSRP,que compreende: (a) transformar a célula hospedeira com um vetor deexpressão que compreende um ácido nucleico que codifica SHSRP e (b) queexpressam o SHSRP dentro da célula hospedeira, desse modo, aumentando aexpressão do gene transcrito em resposta ao SHSRP, em comparação comuma variedade do tipo selvagem da célula hospedeira.
Além da introdução das seqüências de SHSRP de ácidonucleico nas plantas transgênicas, estas seqüências também podem ser usadaspara identificar um organismo como sendo qualquer um dos organismos comofornecido na Coluna N0 2 da Tabela 1 e Tabela 2 ou um próximo com relaçãoa este. Estes também podem ser usados para identificar a presença dequalquer um dos organismos como fornecido na Coluna N0 2 da Tabela 1 eTabela 2 ou um relativo deste em uma população mista de organismos. Ainvenção diz respeito às seqüências de ácido nucleico de diversos genes apartir de qualquer um dos organismos como fornecido na Coluna N0 2 daTabela 1 e Tabela 2; investigando-se o DNA genômico extraído de umacultura de uma população única ou mista de organismos sob condiçõesestringentes com uma sonda medindo a região de um gene particular isto éúnicos aos que correspondem ao organismo de acordo com Tabela 1 e Tabela2, uma pessoa pode determinar quando este organismo está presente..
Além disso, o ácido nucleico e as moléculas de polipeptídeo deacordo com a invenção podem servir como marcadores para as regiõesespecíficas do genoma. Este não tem utilidade apenas no mapeamento dogenoma, mas também em estudos funcionais dos polipeptídeos codificadospor tal genoma. Por exemplo, para identificar a região do genoma ao qual umpolipeptídeo do organismo particular de ligação ao DNA liga o genoma doorganismo poderá ser digerido e os fragmentos incubados com o polipeptídeode ligação ao DNA. Esses fragmentos que ligam o polipeptídeo podem seradicionalmente podem ser submetidos à sondagem com as moléculas de ácidonucleico da invenção, preferivelmente com rótulos facilmente detectáveis. Aligação de uma tal molécula de ácido nucleico ao fragmento de genomapermitem a localização do fragmento no mapa do genoma de um talorganismo e quando realizado múltiplas vezes com enzimas diferentes,facilitando uma rápida determinação da seqüência de ácido nucleico à qual opolipeptídeo liga-se. Além disso, as moléculas de ácido nucleico da invençãopodem ser suficientemente idênticas às seqüências de espécies relatadas, talque estas moléculas de ácido nucleico podem servir como marcador para aconstrução de um mapa genômico em plantas relatadas.
As moléculas de ácido nucleico de SHSRP da invenção sãotambém úteis para estudos evolutionários e estruturais de polipeptídeos. Osprocessos de tráfego na vesícula em que as moléculas da invenção participamsão utilizadas por uma ampla variedade de células procarióticas eeucarióticas; pela comparação das seqüências da moléculas de ácido nucleicoda presente invenção àquelas que codificam enzimas similares a partir deoutros organismos, a ligação evolucionária dos organismos pode ser estimada.Similarmente, uma tal comparação permite uma estimativa daquelas regiõesdas seqüências que são conservadas e as que não são, que podem auxiliar nadeterminação daquelas regiões do polipeptídeo que são essenciais para ofuncionamento da enzima. Este tipo de determinação é de valor para projetaros estudos de engenharia de polipeptídeo e pode dar uma indicação do que opolipeptídeo pode tolerar em termos de mutagênese sem perder a função.
A manipulação das moléculas de ácido nucleico de SHSRP dainvenção pode resultar na produção de SHSRPs tendo diferenças funcionaisdos SHSRPs do tipo selvagem. Estes polipeptídeos podem ser melhorados emeficiência ou atividade, podem estar presentes em números maiores na célulado que é usual ou pode ser diminuído em eficiência ou atividade.
Existem diversos mecanismos pelos quais a alteração de umSHSRP da invenção pode afetar diferentemente desenvolvimento de raiz e/ourendimento e/ou resposta à tensão e/ou tolerância à tensão. No caso de plantasque expressam SHSRPs, a super-expressão de SHMT4 pode fornecer umafonte maior de unidades únicas de carbono para as reações biossínteticascelulares no citosol e cloroplastos, que pode aumentar a síntese de blocos deconstrução como metionina, purinas, pirimidinas e lipídeos, que levam a umaumento no comprimento da raiz e eficiência da planta melhorada do uso daágua.
O efeito da modificação genética em plantas, C. glutamicum,fungos, algas ou ciliados no desenvolvimento de raiz e/ou tolerância à tensãopode ser estimada pelo desenvolvimento do microorganismo modificado ouplanta sob menos do que condições adequadas e depois análise dascaracterísticas de desenvolvimento e/ou metabolismo da planta. Tais técnicasde análise são bem conhecidas por uma pessoa habilitada na técnica e incluempeso seco, peso úmido, síntese de polipeptídeo, síntese de carboidrato, síntesede lipídeo, taxas de evapotranspiração, planta geral e/ou desenvolvimento desafra, floração, reprodução, ajuste de semente, desenvolvimento de raiz, taxasde respiração, taxas de fotossíntese, etc. (Applications of HPLC inBiochemistry in: Laboratory Techniques in Biochemistry and MolecularBiology, vol. 17; Rehm et al., 1993 Biotechnology, vol. 3, Capítulo III;Product recovery and purification, página 469-714, VCH: Weinheim; Belter,P.A. et al., 1988, Bioseparations: downstream processing for biotechnology,John Wiley and Sons; Kennedy, J.F. and Cabral, J.M.S., 1992, Recoveryprocesses for biological materiais, John Wiley and Sons; Shaeiwitz, J.A. andHenry, J.D., 1988, Biochemical separations, in: Ulmann1S Enciclopédia ofIndustrial Chemistry, vol. B3, Capítulo 11, página 1-27, VCH: Weinheim eDechow, F.J., 1989, Separation and purification techniques in biotechnology,Noyes Publications).
Por exemplo, os vetores de expressão de levedura quecompreende os ácidos nucleicos divulgados neste ou fragmentos destes,podem ser construídos e transformados em Saccharomyces eerevisiae usando-se protocolos padrão. As células transgênicas resultantes podem ser estimadaspor falha ou alteração de seu desenvolvimento aumentado e/ou tolerância àseca, tensões a sal e temperatura. Similarmente, vetores de expressão deplanta que compreende os ácidos nucleicos divulgados neste ou fragmentosdestes, podem ser construídos e transformados em uma célula vegetalapropriada, tais como Arabidopsis, soja, colza, milho, trigo, Medieagotruneatula, etc., usando-se protocolos padrão. As células transgênicasresultantes e/ou plantas derivadas destes podem ser estimadas por falha oualteração de seu desenvolvimento de raiz aumentado e/ou tolerância à seca,tensões a sal e temperatura.
Adicionalmente, as seqüências divulgadas neste ou fragmentosdestes, podem ser usados para gerar mutações de nocaute nos genomas devários organismos, tais como bactérias, células de mamíferos, células delevedura e células vegetais (Girke, T., 1998, The Plant Journal 15:39-48). Ascélulas de nocaute resultantes podem ser então avaliadas quanto à suahabilidade ou capacidade de tolerar várias condições de tensão, sua resposta avárias condições de tensão e o efeito no fenotipo e/ou genotipo da mutação.Para outros métodos de inativação genética, ver Patente U. S. Patent N06.004.804 "Non-Chimeric Mutational Vetors" and Puttaraju et al„ 1999,Spliceosome-mediated RNA trans-splicing as a tool for gene therapy, NatureBiotechnology 17:246-252.
As estratégias de mutagênese mencionada acima para SHSRPsque resultam no desenvolvimento de raiz aumentado e/ou rendimento e/outolerância à tensão não são entendidos serem limitados; variações nestaestratégia estarão facilmente evidente para aqueles habilitados na técnica.Usando-se tais estratégias e incorporando os mecanismos divulgados nestes, oácido nucleico e as moléculas de polipeptídeo da invenção podem serutilizados para a geração de algas, ciliados, plantas, fungos ou outrosmicroorganismos como C. glutamicum que expressam ácido nucleico deSHSRP mutados e as moléculas de polipeptídeo tal que o desenvolvimento deraiz e/ou tolerância à tensão seja melhorado.
A presente invenção também fornece anticorpos que ligam-seespecificamente a um SHSRP ou uma porção destes, como codificado por umácido nucleico descritos nestes. Os anticorpos podem ser fabricados pormuitos métodos bem conhecidos (Ver, por exemplo, Harlow and Lane,"Antibodies; A Laboratory Manual," Cold Spring Harbor Laboratory, ColdSpring Harbor, New York, (1988)). Resumidamente, o antígeno purificadopode ser injetado em um animal em uma quantidade e em intervalossuficientes para incitar uma resposta imune. Os anticorpos podem serpurificados diretamente ou as células de baço podem ser obtidas a partir doanimal. As células podem ser então fundidas com uma linha celular imortal eavaliadas quanto à secreção de anticorpo. Os anticorpos podem ser usadospara a avaliação de ácido nucleico que clona bibliotecas para células quesecretam o antígeno. Aqueles clones positivos podem ser então sequenciados.(Ver, por exemplo, Kelly et al„ 1992, Bio/Technology 10:163-167;Bebbington et al. 1992, Bio/Technology 10:169-175).
As frases "liga-se seletivamente" e "liga-se especificamente"com o polipeptídeo refere-se a uma reação de ligação isto é determinante dapresença do polipeptídeo em uma população heterogênea de polipeptídeos eoutros biológicos. Desta maneira, sob condições de imunoensaio designado,os anticorpos especificados ligados a um polipeptídeo particular não liga-seem uma quantidade significante a outros polipeptídeos presentes na amostra.
A Ligação seletiva de um anticorpo sob tais condições pode requerer umanticorpo isto é selecionado quanto a sua especificidade para um polipeptídeoparticular. Uma variedade de formatos de imunoensaio podem ser usados paraselecionar anticorpos que ligam-se seletivamente com um polipeptídeoparticular. Por exemplo, imuno-ensaios ELISA de fase sólida sãorotineiramente usados para selecionar anticorpos seletivamenteimunorreativos com um polipeptídeo. Ver Harlow and Lane, "Antibodies, ALaboratory Manual" Cold Spring Harbor Publications, New York, (1988),para uma descrição de formatos de imunoensaio e condições que podem serusadas para a determinação de ligação seletiva.
Em alguns exemplos, é desejável preparar anticorposmonoclonais a partir de vários hospedeiros. Uma descrição de técnicas para apreparação de tais anticorpos monoclonais pode ser encontrada em Stites etal., eds., "Basic and Clinicai Immunology," (Lange Medicai Publications, LosAltos, Calif., Quarta edição) e referências citadas neste e em Harlow and Lane"Antibodies, A Laboratory Manual" Cold Spring Harbor Publications, NewYork, 1988,Por todo este pedido, várias publicações são referidas. Asdivulgações de todas estas publicações e aqueles referidos citados dentrodaquelas publicações em suas totalidades são, desse modo, incorporadas porreferência neste pedido a fim de descrever mais totalmente o estado da técnicaao qual esta invenção pertence.
Deve ser pretendido que o precedente diz respeito à formas derealização preferidas da presente invenção e que numerosas mudanças podemser feitas neste sem divergir do escopo da invenção. A invenção ainda éilustrada pelos seguintes exemplos, que não devem ser construídos dequalquer maneira para impor limitações no seu escopo. Pelo contrário, deveser claramente entendido que o recurso pode ter várias outras formas derealização, modificações e equivalentes destes, que, após a leitura nadescrição neste, pode sugerir, por si só, para aqueles habilitados na técnicasem divergir do espírito da presente invenção e/ou do escopo dasreivindicações anexas.
EXEMPLOS
Exemplo 1
Isolamento de DNA total a partir do material vegetal
Os detalhes para o isolamento do DNA total dizem respeito aotrabalho de uma grama de peso fresco de material vegetal. Os materiaisusados incluem os seguintes tampões: Tampão de CTAB: 2 % (p/v) Brometode N-cetil-N,N,N-trimetilamônio (CTAB); 100 mM de Tris HCl pH 8,0; 1,4M de NaCl; 20 mM de EDTA; Tampão de N-Laurilsarcosina: 10 % (p/v) deN-laurilsarcosina; 100 mM de Tris HCl pH 8,0 e 20 mM de EDTA.
Um material vegetal foi triturado sob nitrogênio líquido em ummortar para dar um pó fino e transferido a recipientes de Eppendorf de 2 ml.O material vegetal congelado foi então convertido com uma camada de 1 mlde tampão de decomposição (1 ml de Tampão de CTAB, 100 μΐ de Tampãode N-Laurilsarcosina, 20 μΐ de β-mercaptoetanol e 10 μΐ de solução deproteinase K solution, 10 mg/ml) e incubado a 60° C por uma hora comagitação contínua. O homogeneizado obtido foi distribuído em doisrecipientes de Eppendorf (2 ml) e extraído duas vezes com o mesmo volumede clorofórmio/álcool isoamílico (24:1). Para a separação de fase,centrifiigação foi realizada a 8000 χ g e temperatura ambiente por 15 minutosem cada caso. O DNA foi então precipitado a -70° C por 30 minutos usando-se isopropanol gelado. O DNA precipitado foi sedimentado a 4o C e 10.000 gpor 30 minutos e recolocado em suspensão em 180 μΐ do tampão de TE(Sambrook et al„ 1989, Cold Spring Harbor Laboratory Press: ISBN 0-87969-309-6). Para purificação adicional, o DNA foi tratado com NaCl (1,2 M deconcentração final) e precipitado novamente a -70° C por 30 minutos usando-se duas vezes o volume de etanol absoluto. Após a etapa de lavagem com 70% de etanol, o DNA foi secado e subseqüentemente absorvido em 50 μΐ deH2O + RNAse (50 mg/ml de concentração final). O DNA foi dissolvidodurante a noite a 4o C e a digestão de RNAse foi subseqüentemente realizadaa 37° C por 1 hora. A armazenagem do DNA aconteceu a 4o C.
Exemplo 2
Isolamento de RNA e cDNA total de material vegetal de Arabidopsis
AtSHMT4 foi isolado pela preparação de RNA a partir dasfolhas de Arabidopsis usando-se o kit de mini-isolamento de RNA (Qiagenkit) seguindo as recomendações do fabricante. As reações de transcriçãoreversa e amplificação do cDNA foram realizadas como descrito abaixo.
1. Uso de 2 μΐ de RNA (0,5 a 2,0 μg ) de preparação em umaReação de Dnase de 10 μΐ, levar o tubo a 37° Cpor 15 minutos, adicionar 1 μΐ25 mM de EDTA e depois reação aquecida a 65° C por 15 minutos.
a. Tampão (10X: 200 mM de Tris, 500 mM de KCl, 20 mM deMgCl2) -1 μl
b. RNA-2 μl
c. Dnase (10 U/μΙ) - 1 μld. H2O - 6 μΐ
2. Uso de 1 μΐ da reação acima em uma reação emtemperatura ambiente e aquecer a 65° C por 5 minutos.
a. Dnased RNA (0,025 a 0,1 dependendo da quantidade departida)- 1 μΐ
b. 10 mM de dNTPs- 1 μΐ
c. Iniciador (10 μΜ)- 1 μΐ
d. H2O - até 10 μΐ
3. Preparar uma mistura de reação com estes agentes em umtubo separado
a. Tampão SuperScript II RT (IOX)- 2 μΐ
b. 25 mM de MgCl2 - 4 μΐ
c. DTT (0,1 M) - 2 μΐ
d. Inibidor de Rnase Out Rnase (40 U/μΙ)- 1 μΐ
4. Adicionar os 9μ1 mistura de reação à solução de RNAdesnaturada e mantida a 42° C por 42 minutos.
5. Adicionar 1 μΐ de SuperScriptII RT (50 U/μΙ) e incubar a42° C por 50 minutos.
6. Terminar a reação a 70° C por 15 minutos.
7. Opcional: adicionar 1 μΐ de RNAseH à reação para removeroRNA.
8. Realizar o PCR usando-se 1 a 2 μΐ do novo cDNA.Coleta de tecido. Isolamento de RNA e construção de biblioteca de cDNA
As plantas de cultivo foram desenvolvidas sob uma variedadede condições e tratamentos e tecidos diferentes foram coletados em váriosestágios de desenvolvimento. O desenvolvimento e a coleta de planta foirealizada de uma maneira estratégica tal que a probabilidade de coletar todosos genes expressáveis em pelo menos uma ou mais bibliotecas resultantes émaximizada. O mRNA foi isolado como descrito acima a partir de cada umadas amostras coletadas e bibliotecas de cDNA foram construídas. Nenhumaetapa de amplificação foi usada no processo de produção de biblioteca a fimde minimizar a redundância dos genes dentro da amostra e reter a informaçãoda expressão. Todas as bibliotecas foram 3' geradas a partir de mRNApurificado em colunas oligo dT. As colônias da transformação da bibliotecade cDNA em E. coli foram aleatoriamente picadas e colocadas em placasmicrotituladoras.
Amplificação de PCR de Inserções e Marcações de cDNA
As inserções de cDNA de cada clone das placasmicrotituladoras foram amplificadas por PCR. DNA de plasmídeo foi isoladoa partir das colônias de E. coli e então marcadas em membranas, nenhumaetapa de purificação foi necessária antes da marcação das amostras emmembranas de náilon.
Exemplo 3
Clonagem de AtSHMT4
O cDNA isolado como descrito no Exemplo 2 foi usado para aclonagem do gene AtSHMT4 por RT-PCR. Os seguintes iniciadores foramusados:
O iniciador direto foi 5'-ATGGAACCAGTCTCTTCATG -3'(SEQ ID N°: 159). O iniciador reverso foi 5'-CTAATCCTTGT ACTTC ATCT-3' (SEQ ID N°: 160). As reações de PCR para a amplificação incluíram: 1 χtampão de PCR, 0,2 mM de dNTP, 100 ng de DNA de Arabidopsis thaliana,25 pmol de iniciador reverso, 2,5 u Pfu ou Herculase DNA polimerase.
O PCR foi realizado de acordo com condições padrão e com osprotocolos do fabricante (Sambrook et ai., 1989, Molecular Cloning, ALaboratory Manual, 2o Edição, Cold Spring Harbor Laboratory Press, ColdSpring Harbor, NY, Biometra T3 Thermocycler). Os parâmetros para a reaçãoforam: 1 ciclo para 3 minutos a 94° C; seguido por 25 ciclos de 30 segundos a94° C, 30 segundos a 55° C e 1,5 minutos a 72° C.Os fragmentos amplificados foram então extraídos do gel deagarose com um QlAquick Gel Extraction Kit (Qiagen) e ligado no vetorTOPO pCR 2.1 (Invitrogen) seguindo as instruções do fabricante. Os vetoresrecombinantes foram transformados em células ToplO (Invitrogen) usando-secondições padrão (Sambrook et al. 1989. Molecular Cloning, A LaboratoryManual, 2o Edição, Cold Spring Harbor Laboratory Press, Cold SpringHarbor5NY). As células transformadas foram selecionadas por um ágar LBcontendo 100 μπ^πιΐ de carbenicilina, 0,8 mg de X-gal (5-bromo-4-cloro-3-indolil-p-D-galactosida) e 0,8 mg de IPTG (isopropiltio-P-D-galactosida) quese desenvolve durante a noite a 37° C. Enquanto as colônias foramselecionadas e usadas para inocular 3 ml de LB líquido contendo 100 μg/mlde ampicilina e que se desenvolve durante a noite a 37° C. DNA de plasmídeofoi extraído usando-se o QlAprep Spin Miniprep Kit (Qiagen) seguindo asinstruções do fabricante, análises de clone subseqüentes e o mapeamento derestrição foram realizadas como de acordo com técnicas de biologia molecularpadrão (Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, 2oEdição, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY).
Os clones foram submetidos ao sequenciamento, queconfirmou que a identidade do gene clonado foi idêntica à seqüênciadepositada nos bancos de dados de Arabidopsis thaliana (SEQ ID N°: 1). Aseqüência de aminoácido deduzida de AtSHMT4 é mostrada na SEQ ID N°: 2.
O gene AtSHMT4 foi então clonado em um vetor binário eexpressado sob o Superpromotor (Figura 3). O Superpromotor é constitutivo,mas preferencial de raiz (Patente U. S. N0 5.428.147 e 5.217.903).
Exemplo 4
Transformação de planta de Arabidopsis
As plantas de Arabidopsis thaliana transgênicas (Col) foramgeradas pelo método de infiltração por imersão (Bechtold et al., 1993, "InPlant Agrobacterium-mediated gene transfer by infiltration of adultArabidopsis thaliana plants," C. R. Aead. Sei. Paris Life Sei, 316:1194-1199).Os vetores binários foram transformados em Cepa de Agrobacteria C58C1 oupMP90 usando-se eletroporação. As cultura do Agrobacteria transformado foidesenvolvido e as bactérias foram recolocadas em suspensão em meio deinfiltração por imersão (1/2 MS, 5 % de sacarose, 0,5 mg/ml MES, pH 5,7 ecom 200 ppm de Silwet L-77 (Lehle Seeds) adicionado). Cada cultura foiusada para transformar 3 potes de plantas de ColO de aproximadamente 5semanas de idade mergulhando-se os potes 5 minutos cada em culturas deAgrobacterium recolocadas em suspensão. As plantas foram entãodesenvolvidas para semear sob condições de Arabidopsis padrão (23° Cdia/20° C noite, 18 horas por dia e 65 % de umidade). As sementes de Tlforam avaliadas em Placas MS usando-se 100 nM de Pursuit (BASF).
Avaliação de Plantas Transformadas
As sementes Tl foram esterilizadas de acordo com osprotocolos padrão (Xiong et al., 1999, Plant Molecular Biology Repórter 17:159-170). Sementes foram selecionadas em V2 de meio Murashige e Skoog(MS) (Sigma-Aldrich), 0,6 % de ágar e suplementado com 1 % de sacarose e2 μg/ml de benomila (Sigma-Aldrich). As sementes em placas foramvernalizadas por 4 dias a 4o C. As sementes foram germinadas em umacâmara clomática em uma temperatura de ar de 22° C e intensidade de luz de40 micromols"lm2 (luz branca; Tubo fluorescente Philips TL 65W/25) e ciclode duração do dia de 16 horas de luz e de 8 horas no escuro. As mudastransformadas foram selecionadas após 14 dias e transferidas a V2 Meio deMS suplementado com 0,6 % de ágar, 1 % de sacarose e deixado recuperarpor cinco a sete dias.
As sementes da geração T2 foram usadas para uma análise deraiz de planta em solo e in vitro.
Exemplo 5Análise de Raiz in vitro de Plantas Arabidopsis Transformadas
Para análise de raiz in vitro de plantas transformadas, placasquadradas medindo 12 cm χ 12 cm foram usadas. Para cada placa, 52 ml deMeio de MS (sais de 0,5X MS, 0,5 % de sacarose, 0,5 g/L de tampão de MES,1 % de Phytagar) sem seleção foi usada. Placas foram deixadas secar natampa estéril por uma hora para reduzir futura condensação.
Alíquotas de semente foram esterilizadas em frascos de vidrocom etanol por 5 minutos, o etanol foi removido e a alíquota de sementeforam secadas na tampa estéril por uma hora. Sementes foram colocadas emplacas usando-se o Vacuseed Device (Lehle). No projeto experimental, cadaplaca continha tanto o tipo selvagem e quanto Plantas transgênicas deAtSHMT4. Portanto, cada linha foi sempre comparada com os controlesdesenvolvidos nas placa(s) de amostra para contagem quanto a variação domicroambiente. Após as sementes serem colocadas nas placas, as placasforam empacotadas com Ventwrap e colocadas verticalmente em prateleirasno escuro em 4o C por quatro dias para estratificar as sementes. As placasforam transferidas para uma Câmara de desenvolvimento de C5 Percival ecolocadas verticalmente por quatorze dias. As condições da câmara dedesenvolvimento foram 23° C dia/2Io C noite e 16 horas dias/8 horas noites.
Para coleção de dados um scanner de leito plano de altaresolução foi usado. Análise de raízes foram realizadas usando-se o pacote desoftware de WinRhizo.
Em análise in vitro, raízes foram avaliadas como comprimentoda raiz primária em 14 dias após germinação. Isto corresponde a um estágiode 4 a 6 folhas na Arabidopsis ecotipo Columbia. Qualquer diferençaobservada pode uma diferença na taxa de desenvolvimento nodesenvolvimento de raiz, mais também pode refletir no desenvolvimento finalda raiz.
Os resultados destes experimentos também foram analisadosao nível genético. Para realizar isto, comprimento da raiz de todas as plantasde todas as linhas transgênicas foi medido e comparado contra a média detipos de plantas selvagens. Presença do transgênico e número de cópias doseventos foram determinados alvejando-se o terminador de NOS em temporeal PCR, o iniciador de NOS usado para uma análise foram: Iniciador direto:5'-TCCCCGATCGTTCAAACATT-3' (SEQ ID N°: 161), Iniciador reverso5'-CCATCTCATAAATAACGTCATGCAT-3 (SEQ ID N°: 162). As reaçõesforam realizadas em um a placa ótica de 96 reservatórios (AppliedBiosystems, 4314320) e o controle endógeno e gene de reações de interesseforam realizados na mesma placa simultaneamente. A mistura principal foifabricado por ambos grupos iniciadores. As principais misturas e a placa de96 reservatórios para ensaio deve ser mantida em gelo. Cálculos são incluídospara 52 reações, que são adequadas para metade da placa que usa de umpipetador multicanal. O kit Eurogentec, (cat#RTSNRT032X-l) foi usado ereações foram preparadas usando-se recomendações do fabricante. AGeneAmp 5700 foi usado para realizar reações e coletar dados.
Resultados
Nossos resultados mostram que plantas transgênicas deAtSHMT4 avaliadas nas placas tem um fenotipo de raiz mais longa. Figura4A mostra o resultados das plantas desenvolvidas nas placas verticais em umabase por linha. A maioria de linhas transgênicas de AtSHMT4 avaliadasapresentaram um fenotipo de raiz mais longa em comparação com o tiposelvagem controla as raízes das plantas. O fenotipo foi mais claramenteobservado nas linhas 3, 6, 7, 8 e 9.
Análise do nível de gene de plantas transgênicas deAtSHMT4, como visto na Figura 4B, confirmam que as plantas de AtSHMT4apresentaram um comprimento aumentado do fenotipo da raiz. Com basenesta análise, Plantas de Arabidopsis transgênicas de SHMT4 apresentaram8,4 % de crescimento no comprimento da raiz.Exemplo 6
Análise de Raiz no Solo de Plantas Arabidopsis Transformadas
Para análise da raiz de solo, as sementes foram embebidas em4o C por 2 dias em água e foram plantadas no solo sem nenhuma seleção.
Deepots (Hummert D40) foram usados com um grânulo de turfa saturada(Jiffy 727) na base e enchido com água saturada de Metromix. Após o plantio,potes foram cobertos com manta de plástico para evitar a seca. Plantas foramdesenvolvidas usando-se apenas água presente na preparação de meio, como aágua do solo nestes potes grandes são suficiente para 3 semanas decrescimento e encoraja o desenvolvimento rápido da raiz, a manta plástica dospotes foi removida após 12 dias e os dados morfológicos foramdocumentados. No dia 17 as partes aéreas da plantas foram coletadas, secadasem 65° C por 2 dias e o peso seco foi medido. Para examinar as raízes, ogrânulo de turfa foi empurrado na direção superior do pote para remover osolo e raízes como uma unidade. O solo foi então separado das raízes em umabandeja e o máximo do comprimento da raiz foi medido.
Para determinar o impacto do fenotipo da raiz, os tecidostriturados acima das plantas transgênicas e o peso seco da roseta forammedidos e comparados contra o tipo selvagem das plantas.
Resultados
As raízes das linhas de AtSHMT4 foram também avaliadas nosolo como descrito acima. Os resultados indicaram planta transgênicas eapresentaram um fenotipo de raiz mais longa quando as plantas sãodesenvolvidas no solo (Figuras 5 e 6). No geral, todas as linha de AtSHMT4analisadas apresentaram desenvolvimento aumentado no ensaio com base nosolo. As linhas G2, G3, G6, GS e GlO apresentaram o aumento maior nocomprimento da raiz (Figura 5). Figura 6 mostra o ANOVA dodesenvolvimento total do gene AtSHMT4, demonstrou que as plantastransgênicas de AtSHMT4 tiveram desempenho significantemente melhor doque os controles do tipo selvagem.
O peso seco da roseta foi medido e análise de ANOVA dosresultados foram mostrados na Figura 7. Nenhuma diferença significante foiobservada entre as plantas transgênicas e os controles de tipo selvagem.
Portanto a biomassa da roseta não pareceu ser afetada pela super expressão dogene AtSHMT4.
Exemplo 7
Identificação de Homólogos ao AtSHMT4
O algarismo usado na presente invenção inclui: FASTA (Verysensitive sequence database searches with estimates of statistical significance;Pearson, 1990, Rapid and sensitive sequence comparison with FASTP andFASTA, Métodos Enzymol. 183:63-98); BLAST (Very sensitive sequencedatabase searches with estimates of statistical significance; Altschul et al.,Basic local alignment search tool, Journal of Molecular Biology 215:403-10);PREDATOR (High-accuracy secondary structure prediction from single andmultiple sequences; Frishman and Argos, 1997, 75 % accuracy in proteinsecondary structure prediction. Proteins 27:329-335); CLUSTAL W (Multiplesequence alignment; Thompson et al., 1994, CLUSTAL W (improving thesensitivity of progressive multiple sequence alignment atráves sequenceweighting, positions-specific gap penalties and weight matriz choice), NucleicAcid Research 22:4673-4680); TMAP (Transmembrane region predictionfrom multiply aligned sequences; Persson and Argos, 1994, Prediction oftransmembrane segments in proteins utilizing multiple sequence alignments,I. Mol. Biol. 237:182-192); ALOM2 (Transmembrane region prediction fromsingle sequences; Klein et al., Prediction of protein fimction from sequenceproperties: A discriminate análise of a database. Biochim. Biophys. Acta787:221-226 (1984). Version 2 by Dr. K. Nakai); PROSEARCH (Detectionof PROSITE protein sequence patterns; Kolakowski et al., 1992, ProSearch:fast searching of protein sequences with regular expression patterns related toprotein structure and function. Biotécnicas 13, 919-921); BLIMPS (Similaritysearches contra a database of ungapped blocks, Wallace and Henikoff, 1992);PATMAT (a searching and extraction program for sequence, pattern andblock queries and databases, CABIOS 8:249-254. Written by Bill Alford).
Homólogos do gene AtSHMT4 foram observados nos bancosde dados públicos e registrados. Estes homólogos foram avaliados paradeterminar o nível de relacionamento com o AtSHMT4. O programa Blast dafamília BLAST de algoritmos foi usado para comparar a seqüência de aminoácido de AtSHMT4 contra os bancos de dados de safra registrados traduzidosem todas as seis estruturas de leituras. Seqüência com homologia significanteforam observadas em cada biblioteca de safra. A percentagem da identidadede seqüência em nível de amino ácido de cada seqüência como comparada aAtSHMT4 foram mostradas na Coluna N0 5 da Tabela 1 e Tabela 2.
O alinhamento BLAST entre AtSHMT4 e SHSRP da safra talcomo canola, soja, girassol, trigo, milho, linhaça, arroz e cevada sãomostradas na Figuras 9 a 16. Um alinhamento de cada uma destas seqüênciasforam mostradas na Figura 17. Para análise de alinhamento, comparação aospares foram realizadas com uma penalidade de abertura de fenda de 10 epenalidade de extensão de fenda de 0,1. Os alinhamentos múltiplos foramrealizados com penalidade de abertura de fenda de 10 e penalidade deextensão de fenda de 0,05 e uma taxa de penalidade de separação de fenda de 8.
Exemplo 8
Engenharia de Plantas de Soja pela Super Expressão do Gene SHMT4
Sementes de soja são superficialmente esterilizadas com 70 %de etanol por 4 minutos em temperatura ambiente com agitação contínua,seguido por, 20 % (v/v) de Clorox suplementado com 0,05 % (v/v) de Tweenpor 20 minutos com agitação contínua. Então, as sementes são enxaguadas 4vezes com água destilada e colocadas em papel de filtro estéril umedecido emuma placa de Petri em temperatura ambiente por 6 a 39 horas. As cascas dassementes são descascadas e os cotilédones são separados a partir do eixo doembrião. O eixo do embrião é examinado para garantir que a regiãomeristemática não seja danificada. Os eixos embrionários excisados sãocoletados em uma placa de Petri estéril meio aberta e secados ao ar a um teorde umidade menor do que 20 % (peso fresco ) em uma placa de Petri seladaaté o uso mais adiante.
A cultura de Agrobacterium tumefaciens é preparada a partirde um colônia simples em meio de sólido LB mais agentes de seleçãoapropriada seguido por desenvolvimento da colônia simples em meio LBlíquido ao uma densidade ótica em 600 nm de 0,8. Então, a cultura da bactériaé granulada em 7000 rpm por 7 minutos em temperatura ambiente e colocadasem suspensão em meio de MS suplementado com 100 μΝΙ de acetosiringona.As culturas das bactérias são incubadas neste meio de pré-indução por 2 horasem temperatura ambiente antes do uso. Os eixos embrióticos zigóticos da sojaem aproximadamente 15 % de teor de umidade são embebecidos por 2 horasem temperatura ambiente com a pré-indução da cultura de suspensão daAgrobacterium. Os embriões são removidos a partir da cultura saturada e sãotransferidos as placas de Petri contendo meio de sólido de MS suplementadocom 2 % de sacarose e incubados por 2 dias no escuro em temperaturaambiente. Alternativamente, os embriões são colocados em cima do papel defiltro estéril umedecido (meio de MS líquido) em uma placa de Petri eincubados sob as mesmas condições descritas acima. Depois deste período, osembriões são transferidos ao meio de MS sólido ou líquido suplementado com500 mg/L de carbenicilina ou 300 mg/L de cefotaxima para matar aAgrobacteria. O meio líquido é usado para umedecer o papel de filtro estéril.
Os embriões são incubados durante 4 semanas em 25° C, sob 150 μηιοί m"sec" e 12 horas de fotoperíodo. Uma vez que as mudas produzem raízes, sãotransferidas para o solo estéril de metromix. O meio das plantas in vitro foilavado antes da transferência das plantas para o solo. As plantas são mantidassob uma tampa plástica por 1 semana para favorecer o processo de adaptação.Então as plantas são transferidas para um ambiente de desenvolvimento ondeserão incubadas em 25° C, sob 150 μπιοί Hi-2Sec"1 de intensidade de luz e 12horas de fotoperíodo por cerca de 80 dias.
As plantas transgênicas são avaliadas por seu desenvolvimentomelhorado de raiz e/ou tolerância à tensão, demonstrando que a expressão detransgene transfere tolerância à tensão e/ou eficiência aumentada do uso deágua.
Exemplo 9
Engenharia de Semente de Plantas de Colza/Canola pela Super Expressão dogene SHMT4
O método de transformação das plantas descritas neste éaplicado ao Brassica e outras safras. Sementes de canola são esterilizadas nasuperfície com 70 % de etanol por 4 minutos em temperatura ambiente comagitação contínua, seguidas por 20 % (v/v) de Clorox suplementado com 0,05C7c (v/v) de Tween por 20 minutos, em temperatura ambiente com agitaçãocontínua. Então, as sementes são enxaguadas 4 vezes com água destilada ecolocadas em papel de filtro estéril umedecido em uma placa de Petri emtemperatura ambiente por 18 horas. Então as safras da semente são removidase as sementes são secadas ao ar durante a noite em uma placa de Petri estérilmeio aberta. Durante este período, as sementes perdem aproximadamente 85% de seu teor de água. As sementes são então armazenadas em temperaturaambiente em uma placa de Petri selada até o uso mais adiante. As construçõesdo DNA e a saturação embriônica são como descritas no exemplo 10.Amostra das plantas transgênicas primárias (TO) são analisadas por PCR paraconfirmar a presença de T-DNA. Estes resultados são confirmados porhibridização de Southern em que o DNA é submetido a eletroforese em 1 %de gel de agarose e transferida para uma membrana de náilon positivamentecarregada (Roche Diagnostics). O kit Probe Synthesis PCR DIG (RocheDiagnostics) é usado para preparar uma sonda rotulada por digoxigenina porPCR e usada como recomendada pelo fabricante.
As plantas transgênicas são avaliadas por seu desenvolvimentomelhorado de raiz e/ou tolerância à tensão, demonstrando que a expressão detransgene transfere tolerância à tensão e/ou eficiência aumentada do uso deágua.
Exemplo 10
Engenharia de Plantas de Milho pela Super Expressão do Gene de SHMT4
A transformação do milho {Zea Mays L.) que o gene deinteresse foi realizado com o método descrito por Ishida et al., 1996, NatureBiotech. 14745-50. Os embriões imaturos são co-cultivados comAgrobacterium tumefaciens que carrega vetores "super binário" e plantastransgênicas são recuparadas através da organogênese. Este procedimentoprovém de uma transformação eficiente entre 2,5 % e 20 %. As plantastransgênicas são avaliadas por seu desenvolvimento melhorado de raiz e/outolerância à tensão, demonstrando que a expressão de transgene transferetolerância à tensão e/ou eficiência aumentada do uso de água.
Exemplo 11
Engenharia de Plantas de Arroz pela Super Expressão do Gene de SHMT4
A transformação do arroz que o gene de interesse pode sofrerpelas técnicas de transferência de gene direto, técnicas utilizando-se debombardeamento de protoplasto ou partículas. A transformação mediada porprotoplastos foi descrita por tipos Japonica e tipos Indica (Zhang et al., PlantCell Rep 7: 379-384 (198S); Shimamoto et al. Nature 338: 274-277 (1989);Datta et al. Biotechnology 8: 736-740 (1990)). Ambos os tipos são tambémrotineiramente transformados usando-se bombardeamento de partículas(Christou et al. Biotechnology 9: 957-962 (1991)). As plantas transgênicassão avaliadas por seu desenvolvimento melhorado e/ou tolerância à tensão,demonstrando que a expressão de transgene transfere tolerância à tensão e/oueficiência aumentada do uso de água.
Exemplo 12
Identificação de Genes Homólogos e Hetorólogos
As seqüências de gene pode ser usada para identificar geneshomólogos ou heterólogos a partir de cDNA ou biblioteca genômicas. Geneshomólogos (por exemplo clones de cDNA de comprimento total) podem serisolados por intermédio de hibridização de ácido nucleico usando-se porexemplo bibliotecas de cDNA. Dependendo da abundância do gene deinteresse, 100.000 até 1.000.000 bacteriófagos recombinantes são colocados etransferidos em membranas de náilon. Após desnaturação com álcali, o DNAé imobilizado na membrana por, por exemplo, Reticulação por UV.Hibridização é realizada em condições de estrigências altas. Em soluçõesaquosas, hibridização e lavagem são realizadas em uma força iônica de 1 Mde NaCl e uma temperatura de 68° C. As sondas de hibridização são geradaspor, por exemplo, rotulação de transcrição de corte (32P) radioativa (HighPrime, Roche, Mannheim, Germany). Sinais são detectados porautoradiografia.
Os genes parcialmente homólogos ou heterólogos que sãorelacionados mas não idênticos podem ser identificados de uma maneiraanáloga ao procedimento descrito acima usando-se hibridização de baixaestringência e condições de lavagem. Para hibridização aquosa, a força iônicaé normalmente mantida em 1 M de NaCl enquanto uma temperatura éprogressivamente diminuída de 68 para 42° C.
O isolamento da seqüência de gene com homologias (ouidentidade/similaridade de seqüência) somente em um domínio distinto de(por exemplo 10 a 20 aminoácidos) podem ser realizados usando-se sondas deoligonucleotídeo radio rotuladas sintéticas. Oligonucleotídeos radiorrotuladassão preparadas por fosforilação e a extremidade iniciadora 5 e de doisoligonucleotídeos complementares com T4 polinucleotídeo cinase. Osoligonucleotídeos complementares são recozidos e ligados para formarconcatêmeros. Os concatêmeros de filamentos duplos são entãoradiorrotulados por, por exemplo, transcrição de corte, hibridização énormalmente realizada em condições de baixas estringências usando-seconcentrações altas de oligonucleotídeo.
A solução de hibridização de Oligonucleotídeo:
6 χ SSC
0,01 M fosfato de sódio
1 mM de EDTA (pH 8)
0,5 % SDS
100 kg/ml de DNA de esperma de salmão desnaturado
0,1 % leite seco desnatado
Durante a hibridização, a temperatura foi baixadagradualmente de 5 a 10° C abaixo do nucleotídeo estimado ou abaixo datemperatura ambiente, seguido por etapas de lavagem e autoradiografia.Lavagem é realizada com baixa estringência, tal como 3 etapas de lavagemusando-se 4 χ SSC. Ainda detalhes são descritos por Sambrook, J. et al„1989, "Molecular Cloning; A Laboratoiy Manual", Cold Spring HarborLaboratory Press or Ausubel, F.M. et al., 1994, "Current Protocols inMolecular Biology", John Wiley & Sons.
Exemplo 13
Identificação de Genes Homólogos pela Avaliação de Bibliotecas deExpressão com Anticorpos
Os clones de c-DNA podem ser usados para produzir proteínasrecombinantes por exemplo em E. coli (por exemplo, Qiagen QIAexpresspQE system). Proteínas recombinantes são então normalmente purificadas porafinidade por intermédio da Ni-NTA cromatografia de afinidade (Qiagen).Proteínas recombinantes são então usadas para produzir anticorposespecíficos por exemplo usando-se técnicas padrão de imunização de coelho.Os anticorpos são purificados por afinidade usando-se uma coluna de Ni-NTAsaturada com o antígeno recombinante como descrito por Gu et al., 1994,BioTechnics 17:257-262. O anticorpo podem ser usados para avaliar asbibliotecas de expressão de cDNA para identificar genes homólogos ouheterólogos por intermédio de uma avaliação imonulógica (Sambrook, J. etal., 1989, "Molecular Cloning: A Laboratory Manual", Cold Spring HarborLaboratory Press or Ausubel, F.M. et al., 1994, "Current Protocols inMolecular Biology", John Wiley & Sons).
Exemplo 14
Mutagênese in vivo
Mutagenese in vivo de microorganismos podem ser realizadospor passagem de plasmídeo (ou outro vetor ) de DNA através E. coli ououtros microorganismos (por exemplo, Bacillus spp. ou leveduras tais comoSaccharomyces eerevisiaej que são debilitados em suas capacidades paramanter a integridade de sua informação genética. As cepas de mutação típicatem mutações nos genes para o Sistema reparador de DNA (por exemplo,mutHLS, mutD, mutT, etc.; por referência, ver Rupp, W.D., 1996, DNArepair mechanisms, em: Eseheriehia coli and Salmonella, p. 2277-2294,ASM: Washington.) Tais cepas são bem conhecidas para aqueles habilitadosna técnica. O uso de tais cepas são ilustradas, por exemplo, em Greener, A.and Callahan, M., 1994, Strategies 7:32-34, Transferência de moléculas deDNA mutadas dentro das plantas é preferivelmente realizado depois daseleção e teste em microorganismos. Planta transgênicas são geradas deacordo com vários exemplos dentro da exemplificação deste documento.
Exemplo 15
Análise in vitro da Função de Gene Arabidopsis em Organismos TransgênicosA determinação de atividades e parâmetros cinéticos deenzimas está bem estabelecida na técnica. Experimentos para determinar aatividade de qualquer enzima alterada dada deve ser adaptada a atividadeespecífica de enzimas de tipo selvagem, que está satisfatoriamente dentro dahabilidade de uma prática na técnica. As visões gerais sobre enzimas no geral,bem como detalhes específicos que dizem respeito a estrutura, cinética,princípios, métodos, aplicações e exemplos pela determinação de muitasatividades de enzima pode ser observada, por exemplo, nas referênciasseguintes: Dixon, M. e Webb, E.C., 1979, Enzymes. Longmans: London;Fersht, 1985, Enzyme Structure and Mechanism. Freeman: New York; Walsh,1979. Enzymatic Reaction Mechanisms, Freeman: San Francisco; Parroz,N.C., Stevens, L., 1982, Fundamentais of Enzymology. Oxford Univ. Press:Oxford; Boyer, P.D., ed., 1983, The Enzymes, 3rd ed. Academic Press: NewYork; Bisswanger, H., 1994, Enzymkinetik, 2nd ed. VCH: Weinheim (ISBN3527300325); Bergmeyer, H.U., Bergmeyer, J., Gral31, M., eds., 1983-1986,Methods of Enzymatic Analysis, 3rded., vol. I-NII, Verlag Chemie: Weinheime Ullmann1S Enciclopédia of Industrial Chemistry, 1987, vol. A9, Enzymes.VCH: Weinheim, p. 352-363.
A atividade das proteínas que liga-se ao DNA pode seravaliada por diversos métodos bem estabelecidos, tal como ensaios demudança de faixa de DNA (também denominado ensaio de retardamento degel). O efeito de tais proteínas na expressão de outras moléculas pode seravaliada usando-se ensaio de gene repórter (tal como aquele descrito emKolmar, H. et al., 1995. EMBO J. 14: 3895-3904 e referências citadas neste).Os sistemas de teste do gene repórter são bem conhecidos e estabelecidos poraplicações tanto nas células pocarióticas quanto eucarióticas, usando-seenzimas tal como (3-galactosidase, proteína fluorescente verde e de outrosdiversos.
A determinação de atividade de proteína de transporte demembrana podem ser realizado de acordo com técnicas tal como essasdescritas em Gennis, R.B., 1989, Pores, Channels and Transporters, inBiomembranes, Molecular Structure and Function, pp. 85-137, 199-234 and270-322, Springer: Heidelberg.
Exemplo 16
Purificação do Produto Desejado a partir de Organismos Transformados
A recuperação do produto desejado a partir do materialvegetal, fungos, algas, ciliados, células de C. glutamicum, e outras célulasbacterianas com as seqüências de ácido nucleico descrito nisso ou osobrenadante das culturas descritas acima podem ser realizadas por váriosmétodos bem conhecidos na técnica. Se o produto desejado não for secretadoa partir das células, as células podem ser coletadas a partir da cultura pelacentrifugação em baixa velocidade e as células podem ser lisadas pelastécnicas padrão, tal como força mecânica ou sonicação. Os órgãos das plantaspodem ser separados mecanicamente a partir de um outro tecido ou órgãos.
Seguindo homogeneização, fragmentos celulares são removidos porcentrifugação e a fração sobrenadante contendo as proteínas solúveis éretirada para purificação adicional dos compostos desejados. Se o produto ésecretado a partir das células desejadas, então as células são removidas apartir da cultura pela centrifugação em baixa velocidade e a fraçãosobrenadante é retirada para purificação adicional.
Ea fração sobrenadante a partir de outro método depurificação é submetido a cromatografia com um resina adequada, em queuma molécula desejada é retida em uma resina de cromatografia enquantoqualquer uma das impurezas na amostra não estão, ou onde as impurezas sãoretidas pela resina enquanto a amostra não é. Tais etapas da cromatografiapodem ser repetidas quando necessárias, usando-se a amostra ou resinas dediferentes cromotagrafias. Um pessoa habilitada na técnica deve ser bemhabilitado na seleção de resinas de cromatografia apropriada e em suaaplicação mais eficaz por uma molécula particular sendo purificada. Oproduto purificado pode ser concentrado por filtração ou utrafiltração earmazenada em uma temperatura em que a estabilidade do produto émaximizada.
Existe uma série ampla de métodos de purificação conhecidosna técnica e o método precedente de purificação não é entendido ser limitante.Tais técnicas de purificação são descritas, por exemplo, em Bailey, J.E. &Ollis, 1986, D.F. Biochemical Engineering Fundamentais, McGraw-Hill: NewYork. Adicionalmente, a identidade e pureza dos componentes isoladospodem ser estimadas por técnicas padrão na técnica. Este inclui cromatografialíquida de alto desempenho de (HPLC), métodos espectroscópicos, métodosde tingimento, cromatografia de camada fina, NIB S, ensaio enzimático, oumicrobiologicamente. Tais métodos de análise são revistos em: Patek et ai.,1994, Appl. Environ. Microbiol. 60:133-140; Malakhova et al., 1996,Biotekhnologiya 11:27-32 e Schmidt et al., 1998, Bioprocess Engineer.19:67-70; Ulmann's Enciclopédia of Industrial Chemistry, 1996, vol. A27,VCH: Weinheim, p. 89-90, p. 521-540, p. 540-547, p. 559-566, 575-581 e p.581-587; Michal, G., 1999, Biochemical Pathways: An Atlas of Biochemistryand Molecular Biology, John Wiley and Sons; Fallon, A. et al., 1987,Aplicações de HPLC in Biochemistry in: Laboratory Técnicas inBiochemistry and Molecular Biology, vol. 17.
Exemplo 17
Avaliação de Tolerância ao Sal
Teste de sal em placas de MS
Avaliações são transferidas ao papel de filtro molhado em '/2de MS e colocados em 1/2 de MS 0,6 % de ágar suplementado com 2ug/ml debenomila a noite antes da avaliação da tensão. Para avaliar a tensão, o papelde filtro com a avaliação é movido para pilhas de papel de filtro estéril,molhado em 50 mM de NaCl, em uma placa de petri. Após duas horas, opapel de filtro com a avaliação é movido para pilhas de papel de filtro estéril,molhado com 200 nM de NaCl, em uma placa de petri. Após duas horas, opapel de filtro com a avaliação é movido para pilhas de papel de filtro estéril,molhado em 600 mM de NaCl5 em uma placa de petri. Após 10 horas, asmudas são movidas para uma placa de petri contendo V2 de MS 0,6 % de ágarsuplementado com 2 μ§/ηι1 de benomila. As mudas são contadas após 5 dias,demonstrando que a expressão de transgene transfere tolerância ao sal.
Teste de Solo para Tolerância ao Sal
As sementes de plantas a serem testadas são esterilizadas (100% de alvejante, 0,1 % de TritonX por cinco minutos duas vezes e enxaguadascinco vezes com ddH20). As sementes são colocadas no meio que não o deseleção (1/2 de MS, 0,6 % de phytagar, 0,5 g/L de MES, 1 % de sacarose, 2μg/ml de benamila),
Sementes são deixadas germinar por aproximadamente 10dias. No estágio de 4 a 5 folhas, plantas transgênicas são colocadas dentro depotes de 5,5 cm de diâmetro enchidos com solo frouxamente embalado(Metromix 360, Scotts) umectado com 1 g/L de fertilizante 20-20-20 (PetersProfessional, Scotts).
As plantas são deixadas para desenvolver (22° C, luz contínua)por aproximadamente sete dias, umidificando-se quando necessário. Quandoas plantas estão quase separadas, a água é removida de uma bandeja e oensaio é iniciado. Para começar o ensaio, três litros de 100 mM de NaCl e 1/2de MS é adicionado à bandeja sob os potes. À bandeja contendo as plantas decontrole, três litros de 1/8 de MS é adicionado. Após 10 dias, as plantastratadas com NaCl e as de controle é dado água. Dez dias depois, as plantassão fotografadas.
Exemplo 18
Avaliação da Tolerância à Seca
As avaliações de Tl e T2 são transferidas ao papel de filtroseco estéril em uma placa de Petri e deixado secar por duas horas em 80 % deRH (umidade relativa)
em um Sanyo Growth Cabinet MLR-350H, micromols11112 (luz branca; Tubo fluorescente Philips TL 65W/25). O RH é entãodiminuído para 60 % e as mudas ainda são secadas por oito horas. As mudassão então removidas e colocados em V2 de MS 0,6 % de placas de ágarsuplementado com 2 μ§/ηι1 de benomila e contadas após cinco dias.
As plantas transgênicas são avaliadas por sua tolerância secamelhorada demonstrando que a expressão de transgene transfere tolerância aseco.
Exemplo 19
Avaliação de Tolerância ao Congelamento
As mudas são movidas para as placas em petri contendo xI2 deMS 0,6 % de ágar suplementado com 2 % de sacarose e 2 μ§/ιη1 de benomila.Após quatro dias, as mudas são incubadas em +4° C por 1 hora e entãocobertas com gelo fino. As mudas são então colocadas em um EnvironmentalSpecialist ES2000 Environmental Chamber e incubadas por 3,5 horascomeçando em -1,0° C decrescente -1°C hora. As mudas são então incubadasem -5,0° C por 24 horas e então colocadas para descongelar a +5° C por 12horas. A água é vertida e as mudas são contadas após 5 dias.
As plantas transgênicas são avaliadas por sua tolerância deesfriamento improvável demonstrando que a expressão de transgene transferetolerância de esfriamento.LISTAGEM DE SEQÜÊNCIAS
<110> BASF Plant Science GmbHSarria-Millan, RodrigoGarr, Eric RHaertel, JamieAllen, DamianMcKersie, Bryan
<120> AUMENTO DE RENDIMENTO EM PLANTAS QUE SUPER-EXPRESSAM OS GENES SHSRP
<130> PF2063015104
<150> US 60/700,267<151> 2005-07-18
<160> 162
<170> PatentIn version 3.3
<210> 1<211> 1416<212> DNA
<213> Arabidopsis thaliana
<220><221> CDS<222> (1) .. (1416)
<400> 1
atg gaa cca gtc tct tca tgg ggt aac acc tct ctc gtcMet Glu Pro Val Ser Ser Trp Gly Asn Thr Ser Leu Val15 10
cca gag ate cac gac cta ate gag aag gag aaa cgt cggPro Glu Ile His Asp Leu Ile Glu Lys Glu Lys Arg Arg
20 25
gga ate gaa ctt ate gct tcc gag aat ttc act tcc ttc
Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe
35 40 45
gaa gct ctc gga agt gcc tta acc aac aaa tac tcc gaa
Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu
50 55 60
ggt aat cgt tat tac gga ggt aac gaa ttc ate gat gag
Gly Asn Arg Tyr Tyr Gly Gly Asn Glu Phe Ile Asp Glu
65 70 75
ctt tgc cgt tca aga gct ctc gaa gct ttc cat tgt gat
Leu Cys Arg Ser Arg Ala Leu Glu Ala Phe His Cys Asp
85 90
tÇTÇT 99a gtt aat gtt cag ccg tat tct gga tct ccg gea
Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala
100 105
gct tac acg gct ttg ctt cag cct cac gat cgt ate atg
Ala Tyr Thr Ala Leu Leu Gln Pro His Asp Arg Ile Met115 120 125
ttg cct tca ggt ggt cat ttg act cat ggt tac tat aca
Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr
130 135 140
aag aag ate tct gcg act tcg ate tae ttt ggg agt ctt
Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Gly Ser Leu
145 150 155
gtg aat ttc acc act ggt tac att gat tac gat aag ctt
Val Asn Phe Thr Thr Gly Tyr Ile Asp Tyr Asp Lys Leu
tcc gta gat 48
Ser Val Asp15
caa tgt cga 96
Gln Cys Arg30
gcc gtc ate 144
Ala Val Ile
ggt att ccc 192
Gly Ile Pro
ate gag aat 240
Ile Glu Asn80
cca gea gcg 288
Pro Ala Ala95
aat ttc gct 336
Asn Phe Ala110
ggg ctt gat 384
Gly Leu Asp
tct ggt ggt 432
Ser Gly Gly
ccg tat aag 480
Pro Tyr Lys160
gaa gag aag 528
Glu Glu Lys165 170 175
gcg ttg gat ttc agg cct aag ttg ctt ate tgt ggt ggt agt gcg tat 576
Ala Leu Asp Phe Arg Pro Lys Leu Leu Ile Cys Gly Gly Ser Ala Tyr
180 185 190
cct agg gat tgg gat tac gct aga ttt aga gct att gct gat aag gtt 624
Pro Arg Asp Trp Asp Tyr Ala Arg Phe Arg Ala Ile Ala Asp Lys Val
195 200 205
gga gct ctt ttg ctt tgt gac atg gct cac ate agt ggt ctc gtt gct 672
Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala
210 215 220
gct cag gaa gct gea aac cca ttt gag tac tgt gac gtt gtg aca acc 720
Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr Thr225 230 235 240
aca acc cac aag agt ttg agg ggt cca agg gct ggt atg att ttc tac 768
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr
245 250 255
agg aag ggt cca aaa cca cca aag aag ggt caa ccc gag ggt gea gtc 816
Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala Val
260 265 270
tat gat ttt gag gac aaa ate aac ttt gct gta ttc cct gcg ctt caa 864
Tyr Asp Phe Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ala Leu Gln
275 280 285
ggt ggt cct cac aat cac cag att ggt gct cta gct gtt gcg ttg aag 912
Gly Gly Pro His Asn His Gln Ile Gly Ala Leu Ala Val Ala Leu Lys
290 295 300
cag gct aat act cct ggg ttc aag gtc tac gea aaa caa gtg aaa gcc 960
Gln Ala Asn Thr Pro Gly Phe Lys Val Tyr Ala Lys Gln Val Lys Ala305 310 315 320
aat gct gtt gcc ctt gga aac tac cta atg age aag ggt tac cag att1008
Asn Ala Val Ala Leu Gly Asn Tyr Leu Met Ser Lys Gly Tyr Gln Ile
325 330 335
gtg acc aat gga act gag aac cac ctt gtt ctc tgg gat ctt cgc cct1056
Val Thr Asn Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro
340 345 350
ctt gga ttg acc gga aac aag gtt gag aag ctc tgc gat ctg tgc age1104
Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys Ser
355 360 365
att aca ttg aac aag aac gea gta ttt gga gac agt agt gct ctt gct1152
Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ala
370 375 380
cct gga ggt gta aga ate ggt gea ccc gcg atg aca tcg aga gga ttg1200
Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly Leu385 390 395 400
gtg gag aag gac ttt gag cag ata gga gaa ttc ctg age cgt gea gtg1248
Val Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu Ser Arg Ala Val
405 410 415
aca ctg acg ttg gac ate caa aag aca tac ggt aag ttg ttg aag gac1296
Thr Leu Thr Leu Asp Ile Gln Lys Thr Tyr Gly Lys Leu Leu Lys Asp
420 425 430
ttc aac aag ggt ttg gtg aac aac aaa gat ctc gat cag ctc aag gct1344
Phe Asn Lys Gly Lsu Val Àsn As π Lys Àsp Leu Asp Gl π Lsu Lys Al 3.
435 440 445
gat gtc gag aag ttc tcg gcg tet tat gag atg cct gga ttc ctc atg1392
Asp Val Glu Lys Phe Ser Ala Ser Tyr Glu Met Pro Gly Phe Leu Met
\450 455 460
tct gag atg aag tac cag gat tag1416
Ser Glu Met Lys Tyr Gln Asp465 470
<210> 2<211> 471<212> PRT
<213> Arabidopsis thaliana
<400> 2
Met Glu Pro Val Ser Ser Trp Gly Asn Thr Ser Leu Val Ser Val Asp15 10 15
Pro Glu Ile His Asp Leu Ile Glu Lys Glu Lys Arg Arg Gln Cys Arg
20 25 30
Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Ile
35 40 45
Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Ile Pro
50 55 60
Gly Asn Arg Tyr Tyr Gly Gly Asn Glu Phe Ile Asp Glu Ile Glu Asn65 70 75 80
Leu Cys Arg Ser Arg Ala Leu Glu Ala Phe His Cys Asp Pro Ala Ala
85 90 95
Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala
100 105 110
Ala Tyr Thr Ala Leu Leu Gln Pro His Asp Arg Ile Met Gly Leu Asp
115 120 125
Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ser Gly Gly
130 135 140
Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Gly Ser Leu Pro Tyr Lys145 150 155 160
Val Asn Phe Thr Thr Gly Tyr Ile Asp Tyr Asp Lys Leu Glu Glu Lys
165 170 175
Ala Leu Asp Phe Arg Pro Lys Leu Leu Ile Cys Gly Gly Ser Ala Tyr
180 185 190
Pro Arg Asp Trp Asp Tyr Ala Arg Phe Arg Ala Ile Ala Asp Lys Val
195 200 205
Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala
210 215 220
Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr Thr225 230 235 240
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr
245 250 255
Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala Val
260 265 270
Tyr Asp Phe Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ala Leu Gln
275 280 285
Gly Gly Pro His Asn His Gln Ile Gly Ala Leu Ala Val Ala Leu Lys
290 295 300
Gln Ala Asn Thr Pro Gly Phe Lys Val Tyr Ala Lys Gln Val Lys Ala305 310 315 320
Asn Ala Val Ala Leu Gly Asn Tyr Leu Met Ser Lys Gly Tyr Gln Ile
325 330 335
Val Thr Asn Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro
340 345 350
Leu Gly Xj6U Thr Gly Asn Lys Val Glu Lys Lsu Cys Asp Leu Cys Ser
355 360 365
Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ala
370 375 380
Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly Leu385 390 395 400
Val Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu Ser Arg Ala Val405 410 415 Thr Leu Thr Leu 420 Asp Ile Gln Lys Thr 425 Tyr Gly Lys Leu Leu 430 Lys AspPhe Asn Lys 435 Gly Leu Val Asn Asn 440 Lys Asp Leu Asp Gln 445 Leu Lys AlaAsp Val 450 Glu Lys Phe Ser Ala 455 Ser Tyr Glu Met Pro 460 Gly Phe Leu Met
Ser Glu Met Lys Tyr Gln Asp465 470
<210> 3<211> 1944<212> DNA
<213> Arabidopsis thaliana
<220><221> CDS
<222> (531)..(1766)<400> 3
ctcactagtc cccccccccc ccggagcttt ttttgttgtg atatatcccg taaaacccta 60
aacatagtca cttcatcgtc tcctccactg tatcattcaa tctctgtctt ccttcttttt 120
agcgacctcg tctccaaagc tcacaaattt tctacctttc cggagtagag agaaagatgc 180
aagcttgttg tggtggtaat tcgatggctt ctcttcagca acctggacgg gttcaaggat 240
ctgtctttcc cccaattatg cctccagtga ccaaattttc tcagcagttg aagttcaata 300
tttcaaaacc tttccgttct tcatttctga aaagaaacct ggtctctgaa atgagagcat 360
cttcagtctc gctacctaat gtcgagataa gcagcaaaga aatccctttt gaggactatg 420
gtcttggtga agttgatcca gaggtccgaa ccatcatcac aaaggagaaa gatagacaat 480
tcaggagctt ggagcttatt gcatctgaga atttcacgtc tcgagcagtt atg gag 536
Met Glu1
tgc ctt acc aac aag tat tct gag gga ctg cct ggt 584
Cys Leu Thr Asn Lys Tyr Ser Glu Gly Leu Pro Gly
10 15
ggt ggc aat gag tac att gat cag ttg gag acg ctt 632
Gly Gly Asn Glu Tyr Ile Asp Gln Leu Glu Thr Leu
25 30
gct ttg gca gcc ttc cgc tta gat tct acg aaa tgg 680
Ala Leu Ala Ala Phe Arg Leu Asp Ser Thr Lys Trp
40 45 50
cag ccg tta tct ggt tca cct gca aac ttt gct gtc 728
Gln Pro Leu Ser Gly Ser Pro Ala Asn Phe Ala Val55 60 65
ctt age cct cat gat cgg ate atg ggt ttg gat tta 776
Leu Ser Pro His Asp Arg Ile Met Gly Leu Asp Leu
75 80
cat ctg tcg cat ggg ttc atg acc gct aaa agg cgt 824
His Leu Ser His Gly Phe Met Thr Ala Lys Arg Arg
90 95
tca ata tac ttt gag tcc atg cct tat cga ctt gat 872
Ser Ile Tyr Phe Glu Ser Met Pro Tyr Arg Leu Asp
105 110
att gtt gac tac gat atg ctc gag aaa act gct aca 920
Ile Val Asp Tyr Asp Met Leu Glu Lys Thr Ala Thr120 125 130
gcg gtt ggc tcaAla Val Gly Ser5
aaa aga tat tatLys Arg Tyr Tyr20
tgc cag aac cggCys Gln Asn Arg35
ggg gtt aat gttGly Val Asn Val
tac act gcg ataTyr Thr Ala Ile70
cct cac ggt ggtPro His Gly Gly85
gta tct gga actVal Ser Gly Thr100
gaa tca aca ggcGlu Ser Thr Gly115
\ctt ttc aga cca aag ctt att ate gea gga gct agt gea tac age cga 968
Leu Phe Arg Pro Lys Leu Ile Ile Ala Gly Ala Ser Ala Tyr Ser Arg
135 140 145
gat ttt gac tat cct cgc atg agg aag ate gea gac tca gtt ggt gct1016
Asp Phe Asp Tyr Pro Arg Met Arg Lys Ile Ala Asp Ser Val Gly Ala
150 155 160
ttt ctg atg atg gat atg gct cat ate agt ggg ctt gtg gct gct tet1064
Phe Leu Met Met Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Ser
165 170 175
gtg gta gct gac cct ttt gag tat tgt gat att gtt aca aca aca act1112
Val Val Ala Asp Pro Phe Glu Tyr Cys Asp Ile Val Thr Thr Thr Thr
180 185 190
cac aag tet ttg aga ggt ccg aga ggt ggc atg ate ttc ttc agg aag1160
His Lys Ser Leu Arg Gly Pro Arg Gly Gly Met Ile Phe Phe Arg Lys195 200 205 210
gat cca att aat ggg gtt gat ctt gaa tet gcc gtg aac aat gct gtc1208
Asp Pro Ile Asn Gly Val Asp Leu Glu Ser Ala Val Asn Asn Ala Val
215 220 225
ttc cct ggt ttg cag ggt ggc cct cat aac cac aca att gga gga tta1256
Phe Pro Gly Leu Gln Gly Gly Pro His Asn His Thr Ile Gly Gly Leu
230 235 240
gea gtc tgc ttg aaa cac gea caa tca ccg gaa ttc aag gcg tac cag1304
Ala Val Cys Leu Lys His Ala Gln Ser Pro Glu Phe Lys Ala Tyr Gln
245 250 255
aaa aga gtt gtg tet aac tgt aga gct cta gct aac cga ttg gtt gaa1352
Lys Arg Val Val Ser Asn Cys Arg Ala Leu Ala Asn Arg Leu Val Glu
260 265 270
ctc ggg ttt aag cta gtt tet ggt ggc age gat aac cac ttg gtt etc1400
Leu Gly Phe Lys Leu Val Ser Gly Gly Ser Asp Asn His Leu Val Leu275 280 - 285 290
gtc gat ctt aga ccc atg ggt atg gat ggt gcg cgg gtt gag aaa ate1448
Val Asp Leu Arg Pro Met Gly Met Asp Gly Ala Arg Val Glu Lys Ile
295 300 305
tta gac atg gea tet att act ctc aac aag aac tet gtc cct ggg gac1496
Leu Asp Met Ala Ser Ile Thr Leu Asn Lys Asn Ser Val Pro Gly Asp
310 315 320
aaa agt gcg ttg gta cca ggg gga ata agg ata gga tcc ccc gcg atg1544
Lys Ser Ala Leu Val Pro Gly Gly Ile Arg Ile Gly Ser Pro Ala Met
325 330 335
acg aca aga gga ctg tca gag aaa gac ttt gta gta gtg gct gac ttc1592
Thr Thr Arg Gly Leu Ser Glu Lys Asp Phe Val Val Val Ala Asp Phe
340 345 350
ate aag gaa ggt gtg gag ata aca atg gaa gcc aag aaa gcc gcg ccg1640
Ile Lys Glu Gly Val Glu Ile Thr Met Glu Ala Lys Lys Ala Ala Pro355 360 365 370
ggt tca aag ctt caa gat ttc aac aag ttc gtg aca tet cct gag ttt1688
Gly Ser Lys Leu Gln Asp Phe Asn Lys Phe Val Thr Ser Pro Glu Phe375 380 385cca ttg aaa gag aga gtg aag agt cta aag gag aga gtg gaa acc ttc1736
Pro Leu Lys Glu Arg Val Lys Ser Leu Lys Glu Arg Val Glu Thr Phe
390 395 400
aca tct cgt ttt ccc att cct ggc gtt taagctataa acacacacag1783
Thr Ser Arg Phe Pro Ile Pro Gly Val
405 410
atatgctctt gttgtacctt aattattcac ctttttcatc tgtcttttag ggtttttact1843
tgcttgtgtc ccaagtttaa agttacagtt gaatcgagag aaattatttt caaaaataaa1903
tttatttgtg gaacaatgat tcgtctatgt tcccaaatct c1944
<210> 4<211> 411<212> PRT
<213> Arabidopsls thaliana <400> 4 Met Glu Ala Val Gly Ser Cys Leu Thr Asn Lys Tyr Ser Glu Gly Leu1 5 10 15 Pro Gly Lys Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Gln Leu Glu 20 25 30 Thr Leu Cys Gln Asn Arg Ala Leu Ala Ala Phe Arg Leu Asp Ser Thr 35 40 45 Lys Trp Gly Val Asn Val Gln Pro Leu Ser Gly Ser Pro Ala Asn Phe 50 55 60 Ala Val Tyr Thr Ala Ile Leu Ser Pro His Asp Arg Ile Met Gly Leu65 70 75 80Asp Leu Pro His Gly Gly His Leu Ser His Gly Phe Met Thr Ala Lys 85 90 95 Arg Arg Val Ser Gly Thr Ser Ile Tyr Phe Glu Ser Met Pro Tyr Arg 100 105 110 Leu Asp Glu Ser Thr Gly Ile Val Asp Tyr Asp Met Leu Glu Lys Thr 115 120 125 Ala Thr Leu Phe Arg Pro Lys Leu Ile Ile Ala Gly Ala Ser Ala Tyr 130 135 140 Ser Arg Asp Phe Asp Tyr Pro Arg Met Arg Lys Ile Ala Asp Ser Val145 150 155 160Gly Ala Phe Leu Met Met Asp Met Ala His Ile Ser Gly Leu Val Ala 165 170 175 Ala Ser Val Val Ala Asp Pro Phe Glu Tyr Cys Asp Ile Val Thr Thr 180 185 190 Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Gly Met Ile Phe Phe 195 200 205 Arg Lys Asp Pro Ile Asn Gly Val Asp Leu Glu Ser Ala Val Asn Asn 210 215 220 Ala Val Phe Pro Gly Leu Gln Gly Gly Pro His Asn His Thr Ile Gly225 230 235 240Gly Leu Ala Val Cys Leu Lys His Ala Gln Ser Pro Glu Phe Lys Ala 245 250 255 Tyr Gln Lys Arg Val Val Ser Asn Cys Arg Ala Leu Ala Asn Arg Leu 260 265 270 Val Glu Leu Gly Phe Lys Leu Val Ser Gly Gly Ser Asp Asn His Leu 275 280 285 Val Leu Val Asp Leu Arg Pro Met Gly Met Asp Gly Ala Arg Val Glu 290 295 300 Lys Ile Leu Asp Met Ala Ser Ile Thr Leu Asn Lys Asn Ser Val Pro
\305 310 315 320Gly Asp Lys Ser Ala 325 Leu Val Pro Gly Gly 330 Ile Arg Ile Gly Ser 335 ProAla Met Thr Thr 340 Arg Gly Leu Ser Glu 345 Lys Asp Phe Val Val 350 Val AlaAsp Phe Ile 355 Lys Glu Gly Val Glu 360 Ile Thr Met Glu Ala 365 Lys Lys AlaAla Pro 370 Gly Ser Lys Leu Gln 375 Asp Phe Asn Lys Phe 380 Val Thr Ser ProGlu Phe Pro Leu Lys Glu Arg Val Lys Ser Leu Lys Glu Arg Val Glu385 390 395 400Thr Phe Thr Ser Arg 405 Phe Pro Ile Pro Gly 410 Val
<210> 5<211> 1944<212> DNA
<213> Arabidopsis thaliana
<220><221> CDS
<222> (762)..(1766)<400> 5
ctcactagtc cccccccccc ccggagcttt ttttgttgtg atatatcccg taaaacccta 60
aacatagtca cttcatcgtc tcctccactg tatcattcaa tctctgtctt ccttcttttt 120
agcgacctcg tctccaaagc tcacaaattt tctacctttc cggagtagag agaaagatgc 180
aagcttgttg tggtggtaat tcgatggctt ctcttcagca acctggacgg gttcaaggat 240
ctgtctttcc cccaattatg cctccagtga ccaaattttc tcagcagttg aagttcaata 300
tttcaaaacc tttccgttct tcatttctga aaagaaacct ggtctctgaa atgagagcat 360
cttcagtctc gctacctaat gtcgagataa gcagcaaaga aatccctttt gaggactatg 420
gtcttggtga agttgatcca gaggtccgaa ccatcatcac aaaggagaaa gatagacaat 480
tcaggagctt ggagcttatt gcatctgaga atttcacgtc tcgagcagtt atggaggcgg 540
ttggctcatg ccttaccaac aagtattctg agggactgcc tggtaaaaga tattatggtg 600
gcaatgagta cattgatcag ttggagacgc tttgccagaa ccgggctttg gcagccttcc 660
gcttagattc tacgaaatgg ggggttaatg ttcagccgtt atctggttca cctgcaaact 720
ttgctgtcta cactgcgata cttagccctc atgatcggat σ atg ggt ttg gat tta 776
Met Gly Leu Asp Leu1 5
cct cac ggt ggt cat ctg tcg cat ggg ttc atg acc gct aaa agg cgt 824
Pro His Gly Gly His Leu Ser His Gly Phe Met Thr Ala Lys Arg Arg
10 15 20
gta tct gga act tca ata tac ttt gag tcc atg cct tat cga ctt gat 872
Val Ser Gly Thr Ser Ile Tyr Phe Glu Ser Met Pro Tyr Arg Leu Asp
25 30 35
gaa tca aca ggc att gtt gac tac gat atg ctc gag aaa act gct aca 920
Glu Ser Thr Gly Ile Val Asp Tyr Asp Met Leu Glu Lys Thr Ala Thr
40 45 50
ctt ttc aga cca aag ctt att ate gea gga gct agt gea tac age cga 968
Leu Phe Arg Pro Lys Leu Ile Ile Ala Gly Ala Ser Ala Tyr Ser Arg55 60 65gat ttt gac tat cct cgc atg agg aag ate gea gac tca gtt ggt gct1016
Asp Phe Asp Tyr Pro Arg Met Arg Lys Ile Ala Asp Ser Val Gly Ala70 75 80 85
ttt ctg atg atg gat atg gct cat ate agt ggg ctt gtg gct gct tet1064
Phe Leu Met Met Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Ser
90 95 100
gtg gta gct gac cct ttt gag tat tgt gat att gtt aca aca aca act1112
Val Val Ala Asp Pro Phe Glu Tyr Cys Asp Ile Val Thr Thr Thr Thr
105 110 115
cac aag tet ttg aga ggt ccg aga ggt ggc atg ate ttc ttc agg aag1160
His Lys Ser Leu Arg Gly Pro Arg Gly Gly Met Ile Phe Phe Arg Lys
120 125 130
gat cca att aat ggg gtt gat ctt gaa tet gcc gtg aac aat gct gtc1208
Asp Pro Ile Asn Gly Val Asp Leu Glu Ser Ala Val Asn Asn Ala Val
135 140 145
ttc cct ggt ttg cag ggt ggc cct cat aac cac aca att gga gga tta1256
Phe Pro Gly Leu Gln Gly Gly Pro His Asn His Thr Ile Gly Gly Leu150 155 160 165
gea gtc tgc ttg aaa cac gea caa tca ccg gaa ttc aag gcg tac cag1304
Ala Val Cys Leu Lys His Ala Gln Ser Pro Glu Phe Lys Ala Tyr Gln
170 175 180
aaa aga gtt gtg tet aac tgt aga gct cta gct aac cga ttg gtt gaa1352
Lys Arg Val Val Ser Asn Cys Arg Ala Leu Ala Asn Arg Leu Val Glu
185 190 195
etc ggg ttt aag cta gtt tet ggt ggc age gat aac cac ttg gtt ctc1400
Leu Gly Phe Lys Leu Val Ser Gly Gly Ser Asp Asn His Leu Val Leu
200 205 210
gtc gat ctt aga ccc atg ggt atg gat ggt gcg cgg gtt gag aaa ate1448
Val Asp Leu Arg Pro Met Gly Met Asp Gly Ala Arg Val Glu Lys Ile
215 220 225
tta gac atg gea tet att act ctc aac aag aac tet gtc cct ggg gac1496
Leu Asp Met Ala Ser Ile Thr Leu Asn Lys Asn Ser Val Pro Gly Asp230 235 240 245
aaa agt gcg ttg gta cca ggg gga ata agg ata gga tcc ccc gcg atg1544
Lys Ser Ala Leu Val Pro Gly Gly Ile Arg Ile Gly Ser Pro Ala Met
250 255 260
acg aca aga gga ctg tca gag aaa gac ttt gta gta gtg gct gac ttc1592
Thr Thr Arg Gly Leu Ser Glu Lys Asp Phe Val Val Val Ala Asp Phe
265 270 275
ate aag gaa ggt gtg gag ata aca atg gaa gcc aag aaa gcc gcg ccg1640
Ile Lys Glu Gly Val Glu Ile Thr Met Glu Ala Lys Lys Ala Ala Pro
280 285 290
ggt tca aag ctt caa gat ttc aac aag ttc gtg aca tet cct gag ttt1688
Gly Ser Lys Leu Gln Asp Phe Asn Lys Phe Val Thr Ser Pro Glu Phe
295 300 305
cca ttg aaa gag aga gtg aag agt cta aag gag aga gtg gaa acc ttc1736
Pro Leu Lys Glu Arg Val Lys Ser Leu Lys Glu Arg Val Glu Thr Phe310 315 320 325
aca tct cgt ttt ccc att cct ggc gtt taagctataa acacacacag1783
Thr Ser Arg Phe Pro Ile Pro Gly Val330
atatgctctt gttgtacctt aattattcac ctttttcatc tgtcttttag ggtttttact1843
tgcttgtgtc ccaagtttaa agttacagtt gaatcgagag aaattatttt caaaaataaa1903
tttatttgtg gaacaatgat tcgtctatgt tcccaaatct c1944
<210> 6<211> 334<212> PRT
<213> Arabidopsis thaliana
<400> 6
Met Gly Leu Asp Leu Pro His Gly Gly His Leu Ser His Gly Phe Met1 5 10 15 Thr Ala Lys Arg Arg Val Ser Gly Thr Ser Ile Tyr Phe Glu Ser Met 20 25 30 Pro Tyr Arg Leu Asp Glu Ser Thr Gly Ile Val Asp Tyr Asp Met Leu 35 40 45 Glu Lys Thr Ala Thr Leu Phe Arg Pro Lys Leu Ile Ile Ala Gly Ala 50 55 60 Ser Ala Tyr Ser Arg Asp Phe Asp Tyr Pro Arg Met Arg Lys Ile Ala65 70 75 80Asp Ser Val Gly Ala Phe Leu Met Met Asp Met Ala His Ile Ser Gly 85 90 95 Leu Val Ala Ala 100 Ser Val Val Ala Asp 105 Pro Phe Glu Tyr Cys 110 Asp IleVal Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Gly Met 115 120 125 Ile Phe Phe Arg Lys Asp Pro Ile Asn Gly Val Asp Leu Glu Ser Ala 130 135 140 Val Asn Asn Ala Val Phe Pro Gly Leu Gln Gly Gly Pro His Asn His145 150 155 160Thr Ile Gly Gly Leu 165 Ala Val Cys Leu Lys 170 His Ala Gln Ser Pro 175 GluPhe Lys Ala Tyr 180 Gln Lys Arg Val Val 185 Ser Asn Cys Arg Ala 190 Leu AlaAsn Arg Leu 195 Val Glu Leu Gly Phe 200 Lys Leu Val Ser Gly Gly 205 Ser AspAsn His Leu Val Leu Val Asp Leu Arg Pro Met Gly Met Asp Gly Ala 210 215 220 Arg Val Glu Lys Ile Leu Asp Met Ala Ser Ile Thr Leu Asn Lys Asn225 230 235 240Ser Val Pro Gly Asp Lys Ser Ala Leu Val Pro Gly Gly Ile Arg Ile 245 250 255 Gly Ser Pro Ala 260 Met Thr Thr Arg Gly 265 Leu Ser Glu Lys Asp 270 Phe ValVal Val Ala Asp Phe Ile Lys Glu Gly Val Glu Ile Thr Met Glu Ala 275 280 285 Lys Lys Ala Ala Pro Gly Ser Lys Leu Gln Asp Phe Asn Lys Phe Val 290 295 300 Thr Ser Pro Glu Phe Pro Leu Lys Glu Arg Val Lys Ser Leu Lys Glu305 310 315 320Arg Val Glu Thr Phe 325 Thr Ser Arg Phe Pro 330 Ile Pro Gly Val<210> 7<211> 2144<212> DNA<213> Zea mays
<220><221> CDS
<222> (220)..(1755)<400> 7
cattgggacc tcgagccggc ggggactggt ctccatagtg taccaaaccc acgaggccac 60
aagcacggga ctggcatata ttatccatgt aaataaaata aagtatataa ataaccccat 120
aaaaagctag gacgggacta cctcccaaac tcgcgagcga gtcgaggctc caaccccggc 180
acatcacagg aggaggagga cgacgcgccc accatggcc atg gcg acg gcc ctc 234
Met Ala Ihr Ala Leu1 5
cgc aag ctc tcc gcc aac gct ctg cgc cgc cag ccg ctc tcc cgc ate 282
Arg Lys Leu Ser Ala Asn Ala Leu Arg Arg Gln Pro Leu Ser Arg Ile
10 15 20
acg ccg ctc tac tac atg gcg tcc ctt ccg gcg acg gag gag aga tcc 330
Thr Pro Leu Tyr Tyr Met Ala Ser Leu Pro Ala Thr Glu Glu Arg Ser
25 30 35
gga ate acc tgg act aag cag ttg aac gcg ccg ctg gaa gag gtc gac 378
Gly Ile Thr Trp Thr Lys Gln Leu Asn Ala Pro Leu Glu Glu Val Asp
40 45 50
ccc gag att gct gac ate ate gag cac gag aag gcc cgc caa tgg aag 426
Pro Glu Ile Ala Asp Ile Ile Glu His Glu Lys Ala Arg Gln Trp Lys
55 60 65
ggt ctg gag ctc ate ccg tcg gag aat ttc acg tcg gtg tca gtg atg 474
Gly Leu Glu Leu Ile Pro Ser Glu Asn Phe Thr Ser Val Ser Val Met70 75 80 85
cag gea gtg ggt tcc gtc atg acc aac aag tac age gag ggg tac cct 522
Gln Ala Val Gly Ser Val Met Thr Asn Lys Tyr Ser Glu Gly Tyr Pro
90 95 100
ggc gea aga tac tac ggg gga aat gag ttt att gat atg gea gag tcc 570
Gly Ala Arg Tyr Tyr Gly Gly Asn Glu Phe Ile Asp Met Ala Glu Ser
105 110 115
ttg tgt cag aaa cgt gct ttg gag gct ttc cgt ttg gac ccg gcg aaa 618
Leu Cys Gln Lys Arg Ala Leu Glu Ala Phe Arg Leu Asp Pro Ala Lys
120 125 130
tgg gtg aat gtg caa cct cta tcc ggt tcg ccc gcc aac ttc cat 666
Trp Gly Val Asn Val Gln Pro Leu Ser Gly Ser Pro Ala Asn Phe His
135 140 145
gta tac act gea ctc ttg aag cca cat gaa agg ate atg gct ttg gat 714
Val Tyr Thr Ala Leu Leu Lys Pro His Glu Arg Ile Met Ala Leu Asp150 155 160 165
ctt cct cac ggt gga cat ctt tet cat ggt tac cag act gac act aag 762
Leu Pro His Gly Gly His Leu Ser His Gly Tyr Gln Thr Asp Thr Lys
170 175 180
aag ata tet gea act tca ata ttt ttt gag aca atg cct tac aga ttg 810
Lys Ile Ser Ala Thr Ser Ile Phe Phe Glu Thr Met Pro Tyr Arg Leu
185 190 195
gat gaa age act gga ttg att gat tac gat cag ttg gag aaa age gct 858
Asp Glu Ser Thr Gly Leu Ile Asp Tyr Asp Gln Leu Glu Lys Ser Ala
200 205 210
gtt ctt ttt agg cca aag ttg ate att gct ggt gea agt gea tat gct 906
Val Leu Phe Arg Pro Lys Leu Ile Ile Ala Gly Ala Ser Ala Tyr Ala
215 220 225
cgg cta tat gat tat gac cgt atg cgg aag ata tgc aac aag cag aag 954Axg Leu Tyr Asp Tyr Asp Arg Met Arg Lys Ile Cys Asn Lys Gln Lys230 235 240 245gca ata Ctt cta gca gac atg gca cat att agt ggg Ctt gtt gca gct1002 Ala Ile Leu Leu Ala Asp Met Ala His Ile Ser Gly Leu Val Ala Ala 250 255 260 ggt gtt gtt cca tet cct ttt gat tat gca gat gta gtg act acc act1050 Gly Val Val Pro Ser Pro Phe Asp Tyr Ala Asp Val Val Thr Thr Thr 265 270 275 act cac aaa tca ctc cgt ggg cca cgt gga gcc atg ate ttt tac agg1098 Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala Met Ile Phe Tyr Arg 280 285 290 aag gga gtc aaa gaa ata aat aaa caa gga aaa gag gtt atg tat gat1146 Lys Gly Val Lys Glu Ile Asn Lys Gln Gly Lys Glu Val Met Tyr Asp 295 300 305 ttt gag gac aaa ate aat gct gct gtc ttt cct ggt ctg caa ggt ggg1194 Phe Glu Asp Lys Ile Asn Ala Ala Val Phe Pro Gly Leu Gln Gly Gly 310 315 320 325cct cat aac cat acc att act ggc ttg gct gtt gcg ctc aaa cag gca1242 Pro His Asn His Thr Ile Thr Gly Leu Ala Val Ala Leu Lys Gln Ala 330 335 340 act act cca gaa tac aga gct tac caa gag caa gtt ate agt aat tgt1290 Thr Thr Pro Glu Tyr Arg Ala Tyr Gln Glu Gln Val Ile Ser Asn Cys 345 350 355 gct aaa ttt gcg cag age ctg att tca aaa gga tat gaa ctc gtc tet1338 Ala Lys Phe Ala Gln Ser Leu Ile Ser Lys Gly Tyr Glu Leu Val Ser 360 365 370 ggt ggg act gac aac cat tta gtt ctg gtg aat ctc aag aat aag ggg1386 Gly Gly Thr Asp Asn His Leu Val Leu Val Asn Leu Lys Asn Lys Gly375 380 385 ata gat ggt tca agg gtg gag aag gtt tta gaa agt gtg cat att gca1434 Ile Asp Gly Ser Arg Val Glu Lys Val Leu Glu Ser Val His Ile Ala390 395 400 405gca aac aag aac aca gtt cct ggt gat gtt tca gct atg gtg cca gga1482 Ala Asn Lys Asn Thr Val Pro Gly Asp Val Ser Ala Met Val Pro Gly 410 415 420 ggc ate agg atg gga acc cca gcc Ctt acg tcg aga gga ttt gtt gaa1530 Gly Ile Arg Met Gly Thr Pro Ala Leu Thr Ser Arg Gly Phe Val Glu 425 430 435 gaa gat ttc gct aaa gtt gct gac ttc ttc gat gca gca gtg aat ctg1578 Glu Asp Phe Ala Lys Val Ala Asp Phe Phe Asp Ala Ala Val Asn Leu 440 445 450 gcc ttg aag att aag gct gca acg aca ggt gga aca aag ctg aag gac1626 Ala Leu Lys Ile Lys Ala Ala Thr Thr Gly Gly Thr Lys Leu Lys Asp455 460 465 ttt gtt gcc act ttg caa tet gat age ate caa gtt gag att gca aag1674 Phe Val Ala Thr Leu Gln Ser Asp Ser Ile Gln Val Glu Ile Ala Lys470 475 480 485ctt cgc cat gat gta gag gaa ttt gca aaa caa ttc cca aca att gga1722
Leu Arg His Asp Val Glu Glu Phe Ala Lys Gln Phe Pro Thr Ile Gly
490 495 500
ttt gag aaa gag acc atg aaa tac aag aac taatatctgg atgacaagaa1772
Phe Glu Lys Glu Thr Met Lys Tyr Lys Asn
505 510
gagaatgagg tcactcttct tgcagtaagc attcgaagca agatgccacg atgattattg1832
ggagtttaac catggtgtaa tggcatctta tgttaaagag atgttggcaa tttacagcat1892
gtggaacttt cgtcaatcat attgtagaca cataccgcga gatgctatat tgaccggaca1952
attgcatttc catatgtgta aaaaaaaagc gttcaaaaaa aaaacgtaca tcctgacaca2012
cacfcccaccc ccatccccac tcacaagcac acgtcaccct gcccgcaagg ctatctactc2072
atctctataa tcaaactata ctatgtgaaa gttatagtct acggtgcaaa atagtgcaaa2132
atagtgtttt ag2144
<210> 8<211> 511<212> PRT<213> Zea mays
<400> 8
Met Ala Thr Ala Leu Arg Lys Leu Ser Ala Asn Ala Leu Arg Arg Gln
1 5 10 15 Pro Leu Ser Arg 20 Ile Thr Pro Leu Tyr 25 Tyr Met Ala Ser Leu 30 Pro AlaThr Glu Glu 35 Arg Ser Gly Ile Thr 40 Trp Thr Lys Gln Leu 45 Asn Ala ProLeu Glu 50 Glu Val Asp Pro Glu 55 Ile Ala Asp Ile Ile 60 Glu His Glu LysAla Arg Gln Trp Lys Gly Leu Glu Leu Ile Pro Ser Glu Asn Phe Thr65 70 75 80Ser Val Ser Val Met 85 Gln Ala Val Gly Ser 90 Val Met Thr Asn Lys 95 TyrSer Glu Gly Tyr 100 Pro Gly Ala Arg Tyr 105 Tyr Gly Gly Asn Glu 110 Phe IleAsp Met Ala 115 Glu Ser Leu Cys Gln 120 Lys Arg Ala Leu Glu 125 Ala Phe ArgLeu Asp 130 Pro Ala Lys Trp Gly 135 Val Asn Val Gln Pro 140 Leu Ser Gly SerPro Ala Asn Phe His Val Tyr Thr Ala Leu Leu Lys Pro His Glu Arg 145 150 155 160Ile Met Ala Leu Asp 165 Leu Pro His Gly Gly 170 His Leu Ser His Gly 175 TyrGln Thr Asp Thr 180 Lys Lys Ile Ser Ala 185 Thr Ser Ile Phe Phe 190 Glu ThrMet Pro Tyr 195 Arg Leu Asp Glu Ser 200 Thr Gly Leu Ile Asp 205 Tyr Asp GlnLeu Glu Lys Ser Ala Val Leu Phe Arg Pro Lys Leu Ile Ile Ala Gly 210 215 220Ala Ser Ala Tyr Ala Arg Leu Tyr Asp Tyr Asp Arg Met Arg Lys Ile225 230 235 240Cys Asn Lys Gln Lys Ala Ile Leu Leu Ala Asp Met Ala His Ile Ser 245 250 255 Gly Leu Val Ala 260 Ala Gly Val Val Pro 265 Ser Pro Phe Asp Tyr 270 Ala AspVal Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala 275 280 285 Met Ile 290 Phe Tyr Arg Lys Gly 295 Val Lys Glu Ile Asn 300 Lys Gln Gly LysGlu Val Met Tyr Asp Phe Glu Asp Lys Ile Asn Ala Ala Val Phe Pro305 310 315 320Gly Leu Gln Gly Gly Pro His Asn His Thr Ile Thr Gly Leu Ala Val 325 330 335 Ala Leu Lys Gln Ala Thr Thr Pro Glu Tyr Arg Ala Tyr Gln Glu Gln 340 345 350 Val Ile Ser 355 Asn Cys Ala Lys Phe 360 Ala Gln Ser Leu Ile 365 Ser Lys GlyTyr Glu Leu Val Ser Gly Gly Thr Asp Asn His Leu Val Leu Val Asn 370 375 380 Leu Lys Asn Lys Gly Ile Asp Gly Ser Arg Val Glu Lys Val Leu Glu385 390 395 400Ser Val His Ile Ala Ala Asn Lys Asn Thr Val Pro Gly Asp Val Ser 405 410 415 Ala Met Val Pro Gly Gly Ile Arg Met Gly Thr Pro Ala Leu Thr Ser 420 425 430 Arg Gly Phe 435 Val Glu Glu Asp Phe 440 Ala Lys Val Ala Asp 445 Phe Phe AspAla Ala Val Asn Leu Ala Leu Lys Ile Lys Ala Ala Thr Thr Gly Gly 450 455 460 Thr Lys Leu Lys Asp Phe Val Ala Thr Leu Gln Ser Asp Ser Ile Gln465 470 475 480Val Glu Ile Ala Lys 485 Leu Arg His Asp Val 490 Glu Glu Phe Ala Lys 495 GlnPhe Pro Thr Ile 500 Gly Phe Glu Lys Glu 505 Thr Met Lys Tyr Lys 510 Asn
<210> 9<211> 1875<212> DNA<213> Zea mays
<220>
<221> CDS
<222> (206)..(1621)
<400> 9
caccaacaac accaccagtc caccaccacc cacctcccac atgtgcacac gcgcccacct 60
cccgtccacc accgctatat atcccggcgc cccttcctcc ctcccccgtc cttccctccg 120
cctccgcctc cgcccccgcc cccgcccacg cccactcctc gctgccacca ctcctgtcac 180
ctcttcccgc gccgacgcag ccgcc atg gac ccc gtc gcc aca tgg ggg cta 232
Met Asp Pro Val Ala Thr Trp Gly Leu1 5
acc ccg ctc gcg ggc gcc gac ccg gag ate tac gac ctc ctg gag cgc 280
Thr Pro Leu Ala Gly Ala Asp Pro Glu Ile Tyr Asp Leu Leu Glu Arg
10 15 20 25
gag aag cgg cgc cag cgt cgc ggc ate gag ctc ate gcc tcc gag aac 328
Glu Lys Arg Arg Gln Arg Arg Gly Ile Glu Leu Ile Ala Ser Glu Asn
30 35 40
ttc acc tcc ttc gcc gtc atg gag gcg ctc ggc tcc gcg ctc act aac 376Phe Thr Ser Phe Ala Val Met Glu Ala Leu Gly Ser Ala Leu Thr Asn
45 50 55
aag tac tcc gag ggc atg ccc ggt gcc cgc tac tac ggc ggc aac gac 424
Lys Tyr Ser Glu Gly Met Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Asp
60 65 70
gtc ate gac gag ate gag aac ctc tgc cgg tca cgc gcg ctc gct gcc 472
Val Ile Asp Glu Ile Glu Asn Leu Cys Arg Ser Arg Ala Leu Ala Ala
75 80 85
ttc cac ctt gac gcc gcg tcc tgg ggc gtc aac gtg cag ccc tac tcg 520
Phe His Leu Asp Ala Ala Ser Trp Gly Val Asn Val Gln Pro Tyr Ser90 95 100 105
ggc tcc ccc gcc aac ttc gcc gcc tac acc gcg ctg ctc aac ccg cac 568
Gly Ser Pro Ala Asn Phe Ala Ala Tyr Thr Ala Leu Leu Asn Pro His
110 115 120
gac cgg ate atg ggg ctc gac ctt ccc tcc ggc gga cac ctc act cac 616
Asp Arg Ile Met Gly Leu Asp Leu Pro Ser Gly Gly His Leu Thr His
125 130 135
ggg tac tac acg gcc ggc ggt aag aag ate tcc gcc acc tcg ate tac 664
Gly Tyr Tyr Thr Ala Gly Gly Lys Lys Ile Ser Ala Thr Ser Ile Tyr
140 145 150
ttt gag age ctg ccg tac aag gtg age gcc gea acg ggg tac ate gac 712
Phe Glu Ser Leu Pro Tyr Lys Val Ser Ala Ala Thr Gly Tyr Ile Asp
155 160 165
tac gag aag ctc gag gag aag gea ctt gac ttc cgc ccc aag ctc ate 760
Tyr Glu Lys Leu Glu Glu Lys Ala Leu Asp Phe Arg Pro Lys Leu Ile170 175 180 185
ate tgc ggt ggc agt gcg tac ccg agg gac tgg gat tac gcc aag ctc 808
Ile Cys Gly Gly Ser Ala Tyr Pro Arg Asp Trp Asp Tyr Ala Lys Leu
190 195 200
agg gcc gtc gcc gac aag gtc ggg gcc ctg ctg ctc tgc gac atg gcg 856
Arg Ala Val Ala Asp Lys Val Gly Ala Leu Leu Leu Cys Asp Met Ala
205 210 215
cac ate age ggg ctc gtc gcc gcg cag gaa gct gea aat cct ttt gaa 904
His Ile Ser Gly Leu Val Ala Ala Gln Glu Ala Ala Asn Pro Phe Glu
220 225 230
tat tgt gat gtg gtt acc aca acc acg cac aag tcc ctc aga ggg cca 952
Tyr Cys Asp Val Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro
235 240 245
agg gct ggc atg ate ttc tac agg aaa ggc cct aag ccc ccc aag aag1000
Arg Ala Gly Met Ile Phe Tyr Arg Lys Gly Pro Lys Pro Pro Lys Lys250 255 260 265
ggc cag cct gag ggt gct gtt tat gat tac gaa gac aag ate aac ttt1048
Gly Gln Pro Glu Gly Ala Val Tyr Asp Tyr Glu Asp Lys Ile Asn Phe
270 275 280
gea gtg ttc cca tet ctc caa ggt ggc cct cac aac cac cag att gct1096
Ala Val Phe Pro Ser Leu Gln Gly Gly Pro His Asn His Gln Ile Ala
285 290 295
gea ctt gct gtt gct cta cag caa act atg tcg cct ggc ttc aag gcc1144
Ala Leu Ala Val Ala Leu Gln Gln Thr Met Ser Pro Gly Phe Lys Ala
300 305 310
tat gea aag caa gtg aag gcc aat gct gtt gea att gga aac tat ctc1192
Tyr Ala Lys Gln Val Lys Ala Asn Ala Val Ala Ile Gly Asn Tyr Leu
315 320 325
atg age aag ggc tac aag atg gtg act gat gga act gag aac cac ctt1240
Met Ser Lys Gly Tyr Lys Met Val Thr Asp Gly Thr Glu Asn His Leu330 335 340 345
gtt ctc tgg gat ctc cgc ccc ctt ggc ttg act gga aac aag gtc gaa1288
Val Leu Trp Asp Leu Arg Pro Leu Gly Leu Thr Gly Asn Lys Val Glu
350 355 360
aag cta tgt gat ctt tgc cac ate aca ttg aac aag aat gct gtc ttc1336
Lys Leu Cys Asp Leu Cys His Ile Thr Leu Asn Lys Asn Ala Val Phe
365 370 375
ggt gac age agt gea ttg tet ccg ggt ggt gtc cgc att ggc gcg cca1384
Gly Asp Ser Ser Ala Leu Ser Pro Gly Gly Val Arg Ile Gly Ala Pro
380 385 390
gea atg acc tcg agg ggt cta ctg gag aag gat ttc gag cag att ggg1432
Ala Met Thr Ser Arg Gly Leu Leu Glu Lys Asp Phe Glu Gln Ile Gly
395 400 405
gag ttc ctc cac cag gea gtg acc ate tgc ctg aac ate cag aag gag1480
Glu Phe Leu His Gln Ala Val Thr Ile Cys Leu Asn Ile Gln Lys Glu410 415 420 425
tac ggc aag ctc ctc aag gac ttc aac aag ggc ctg gtg aac aac aag1528
Tyr Gly Lys Leu Leu Lys Asp Phe Asn Lys Gly Leu Val Asn Asn Lys
430 435 440
gac ate gag aac ctc aag gtc cag gtg gag aag ttt gcc gac tcc ttc1576
Asp Ile Glu Asn Leu Lys Val Gln Val Glu Lys Phe Ala Asp Ser Phe
445 450 455
gac atg cct ggg ttc acg ctt gag age atg aaa tac aag gag tagatatgcc1628
Asp Met Pro Gly Phe Thr Leu Glu Ser Met Lys Tyr Lys Glu
460 465 470
tctttcatgc gcggcaaggt cctcctgtac cgatgtcttt ccttgtggtg gcgcagggtg1688
ccatggcact gcattgccgc cacacttacg atgatgatga tgggttatgg attttgtcta1748
caatgtcagc aggataggct cacaattgcc ccctgccctc cggtttggtc gcctctcagg1808
ttttcatttg gtagttgttc gcagggaacc atatgagaat tgcaatgtca atcaggtgtt1868
tgccaat1875
<210> 10<211> 471<212> PRT<213> Zea mays
<400> 10
Met Asp Pro Val Ala Thr Trp Gly Leu Thr Pro Leu Ala Gly Ala Asp15 10 15
Pro Glu Ile Tyr Asp Leu Leu Glu Arg Glu Lys Arg Arg Gln Arg Arg
20 25 30
Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Met
35 40 45
Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro
50 55 60
Gly Ala Arg Tyr Tyr Gly Gly Asn Asp Val Ile Asp Glu Ile Glu Asn65 70 75 80Leu Cys Arg Ser Arg Ala Leu Ala Ala Phe His Leu Asp Ala Ala Ser
85 90 95
Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala
100 105 110
Ala Tyr Thr Ala Leu Leu Asn Pro His Asp Arg Ile Met Gly Leu Asp
115 120 125
Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ala Gly Gly
130 135 140
Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys145 150 155 160
Val Ser Ala Ala Thr Gly Tyr Ile Asp Tyr Glu Lys Leu Glu Glu Lys
165 170 175
Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala Tyr
180 185 190
Pro Arg Asp Trp Asp Tyr Ala Lys Leu Arg Ala Val Ala Asp Lys Val
195 200 205
Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala
210 215 220
Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr Thr225 230 235 240
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr
245 250 255
Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala Val
260 265 270
Tyr Asp Tyr Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser Leu Gln
275 280 285
Gly Gly Pro His Asn His Gln Ile Ala Ala Leu Ala Val Ala Leu Gln
290 295 300
Gln Thr Met Ser Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Lys Ala305 310 315 320
Asn Ala Val Ala Ile Gly Asn Tyr Leu Met Ser Lys Gly Tyr Lys Met
325 330 335
Val Thr Asp Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro
340 345 350
Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys His
355 360 365
Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ser
370 375 380
Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly Leu385 390 395 400
Leu Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu His Gln Ala Val
405 410 415
Thr Ile Cys Leu Asn Ile Gln Lys Glu Tyr Gly Lys Leu Leu Lys Asp
420 425 430
Phe Asn Lys Gly Leu Val Asn Asn Lys Asp Ile Glu Asn Leu Lys Val
435 440 445
Gln Val Glu Lys Phe Ala Asp Ser Phe Asp Met Pro Gly Phe Thr Leu
450 455 460
Glu Ser Met Lys Tyr Lys Glu465 470
<210> 11<211> 1875<212> DNA<213> Zea mays
<220><221> CDS
<222> (347)..(1621)<400> 11
caccaacaac accaccagtc caccaccacc cacctcccac atgtgcacac gcgcccacct
νcccgtccacc accgctatat atcccggcgc cccttcctcc ctcccccgtc cttccctccg 120
cctccgcctc cgcccccgcc cccgcccacg cccactcctc gctgccacca ctcctgtcac 180
ctcttcccgc gccgacgcag ccgccatgga ccccgtcgcc acatgggggc taaccccgct 240
cgcgggcgcc gacccggaga tctacgacct cctggagcgc gagaagcggc gccagcgtcg 300
cggcatcgag ctcatcgcct ccgagaactt cacctccttc gccgtc atg gag gcg 355
Met Glu Ala1
ctc ggc tcc gcg ctc act aac aag tac tcc gag ggc atg ccc ggt gcc 403
Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro Gly Ala
5 10 15
cgc tac tac ggc ggc aac gac gtc ate gac gag ate gag aac ctc tgc 451
Arg Tyr Tyr Gly Gly Asn Asp Val Ile Asp Glu Ile Glu Asn Leu Cys20 25 30 35
cgg tca cgc gcg ctc gct gcc ttc cac ctt gac gcc gcg tcc tgg ggc 499
Arg Ser Arg Ala Leu Ala Ala Phe His Leu Asp Ala Ala Ser Trp Gly
40 45 50
gtc aac gtg cag ccc tac tcg ggc tcc ccc gcc aac ttc gcc gcc tac 547
Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala Ala Tyr
55 60 65
acc gcg ctg ctc aac ccg cac gac cgg ate atg ggg ctc gac ctt ccc 595
Thr Ala Leu Leu Asn Pro His Asp Arg Ile Met Gly Leu Asp Leu Pro
70 75 80
tcc ggc gga cac ctc act cac ggg tac tac acg gcc ggc ggt aag aag 643
Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ala Gly Gly Lys Lys
85 90 95
ate tcc gcc acc tcg ate tac ttt gag age ctg ccg tac aag gtg age 691
Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys Val Ser100 105 110 115
gcc gea acg ggg tac ate gac tac gag aag ctc gag gag aag gea ctt 739
Ala Ala Thr Gly Tyr Ile Asp Tyr Glu Lys Leu Glu Glu Lys Ala Leu
120 125 130
gac ttc cgc ccc aag ctc ate ate tgc ggt ggc agt gcg tac ccg agg 787
Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala Tyr Pro Arg
135 140 145
gac tgg gat tac gcc aag ctc agg gcc gtc gcc gac aag gtc ggg gcc 835
Asp Trp Asp Tyr Ala Lys Leu Arg Ala Val Ala Asp Lys Val Gly Ala
150 155 160
ctg ctg ctc tgc gac atg gcg cac ate age ggg ctc gtc gcc gcg cag 883
Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Gln
165 170 175
gaa gct gea aat cct ttt gaa tat tgt gat gtg gtt acc aca acc acg 931
Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr Thr Thr Thr180 185 190 195
cac aag tcc ctc aga ggg cca agg gct ggc atg ate ttc tac agg aaa 979
His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr Arg Lys
200 205 210
ggc cct aag ccc ccc aag aag ggc cag cct gag ggt gct gtt tat gat1027
Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala Val Tyr Asp
215 220 225
tac gaa gac aag ate aac ttt gea gtg ttc cca tet ctc caa ggt ggc1075
Tyr Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser Leu Gln Gly Gly
230 235 240
cct cac aac cac cag att gct gea ctt gct gtt gct cta cag caa act1123
Pro His Asn His Gln Ile Ala Ala Leu Ala Val Ala Leu Gln Gln Thr
245 250 255
atg tcg cct ggc ttc aag gcc tat gea aag caa gtg aag gcc aat gct1171
Met Ser Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Lys Ala Asn Ala260 265 270 275
gtt gca att gga aac tat ctc atg age aag ggc tac aag atg gtg act1219
Val Ala Ile Gly Asn Tyr Leu Met Ser Lys Gly Tyr Lys Met Val Thr
280 285 290
gat gga act gag aac cac ctt gtt ctc tgg gat ctc cgc ccc ctt ggc1267
Asp Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro Leu Gly
295 300 305
ttg act gga aac aag gtc gaa aag cta tgt gat ctt tgc cac ate aca1315
Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys His Ile Thr
310 315 320
ttg aac aag aat gct gtc ttc ggt gac age agt gca ttg tet ccg ggt1363
Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ser Pro Gly
325 330 335
ggt gtc cgc att ggc gcg cca gca atg acc tcg agg ggt cta ctg gag1411
Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly Leu Leu Glu340 345 350 355
aag gat ttc gag cag att ggg gag ttc ctc cac cag gca gtg acc ate1459
Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu His Gln Ala Val Thr Ile
360 365 370
tgc ctg aac ate cag aag gag tac ggc aag ctc ctc aag gac ttc aac1507
Cys Leu Asn Ile Gln Lys Glu Tyr Gly Lys Leu Leu Lys Asp Phe Asn
375 380 385
aag ggc ctg gtg aac aac aag gac ate gag aac ctc aag gtc cag gtg1555
Lys Gly Leu Val Asn Asn Lys Asp Ile Glu Asn Leu Lys Val Gln Val
390 395 400
gag aag ttt gcc gac tcc ttc gac atg cct ggg ttc acg ctt gag age1603
Glu Lys Phe Ala Asp Ser Phe Asp Met Pro Gly Phe Thr Leu Glu Ser
405 -· 410 415
atg aaa tac aag gag tagatatgcc tctttcatgc gcggcaaggt cctcctgtac1658
Met Lys Tyr Lys Glu420
cgatgtcttt ccttgtggtg gcgcagggtg ccatggcact gcattgccgc cacacttacg1718
atgatgatga tgggttatgg attttgtcta caatgtcagc aggataggct cacaattgcc1778
ccctgccctc cggtttggtc gcctctcagg ttttcatttg gtagttgttc gcagggaacc1838
atatgagaat tgcaatgtca atcaggtgtt tgccaat1875
<210> 12<211> 424<212> PRT<213> Zea mays
<400> 12
Met Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met1 5 10 15 Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Asp Val Ile Asp Glu Ile Glu 20 25 30 Asn Leu Cys Arg Ser Arg Ala Leu Ala Ala Phe His Leu Asp Ala Ala 35 40 45 Ser Trp 50 Gly Val Asn Val Gln 55 Pro Tyr Ser Gly Ser 60 Pro Ala Asn PheAla Ala Tyr Thr Ala Leu Leu Asn Pro His Asp Arg Ile Met Gly Leu 65 70 75 80Asp Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ala Gly 85 90 95 Gly Lys Lys Ile 100 Ser Ala Thr Ser Ile 105 Tyr Phe Glu Ser Leu 110 Pro TyrLys Val Ser 115 Ala Ala Thr Gly Tyr 120 Ile Asp Tyr Glu Lys 125 Leu Glu GluLys Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala 130 135 140 Tyr Pro Arg Asp Trp Asp Tyr Ala Lys Leu Arg Ala Val Ala Asp Lys145 150 155 160Val Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val 165 170 175 Ala Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr 180 185 190 Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe 195 200 205 Tyr Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala 210 215 220 Val Tyr Asp Tyr Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser Leu225 230 235 240Gln Gly Gly Pro His 245 Asn His Gln Ile Ala 250 Ala Leu Ala Val Ala 255 LeuGln Gln Thr Met 260 Ser Pro Gly Phe Lys 265 Ala Tyr Ala Lys Gln 270 Val LysAla Asn Ala Val Ala Ile Gly Asn Tyr Leu Met Ser Lys Gly Tyr Lys 275 280 285 Met Val Thr Asp Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg 290 295 300 Pro Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys305 310 315 320His Ile Thr Leu Asn 325 Lys Asn Ala Val Phe 330 Gly Asp Ser Ser Ala 335 LeuSer Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly 340 345 350 Leu Leu Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu His Gln Ala 355 360 365 Val Thr 370 Ile Cys Leu Asn Ile 375 Gln Lys Glu Tyr Gly 380 Lys Leu Leu LysAsp Phe Asn Lys Gly Leu Val Asn Asn Lys Asp Ile Glu Asn Leu Lys385 390 395 400Val Gln Val Glu Lys Phe Ala Asp Ser Phe Asp Met Pro Gly Phe Thr 405 410 415 Leu Glu Ser Met 420 Lys Tyr Lys Glu
<210> 13<211> 1944<212> DNA
<213> Arabidopsis thaliana
<220><221> CDS
<222> (204)..(1766)<400> 13
ctcactagtc cccccccccc ccggagcttt ttttgttgtg atatatcccg taaaacccta 60
aacatagtca cttcatcgtc tcctccactg tatcattcaa tctctgtctt ccttcttttt 120
agcgacctcg tctccaaagc tcacaaattt tctacctttc cggagtagag agaaagatgc 180
aagcttgttg tggtggtaat tcg atg gct tct ctt cag caa cct gga cgg gtt 233
Met Ala Ser Leu Gln Gln Pro Gly Arg Val1 5 10
caa gga tct gtc ttt ccc cca att atg cct cca gtg acc aaa ttt tct 281
Gln Gly Ser Val Phe Pro Pro Ile Met Pro Pro Val Thr Lys Phe Ser
15 20 25
cag cag ttg aag ttc aat att tca aaa cct ttc cgt tct tca ttt ctg 329
Gln Gln Leu Lys Phe Asn Ile Ser Lys Pro Phe Arg Ser Ser Phe Leu
30 35 40
aaa aga aac ctg gtc tct gaa atg aga gca tct tca gtc tcg cta cct 377
Lys Arg Asn Leu Val Ser Glu Met Arg Ala Ser Ser Val Ser Leu Pro
45 50 55
aat gtc gag ata age age aaa gaa ate cct ttt gag gac tat ggt ctt 425
Asn Val Glu Ile Ser Ser Lys Glu Ile Pro Phe Glu Asp Tyr Gly Leu
60 65 70
ggt gaa gtt gat cca gag gtc cga acc ate ate aca aag gag aaa gat 473
Gly Glu Val Asp Pro Glu Val Arg Thr Ile Ile Thr Lys Glu Lys Asp75 80 85 90
aga caa ttc agg age ttg gag ctt att gca tct gag aat ttc acg tct 521
Arg Gln Phe Arg Ser Leu Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser
95 100 105
cga gca gtt atg gag gcg gtt ggc tca tgc ctt acc aac aag tat tct 569
Arg Ala Val Met Glu Ala Val Gly Ser Cys Leu Thr Asn Lys Tyr Ser
110 115 120
gag gga ctg cct ggt aaa aga tat tat ggt ggc aat gag tac att gat 617
Glu Gly Leu Pro Gly Lys Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp
125 130 135
cag ttg gag acg ctt tgc cag aac cgg gct ttg gca gcc ttc cgc tta 665
Gln Leu Glu Thr Leu Cys Gln Asn Arg Ala Leu Ala Ala Phe Arg Leu
140 145 150
gat tct acg aaa tgg ggg gtt aat gtt cag ccg tta tct ggt tca cct 713
Asp Ser Thr Lys Trp Gly Val Asn Val Gln Pro Leu Ser Gly Ser Pro155 160 165 170
gca aac ttt gct gtc tac act gcg ata ctt age cct cat gat cgg ate 761
Ala Asn Phe Ala Val Tyr Thr Ala Ile Leu Ser Pro His Asp Arg Ile
175 180 185
atg ggt ttg gat tta cct cac ggt ggt cat ctg tcg cat ggg ttc atg 809
Met Gly Leu Asp Leu Pro His Gly Gly His Leu Ser His Gly Phe Met
190 195 200
acc gct aaa agg cgt gta tct gga act tca ata tac ttt gag tcc atg 857
Thr Ala Lys Arg Arg Val Ser Gly Thr Ser Ile Tyr Phe Glu Ser Met
205 210 215
cct tat cga ctt gat gaa tca aca ggc att gtt gac tac gat atg ctc 905
Pro Tyr Arg Leu Asp Glu Ser Thr Gly Ile Val Asp Tyr Asp Met Leu
220 225 230
gag aaa act gct aca ctt ttc aga cca aag ctt att ate gca gga gct 953
Glu Lys Thr Ala Thr Leu Phe Arg Pro Lys Leu Ile Ile Ala Gly Ala235 240 245 250
agt gca tac age cga gat ttt gac tat cct cgc atg agg aag ate gca1001
Ser Ala Tyr Ser Arg Asp Phe Asp Tyr Pro Arg Met Arg Lys Ile Ala
255 260 265
gac tca gtt ggt gct ttt ctg atg atg gat atg gct cat ate agt ggg1049
Asp Ser Val Gly Ala Phe Leu Met Met Asp Met Ala His Ile Ser Gly270 275 280
\ctt gtg gct gct tet gtg gta gct gac CCt ttt gag tat tgt gat att1097 Leu Val Ala Ala Ser Val Val Ala Asp Pro Phe Glu Tyr Cys Asp Ile 285 290 295 gtt aca aca aca act cac aag tet ttg aga ggt ccg aga ggt ggc atg1145 Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Gly Met 300 305 310 ate ttc ttc agg aag gat cca att aat ggg gtt gat Ctt gaa tet gcc1193 Ile Phe Phe Arg Lys Asp Pro Ile Asn Gly Val Asp Leu Glu Ser Ala315 320 325 330gtg aac aat gct gtc ttc cct ggt ttg cag ggt ggc cct cat aac cac1241 Val Asn Asn Ala Val Phe Pro Gly Leu Gln Gly Gly Pro His Asn His 335 340 345 aca att gga gga tta gea gtc tgc ttg aaa cac gea caa tca ccg gaa1289 Thr Ile Gly Gly 350 Leu Ala Val Cys Leu 355 Lys His Ala Gln Ser 360 Pro Gluttc aag gcg tac cag aaa aga gtt gtg tet aac tgt aga gct cta gct1337 Phe Lys Ala Tyr Gln Lys Arg Val Val Ser Asn Cys Arg Ala Leu Ala 365 370 375 aac cga ttg gtt gaa ctc ggg ttt aag cta gtt tet ggt ggc age gat1385 Asn Arg Leu Val Glu Leu Gly Phe Lys Leu Val Ser Gly Gly Ser Asp 380 385 390 aac cac ttg gtt ctc gtc gat Ctt aga CCC atg ggt atg gat ggt gcg1433 Asn His Leu Val Leu Val Asp Leu Arg Pro Met Gly Met Asp Gly Ala 395 400 405 410cgg gtt gag aaa ate tta gac atg gea tet att act ctc aac aag aac1481 Arg Val Glu Lys Ile Leu Asp Met Ala Ser Ile Thr Leu Asn Lys Asn 415 420 425 tet gtc cct ggg gac aaa agt gcg ttg gta cca ggg gga ata agg ata1529 Ser Val Pro Gly Asp Lys Ser Ala Leu Val Pro Gly Gly Ile- Arg Ile 430 435 440 gga tcc CCC gcg atg acg aca aga gga ctg tca gag aaa gac ttt gta1577 Gly Ser Pro Ala Met Thr Thr Arg Gly Leu Ser Glu Lys Asp Phe Val 445 450 455 gta gtg gct gac ttc ate aag gaa ggt gtg gag ata aca atg gaa gcc1625 Val Val Ala Asp Phe Ile Lys Glu Gly Val Glu Ile Thr Met Glu Ala460 465 470 aag aaa gcc gcg ccg ggt tca aag Ctt caa gat ttc aac aag ttc gtg1673 Lys Lys Ala Ala Pro Gly Ser Lys Leu Gln Asp Phe Asn Lys Phe Val475 480 485 490aca tet cct gag ttt CCcL ttg aaa gag aga gtg aag agt cta aag gag1721 Thr Ser Pro Glu Phe Pro Leu Lys Glu Arg Val Lys Ser Leu Lys Glu 495 500 505 aga gtg gaa acc ttc aca tet cgt ttt CCC att cct ggc gtt taagctat 1773 Arg Val Glu Thr Phe Thr Ser Arg Phe Pro Ile Pro Gly Val 510 515 520
acacacacag atatgctctt gttgtacctt aattattcac ctttttcatc tgtcttttag1833ggtttttact tgcttgtgtc ccaagtttaa agttacagtt gaatcgagag aaattatttt1893
caaaaataaa tttatttgtg gaacaatgat tcgtctatgt tcccaaatct c1944
<210> 14<211> 520<212> PRT
<213> Arabidopsis thaliana
<400> 14 Met Ala Ser Leu Gln Gln Pro Gly Arg Val Gln Gly Ser Val Phe Pro1 5 10 15 Pro Ile Met Pro 20 Pro Val Thr Lys Phe 25 Ser Gln Gln Leu Lys 30 Phe AsnIle Ser Lys Pro Phe Arg Ser Ser Phe Leu Lys Arg Asn Leu Val Ser 35 40 45 Glu Met 50 Arg Ala Ser Ser Val 55 Ser Leu Pro Asn Val 60 Glu Ile Ser SerLys Glu Ile Pro Phe Glu Asp Tyr Gly Leu Gly Glu Val Asp Pro Glu65 70 75 80Val Arg Thr Ile Ile Thr Lys Glu Lys Asp Arg Gln Phe Arg Ser Leu 85 90 95 Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Arg Ala Val Met Glu Ala 100 105 110 Val Gly Ser Cys Leu Thr Asn Lys Tyr Ser Glu Gly Leu Pro Gly Lys 115 120 125 Arg Tyr 130 Tyr Gly Gly Asn Glu 135 Tyr Ile Asp Gln Leu 140 Glu Thr Leu CysGln Asn Arg Ala Leu Ala Ala Phe Arg Leu Asp Ser Thr Lys Trp Gly145 150 155 160Val Asn Val Gln Pro 165 Leu Ser Gly Ser Pro 170 Ala Asn Phe Ala Val 175 TyrThr Ala Ile Leu Ser Pro His Asp Arg Ile Met Gly Leu Asp Leu Pro 180 185 190 His Gly Gly His Leu Ser His Gly Phe Met Thr Ala Lys Arg Arg Val 195 200 205 Ser Gly Thr Ser Ile Tyr Phe Glu Ser Met Pro Tyr Arg Leu Asp Glu 210 215 220 Ser Thr Gly Ile Val Asp Tyr Asp Met Leu Glu Lys Thr Ala Thr Leu225 230 235 240Phe Arg Pro Lys Leu Ile Ile Ala Gly Ala Ser Ala Tyr Ser Arg Asp 245 250 255 Phe Asp Tyr Pro Arg Met Arg Lys Ile Ala Asp Ser Val Gly Ala Phe 260 265 270 Leu Met Met Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Ser Val 275 280 285 Val Ala 290 Asp Pro Phe Glu Tyr 295 Cys Asp Ile Val Thr 300 Thr Thr Thr HisLys Ser Leu Arg Gly Pro Arg Gly Gly Met Ile Phe Phe Arg Lys Asp305 310 315 320Pro Ile Asn Gly Val Asp Leu Glu Ser Ala Val Asn Asn Ala Val Phe 325 330 335 Pro Gly Leu Gln Gly Gly Pro His Asn His Thr Ile Gly Gly Leu Ala 340 345 350 Val Cys Leu 355 Lys His Ala Gln Ser 360 Pro Glu Phe Lys Ala 365 Tyr Gln LysArg Val Val Ser Asn Cys Arg Ala Leu Ala Asn Arg Leu Val Glu Leu 370 375 380 Gly Phe Lys Leu Val Ser Gly Gly Ser Asp Asn His Leu Val Leu Val385 390 395 400Asp Leu Arg Pro Met Gly Met Asp Gly Ala Arg Val Glu Lys Ile Leu
405 410 415
Asp Met Ala Ser Ile Thr Leu Asn Lys Asn Ser Val Pro Gly Asp Lys
420 425 430
Ser Ala Leu Val Pro Gly Gly Ile Arg Ile Gly Ser Pro Ala Met Thr
435 440 445
Thr Arg Gly Leu Ser Glu Lys Asp Phe Val Val Val Ala Asp Phe Ile
450 455 460
Lys Glu Gly Val Glu Ile Thr Met Glu Ala Lys Lys Ala Ala Pro Gly465 470 475 480
Ser Lys Leu Gln Asp Phe Asn Lys Phe Val Thr Ser Pro Glu Phe Pro
485 490 495
Leu Lys Glu Arg Val Lys Ser Leu Lys Glu Arg Val Glu Thr Phe Thr
500 505 510
Ser Arg Phe Pro Ile Pro Gly Val515 520
<210> 15<211> 1944<212> DNA
<213> Arabidopsis thaliana
<220><221> CDS
<222> (258)..(1766)<400> 15
ctcactagtc cccccccccc ccggagcttt ttttgttgtg atatatcccg taaaacccta 60
aacatagtca cttcatcgtc tcctccactg tatcattcaa tctctgtctt ccttcttttt 120
agcgacctcg tctccaaagc tcacaaattt tctacctttc cggagtagag agaaagatgc 180
aagcttgttg tggtggtaat tcgatggctt ctcttcagca acctggacgg gttcaaggat 240
ctgtctttcc cccaatt atg cct cca gtg acc aaa ttt tct cag cag ttg 290
Met Pro Pro Val Thr Lys Phe Ser Gln Gln Leu15 10
aag ttc aat att tca aaa cct ttc cgt tct tca ttt ctg aaa aga aac 338
Lys Phe Asn Ile Ser Lys Pro Phe Arg Ser Ser Phe Leu Lys Arg Asn
15 20 25
ctg gtc tct gaa atg aga gca tct tca gtc tcg cta cct aat gtc gag 386
Leu Val Ser Glu Met Arg Ala Ser Ser Val Ser Leu Pro Asn Val Glu
30 35 40
ata age age aaa gaa ate cct ttt gag gac tat ggt ctt ggt gaa gtt 434
Ile Ser Ser Lys Glu Ile Pro Phe Glu Asp Tyr Gly Leu Gly Glu Val
45 50 55
gat cca gag gtc cga acc ate ate aca aag gag aaa gat aga caa ttc 482
Asp Pro Glu Val Arg Thr Ile Ile Thr Lys Glu Lys Asp Arg Gln Phe60 65 70 75
agg age ttg gag ctt att gca tct gag aat ttc acg tct cga gca gtt 530
Arg Ser Leu Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Arg Ala Val
80 85 90
atg gag gcg gtt ggc tca tgc ctt acc aac aag tat tct gag gga ctg 578
Met Glu Ala Val Gly Ser Cys Leu Thr Asn Lys Tyr Ser Glu Gly Leu
95 100 105
cct ggt aaa aga tat tat ggt ggc aat gag tac att gat cag ttg gag 626
Pro Gly Lys Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Gln Leu Glu
110 115 120
acg ctt tgc cag aac cgg gct ttg gca gcc ttc cgc tta gat tct acg 674
Thr Leu Cys Gln Asn Arg Ala Leu Ala Ala Phe Arg Leu Asp Ser Thr
125 130 135
aaa tgg ggg gtt aat gtt cag ccg tta tct ggt tca cct gca aac ttt 722
\Lys Trp Gly Val Asn Val Gln Pro Leu Ser Gly Ser Pro Ala Asn Phe
140 145 150 155
gct gtc tac act gcg ata ctt age cct cat gat cgg ate atg ggt ttg 770
Ala Val Tyr Thr Ala Ile Leu Ser Pro His Asp Arg Ile Met Gly Leu
160 165 170
gat tta cct cac ggt ggt cat ctg tcg cat ggg ttc atg acc gct aaa 818
Asp Leu Pro His Gly Gly His Leu Ser His Gly Phe Met Thr Ala Lys
175 180 185
agg cgt gta tet gga act tca ata tac ttt gag tcc atg cct tat cga 866
Arg Arg Val Ser Gly Thr Ser Ile Tyr Phe Glu Ser Met Pro Tyr Arg
190 195 200
ctt gat gaa tca aca ggc att gtt gac tac gat atg ctc gag aaa act 914
Leu Asp Glu Ser Thr Gly Ile Val Asp Tyr Asp Met Leu Glu Lys Thr
205 210 215
gct aca ctt ttc aga cca aag ctt att ate gea gga gct agt gea tac 962
Ala Thr Leu Phe Arg Pro Lys Leu Ile Ile Ala Gly Ala Ser Ala Tyr220 225 230 235
age cga gat ttt gac tat cct cgc atg agg aag ate gea gac tca gtt1010
Ser Arg Asp Phe Asp Tyr Pro Arg Met Arg Lys Ile Ala Asp Ser Val
240 245 250
ggt gct ttt ctg atg atg gat atg get cat ate agt ggg ctt gtg gct1058
Gly Ala Phe Leu Met Met Asp Met Ala His Ile Ser Gly Leu Val Ala
255 260 265
gct tet gtg gta gct gac cct ttt gag tat tgt gat att gtt aca aca1106
Ala Ser Val Val Ala Asp Pro Phe Glu Tyr Cys Asp Ile Val Thr Thr
270 275 280
aca act cac aag tet ttg aga ggt ccg aga ggt ggc atg ate ttc ttc1154
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Gly Met Ile Phe Phe
285 290 295
agg aag gat cca att aat ggg gtt gat ctt gaa tet gcc gtg aac aat1202
Arg Lys Asp Pro Ile Asn Gly Val Asp Leu Glu Ser Ala Val Asn Asn300 305 310 315
gct gtc ttc cct ggt ttg cag ggt ggc cct cat aac cac aca att gga1250
Ala Val Phe Pro Gly Leu Gln Gly Gly Pro His Asn His Thr Ile Gly
320 325 330
gga tta gea gtc tgc ttg aaa cac gea caa tca ccg gaa ttc aag gcg1298
Gly Leu Ala Val Cys Leu Lys His Ala Gln Ser Pro Glu Phe Lys Ala
335 340 345
tac cag aaa aga gtt gtg tet aac tgt aga gct cta gct aac cga ttg1346
Tyr Gln Lys Arg Val Val Ser Asn Cys Arg Ala Leu Ala Asn Arg Leu
350 355 360
gtt gaa ctc ggg ttt aag cta gtt tet ggt ggc age gat aac cac ttg1394
Val Glu Leu Gly Phe Lys Leu Val Ser Gly Gly Ser Asp Asn His Leu
365 370 375
gtt ctc gtc gat ctt aga ccc atg ggt atg gat ggt gcg cgg gtt gag1442
Val Leu Val Asp Leu Arg Pro Met Gly Met Asp Gly Ala Arg Val Glu380 385 390 395
aaa ate tta gac atg gea tet att act ctc aac aag aac tet gtc cct1490
Lys Ile Leu Asp Met Ala Ser Ile Thr Leu Asn Lys Asn Ser Val Pro
400 405 410
ggg gac aaa agt gcg ttg gta cca ggg gga ata agg ata gga tcc ccc1538Gly Asp Lys Ser Ala Leu Val Pro Gly Gly Ile Arg Ile Gly Ser Pro
415 420 425
gcg atg acg aca aga gga ctg tca gag aaa gac ttt gta gta gtg gct1586
Ala Met Thr Thr Arg Gly Leu Ser Glu Lys Asp Phe Val Val Val Ala
430 435 440
gac ttc ate aag gaa ggt gtg gag ata aca atg gaa gcc aag aaa gcc1634
Asp Phe Ile Lys Glu Gly Val Glu Ile Thr Met Glu Ala Lys Lys Ala
445 450 455
gcg ccg ggt tca aag ctt caa gat ttc aac aag ttc gtg aca tet cct1682
Ala Pro Gly Ser Lys Leu Gln Asp Phe Asn Lys Phe Val Thr Ser Pro460 465 470 475
gag ttt cca ttg aaa gag aga gtg aag agt cta aag gag aga gtg gaa1730
Glu Phe Pro Leu Lys Glu Arg Val Lys Ser Leu Lys Glu Arg Val Glu
480 485 490
acc ttc aca tet cgt ttt ccc att cct ggc gtt taagctataa acacacacag1783
Thr Phe Thr Ser Arg Phe Pro Ile Pro Gly Val
495 500
atatgctctt gttgtacctt aattattcac ctttttcatc tgtcttttag ggtttttact1843
tgcttgtgtc ccaagtttaa agttacagtt gaatcgagag aaattatttt caaaaataaa1903
tttatttgtg gaacaatgat tcgtctatgt tcccaaatct c1944
<210> 16<211> 502<212> PRT
<213> Arabidopsis thaliana <400> 16 Met Pro Pro Val Thr Lys Phe Ser Gln Gln Leu Lys Phe Asn Ile Ser1 5 10 15 Lys Pro Phe Arg Ser Ser Phe Leu Lys Arg Asn Leu Val Ser Glu Met 20 25 30 Arg Ala Ser Ser Val Ser Leu Pro Asn Val Glu Ile Ser Ser Lys Glu 35 40 45 Ile Pro Phe Glu Asp Tyr Gly Leu Gly Glu Val Asp Pro Glu Val Arg 50 55 60 Thr Ile Ile Thr Lys Glu Lys Asp Arg Gln Phe Arg Ser Leu Glu Leu65 70 75 80Ile Ala Ser Glu Asn Phe Thr Ser Arg Ala Val Met Glu Ala Val Gly 85 90 95 Ser Cys Leu Thr Asn Lys Tyr Ser Glu Gly Leu Pro Gly Lys Arg Tyr 100 105 110 Tyr Gly Gly Asn Glu Tyr Ile Asp Gln Leu Glu Thr Leu Cys Gln Asn 115 120 125 Arg Ala Leu Ala Ala Phe Arg Leu Asp Ser Thr Lys Trp Gly Val Asn 130 135 140 Val Gln Pro Leu Ser Gly Ser Pro Ala Asn Phe Ala Val Tyr Thr Ala145 150 155 160Ile Leu Ser Pro His Asp Arg Ile Met Gly Leu Asp Leu Pro His Gly 165 170 175 Gly His Leu Ser His Gly Phe Met Thr Ala Lys Arg Arg Val Ser Gly 180 185 190 Thr Ser Ile Tyr Phe Glu Ser Met Pro Tyr Arg Leu Asp Glu Ser Thr195 200 205
Gly Ile 210 Val Asp Tyr Asp Met 215 Leu Glu Lys Thr Ala 220 Thr Leu Phe ArgPro Lys Leu Ile Ile Ala Gly Ala Ser Ala Tyr Ser Arg Asp Phe Asp225 230 235 240Tyr Pro Arg Met Arg Lys Ile Ala Asp Ser Val Gly Ala Phe Leu Met 245 250 255 Met Asp Met Ala 260 His Ile Ser Gly Leu 265 Val Ala Ala Ser Val 270 Val AlaAsp Pro Phe 275 Glu Tyr Cys Asp Ile 280 Val Thr Thr Thr Thr 285 His Lys SerLeu Arg Gly Pro Arg Gly Gly Met Ile Phe Phe Arg Lys Asp Pro Ile 290 295 300 Asn Gly Val Asp Leu Glu Ser Ala Val Asn Asn Ala Val Phe Pro Gly305 310 315 320Leu Gln Gly Gly Pro His Asn His Thr Ile Gly Gly Leu Ala Val Cys 325 330 335 Leu Lys His Ala 340 Gln Ser Pro Glu Phe 345 Lys Ala Tyr Gln Lys 350 Arg ValVal Ser Asn 355 Cys Arg Ala Leu Ala 360 Asn Arg Leu Val Glu 365 Leu Gly PheLys Leu 370 Val Ser Gly Gly Ser 375 Asp Asn His Leu Val 380 Leu Val Asp LeuArg Pro Met Gly Met Asp Gly Ala Arg Val Glu Lys Ile Leu Asp Met385 390 395 400Ala Ser Ile Thr Leu 405 Asn Lys Asn Ser Val 410 Pro Gly Asp Lys Ser 415 AlaLeu Val Pro Gly 420 Gly Ile Arg Ile Gly 425 Ser Pro Ala Met Thr 430 Thr ArgGly Leu Ser Glu Lys Asp Phe Val Val Val Ala Asp Phe Ile Lys Glu 435 440 445 Gly Val 450 Glu Ile Thr Met Glu 455 Ala Lys Lys Ala Ala 460 Pro Gly Ser LysLeu Gln Asp Phe Asn Lys Phe Val Thr Ser Pro Glu Phe Pro Leu Lys465 470 475 480Glu Arg Val Lys Ser 485 Leu Lys Glu Arg Val 490 Glu Thr Phe Thr Ser 495 ArgPhe Pro Ile Pro 500 Gly Val
<210> 17<211> 2073<212> DNA<213> Glycine max
<220><221> CDS
<222> (187)..(1770)<400> 17
cccacgcgtc cgcccacgcg tccgctcaac tttgaaattc ttaaaaccct aactggtccg 60
aaccattgga gccaccgtgc aatagttcct cctctcactc tctccctcaa cacaccattg 120
attttggttt cagctttatt tggaagaggg ttgtaacgct gacgtgaaat ttttctgaag 180
acaaag atg cag gct tgt aca acg atg agt tct ttg cag caa caa cct 228
Met Gln Ala Cys Thr Thr Met Ser Ser Leu Gln Gln Gln Pro15 10
att tgg aoc aaa ggg tta aat ttc cct gca aaa ggg tat ggc age aat 276
Ile Trp Thr Lys Gly Leu Asn Phe Pro Ala Lys Gly Tyr Gly Ser Asn15 20 25 30
aac ggg ttt cta cct cag gtg agg ttc tgc aat att aag cca tcc aaa 324Asn Gly Phe Leu Pro Gln Val Arg Phe Cys Asn Ile Lys Pro Ser Lys
35 40 45
gct tct cat gtt gaa gca agt tta gtc act ggg aag ccg tca tct gtg 372
Ala Ser His Val Glu Ala Ser Leu Val Thr Gly Lys Pro Ser Ser Val
50 55 60
cct ttc tct gtg cct gaa att gga ggc gac gga agt age ttc ctg gac 420
Pro Phe Ser Val Pro Glu Ile Gly Gly Asp Gly Ser Ser Phe Leu Asp
65 70 75
tat ggc ttg agt gaa gct gat cct gat gtt cgt gca att att gac aag 468
Tyr Gly Leu Ser Glu Ala Asp Pro Asp Val Arg Ala Ile Ile Asp Lys
80 85 90
gaa aag gac cga caa ttt aaa agt ctt gag ctt att gct tct gag aat 516
Glu Lys Asp Arg Gln Phe Lys Ser Leu Glu Leu Ile Ala Ser Glu Asn95 100 105 110
ttt aca tct aga gca gtg atg gaa gca gtt ggg tcg tgc ctc aca aac 564
Phe Thr Ser Arg Ala Val Met Glu Ala Val Gly Ser Cys Leu Thr Asn
115 120 125
aag tac tca gaa gga ttg ccg ggt aaa agg tac tat ggt ggc aat gag 612
Lys Tyr Ser Glu Gly Leu Pro Gly Lys Arg Tyr Tyr Gly Gly Asn Glu
130 135 140
tac att gat gag ctt gaa ate cta tgt caa caa agg gca ctg gct gca 660
Tyr Ile Asp Glu Leu Glu Ile Leu Cys Gln Gln Arg Ala Leu Ala Ala
145 150 155
ttt cat gta gat gaa aac aaa tgg ggt gtt aat gtt caa act tta tct 708
Phe His Val Asp Glu Asn Lys Trp Gly Val Asn Val Gln Thr Leu Ser
160 165 170
ggt tcc cct gct aat ttt gca gta tac act gca gtt ctt aaa cca cat 756
Gly Ser Pro Ala Asn Phe Ala Val Tyr Thr Ala Val Leu Lys Pro His175 180 185 190
gat cgg ata atg ggt ttg gac ttg cct cac gga gga cat ttg tct cat 804
Asp Arg Ile Met Gly Leu Asp Leu Pro His Gly Gly His Leu Ser His
195 200 205
gga ttc atg aca ccc aaa aaa cgt gta tca gcc aca tca att tat ttt 852
Gly Phe Met Thr Pro Lys Lys Arg Val Ser Ala Thr Ser Ile Tyr Phe
210 215 220
gaa tct atg cct tat cga ctt gat gaa tca aca ggt ctt att gat tat 900
Glu Ser Met Pro Tyr Arg Leu Asp Glu Ser Thr Gly Leu Ile Asp Tyr
225 230 235
gat atg ctg gag aaa act gct act ctg ttt cgt cca aaa ctc att gtt 948
Asp Met Leu Glu Lys Thr Ala Thr Leu Phe Arg Pro Lys Leu Ile Val
240 245 250
gct ggt gct agt gct tat cct cgg gac att gac tac cct cgt atg aga 996
Ala Gly Ala Ser Ala Tyr Pro Arg Asp Ile Asp Tyr Pro Arg Met Arg255 260 265 270
aaa att gca gat gaa gta ggt gct ttt ctt atg atg gat atg gct cat1044
Lys Ile Ala Asp Glu Val Gly Ala Phe Leu Met Met Asp Met Ala His
275 280 285
ata agt ggg ctt gtt gct gca tct gta ctt tct aat ccc ttt gag tat1092
Ile Ser Gly Leu Val Ala Ala Ser Val Leu Ser Asn Pro Phe Glu Tyr
290 295 300
tgt gat att gtg acc acc aca acc cac aag tct tta cga ggt cca aga1140
Cys Asp Ile Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg
305 310 315
ggt ggt atg ata ttc ttc aag aaa gat act gtg cat ggg gtt gat ttg1188
Gly Gly Met Ile Phe Phe Lys Lys Asp Thr Val His Gly Val Asp Leu
320 325 330
gag cct gcc att aac aat gct gtt ttt cct ggt cta cag ggg ggt cct1236
Glu Pro Ala Ile Asn Asn Ala Val Phe Pro Gly Leu Gln Gly Gly Pro
\335 340 345 350
cat aac cac aca att gga gga cta gca gtt tgc ttg aag tat gct cag1284
His Asn His Thr Ile Gly Gly Leu Ala Val Cys Leu Lys Tyr Ala Gln
355 360 365
tct cca gaa ttt aaa aat tat caa aat cag gtg gtt gct aac tgt aga1332
Ser Pro Glu Phe Lys Asn Tyr Gln Asn Gln Val Val Ala Asn Cys Arg
370 375 380
gct ctt gct aag cga tta att gag cat gga tat aaa ctg gtt tct ggt1380
Ala Leu Ala Lys Arg Leu Ile Glu His Gly Tyr Lys Leu Val Ser Gly
385 390 395
ggt agt gac aat cac ctg gtt ctt gtc gat cta agg cca tct ggt ctt1428
Gly Ser Asp Asn His Leu Val Leu Val Asp Leu Arg Pro Ser Gly Leu
400 405 410
gat ggt gct cgg gtg gag aaa att ctt gac ttg gct tct ata acc ctc1476
Asp Gly Ala Arg Val Glu Lys Ile Leu Asp Leu Ala Ser Ile Thr Leu415 420 425 430
aac aaa aat tca gtg cct ggt gat aag agt gcc cta gtt cca gga ggc1524
Asn Lys Asn Ser Val Pro Gly Asp Lys Ser Ala Leu Val Pro Gly Gly
435 440 445
att cgc att ggg gca cca gca atg aca aca aga gga ctt ggt gag aaa1572
Ile Arg Ile Gly Ala Pro Ala Met Thr Thr Arg Gly Leu Gly Glu Lys
450 455 460
gaa ttt tca ctc att gct gat ttc att cat gag ggt gtg caa ata agt1620
Glu Phe Ser Leu Ile Ala Asp Phe Ile His Glu Gly Val Gln Ile Ser
465 470 475
ctt gaa gcc aaa agt ttg gtc tca gga acg aag ctc caa gat ttt ttg1668
Leu Glu Ala Lys Ser Leu Val Ser Gly Thr Lys Leu Gln Asp Phe Leu
480 485 490
aag ttt gta aca tct tct gaa ttt cct ttg gga gag aag gta tca gag1716
Lys Phe Val Thr Ser Ser Glu Phe Pro Leu Gly Glu Lys Val Ser Glu495 500 505 510
ttg cgt agg aaa gtt gaa gct ctt act act cag tat cca ata ccc gga1764
Leu Arg Arg Lys Val Glu Ala Leu Thr Thr Gln Tyr Pro Ile Pro Gly
515 520 525
gtc taagtgtacc cgcataatga atacttaaaa ctaagacgct gttaaaaaat1817Val
tttgtacaat aatcatgctt cgatgtgtgt tgctaataat atgttgtaac attttatggc1877
aaatgcagca gcagctttat gattatccca tttataattg gaagcaaacc aatccaatcc1937
ttgatccttc aaatattcct tagtaattaa tattgtagat gaatggaaag caaattggta1997
acgagtggcc cgacttcttg gggttcgaaa agctttgtac ttgaattgaa agaccacttc2057
aagacttagg tccttt2073<210> 18 <211> 527 <212> PRT <213> Glycine max <400> 18 Met Gln Ala Cys Thr Thr Met Ser Ser Leu Gln Gln Gln Pro Ile Trp1 5 10 15Thr Lys Gly Leu Asn Phe Pro Ala Lys Gly Tyr Gly Ser Asn Asn Gly 20 25 30 Phe Leu Pro Gln Val Arg Phe Cys Asn Ile Lys Pro Ser Lys Ala Ser 35 40 45 His Val Glu Ala Ser Leu Val Thr Gly Lys Pro Ser Ser Val Pro Phe 50 55 60 Ser Val Pro Glu Ile Gly Gly Asp Gly Ser Ser Phe Leu Asp Tyr Gly65 70 75 80Leu Ser Glu Ala Asp Pro Asp Val Arg Ala Ile Ile Asp Lys Glu Lys 85 90 95Asp Arg Gln Phe Lys Ser Leu Glu Leu Ile Ala Ser Glu Asn Phe Thr 100 105 110 Ser Arg Ala Val Met Glu Ala Val Gly Ser Cys Leu Thr Asn Lys Tyr 115 120 125 Ser Glu Gly Leu Pro Gly Lys Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile 130 135 140 Asp Glu Leu Glu Ile Leu Cys Gln Gln Arg Ala Leu Ala Ala Phe His145 150 155 160Val Asp Glu Asn Lys Trp Gly Val Asn Val Gln Thr Leu Ser Gly Ser 165 170 175Pro Ala Asn Phe Ala Val Tyr Thr Ala Val Leu Lys Pro His Asp Arg 180 185 190 Ile Met Gly Leu Asp Leu Pro His Gly Gly His Leu Ser His Gly Phe 195 200 205 Met Thr Pro Lys Lys Arg Val Ser Ala Thr Ser Ile Tyr Phe Glu Ser 210 215 220 Met Pro Tyr Arg Leu Asp Glu Ser Thr Gly Leu Ile Asp Tyr Asp Met 225 230 235 240Leu Glu Lys Thr Ala Thr Leu Phe Arg Pro Lys Leu Ile Val Ala Gly 245 250 255Ala Ser Ala Tyr Pro Arg Asp Ile Asp Tyr Pro Arg Met Arg Lys Ile 260 265 270 Ala Asp Glu Val Gly Ala Phe Leu Met Met Asp Met Ala His Ile Ser 275 280 285 Gly Leu Val Ala Ala Ser Val Leu Ser Asn Pro Phe Glu Tyr Cys Asp 290 295 300 Ile Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Gly305 310 315 320Met Ile Phe Phe Lys Lys Asp Thr Val His Gly Val Asp Leu Glu Pro 325 330 335Ala Ile Asn Asn Ala Val Phe Pro Gly Leu Gln Gly Gly Pro His Asn 340 345 350 His Thr Ile Gly Gly Leu Ala Val Cys Leu Lys Tyr Ala Gln Ser Pro 355 360 365 Glu Phe Lys Asn Tyr Gln Asn Gln Val Val Ala Asn Cys Arg Ala Leu 370 375 380 Ala Lys Arg Leu Ile Glu His Gly Tyr Lys Leu Val Ser Gly Gly Ser385 390 395 400Asp Asn His Leu Val Leu Val Asp Leu Arg Pro Ser Gly Leu Asp Gly 405 410 415Ala Arg Val Glu Lys Ile Leu Asp Leu Ala Ser Ile Thr Leu Asn Lys 420 425 430 Asn Ser Val Pro Gly Asp Lys Ser Ala Leu Val Pro Gly Gly Ile Arg435
Ile Gly Ala
450Ser Leu Ile465
Ala Lys Ser
Val Thr Ser
Arg Lys Val515
<210> 19<211> 2055<212> DNA<213> Glycine max
<220>
<221> CDS
<222> (75)..(1631)
<400> 19
cggctcgagc gggacttctt cttcaaaaac acacaagcac actacacttt gtctctgttc 60
tgtgtgtgcg agaa atg gcg atg gca atg gcg Ctt cgc agg Ctt tca tct 110 Met Ala Met Ala Met Ala Leu Arg Arg Leu Ser Ser 1 5 10 tca att gac aag cct ctg cgc cct ctc ttc aat gcc ggt tcc ctc tac 158Ser Ile Asp 15 Lys Pro Leu Arg Pro 20 Leu Phe Asn Ala Gly 25 Ser Leu Tyr tac aag tcg tct ttg cct gat gaa gct gtt tac gac aag gag cga CCC 206Tyr Lys Ser Ser Leu Pro Asp Glu Ala Val Tyr Asp Lys Glu Arg Pro 30 35 40 gga gtt aca tgg ccg aag cag ttg aat gct cca Ctt gag gtc gtg gat 254Gly Val Thr Trp Pro Lys Gln Leu Asn Ala Pro Leu Glu Val Val Asp 45 50 55 60 cct gag att gct gat att att gag Ctt gag aaa gct agg caa tgg aag 302Pro Glu Ile Ala Asp 65 Ile Ile Glu Leu Glu 70 Lys Ala Arg Gln Trp 75 Lys ggg cta gaa ttg ata ccg tca gag aat ttc acc tct gtg tct gtg atg 350Gly Leu Glu Leu 80 Ile Pro Ser Glu Asn 85 Phe Thr Ser Val Ser 90 Val Met caa gcg gtt gga tcg gtt atg acc aac aaa tac agt gag ggg tac cct 398Gln Ala Val 95 Gly Ser Val Met Thr 100 Asn Lys Tyr Ser Glu 105 Gly Tyr Pro ggt gca aga tat tat ggt gga aat gag tat att gac atg gct gaa aca 446Gly Ala Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Met Ala Glu Thr 110 115 120 ctg tgc caa aag cgt gcc cta gaa gct ttt aga ttg gat CCC gct aaa 494Leu Cys Gln Lys Arg Ala Leu Glu Ala Phe Arg Leu Asp Pro Ala Lys 125 130 135 140 tgg gga gtg aac gtg cag cct ctg tca ggg tct cct gca aat ttc cac 542Trp Gly Val Asn Val 145 Gln Pro Leu Ser Gly 150 Ser Pro Ala Asn Phe 155 His gtt tac act gca ttg Ctt aaa cct cat gaa aga ate atg gca Ctt gat 590Val Tyr Thr Ala Leu Leu Lys Pro His Glu Arg Ile Met Ala Leu Asp 160 165 170 Ctt cct cat ggt ggc cat Ctt tct cac gga tat cag act gat acc aaa 638Leu Pro His Gly Gly His Leu Ser His Gly Tyr Gln Thr Asp Thr Lys 175 180 185 aag ata tct gca gtc tcg ata ttt ttt gag aca atg cca tat cga ttg 686Lys Ile Ser Ala Val Ser Ile Phe Phe Glu Thr Met Pro Tyr Arg Leu 190 195 200
440 445
Pro Ala Met Thr Thr Arg Gly Leu Gly Glu Lys Glu Phe
455 460
Ala Asp Phe Ile His Glu Gly Val Gln Ile Ser Leu Glu470 475 480
Leu Val Ser Gly Thr Lys Leu Gln Asp Phe Leu Lys Phe
485 490 495
Ser Glu Phe Pro Leu Gly Glu Lys Val Ser Glu Leu Arg500 505 510
Glu Ala Leu Thr Thr Gln Tyr Pro Ile Pro Gly Val520 525aat gaa agt aca gga tac ate gac tat gac cag atg gag aaa tet gct 734
Asn Glu Ser Thr Gly Tyr Ile Asp Tyr Asp Gln Met Glu Lys Ser Ala
205 210 215 220
aca ctc ttc agg cca aaa tta att gtt gct gga gct age gct tat gea 782
Thr Leu Phe Arg Pro Lys Leu Ile Val Ala Gly Ala Ser Ala Tyr Ala
225 230 235
cgt ctc tat gat tat gaa cgt gta cgc aag gtt tgc gat aaa cag aaa 830
Arg Leu Tyr Asp Tyr Glu Arg Val Arg Lys Val Cys Asp Lys Gln Lys
240 245 250
gct ata cta ttg gea gat atg gea cac ate agt gga ttg gtt gea gct 878
Ala Ile Leu Leu Ala Asp Met Ala His Ile Ser Gly Leu Val Ala Ala
255 260 265
ggt gtc ate cca tca cct ttt gat tat gct gat gta gtt act acc aca 926
Gly Val Ile Pro Ser Pro Phe Asp Tyr Ala Asp Val Val Thr Thr Thr
270 275 280
act cac aag tca ctt cga gga cca cgt gga gct atg ata ttc tac aga 974
Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala Met Ile Phe Tyr Arg285 290 295 300
aaa ggg gtt aaa gaa att aac aaa caa gga aaa gag gta ttg tat gac1022
Lys Gly Val Lys Glu Ile Asn Lys Gln Gly Lys Glu Val Leu Tyr Asp
305 310 315
tac gaa gac aaa ate aac caa gct gtt ttc cct gga ctg caa ggt ggc1070
Tyr Glu Asp Lys Ile Asn Gln Ala Val Phe Pro Gly Leu Gln Gly Gly
320 325 330
cct cac aac cac act att act ggt tta gct gtt gcg ttg aag cag gcc1118
Pro His Asn His Thr Ile Thr Gly Leu Ala Val Ala Leu Lys Gln Ala
335 340 345
act act ccc gaa tat aga gea tat caa gag caa gtt ctc age aac age1166
Thr Thr Pro Glu Tyr Arg Ala Tyr Gln Glu Gln Val Leu Ser Asn Ser
350 355 360
ttt aaa ttt gea cag gct ctg agt gag aga age tat gag ctt gtc tet1214
Phe Lys Phe Ala Gln Ala Leu Ser Glu Arg Ser Tyr Glu Leu Val Ser365 370 375 380
ggt gga acc gag aat cac ctg gtt ttg gtg aat ctg aag aat aag ggt1262
Gly Gly Thr Glu Asn His Leu Val Leu Val Asn Leu Lys Asn Lys Gly
385 390 395
att gat ggc tcc aga gtt gag aag gtg ttg gaa gea gtt cat att gea1310
Ile Asp Gly Ser Arg Val Glu Lys Val Leu Glu Ala Val His Ile Ala
400 405 410
gct aat aaa aac act gtt cct gga gat gtg tet gcc atg gtt cct ggt1358
Ala Asn Lys Asn Thr Val Pro Gly Asp Val Ser Ala Met Val Pro Gly
415 420 425
ggc ate agg atg gga acc cct gct ctt act tet aga gga ttt gtt gag1406
Gly Ile Arg Met Gly Thr Pro Ala Leu Thr Ser Arg Gly Phe Val Glu
430 435 440
gag gat ttt gtc aag gta gea gag ttt ttt gat gea gea gtg aag ata1454
Glu Asp Phe Val Lys Val Ala Glu Phe Phe Asp Ala Ala Val Lys Ile445 450 455 460
gct gtg aag att aag gga gag age aaa gga aca aag ctg aag gac ttc1502
Ala Val Lys Ile Lys Gly Glu Ser Lys Gly Thr Lys Leu Lys Asp Phe
465 470 475
ttg gcc aca att gag tca tet tet acc ttt caa tcg gag ata gea aag1550
Leu Ala Thr Ile Glu Ser Ser Ser Thr Phe Gln Ser Glu Ile Ala Lys
480 485 490
ctc cgc ctt gat gtt gag gag tat gca aaa caa ttt cca acc att ggt1598
Leu Arg Leu Asp Val Glu Glu Tyr Ala Lys Gln Phe Pro Thr Ile Gly
495 500 505
ttt gat aaa gca acc atg aag cac aag aat tgagaaaaga aaattttcca1648
Phe Asp Lys Ala Thr Met Lys His Lys Asn
510 515
ttaggtcatc ccatggtctt actggcaagc aattcaacaa gatcagtttt cctgatccat1708
ggtagaggac gacaacatat tttaaaaaca atgtcaaaag cctttatatg taagaatcca1768
gaaaatcttg atcgttatgt tgaaatgtat agatgcatat gtaataaagg cttcaaatac1828
caaatttctt aatcagatga ttgttgaacc tatcccctat aatggggtta caátcgatcg1888
taagtggttg tatctgctat aaattcaact agcctcctca attgcataga atcctgctgg1948
atgctgatgt gaattatttt acctcaatga tatttcttaa ataaaaattt catttgcctt2008
aaaaaaaaaa aactgaattc ctttatttat cctaattccc cggatcc2055
<210> 20<211> 518<212> PRT
<213> Glycine max <400> 20 Met Ala Met Ala Met Ala Leu Arg Arg Leu Ser Ser Ser Ile Asp Lys1 5 10 15 Pro Leu Arg Pro Leu Phe Asn Ala Gly Ser Leu Tyr Tyr Lys Ser Ser 20 25 30 Leu Pro Asp Glu Ala Val Tyr Asp Lys Glu Arg Pro Gly Val Thr Trp 35 40 45 Pro Lys Gln Leu Asn Ala Pro Leu Glu Val Val Asp Pro Glu Ile Ala 50 55 60 Asp Ile Ile Glu Leu Glu Lys Ala Arg Gln Trp Lys Gly Leu Glu Leu65 70 75 80Ile Pro Ser Glu Asn Phe Thr Ser Val Ser Val Met Gln Ala Val Gly 85 90 95 Ser Val Met Thr Asn Lys Tyr Ser Glu Gly Tyr Pro Gly Ala Arg Tyr 100 105 110 Tyr Gly Gly Asn Glu Tyr Ile Asp Met Ala Glu Thr Leu Cys Gln Lys 115 120 125 Arg Ala Leu Glu Ala Phe Arg Leu Asp Pro Ala Lys Trp Gly Val Asn 130 135 140 Val Gln Pro Leu Ser Gly Ser Pro Ala Asn Phe His Val Tyr Thr Ala145 150 155 160Leu Leu Lys Pro His Glu Arg Ile Met Ala Leu Asp Leu Pro His Gly 165 170 175 Gly His Leu Ser His Gly Tyr Gln Thr Asp Thr Lys Lys Ile Ser Ala 180 185 190Val Ser Ile Phe Phe Glu Thr Met Pro Tyr Arg Leu Asn Glu Ser Thr 195 200 205 Gly Tyr 210 Ile Asp Tyr Asp Gln 215 Met Glu Lys Ser Ala 220 Thr Leu Phe ArgPro Lys Leu Ile Val Ala Gly Ala Ser Ala Tyr Ala Arg Leu Tyr Asp 225 230 235 240Tyr Glu Arg Val Arg Lys Val Cys Asp Lys Gln Lys Ala Ile Leu Leu 245 250 255 Ala Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Gly Val Ile Pro 260 265 270 Ser Pro Phe 275 Asp Tyr Ala Asp Val 280 Val Thr Thr Thr Thr 285 His Lys SerLeu Arg Gly Pro Arg Gly Ala Met Ile Phe Tyr Arg Lys Gly Val Lys 290 295 300 Glu Ile Asn Lys Gln Gly Lys Glu Val Leu Tyr Asp Tyr Glu Asp Lys305 310 315 320Ile Asn Gln Ala Val Phe Pro Gly Leu Gln Gly Gly Pro His Asn His 325 330 335 Thr Ile Thr Gly 340 Leu Ala Val Ala Leu 345 Lys Gln Ala Thr Thr 350 Pro GluTyr Arg Ala Tyr Gln Glu Gln Val Leu Ser Asn Ser Phe Lys Phe Ala 355 360 365 Gln Ala Leu Ser Glu Arg Ser Tyr Glu Leu Val Ser Gly Gly Thr Glu 370 375 380 Asn His Leu Val Leu Val Asn Leu Lys Asn Lys Gly Ile Asp Gly Ser385 390 395 400Arg Val Glu Lys Val Leu Glu Ala Val His Ile Ala Ala Asn Lys Asn 405 410 415 Thr Val Pro Gly Asp Val Ser Ala Met Val Pro Gly Gly Ile Arg Met 420 425 430 Gly Thr Pro Ala Leu Thr Ser Arg Gly Phe Val Glu Glu Asp Phe Val 435 440 445 Lys Val 450 Ala Glu Phe Phe Asp 455 Ala Ala Val Lys Ile 460 Ala Val Lys IleLys Gly Glu Ser Lys Gly Thr Lys Leu Lys Asp Phe Leu Ala Thr Ile465 470 475 480Glu Ser Ser Ser Thr Phe Gln Ser Glu Ile Ala Lys Leu Arg Leu Asp 485 490 495 Val Glu Glu Tyr Ala Lys Gln Phe Pro Thr Ile Gly Phe Asp Lys Ala 500 505 510 Thr Met Lys His Lys Asn
515
<210> 21<211> 1795<212> DNA<213> Glycine max
<220>
<221> CDS
<222> (73).. (1296)
<400> 21
caacaacact ctctcttcte gctcttggct tttcgctctt cactcactct cattcattca 60
tttccaccgt tc atg gat cca gta age gtg tgg ggt aac acg ccc ttg gcg 111
Met Asp Pro Val Ser Val Trp Gly Asn Thr Pro Leu Ala15 10
acg gtg gat ccc gag ate cat gac etc ate gag aag gag aag cgc cgt 159
Thr Val Asp Pro Glu Ile His Asp Leu Ile Glu Lys Glu Lys Arg Arg
15 20 25
caa tgc cgc gga ate gag etc ate gcc tcc gag aac ttc acc tcc ttc 207
Gln Cys Arg Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe
\30 35 40 45
gcc gtc ate gag gcc ctc ggc age gct ctc acg aac aaa tac tcc gag 255
Ala Val Ile Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu
50 55 60
ggc atg ccg ggc aac cgc tac tac ggc ggc aat gaa tac ate gac cag 303
Gly Met Pro Gly Asn Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Gln
65 70 75
ate gaa aac ctc tgc cgc tca cgc gcc ctc caa gcc ttc cac ctc gac 351
Ile Glu Asn Leu Cys Arg Ser Arg Ala Leu Gln Ala Phe His Leu Asp
80 85 90
gcc caa tcc tgg ggc gtc aac gtc cag ccc tac tcc ggc tcc ccg gcc 399
Ala Gln Ser Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala
95 100 105
aac ttc gcc gcc tac acc gcc gtc ctc aac ccc cac gac cgc ate atg 447
Asn Phe Ala Ala Tyr Thr Ala Val Leu Asn Pro His Asp Arg Ile Met110 115 120 125
ggg cta gat ctc ccc tcc ggc ggc cac ctc acc cac ggc tac tac acc 495
Gly Leu Asp Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr
130 135 140
tcc ggc gga aag aag ate tcc gcc acc tcc att tac ttc gag agt ctc 543
Ser Gly Gly Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu
145 150 155
cct tac aag gta aac tcc acc acc ggc tac ate gac tac gac cgc ttg 591
Pro Tyr Lys Val Asn Ser Thr Thr Gly Tyr Ile Asp Tyr Asp Arg Leu
160 165 170
gaa gaa aaa gcc cta gac ttc agg cca aaa ctc ata ate tgc ggt ggc 639
Glu Glu Lys Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly
175 180 185
age gcg tac cct cgc gat tgg gac tac aaa cgt ttc agg gaa gtc gct 687
Ser Ala Tyr Pro Arg Asp Trp Asp Tyr Lys Arg Phe Arg Glu Val Ala190 195 200 205
gat aag tgc gga gea ttg ctt ctc tgc gac atg gcg cac act age ggc 735
Asp Lys Cys Gly Ala Leu Leu Leu Cys Asp Met Ala His Thr Ser Gly
210 215 220
ctt gtg gcc gcg cag gaa gtg aac age ccc ttc gag tat tgc gac att 783
Leu Val Ala Ala Gln Glu Val Asn Ser Pro Phe Glu Tyr Cys Asp Ile
225 230 235
gtg acc acc acg act cac aag age ttg cgg ggc cca cgt gcg ggg atg 831
Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala- Gly Met
240 245 250
ate ttt tac cgg aag ggc ccc aag ccg ccg aag aag ggg cag ccg gag 879
Ile Phe Tyr Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu
255 260 265
aac gcg gtt tat gat ttc gag gac aag att aac ttc gcg gtg ttc cct 927
Asn Ala Val Tyr Asp Phe Glu Asp Lys Ile Asn Phe Ala Val Phe Pro270 275 280 285
tcg ctg cag ggt ggg ccc cac aac cac cag ate ggt gct ctc gcc gtg 975
Ser Leu Gln Gly Gly Pro His Asn His Gln Ile Gly Ala Leu Ala Val
290 295 300
gcg ctg aag cag gcc gcg tcg ccc ggg ttt aag gcc tac gcg aag cag1023
Ala Leu Lys Gln Ala Ala Ser Pro Gly Phe Lys Ala Tyr Ala Lys Gln
305 310 315
gtt aag gcg aac gcc gtt gcg ctt gga aaa tac ttg atg ggg aaa ggg1071
Val Lys Ala Asn Ala Val Ala Leu Gly Lys Tyr Leu Met Gly Lys Gly
320 325 330
tac age ctt gtc act ggc gga acg gag aac cat ctt gtt ttg tgg gat1119
Tyr Ser Leu Val Thr Gly Gly Thr Glu Asn His Leu Val Leu Trp Asp
335 340 345
ctg aga cct ctt gga ttg act ggg aat aag gtg gag aaa ctc tgt gat1167Leu Arg Pro Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp350 355 360 365ctc tgt aac att act gtt aac aag aac gct gtt ttt ggt gat age agt1215 Leu Cys Asn Ile Thr 370 Val Asn Lys Asn Ala 375 Val Phe Gly Asp Ser 380 Sergcc ttg gcc CCt ggt gga gtg cga att ggt aac gat Ctt act tet Ctt1263 Ala Leu Ala Pro 385 Gly Gly Val Arg Ile 390 Gly Asn Asp Leu Thr 395 Ser Leutta tat gct aca ata caa ate ttg Ctt tac taactcaatt ggaaacaaga 1313 Leu Tyr Ala 400 Thr Ile Gln Ile Leu 405 Leu Tyr
tctcatttat aagattataa aaatgatttc cttaggctag gactatatcc tctctctctc1373
tctctctttt tcttttttat catcgcagaa cttagatgaa ttttettacg taattttagt1433
actgttctet tatcagagtt cgaaagtaag ttataaaatt tctattgaag gcttgcatat1493
ttatataagt gaaattttaa ttttggttgg agaacaatgt ccaaaacacc aaagtgattg1553
catctaagtt ttttggattt tttaatgtat ttgtattttg tacaaggtat cttagtaagt1613
tgttgtagat tagtattgaa agagatttca ttgaggatgt gttttttagt gctttaacaa1673
aggaggtatg ttagttcggg ctaaagcttg cagactgcct ttgttaaaga atttcgagtt1733
gttgtcgtgc aatatgattg gcaaatcaat tataaactaa tctgttattt tgtttttctg1793
at1795
<210> 22<211> 407<212> PRT<213> Glycine max
<400> 22
Met Asp Pro Val Ser1 5
Pro Glu Ile His Asp20
Gly Ile Glu Leu Ile35
Glu Ala Leu Gly Ser50
Gly Asn Arg Tyr Tyr65
Leu Cys Arg Ser Arg85
Trp Gly Val Asn Val100
Ala Tyr Thr Ala Val
Val Trp Gly Asn Thr Pro Leu Ala Thr Val Asp
10 15
Leu Ile Glu Lys Glu Lys Arg Arg Gln Cys Arg
25 30
Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Ile
40 45
Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro
55 60
Gly Gly Asn Glu Tyr Ile Asp Gln Ile Glu Asn70 75 80
Ala Leu Gln Ala Phe His Leu Asp Ala Gln Ser
90 95
Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala
105 110
Leu Asn Pro His Asp Arg Ile Met Gly Leu Asp115 120 125
Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ser Gly Gly
130 135 140
Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys145 150 155 160
Val Asn Ser Thr Thr Gly Tyr Ile Asp Tyr Asp Arg Leu Glu Glu Lys
165 170 175
Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala Tyr
180 185 190
Pro Arg Asp Trp Asp Tyr Lys Arg Phe Arg Glu Val Ala Asp Lys Cys
195 200 205
Gly Ala Leu Leu Leu Cys Asp Met Ala His Thr Ser Gly Leu Val Ala
210 215 220
Ala Gln Glu Val Asn Ser Pro Phe Glu Tyr Cys Asp Ile Val Thr Thr225 230 235 240
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr
245 250 255
Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Asn Ala Val
260 265 270
Tyr Asp Phe Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser Leu Gln
275 280 285
Gly Gly Pro His Asn His Gln Ile Gly Ala Leu Ala Val Ala Leu Lys
290 295 300
Gln Ala Ala Ser Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Lys Ala305 310 315 320
Asn Ala Val Ala Leu Gly Lys Tyr Leu Met Gly Lys Gly Tyr Ser Leu
325 330 335
Val Thr Gly Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro
340 345 350
Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys Asn
355 360 365
Ile Thr Val Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ala
370 375 380
Pro Gly Gly Val Arg Ile Gly Asn Asp Leu Thr Ser Leu Leu Tyr Ala385 390 395 400
Thr Ile Gln Ile Leu Leu Tyr405
<210> 23<211> 1275<212> DNA<213> Oryza sativa
<220>
<221> CDS
<222> (1)..(1275)
<400> 23
atg gac tcc gtc gcg tcgMet Asp Ser Val Ala Ser1 5
ccg ctc gtc cac gac ctcPro Leu Val His Asp Leu20
ggc ate gag ctc ate gccGly Ile Glu Leu Ile Ala35
gag gcc ctc ggc tcc gcgGlu Ala Leu Gly Ser Ala50
ggg gcg cgc tac tac ggcGly Ala Arg Tyr Tyr Gly65 70
tgg ggg ctg acc ccg ctcTrp Gly Leu Thr Pro Leu
1O
ctc gag cgg gag aag cggLeu Glu Arg Glu Lys Arg25
tcg gag aac ttc acc tccSer Glu Asn Phe Thr Ser40
ctc acc aac aag tac tccLeu Thr Asn Lys Tyr Ser55 60
ggg aac gac gtc ate gacGly Asn Asp Val Ile Asp75
gcc gcg gcc gac 48
Ala Ala Ala Asp15
cgg cag cgg age 96
Arg Gln Arg Ser30
ttc gcc gtc atg 144
Phe Ala Val Met45
gag ggg atg ccc 192
Glu Gly Met Pro
gag ate gag aac 240
Glu Ile Glu Asn80ctg tgc cgc gac cgc gcc ctc gcc gcg ttc cgc ctc gac gcc gcg tcg 288Leu Cys Arg Asp Arg Ala Leu Ala Ala Phe Arg Leu Asp Ala Ala Ser 85 90 95 tgg ggc aag ate tcc gcg acg tcg ate tac ttc gag age ctc CCC tac 336Trp Gly Lys Ile 100 Ser Ala Thr Ser Ile 105 Tyr Phe Glu Ser Leu 110 Pro Tyr aag gtg age gcc gcc acg ggg tac ate gac tac gag aag ctg gag gag 384Lys Val Ser 115 Ala Ala Thr Gly Tyr 120 Ile Asp Tyr Glu Lys 125 Leu Glu Glu aag gcg ctc gac ttc cgc CCC aag ctc ate ate tgc ggc ggc age gcg 432Lys Ala 130 Leu Asp Phe Arg Pro 135 Lys Leu Ile Ile Cys 140 Gly Gly Ser Ala tac ccg agg gac tgg gac tac gcc aag ctc agg gcc gtc gcc gac aag 480Tyr Pro Arg Asp Trp Asp Tyr Ala Lys Leu Arg Ala Val Ala Asp Lys 145 150 155 160 gtc ggg gcg ctg ctc ctc tgc gac atg gcg cac ate age ggc ctc gtc 528Val Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val 165 170 175 gcc gcg cag gaa gct gea aat cct ttt gag tac tgt gat gtg gtt acc 576Ala Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr 180 185 190 acc acc acg cac aag tcc ctc cga gga cca aga gct ggc atg ate ttc 624Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe 195 200 205 tac agg aag ggc cct aag cct CCC aag aag ggc cag cct gag ggt gct 672Tyr Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala 210 215 220 gtc tat gac tac gag gac aag ate aac ttc gea gtg ttc ccg tca ctg 720Val Tyr Asp Tyr Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser Leu 225 230 235 240 caa ggt ggt cct cac aac cac cag att gea gcc Ctt gct gtt gct ctg 768Gln Gly Gly Pro His 245 Asn His Gln Ile Ala 250 Ala Leu Ala Val Ala 255 Leu cag caa acc atg aca cct gga ttc aag gcc tac gea aag cag gtc aag 816Gln Gln Thr Met Thr Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Lys 260 265 270 gcc aac gct gtc gcc att ggc aag tat Ctt atg age aag ggc tac aaa 864Ala Asn Ala 275 Val Ala Ile Gly Lys 280 Tyr Leu Met Ser Lys 285 Gly Tyr Lys atg gtg act gat gga act gag aac cac Ctt gtt ctc tgg gat Ctt cgc 912Met Val Thr Asp Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg 290 295 300 CC t Ctt ggc ttg act ggc aac aag gtt gag aag atg tgt gac Ctt tgc 960Pro Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Met Cys Asp Leu Cys 305 310 315 320 age att aca Ctt aac aag aat gct gtc ttt ggt gac age agt gea ttg 1008 Ser Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu 325 330 335 gct cct ggc ggt gtc cgc att ggt act cct gcg atg aca tcc agg ggt 1056 Ala Pro Gly Gly Val Arg Ile Gly Thr Pro Ala Met Thr Ser Arg Gly 340 345 350 Ctt gtc gag aag gac ttt gag cag ate ggc gag ttc ctc cac cag gcc 1104 Leu Val Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu His Gln Ala 355 360 365 gtg acc ate tgc ctc aac ate cag aag gag cac ggc aag ctc ctc aag 1152 Val Thr 370 Ile Cys Leu Asn Ile 375 Gln Lys Glu His Gly 380 Lys Leu Leu Lys gac ttc tcc aag ggc ctg gtg aac aac aag gac ate gag aac ctc aag 1200Asp Phe Ser Lys Gly Leu Val Asn Asn Lys Asp Ile Glu Asn Leu Lys385 390 395 400ctg gag gtc gag aag ttc gcc acc tcc ttc gac atg CCC ggc ttc acc1248 Leu Glu Val Glu Lys Phe Ala Thr Ser Phe Asp Met Pro Gly Phe Thr 405 410 415 ctc gac age atg aag tac aag gag tag 1275 Leu Asp Ser Met Lys Tyr Lys Glu 420 <210> 24 <211> 424 <212> PRT <213> Oryza sativa <400> 24 Met Asp Ser Val Ala Ser Trp Gly Leu Thr Pro Leu Ala Ala Ala Asp 1 5 10 15 Pro Leu Val His Asp Leu Leu Glu Arg Glu Lys Arg Arg Gln Arg Ser 20 25 30 Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Met 35 40 45 Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro 50 55 60 Gly Ala Arg Tyr Tyr Gly Gly Asn Asp Val Ile Asp Glu Ile Glu Asn65 70 75 80Leu Cys Arg Asp Arg Ala Leu Ala Ala Phe Arg Leu Asp Ala Ala Ser 85 90 95 Trp Gly Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr 100 105 110 Lys Val Ser Ala Ala Thr Gly Tyr Ile Asp Tyr Glu Lys Leu Glu Glu 115 120 125 Lys Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala 130 135 140 Tyr Pro Arg Asp Trp Asp Tyr Ala Lys Leu Arg Ala Val Ala Asp Lys145 150 155 160Val Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val 165 170 175 Ala Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr 180 185 190 Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe 195 200 205 Tyr Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala 210 215 220 Val Tyr Asp Tyr Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser Leu225 230 235 240Gln Gly Gly Pro His Asn His Gln Ile Ala Ala Leu Ala Val Ala Leu 245 250 255 Gln Gln Thr Met Thr Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Lys 260 265 270 Ala Asn Ala Val Ala Ile Gly Lys Tyr Leu Met Ser Lys Gly Tyr Lys 275 280 285 Met Val Thr Asp Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg 290 295 300 Pro Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Met Cys Asp Leu Cys305 310 315 320Ser Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu 325 330 335 Ala Pro Gly Gly Val Arg Ile Gly Thr Pro Ala Met Thr Ser Arg Gly 340 345 350 Leu Val Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu His Gln Ala 355 360 365Val Thr 370 Ile Cys Leu Asn Ile 375 Gln Lys Glu His Gly 380 Lys Leu Leu LysAsp Phe Ser Lys Gly Leu Val Asn Asn Lys Asp Ile Glu Asn Leu Lys385 390 395 400Leu Glu Val Glu Lys 405 Phe Ala Thr Ser Phe 410 Asp Met Pro Gly Phe 415 ThrLeu Asp Ser Met Lys Tyr Lys Glu
420
<210> 25<211> 1876<212> DKA<213> Oryza sativa
<220>
<221> CDS
<222> (70).. (1485)
<400> 25
gcgttctctc gccgccgcaa ccaccgccgc ctcgccgcag catcacgggc agccgccgcc 60
gccgccgcc atg gac tcc gtc gcg tcg tgg ggg ctg acc ccg ctc gcc gcg 111
Met Asp Ser Val Ala Ser Trp Gly Leu Thr Pro Leu Ala Ala1 5 10
gcc gac ccg ctc gtc cac gac ctc ctc gag cgg gag aag cgg cgg cag 159
Ala Asp Pro Leu Val His Asp Leu Leu Glu Arg Glu Lys Arg Arg Gln15 20 25 30
cgg age ggc ate gag ctc ate gcc tcg gag aac ttc acc tcc ttc gcc 207
Arg Ser Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala
35 40 45
gtc atg gag gcc ctc ggc tcc gcg ctc acc aac aag tac tcc gag ggg 255
Val Met Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly
50 55 60
atg ccc ggg gcg cgc tac tac ggc ggg aac gac gtc ate gac gag ate 303
Met Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Asp Val Ile Asp Glu Ile
65 70 75
gag aac ctg tgc cgc gac cgc gcc ctc gcc gcg ttc cgc ctc gac gcc 351
Glu Asn Leu Cys Arg Asp Arg Ala Leu Ala Ala Phe Arg Leu Asp Ala
80 85 90
gcg tcg tgg ggc gtc aac gtg cag ccc tac tcc ggc tcg ccg gcc aac 399
Ala Ser Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn95 100 105 110
ttc gcc gcc tac acg gcg ctc ctc aac ccg cac gac cgc ate atg ggg 447
Phe Ala Ala Tyr Thr Ala Leu Leu Asn Pro His Asp Arg Ile Met Gly
115 120 125
ctc gac ctc ccc tcc ggt ggc cac ctc acc cat ggc tac tac acc gcg 495
Leu Asp Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ala
130 135 140
ggc ggg aag aag ate tcc gcg acg tcg ate tac ttc gag age ctc ccc 543
Gly Gly Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro
145 150 155
tac aag gtg age gcc gcc acg ggg tac ate gac tac gag aag ctg gag 591
Tyr Lys Val Ser Ala Ala Thr Gly Tyr Ile Asp Tyr Glu Lys Leu Glu
160 165 170
gag aag gcg ctc gac ttc cgc ccc aag ctc ate ate tgc ggc ggc age 639
Glu Lys Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser175 180 185 190
gcg tac ccg agg gac tgg gac tac gcc aag ctc agg gcc gtc gcc gac 687
Ala Tyr Pro Arg Asp Trp Asp Tyr Ala Lys Leu Arg Ala Val Ala Asp
195 200 205
aag gtc ggg gcg ctg ctc ctc tgc gac atg gcg cac ate age ggc ctc 735
Lys Val Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu210 215 220gtc gcc gcg cag gaa gct gca aat cct ttt gag tac tgt gat gtg gtt 783
Val Ala Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val
225 230 235
acc acc acc acg cac aag tcc ctc cga gga cca aga gct ggc atg ate 831
Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile
240 245 250
ttc tac agg aag ggc cct aag cct ccc aag aag ggc cag cct gag ggt 879
Phe Tyr Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly255 260 265 270
gct gtc tat gac tac gag gac aag ate aac ttc gca gtg ttc ccg tca 927
Ala Val Tyr Asp Tyr Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser
275 280 285
ctg caa ggt ggt cct cac aac cac cag att gca gcc ctt gct gtt gct 975
Leu Gln Gly Gly Pro His Asn His Gln Ile Ala Ala Leu Ala Val Ala
290 295 300
ctg cag caa acc atg aca cct gga ttc aag gcc tac gca aag cag gtc1023
Leu Gln Gln Thr Met Thr Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val
305 310 315
aag gcc aac gct gtc gcc att ggc aag tat ctt atg age aag ggc tac1071
Lys Ala Asn Ala Val Ala Ile Gly Lys Tyr Leu Met Ser Lys Gly Tyr
320 325 330
aaa atg gtg act gat gga act gag aac cac ctt gtt ctc tgg gat ctt1119
Lys Met Val Thr Asp Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu335 340 345 350
cgc cct ctt ggc ttg act ggc aac aag gtt gag aag atg tgt gac ctt1167
Arg Pro Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Met Cys Asp Leu
355 360 365
tgc age att aca ctt aac aag aat gct gtc ttt ggt gac age agt gca1215
Cys Ser Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala
370 375 380
ttg gct cct ggc ggt gtc cgc att ggt act cct gcg atg aca tcc agg1263
Leu Ala Pro Gly Gly Val Arg Ile Gly Thr Pro Ala Met Thr Ser Arg
385 390 395
ggt ctt gtc gag aag gac ttt gag cag ate ggc gag ttc ctc cac cag1311
Gly Leu Val Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu His Gln
400 405 410
gcc gtg acc ate tgc ctc aac ate cag aag gag cac ggc aag ctc ctc1359
Ala Val Thr Ile Cys Leu Asn Ile Gln Lys Glu His Gly Lys Leu Leu415 420 425 430
aag gac ttc tcc aag ggc ctg gtg aac aac aag gac ate gag aac ctc1407
Lys Asp Phe Ser Lys Gly Leu Val Asn Asn Lys Asp Ile Glu Asn Leu
435 440 445
aag ctg gag gtc gag aag ttc gcc acc tcc ttc gac atg ccc ggc ttc1455
Lys Leu Glu Val Glu Lys Phe Ala Thr Ser Phe Asp Met Pro Gly Phe
450 455 460
acc ctc gac age atg aag tac aag gag taggaaaaca aaaacacaca1502
Thr Leu Asp Ser Met Lys Tyr Lys Glu
465 470
caaaccatgg tcctaccgcc gctaatcgtc gaccagctgt gctctcgtgg accgccgtcg1562
tcgtcatctt cttcctcggc acaagctggc cctgtgttac ggattttgtc tgcccatcga1622
gatgataggt ttcataaaac gctctctccc ccaccctgct gctgcctctg gtttggttgc1682
caacctcatc ccccatcggt ttttttcctc ctcttgtttc taatttctag gagctgtgcc1742
ttttggaatc atggaatgtc aagtatttgc caataatcaa tccgtttgat ttctgcctac1802
cttgtgtttt ctgtgggatt gctaaactat caaactgtgc gaagctacga aaaaaagaaa1862
tgctggaatt tttc1876
<210> 26
<211> 471
<212> PRT
<213> Oryza sativa
<400> 26 Met Asp Ser Val Ala Ser Trp Gly Leu Thr Pro Leu Ala Ala Ala Asp1 5 10 15 Pro Leu Val His Asp Leu Leu Glu Arg Glu Lys Arg Arg Gln Arg Ser 20 25 30 Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Met 35 40 45 Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro 50 55 60 Gly Ala Arg Tyr Tyr Gly Gly Asn Asp Val Ile Asp Glu Ile Glu Asn65 70 75 80Leu Cys Arg Asp Arg Ala Leu Ala Ala Phe Arg Leu Asp Ala Ala Ser 85 90 95 Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala 100 105 110 Ala Tyr Thr Ala Leu Leu Asn Pro His Asp Arg Ile Met Gly Leu Asp 115 120 125 Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ala Gly Gly 130 135 140 Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys145 150 155 160Val Ser Ala Ala Thr Gly Tyr Ile Asp Tyr Glu Lys Leu Glu Glu Lys 165 170 175 Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala Tyr 180 185 190 Pro Arg Asp Trp Asp Tyr Ala Lys Leu Arg Ala Val Ala Asp Lys Val 195 200 205 Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala 210 215 220 Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr Thr225 230 235 240Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr 245 250 255 Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala Val 260 265 270 Tyr Asp Tyr Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser Leu Gln 275 280 285 Gly Gly Pro His Asn His Gln Ile Ala Ala Leu Ala Val Ala Leu Gln 290 295 300 Gln Thr Met Thr Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Lys Ala305 310 315 320Asn Ala Val Ala Ile Gly Lys Tyr Leu Met Ser Lys Gly Tyr Lys Met 325 330 335 Val Thr Asp Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro 340 345 350 Leu Gly Leu 355 Thr Gly Asn Lys Val 360 Glu Lys Met Cys Asp 365 Leu Cys SerIle Thr 370 Leu Asn Lys Asn Ala 375 Val Phe Gly Asp Ser 380 Ser Ala Leu AlaPro Gly Gly Val Arg Ile Gly Thr Pro Ala Met Thr Ser Arg Gly Leu385 390 395 400Val Glu Lys Asp Phe 405 Glu Gln Ile Gly Glu 410 Phe Leu His Gln Ala 415 ValThr Ile Cys Leu Asn Ile Gln Lys Glu His Gly Lys Leu Leu Lys Asp 420 425 430 Phe Ser Lys 435 Gly Leu Val Asn Asn 440 Lys Asp Ile Glu Asn 445 Leu Lys LeuGlu Val 450 Glu Lys Phe Ala Thr 455 Ser Phe Asp Met Pro 460 Gly Phe Thr LeuAsp Ser Met Lys Tyr Lys Glu
465 470
<210> 27<211> 2422<212> DNA<213> Oryza sativa
<220>
<221> CDS
<222> (314)..(2116)<220>
<221> misc_feature
<222> (2368)..(2368)
<223> η is a, c, g, or t
<400> 27
accacacatc cccccccccc cttcccctcc tcaccttccc ttctccggtt ctcagattcc 60
acccaatccg ccgctgcgtc gcgtgtgctg ttcggcgaaa ttccaagccc caattcccca 120
catctcatgg ttctctctcc catcgcctcc gccgacgtcg accgcctcct ttgctgctgt 180
cgccggtgtt gttgctgtcg ccggtgttgt tgttgttgag ggggtaacgg tggtggtggt 240
ggtggtggtg aggggttaga ggggctaggg ttgcggattt gcggccaatt ggttggggga 300
tttcgaaggg gga atg gat ctc tcg cgg ccg gaa tcg tcg gac ctg tcg 349
Met Asp Leu Ser Arg Pro Glu Ser Ser Asp Leu Ser1 5 10
ctg ggt ttc cac tcg ctc ggc cac gcc cgc ggg cac gcg gtc acg ggg 397
Leu Gly Phe His Ser Leu Gly His Ala Arg Gly His Ala Val Thr Gly
15 20 25
ccg ctg cgg ctg ttc gat gac atg gag gac gcc aag ccg gag aag age 445
Pro Leu Arg Leu Phe Asp Asp Met Glu Asp Ala Lys Pro Glu Lys Ser
30 35 40
gtc ggt ggc ggc gga gga gga ggg gga gga gga ggc gag gag gag gat 493
Val Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Glu Glu Glu Asp45 50 55 60
ggg gag gaa ggg ggc gac cag cac ttc tcc ctc ctc ggc cac gcg ctc 541
Gly Glu Glu Gly Gly Asp Gln His Phe Ser Leu Leu Gly His Ala Leu
65 70 75
tgc gtc aag cgt cca cgc cgc gcg ctc tac gga ggc gga ggc gga ggc 589
\Cys Val Lys Arg Pro Arg Arg Ala Leu Tyr Gly Gly Gly Gly Gly Gly
80 85 90
ggg gca gga ggt gga gga gga gga gga ggg gag gcg tcc tcc tgc tcg 637
Gly Ala Gly Gly Gly Gly Gly Gly Gly Gly Glu Ala Ser Ser Cys Ser
95 100 105
tct tcc tcc tcg tcg ctg cac ccg gcg aag cgg cag gcg acg gcg gag 685
Ser Ser Ser Ser Ser Leu His Pro Ala Lys Arg Gln Ala Thr Ala Glu
110 115 120
cgc ggc gcg gat ctg gag gcc cgc cgc ggc gcc gtc cgc gcg tgg ggc 733
Arg Gly Ala Asp Leu Glu Ala Arg Arg Gly Ala Val Arg Ala Trp Gly125 130 135 140
aac cag gcg ctg gcg gag gcc gac ccg gac gtg cac gcg ctg atg gag 781
Asn Gln Ala Leu Ala Glu Ala Asp Pro Asp Val His Ala Leu Met Glu
145 150 155
ctc gag cgc gac cgc cag gtg cgc ggg ate gag ctg ate gcg tcg gag 829
Leu Glu Arg Asp Arg Gln Val Arg Gly Ile Glu Leu Ile Ala Ser Glu
160 165 170
aac ttc gtc tgc cgc gcg gtg ctc gag gcg ctc ggc age cac ctc acc 877
Asn Phe Val Cys Arg Ala Val Leu Glu Ala Leu Gly Ser His Leu Thr
175 180 185
aac aag tac tct gag ggc cat ccc ggg gct cgg tac tat ggc ggg aac 925
Asn Lys Tyr Ser Glu Gly His Pro Gly Ala Arg Tyr Tyr Gly Gly Asn
190 195 200
cag cac ate gac ggc ate gag cgc ctc tgc cat gag cgc gcc ctc gcc 973
Gln His Ile Asp Gly Ile Glu Arg Leu Cys His Glu Arg Ala Leu Ala205 210 215 220
gcc ttc ggt ctc gac ccc gcc tgc tgg ggg gtc aac gtc cag cca tac1021
Ala Phe Gly Leu Asp Pro Ala Cys Trp Gly Val Asn Val Gln Pro Tyr
225 230 235
tcc tgc acc tct gca aac cta gct gtt tac aca ggt ctc ctc ctg ccc1069
Ser Cys Thr Ser Ala Asn Leu Ala Val Tyr Thr Gly Leu Leu Leu Pro
240 245 250
aag gac cgt ate atg ggg ctc gag ccg cct tcc ggt ggc cat gtc age1117
Lys Asp Arg Ile Met Gly Leu Glu Pro Pro Ser Gly Gly His Val Ser
255 260 265
cac ggg tac tac aca cca agt ggt aag aag gtg tct gga gca tcc ata1165
His Gly Tyr Tyr Thr Pro Ser Gly Lys Lys Val Ser Gly Ala Ser Ile
270 275 280
ttc ttc gag age ttg tcg tac aag gtg aat ccg cag act ggg tat att1213
Phe Phe Glu Ser Leu Ser Tyr Lys Val Asn Pro Gln Thr Gly Tyr Ile285 290 295 300
gat tac gac aag ctt gag gag cgg gca atg gat ttc cac cct aag att1261
Asp Tyr Asp Lys Leu Glu Glu Arg Ala Met Asp Phe His Pro Lys Ile
305 310 315
ctc ata tgt ggt ggg age tca tac ccc agg gag tgg gat ttt gca cgg1309
Leu Ile Cys Gly Gly Ser Ser Tyr Pro Arg Glu Trp Asp Phe Ala Arg
320 325 330
atg agg ctc att gct gat aag tgc ggt gcg gtg ctc atg tgc gat atg1357
Met Arg Leu Ile Ala Asp Lys Cys Gly Ala Val Leu Met Cys Asp Met
335 340 345
gca cat ate age ggg ctt gtt gcg gcc aag gaa tgc cgt agt ccc ttt1405
Ala His Ile Ser Gly Leu Val Ala Ala Lys Glu Cys Arg Ser Pro Phe
350 355 360
gat tac tgt gat gtg gtt aca tca act act cac aag aat ctg aga ggt1453
Asp Tyr Cys Asp Val Val Thr Ser Thr Thr His Lys Asn Leu Arg Gly365 370 375 380
cct aga ggt ggt ata ata ttt ttc agg aga ggg aaa aac tta agg agg1501
Pro Arg Gly Gly Ile Ile Phe Phe Arg Arg Gly Lys Asn Leu Arg Arg
385 390 395
cgt act gga tct ttt tct caa gcg gat gag aat gat tat gac ttc gag1549
Arg Thr Gly Ser Phe Ser Gln Ala Asp Glu Asn Asp Tyr Asp Phe Glu
400 405 410
gac agg ata aat ttt gca gtt cca cgc tca agg caa gga gga ccc cat1597
Asp Arg Ile Asn Phe Ala Val Pro Arg Ser Arg Gln Gly Gly Pro His
415 420 425
aat aat cat att gca gcc ttg gcg ata act ctg aag caa gta gca aca1645
Asn Asn His Ile Ala Ala Leu Ala Ile Thr Leu Lys Gln Val Ala Thr
430 435 440
cct gaa tac aaa gca tac ate ata caa gtt aag aaa aat gcc caa gct1693
Pro Glu Tyr Lys Ala Tyr Ile Ile Gln Val Lys Lys Asn Ala Gln Ala445 450 455 460
ttg gca tca gcc tta ctc aga aga aaa tgc aga ttg gtt act ggt ggc1741
Leu Ala Ser Ala Leu Leu Arg Arg Lys Cys Arg Leu Val Thr Gly Gly
465 470 475
acc gat aac cac ttg gta ctt tgg gac ctc aga aat tta ggc ttg act1789
Thr Asp Asn His Leu Val Leu Trp Asp Leu Arg Asn Leu Gly Leu Thr
480 485 490
gga aag aac ttt gag aag gtc tgt gag gca tgc cac ate tcc ata aat1837
Gly Lys Asn Phe Glu Lys Val Cys Glu Ala Cys His Ile Ser Ile Asn
495 500 505
aag atg ccg ata tat ggg gat aat ggc tca ata tct cct ggg ggt gtt1885
Lys Met Pro Ile Tyr Gly Asp Asn Gly Ser Ile Ser Pro Gly Gly Val
510 ^ 515 520
cgg att gga aca cct gca atg act act aga ggt tgc ttg gaa gat gac1933
Arg Ile Gly Thr Pro Ala Met Thr Thr Arg Gly Cys Leu Glu Asp Asp525 530 535 540
ttt gag gtg ate gca gat ttc ctc ate aga gcc acc caa ata gct agt1981
Phe Glu Val Ile Ala Asp Phe Leu Ile Arg Ala Thr Gln Ile Ala Ser
545 550 555
aat ctt atg aaa gaa cat gga aaa atg cag aag gaa ttc ctg aga ggc2029
Asn Leu Met Lys Glu His Gly Lys Met Gln Lys Glu Phe Leu Arg Gly
560 565 570
cta cag aac aat aaa gat ate ata gaa ctc cgt aac cag gtt gag aat2077
Leu Gln Asn Asn Lys Asp Ile Ile Glu Leu Arg Asn Gln Val Glu Asn
575 580 585
ttt gca tcg cag ttt gca atg cca ggt ttt gat gta tgagtgtgca2123
Phe Ala Ser Gln Phe Ala Met Pro Gly Phe Asp Val590 595 600
tgtatgtgta catatcttgg tgaggttgtc cagattcatc aggaattagc aaccgtttca2183
ctctttgccg aagtgtttct ttcaacagga gcagaatagg gaaagatcgt tttttctttt2243
gttggaaatt ggtcttgact gaagctgtac atgcatactt ctgagttgtc atttatgtaa2303
cgtattgaac cttcatataa cggctttgta taggagataa ttttcctcca tgcgtaagga2363
tcttnaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa2422
<210> 28
<211> 600
<212> PRT
<213> Oryza sativa
<400> 28
Met Asp Leu Ser Arg Pro Glu Ser Ser Asp Leu Ser Leu Gly Phe His
1 5 10 15 Ser Leu Gly His Ala Arg Gly His Ala Val Thr Gly Pro Leu Arg Leu 20 25 30 Phe Asp Asp Met Glu Asp Ala Lys Pro Glu Lys Ser Val Gly Gly Gly 35 40 45 Gly Gly Gly Gly Gly Gly Gly Gly Glu Glu Glu Asp Gly Glu Glu Gly 50 55 60 Gly Asp Gln His Phe Ser Leu Leu Gly His Ala Leu Cys Val Lys Arg65 70 75 80Pro Arg Arg Ala Leu Tyr Gly Gly Gly Gly Gly Gly Gly Ala Gly Gly 85 90 95 Gly Gly Gly Gly 100 Gly Gly Glu Ala Ser 105 Ser Cys Ser Ser Ser 110 Ser SerSer Leu His Pro Ala Lys Arg Gln Ala Thr Ala Glu Arg Gly Ala Asp 115 120 125 Leu Glu 130 Ala Arg Arg Gly Ala 135 Val Arg Ala Trp Gly 140 Asn Gln Ala LeuAla Glu Ala Asp Pro Asp Val His Ala Leu Met Glu Leu Glu Arg Asp145 150 155 160Arg Gln Val Arg Gly 165 Ile Glu -Leu Ile Ala 170 Ser Glu Asn Phe Val 175 CysArg Ala Val Leu 180 Glu Ala Leu Gly Ser 185 His Leu Thr Asn Lys 190 Tyr SerGlu Gly His Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Gln His Ile Asp 195 200 205 Gly Ile Glu Arg Leu Cys His Glu Arg Ala Leu Ala Ala Phe Gly Leu 210 215 220 Asp Pro Ala Cys Trp Gly Val Asn Val Gln Pro Tyr Ser Cys Thr Ser225 230 235 240Ala Asn Leu Ala Val Tyr Thr Gly Leu Leu Leu Pro Lys Asp Arg Ile 245 250 255 Met Gly Leu Glu Pro Pro Ser Gly Gly His Val Ser His Gly Tyr Tyr 260 265 270 Thr Pro Ser 275 Gly Lys Lys Val Ser 280 Gly Ala Ser Ile Phe 285 Phe Glu SerLeu Ser 290 Tyr Lys Val Asn Pro 295 Gln Thr Gly Tyr Ile 300 Asp Tyr Asp LysLeu Glu Glu Arg Ala Met Asp Phe His Pro Lys Ile Leu Ile Cys Gly305 310 315 320Gly Ser Ser Tyr Pro Arg Glu Trp Asp Phe Ala Arg Met Arg Leu Ile 325 330 335 Ala Asp Lys Cys Gly Ala Val Leu Met Cys Asp Met Ala His Ile Ser 340 345 350 Gly Leu Val Ala Ala Lys Glu Cys Arg Ser Pro Phe Asp Tyr Cys Asp
\355 360 365
Val Val Thr Ser Thr Thr His Lys Asn Leu Arg Gly Pro Arg Gly Gly
370 375 380
Ile Ile Phe Phe Arg Arg Gly Lys Asn Leu Arg Arg Arg Thr Gly Ser385 390 395 400
Phe Ser Gln Ala Asp Glu Asn Asp Tyr Asp Phe Glu Asp Arg Ile Asn
405 410 415
Phe Ala Val Pro Arg Ser Arg Gln Gly Gly Pro His Asn Asn His Ile
420 425 430
Ala Ala Leu Ala Ile Thr Leu Lys Gln Val Ala Thr Pro Glu Tyr Lys
435 440 445
Ala Tyr Ile Ile Gln Val Lys Lys Asn Ala Gln Ala Leu Ala Ser Ala
450 455 460
Leu Leu Arg Arg Lys Cys Arg Leu Val Thr Gly Gly Thr Asp Asn His465 470 475 480
Leu Val Leu Trp Asp Leu Arg Asn Leu Gly Leu Thr Gly Lys Asn Phe
485 490 495
Glu Lys Val Cys Glu Ala Cys His Ile Ser Ile Asn Lys Met Pro Ile
500 505 510
Tyr Gly Asp Asn Gly Ser Ile Ser Pro Gly Gly Val Arg Ile Gly Thr
515 520 525
Pro Ala Met Thr Thr Arg Gly Cys Leu Glu Asp Asp Phe Glu Val Ile
530 535 540
Ala Asp Phe Leu Ile Arg Ala Thr Gln Ile Ala Ser Asn Leu Met Lys545 550 555 560
Glu His Gly Lys Met Gln Lys Glu Phe Leu Arg Gly Leu Gln Asn Asn
565 570 575
Lys Asp Ile Ile Glu Leu Arg Asn Gln Val Glu Asn Phe Ala Ser Gln
580 585 590
Phe Ala Met Pro Gly Phe Asp Val595 600
<210> 29
<211> 1944
<212> DNA
<213> Oryza sativa
<220>
<221> CDS
<222> (99)..(1694)
<400> 29
cccacgcgtc cgaggctccc ctctccactc cccttccctc acccgcgccg catcgcagcc 60
gctatccgcg tgggcattcc gccgagcacc tggcgcgc atg gcg atg gct tcg cac 116
Met Ala Met Ala Ser His1 5
cac ctc gcc cag ccg ccc acg cgc gcg gct ctc tcc tcg cgc ccc acc 164
His Leu Ala Gln Pro Pro Thr Arg Ala Ala Leu Ser Ser Arg Pro Thr
10 15 20
tac ccg ctc tcc age cat cac cac tcc tcc cgt ctc cag ctc ccg ctc 212
Tyr Pro Leu Ser Ser His His His Ser Ser Arg Leu Gln Leu Pro Leu
25 30 35
gtc age ggg gcg cgg cgc age agg ctg tcc ccc gcg gtg gcg acg tcc 260
Val Ser Gly Ala Arg Arg Ser Arg Leu Ser Pro Ala Val Ala Thr Ser
40 45 50
ccg gtc gcc gcc cca gcg atg gac gcc gtg gcc gac tgg ggg ctg acc 308
Pro Val Ala Ala Pro Ala Met Asp Ala Val Ala Asp Trp Gly Leu Thr55 60 65 70
act ctg gag gag gct gac ccg gag gtg tac gac ctc gtc gag cgc gag 356
Thr Leu Glu Glu Ala Asp Pro Glu Val Tyr Asp Leu Val Glu Arg Glu
75 80 85
aag cgg cgg cag cgc gcg ggc gtc gag ctc ate gcg tcg gag aac ttc 404Lys Arg Arg Gln Arg Ala Gly Val Glu Leu Ile Ala Ser Glu Asn Phe
90 95 100
acc tcg ctc gcc gtc atg gag gcg ctg ggc tcg ccg ctc acc aac aag 452
Thr Ser Leu Ala Val Met Glu Ala Leu Gly Ser Pro Leu Thr Asn Lys
105 110 115
tac tcc gag ggc atg ccg ggg tcc cgc tac tac gga ggc aac gag gtc 500
Tyr Ser Glu Gly Met Pro Gly Ser Arg Tyr Tyr Gly Gly Asn Glu Val
120 125 130
ate gac gag gtg gag gag ctc tgc cgc gcc cgc gcg ctc gcc gcc ttc 548
Ile Asp Glu Val Glu Glu Leu Cys Arg Ala Arg Ala Leu Ala Ala Phe135 140 145 150
cac ctc gac ccc gag gcc tgg ggc gtc aac gtg cag ccc tac tcc ggc 596
His Leu Asp Pro Glu Ala Trp Gly Val Asn Val Gln Pro Tyr Ser Gly
155 160 165
tcg ccg gcg aac ttc gcc gcc tac acc ggg ctg ctc caa ccc cac gag 644
Ser Pro Ala Asn Phe Ala Ala Tyr Thr Gly Leu Leu Gln Pro His Glu
170 175 180
cgg ate atg ggg ctc gat ttg ccg tcc ggc ggc cac ctc acg cac ggc 692
Arg Ile Met Gly Leu Asp Leu Pro Ser Gly Gly His Leu Thr His Gly
185 190 195
tac tac acc gcc ggc ggc aaa aag ate tcc gcc acg tcc ate tac ttc 740
Tyr Tyr Thr Ala Gly Gly Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe
200 205 210
gag age ctg ccg tac aag gtg age tcc gag aca gga tac gtc gat tat 788
Glu Ser Leu Pro Tyr Lys Val Ser Ser Glu Thr Gly Tyr Val Asp Tyr215 220 225 230
gat aag ctg gag gag aag gcc atg gat ttt cgg ccc aag ctc ate ate 836
Asp Lys Leu Glu Glu Lys Ala Met Asp Phe Arg Pro Lys Leu Ile Ile
235 240 245
tgc ggc ggg age gcg tac ccg cgg gat tgg gat tac gcc agg ttc agg 884
Cys Gly Gly Ser Ala Tyr Pro Arg Asp Trp Asp Tyr Ala Arg Phe Arg
250 255 260
gcc ate gcg gat aag tgc ggc gcc atg ttg ctc tgc gac atg gct cac 932
Ala Ile Ala Asp Lys Cys Gly Ala Met Leu Leu Cys Asp Met Ala His
265 270 275
ate agt ggc cta gtt gcc gcg cag gag gct gea aat cct ttt caa tat 980
Ile Ser Gly Leu Val Ala Ala Gln Glu Ala Ala Asn Pro Phe Gln Tyr
280 285 290
tet gat gtg gtt acc acc acc acc cac aag agt ctc cga ggg cca aga1028
Ser Asp Val Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg295 300 305 310
tet ggt atg ate ttc tac agg aag ggc ctg aag cct ccc aag aaa ggc1076
Ser Gly Met Ile Phe Tyr Arg Lys Gly Leu Lys Pro Pro Lys Lys Gly
315 320 325
cag cct gag ggc gct ctg tat gac tac gag gac agg ate aac ttc gea1124
Gln Pro Glu Gly Ala Leu Tyr Asp Tyr Glu Asp Arg Ile Asn Phe Ala
330 335 340
gtg ttt ccg tcg ctc caa ggg ggc cct cac aac cac caa att gct gcg1172
Val Phe Pro Ser Leu Gln Gly Gly Pro His Asn His Gln Ile Ala Ala
345 350 355
cta gcg gtt ggt ttg aag cag act atg tca cct gga ttc aag tet tat1220
Leu Ala Val Gly Leu Lys Gln Thr Met Ser Pro Gly Phe Lys Ser Tyr
360 365 370
att aag cag gtc aag gcc aat gct gtt gcc ctt ggt aac cat ttg atg1268
Ile Lys Gln Val Lys Ala Asn Ala Val Ala Leu Gly Asn His Leu Met375 380 385 390
agt aag ggc tac aaa ttg gtt act gac gga aca gag aac cat ctt gtt1316 Ser Lys Gly Tyr Lys 395 Leu Val Thr Asp Gly 400 Thr Glu Asn His Leu 405 Valctc tgg gat ctg cgc cct Ctt ggc ttg act ggt aac aaa gtt gag aag1364 Leu Trp Asp Leu Arg Pro Leu Gly Leu Thr Gly Asn Lys Val Glu Lys 410 415 420 gtc tgt gat ttg tgc age att aca ctg aac aaa aat gct gtc ttt ggg1412 Val Cys Asp 425 Leu Cys Ser Ile Thr 430 Leu Asn Lys Asn Ala 435 Val Phe Glygat age agt gea atg tca CCt ggt ggt gtc cgc att ggt aca cct gcc1460 Asp Ser Ser Ala Met Ser Pro Gly Gly Val Arg Ile Gly Thr Pro Ala440 445 450 atg aca tca agg ggt ttg gta gag gag gac ttt gta cag ate gcc gag1508 Met Thr Ser Arg Gly Leu Val Glu Glu Asp Phe Val Gln Ile Ala Glu455 460 465 470ttc ctt cac cag gea gtg acc ate tgc ttg gat gtt cag aag gag cgt1556 Phe Leu His Gln Ala Val Thr Ile Cys Leu Asp Val Gln Lys Glu Arg 475 480 485 ggc aag Ctt CtC aag tac ttc aac gag ggc ctg gag aac aac aag gac1604 Gly Lys Leu Leu 490 Lys Tyr Phe Asn Glu 495 Gly Leu Glu Asn Asn 500 Lys Aspatt gag gac ctc agg gcg gag gtg gag aag ttt gcc act tca ttc gag1652 Ile Glu Asp Leu Arg Ala Glu Val Glu Lys Phe Ala Thr Ser Phe Glu 505 510 515 atg cct ggc ttc agg gta tcc gac atg aag tac aag gat taggcggcat 1701 Met Pro Gly Phe Arg Val Ser Asp Met Lys Tyr Lys Asp
520 525 530
cgtgcacatc gtcctctttc tcttgccctg aactttggcg cccttgaaac ctgattactg1761
tggcgtgaat cgtggtgtat ggattttgct gaactctggg tagtctctaa ccgctttcgt1821
ctacctgagc tggttgtgcc attcagtcgt taaatgctgg aattgtaatg atgtggtata1881
ataataataa ctagcatggt ggtccgcgca gattgcgcgg ctagcatcat tatattttct1941
ctc1944
<210> 30
<211> 531
<212> PRT
<213> Oryza sativa
<400> 30
Met Ala Met Ala Ser His His1 5
Leu Ser Ser Arg Pro Thr Tyr20
Arg Leu Gln Leu Pro Leu Val35
Leu Ala Gln Pro Pro Thr Arg Ala Ala
10 15
Pro Leu Ser Ser His His His Ser Ser
25 30
Ser Gly Ala Arg Arg Ser Arg Leu Ser40 45Pro Ala Val Ala Thr Ser Pro Val Ala Ala Pro Ala Met Asp Ala Val
50 55 60
Ala Asp Trp Gly Leu Thr Thr Leu Glu Glu Ala Asp Pro Glu Val Tyr65 70 75 80
Asp Leu Val Glu Arg Glu Lys Arg Arg Gln Arg Ala Gly Val Glu Leu
85 90 95
Ile Ala Ser Glu Asn Phe Thr Ser Leu Ala Val Met Glu Ala Leu Gly
100 105 110
Ser Pro Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro Gly Ser Arg Tyr
115 120 125
Tyr Gly Gly Asn Glu Val Ile Asp Glu Val Glu Glu Leu Cys Arg Ala
130 135 140
Arg Ala Leu Ala Ala Phe His Leu Asp Pro Glu Ala Trp Gly Val Asn145 150 155 160
Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala Ala Tyr Thr Gly
165 170 175
Leu Leu Gln Pro His Glu Arg Ile Met Gly Leu Asp Leu Pro Ser Gly
180 185 190
Gly His Leu Thr His Gly Tyr Tyr Thr Ala Gly Gly Lys Lys Ile Ser
195 200 205
Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys Val Ser Ser Glu
210 215 220
Thr Gly Tyr Val Asp Tyr Asp Lys Leu Glu Glu Lys Ala Met Asp Phe225 230 235 240
Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala Tyr Pro Arg Asp Trp
245 250 255
Asp Tyr Ala Arg Phe Arg Ala Ile Ala Asp Lys Cys Gly Ala Met Leu
260 265 270
Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Gln Glu Ala
275 280 285
Ala Asn Pro Phe Gln Tyr Ser Asp Val Val Thr Thr Thr Thr His Lys
290 295 300
Ser Leu Arg Gly Pro Arg Ser Gly Met Ile Phe Tyr Arg Lys Gly Leu305 310 315 320
Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala Leu Tyr Asp Tyr Glu
325 330 335
Asp Arg Ile Asn Phe Ala Val Phe Pro Ser Leu Gln Gly Gly Pro His
340 345 350
Asn His Gln Ile Ala Ala Leu Ala Val Gly Leu Lys Gln Thr Met Ser
355 360 365
Pro Gly Phe Lys Ser Tyr Ile Lys Gln Val Lys Ala Asn Ala Val Ala
370 375 380
Leu Gly Asn His Leu Met Ser Lys Gly Tyr Lys Leu Val Thr Asp Gly385 390 395 400
Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro Leu Gly Leu Thr
405 410 415
Gly Asn Lys Val Glu Lys Val Cys Asp Leu Cys Ser Ile Thr Leu Asn
420 425 430
Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Met Ser Pro Gly Gly Val
435 440 445
Arg Ile Gly Thr Pro Ala Met Thr Ser Arg Gly Leu Val Glu Glu Asp
450 455 460
Phe Val Gln Ile Ala Glu Phe Leu His Gln Ala Val Thr Ile Cys Leu465 470 475 480
Asp Val Gln Lys Glu Arg Gly Lys Leu Leu Lys Tyr Phe Asn Glu Gly
485 490 495
Leu Glu Asn Asn Lys Asp Ile Glu Asp Leu Arg Ala Glu Val Glu Lys
500 505 510
Phe Ala Thr Ser Phe Glu Met Pro Gly Phe Arg Val Ser Asp Met Lys
515 520 525
Tyr Lys Asp530<210> 31<211> 1750<212> DKA
<213> Sorghum bicolor
<220>
<221> CDS
<222> (58).. (1473)
<400> 31
gccccccgcc ccctcctcgc ctccgccagt cctgtcaacc cctcccacgc cgccgcc 57
atg gac ccc gtc gcc aca tgg ggg cta acc ccg ctc gcc ggc gcc gac 105
Met Asp Pro Val Ala Thr Trp Gly Leu Thr Pro Leu Ala Gly Ala Asp1 5 10 15
ccg gag ate tac gac ctc ctg gag cgc gag aag cgg cgc cag cgt cgc 153
Pro Glu Ile Tyr Asp Leu Leu Glu Arg Glu Lys Arg Arg Gln Arg Arg
20 25 30
ggc ate gag ctc ate gcc tcc gag aac ttc acc tcc ttc gcc gtc atg 201
Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Met
35 40 45
gag gea ctc ggc tet ccg ctc acc aac aag tac tet gag ggc atg ccc 249
Glu Ala Leu Gly Ser Pro Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro
50 55 60
ggt gcc cgc tac tac ggc ggc aac gac gtc ate gac gag ate gag aac 297
Gly Ala Arg Tyr Tyr Gly Gly Asn Asp Val Ile Asp Glu Ile Glu Asn65 70 75 80
ctc tgc cgg tca cgc gcg ctc gct gcc ttc cgc ctc gac gcc gcg ttc 345
Leu Cys Arg Ser Arg Ala Leu Ala Ala Phe Arg Leu Asp Ala Ala Phe
85 90 95
fcgg ggc gtc aac gtg cag ccc tac tcg ggc tcc ccc gcc aac ttc gcc 393
Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala
100 105 110
gct tac acc gcg ctg ctc aac ccg cac gac cgg ate atg ggg ctt gac 441
Ala Tyr Thr Ala Leu Leu Asn Pro His Asp Arg Ile Met Gly Leu Asp
115 120 125
ctt ccc tcc ggc gga cac ctc act cac ggc tac tat act gcc ggc ggg 489
Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ala Gly Gly
130 135 140
aag aag ate tcc gcc acc tcg ate tac ttt gag age ctg ccg tac aaa 537
Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys145 150 155 160
gtg age gcc acc acc ggg tac ate gac tac gag aaa ctc gag gag aag 585
Val Ser Ala Thr Thr Gly Tyr Ile Asp Tyr Glu Lys Leu Glu Glu Lys
165 170 175
gea ctt gac ttc cgc ccc aag ctc ate ate tgc ggt ggc age gcg tac 633
Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala Tyr
180 185 190
ccg agg gac tgg gac tac tcc agg ctc agg gcc ate gcc gac aag gtc 681
Pro Arg Asp Trp Asp Tyr Ser Arg Leu Arg Ala Ile Ala Asp Lys Val
195 200 205
ggg gcc ctg ctg ctc tgc gac atg gcg cac ate age gga ctc gtc gcc 729
Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala
210 215 220
gcg gag gaa gct gea aat cct ttt gaa tat tgt gat gtg gtt acc act 777
Ala Glu Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr Thr225 230 235 240
acc aca cac aag tet ctt aga ggg cca agg gct ggc atg ate ttc tac 825
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr
245 250 255
agg aaa ggc cct aag ccc ccc aag aag ggc cag cct gag ggt gct gtg 873
Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala Val260 265 270tat gat tat gaa gac aag ate aac ttt gct gtg ttc cca tet ctc caa 921
Tyr Asp Tyr Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser Leu Gln
275 280 285
ggt ggc cct cac aac cac cag att gct gea ctt gct gtt gct ctg cag 969
Gly Gly Pro His Asn His Gln Ile Ala Ala Leu Ala Val Ala Leu Gln
290 295 300
caa act atg aca cct ggc ttc aag gcc tat gea aag caa gtg aag gcc1017
Gln Thr Met Thr Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Lys Ala305 310 315 320
aat gct gtt gea att gga aac tat ctc atg age aag ggc tac aag atg1065
Asn Ala Val Ala Ile Gly Asn Tyr Leu Met Ser Lys Gly Tyr Lys Met
325 330 335
gtg act gat gga act gag aac cac ctt gtt ctc tgg gat ctc cgc cct1113
Val Thr Asp Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro
340 345 350
ctt ggc ttg act gga aac aag gtt gaa aaa ctc tgt gac ctt tgc cac1161
Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys His
355 360 365
ate aca ttg aac aag aat gct gtc ttt ggt gac age agt gea ttg gct1209
Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ala
370 375 380
ccg ggt ggt gtc cgc att ggt gcg cca gea atg acc tcg agg ggt cta1257
Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly Leu385 390 395 400
gtg gag aag gac ttt gag cag att gga gag ttc ctc cac cag gcg gtg1305
Val Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu His Gln Ala Val
405 410 415
acc ate tgc ctg aac att cag aag gag tac ggc aag ctc ctc aag gac1353
Thr Ile Cys Leu Asn Ile Gln Lys Glu Tyr Gly Lys Leu Leu Lys Asp
420 425 430
ttc aac aag ggc ctg ttg aac aac aag gac att gag aac ctc aag acc1401
Phe Asn Lys Gly Leu Leu Asn Asn Lys Asp Ile Glu Asn Leu Lys Thr
435 440 445
cag gtg gag aag ttc gcc gac tet ttc gac atg cct ggg ttc acg ctt1449
Gln Val Glu Lys Phe Ala Asp Ser Phe Asp Met Pro Gly Phe Thr Leu
450 455 460
gag age atg aag tac aag gag tagatgtctc ccgtgtataa caaggccctc1500
Glu Ser Met Lys Tyr Lys Glu465 470
ttgtaccaat gtttttcttg gccatggcgg agggtgccat ggcactgcac tgccacactt1560
aaggtgatga tggcttatgg attttgtcta caacgtcagc agtataggct cacaagtgcc1620
ccctgccctc tggtttggtc gccttcggtt tatcaggttt tcctttggta cttgttcgca1680
gggagtcatg aaaatgtcaa tcaggtgttt gccaataata attccgtggt ttcagccagc1740
agcttttttt1750
<210> 32<211> 471<212> PRT
<213> Sorghiam bicolor<400> 32
Met Asp Pro Val Ala Thr Trp Gly Leu Thr Pro Leu Ala Gly Ala Asp1 5 10 15
Pro Glu Ile Tyr Asp Leu Leu Glu Arg Glu Lys Arg Arg Gln Arg Arg
20 25 30
Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Met
35 40 45
Glu Ala Leu Gly Ser Pro Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro
50 55 60
Gly Ala Arg Tyr Tyr Gly Gly Asn Asp Val Ile Asp Glu Ile Glu Asn65 70 75 80
Leu Cys Arg Ser Arg Ala Leu Ala Ala Phe Arg Leu Asp Ala Ala Phe
85 90 95
Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala
100 105 110
Ala Tyr Thr Ala Leu Leu Asn Pro His Asp Arg Ile Met Gly Leu Asp
115 120 125
Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ala Gly Gly
130 135 140
Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys145 150 155 160
Val Ser Ala Thr Thr Gly Tyr Ile Asp Tyr Glu Lys Leu Glu Glu Lys
165 170 175
Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala Tyr
180 185 190
Pro Arg Asp Trp Asp Tyr Ser Arg Leu Arg Ala Ile Ala Asp Lys Val
195 200 205
Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala
210 215 220
Ala Glu Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr Thr225 230 235 240
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr
245 250 255
Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala Val
260 265 270
Tyr Asp Tyr Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser Leu Gln
275 280 285
Gly Gly Pro His Asn His Gln Ile Ala Ala Leu Ala Val Ala Leu Gln
290 295 300
Gln Thr Met Thr Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Lys Ala305 310 315 320
Asn Ala Val Ala Ile Gly Asn Tyr Leu Met Ser Lys Gly Tyr Lys Met
325 330 335
Val Thr Asp Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro
340 345 350
Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys His
355 360 365
Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ala
370 375 380
Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly Leu385 390 395 400
Val Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu His Gln Ala Val
405 410 415
Thr Ile Cys Leu Asn Ile Gln Lys Glu Tyr Gly Lys Leu Leu Lys Asp420 425 430Phe Asn Lys Gly Leu Leu Asn Asn Lys Asp Ile Glu Asn Leu Lys Thr
435 440 445
Gln Val Glu Lys Phe Ala Asp Ser Phe Asp Met Pro Gly Phe Thr Leu
450 455 460
Glu Ser Met Lys Tyr Lys Glu465 470
<210> 33<211> 2144<212> DNA<213> Zea mays
<220><221> CDS
<222> (214)..(1755)<400> 33
cattgggacc tcgagccggc ggggactggt ctccatagtg taccaaaccc acgaggccac 60
aagcacggga ctggcatata ttatccatgt aaataaaata aagtatataa ataaccccat 120
aaaaagctag gacgggacta cctcccaaac tcgcgagcga gtcgaggctc caaccccggc 180
acatcacagg aggaggagga cgacgcgccc acc atg gcc atg gcg acg gcc ctc 234
Met Ala Met Ala Thr Ala Leu1 5
cgc aag ctc tcc gcc aac gct ctg cgc cgc cag ccg ctc tcc cgc ate 282
Arg Lys Leu Ser Ala Asn Ala Leu Arg Arg Gln Pro Leu Ser Arg Ile
10 15 20
acg ccg ctc tac tac atg gcg tcc ctt ccg gcg acg gag gag aga tcc 330
Thr Pro Leu Tyr Tyr Met Ala Ser Leu Pro Ala Thr Glu Glu Arg Ser
25 30 35
gga ate acc tgg act aag cag ttg aac gcg ccg ctg gaa gag gtc gac 378
Gly Ile Thr Trp Thr Lys Gln Leu Asn Ala Pro Leu Glu Glu Val Asp40 45 50 55
ccc gag att gct gac ate ate gag cac gag aag gcc cgc caa tgg aag 426
Pro Glu Ile Ala Asp Ile Ile Glu His Glu Lys Ala Arg Gln Trp Lys
60 65 70
ggt ctg gag ctc ate ccg tcg gag aat ttc acg tcg gtg tca gtg atg 474
Gly Leu Glu Leu Ile Pro Ser Glu Asn Phe Thr Ser Val Ser Val Met
75 80 85
cag gea gtg ggt tcc gtc atg acc aac aag tac age gag ggg tac cct 522
Gln Ala Val Gly Ser Val Met Thr Asn Lys Tyr Ser Glu Gly Tyr Pro
90 95 100
ggc gea aga tac tac ggg gga aat gag ttt att gat atg gea gag tcc 570
Gly Ala Arg Tyr Tyr Gly Gly Asn Glu Phe Ile Asp Met Ala Glu Ser
105 110 115
ttg tgt cag aaa cgt gct ttg gag gct ttc cgt ttg gac ccg gcg aaa 618
Leu Cys Gln Lys Arg Ala Leu Glu Ala Phe Arg Leu Asp Pro Ala Lys120 125 130 135
tgg gga gtg aat gtg caa cct cta tcc ggt tcg ccc gcc aac ttc cat 666
Trp Gly Val Asn Val Gln Pro Leu Ser Gly Ser Pro Ala Asn Phe His
140 145 150
gta tac act gea ctc ttg aag cca cat gaa agg ate atg gct ttg gat 714
Val Tyr Thr Ala Leu Leu Lys Pro His Glu Arg Ile Met Ala Leu Asp
155 160 165
ctt cct cac ggt gga cat ctt tet cat ggt tac cag act gac act aag 762
Leu Pro His Gly Gly His Leu Ser His Gly Tyr Gln Thr Asp Thr Lys
170 175 180
aag ata tet gea act tca ata ttt ttt gag aca atg cct tac aga ttg 810
Lys Ile Ser Ala Thr Ser Ile Phe Phe Glu Thr Met Pro Tyr Arg Leu
185 190 195
gat gaa age act gga ttg att gat tac gat cag ttg gag aaa age gct 858Asp Glu Ser Thr Gly Leu Ile Asp Tyr Asp Gln Leu Glu Lys Ser Ala200 205 210 215gtt ctt ttt agg cca aag ttg ate att gct ggt gca agt gca tat gctVal Leu Phe Arg Pro Lys Leu Ile Ile Ala Gly Ala Ser Ala Tyr Ala 220 225 230 cgg cta tat gat tat gac cgt atg cgg aag ata tgc aac aag cag aagArg Leu Tyr Asp Tyr Asp Arg Met Arg Lys Ile Cys Asn Lys Gln Lys 235 240 245 gca ata Ctt cta gca gac atg gca cat att agt ggg Ctt gtt gca gct1002 Ala Ile Leu Leu Ala Asp Met Ala His Ile Ser Gly Leu Val Ala Ala 250 255 260 ggt gtt gtt cca tet CCt ttt gat tat gca gat gta gtg act acc act1050 Gly Val Val Pro Ser Pro Phe Asp Tyr Ala Asp Val Val Thr Thr Thr265 270 275 act cac aaa tca ctc cgt ggg cca cgt gga gcc atg ate ttt tac agg1098 Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala Met Ile Phe Tyr Arg280 285 290 295aag gga gtc aaa gaa ata aat aaa caa gga aaa gag gtt atg tat gat1146 Lys Gly Val Lys Glu Ile Asn Lys Gln Gly Lys Glu Val Met Tyr Asp 300 305 310 ttt gag gac aaa ate aat gct gct gtc ttt cct ggt ctg caa ggt ggg1194 Phe Glu Asp Lys Ile Asn Ala Ala Val Phe Pro Gly Leu Gln Gly Gly 315 320 325 cct cat aac cat acc att act ggc ttg gct gtt gcg ctc aaa cag gca1242 Pro His Asn His Thr Ile Thr Gly Leu Ala Val Ala Leu Lys Gln Ala 330 335 340 act act cca gaa tac aga gct tac caa gag caa gtt ate agt aat tgt1290 Thr Thr Pro Glu Tyr Arg Ala Tyr Gln Glu Gln Val Ile Ser Asn Cys345 350 355 gct aaa ttt gcg cag age ctg att tca aaa gga tat gaa ctc gtc tet1338 Ala Lys Phe Ala Gln Ser Leu Ile Ser Lys Gly Tyr Glu Leu Val Ser360 365 370 375ggt ggg act gac aac cat tta gtt ctg gtg aat ctc aag aat aag ggg1386 Gly Gly Thr Asp Asn His Leu Val Leu Val Asn Leu Lys Asn Lys Gly 380 385 390 ata gat ggt tca agg gtg gag aag gtt tta gaa agt gtg cat att gca1434 Ile Asp Gly Ser Arg Val Glu Lys Val Leu Glu Ser Val His Ile Ala 395 400 405 gca aac aag aac aca gtt cct ggt gat gtt tca gct atg gtg cca gga1482 Ala Asn Lys Asn Thr Val Pro Gly Asp Val Ser Ala Met Val Pro Gly 410 415 420 ggc ate agg atg gga acc cca gcc Ctt acg tcg aga gga ttt gtt gaa1530 Gly Ile Arg Met Gly Thr Pro Ala Leu Thr Ser Arg Gly Phe Val Glu425 430 435 gaa gat ttc gct aaa gtt gct gac ttc ttc gat gca gca gtg aat ctg1578 Glu Asp Phe Ala Lys Val Ala Asp Phe Phe Asp Ala Ala Val Asn Leu 440 445 450 455gcc ttg aag att aag gct gca acg aca ggt gga aca aag ctg aag gac1626 Ala Leu Lys Ile Lys Ala Ala Thr Thr Gly Gly Thr Lys Leu Lys Asp460 465 470
ttt gtt gcc act ttg caa tct gat age ate caa gtt gag att gea aag1674
Phe Val Ala Thr Leu Gln Ser Asp Ser Ile Gln Val Glu Ile Ala Lys
475 480 485
ctt cgc cat gat gta gag gaa ttt gea aaa caa ttc cca aca att gga1722
Leu Arg His Asp Val Glu Glu Phe Ala Lys Gln Phe Pro Thr Ile Gly
490 495 500
ttt gag aaa gag acc atg aaa tac aag aac taatatctgg atgacaagaa1772
Phe Glu Lys Glu Thr Met Lys Tyr Lys Asn
505 510
gagaatgagg tcactcttct tgcagtaagc attcgaagca agatgccacg atgattattg1832
ggagtttaac catggtgtaa tggcatctta tgttaaagag atgttggcaa tttacagcat1892
gtggaacttt cgtcaatcat attgtagaca cataccgcga gatgctatat tgaccggaca1952
attgcatttc catatgtgta aaaaaaaagc gttcaaaaaa aaaacgtaca tcctgacaca2012
cactccaccc ccatccccac tcacaagcac acgtcaccct gcccgcaagg ctatctactc2072
atetetataa tcaaactata ctatgtgaaa gttatagtct acggtgcaaa atagtgcaaa2132
atagtgtttt ag2144
<210> 34<211> 513<212> PRT
<213> Zea mays <400> 34 Met Ala Met Ala Thr Ala Leu Arg Lys Leu Ser Ala Asn Ala Leu Arg1 5 10 15 Arg Gln Pro Leu Ser Arg Ile Thr Pro Leu Tyr Tyr Met Ala Ser Leu 20 25 30 Pro Ala Thr Glu Glu Arg Ser Gly Ile Thr Trp Thr Lys Gln Leu Asn 35 40 45 Ala Pro Leu Glu Glu Val Asp Pro Glu Ile Ala Asp Ile Ile Glu His 50 55 60 Glu Lys Ala Arg Gln Trp Lys Gly Leu Glu Leu Ile Pro Ser Glu Asn65 70 75 80Phe Thr Ser Val Ser Val Met Gln Ala Val Gly Ser Val Met Thr Asn 85 90 95 Lys Tyr Ser Glu Gly Tyr Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Glu 100 105 110 Phe Ile Asp Met Ala Glu Ser Leu Cys Gln Lys Arg Ala Leu Glu Ala 115 120 125 Phe Arg Leu Asp Pro Ala Lys Trp Gly Val Asn Val Gln Pro Leu Ser 130 135 140 Gly Ser Pro Ala Asn Phe His Val Tyr Thr Ala Leu Leu Lys Pro His145 150 155 160Glu Arg Ile Met Ala Leu Asp Leu Pro His Gly Gly His Leu Ser His
165 170 175Gly Tyr Gln Thr Asp Thr Lys Lys Ile Ser Ala Thr Ser Ile Phe Phe
180 185 190
Glu Thr Met Pro Tyr Arg Leu Asp Glu Ser Thr Gly Leu Ile Asp Tyr
195 200 205
Asp Gln Leu Glu Lys Ser Ala Val Leu Phe Arg Pro Lys Leu Ile Ile
210 215 220
Ala Gly Ala Ser Ala Tyr Ala Arg Leu Tyr Asp Tyr Asp Arg Met Arg225 230 235 240
Lys Ile Cys Asn Lys Gln Lys Ala Ile Leu Leu Ala Asp Met Ala His
245 250 255
Ile Ser Gly Leu Val Ala Ala Gly Val Val Pro Ser Pro Phe Asp Tyr
260 265 270
Ala Asp Val Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg
275 280 285
Gly Ala Met Ile Phe Tyr Arg Lys Gly Val Lys Glu Ile Asn Lys Gln
290 295 300
Gly Lys Glu Val Met Tyr Asp Phe Glu Asp Lys Ile Asn Ala Ala Val305 310 315 320
Phe Pro Gly Leu Gln Gly Gly Pro His Asn His Thr Ile Thr Gly Leu
325 330 335
Ala Val Ala Leu Lys Gln Ala Thr Thr Pro Glu Tyr Arg Ala Tyr Gln
340 345 350
Glu Gln Val Ile Ser Asn Cys Ala Lys Phe Ala Gln Ser Leu Ile Ser
355 360 365
Lys Gly Tyr Glu Leu Val Ser Gly Gly Thr Asp Asn His Leu Val Leu
370 375 380
Val Asn Leu Lys Asn Lys Gly Ile Asp Gly Ser Arg Val Glu Lys Val385 390 395 400
Leu Glu Ser Val His Ile Ala Ala Asn Lys Asn Thr Val Pro Gly Asp
405 410 415
Val Ser Ala Met Val Pro Gly Gly Ile Arg Met Gly Thr Pro Ala Leu
420 425 430
Thr Ser Arg Gly Phe Val Glu Glu Asp Phe Ala Lys Val Ala Asp Phe
435 440 445
Phe Asp Ala Ala Val Asn Leu Ala Leu Lys Ile Lys Ala Ala Thr Thr
450 455 460
Gly Gly Thr Lys Leu Lys Asp Phe Val Ala Thr Leu Gln Ser Asp Ser465 470 475 480
Ile Gln Val Glu Ile Ala Lys Leu Arg His Asp Val Glu Glu Phe Ala
485 490 495
Lys Gln Phe Pro Thr Ile Gly Phe Glu Lys Glu Thr Met Lys Tyr Lys500 505 510
Asn
<210> 35<211> 2136<212> DNA<213> Zea mays
<220><221> CDS
<222> (143).. (1705)<400> 35
aaacccctcc gaccacccaa tctccgcccc ccgcattctg tcgaacacct cgtcttcgct 60
cgcaccgacc ccaccgcacc gcaccgcacc gcacctcacc tccaccaaca acaccaccag 120
tccaccacca cccacctccc ac atg tgc aca cgc gcc ctc ctc ccg tcc acc 172
Met Cys Thr Arg Ala Leu Leu Pro Ser Thr1 5 10
acc gct ata tat ccc ggc gcc cct tcc tcc ctc ccc cgt cct tcc ctc 220Thr Ala Ile Tyr Pro Gly Ala Pro Ser Ser Leu Pro Arg Pro Ser Leu
1 5 20 25
cgc ctc cgc ccc cgc cca ctc ctc gct gcc acc act cct gtc acc tct 268
Arg Leu Arg Pro Arg Pro Leu Leu Ala Ala Thr Thr Pro Val Thr Ser
30 35 40
toe cgc gcc gac gea gcc gcc atg gac ccc gtc gcc aca tgg ggg cta 316
Ser Arg Ala Asp Ala Ala Ala Met Asp Pro Val Ala Thr Trp Gly Leu
45 50 55
acc ccg ctc gcg ggc gcc gac ccg gag ate tac gac ctc ctg gag cgc 364
Thr Pro Leu Ala Gly Ala Asp Pro Glu Ile Tyr Asp Leu Leu Glu Arg
60 65 70
gag aag cgg cgc cag cgt cgc ggc ate gag ctc ate gcc tcc gag aac 412
Glu Lys Arg Arg Gln Arg Arg Gly Ile Glu Leu Ile Ala Ser Glu Asn75 80 85 90
ttc acc tcc ttc gcc gtc atg gaa gcg ctc ggc tcc gcg ctc act aac 460
Phe Thr Ser Phe Ala Val Met Glu Ala Leu Gly Ser Ala Leu Thr Asn
95 100 105
aag tac tcc gag ggc atg ccc ggc gcc cgc tac tac ggc ggc aac gac 508
Lys Tyr Ser Glu Gly Met Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Asp
110 115 120
gtc ate gac gag ate gag aac ctc tgc cgg tca cgc gcg ctc gct gcc 556
Val Ile Asp Glu Ile Glu Asn Leu Cys Arg Ser Arg Ala Leu Ala Ala
125 130 135
ttc cgc ctt gac gcc gcg tcc tgg ggc gtc aac gtg cag ccc tac tcg 604
Phe Arg Leu Asp Ala Ala Ser Trp Gly Val Asn Val Gln Pro Tyr Ser
140 145 150
ggc tcc ccc gcc aac ttc gcc gcc tac acc gcg ctg ctc aac ccg cac 652
Gly Ser Pro Ala Asn Phe Ala Ala Tyr Thr Ala Leu Leu Asn Pro His155 160 165 170
gac cgg ate atg ggg ctc gac ctt ccc tcc ggc gga cac ctc act cac 700
Asp Arg Ile Met Gly Leu Asp Leu Pro Ser Gly Gly His Leu Thr His
175 180 185
ggg tac tac acg gcc ggc ggt aag aag ate tcc gcc acc tcg ate tac 748
Gly Tyr Tyr Thr Ala Gly Gly Lys Lys Ile Ser Ala Thr Ser Ile Tyr
190 195 200
ttt gag age ctg ccg tac aag gtg age gcc gea acg ggg tac ate gac 796
Phe Glu Ser Leu Pro Tyr Lys Val Ser Ala Ala Thr Gly Tyr Ile Asp
205 210 215
tac gag aag ctc gag gag aag gea ctt gac ttc cgc ccc aag ctc ate 844
Tyr Glu Lys Leu Glu Glu Lys Ala Leu Asp Phe Arg Pro Lys Leu Ile
220 225 230
ate tgc ggt ggc agt gcg tac ccg agg gac tgg gat tac gcc aag ctc 892
Ile Cys Gly Gly Ser Ala Tyr Pro Arg Asp Trp Asp Tyr Ala Lys Leu235 240 245 250
agg gcc gtc gcc gac aag gtc ggg gcc ctg ctg ctc tgc gac atg gcg 940
Arg Ala Val Ala Asp Lys Val Gly Ala Leu Leu Leu Cys Asp Met Ala
255 260 265
cac ate age ggg ctc gtc gcc gcg cag gaa gct gea aat cct ttt gaa 988
His Ile Ser Gly Leu Val Ala Ala Gln Glu Ala Ala Asn Pro Phe Glu
270 275 280
tat tgt gat gtg gtt acc aca acc acg cac aag tcc ctc aga ggg cca1036
Tyr Cys Asp Val Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro
285 290 295
agg gct ggc atg ate ttc tac agg aaa ggc cct aag ccc ccc aag aag1084
Arg Ala Gly Met Ile Phe Tyr Arg Lys Gly Pro Lys Pro Pro Lys Lys
300 305 310
ggc cag cct gag ggt gct gtt tat gat tac gaa gac aag ate aac ttt1132
Gly Gln Pro Glu Gly Ala Val Tyr Asp Tyr Glu Asp Lys Ile Asn Phe315 320 325 330
gea gtg ttc cca tct ctc caa ggt ggc cct cac aac cac cag att gct1180
Ala Val Phe Pro Ser Leu Gln Gly Gly Pro His Asn His Gln Ile Ala
335 340 345
gca ctt gct gtt gct cta cag caa act atg tcg cct ggc ttc aag gcc1228
Ala Leu Ala Val Ala Leu Gln Gln Thr Met Ser Pro Gly Phe Lys Ala
350 355 360
tat gca aag caa gtg aag gcc aat gct gtt gca att gga aac tat ctc1276
Tyr Ala Lys Gln Val Lys Ala Asn Ala Val Ala Ile Gly Asn Tyr Leu
365 370 375
atg age aag ggc tac aag atg gtg act gat gga act gag aac cac ctt1324
Met Ser Lys Gly Tyr Lys Met Val Thr Asp Gly Thr Glu Asn His Leu
380 385 390
gtt ctc tgg gat ctc cgc ccc ctt ggc ttg act gga aac aag gtc gaa1372
Val Leu Trp Asp Leu Arg Pro Leu Gly Leu Thr Gly Asn Lys Val Glu395 400 405 410
aag cta tgt gat ctt tgc cac ate aca ttg aac aag aat gct gtc ttc1420
Lys Leu Cys Asp Leu Cys His Ile Thr Leu Asn Lys Asn Ala Val Phe
415 420 425
ggt gac age agt gca ttg tet ccg ggt ggt gtc cgc att ggc gcg cca1468
Gly Asp Ser Ser Ala Leu Ser Pro Gly Gly Val Arg Ile Gly Ala Pro
430 435 440
gca atg acc tcg agg ggt cta ctg gag aag gat ttc gag cag att ggg1516
Ala Met Thr Ser Arg Gly Leu Leu Glu Lys Asp Phe Glu Gln Ile Gly
445 450 455
gag ttc ctc cac cag gca gtg acc ate tgc ctg aac ate cag aag gag1564
Glu Phe Leu His Gln Ala Val Thr Ile Cys Leu Asn Ile Gln Lys Glu
460 465 470
tac ggc aag ctc ctc aag gac ttc aac aag ggc ctg gtg aac aac aag1612
Tyr Gly Lys Leu Leu Lys Asp Phe Asn Lys Gly Leu Val Asn Asn Lys475 480 485 490
gac ate gag aac ctc aag gtc cag gtg gag aag ttt gcc gac tcc ttc1660
Asp Ile Glu Asn Leu Lys Val Gln Val Glu Lys Phe Ala Asp Ser Phe
495 500 505
gac atg cct ggg ttc acg ctt gag age atg aaa tac aag gag tagatatgcc1712
Asp Met Pro Gly Phe Thr Leu Glu Ser Met Lys Tyr Lys Glu510 515 520
tctcecatgc gcggcaaggt cctcctgtac cgatgtcttt ccttgtggtg gcgcagggtg1772
ccatggcact gcattgccgc cacacttacg atgatgatga tgggttatgg attttgtcta1832
caatgtcagc aggataggct cacaattgcc ccctgccctc cggtttggtc gcctctcagg1892
ttttcatttg gtagttgttc gcagggaacc atatgagaat tgcaatgtca atcaggtgtt1952
tgccaataat aattgggtgg tttctgctct tgctctggtc attaccatgc attttttatt2012
ctgttggtga gttggtcgat ttattatctc ctgcagtcct gctggcactg ccggtggtcg2072
tttgattatc atgtatgaat cttcctggag actgttgctc gattaacata tcgcctgctc2132
ctgc2136
<210> 36<211> 520<212> PRT<213> Zea mays
<400> 36
Met Cys Thr Arg Ala Leu Leu Pro Ser Thr Thr Ala Ile Tyr Pro Gly1 5 10 15
Ala Pro Ser Ser Leu Pro Arg Pro Ser Leu Arg Leu Arg Pro Arg Pro
20 25 30
Leu Leu Ala Ala Thr Thr Pro Val Thr Ser Ser Arg Ala Asp Ala Ala
35 40 45
Ala Met Asp Pro Val Ala Thr Trp Gly Leu Thr Pro Leu Ala Gly Ala
50 55 60
Asp Pro Glu Ile Tyr* Asp Leu Leu Glu. Axg Glu. Lys Axg1 Axgp Gln Axg65 70 75 80
Arg Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val
85 90 95
Met Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met
100 105 110
Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Asp Val Ile Asp Glu Ile Glu
115 120 125
Asn Leu Cys Arg Ser Arg Ala Leu Ala Ala Phe Arg Leu Asp Ala Ala
130 135 140
Ser Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe145 150 155 160
Ala Ala Tyr Thr Ala Leu Leu Asn Pro His Asp Arg Ile Met Gly Leu
165 170 175
Asp Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ala Gly
180 185 190
Gly Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr
195 200 205
Lys Val Ser Ala Ala Thr Gly Tyr Ile Asp Tyr Glu Lys Leu Glu Glu
210 215 220
Lys Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala225 230 235 240
Tyr Pro Arg Asp Trp Asp Tyr Ala Lys Leu Arg Ala Val Ala Asp Lys
245 250 255
Val Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val
260 265 270
Ala Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr
275 280 285
Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe
290 295 300
Tyr Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala305 310 315 320
Val Tyr Asp Tyr Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser Leu
325 330 335
Gln Gly Gly Pro His Asn His Gln Ile Ala Ala Leu Ala Val Ala Leu
340 345 350
Gln Gln Thr Met Ser Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Lys
355 360 365
Ala Asn Ala Val Ala Ile Gly Asn Tyr Leu Met Ser Lys Gly Tyr Lys370 375 380Met Val Thr Asp Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg385 390 395 400
Pro Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys
405 410 415
His Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu
420 425 430
Ser Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly
435 440 445
Leu Leu Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu His Gln Ala
450 455 460
Val Thr Ile Cys Leu Asn Ile Gln Lys Glu Tyr Gly Lys Leu Leu Lys465 470 475 480
Asp Phe Asn Lys Gly Leu Val Asn Asn Lys Asp Ile Glu Asn Leu Lys
485 490 495
Val Gln Val Glu Lys Phe Ala Asp Ser Phe Asp Met Pro Gly Phe Thr
500 505 510
Leu Glu Ser Met Lys Tyr Lys Glu515 520
<210> 37<211> 1875<212> DNA<213> Zea mays
<220>
<221> CDS
<222> (41)..(1621)
<400> 37
caccaacaac accaccagtc caccaccacc cacctcccac atg tgc aca cgc gcc 55
Met Cys Thr Arg Ala1 5
cac ctc ccg tcc acc acc gct ata tat ccc ggc gcc cct tcc tcc ctc 103
His Leu Pro Ser Thr Thr Ala Ile Tyr Pro Gly Ala Pro Ser Ser Leu
10 15 20
ccc cgt cct tcc ctc cgc ctc cgc ctc cgc ccc cgc ccc cgc cca cgc 151
Pro Arg Pro Ser Leu Arg Leu Arg Leu Arg Pro Arg Pro Arg Pro Arg
25 30 35
cca ctc ctc gct gcc acc act cct gtc acc tct-tcc cgc gcc gac gca 199
Pro Leu Leu Ala Ala Thr Thr Pro Val Thr Ser Ser Arg Ala Asp Ala
40 45 50
gcc gcc atg gac ccc gtc gcc aca tgg ggg cta acc ccg ctc gcg ggc 247
Ala Ala Met Asp Pro Val Ala Thr Trp Gly Leu Thr Pro Leu Ala Gly
55 60 65
gcc gac ccg gag ate tac gac ctc ctg gag cgc gag aag cgg cgc cag 295
Ala Asp Pro Glu Ile Tyr Asp Leu Leu Glu Arg Glu Lys Arg Arg Gln70 75 80 85
cgt cgc ggc ate gag ctc ate gcc tcc gag aac ttc acc tcc ttc gcc 343
Arg Arg Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala
90 95 100
gtc atg gag gcg ctc ggc tcc gcg ctc act aac aag tac tcc gag ggc 391
Val Met Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly
105 110 115
atg ccc ggt gcc cgc tac tac ggc ggc aac gac gtc ate gac gag ate 439
Met Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Asp Val Ile Asp Glu Ile
120 125 130
gag aac ctc tgc cgg tca cgc gcg ctc gct gcc ttc cac ctt gac gcc 487
Glu Asn Leu Cys Arg Ser Arg Ala Leu Ala Ala Phe His Leu Asp Ala
135 140 145
gcg tcc tgg ggc gtc aac gtg cag ccc tac tcg ggc tcc ccc gcc aac 535
Ala Ser Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn150 155 160 165
ttc gcc gcc tac acc gcg ctg ctc aac ccg cac gac cgg ate atg ggg 583Phe Ala Ala Tyr Thr Ala Leu Leu Asn Pro His Asp Arg Ile Met Gly
170 175 180
ctc gac ctt ccc tcc ggc gga cac ctc act cac ggg tac tac acg gcc 631
Leu Asp Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ala
185 190 195
ggc ggt aag aag ate tcc gcc acc tcg ate tac ttt gag age ctg ccg 679
Gly Gly Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro
200 205 210
tac aag gtg age gcc gea acg ggg tac ate gac tac gag aag ctc gag 727
Tyr Lys Val Ser Ala Ala Thr Gly Tyr Ile Asp Tyr Glu Lys Leu Glu
215 220 225
gag aag gea ctt gac ttc cgc ccc aag ctc ate ate tgc ggt ggc agt 775
Glu Lys Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser230 235 240 245
gcg tac ccg agg gac tgg gat tac gcc aag ctc agg gcc gtc gcc gac 823
Ala Tyr Pro Arg Asp Trp Asp Tyr Ala Lys Leu Arg Ala Val Ala Asp
250 255 260
aag gtc ggg gcc ctg ctg ctc tgc gac atg gcg cac ate age ggg ctc 871
Lys Val Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu
265 270 275
gtc gcc gcg cag gaa gct gea aat cct ttt gaa tat tgt gat gtg gtt 919
Val Ala Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val
280 285 290
acc aca acc acg cac aag tcc ctc aga ggg cca agg gct ggc atg ate 967
Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile
295 300 305
ttc tac agg aaa ggc cct aag ccc ccc aag aag ggc cag cct gag ggt1015
Phe Tyr Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly310 315 320 325
gct gtt tat gat tac gaa gac aag ate aac ttt gea gtg ttc cca tet1063
Ala Val Tyr Asp Tyr Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser
330 335 340
ctc caa ggt ggc cct cac aac cac cag att gct gea ctt gct gtt gct1111
Leu Gln Gly Gly Pro His Asn His Gln Ile Ala Ala Leu Ala Val Ala
345 350 355
cta cag caa act atg tcg cct ggc ttc aag gcc tat gea aag- caa gtg1159
Leu Gln Gln Thr Met Ser Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val
360 365 370
aag gcc aat gct gtt gea att gga aac tat ctc atg age aag ggc tac1207
Lys Ala Asn Ala Val Ala Ile Gly Asn Tyr Leu Met Ser Lys Gly Tyr
375 380 385
aag atg gtg act gat gga act gag aac cac ctt gtt ctc tgg gat ctc1255
Lys Met Val Thr Asp Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu390 395 400 405
cgc ccc ctt ggc ttg act gga aac aag gtc gaa aag cta tgt gat ctt1303
Arg Pro Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu
410 415 420
tgc cac ate aca ttg aac aag aat gct gtc ttc ggt gac age agt gea1351
Cys His Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala
425 430 435
ttg tet ccg ggt ggt gtc cgc att ggc gcg cca gea atg acc tcg agg1399
Leu Ser Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg
440 445 450
ggt cta ctg gag aag gat ttc gag cag att ggg gag ttc ctc cac cag
\1447
Gly Leu Leu Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu His Gln
455 460 465
gca gtg acc ate tgc ctg aac ate cag aag gag tac ggc aag ctc ctc1495
Ala Val Thr Ile Cys Leu Asn Ile Gln Lys Glu Tyr Gly Lys Leu Leu470 475 480 485
aag gac ttc aac aag ggc ctg gtg aac aac aag gac ate gag aac ctc1543
Lys Asp Phe Asn Lys Gly Leu Val Asn Asn Lys Asp Ile Glu Asn Leu
490 495 500
aag gtc cag gtg gag aag ttt gcc gac tcc ttc gac atg cct ggg ttc1591
Lys Val Gln Val Glu Lys Phe Ala Asp Ser Phe Asp Met Pro Gly Phe
505 510 515
acg ctt gag age atg aaa tac aag gag tagatatgcc tctttcatgc1638
Thr Leu Glu Ser Met Lys Tyr Lys Glu
520 525
gcggcaaggt cctcctgtac cgatgtcttt ccttgtggtg gcgcagggtg ccatggcact1698
gcattgccgc cacacttacg atgatgatga tgggttatgg attttgtcta caatgtcagc1758
aggataggct cacaattgcc ccctgccctc cggtttggtc gcctctcagg ttttcatttg1818
gtagttgttc gcagçfgaacc a.tâtga.gaat tgcaatgtca atcaggtgtt tgccaat1875
<210> 38<211> 526<212> PRT<213> Zea mays
<400> 38
Met Cys Thr Arg Ala His Leu Pro Ser Thr Thr Ala Ile Tyr Pro Gly1 5 10 15
Ala Pro Ser Ser Leu Pro Arg Pro Ser Leu Arg Leu Arg Leu Arg Pro
20 25 30
Arg Pro Arg Pro Arg Pro Leu Leu Ala Ala Thr Thr Pro Val Thr Ser
35 40 45
Ser Arg Ala Asp Ala Ala Ala Met Asp Pro Val Ala Thr Trp Gly Leu
50 55 60
Thr Pro Leu Ala Gly Ala Asp Pro Glu Ile Tyr Asp Leu Leu Glu Arg65 70 75 80
Glu Lys Arg Arg Gln Arg Arg Gly Ile Glu Leu Ile Ala Ser Glu Asn
85 90 95
Phe Thr Ser Phe Ala Val Met Glu Ala Leu Gly Ser Ala Leu Thr Asn
100 105 110
Lys Tyr Ser Glu Gly Met Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Asp
115 120 125
Val Ile Asp Glu Ile Glu Asn Leu Cys Arg Ser Arg Ala Leu Ala Ala
130 135 140
Phe His Leu Asp Ala Ala Ser Trp Gly Val Asn Val Gln Pro Tyr Ser145 150 155 i60
Gly Ser Pro Ala Asn Phe Ala Ala Tyr Thr Ala Leu Leu Asn Pro His
165 170 175
Asp Arg Ile Met Gly Leu Asp Leu Pro Ser Gly Gly His Leu Thr His
180 185 190
Gly Tyr Tyr Thr Ala Gly Gly Lys Lys Ile Ser Ala Thr Ser Ile Tyr195 200 205 Phe Glu 210 Ser Leu Pro Tyr Lys 215 Val Ser Ala Ala Thr 220 Gly Tyr Ile AspTyr Glu Lys Leu Glu Glu Lys Ala Leu Asp Phe Arg Pro Lys Leu Ile225 230 235 240Ile Cys Gly Gly Ser 245 Ala Tyr Pro Arg Asp 250 Trp Asp Tyr Ala Lys 255 LeuArg Ala Val Ala Asp Lys Val Gly Ala Leu Leu Leu Cys Asp Met Ala 260 265 270 His Ile Ser 275 Gly Leu Val Ala Ala 280 Gln Glu Ala Ala Asn 285 Pro Phe GluTyr Cys 290 Asp Val Val Thr Thr 295 Thr Thr His Lys Ser 300 Leu Arg Gly ProArg Ala Gly Met Ile Phe Tyr Arg Lys Gly Pro Lys Pro Pro Lys Lys305 310 315 320Gly Gln Pro Glu Gly Ala Val Tyr Asp Tyr Glu Asp Lys Ile Asn Phe 325 330 335 Ala Val Phe Pro 340 Ser Leu Gln Gly Gly 345 Pro His Asn His Gln 350 Ile AlaAlai Leu Ala 355 Val Ala Leu Gln Gln 360 Thr Met Ser Pro Gly 365 Phe Lys AlaTyr Ala 370 Lys Gln Val Lys Ala 375 Asn Ala Val Ala Ile 380 Gly Asn Tyr LeuMet Ser Lys Gly Tyr Lys Met Val Thr Asp Gly Thr Glu Asn His Leu385 390 395 400Val Leu Trp Asp Leu 405 Arg Pro Leu Gly Leu 410 Thr Gly Asn Lys Val 415 GluLys Leu Cys Asp 420 Leu Cys His Ile Thr 425 Leu Asn Lys Asn Ala 430 Val PheGly Asp Ser 435 Ser Ala Leu Ser Pro 440 Gly Gly Val Arg Ile 445 Gly Ala ProAla Met 450 Thr Ser Arg Gly Leu 455 Leu Glu Lys Asp Phe 460 Glu Gln Ile GlyGlu Phe Leu His Gln Ala Val Thr Ile Cys Leu Asn Ile Gln Lys Glu465 470 475 480Tyr Gly Lys Leu Leu 485 Lys Asp Phe Asn Lys 490 Gly Leu Val Asn Asn 495 LysAsp Ile Glu Asn 500 Leu Lys Val Gln Val 505 Glu Lys Phe Ala Asp 510 Ser Phe
Asp Met Pro Gly Phe Thr Leu Glu Ser Met Lys Tyr Lys Glu515 520 525
<210> 39<211> 1944<212> DNA
<213> Arabidopsis thaliana
<220><221> CDS
<222> (177)..(1766)<400> 39
ctcactagtc cccccccccc ccggagcttt ttttgttgtg atatatcccg taaaacccta 60
aacatagtca cttcatcgtc tcctccactg tatcattcaa tctctgtctt ccttcttttt 120
agcgacctcg tctccaaagc tcacaaattt tctacctttc cggagtagag agaaag atg 179
Met1
caa gct tgt tgt ggt ggt aat tcg atg gct tct ctt cag caa cct gga 227
Gln Ala Cys Cys Gly Gly Asn Ser Met Ala Ser Leu Gln Gln Pro Gly
5 10 15
cgg gtt caa gga tct gtc ttt ccc cca att atg cct cca gtg acc aaa 275Arg Val Gln Gly Ser Val Phe Pro Pro Ile Met Pro Pro Val Thr Lys 20 25 30 ttt tct cag cag ttg aag ttc aat att tca aaa cct ttc cgt tct tca 323Phe Ser 35 Gln Gln Leu Lys Phe 40 Asn Ile Ser Lys Pro 45 Phe Arg Ser Ser ttt ctg aaa aga aac ctg gtc tct gaa atg aga gea tct tca gtc tcg 371Phe Leu Lys Arg Asn Leu Val Ser Glu Met Arg Ala Ser Ser Val Ser 50 55 60 65 cta CCt aat gtc gag ata age age aaa gaa ate cct ttt gag gac tat 419Leu Pro Asn Val Glu 70 Ile Ser Ser Lys Glu 75 Ile Pro Phe Glu Asp 80 Tyr ggt ctt ggt gaa gtt gat cca gag gtc cga acc ate ate aca aag gag 467Gly Leu Gly Glu 85 Val Asp Pro Glu Val 90 Arg Thr Ile Ile Thr 95 Lys Glu aaa gat aga caa ttc agg age ttg gag ctt att gea tct gag aat ttc 515Lys Asp Arg 100 Gln Phe Arg Ser Leu 105 Glu Leu Ile Ala Ser 110 Glu Asn Phe acg tct cga gea gtt atg gag gcg gtt ggc tca tgc ctt acc aac aag 563Thr Ser 115 Arg Ala Val Met Glu 120 Ala Val Gly Ser Cys 125 Leu Thr Asn Lys tat tct gag gga ctg cct ggt aaa aga tat tat ggt ggc aat gag tac 611Tyr Ser Glu Gly Leu Pro Gly Lys Arg Tyr Tyr Gly Gly Asn Glu Tyr 130 135 140 145 att gat cag ttg gag acg ctt tgc cag aac cgg gct ttg gea gcc ttc 659Ile Asp Gln Leu Glu Thr Leu Cys Gln Asn Arg Ala Leu Ala Ala Phe 150 155 160 cgc tta gat tct acg aaa tgg ggg gtt aat gtt cag ccg tta tct ggt 707Arg Leu Asp Ser 165 Thr Lys Trp Gly Val 170 Asn Val Gln Pro Leu 175 Ser Gly tca cct gea aac ttt gct gtc tac act gcg ata ctt age cct cat gat 755Ser Pro Ala 180 Asn Phe Ala Val Tyr 185 Thr Ala Ile Leu Ser 190 Pro His Asp cgg ate atg ggt ttg gat tta cct cac ggt ggt cat ctg tcg cat ggg 803Arg Ile Met Gly Leu Asp Leu Pro His Gly Gly His Leu Ser His Gly 195 200 205 ttc atg acc gct aaa agg cgt gta tct gga act tca ata tac ttt gag 851Phe Met Thr Ala Lys Arg Arg Val Ser Gly Thr Ser Ile Tyr Phe Glu 210 215 220 225 tcc atg cct tat cga ctt gat gaa tca aca ggc att gtt gac tac gat 899Ser Met Pro Tyr Arg 230 Leu Asp Glu Ser Thr 235 Gly Ile Val Asp Tyr 240 Asp atg ctc gag aaa act gct aca ctt ttc aga cca aag ctt att ate gea 947Met Leu Glu Lys 245 Thr Ala Thr Leu Phe 250 Arg Pro Lys Leu Ile 255 Ile Ala gga gct agt gea tac age cga gat ttt gac tat cct cgc atg agg aag 995Gly Ala Ser Ala Tyr Ser Arg Asp Phe Asp Tyr Pro Arg Met Arg Lys 260 265 270 ate gea gac tca gtt ggt gct ttt ctg atg atg gat atg gct cat ate
1043
Ile Ala Asp Ser Val Gly Ala Phe Leu Met Met Asp Met Ala His Ile
275 280 285
agt ggg ctt gtg gct gct tct gtg gta gct gac cct ttt gag tat tgt1091
Ser Gly Leu Val Ala Ala Ser Val Val Ala Asp Pro Phe Glu Tyr Cys290 295 300 305
gat att gtt aca aca aca act cac aag tct ttg aga ggt ccg aga ggt1139
Asp Ile Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly
310 315 320
ggc atg ate ttc ttc agg aag gat cca att aat ggg gtt gat ctt gaa1187
Gly Met Ile Phe Phe Arg Lys Asp Pro Ile Asn Gly Val Asp Leu Glu325 330 335tct gcc gtg aac aat gct gtc ttc cct ggt ttg cag ggt ggc cct cat1235
Ser Ala Val Asn Asn Ala Val Phe Pro Gly Leu Gln Gly Gly Pro His
340 345 350
aac cac aca att gga gga tta gca gtc tgc ttg aaa cac gca caa tca1283
Asn His Thr Ile Gly Gly Leu Ala Val Cys Leu Lys His Ala Gln Ser
355 360 365
ccg gaa ttc aag gcg tac cag aaa aga gtt gtg tct aac tgt aga gct1331
Pro Glu Phe Lys Ala Tyr Gln Lys Arg Val Val Ser Asn Cys Arg Ala370 375 380 385
cta gct aac cga ttg gtt gaa ctc ggg ttt aag cta gtt tct ggt ggc1379
Leu Ala Asn Arg Leu Val Glu Leu Gly Phe Lys Leu Val Ser Gly Gly
390 395 400
age gat aac cac ttg gtt ctc gtc gat ctt aga ccc atg ggt atg gat1427
Ser Asp Asn His Leu Val Leu Val Asp Leu Arg Pro Met Gly Met Asp
405 410 415
ggt gcg cgg gtt gag aaa ate tta gac atg gca tct att act ctc aac1475
Gly Ala Arg Val Glu Lys Ile Leu Asp Met Ala Ser Ile Thr Leu Asn
420 425 430
aag aac tct gtc cct ggg gac aaa agt gcg ttg gta cca ggg gga ata1523
Lys Asn Ser Val Pro Gly Asp Lys Ser Ala Leu Val Pro Gly Gly Ile
435 440 445
agg ata gga tcc ccc gcg atg acg aca aga gga ctg tca gag aaa gac1571
Arg Ile Gly Ser Pro Ala Met Thr Thr Arg Gly Leu Ser Glu Lys Asp450 455 460 465
ttt gta gta gtg gct gac ttc ate aag gaa ggt gtg gag ata aca atg1619
Phe Val Val Val Ala Asp Phe Ile Lys Glu Gly Val Glu Ile Thr Met
470 475 480
gaa gcc aag aaa gcc gcg ccg ggt tca aag ctt caa gat ttc aac aag1667
Glu Ala Lys Lys Ala Ala Pro Gly Ser Lys Leu Gln Asp Phe Asn Lys
485 490 495
ttc gtg aca tct cct gag ttt cca ttg aaa gag aga gtg aag agt cta1715
Phe Val Thr Ser Pro Glu Phe Pro Leu Lys Glu Arg Val Lys Ser Leu
500 505 510
aag gag aga gtg gaa acc ttc aca tct cgt ttt ccc att cct ggc gtt1763
Lys Glu Arg Val Glu Thr Phe Thr Ser Arg Phe Pro Ile Pro Gly Val
515 520 525
taagctataa acacacacag atatgctctt gttgtacctt aattattcac ctttttcatc1823
tgtcttttag ggtttttact tgcttgtgtc ccaagtttaa agttacagtt gaatcgagag1883
aaattatttt caaaaataaa tttatttgtg gaacaatgat tcgtctatgt tcccaaatct
1943
c
1944
<210> 40<211> 529<212> PRT
<213> Arabidopsis thaliana<400> 40
Met Gln Ala Cys Cys Gly Gly Asn Ser Met Ala Ser Leu Gln Gln Pro1 5 10 15
Gly Arg Val Gln Gly Ser Val Phe Pro Pro Ile Met Pro Pro Val Thr
20 25 30
Lys Phe Ser Gln Gln Leu Lys Phe Asn Ile Ser Lys Pro Phe Arg Ser
35 40 45
Ser Phe Leu Lys Arg Asn Leu Val Ser Glu Met Arg Ala Ser Ser Val
50 55 60
Ser Leu Pro Asn Val Glu Ile Ser Ser Lys Glu Ile Pro Phe Glu Asp65 70 75 80
Tyr Gly Leu Gly Glu Val Asp Pro Glu Val Arg Thr Ile Ile Thr Lys
85 90 95
Glu Lys Asp Arg Gln Phe Arg Ser Leu Glu Leu Ile Ala Ser Glu Asn
100 105 110
Phe Thr Ser Arg Ala Val Met Glu Ala Val Gly Ser Cys Leu Thr Asn
115 120 125
Lys Tyr Ser Glu Gly Leu Pro Gly Lys Arg Tyr Tyr Gly Gly Asn Glu
130 135 140
Tyr Ile Asp Gln Leu Glu Thr Leu Cys Gln Asn Arg Ala Leu Ala Ala145 150 155 160
Phe Arg Leu Asp Ser Thr Lys Trp Gly Val Asn Val Gln Pro Leu Ser
165 170 175
Gly Ser Pro Ala Asn Phe Ala Val Tyr Thr Ala Ile Leu Ser Pro His
180 185 190
Asp Arg Ile Met Gly Leu Asp Leu Pro His Gly Gly His Leu Ser His
195 200 205
Gly Phe Met Thr Ala Lys Arg Arg Val Ser Gly Thr Ser Ile Tyr Phe
210 215 220
Glu Ser Met Pro Tyr Arg Leu Asp Glu Ser Thr Gly Ile Val Asp Tyr225 230 235 240
Asp Met Leu Glu Lys Thr Ala Thr Leu Phe Arg Pro Lys Leu Ile Ile
245 250 255
Ala Gly Ala Ser Ala Tyr Ser Arg Asp Phe Asp Tyr Pro Arg Met Arg
260 265 270
Lys Ile Ala Asp Ser Val Gly Ala Phe Leu Met Met Asp Met Ala His
275 280 285
Ile Ser Gly Leu Val Ala Ala Ser Val Val Ala Asp Pro Phe Glu Tyr
290 295 300
Cys Asp Ile Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg305 310 315 320
Gly Gly Met Ile Phe Phe Arg Lys Asp Pro Ile Asn Gly Val Asp Leu
325 330 335
Glu Ser Ala Val Asn Asn Ala Val Phe Pro Gly Leu Gln Gly Gly Pro
340 345 350
His Asn His Thr Ile Gly Gly Leu Ala Val Cys Leu Lys His Ala Gln
355 360 365
Ser Pro Glu Phe Lys Ala Tyr Gln Lys Arg Val Val Ser Asn Cys Arg
370 375 380
Ala Leu Ala Asn Arg Leu Val Glu Leu Gly Phe Lys Leu Val Ser Gly385 390 395 400
Gly Ser Asp Asn His Leu Val Leu Val Asp Leu Arg Pro Met Gly Met
405 410 415
Asp Gly Ala Arg Val Glu Lys Ile Leu Asp Met Ala Ser Ile Thr Leu
420 425 430
Asn Lys Asn Ser Val Pro Gly Asp Lys Ser Ala Leu Val Pro Gly Gly
435 440 445
Ile Arg Ile Gly Ser Pro Ala Met Thr Thr Arg Gly Leu Ser Glu Lys
450 455 460
Asp Phe Val Val Val Ala Asp Phe Ile Lys Glu Gly Val Glu Ile Thr465 470 475 480
Met Glu Ala Lys Lys Ala Ala Pro Gly Ser Lys Leu Gln Asp Phe Asn
485 490 495
Lys Phe Val Thr Ser Pro Glu Phe Pro Leu Lys Glu Arg Val Lys Ser
500 505 510
Leu Lys Glu Arg Val Glu Thr Phe Thr Ser Arg Phe Pro Ile Pro Gly515 520 525
Val
<210> 41<211> 1284<212> DNA
<213> Pyrococcus abyssi
<220>
<221> CDS
<222> (1).. (1284)
<400> 41
atg gcc tac aag gag tat agg gac aag gtg tta cac ttt att gaa gaa 48
Met Ala Tyr Lys Glu Tyr Arg Asp Lys Val Leu His Phe Ile Glu Glu1 5 10 15
cac gag aag tgg agg age cat aca ata aac ttg ate gea agt gag aac 96
His Glu Lys Trp Arg Ser His Thr Ile Asn Leu Ile Ala Ser Glu Asn
20 25 30
ata act tet cca age gtt aac agg gcc gtt gcc tet ggc ttt atg cac 144
Ile Thr Ser Pro Ser Val Asn Arg Ala Val Ala Ser Gly Phe Met His
35 40 45
aag tac gea gag gga tgg cca agg caa agg tat tac caa ggt tgt aag 192
Lys Tyr Ala Glu Gly Trp Pro Arg Gln Arg Tyr Tyr Gln Gly Cys Lys
50 55 60
tac gtt gat gag gtc gag ctc att gga gtt gaa ctc ttc act aag tta 240
Tyr Val Asp Glu Val Glu Leu Ile Gly Val Glu Leu Phe Thr Lys Leu65 70 75 80
ttc aag age gac tat gea gat tta aga cca ate tet gga act aac gct 288
Phe Lys Ser Asp Tyr Ala Asp Leu Arg Pro Ile Ser Gly Thr Asn Ala
85 90 95
aat caa gea gtg ttc ttc ggg tta ggg cag cca ggt gat aag gtt ata 336
Asn Gln Ala Val Phe Phe Gly Leu Gly Gln Pro Gly Asp Lys Val Ile
100 105 110
gtt ctc cac acg age cat ggt gga cat ata age cac atg cca ttc ggg 384
Val Leu His Thr Ser His Gly Gly His Ile Ser His Met Pro Phe Gly
115 120 125
gct gct gga atg cgt ggt tta gag gtt cac aca tgg cca ttc gat aac 432
Ala Ala Gly Met Arg Gly Leu Glu Val His Thr Trp Pro Phe Asp Asn
130 135 140
gaa tcc ttc aac ata gac gtt gac aag gct gag aag atg ata aga gag 480
Glu Ser Phe Asn Ile Asp Val Asp Lys Ala Glu Lys Met Ile Arg Glu145 150 155 160
ctc gag cca aag ata gtt gtc ttt gga ggt tca ttg ttc ccg ttc ccg 528
Leu Glu Pro Lys Ile Val Val Phe Gly Gly Ser Leu Phe Pro Phe Pro
165 170 175
cac cca gtt aag gag ctt gcc cca gtg gct aag gaa gtt ggg gcg ttc 576
His Pro Val Lys Glu Leu Ala Pro Val Ala Lys Glu Val Gly Ala Phe
180 185 190
gta gtt tac gac gea gcc cac gtt ctc gga tta ata gcc ggt ggc gag 624
Val Val Tyr Asp Ala Ala His Val Leu Gly Leu Ile Ala Gly Gly Glu
195 200 205
ttc cag gac cca ctt aga gag gga gea gat ata atg aca gea tca acc 672
Phe Gln Asp Pro Leu Arg Glu Gly Ala Asp Ile Met Thr Ala Ser Thr
210 215 220
cac aag acc ttc cca ggg cca cag gga gga gta ata ctg tac aag aaa 720His Lys Thr Phe Pro Gly Pro Gln Gly Gly Val Ile Leu Tyr Lys Lys225 230 235 240ttc gcc gac gat gaa acg ata gca aag cta cag tgg gcg ate ttc ccaPhe Ala Asp Asp Glu Thr Ile Ala Lys Leu Gln Trp Ala Ile Phe Pro 245 250 255 ggt gtg Ctt age aac cac cac ctc cac cac atg gct gga aaa gtg ataGly Val Leu Ser Asn His His Leu His His Met Ala Gly Lys Val Ile 260 265 270 acg gct gca gag atg ctc gag tac ggt gaa gcg tac gcg aag cag ataThr Ala Ala Glu Met Leu Glu Tyr Gly Glu Ala Tyr Ala Lys Gln Ile 275 280 285 gtt aag aac gca aag gcc cta gct gaa gcc tta gca gag gaa gga tttVal Lys Asn Ala Lys Ala Leu Ala Glu Ala Leu Ala Glu Glu Gly Phe 290 295 300 aag gtg ata ggc gaa gac caa ggt tac acc aag age cat caa gtc ataLys Val Ile Gly Glu Asp Gln Gly Tyr Thr Lys Ser His Gln Val Ile305 310 315 320gtt gac gta age gac ctc cac cca gct gga gga gga tgg gca gct cca1008 Val Asp Val Ser Asp Leu His Pro Ala Gly Gly Gly Trp Ala Ala Pro 325 330 335 etc Ctt gag gaa gcc gga ata att ctc aac aag aac tta Ctt cca tgg1056 Leu Leu Glu Glu Ala Gly Ile Ile Leu Asn Lys Asn Leu Leu Pro Trp 340 345 350 gat cca cta gag aag gtt aac gag cca agt gga ctg aga att gga gtc1104 Asp Pro Leu Glu Lys Val Asn Glu Pro Ser Gly Leu Arg Ile Gly Val 355 360 365 cag gag atg acg aga gta gga atg atg gaa gac gag atg aag gag ata1152 Gln Glu Met Thr Arg Val Gly Met Met Glu Asp Glu Met Lys Glu Ile 370 375 380 gcg cac ttc atg aag cgc gtt ctc ttg gac aaa gag gat cca aag aag1200 Ala His Phe Met Lys Arg Val Leu Leu Asp Lys Glu Asp Pro Lys Lys385 390 395 400gta agg aag gac gtc tac tac ttc agg ctc gag tac cag aaa gtc tac1248 Val Arg Lys Asp Val 405 Tyr Tyr Phe Arg Leu 410 Glu Tyr Gln Lys Val 415 Tyrtac tcc ttc gac tat ggc Ctt cca atg aag gag tga 1284 Tyr Ser Phe Asp 420 Tyr Gly Leu Pro Met 425 Lys Glu
<210> 42<211> 427<212> PRT
<213> Pyrococcus abyssi<400> 42
Met Ala Tyr Lys Glu Tyr Arg Asp Lys Val Leu His Phe Ile Glu Glu1 5 10 15
His Glu Lys Trp Arg Ser His Thr Ile Asn Leu Ile Ala Ser Glu Asn
20 25 30
Ile Thr Ser Pro Ser Val Asn Arg Ala Val Ala Ser Gly Phe Met His
35 40 45
Lys Tyr Ala Glu Gly Trp Pro Arg Gln Arg Tyr Tyr Gln Gly Cys Lys
50 55 60
Tyr Val Asp Glu Val Glu Leu Ile Gly Val Glu Leu Phe Thr Lys Leu65 70 75 80
Phe Lys Ser Asp Tyr Ala Asp Leu Arg Pro Ile Ser Gly Thr Asn Ala
768
816
864
912
96085 90 95 Asn Gln Ala Val Phe Phe Gly Leu Gly Gln Pro Gly Asp Lys Val Ile 100 105 110 Val Leu His 115 Thr Ser His Gly Gly 120 His Ile Ser His Met 125 Pro Phe GlyAla Ala 130 Gly Met Arg Gly Leu 135 Glu Val His Thr Trp 140 Pro Phe Asp AsnGlu Ser Phe Asn Ile Asp Val Asp Lys Ala Glu Lys Met Ile Arg Glu145 150 155 160Leu Glu Pro Lys Ile 165 Val Val Phe Gly Gly 170 Ser Leu Phe Pro Phe 175 ProHis Pro Val Lys 180 Glu Leu Ala Pro Val 185 Ala Lys Glu Val Gly 190 Ala PheVal Val Tyr 195 Asp Ala Ala His Val 200 Leu Gly Leu Ile Ala 205 Gly Gly GluPhe Gln 210 Asp Pro Leu Arg Glu 215 Gly Ala Asp Ile Met 220 Thr Ala Ser ThrHis Lys Thr Phe Pro Gly Pro Gln Gly Gly Val Ile Leu Tyr Lys Lys225 230 235 240Phe Ala Asp Asp Glu 245 Thr Ile Ala Lys Leu 250 Gln Trp Ala Ile Phe 255 ProGly Val Leu Ser Asn His His Leu His His Met Ala Gly Lys Val Ile 260 265 270 Thr Ala Ala 275 Glu Met Leu Glu Tyr 280 Gly Glu Ala Tyr Ala 285 Lys Gln IleVal Lys 290 Asn Ala Lys Ala Leu 295 Ala Glu Ala Leu Ala 300 Glu Glu Gly PheLys Val Ile Gly Glu Asp Gln Gly Tyr Thr Lys Ser His Gln Val Ile305 310 315 320Val Asp Val Ser Asp 325 Leu His Pro Ala Gly 330 Gly Gly Trp Ala Ala 335 ProLeu Leu Glu Glu 340 Ala Gly Ile Ile Leu 345 Asn Lys Asn Leu Leu 350 Pro TrpAsp Pro Leu Glu Lys Val Asn Glu Pro Ser Gly Leu Arg Ile Gly Val 355 360 365 Gln Glu 370 Met Thr Arg Val Gly 375 Met Met Glu Asp Glu 380 Met Lys Glu IleAla His Phe Met Lys Arg Val Leu Leu Asp Lys Glu Asp Pro Lys Lys385 390 395 400Val Arg Lys Asp Val 405 Tyr Tyr Phe Arg Leu 410 Glu Tyr Gln Lys Val 415 TyrTyr Ser Phe Asp 420 Tyr Gly Leu Pro Met 425 Lys Glu
<210> 43<211> 1489<212> DNA
<213> Hyphomicrobivim methylovorum
<220><221> CDS
<222> (154)..(1458)<400> 43
cgcaacggcc gttcccgcgc ccttgttaca cggggctcgg ggtcggttga gtgctggtgt 60
ccagcctcgt actatggttc aaagctcgtt ggccggactt gactccgtgt cctgagcgcg 120
cagttaaatc actttcattt tgaaggaaaa cac atg tcg tcc gca ccg gct gca 174
Met Ser Ser Ala Pro Ala Ala1 5
ggt act gct tct acg tcc cgt ttt ttc aag tcg cac gtg tcg gag acg 222
Gly Thr Ala Ser Thr Ser Arg Phe Phe Lys Ser His Val Ser Glu Thr10 15 20
gat CCC gat att ttc age gcc ate caa aag gaa ttt ggc cgc cag cag 270Asp Pro Asp Ile Phe Ser Ala Ile Gln Lys Glu Phe Gly Arg Gln Gln 25 30 35 cac gag ate gag ctg ate gcg tet gag aac ate gtt tcg cag gcc gtt 318His Glu Ile Glu Leu Ile Ala Ser Glu Asn Ile Val Ser Gln Ala Val 40 45 50 55 CtC gat gea gct ggt tcg gtg ctg acc aac aag tat gcc gag ggc tat 366Leu Asp Ala Ala Gly Ser Val Leu Thr Asn Lys Tyr Ala Glu Gly Tyr 60 65 70 ccg ggc aag cgc tac tac ggc ggc tgc cag tac gtc gac ate gtt gaa 414Pro Gly Lys Arg Tyr Tyr Gly Gly Cys Gln Tyr Val Asp Ile Val Glu 75 80 85 gac ate gcg ate gac cgc gea aag aag ctc ttc aac tgc gaa ttc gcg 462Asp Ile Ala Ile Asp Arg Ala Lys Lys Leu Phe Asn Cys Glu Phe Ala 90 95 100 aac gtg cag ccg aac tcc ggc age cag gcg aac cag ggc gtg ttc aat 510Asn Val Gln Pro Asn Ser Gly Ser Gln Ala Asn Gln Gly Val Phe Asn 105 110 115 gcg ctc gcg cag ccg ggc gac acc ate ctc ggt ctc tcg ctc gct gcc 558Ala Leu Ala Gln Pro Gly Asp Thr Ile Leu Gly Leu Ser Leu Ala Ala 120 125 130 135 ggt ggt cac ttg acc cac ggc gcg ccg gtg aac cag tcc ggc aag tgg 606Gly Gly His Leu Thr His Gly Ala Pro Val Asn Gln Ser Gly Lys Trp 140 145 150 ttc aag gcc gtg cac tac atg gtc aag CCC gac tcg cac ctc ate gac 654Phe Lys Ala Val His Tyr Met Val Lys Pro Asp Ser His Leu Ile Asp 155 160 165 atg gac gaa gtg cgc aag ctg gcc cag gag cac aag ccg cgc ate ate 702Met Asp Glu Val Arg Lys Leu Ala Gln Glu His Lys Pro Arg Ile Ile 170 175 180 ate gct ggt ggt tcg gcc tat ccg cgc aag ate gat ttc gct gea ttt 750Ile Ala 185 Gly Gly Ser Ala Tyr 190 Pro Arg Lys Ile Asp 195 Phe Ala Ala Phe cgc gcg att gcg gat gag gtt ggc gcg ate ttc ctc gtc gat atg gcg 798Arg Ala Ile Ala Asp Glu Val Gly Ala Ile Phe Leu Val Asp Met Ala 200 205 210 215 cac ttc gcc ggt Ctt gtt gcg gcc ggt ctc att ccg age ccg ttc ccg 846His Phe Ala Gly Leu Val Ala Ala Gly Leu Ile Pro Ser Pro Phe Pro 220 225 230 cat gcc cac gtc gta acg acg acg acg cac aag acg ctg cgc gga CCC 894His Ala His Val Val Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro 235 240 245 cgt ggc ggc atg att tta acg aac gac g«=g gac ate gcg aag aag ate 942Arg Gly Gly Met Ile Leu Thr Asn Asp Ala Asp Ile Ala Lys Lys Ile 250 255 260 aac tcg gcg ate ttc cct ggc att cag ggc ggc ccg ctc atg cac gtt 990Asn Ser Ala Ile Phe Pro Gly Ile Gln Gly Gly Pro Leu Met His Val 265 270 275 ate gcc ggt aag gcc gtc gea ttc ggc gag gct ctg cgt ccg gac ttc 1038 Ile Ala Gly Lys Ala Val Ala Phe Gly Glu Ala Leu Arg Pro Asp Phe 280 285 290 295 aag gtc tac ate aag cag gtg atg gac aac gcc cgc gcg ctc ggt gaa 1086 Lys Val Tyr Ile Lys Gln Val Met Asp Asn Ala Arg Ala Leu Gly Glu 300 305 310 gtg Ctt gtg cag aac ggc ttc gcg ctc gtt tet ggc ggc acc gac acg 1134 Val Leu Val Gln 315 Asn Gly Phe Ala Leu 320 Val Ser Gly Gly Thr 325 Asp Thr cac CtC gtt ctc gtc gat ctg cgg ccg aag aag ctg acc ggt acg aag 1182His Leu Val Leu Val Asp Leu Arg Pro Lys Lys Leu Thr Gly Thr Lys
330 335 340
gct gag aag gcg ctt ggc cgt gcc aac ate acc tgc aac aag aac ggc1230
Ala Glu Lys Ala Leu Gly Arg Ala Asn Ile Thr Cys Asn Lys Asn Gly
345 350 355
att ccg ttc gac ccc gag aag ccg atg gtg acg tcg ggc att cgt ttg1278
Ile Pro Phe Asp Pro Glu Lys Pro Met Val Thr Ser Gly Ile Arg Leu360 365 370 375
ggt tcg cct gea ggc acg acg cgc ggc ttc ggc gtt gcc gaa ttc cag1326
Gly Ser Pro Ala Gly Thr Thr Arg Gly Phe Gly Val Ala Glu Phe Gln
380 385 390
gaa ate ggc cgc ctg ate tcg gaa gtt ctg gat ggc gtt gcg aag aac1374
Glu Ile Gly Arg Leu Ile Ser Glu Val Leu Asp Gly Val Ala Lys Asn
395 400 405
ggc gaa gat ggc aac ggc gcc gtc gaa gcg gcc gtc aag gea aag gct1422
Gly Glu Asp Gly Asn Gly Ala Val Glu Ala Ala Val Lys Ala Lys Ala
410 415 420
ate gct ctt tgc gat cgc ttc ccg att tac gea taacgctgtt tacgcacatt1475
Ile Ala Leu Cys Asp Arg Phe Pro Ile Tyr Ala
425 430
tgaagatatg cttg1489
<210> 44<211> 434<212> PRT
<213> Hyphomicrobium methylovorum
<400> 44
Met Ser Ser Ala Pro Ala Ala Gly Thr Ala Ser Thr Ser Arg Phe Phe1 5 10 15 Lys Ser His Val 20 Ser Glu Thr Asp Pro 25 Asp Ile Phe Ser Ala 30 Ile GlnLys Glu Phe 35 Gly Arg Gln Gln His 40 Glu Ile Glu Leu Ile 45 Ala Ser GluAsn Ile 50 Val Ser Gln Ala Val 55 Leu Asp Ala Ala Gly 60 Ser Val Leu ThrAsn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr Tyr Gly Gly Cys65 70 75 80Gln Tyr Val Asp Ile Val Glu Asp Ile Ala Ile Asp Arg Ala Lys Lys 85 90 95 Leu Phe Asn Cys 100 Glu Phe Ala Asn Val 105 Gln Pro Asn Ser Gly 110 Ser GlnAla Asn Gln Gly Val Phe Asn Ala Leu Ala Gln Pro Gly Asp Thr Ile 115 120 125 Leu Gly Leu Ser Leu Ala Ala Gly Gly His Leu Thr His Gly Ala Pro 130 135 140 Val Asn Gln Ser Gly Lys Trp Phe Lys Ala Val His Tyr Met Val Lys145 150 155 160Pro Asp Ser His Leu 165 Ile Asp Met Asp Glu 170 Val Arg Lys Leu Ala 175 GlnGlu His Lys Pro Arg Ile Ile Ile Ala Gly Gly Ser Ala Tyr Pro Arg 180 185 190 Lys Ile Asp 195 Phe Ala Ala Phe Arg 200 Ala Ile Ala Asp Glu 205 Val Gly AlaIle Phe Leu Val Asp Met Ala His Phe Ala Gly Leu Val Ala Ala Gly210 215 220 Leu Ile Pro Ser Pro Phe Pro His Ala His Val Val Thr Thr Thr Thr225 230 235 240His Lys Thr Leu Arg 245 Gly Pro Arg Gly Gly 250 Met Ile Leu Thr Asn 255 AspAla Asp Ile Ala 260 Lys Lys Ile Asn Ser 265 Ala Ile Phe Pro Gly 270 Ile GlnGly Gly Pro 275 Leu Met His Val Ile 280 Ala Gly Lys Ala Val 285 Ala Phe GlyGlu Ala 290 Leu Arg Pro Asp Phe 295 Lys Val Tyr Ile Lys 300 Gln Val Met AspAsn Ala Arg Ala Leu Gly Glu Val Leu Val Gln Asn Gly Phe Ala Leu305 310 315 320Val Ser Gly Gly Thr 325 Asp Thr His Leu Val 330 Leu Val Asp Leu Arg 335 ProLys Lys Leu Thr 340 Gly Thr Lys Ala Glu 345 Lys Ala Leu Gly Arg 350 Ala AsnIle Thr Cys 355 Asn Lys Asn Gly Ile 360 Pro Phe Asp Pro Glu 365 Lys Pro MetVal Thr 370 Ser Gly Ile Arg Leu 375 Gly Ser Pro Ala Gly 380 Thr Thr Arg GlyPhe Gly Val Ala Glu Phe Gln Glu Ile Gly Arg Leu Ile Ser Glu Val385 390 395 400Leu Asp Gly Val Ala Lys Asn Gly Glu Asp Gly Asn Gly Ala Val Glu 405 410 415 Ala Ala Val Lys 420 Ala Lys Ala Ile Ala 425 Leu Cys Asp Arg Phe 430 Pro IleTyr Ala
<210> 45<211> 2104<212> DNA
<213> Brevibacberitim fIavum
<220><221> CDS
<222> (556).. (1860)<400> 45
ggatcccgcg acaccaatga caaacggcac agaggtggag ggggaagttc cgaggaaggt 60
ttcggtggct gcggtaagtt gctgtcgggc cgctacctgg aggtgaatca gacgggacag 120
cggaaggtag acttctgcca cttcagcgag gtcaatgttt tctccgatgc ctcgaagttc 180
aatgacttct ttttgggtca gcacctgagg cattgagttt ctcagctcgc gccattgtgc 240
gcggtcgaaa tcaaggtagg ggctgaaatc tggtgtgcgt ggggaaggtt tcacaccagt 300
tgtgcttgca gcgttttgct ctgccatgaa tccattgtgc accttagcta ctccattagt 360
gtgatcgggg ttattttttc acttcaatgg gtggctaaaa gacgtgggca cgtgagtaaa 420
ctcatgcgcg cgaaacgatg gaagtgaacc catactttta tatatgggta tcggcggtct 480
atgcttgtgg gcgtacctgt cccgcgagtg aggtcttacg cgcgggattc gtcttgtgaa 540
aggttagctg acctg atg acc gat gcc cac caa gcg gac gat gtc cgt tac 591
Met Thr Asp Ala His Gln Ala Asp Asp Val Arg Tyr1 5 10
cag cca ctg aac gag ctt gaa cct gag gtg gct gct gcc ate gct ggg 639
Gln Pro Leu Asn Glu Leu Glu Pro Glu Val Ala Ala Ala Ile Ala Gly15 20 25
gaa ctt gcc cgt caa cgc gat aca tta gag atg ate gcg tet gag aac 687
Glu Leu Ala Arg Gln Arg Asp Thr Leu Glu Met Ile Ala Ser Glu Asn
30 35 40
ttc gtt ccc cgt tet gtt ttg cag gcg cag ggt tet gtt ctt acc aat 735
Phe Val Pro Arg Ser Val Leu Gln Ala Gln Gly Ser Val Leu Thr Asn45 50 55 60
aag tat gcc gag ggt tac cct ggc cgc cgt tac tac ggt ggt tgc gaa 783
Lys Tyr Ala Glu Gly Tyr Pro Gly Arg Arg Tyr Tyr Gly Gly Cys Glu
65 70 75
caa gtt gac ate att gag gat ctt gea cgt gat cgt gcg aag gct ctc 831
Gln Val Asp Ile Ile Glu Asp Leu Ala Arg Asp Arg Ala Lys Ala Leu
80 85 90
ttc ggt gea gag ttc gcc aat gtt cag cct cac tcc ggc gcg cag gct 879
Phe Gly Ala Glu Phe Ala Asn Val Gln Pro His Ser Gly Ala Gln Ala
95 100 105
aat gct gct gtg ctg atg act ttg gct gag cca ggc gac aag ate atg 927
Asn Ala Ala Val Leu Met Thr Leu Ala Glu Pro Gly Asp Lys Ile Met
110 115 120
ggt ctg tet ttg gct cat ggt ggt cac ttg acc cac gga atg aag ttg 975
Gly Leu Ser Leu Ala His Gly Gly His Leu Thr His Gly Met Lys Leu125 130 135 140
aac ttc tcc gga aag ctg tac gag gtt gtt gcg tac ggt gtt gat cct1023
Asn Phe Ser Gly Lys Leu Tyr Glu Val Val Ala Tyr Gly Val Asp Pro
145 150 155
gag acc atg cgt gtt gat atg gat cag gtt cgt gag att gct ctg aag1071
Glu Thr Met Arg Val Asp Met Asp Gln Val Arg Glu Ile Ala Leu Lys
160 165 170
gag cag cca aag gta att ate gct ggc tgg tet gea tac cct cgc cac1119
Glu Gln Pro Lys Val Ile Ile Ala Gly Trp Ser Ala Tyr Pro Arg His
175 180 185
ctt gat ttc gag gct ttc cag tet att gct gcg gaa gtt ggc gcg aag1167
Leu Asp Phe Glu Ala Phe Gln Ser Ile Ala Ala Glu Val Gly Ala Lys
190 195 200
ctg tgg gtc gat atg gct cac ttc gct ggt ctt gtt gct gct ggt ttg1215
Leu Trp Val Asp Met Ala His Phe Ala Gly Leu Val Ala Ala Gly Leu205 210 215 220
cac cca age cca gtt cct tac tet gat gtt gtt tet tcc act gtc cac1263
His Pro Ser Pro Val Pro Tyr Ser Asp Val Val Ser Ser Thr Val His
225 230 235
aag act ttg ggt gga cct cgt tcc ggc ate att ctg gct aag cag gag1311
Lys Thr Leu Gly Gly Pro Arg Ser Gly Ile Ile Leu Ala Lys Gln Glu
240 245 250
tac gcg aag aag ctg aac tet tcc gta ttc cca ggt cag cag ggt ggt1359
Tyr Ala Lys Lys Leu Asn Ser Ser Val Phe Pro Gly Gln Gln Gly Gly
255 260 265
cct ttg atg cac gea gtt gct gcg aag gct act tet ttg aag att gct1407
Pro Leu Met His Ala Val Ala Ala Lys Ala Thr Ser Leu Lys Ile Ala
270 275 280
ggc aat gag cag ttc cgt gac cgt cag gct cgc acg ttg gag ggt gct1455
Gly Asn Glu Gln Phe Arg Asp Arg Gln Ala Arg Thr Leu Glu Gly Ala285 290 295 300
cgc att ctt gcc gag cgt ctg act gct tet gat gcg aag gcc gct ggc1503
Arg Ile Leu Ala Glu Arg Leu Thr Ala Ser Asp Ala Lys Ala Ala Gly
305 310 315
gtg gat gtc ttg acc ggt ggc act gat gtg cac ttg gtt ttg gct gat1551
Val Asp Val Leu Thr Gly Gly Thr Asp Val His Leu Val Leu Ala Asp
320 325 330
ctg cgt aac tcc cag atg gat ggc caa cag gcg gaa gat ctg ctg cac1599
Leu Arg Asn Ser Gln Met Asp Gly Gln Gln Ala Glu Asp Leu Leu His
335 340 345
gag gtt ggt ate act gtg aac cgt aac gcg gtt cct ttc gat cct cgt1647
Glu Val Gly Ile Thr Val Asn Arg Asn Ala Val Pro Phe Asp Pro Arg
350 355 360
cca cca atg gtt act tet ggt ctg cgt att ggt act cct gcg ctg gct1695
Pro Pro Met Val Thr Ser Gly Leu Arg Ile Gly Thr Pro Ala Leu Ala365 370 375 380
acc cgt ggt ttc gat att cct gea ttc act gag gtt gea gac ate ate1743
Thr Arg Gly Phe Asp Ile Pro Ala Phe Thr Glu Val Ala Asp Ile Ile
385 390 395
ggt act gct ttg gct aat ggt aag tcc gea gac att gag tcc ctg cgt1791
Gly Thr Ala Leu Ala Asn Gly Lys Ser Ala Asp Ile Glu Ser Leu Arg
400 405 410
ggc cgt gta gea aag ctt gct gea gat tac cca ctg tat gag ggc ttg1839
Gly Arg Val Ala Lys Leu Ala Ala Asp Tyr Pro Leu Tyr Glu Gly Leu
415 420 425
gaa gac tgg acc ate gtc taa gcttttcttt gagttttcat atgtagaagg1890
Glu Asp Trp Thr Ile Val430
catcgtcggc ttcggcctgg cggtgctttt ctcgttgttt tgtggttttg tcagaggatg1950
tcatgcgcgt tttaattatt gataattatg attctttcac gtttaatctc gccacctatg2010
tggaagaggt tacgggtcag gcacctgtgg tggtgcctaa tgatcaagaa atagatgaga2070
cgcttttcga cgccgtcatc ctctcaccgg gccc2104
<210> 46<211> 434<212> PRT
<213> Brevibacterium flavram<400> 46
Met Thr Asp Ala His Gln Ala Asp Asp Val Arg Tyr Gln Pro Leu Asn1 5 10 15
Glu Leu Glu Pro Glu Val Ala Ala Ala Ile Ala Gly Glu Leu Ala Arg
20 25 30
Gln Arg Asp Thr Leu Glu Met Ile Ala Ser Glu Asn Phe Val Pro Arg
35 40 45
Ser Val Leu Gln Ala Gln Gly Ser Val Leu Thr Asn Lys Tyr Ala Glu
50 55 60
Gly Tyr Pro Gly Arg Arg Tyr Tyr Gly Gly Cys Glu Gln Val Asp Ile65 70 75 80
Ile Glu Asp Leu Ala Arg Asp Arg Ala Lys Ala Leu Phe Gly Ala Glu
85 90 95
Phe Ala Asn Val Gln Pro His Ser Gly Ala Gln Ala Asn Ala Ala Val
100 105 110
Leu Met Thr Leu Ala Glu Pro Gly Asp Lys Ile Met Gly Leu Ser Leu
115 120 125
Ala His Gly Gly His Leu Thr His Gly Met Lys Leu Asn Phe Ser Gly
130 135 140
Lys Leu Tyr Glu Val Val Ala Tyr Gly Val Asp Pro Glu Thr Met Arg145 150 155 160
Val Asp Met Asp Gln Val Arg Glu Ile Ala Leu Lys Glu Gln Pro Lys
165 170 175
Val Ile Ile Ala Gly Trp Ser Ala Tyr Pro Arg His Leu Asp Phe Glu
180 185 190
Ala Phe Gln Ser Ile Ala Ala Glu Val Gly Ala Lys Leu Trp Val Asp
195 200 205
Met Ala His Phe Ala Gly Leu Val Ala Ala Gly Leu His Pro Ser Pro
210 215 220
Val Pro Tyr Ser Asp Val Val Ser Ser Thr Val His Lys Thr Leu Gly225 230 235 240
Gly Pro Arg Ser Gly Ile Ile Leu Ala Lys Gln Glu Tyr Ala Lys Lys
245 250 255
Leu Asn Ser Ser Val Phe Pro Gly Gln Gln Gly Gly Pro Leu Met His
260 265 270
Ala Val Ala Ala Lys Ala Thr Ser Leu Lys Ile Ala Gly Asn Glu Gln
275 280 285
Phe Arg Asp Arg Gln Ala Arg Thr Leu Glu Gly Ala Arg Ile Leu Ala
290 295 300
Glu Arg Leu Thr Ala Ser Asp Ala Lys Ala Ala Gly Val Asp Val Leu305 310 315 320
Thr Gly Gly Thr Asp Val His Leu Val Leu Ala Asp Leu Arg Asn Ser
325 330 335
Gln Met Asp Gly Gln Gln Ala Glu Asp Leu Leu His Glu Val Gly Ile
340 345 350
Thr Val Asn Arg Asn Ala Val Pro Phe Asp Pro Arg Pro Pro Met Val
355 360 365
Thr Ser Gly Leu Arg Ile Gly Thr Pro Ala Leu Ala Thr Arg Gly Phe
370 375 380
Asp Ile Pro Ala Phe Thr Glu Val Ala Asp Ile Ile Gly Thr Ala Leu385 390 395 400
Ala Asn Gly Lys Ser Ala Asp Ile Glu Ser Leu Arg Gly Arg Val Ala
405 410 415
Lys Leu Ala Ala Asp Tyr Pro Leu Tyr Glu Gly Leu Glu Asp Trp Thr420 425 430
Ile Val
<210> 47<211> 1254<212> DNA
<213> Escherichia coli
<220>
<221> CDS
<222> (1).. (1254)
ctg tggLeu Trp15
gaa ctgGlu Leu
<400> 47
atg tta aag cgt gaa atg aacMet Leu Lys Arg Glu Met Asn1 5
cag gct atg gag cag gaa aaaGln Ala Met Glu Gln Glu Lys
att gcc gat tat gat gcc gaaIle Ala Asp Tyr Asp Ala Glu10
gta cgt cag gaa gag cac ateVal Arg Gln Glu Glu His Ile20 25 30
ate gcc tcc gaa aac tac acc age ccg cgc gta atg cag gcg cag ggt 144
Ile Ala Ser Glu Asn Tyr Thr Ser Pro Arg Val Met Gln Ala Gln Gly
35 40 45
tet cag ctg acc aac aaa tat gct gaa ggt tat ccg ggc aaa cgc tac 192
Ser Gln Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr
50 55 60
tac ggc ggt tgc gag tat gtt gat ate gtt gaa caa ctg gcg ate gat 240
Tyr Gly Gly Cys Glu Tyr Val Asp Ile Val Glu Gln Leu Ala Ile Asp65 70 75 80
cgt gcg aaa gaa ctg ttc ggc gct gac tac gct aac gtc cag ccg cac 288
Arg Ala Lys Glu Leu Phe Gly Ala Asp Tyr Ala Asn Val Gln Pro His
85 90 95
tcc ggc tcc cag gct aac ttt gcg gtc tac acc gcg ctg ctg gaa cca 336
Ser Gly Ser Gln Ala Asn Phe Ala Val Tyr Thr Ala Leu Leu Glu Pro
100 105 110
ggt gat acc gtt ctg ggt atg aac ctg gcg cat ggc ggt cac ctg act 384
Gly Asp Thr Val Leu Gly Met Asn Leu Ala His Gly Gly His Leu Thr
115 120 125
cac ggt tet ccg gtt aac ttc tcc ggt aaa ctg tac aac ate gtt cct 432
His Gly Ser Pro Val Asn Phe Ser Gly Lys Leu Tyr Asn Ile Val Pro
130 135 140
tac ggt ate gat gct acc ggt cat ate gac tac gcc gat ctg gaa aaa 480
Tyr Gly Ile Asp Ala Thr Gly His Ile Asp Tyr Ala Asp Leu Glu Lys145 150 155 160
caa gcc aaa gaa cac aag ccg aaa atg att ate ggt ggt ttc tet gea 528
Gln Ala Lys Glu His Lys Pro Lys Met Ile Ile Gly Gly Phe Ser Ala
165 170 175
tat tcc ggc gtg gtg gac tgg gcg aaa atg cgt gaa ate gct gac age 576
Tyr Ser Gly Val Val Asp Trp Ala Lys Met Arg Glu Ile Ala Asp Ser
180 185 190
ate ggt gct tac ctg ttc gtt gat atg gcg cac gtt gcg ggc ctg gtt 624
Ile Gly Ala Tyr Leu Phe Val Asp Met Ala His Val Ala Gly Leu Val
195 200 205
gct gct ggc gtc tac ccg aac ccg gtt cct cat gct cac gtt gtt act 672
Ala Ala Gly Val Tyr Pro Asn Pro Val Pro His Ala His Val Val Thr
210 215 220
acc acc act cac aaa acc ctg gcg ggt ccg cgc ggc ggc ctg ate ctg 720
Thr Thr Thr His Lys Thr Leu Ala Gly Pro Arg Gly Gly Leu Ile Leu ^
225 230 235 240
gcg aaa ggt ggt age gaa gag ctg tae aaa aaa ctg aac tet gcc gtt 7 68
Ala Lys Gly Gly Ser Glu Glu Leu Tyr Lys Lys Leu Asn Ser Ala Val
245 250 255
ttc cct ggt ggt cag ggc ggt ccg ttg atg cac gta ate gcc ggt aaa 816
Phe Pro Gly Gly Gln Gly Gly Pro Leu Met His Val Ile Ala Gly Lys
260 265 270
gcg gtt gct ctg aaa gaa gcg atg gag cct gag ttc aaa act tac cag 864
Ala Val Ala Leu Lys Glu Ala Met Glu Pro Glu Phe Lys Thr Tyr Gln
275 280 285
cag cag gtc gct aaa aac gct aaa gcg atg gta gaa gtg ttc ctc gag 912
Gln Gln Val Ala Lys Asn Ala Lys Ala Met Val Glu Val Phe Leu Glu
290 295 300
cgc ggc tac aaa gtg gtt tcc ggc ggc act gat aac cac ctg ttc ctg 960
Arg Gly Tyr Lys Val Val Ser Gly Gly Thr Asp Asn His Leu Phe Leu305 310 315 320
gtt gat ctg gtt gat aaa aac ctg acc ggt aaa gaa gea gac gcc gct1008
Val Asp Leu Val Asp Lys Asn Leu Thr Gly Lys Glu Ala Asp Ala Ala
325 330 335
ctg ggc cgt gct aac ate acc gtc aac aaa aac age gta ccg aac gat1056
Leu Gly Arg Ala Asn Ile Thr Val Asn Lys Asn Ser Val Pro Asn Asp340 345 350ccg aag age ccg ttt gtg acc tcc ggt att cgt gta ggt act ccg gcg1104 Pro Lys Ser Pro Phe Val Thr Ser Gly Ile Arg Val Gly Thr Pro Ala 355 360 365 att acc cgt cgc ggc ttt aaa gaa gcc gaa gcg aaa gaa ctg gct ggc1152 Ile Thr Arg Arg Gly Phe Lys Glu Ala Glu Ala Lys Glu Leu Ala Gly370 375 380 tgg atg tgt gac gtg ctg gac age ate aat gat gaa gcc gtt ate gag1200 Trp Met Cys Asp Val Leu Asp Ser Ile Asn Asp Glu Ala Val Ile Glu385 390 395 400cgc ate aaa ggt aaa gtt ctc gac ate tgc gea cgt tac ccg gtt tac1248 Arg Ile Lys Gly Lys Val Leu Asp Ile Cys Ala Arg Tyr Pro Val Tyr 405 410 415 gea taa 1254 Ala <210> 48 <211> 417 <212> PRT <213> Escherichia coli <400> 48 Met Leu Lys Arg Glu Met Asn Ile Ala Asp Tyr Asp Ala Glu Leu Trp1 5 10 15 Gln Ala Met Glu Gln Glu Lys Val Arg Gln Glu Glu His Ile Glu Leu 20 25 30 Ile Ala Ser Glu Asn Tyr Thr Ser Pro Arg Val Met Gln Ala Gln Gly 35 40 45 Ser Gln Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr50 55 60 Tyr Gly Gly Cys Glu Tyr Val Asp Ile Val Glu Gln Leu Ala Ile Asp65 70 75 80Arg Ala Lys Glu Leu Phe Gly Ala Asp Tyr Ala Asn Val Gln Pro His 85 90 95 Ser Gly Ser Gln Ala Asn Phe Ala Val Tyr Thr Ala Leu Leu Glu Pro 100 105 110 Gly Asp Thr Val Leu Gly Met Asn Leu Ala His Gly Gly His Leu Thr 115 120 125 His Gly Ser Pro Val Asn Phe Ser Gly Lys Leu Tyr Asn Ile Val Pro130 135 140 Tyr Gly Ile Asp Ala Thr Gly His Ile Asp Tyr Ala Asp Leu Glu Lys145 150 155 160Gln Ala Lys Glu His Lys Pro Lys Met Ile Ile Gly Gly Phe Ser Ala 165 170 175 Tyr Ser Gly Val Val Asp Trp Ala Lys Met Arg Glu Ile Ala Asp Ser 180 185 190 Ile Gly Ala Tyr Leu Phe Val Asp Met Ala His Val Ala Gly Leu Val 195 200 205 Ala Ala Gly Val Tyr Pro Asn Pro Val Pro His Ala His Val Val Thr210 215 220 Thr Thr Thr His Lys Thr Leu Ala Gly Pro Arg Gly Gly Leu Ile Leu225 230 235 240Ala Lys Gly Gly Ser Glu Glu Leu Tyr Lys Lys Leu Asn Ser Ala Val 245 250 255 Phe Pro Gly Gly Gln Gly Gly Pro Leu Met His Val Ile Ala Gly Lys 260 265 270 Ala Val Ala Leu Lys Glu Ala Met Glu Pro Glu Phe Lys Thr Tyr Gln 275 280 285Gln Gln Val Ala Lys Asn Ala Lys Ala Met Val Glu Val Phe Leu Glu 290 295 300 Arg Gly Tyr Lys Val Val Ser Gly Gly Thr Asp Asn His Leu Phe Leu305 310 315 320Val Asp Leu Val Asp Lys Asn Leu Thr Gly Lys Glu Ala Asp Ala Ala 325 330 335Leu Gly Arg Ala Asn Ile Thr Val Asn Lys Asn Ser Val Pro Asn Asp 340 345 350 Pro Lys Ser Pro Phe Val Thr Ser Gly Ile Arg Val Gly Thr Pro Ala 355 360 365 Ile Thr Arg Arg Gly Phe Lys Glu Ala Glu Ala Lys Glu Leu Ala Gly 370 375 380 Trp Met Cys Asp Val Leu Asp Ser Ile Asn Asp Glu Ala Val Ile Glu385 390 395 400Arg Ile Lys Gly Lys Val Leu Asp Ile Cys Ala Arg Tyr Pro Val Tyr
405 410 415
Ala
<210> 49<211> 1239<212> DNA
<213> Enterococcus faecalls
<220>
<221> CDS
<222> (1).. (1239)
<400> 49 atg gat tac aaa acg tat gac cca gat tta tgg aat gca att gca aga 48Met Asp Tyr Lys Thr Tyr Asp Pro Asp Leu Trp Asn Ala Ile Ala Arg 1 5 10 15 gaa gaa gag cgc caa gaa aat aac ttg gaa cta ate gca tet gag aat 96Glu Glu Glu Arg 20 Gln Glu Asn Asn Leu 25 Glu Leu Ile Ala Ser 30 Glu Asn gtt gtg tca aaa gca gtt atg gct gcc caa gga agt att tta acg aat 144Val Val Ser 35 Lys Ala Val Met Ala 40 Ala Gln Gly Ser Ile 45 Leu Thr Asn aaa tac gca gaa ggt tac cct ggc aaa cgg tac tat ggt ggt tgt gaa 192Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr Tyr Gly Gly Cys Glu 50 55 60 ttt ate gat ate gta gaa aat tta gct att gat cgt gcc aaa gaa tta 240Phe Ile Asp Ile Val Glu Asn Leu Ala Ile Asp Arg Ala Lys Glu Leu 65 70 75 80 ttt ggt gca aaa ttc gcg aat gta caa gcc cat tca ggt tet caa gcc 288Phe Gly Ala Lys Phe 85 Ala Asn Val Gln Ala 90 His Ser Gly Ser Gln 95 Ala aat aca gcg gca tac Ctt tca ttg gtt gaa cca ggt gat acc att ttg 336Asn Thr Ala Ala Tyr Leu Ser Leu Val Glu Pro Gly Asp Thr Ile Leu 100 105 110 ggg atg gat tta tca get ggt ggt cac tta aca cat ggt tcg CCC gtt 384Gly Met Asp Leu Ser Ala Gly Gly His Leu Thr His Gly Ser Pro Val 115 120 125 aac ttt agt ggc aaa acc tat aat ttt gtc agt tat gga gtg gat cct 432Asn Phe Ser Gly Lys Thr Tyr Asn Phe Val Ser Tyr Gly Val Asp Pro 130 135 140 tca aca gaa gta ate gat tac gat gtc gtg cga att tta gca aga gaa 480Ser Thr Glu Val Ile Asp Tyr Asp Val Val Arg Ile Leu Ala Arg Glu 145 150 155 160 cat cgt cca aaa cta ate att gca ggc gca agt gcg tat tca cga acg 528His Arg Pro Lys Leu Ile Ile Ala Gly Ala Ser Ala Tyr Ser Arg Thr 165 170 175 att gac ttc aaa cgt ttc cgt gaa ate gct gat gaa gta gat gcc aag 576Ile Asp Phe Lys Arg Ph© Arg Glu XXe AXa. Asp GXu VaX Asp AXa. Lys
180 185 190
tta atg gtt gat atg gca cat att gca ggc ttg gta gct tca ggg ttg 624
Leu Met Val Asp Met Ala His Ile Ala Gly Leu Val Ala Ser Gly Leu
195 200 205
cac cca aat cca gtt ccg tat gct gat ate gta aca agt acg acc cat 672
His Pro Asn Pro Val Pro Tyr Ala Asp Ile Val Thr Ser Thr Thr His
210 215 220
aaa aca ttg cgt ggt cct cgt ggc ggt tta att ttg aca aat age gaa 720
Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile Leu Thr Asn Ser Glu225 230 235 240
gaa ttg gcg aaa aaa gta aat agt agt att ttc cca ggc att caa ggt 768
Glu Leu Ala Lys Lys Val Asn Ser Ser Ile Phe Pro Gly Ile Gln Gly
245 250 255
ggc cca ttg gaa cat gtg att gcc gga aaa gcc gca gct ttt aaa gaa 816
Gly Pro Leu Glu His Val Ile Ala Gly Lys Ala Ala Ala Phe Lys Glu
260 265 270
gct ttg gat cca agt ttt gct gaa tat agt cag caa gtg att gca aat 864
Ala Leu Asp Pro Ser Phe Ala Glu Tyr Ser Gln Gln Val Ile Ala Asn
275 280 285
gca caa gcg atg acg aaa gtt ttc aat caa gcg cca gaa gct cgt tta 912
Ala Gln Ala Met Thr Lys Val Phe Asn Gln Ala Pro Glu Ala Arg Leu
290 295 300
att agt ggg gca aca gac aac cac tta tta ctg att gaa gtg aca ggt 960
Ile Ser Gly Ala Thr Asp Asn His Leu Leu Leu Ile Glu Val Thr Gly305 310 315 320
ttt ggt tta aat gga aaa gaa gca gaa gct att tta gat agt gta aat1008
Phe Gly Leu Asn Gly Lys Glu Ala Glu Ala Ile Leu Asp Ser Val Asn
325 330 335
att act gtc aat aaa aat tca att ccg ttt gaa caa tta agt cca ttt1056
Ile Thr Val Asn Lys Asn Ser Ile Pro Phe Glu Gln Leu Ser Pro Phe
340 345 350
aaa aca agt ggt ate cgt att gga acg cct gca att act tca cgt ggt1104
Lys Thr Ser Gly Ile Arg Ile Gly Thr Pro Ala Ile Thr Ser Arg Gly
355 360 365
ttt aaa gaa gaa gat gcg gta gaa gtt gct aaa tta ate gtt caa gtc1152
Phe Lys Glu Glu Asp Ala Val Glu Val Ala Lys Leu Ile Val Gln Val
370 375 380
tta aaa gat cca gaa aat aca gca gtt cat gat gaa gtt aaa gca gct1200
Leu Lys Asp Pro Glu Asn Thr Ala Val His Asp Glu Val Lys Ala Ala385 390 395 400
gta gca gcg cta act aaa aaa tat cca tta tat aac taa1239
Val Ala Ala Leu Thr Lys Lys Tyr Pro Leu Tyr Asn405 410
<210> 50<211> 412<212> PRT
<213> Enterococcus faecalis<400> 50
Met Asp Tyr Lys Thr Tyr Asp Pro1 5
Glu Glu Glu Arg Gln Glu Asn Asn20
Val Val Ser Lys Ala Val Met Ala35 40
Asp Leu Trp Asn Ala Ile Ala Arg
10 15
Leu Glu Leu Ile Ala Ser Glu Asn25 30
Ala Gln Gly Ser Ile Leu Thr Asn45Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr Tyr Gly Gly Cys Glu 50 55 60 Phe Ile Asp Ile Val Glu Asn Leu Ala Ile Asp Arg Ala Lys Glu Leu65 70 75 80Phe Gly Ala Lys Phe Ala Asn Val Gln Ala His Ser Gly Ser Gln Ala 85 90 95 Asn Thr Ala Ala Tyr Leu Ser Leu Val Glu Pro Gly Asp Thr Ile Leu 100 105 110 Gly Met Asp Leu Ser Ala Gly Gly His Leu Thr His Gly Ser Pro Val 115 120 125 Asn Phe Ser Gly Lys Thr Tyr Asn Phe Val Ser Tyr Gly Val Asp Pro 130 135 140 Ser Thr Glu Val Ile Asp Tyr Asp Val Val Arg Ile Leu Ala Arg Glu145 150 155 160His Arg Pro Lys Leu Ile Ile Ala Gly Ala Ser Ala Tyr Ser Arg Thr 165 170 175 Ile Asp Phe Lys Arg Phe Arg Glu Ile Ala Asp Glu Val Asp Ala Lys 180 185 190 Leu Met Val Asp Met Ala His Ile Ala Gly Leu Val Ala Ser Gly Leu 195 200 205 His Pro Asn Pro Val Pro Tyr Ala Asp Ile Val Thr Ser Thr Thr His 210 215 220 Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile Leu Thr Asn Ser Glu225 230 235 240Glu Leu Ala Lys Lys Val Asn Ser Ser Ile Phe Pro Gly Ile Gln Gly 245 250 255 Gly Pro Leu Glu His Val Ile Ala Gly Lys Ala Ala Ala Phe Lys Glu 260 265 270 Ala Leu Asp Pro Ser Phe Ala Glu Tyr Ser Gln Gln Val Ile Ala Asn 275 280 285 Ala Gln Ala Met Thr Lys Val Phe Asn Gln Ala Pro Glu Ala Arg Leu 290 295 300 Ile Ser Gly Ala Thr Asp Asn His Leu Leu Leu Ile Glu Val Thr Gly305 310 315 320Phe Gly Leu Asn Gly Lys Glu Ala Glu Ala Ile Leu Asp Ser Val Asn 325 330 335 Ile Thr Val Asn Lys Asn Ser Ile Pro Phe Glu Gln Leu Ser Pro Phe 340 345 350 Lys Thr Ser Gly Ile Arg Ile Gly Thr Pro Ala Ile Thr Ser Arg Gly 355 360 365 Phe Lys Glu Glu Asp Ala Val Glu Val Ala Lys Leu Ile Val Gln Val 370 375 380 Leu Lys Asp Pro Glu Asn Thr Ala Val His Asp Glu Val Lys Ala Ala385 390 395 400Val Ala Ala Leu Thr Lys Lys Tyr Pro Leu Tyr Asn 405 410 <210> 51 <211> 1266 <212> DNA <213> Haemophilus influenzae <220> <221> CDS <222> (1)..ι (1266) <400> 51 atg ttt aca aga aat atg act ate gct gat tac gat cca gta ttg tggMet Phe Thr Arg Asn Met Thr Ile Ala Asp Tyr Asp Pro Val Leu Trp1 5 10 15 caa gcg att caa gat gaa aat cgt cgt caa gaa gaa cat ate gaa CtCGln Ala Ile Gln Asp Glu Asn Arg Arg Gln Glu Glu His Ile Glu Leu
20 25 30att gca tct gaa aac tat gcg agt cca cgt gtg atg gaa gcg caa ggt 144
Ile Ala Ser Glu Asn Tyr Ala Ser Pro Arg Val Met Glu Ala Gln Gly
35 40 45
tca caa ttc act aat aaa tat gcg gaa ggc tat cca ggt aaa cgt tat 192
Ser Gln Phe Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr
50 55 60
tac ggt ggt tgt gag tat gct gac att gtg gaa cag tta gca att gac 240
Tyr Gly Gly Cys Glu Tyr Ala Asp Ile Val Glu Gln Leu Ala Ile Asp65 70 75 80
cgt gcg aaa gaa tta ttt ggt gca gat tac gtg aat gtt caa ccg cac 288
Arg Ala Lys Glu Leu Phe Gly Ala Asp Tyr Val Asn Val Gln Pro His
85 90 95
tct gga tca caa gcg aat gct gcg gtg tat ggt gca ttg att aat gca 336
Ser Gly Ser Gln Ala Asn Ala Ala Val Tyr Gly Ala Leu Ile Asn Ala
100 105 110
ggc gat act att tta ggt atg gat ttg gct cac ggt ggt cat tta act 384
Gly Asp Thr Ile Leu Gly Met Asp Leu Ala His Gly Gly His Leu Thr
115 120 125
cac ggt gca aaa gtc agt ttc tct ggc aaa att tat aac tcc gta ctt 432
His Gly Ala Lys Val Ser Phe Ser Gly Lys Ile Tyr Asn Ser Val Leu
130 135 140
tat gga att act gcg gat ggc tta att gat tat gaa gat gtt cgt caa 480
Tyr Gly Ile Thr Ala Asp Gly Leu Ile Asp Tyr Glu Asp Val Arg Gln145 150 155 160
aaa gca tta gaa tgt aaa cca aaa ctt ate gtt gct ggt ttc tcg gct 528
Lys Ala Leu Glu Cys Lys Pro Lys Leu Ile Val Ala Gly Phe Ser Ala
165 170 175
tat tca caa gtt gtg gat tgg gcg aaa atg cgt gaa ate gca gat gaa 576
Tyr Ser Gln Val Val Asp Trp Ala Lys Met Arg Glu Ile Ala Asp Glu
180 185 190
gtt ggt gcg tat tta ttt gtg gat atg gcg cat gta gcg gga tta att 624
Val Gly Ala Tyr Leu Phe Val Asp Met Ala His Val Ala Gly Leu Ile
195 200 205
gca gcg ggt tta tat cca aat cca cta ccg cat gca cat gtt gtg aca 672
Ala Ala Gly Leu Tyr Pro Asn Pro Leu Pro His Ala His Val Val Thr
210 215 220
aca aca act cac aaa aca ttg ggc ggt ccg cgt ggt ggt tta att ctt 720
Thr Thr Thr His Lys Thr Leu Gly Gly Pro Arg Gly Gly Leu Ile Leu225 230 235 240
tca tct tgt ggc gat gaa gaa ate tac aaa aaa tta caa tca tcc gta 768
Ser Ser Cys Gly Asp Glu Glu Ile Tyr Lys Lys Leu Gln Ser Ser Val
245 250 255
ttc cct gca aac caa ggg ggt cca tta gtt cat att att gcg gca aaa 816
Phe Pro Ala Asn Gln Gly Gly Pro Leu Val His Ile Ile Ala Ala Lys
260 265 270
gca gtt tgc ttt aaa gga gca tta gag cct caa tat aaa gaa tac caa 864
Ala Val Cys Phe Lys Gly Ala Leu Glu Pro Gln Tyr Lys Glu Tyr Gln
275 280 285
gca aat gta ate aaa aat gca aaa gca atg gtt gaa gta ttt aaa caa 912
Ala Asn Val Ile Lys Asn Ala Lys Ala Met Val Glu Val Phe Lys Gln
290 295 300
cgt ggt tat gac gtt gtg tca aat ggt act gaa aac cac ttg ttc tta 960
Arg Gly Tyr Asp Val Val Ser Asn Gly Thr Glu Asn His Leu Phe Leu305 310 315 320
gta agt ttc ate aaa caa gga tta aca ggt aaa gca gca gat gcg gca1008
Val Ser Phe Ile Lys Gln Gly Leu Thr Gly Lys Ala Ala Asp Ala Ala
325 330 335
ttg ggc aaa gca aat att acc gtg aat aaa aat gct gta cca aac gat1056
Leu Gly Lys Ala Asn Ile Thr Val Asn Lys Asn Ala Val Pro Asn Asp
340 345 350
ccg caa aaa cca ttc gtc act tct ggc ate cgt gta ggt aca cca tct1104
Pro Gln Lys355
gtg act cgt1152
Val Thr Arg
370tgg atg tgt1200
Trp Met Cys385
gtg att gct1248
Val Ile Ala
cca gtt tat1266
Pro Val Tyr
<210> 52<211> 421<212> PRT<213> Haemophilus influenzae
<400> 52 Met Phe Thr Arg Asn Met Thr Ile Ala Asp Tyr Asp Pro Val Leu Trp1 5 10 15 Gln Ala Ile Gln Asp Glu Asn Arg Arg Gln Glu Glu His Ile Glu Leu 20 25 30 Ile Ala Ser Glu Asn Tyr Ala Ser Pro Arg Val Met Glu Ala Gln Gly 35 40 45 Ser Gln Phe Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr 50 55 60 Tyr Gly Gly Cys Glu Tyr Ala Asp Ile Val Glu Gln Leu Ala Ile Asp65 70 75 80Arg Ala Lys Glu Leu Phe Gly Ala Asp Tyr Val Asn Val Gln Pro His 85 90 95 Ser Gly Ser Gln Ala Asn Ala Ala Val Tyr Gly Ala Leu Ile Asn Ala 100 105 110 Gly Asp Thr Ile Leu Gly Met Asp Leu Ala His Gly Gly His Leu Thr 115 120 125 His Gly Ala Lys Val Ser Phe Ser Gly Lys Ile Tyr Asn Ser Val Leu 130 135 140 Tyr Gly Ile Thr Ala Asp Gly Leu Ile Asp Tyr Glu Asp Val Arg Gln145 150 155 160Lys Ala Leu Glu Cys Lys Pro Lys Leu Ile Val Ala Gly Phe Ser Ala 165 170 175 Tyr Ser Gln Val Val Asp Trp Ala Lys Met Arg Glu Ile Ala Asp Glu 180 185 190 Val Gly Ala Tyr Leu Phe Val Asp Met Ala His Val Ala Gly Leu Ile 195 200 205 Ala Ala Gly Leu Tyr Pro Asn Pro Leu Pro His Ala His Val Val Thr 210 215 220 Thr Thr Thr His Lys Thr Leu Gly Gly Pro Arg Gly Gly Leu Ile Leu225 230 235 240Ser Ser Cys Gly Asp Glu Glu Ile Tyr Lys Lys Leu Gln Ser Ser Val 245 250 255 Phe Pro Ala Asn Gln Gly Gly Pro Leu Val His Ile Ile Ala Ala Lys 260 265 270 Ala Val Cys Phe Lys Gly Ala Leu Glu Pro Gln Tyr Lys Glu Tyr Gln 275 280 285 Ala Asn Val Ile Lys Asn Ala Lys Ala Met Val Glu Val Phe Lys Gln
Pro Phe Val Thr Ser Gly Ile Arg Val Gly Thr Pro Ser 360 365 cgt ggt ttc aat gaa aat gat gtg cgt gaa tta gct ggcArg Gly Phe Asn Glu Asn Asp Val Arg Glu Leu Ala Gly 375 380 gat gtt tta gat gct tta ggc aaa gaa aat gaa gaa caaAsp Val Leu Asp Ala Leu Gly Lys Glu Asn Glu Glu Gln 390 395 400gaa act aaa gaa aaa gta tta gca att tgt aaa cgt CttGlu Thr Lys Glu Lys Val Leu Ala Ile Cys Lys Arg Leu
405 410 415
ccg aaa tga
Pro Lys420290 295 300
Arg Gly Tyr Asp Val Val Ser Asn Gly Thr Glu Asn His Leu Phe Leu305 310 315 320
Val Ser Phe Ile Lys Gln Gly Leu Thr Gly Lys Ala Ala Asp Ala Ala
325 330 335
Leu Gly Lys Ala Asn Ile Thr Val Asn Lys Asn Ala Val Pro Asn Asp
340 345 350
Pro Gln Lys Pro Phe Val Thr Ser Gly Ile Arg Val Gly Thr Pro Ser
355 360 365
Val Thr Arg Arg Gly Phe Asn Glu Asn Asp Val Arg Glu Leu Ala Gly
370 375 380
Trp Met Cys Asp Val Leu Asp Ala Leu Gly Lys Glu Asn Glu Glu Gln385 390 395 400
Val Ile Ala Glu Thr Lys Glu Lys Val Leu Ala Ile Cys Lys Arg Leu
405 410 415
Pro Val Tyr Pro Lys420
<210> 53<211> 1254<212> DNA
<213> Pseudomonas aeruginosa
<220>
<221> CDS
<222> (1) . . (1254)
<400> 53
atg ttc age cgt gat ttg acc ctc gcc cgc tac gat gcc gaa ctc ttt 48
Met Phe Ser Axg Asp Leu Thir Lsu Ais. Airg Tyx Asp Ais, Glu Leu Phe1 5 10 15
gcc gcg atg gag cag gaa gcc cag cgc cag gaa gag cac ate gag ctg 96
Ala Ala Met Glu Gln Glu Ala Gln Arg Gln Glu Glu His Ile Glu Leu
20 25 30
ate gcc tcc gag aac tac acc age ccg gcg gtg atg gaa gcc cag ggt 144
Ile Ala Ser Glu Asn Tyr Thr Ser Pro Ala Val Met Glu Ala Gln Gly
35 40 45
tcg gtg ctg acc aac aag tac gcc gaa ggt tat ccg cac aag cgc tac 192
Ser Val Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro His Lys Arg Tyr
50 55 60
tac ggc ggc tgc gag tac gtc gat ate gtc gag caa ctg gcc ate gac 240
Tyr Gly Gly Cys Glu Tyr Val Asp Ile Val Glu Gln Leu Ala Ile Asp65 70 75 80
cgc gcc aag caa ctg ttc ggc gcc gat tac gcc aac gtc cag ccg cac 288
Arg Ala Lys Gln Leu Phe Gly Ala Asp Tyr Ala Asn Val Gln Pro His
85 90 95
gcc ggc tcc cag gcc aac gcc gcg gtc tac ctg gcc ctg ctg tcg gcc 336
Ala Gly Ser Gln Ala Asn Ala Ala Val Tyr Leu Ala Leu Leu Ser Ala
100 105 110
ggc gac acc ate ctc ggc atg age ctg gcc cat ggc ggc cac ctg acc 384
Gly Asp Thr Ile Leu Gly Met Ser Leu Ala His Gly Gly His Leu Thr
115 120 125
cac ggc gcc age gtc tcc tcc tcc ggc aag ctg tac aac gcc gtg cag 432
His Gly Ala Ser Val Ser Ser Ser Gly Lys Leu Tyr Asn Ala Val Gln
130 135 140
tac ggc ate gac gcc aat ggc ctg ate gac tac gac gaa gtc gag cgc 480
Tyr Gly Ile Asp Ala Asn Gly Leu Ile Asp Tyr Asp Glu Val Glu Arg145 150 155 160
ctg gcc gtg gag cac aag ccg aag atg ate gtc gcc ggc ttc tcc gcc 528
Leu Ala Val Glu His Lys Pro Lys Met Ile Val Ala Gly Phe Ser Ala
165 170 175
tat tcc cag gtc ctc gat ttc gcc cgc ttc cgc gcc ate gcc gac aag 576
Tyr Ser Gln Val Leu Asp Phe Ala Arg Phe Arg Ala Ile Ala Asp Lys180 185 190
gtc ggc gcc tac ctg ttc gtc gac atg gcc cac gtc gcc ggc ctg gtc 624
Val Gly Ala Tyr Leu Phe Val Asp Met Ala His Val Ala Gly Leu Val
195 200 205
gcc gct ggc gtc tac ccg aac ccg gtg ccg ttc gcc gac gtg gtc acc 672
Ala Ala Gly Val Tyr Pro Asn Pro Val Pro Phe Ala Asp Val Val Thr
210 215 220
acc acc acc cac aag acc ctg cgc ggt ccg cgc ggt ggc ctg ate ctg 720
Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile Leu225 230 235 240
gcg cgc gcc aac gag gag ate gag aag aag ctc aac tcc gcg gta ttc 768
Ala Arg Ala Asn Glu Glu Ile Glu Lys Lys Leu Asn Ser Ala Val Phe
245 250 255
ccc age gcc cag ggc ggt ccg ctg gag cac gtg ate gcg gcc aag gcg 816
Pro Ser Ala Gln Gly Gly Pro Leu Glu His Val Ile Ala Ala Lys Ala
260 265 270
gtg tgc ttc aag gaa gcc ctg cag ccg gag ttc aag acc tac cag cag 864
Val Cys Phe Lys Glu Ala Leu Gln Pro Glu Phe Lys Thr Tyr Gln Gln
275 280 285
cag gtc ctg aag aac gcc cag age atg gcc cag gtc ttc ctg gac cgc 912
Gln Val Leu Lys Asn Ala Gln Ser Met Ala Gln Val Phe Leu Asp Arg
290 295 300
ggt ttc gac gtg gtt tcc ggc ggc acc cag aac cac ctg ttc ctg ctc 960
Gly Phe Asp Val Val Ser Gly Gly Thr Gln Asn His Leu Phe Leu Leu305 310 315 320
tcc ctg ate aag cag gac ate acc ggc aaa gac gcc gac gcc gcc ctc1008
Ser Leu Ile Lys Gln Asp Ile Thr Gly Lys Asp Ala Asp Ala Ala Leu
325 330 335
ggc cgc gcg ttc ate acc gtg aac aag aac tcg gtc ccg aac gac ccg1056
Gly Arg Ala Phe Ile Thr Val Asn Lys Asn Ser Val Pro Asn Asp Pro
340 345 350
cgc tcg ccg ttc gtc acc tcc ggc ctg cgc ate ggt acc ccg gcc gtg1104
Arg Ser Pro Phe Val Thr Ser Gly Leu Arg Ile Gly Thr Pro Ala Val
355 360 365
acc acc cgc ggc ttc aag gaa gcc gag tgc cgc gag ctg gcc ggc tgg1152
Thr Thr Arg Gly Phe Lys Glu Ala Glu Cys Arg Glu Leu Ala Gly Trp
370 375 380
ate tgc gac ate ctc gag aac atg ggc gac gag tcc gtg gtc gac ggc1200
Ile Cys Asp Ile Leu Glu Asn Met Gly Asp Glu Ser Val Val Asp Gly385 390 395 400
gta cgc gag aag gtc aag gcg ate tgc gcc aag ttc ccg gtc tac ggc1248
Val Arg Glu Lys Val Lys Ala Ile Cys Ala Lys Phe Pro Val Tyr Gly405 410 415
aac taa
1254
Asn
<210> 54<211> 417<212> PRT
<213> Pseudomonas aeruginosa<400> 54
Met Phe Ser Arg Asp Leu Thr Leu Ala Arg Tyr Asp Ala Glu Leu Phe1 5 10 15
Ala Ala Met Glu Gln Glu Ala Gln Arg Gln Glu Glu His Ile Glu Leu20 25 30
Ile Ala Ser Glu Asn Tyr Thr Ser Pro Ala Val Met Glu Ala Gln Gly
35 40 45
Ser Val Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro His Lys Arg Tyr
50 55 60
Tyr Gly Gly Cys Glu Tyr Val Asp Ile Val Glu Gln Leu Ala Ile Asp65 70 75 80
Arg Ala Lys Gln Leu Phe Gly Ala Asp Tyr Ala Asn Val Gln Pro His
85 90 95
Ala Gly Ser Gln Ala Asn Ala Ala Val Tyr Leu Ala Leu Leu Ser Ala
100 105 110
Gly Asp Thr Ile Leu Gly Met Ser Leu Ala His Gly Gly His Leu Thr
115 120 125
His Gly Ala Ser Val Ser Ser Ser Gly Lys Leu Tyr Asn Ala Val Gln
130 135 140
Tyr Gly Ile Asp Ala Asn Gly Leu Ile Asp Tyr Asp Glu Val Glu Arg145 150 155 160
Leu Ala Val Glu His Lys Pro Lys Met Ile Val Ala Gly Phe Ser Ala
165 170 175
Tyr Ser Gln Val Leu Asp Phe Ala Arg Phe Arg Ala Ile Ala Asp Lys
180 185 190
Val Gly Ala Tyr Leu Phe Val Asp Met Ala His Val Ala Gly Leu Val
195 200 205
Ala Ala Gly Val Tyr Pro Asn Pro Val Pro Phe Ala Asp Val Val Thr
210 215 220
Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile Leu225 230 235 240
Ala Arg Ala Asn Glu Glu Ile Glu Lys Lys Leu Asn Ser Ala Val Phe
245 250 255
Pro Ser Ala Gln Gly Gly Pro Leu Glu His Val Ile Ala Ala Lys Ala
260 265 270
Val Cys Phe Lys Glu Ala Leu Gln Pro Glu Phe Lys Thr Tyr Gln Gln
275 280 285
Gln Val Leu Lys Asn Ala Gln Ser Met Ala Gln Val Phe Leu Asp Arg
290 295 300
Gly Phe Asp Val Val Ser Gly Gly Thr Gln Asn His Leu Phe Leu Leu305 310 315 320
Ser Leu Ile Lys Gln Asp Ile Thr Gly Lys Asp Ala Asp Ala Ala Leu
325 - 330 335
Gly Arg Ala Phe Ile Thr Val Asn Lys Asn Ser Val Pro Asn Asp Pro
340 345 350
Arg Ser Pro Phe Val Thr Ser Gly Leu Arg Ile Gly Thr Pro Ala Val
355 360 365
Thr Thr Arg Gly Phe Lys Glu Ala Glu Cys Arg Glu Leu Ala Gly Trp
370 375 380
Ile Cys Asp Ile Leu Glu Asn Met Gly Asp Glu Ser Val Val Asp Gly385 390 395 400
Val Arg Glu Lys Val Lys Ala Ile Cys Ala Lys Phe Pro Val Tyr Gly405 410 415
Asn
<210> 55<211> 1257<212> DNA
<213> Streptococcus pneumoniae
<220>
<221> CDS
<222> (1).. (1257)
<400> 55
atg att ttt gac aaa gat gat ttt aaa gca tat gat gct gat etc tggMet Ile Phe Asp Lys Asp Asp Phe Lys Ala Tyr Asp Ala Asp Leu Trp1 5 10 15
aat gct att gcc aaa gaa gaa gaa cgc caa caa aat aat ate gag tta 96
Asn Ala Ile Ala Lys Glu Glu Glu Arg Gln Gln Asn Asn Ile Glu Leu
20 25 30
att gct tcg gaa aac gta gtt tcc aag gct gtt atg gea gct caa ggg 144
Ile Ala Ser Glu Asn Val Val Ser Lys Ala Val Met Ala Ala Gln Gly
35 40 45
tet ate ttg aca aat aaa tat gcc gag ggt tac cca gga cgc cgt tat 192
Ser Ile Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Arg Arg Tyr
50 55 60
tat ggt gga act gat gta gta gac gtt gta gag act ctt gct att gaa 240
Tyr Gly Gly Thr Asp Val Val Asp Val Val Glu Thr Leu Ala Ile Glu65 70 75 80
cgc gea aaa gaa att ttc ggt gct aaa ttt gct aat gtc caa cca cat 288
Arg Ala Lys Glu Ile Phe Gly Ala Lys Phe Ala Asn Val Gln Pro His
85 90 95
tca gga age caa gct aac tgt gcg gct tac atg tcc ttg att gag cca 336
Ser Gly Ser Gln Ala Asn Cys Ala Ala Tyr Met Ser Leu Ile Glu Pro
100 105 110
ggt gat acg gtt atg gga atg gat ttg gea gea ggt gga cac ttg acc 384
Gly Asp Thr Val Met Gly Met Asp Leu Ala Ala Gly Gly His Leu Thr
115 120 125
cac gga gct cca gtt age ttc tet ggt caa acc tac aac ttt ctt tcc 432
His Gly Ala Pro Val Ser Phe Ser Gly Gln Thr Tyr Asn Phe Leu Ser
130 135 140
tat agt gtg gat cct gaa acg gaa ctt ttg gac ttt gat gct ate ttg 480
Tyr Ser Val Asp Pro Glu Thr Glu Leu Leu Asp Phe Asp Ala Ile Leu145 150 155 160
aaa caa gcc caa gaa gta aaa cca aaa ctg att gta gct ggt gct tca 528
Lys Gln Ala Gln Glu Val Lys Pro Lys Leu Ile Val Ala Gly Ala Ser
165 170 175
gea tat tet caa att ate gat ttt tca aaa ttc cgt gaa ate gea gat 576
Ala Tyr Ser Gln Ile Ile Asp Phe Ser Lys Phe Arg Glu Ile Ala Asp
180 185 190
gct gtc ggt gcg aag etc atg gtg gac atg gcc cat ate gct ggt ttg 624
Ala Val Gly Ala Lys Leu Met Val Asp Met Ala His Ile Ala Gly Leu
195 200 205
gtt gcg gct ggc ctt cat cca age cca gtt cca tac gct cat ate aca 672
Val Ala Ala Gly Leu His Pro Ser Pro Val Pro Tyr Ala His Ile Thr
210 215 220
aca aca acg acc cac aaa acc ctt cgt gga cct cgt ggt ggt ttg att 720
Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile225 230 235 240
ttg acc aat gac gaa gaa ctt gct aaa aaa ate aat tca gct att ttc 768
Leu Thr Asn Asp Glu Glu Leu Ala Lys Lys Ile Asn Ser Ala Ile Phe
245 250 255
cca ggt att cag ggc ggt cct tta gag cat gtt gtg gcg gct aag gea 816
Pro Gly Ile Gln Gly Gly Pro Leu Glu His Val Val Ala Ala Lys Ala
260 265 270
gtt tcc ttc aaa gaa gtt ttg gat cca gcc ttc aag gaa tat gct gcc 864
Val Ser Phe Lys Glu Val Leu Asp Pro Ala Phe Lys Glu Tyr Ala Ala
275 280 285
aat gta att aag aac age aag gct atg gea gat gtc ttc ttg caa gac 912
Asn Val Ile Lys Asn Ser Lys Ala Met Ala Asp Val Phe Leu Gln Asp
290 295 300
cct gat ttc cgt att att tca ggt gga act gaa aac cat ctc ttc ctt 960
Pro Asp Phe Arg Ile Ile Ser Gly Gly Thr Glu Asn His Leu Phe Leu305 310 315 320
gtt gat gtg act aag gtt gta gaa aac gga aaa gtt gct caa aac ttg1008
Val Asp Val Thr Lys Val Val Glu Asn Gly Lys Val Ala Gln Asn Leu325 330 335ctg gat gaa gtc aat att acc cta aat aaa aat tca ate cct tac gaa1056
Leu Asp Glu Val Asn Ile Thr Leu Asn Lys Asn Ser Ile Pro Tyr Glu
340 345 350
acc ttg tcg cca ttc aag aca agt ggg att cgt ate gga gea gea gct1104
Thr Leu Ser Pro Phe Lys Thr Ser Gly Ile Arg Ile Gly Ala Ala Ala
355 360 365
att act gea cgt gga ttt ggt gaa gaa gaa agt cgc aaa gtg gct gaa1152
Ile Thr Ala Arg Gly Phe Gly Glu Glu Glu Ser Arg Lys Val Ala Glu
370 375 380
ctc ate att aaa acc ctt aag aat tca gaa aat gag gct gta tta gaa1200
Leu Ile Ile Lys Thr Leu Lys Asn Ser Glu Asn Glu Ala Val Leu Glu385 390 395 400
gaa gtg aga agt gea gtc aaa gaa ttg aca gat gcc ttc cca tta tac1248
Glu Val Arg Ser Ala Val Lys Glu Leu Thr Asp Ala Phe Pro Leu Tyr405 410 415
gag gac taa
1257
Glu Asp
<210> 56<211> 418<212> PRT
<213> Streptococcus pneumoniae<400> 56
Met Ile Phe Asp Lys Asp Asp Phe Lys Ala Tyr Asp Ala Asp Leu Trp1 5 10 15
Asn Ala Ile Ala Lys Glu Glu Glu Arg Gln Gln Asn Asn Ile Glu Leu
20 25 30
Ile Ala Ser Glu Asn Val Val Ser Lys Ala Val Met Ala Ala Gln Gly
35 40 45
Ser Ile Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Arg Arg Tyr
50 55 60
Tyr Gly Gly Thr Asp Val Val Asp Val Val Glu Thr Leu Ala Ile Glu65 70 75 80
Arg Ala Lys Glu Ile Phe Gly Ala Lys Phe Ala Asn Val Gln Pro His
85 90 95
Ser Gly Ser Gln Ala Asn Cys Ala Ala Tyr Met Ser Leu Ile Glu Pro
100 105 110
Gly Asp Thr Val Met Gly Met Asp Leu Ala Ala Gly Gly His Leu Thr
115 120 125
His Gly Ala Pro Val Ser Phe Ser Gly Gln Thr Tyr Asn Phe Leu Ser
130 135 140
Tyr Ser Val Asp Pro Glu Thr Glu Leu Leu Asp Phe Asp Ala Ile Leu145 150 155 160
Lys Gln Ala Gln Glu Val Lys Pro Lys Leu Ile Val Ala Gly Ala Ser
165 170 175
Ala Tyr Ser Gln Ile Ile Asp Phe Ser Lys Phe Arg Glu Ile Ala Asp
180 185 190
Ala Val Gly Ala Lys Leu Met Val Asp Met Ala His Ile Ala Gly Leu
195 200 205
Val Ala Ala Gly Leu His Pro Ser Pro Val Pro Tyr Ala His Ile Thr
210 215 220
Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile225 230 235 240
Leu Thr Asn Asp Glu Glu Leu Ala Lys Lys Ile Asn Ser Ala Ile Phe245 250 255Pro Gly Ile Gln Gly Gly Pro Leu Glu His Val Val Ala Ala Lys Ala
260 265 270
Val Ser Phe Lys Glu Val Leu Asp Pro Ala Phe Lys Glu Tyr Ala Ala
275 280 285
Asn Val Ile Lys Asn Ser Lys Ala Met Ala Asp Val Phe Leu Gln Asp
290 295 300
Pro Asp Phe Arg Ile Ile Ser Gly Gly Thr Glu Asn His Leu Phe Leu305 310 315 320
Val Asp Val Thr Lys Val Val Glu Asn Gly Lys Val Ala Gln Asn Leu
325 330 335
Leu Asp Glu Val Asn Ile Thr Leu Asn Lys Asn Ser Ile Pro Tyr Glu
340 345 350
Thr Leu Ser Pro Phe Lys Thr Ser Gly Ile Arg Ile Gly Ala Ala Ala
355 360 365
Ile Thr Ala Arg Gly Phe Gly Glu Glu Glu Ser Arg Lys Val Ala Glu
370 375 380
Leu Ile Ile Lys Thr Leu Lys Asn Ser Glu Asn Glu Ala Val Leu Glu385 390 395 400
Glu Val Arg Ser Ala Val Lys Glu Leu Thr Asp Ala Phe Pro Leu Tyr405 410 415
Glu Asp
<210> 57<211> 1260<212> DNA
<213> Salmonella typhi
<220>
<221> CDS
<222> (1) .. (1260)
<400> 57
atg cgg atg tta aag cgt gaa atg aac att gcc gat tat gat gcc gaa 48
Met Arg Met Leu Lys Arg Glu Met Asn Ile Ala Asp Tyr Asp Ala Glu15 10 15
ttg tgg cag gct atg gag cag gaa aaa gta cgt cag gaa gag cac ate 96
Leu Trp Gln Ala Met Glu Gln Glu Lys Val Arg Gln Glu Glu His Ile
20 25 30--
gaa ctg ate gcc tcc gaa aac tac acc age ccg cgc gtg atg cag gcg 144
Glu Leu Ile Ala Ser Glu Asn Tyr Thr Ser Pro Arg Val Met Gln Ala
35 40 45
cag ggg tet cag ctg acc aac aaa tac gct gaa gga tat ccg ggc aag 192
Gln Gly Ser Gln Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys
50 55 60
cgc tac tac ggc ggt tgc gaa tac gtt gat gtc gta gag cag ctg gct 240
Arg Tyr Tyr Gly Gly Cys Glu Tyr Val Asp Val Val Glu Gln Leu Ala65 70 75 80
ate gac cgc gcg aaa gaa ctg ttc ggc gcc gac tac gct aac gtg cag 288
Ile Asp Arg Ala Lys Glu Leu Phe Gly Ala Asp Tyr Ala Asn Val Gln
85 90 95
ccg cac tcc ggt tet cag gct aac ttc gct gtt tac acc gcg ctg ctg 336
Pro His Ser Gly Ser Gln Ala Asn Phe Ala Val Tyr Thr Ala Leu Leu
100 105 110
cag ccg ggc gat acc gtt ctg ggt atg aac ctg gcg cag ggc ggc cac 384
Gln Pro Gly Asp Thr Val Leu Gly Met Asn Leu Ala Gln Gly Gly His
115 120 125
ctg act cac ggc tcc ccg gtt aac ttc tcc ggt aaa ctg tac aac ate 432
Leu Thr His Gly Ser Pro Val Asn Phe Ser Gly Lys Leu Tyr Asn Ile
130 135 140
gta cct tac ggt ate gat gag tcc ggt aaa att gac tat gac gag atg 480
Val Pro Tyr Gly Ile Asp Glu Ser Gly Lys Ile Asp Tyr Asp Glu Met145 150 155 160gcg aag ctg gccAla Lys Leu Ala
tct gcc tac tccSer Ala Tyr Ser180
gac age ate ggcAsp Ser Ile Gly195
ctg att gcc geaLeu Ile Ala Ala210
gtc acc acc accVal Thr Thr Thr225
ate ctg gcg aaaIle Leu Ala Lys
gcc gtc ttc ccaAla Val Phe Pro260
ggt aaa gcg gtaGly Lys Ala Val275
tac cag cag cagTyr Gln Gln Gln290
ctg aac cgc ggcLeu Asn Arg Gly305
ttc ctg ctg gac1008
Phe Leu Leu Asp
gcc gcg ctg ggc1056
Ala Ala Leu Gly340
aac gat ccg aag1104
Asn Asp Pro Lys355
ccg gcg gtt act1152
Pro Ala Val Thr370
gct ggc tgg atg1200
Ala Gly Trp Met385
att gaa cgc gtg1248
Ile Glu Arg Val
gtt tac gcg taa1260
Val Tyr Ala
aaa gag cac aagLys Glu His Lys165
ggt gtg gtt gacGly Val Val Asp
gea tac ctg tttAla Tyr Leu Phe200
ggc gtt tac ccgGly Val Tyr Pro215
acc cac aaa accThr His Lys Thr230
ggc ggc gac gaaGly Gly Asp Glu245
age gcg cag ggcSer Ala Gln Gly
gcg ctg aaa gaaAla Leu Lys Glu280
gtg gcg aaa aacVal Ala Lys Asn295
tac aaa gtg gtgTyr Lys Val Val310
ctg gtg gat aaa
Leu Val Asp Lys325
cgt gct aac ate
Arg Ala Asn Ile
age ceg ttc gtg
Ser Pro Phe Val360
cgt cgc ggc ttc
Arg Arg Gly Phe375
tgt gac gtg ctg
Cys Asp Val Leu390
aaa gcg aaa gtg
Lys Ala Lys Val405
ccg aag atg attPro Lys Met Ile170
tgg gea aaa atgTrp Ala Lys Met185
gtc gac atg gcgVal Asp Met Ala
aac ccg gtt ccgAsn Pro Val Pro220
ctg gcg ggt ccgLeu Ala Gly Pro235
gag ctg tac aaaGlu Leu Tyr Lys250
ggc ccg ctg atgGly Pro Leu Met265
gcg atg gag ccgAla Met Glu Pro
gcc aaa gcg atgAla Lys Ala Met300
tct ggc ggc actSer Gly Gly Thr315
aac ctg acc ggt
Asn Leu Thr Gly330
acc gtg aac aaa
Thr Val Asn Lys345
acc tcc ggt ate
Thr Ser Gly Ile
aaa gaa gcg gaa
Lys Glu Ala Glu380
gac aac ate aat
Asp Asn Ile Asn395
ctg gat ate tgc
Leu Asp Ile Cys410
ate ggt ggc ttcIle Gly Gly Phe175
cgt gaa ate gctArg Glu Ile Ala190
cac gtg gcg ggcHis Val Ala Gly205
cac gct cac gttHis Ala His Val
egc ggc ggc ctgArg Gly Gly Leu240
aaa ctg aac tccLys Leu Asn Ser255
cac gtg ate gcgHis Val Ile Ala270
gag ttc aaa gttGlu Phe Lys Val285
gtg gaa gtg ttcVal Glu Val Phe
gag aac cac ctgGlu Asn His Leu320
aaa gaa gct gac
Lys Glu Ala Asp335
aac age gtg ccg
Asn Ser Val Pro350
cgt att ggt tct
Arg Ile Gly Ser365
gtg aaa gag ctg
Val Lys Glu Leu
gat gaa gcc acc
Asp Glu Ala Thr400
gcc cgc ttc ccg
Ala Arg Phe Pro415
<210> 58<211> 419<212> PRT
<213> Salmonella typhi<400> 58 Met Arg Met Leu Lys Arg Glu Met Asn Ile Ala Asp Tyr Asp Ala Glu1 5 10 15 Leu Trp Gln Ala 20 Met Glu Gln Glu Lys 25 Val Arg Gln Glu Glu 30 His IleGlu Leu Ile Ala Ser Glu Asn Tyr Thr Ser Pro Arg Val Met Gln Ala 35 40 45 Gln Gly Ser Gln Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys 50 55 60 Arg Tyr Tyr Gly Gly Cys Glu Tyr Val Asp Val Val Glu Gln Leu Ala65 70 75 80Ile Asp Arg Ala Lys Glu Leu Phe Gly Ala Asp Tyr Ala Asn Val Gln 85 90 95 Pro His Ser Gly 100 Ser Gln Ala Asn Phe 105 Ala Val Tyr Thr Ala 110 Leu LeuGln Pro Gly Asp Thr Val Leu Gly Met Asn Leu Ala Gln Gly Gly His 115 120 125 Leu Thr His Gly Ser Pro Val Asn Phe Ser Gly Lys Leu Tyr Asn Ile 130 135 140 Val Pro Tyr Gly Ile Asp Glu Ser Gly Lys Ile Asp Tyr Asp Glu Met145 150 155 160Ala Lys Leu Ala Lys 165 Glu His Lys Pro Lys 170 Met Ile Ile Gly Gly 175 PheSer Ala Tyr Ser Gly Val Val Asp Trp Ala Lys Met Arg Glu Ile Ala 180 185 190 Asp Ser Ile Gly Ala Tyr Leu Phe Val Asp Met Ala His Val Ala Gly 195 200 205 Leu Ile Ala Ala Gly Val Tyr Pro Asn Pro Val Pro His Ala His Val 210 215 220 Val Thr Thr Thr Thr His Lys Thr Leu Ala Gly Pro Arg Gly Gly Leu225 230 235 240Ile Leu Ala Lys Gly Gly Asp Glu Glu Leu Tyr Lys Lys Leu Asn Ser 245 250 255 Ala Val Phe Pro Ser Ala Gln Gly Gly Pro Leu Met His Val Ile Ala 260 265 270 Gly Lys Ala 275 Val Ala Leu Lys Glu 280 Ala Met Glu Pro Glu 285 Phe Lys ValTyr Gln 290 Gln Gln Val Ala Lys 295 Asn Ala Lys Ala Met 300 Val Glu Val PheLeu Asn Arg Gly Tyr Lys Val Val Ser Gly Gly Thr Glu Asn His Leu305 310 315 320Phe Leu Leu Asp Leu 325 Val Asp Lys Asn Leu 330 Thr Gly Lys Glu Ala 335 AspAla Ala Leu Gly Arg Ala Asn Ile Thr Val Asn Lys Asn Ser Val Pro 340 345 350 Asn Asp Pro 355 Lys Ser Pro Phe Val 360 Thr Ser Gly Ile Arg 365 Ile Gly SerPro Ala Val Thr Arg Arg Gly Phe Lys Glu Ala Glu Val Lys Glu Leu 370 375 380 Ala Gly Trp Met Cys Asp Val Leu Asp Asn Ile Asn Asp Glu Ala Thr385 390 395 400Ile Glu Arg Val Lys Ala Lys Val Leu Asp Ile Cys Ala Arg Phe Pro 405 410 415 Val Tyr Ala
<210> 59<211> 1560<212> DNA
<213> Chlamydophila pneumoniae<220><221> CDS<222> (1).. (1560)
<400> 59
ttg cta aaa gtt ttt gag aaa ttt aag aaa ttc gca ata gtg gaa ata 48Leu Leu Lys Val Phe Glu Lys Phe Lys Lys Phe Ala Ile Val Glu Ile 1 5 10 15 ttt aca aag gtg gtt gcg gtg gtt tcg ttg ttg cat aag ttt tta gaa 96Phe Thr Lys Val Val Ala Val Val Ser Leu Leu His Lys Phe Leu Glu 20 25 30 aat gct tcg ggg aaa aag gga caa agt tta gct tcg aca gcg tat tta 144Asn Ala Ser Gly Lys Lys Gly Gln Ser Leu Ala Ser Thr Ala Tyr Leu 35 40 45 gca gct Ctt gac cat ctc tta aat gcg ttt cct tcc att ggg gag aga 192Ala Ala Leu Asp His Leu Leu Asn Ala Phe Pro Ser Ile Gly Glu Arg 50 55 60 ate att gat gag ttg aag age cag cgt tcc cat tta aag atg att gct 240Ile Ile Asp Glu Leu Lys Ser Gln Arg Ser His Leu Lys Met Ile Ala 65 70 75 80 tet gaa aac tat tet tca Ctt tca gtg cag ttg gct atg ggg aac ttg 288Ser Glu Asn Tyr Ser Ser Leu Ser Val Gln Leu Ala Met Gly Asn Leu 85 90 95 ctc aca gat aag tat tgt gaa gga agt CCC ttt aag cgt ttc tat tcc 336Leu Thr Asp Lys Tyr Cys Glu Gly Ser Pro Phe Lys Arg Phe Tyr Ser 100 105 110 tgt tgt gaa aat gta gat gct att gag tgg gag tgt gta gag aca gcg 384Cys Cys Glu Asn Val Asp Ala Ile Glu Trp Glu Cys Val Glu Thr Ala 115 120 125 aaa gaa Ctt ttt gct gcg gat tgc gct tgt gtt cag cct cat tet ggg 432Lys Glu Leu Phe Ala Ala Asp Cys Ala Cys Val Gln Pro His Ser Gly 130 135 140 gct gat gct aat tta ctg gca gta atg gcc att ctc acg cac aaa gtc 480Ala Asp Ala Asn Leu Leu Ala Val Met Ala Ile Leu Thr His Lys Val 145 150 155 160 caa ggc cca gct gtc agt aag tta ggt tat aaa act gta aac gaa tta 528Gln Gly Pro Ala Val Ser Lys Leu Gly Tyr Lys Thr Val Asn Glu Leu 165 170 175 aca gaa gaa gaa tac act cta Ctt aag gct gaa atg tet tet tgt gtt 576Thr Glu Glu Glu Tyr Thr Leu Leu Lys Ala Glu Met Ser Ser Cys Val 180 185 190 tgc tta gga cct tca tta aat tet gga ggc cat ttg acc cat ggg aac 624Cys Leu Gly Pro Ser Leu Asn Ser Gly Gly His Leu Thr His Gly Asn 195 200 205 gta cgt tta aat gtg atg tet aag Ctt atg cgt tgc ttc CCC tat gat 672Val Arg Leu Asn Val Met Ser Lys Leu Met Arg Cys Phe Pro Tyr Asp 210 215 220 gtc aat ccg gat acg gag tgt ttt gat tat gca gag ate tcc cgg tta 720Val Asn Pro Asp Thr Glu Cys Phe Asp Tyr Ala Glu Ile Ser Arg Leu 225 230 235 240 gct aag gag tat aaa cct aag gta ctg ate gca gga tat tet tec tat 768Ala Lys Glu Tyr Lys Pro Lys Val Leu Ile Ala Gly Tyr Ser Ser Tyr 245 250 255 tet cga aga tta aac ttt gca gtt tta aaa cag att gca gag gat tgt 816Ser Arg Arg Leu Asn Phe Ala Val Leu Lys Gln Ile Ala Glu Asp Cys 260 265 270 gga tet gtc ttg tgg gta gat atg gcg cat ttt gca ggc cta gtt gct 864Gly Ser Val Leu Trp Val Asp Met Ala His Phe Ala Gly Leu Val Ala 275 280 285 ggg gga gtg ttt gtt gat gaa gaa aat cct att cct tat gca gat ata 912Gly Gly Val Phe Val Asp Glu Glu Asn Pro Ile Pro Tyr Ala Asp Ile 290 295 300 gtg aca aca aca acg cat aag aca tta cgc ggt cct cgc ggg gga tta 960Val Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu305 310 315 320
gtt ttg gca act cga gag tat gaa age act ctc aat aag gcg tgt cct1008 Val Leu Ala Thr Arg 325 Glu Tyr Glu Ser Thr 330 Leu Asn Lys Ala Cys 335 Prottg atg atg gga ggt CCt cta cct cac gtg ata gct gct aaa aca gtg1056 Leu Met Met Gly 340 Gly Pro Leu Pro His 345 Val Ile Ala Ala Lys 350 Thr Valgct ttg aag gaa gct CtC tct gtg gat ttc aag aaa tac gct cat cag1104 Ala Leu Lys Glu Ala Leu Ser Val Asp Phe Lys Lys Tyr Ala His Gln 355 360 365 gtt gta aat aat gct cgt cga tta gca gag aga ttt tta agt cat ggg1152 Val Val Asn Asn Ala Arg Arg Leu Ala Glu Arg Phe Leu Ser His Gly370 375 380 cta cgt Ctt ttg acg gga gga aca gac aac cac atg atg gtg att gat1200 Leu Arg Leu Leu Thr Gly Gly Thr Asp Asn His Met Met Val Ile Asp385 390 395 400tta ggt tct ttg ggc att tct gga aaa att gct gaa gat ate ttg agt1248 Leu Gly Ser Leu Gly 405 Ile Ser Gly Lys Ile 410 Ala Glu Asp Ile Leu 415 Sertcc gta gga att gct gtg aat cgg aat tca tta cct tca gat gct att1296 Ser Val Gly Ile Ala Val Asn Arg Asn Ser Leu Pro Ser Asp Ala Ile 420 425 430 ggt aag tgg gac act tca ggt ata cgt tta gga acc cct gca cta acg1344 Gly Lys Trp 435 Asp Thr Ser Gly Ile 440 Arg Leu Gly Thr Pro 445 Ala Leu Thract ttg ggt atg ggt ate gat gaa atg gaa gaa gtt gca gat att att1392 Thr Leu Gly Met Gly Ile Asp Glu Met Glu Glu Val Ala Asp Ile Ile450 455 460 gtg aaa gta ttg cga aat att cgt tta agt tgc cat gtt gaa ggg agt1440 Val Lys Val Leu Arg Asn Ile Arg Leu Ser Cys His Val Glu Gly Ser465 470 475 480tct aag aaa aat aaa ggg gaa Ctt cct gaa gcc ata gcg cag gaa gct1488 Ser Lys Lys Asn Lys 485 Gly Glu Leu Pro Glu 490 Ala Ile Ala Gln Glu 495 Alaaga gat cgt gtt cgc aac ttg ttg ctg cgt ttc ccg CtC tac cct gaa1536 Arg Asp Arg Val Arg Asn Leu Leu Leu Arg Phe Pro Leu Tyr Pro Glu 500 505 510 att gat tta gaa gct tta gtt tag 1560 Ile Asp Leu 515 Glu Ala Leu Val
<210> 60<211> 519<212> PRT
<213> Chlamydophila pneumoniae<400> 60
Leu Leu Lys Val Phe Glu Lys Phe Lys Lys Phe Ala Ile Val Glu Ile1 5 10 15
Phe Thr Lys Val Val Ala Val Val Ser Leu Leu His Lys Phe Leu Glu20 25 30
Asn Ala Ser Gly Lys Lys Gly Gln Ser Leu Ala Ser Thr Ala Tyr Leu
35 40 45
Ala Ala Leu Asp His Leu Leu Asn Ala Phe Pro Ser Ile Gly Glu Arg
50 55 60
Ile Ile Asp Glu Leu Lys Ser Gln Arg Ser His Leu Lys Met Ile Ala65 70 75 80
Ser Glu Asn Tyr Ser Ser Leu Ser Val Gln Leu Ala Met Gly Asn Leu
85 90 95
Leu Thr Asp Lys Tyr Cys Glu Gly Ser Pro Phe Lys Arg Phe Tyr Ser
100 105 110
Cys Cys Glu Asn Val Asp Ala Ile Glu Trp Glu Cys Val Glu Thr Ala
115 120 125
Lys Glu Leu Phe Ala Ala Asp Cys Ala Cys Val Gln Pro His Ser Gly
130 135 140
Ala Asp Ala Asn Leu Leu Ala Val Met Ala Ile Leu Thr His Lys Val145 150 155 160
Gln Gly Pro Ala Val Ser Lys Leu Gly Tyr Lys Thr Val Asn Glu Leu
165 170 175
Thr Glu Glu Glu Tyr Thr Leu Leu Lys Ala Glu Met Ser Ser Cys Val
180 185 190
Cys Leu Gly Pro Ser Leu Asn Ser Gly Gly His Leu Thr His Gly Asn
195 200 205
Val Arg Leu Asn Val Met Ser Lys Leu Met Arg Cys Phe Pro Tyr Asp
210 215 220
Val Asn Pro Asp Thr Glu Cys Phe Asp Tyr Ala Glu Ile Ser Arg Leu225 230 235 240
Ala Lys Glu Tyr Lys Pro Lys Val Leu Ile Ala Gly Tyr Ser Ser Tyr
245 250 255
Ser Arg Arg Leu Asn Phe Ala Val Leu Lys Gln Ile Ala Glu Asp Cys
260 265 270
Gly Ser Val Leu Trp Val Asp Met Ala His Phe Ala Gly Leu Val Ala
275 280 285
Gly Gly Val Phe Val Asp Glu Glu Asn Pro Ile Pro Tyr Ala Asp Ile
290 295 300
Val Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu305 310 315 320
Val Leu Ala Thr Arg Glu Tyr Glu Ser Thr Leu Asn Lys Ala Cys Pro
325 330 335
Leu Met Met Gly Gly Pro Leu Pro His Val Ile Ala Ala Lys Thr Val
340 345 350
Ala Leu Lys Glu Ala Leu Ser Val Asp Phe Lys Lys Tyr Ala His Gln
355 360 365
Val Val Asn Asn Ala Arg Arg Leu Ala Glu Arg Phe Leu Ser His Gly
370 375 380
Leu Arg Leu Leu Thr Gly Gly Thr Asp Asn His Met Met Val Ile Asp385 390 395 400
Leu Gly Ser Leu Gly Ile Ser Gly Lys Ile Ala Glu Asp Ile Leu Ser
405 410 415
Ser Val Gly Ile Ala Val Asn Arg Asn Ser Leu Pro Ser Asp Ala Ile
420 425 430
Gly Lys Trp Asp Thr Ser Gly Ile Arg Leu Gly Thr Pro Ala Leu Thr
435 440 445
Thr Leu Gly Met Gly Ile Asp Glu Met Glu Glu Val Ala Asp Ile Ile
450 455 460
Val Lys Val Leu Arg Asn Ile Arg Leu Ser Cys His Val Glu Gly Ser465 470 475 480
Ser Lys Lys Asn Lys Gly Glu Leu Pro Glu Ala Ile Ala Gln Glu Ala
485 490 495
Arg Asp Axg VaX Axg Asn Lgu Lgu Lgu Aarg PhG Pxo Leu. Tyx Pxo GXu
500 505 510
Ile Asp Leu Glu Ala Leu Val515<210> 61<211> 1524<212> DNA
<213> Chlamydia trachomatis
<220>
<221> CDS
<222> (1).. (1524)
<220>
<221> misc_feature
<222> (683)..(975)
<223> η localizado nas posições 683, 938 e 975; cada η é a, c, g,
<400> 61ttg caa ggt ttaLeu Gln Gly Leu1
aga tat ctg agaArg Tyr Leu Arg20
gtg gcc tat ttaVal Ala Tyr Leu35
ata gga cag ageIle Gly Gln Ser50
aaa atg att gctLys Met Ile Ala65
atg ggg aat ttaMet Gly Asn Leu
cga ttt tat tccArg Phe Tyr Ser100
gea gag acg geaAla Glu Thr Ala115
cct cat tet ggaPro His Ser Gly130
aca cag aag ateThr Gln Lys Ile145
ate aat gat ctgIle Asn Asp Leu
gct cag cac aaaAla Gln His Lys180
aca cat ggg actThr His Gly Thr195
ctc cct tat gagLeu Pro Tyr Glu210
ata gea aaa tnaIle Ala Lys Xaa225
tat tcg tet tatTyr Ser Ser Tyr
ate agt gga ggtIle Ser Gly Gly5
aat att tcc gacAsn Ile Ser Asp
gea tca tta gatAla Ser Leu Asp40
att gta caa gaaIle Val Gln Glu55
tca gaa aac tttSer Glu Asn Phe70
ctt aca gac aagLeu Thr Asp Lys85
tgt tgc gag aatCys Cys Glu Asn
aaa gaa tta tttLys Glu Leu Phe120
gec gat gcg aatAla Asp Ala Asn135
cag age cct gcgGln Ser Pro Ala150
cct gag cag gaaPro Glu Gln Glu165
tgc cta ggc cccCys Leu Gly Pro
gtg cgc atg aatVal Arg Met Asn200
gtg aat tta gatVal Asn Leu Asp215
gcg aaa gaa catAla Lys Glu His230
tet aga cga ttcSer Arg Arg Phe
gga aat atg geaGly Asn Met Ala10
aaa agt cag caaLys Ser Gln Gln25
cat ctg tta cacHis Leu Leu His
tta aag agt cagLeu Lys Ser Gln60
tet tet cta tetSer Ser Leu Ser75
tat tgt gaa gggTyr Cys Glu Gly90
gtg gat gea attVal Asp Ala Ile105
ggt gcg gaa agtGly Ala Glu Ser
tta tta gcg ateLeu Leu Ala Ile140
gtt caa cag ttgVal Gln Gln Leu155
tac gaa gea ttaTyr Glu Ala Leu170
tet tta aat tetSer Leu Asn Ser185
ate atg tet aaaIle Met Ser Lys
act gaa tta tttThr Glu Leu Phe220
aag ccc acc gttLys Pro Thr Val235
aac ttt gcc accAsn Phe Ala Thr
tcg tta ttg gatSer Leu Leu Asp15
aat ttg gea tcaAsn Leu Ala Ser30
gct ttt cca tetAla Phe Pro Ser45
cga tet cgt ttaArg Ser Arg Leu
gtg caa ctt gctVal Gln Leu Ala80
age cca ttc aaaSer Pro Phe Lys95
gaa tgg gaa tgcGlu Trp Glu Cys110
gct ttt gtt cagAla Phe Val Gln125
atg tcg ate attMet Ser Ile Ile
gga tat aaa acgGly Tyr Lys Thr160
aaa gct gag atgLys Ala Glu Met175
gga ggg cat ctgGly Gly His Leu190
tta atg cat tgtLeu Met His Cys205
gat tat gat gagAsp Tyr Asp Glu
ctg ate gea gggLeu Ile Ala Gly240
ttg aag caa attLeu Lys Gln Ile
ou t4896144192240288336384432480528576624672720768245 250 255
gca gaa gac tgt ggc gct gtt tta tgg gtg gat atg gct cat ttc gca 816
Ala Glu Asp Cys Gly Ala Val Leu Trp Val Asp Met Ala His Phe Ala
260 265 270
ggc ttg gtt gct gga ggt gtg ttt gta gga gaa gaa aat cct atg cct 864
Gly Leu Val Ala Gly Gly Val Phe Val Gly Glu Glu Asn Pro Met Pro
275 280 285
tat gca gat ate gtg aca acg acg acg cat aag act ttg cga ggg cca 912
Tyr Ala Asp Ile Val Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro
290 295 300
aga ggt gga ttg gtt cta gct aaa ana gaa tat gca aat acc ttg aac 960
Arg Gly Gly Leu Val Leu Ala Lys Xaa Glu Tyr Ala Asn Thr Leu Asn305 310 315 320
aag gct tgt ctc tan atg atg ggc ggc cca ctt cct cat gtt ata gct1008
Lys Ala Cys Leu Xaa Met Met Gly Gly Pro Leu Pro His Val Ile Ala
325 330 335
gct aaa gct att gct ctg aaa gaa gct atg acg ate aat ttc agg aag1056
Ala Lys Ala Ile Ala Leu Lys Glu Ala Met Thr Ile Asn Phe Arg Lys
340 345 350
tat gcg cat aaa gtg gta gag aat gca cag act ttg gct gaa gtg ttc1104
Tyr Ala His Lys Val Val Glu Asn Ala Gln Thr Leu Ala Glu Val Phe
355 360 365
cag cgg aac ggg cta cga tta ctc act ggc ggg aca gat aat cac atg1152
Gln Arg Asn Gly Leu Arg Leu Leu Thr Gly Gly Thr Asp Asn His Met
370 375 380
ttg att att gat cta act tet cta gga gtc cct gga cgt att gca gaa1200
Leu Ile Ile Asp Leu Thr Ser Leu Gly Val Pro Gly Arg Ile Ala Glu385 390 395 400
gat atg tta acc tca gta ggt ate gca gta aat cgt aat act att cct1248
Asp Met Leu Thr Ser Val Gly Ile Ala Val Asn Arg Asn Thr Ile Pro
405 410 415
tca gat gec tet ggg cag tgg aag act tet ggt att cga tta ggg act1296
Ser Asp Ala Ser Gly Gln Trp Lys Thr Ser Gly Ile Arg Leu Gly Thr
420 425 430
cca gct ctg aca acg cta ggg atg ggc agt gcc gaa atg gaa gaa gtt1344
Pro Ala Leu Thr Thr Leu Gly Met Gly Ser Ala Glu Met Glu Glu Val
435 440 445
gcg aat att ate gtg aaa gta ttg cga aat att act gtg aga age aat1392
Ala Asn Ile Ile Val Lys Val Leu Arg Asn Ile Thr Val Arg Ser Asn
450 455 460
gct gag age ggt tet agt aaa agt gag gga gag ctg tca gaa ggg ate1440
Ala Glu Ser Gly Ser Ser Lys Ser Glu Gly Glu Leu Ser Glu Gly Ile465 470 475 480
gct cag gaa gcg aga caa cgt gtg gct gat tta tta gga aga ttc cct1488
Ala Gln Glu Ala Arg Gln Arg Val Ala Asp Leu Leu Gly Arg Phe Pro
485 490 495
ctt tat cct gaa ate gat ctg gaa acg cta gtt tag1524
Leu Tyr Pro Glu Ile Asp Leu Glu Thr Leu Val500 505
<210> 62<211> 507<212> PRT
<213> Chlamydia trachomatis<220>
<221> misc_feature<222> (228)..(325)
<223> Xaa localizado nas posições 228, 313 e 325; cada Xaa pode serqualquer aminoácido de ocorrência natural
<400> 62
Leu Gln Gly Leu Ile Ser Gly Gly Gly Asn Met Ala Ser Leu Leu Asp1 5 10 15
Arg Tyr Leu Arg Asn Ile Ser Asp Lys Ser Gln Gln Asn Leu Ala Ser
20 25 30
Val Ala Tyr Leu Ala Ser Leu Asp His Leu Leu His Ala Phe Pro Ser
35 40 45
Ile Gly Gln Ser Ile Val Gln Glu Leu Lys Ser Gln Arg Ser Arg Leu
50 55 60
Lys Met Ile Ala Ser Glu Asn Phe Ser Ser Leu Ser Val Gln Leu Ala65 70 75 80
Met Gly Asn Leu Leu Thr Asp Lys Tyr Cys Glu Gly Ser Pro Phe Lys
85 90 95
Arg Phe Tyr Ser Cys Cys Glu Asn Val Asp Ala Ile Glu Trp Glu Cys
100 105 110
Ala Glu Thr Ala Lys Glu Leu Phe Gly Ala Glu Ser Ala Phe Val Gln
115 120 125
Pro His Ser Gly Ala Asp Ala Asn Leu Leu Ala Ile Met Ser Ile Ile
130 135 140
Thr Gln Lys Ile Gln Ser Pro Ala Val Gln Gln Leu Gly Tyr Lys Thr145 150 155 160
Ile Asn Asp Leu Pro Glu Gln Glu Tyr Glu Ala Leu Lys Ala Glu Met
165 170 175
Ala Gln His Lys Cys Leu Gly Pro Ser Leu Asn Ser Gly Gly His Leu
180 185 190
Thr His Gly Thr Val Arg Met Asn Ile Met Ser Lys Leu Met His Cys
195 200 205
Leu Pro Tyr Glu Val Asn Leu Asp Thr Glu Leu Phe Asp Tyr Asp Glu
210 215 220
Ile Ala Lys Xaa Ala Lys Glu His Lys Pro Thr Val Leu Ile Ala Gly225 230 235 240
Tyr Ser Ser Tyr Ser Arg Arg Phe Asn Phe Ala Thr Leu Lys Gln Ile
245 250 255
Ala Glu Asp Cys Gly Ala Val Leu Trp Val Asp Met Ala His Phe Ala
260 265 270
Gly Leu Val Ala Gly Gly Val Phe Val Gly Glu Glu Asn Pro Met Pro
275 280 285
Tyr Ala Asp Ile Val Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro
290 295 300
Arg Gly Gly Leu Val Leu Ala Lys Xaa Glu Tyr Ala Asn Thr Leu Asn305 310 315 320
Lys Ala Cys Leu Xaa Met Met Gly Gly Pro Leu Pro His Val Ile Ala
325 330 335
Ala Lys Ala Ile Ala Leu Lys Glu Ala Met Thr Ile Asn Phe Arg Lys
340 345 350
Tyr Ala His Lys Val Val Glu Asn Ala Gln Thr Leu Ala Glu Val Phe
355 360 365
Gln Arg Asn Gly Leu Arg Leu Leu Thr Gly Gly Thr Asp Asn His Met
370 375 380
Leu Ile Ile Asp Leu Thr Ser Leu Gly Val Pro Gly Arg Ile Ala Glu385 390 395 400
Asp Met Leu Thr Ser Val Gly Ile Ala Val Asn Arg Asn Thr Ile Pro405 410 415
\Ser Asp Ala Ser Gly Gln Trp Lys Thr Ser Gly Ile Arg Leu Gly Thr 420 425 430 Pro Ala Leu 435 Thr Thr Leu Gly Met 440 Gly Ser Ala Glu Met 445 Glu Glu ValAla Asn 450 Ile Ile Val Lys Val 455 Leu Arg Asn Ile Thr 460 Val Arg Ser AsnAla Glu Ser Gly Ser Ser Lys Ser Glu Gly Glu Leu Ser Glu Gly Ile465 470 475 480Ala Gln Glu Ala Arg Gln Arg Val Ala Asp Leu Leu Gly Arg Phe Pro 485 490 495 Leu Tyr Pro Glu Ile Asp Leu Glu Thr Leu Val
500 505
<210> 63<211> 1299<212> DNA
<213> Sinorhizobivua meliloti
<220>
<221> CDS
<222> (1).. (1299)
<400> 63 atg Ctt tca cag acc aac gac gct ttc ttc acc cge tet ctc gcc gac 48Met Leu Ser Gln Thr Asn Asp Ala Phe Phe Thr Arg Ser Leu Ala Asp 1 5 10 15 age gat ccg gaa ate ttc ggt gcg ate gag aag gag ctg ggc cgc cag 96Ser Asp Pro Glu Ile Phe Gly Ala Ile Glu Lys Glu Leu Gly Arg Gln 20 25 30 cgc cat gag ate gag ctg ate gcc tcc gag aac ate gtt tca cgg gcc 144Arg His Glu Ile Glu Leu Ile Ala Ser Glu Asn Ile Val Ser Arg Ala 35 40 45 gtg ctc gag gcg cag ggc tcg ate atg acc aac aaa tac gcc gag ggt 192Val Leu Glu Ala Gln Gly Ser Ile Met Thr Asn Lys Tyr Ala Glu Gly 50 55 60 tac ccg ggc aag cgc tat tac ggc ggc tgc caa tat gtc gat ate gcc 240Tyr Pro Gly Lys Arg Tyr Tyr Gly Gly Cys Gln Tyr Val Asp Ile Ala 65 70 75 80 gag gea ctc gcg ate gag cgc gcc aag aag ctc ttc ggc gtc aac ttc 288Glu Ala Leu Ala Ile Glu Arg Ala Lys Lys Leu Phe Gly Val Asn Phe 85 90 95 gcg aac gtg caa ccg aat tcg ggc tcc cag atg aac cag gcg gtc ttc 336Ala Asn Val Gln 100 Pro Asn Ser Gly Ser 105 Gln Met Asn Gln Ala 110 Val Phe ctg gcg ctg ctg cag ccg ggc gac acc ttc atg ggc ctc gac ctc aat 384Leu Ala Leu Leu Gln Pro Gly Asp Thr Phe Met Gly Leu Asp Leu Asn 115 120 125 tcc ggc ggc cac ctg acc cat ggg tcc ccg gtg aac atg tcg ggc aaa 432Ser Gly 130 Gly His Leu Thr His 135 Gly Ser Pro Val Asn 140 Met Ser Gly Lys tgg ttc aac gtc gtt tcc tac ggc gtg cgc gaa gac gat cac Ctt ctc 480Trp Phe Asn Val Val Ser Tyr Gly Val Arg Glu Asp Asp His Leu Leu 145 150 155 160 gac atg gac gaa gtc gcc agg aag gcg cgc gag cag aag ccg aaa ctg 528Asp Met Asp Glu Val 165 Ala Arg Lys Ala Arg 170 Glu Gln Lys Pro Lys 175 Leu ate ate gcc ggc gga acg gcc tat tcc cgc ate tgg gac tgg aag cgc 576Ile Ile Ala Gly Gly Thr Ala Tyr Ser Arg Ile Trp Asp Trp Lys Arg 180 185 190 ttc cgc gag ate gcc gac gag gtg ggc gcg tgg ctg atg gtc gac atg 624Phe Arg Glu Ile Ala Asp Glu Val Gly Ala Trp Leu Met Val Asp Met 195 200 205 gcc cac ate gcc ggt ctc gtg gcc ggt ggc cag cat ccg tcg ccg ttc 672Ala His Xle Ala Gly Leu Val Ala Gly Gly Gln His Pro Ser Pro Phe
210 215 220
ccg cac tgc cac gtt gcg acg acg acc acg cac aag tcc ctg cgc ggc 720
Pro His Cys His Val Ala Thr Thr Thr Thr His Lys Ser Leu Arg Gly225 230 235 240
ccc cgc ggc ggc atg ate ctc acc aat gac gag gaa ate gcc aag aag 768
Pro Arg Gly Gly Met Ile Leu Thr Asn Asp Glu Glu Ile Ala Lys Lys
245 250 255
ate aac tcc gcc gta ttc ccc ggt ctc cag ggt ggg ccg ctg atg cac 816
Ile Asn Ser Ala Val Phe Pro Gly Leu Gln Gly Gly Pro Leu Met His
260 265 270
gtg att gcc gcc aag gcc gtc gcg ctt ggc gag gcg ctg cag ccc tcc 864
Val Ile Ala Ala Lys Ala Val Ala Leu Gly Glu Ala Leu Gln Pro Ser
275 280 285
ttc aag gat tat gcg gcc cag gtc gtc aag aac gcc cgc acc ctt gcc 912
Phe Lys Asp Tyr Ala Ala Gln Val Val Lys Asn Ala Arg Thr Leu Ala
290 295 300
gaa acc ttg aag gcc aac ggc ctg gat gga cat cgt ctc ggc ggt acc 960
Glu Thr Leu Lys Ala Asn Gly Leu Asp Gly His Arg Leu Gly Gly Thr305 310 315 320
gac acc cac ctg atg cct ggt cga cct gcg caa gaa gaa tgc gac cgg1008
Asp Thr His Leu Met Pro Gly Arg Pro Ala Gln Glu Glu Cys Asp Arg
325 330 335
caa gcg tgc cga age tgc tet cgg ccg tgc tac gtc acc tgc aac aag1056
Gln Ala Cys Arg Ser Cys Ser Arg Pro Cys Tyr Val Thr Cys Asn Lys
340 345 350
aac ggc att ccc ttc gac ccc gaa aag ccc ttc gtc acc tcc ggc gtg1104
Asn Gly Ile Pro Phe Asp Pro Glu Lys Pro Phe Val Thr Ser Gly Val
355 360 365
cgc ctc ggt gea ccg gcc ggt acg acg cgc ggc ttc aag gag gcg gag1152
Arg Leu Gly Ala Pro Ala Gly Thr Thr Arg Gly Phe Lys Glu Ala Glu
370 375 380
ttc aag gag gtc ggc gaa ctg ate gtc gag gtg ctc gac ggt ctc aag1200
Phe Lys Glu Val Gly Glu Leu Ile Val Glu Val Leu Asp Gly Leu Lys385 390 395 400
gcc gcc aat tcc gac gag ggc aat gcc gct gtc gag gct ggc gtg cgc1248
Ala Ala Asn Ser Asp Glu Gly Asn Ala Ala Val Glu Ala Gly Val Arg
405 410 415
gag aag gtg ate aag ctc acc gac cgc ttc ccg atg tac ggc tat atg1296
Glu Lys Val Ile Lys Leu Thr Asp Arg Phe Pro Met Tyr Gly Tyr Met420 425 430
tga1299
<210> 64<211> 432<212> PRT
<213> Sinorhizobium meliloti<400> 64
Met Leu Ser Gln Thr Asn Asp Ala Phe Phe Thr Arg Ser Leu Ala Asp15 10 15
Ser Asp Pro Glu Ile Phe Gly Ala Ile Glu Lys Glu Leu Gly Arg Gln20 25 30Arg His Glu Ile Glu Leu Ile Ala Ser Glu Asn Ile Val Ser Arg Ala 35 40 45 Val Leu Glu Ala Gln Gly Ser Ile Met Thr Asn Lys Tyr Ala Glu Gly 50 55 60 Tyr Pro Gly Lys Arg Tyr Tyr Gly Gly Cys Gln Tyr Val Asp Ile Ala65 70 75 80Glu Ala Leu Ala Ile Glu Arg Ala Lys Lys Leu Phe Gly Val Asn Phe 85 90 95Ala Asn Val Gln 100 Pro Asn Ser Gly Ser 105 Gln Met Asn Gln Ala 110 Val PheLeu Ala Leu Leu Gln Pro Gly Asp Thr Phe Met Gly Leu Asp Leu Asn 115 120 125 Ser Gly Gly His Leu Thr His Gly Ser Pro Val Asn Met Ser Gly Lys 130 135 140 Trp Phe Asn Val Val Ser Tyr Gly Val Arg Glu Asp Asp His Leu Leu145 150 155 160Asp Met Asp Glu Val Ala Arg Lys Ala Arg Glu Gln Lys Pro Lys Leu 165 170 175Ile Ile Ala Gly Gly Thr Ala Tyr Ser Arg Ile Trp Asp Trp Lys Arg 180 185 190 Phe Arg Glu Ile Ala Asp Glu Val Gly Ala Trp Leu Met Val Asp Met 195 200 205 Ala His Ile Ala Gly Leu Val Ala Gly Gly Gln His Pro Ser Pro Phe 210 215 220 Pro His Cys His Val Ala Thr Thr Thr Thr His Lys Ser Leu Arg Gly225 230 235 240Pro Arg Gly Gly Met 245 Ile Leu Thr Asn Asp 250 Glu Glu Ile Ala Lys Lys 255Ile Asn Ser Ala 260 Val Phe Pro Gly Leu 265 Gln Gly Gly Pro Leu 270 Met HisVal Ile Ala 275 Ala Lys Ala Val Ala 280 Leu Gly Glu Ala Leu 285 Gln Pro SerPhe Lys 290 Asp Tyr Ala Ala Gln 295 Val Val Lys Asn Ala 300 Arg Thr Leu AlaGlu Thr Leu Lys Ala Asn Gly Leu Asp Gly His Arg Leu Gly Gly Thr305 310 315 320Asp Thr His Leu Met Pro Gly Arg Pro Ala Gln Glu Glu Cys Asp Arg 325 330 335Gln Ala Cys Arg Ser Cys Ser Arg Pro Cys Tyr Val Thr Cys Asn Lys 340 345 350 Asn Gly Ile 355 Pro Phe Asp Pro Glu 360 Lys Pro Phe Val Thr 365 Ser Gly ValArg Leu Gly Ala Pro Ala Gly Thr Thr Arg Gly Phe Lys Glu Ala Glu 370 375 380 Phe Lys Glu Val Gly Glu Leu Ile Val Glu Val Leu Asp Gly Leu Lys385 390 395 400Ala Ala Asn Ser Asp Glu Gly Asn Ala Ala Val Glu Ala Gly Val Arg 405 410 415Glu Lys Val Ile Lys Leu Thr Asp Arg Phe Pro Met Tyr Gly Tyr Met
420 425 430
<210> 65<211> 1242<212> DNA
<213> Listeria monocytogenes
<220>
<221> CDS
<222> (1)..(1242)
<400> 65
atg gtc tat tta caa aag caa gat aag gaa gtt ttt gat gca att aagMet Val Tyr Leu Gln Lys Gln Asp Lys Glu Val Phe Asp Ala Ile Lys
\1 5 10 15
tta gaa Ctt ggt aga caa cgc gcg aat ate gaa tta ate gca tct gag 96Leu Glu Leu Gly 20 Arg Gln Arg Ala Asn 25 Ile Glu Leu Ile Ala 30 Ser Glu aat ttt gtt agt gag caa gta atg gaa gca atg ggt tct gta tta acg 144Asn Phe Val 35 Ser Glu Gln Val Met 40 Glu Ala Met Gly Ser 45 Val Leu Thr aat aaa tat gca gaa ggt tac cca gga aaa cgc tat tac ggc gga tgt 192Asn Lys 50 Tyr Ala Glu Gly Tyr 55 Pro Gly Lys Arg Tyr 60 Tyr Gly Gly Cys gaa ttc gtg gat ate gtg gaa gat tta gca cgc gac cgc gcg aaa aaa 240Glu Phe Val Asp Ile Val Glu Asp Leu Ala Arg Asp Arg Ala Lys Lys 65 70 75 80 tta ttt gga gct gaa tat gcg aac gtt caa cca cac tca ggt gct caa 288Leu Phe Gly Ala Glu Tyr Ala Asn Val Gln Pro His Ser Gly Ala Gln 85 90 95 gcg aat atg gcg gtt tat cat aca gtg Ctt gaa cca ggt gat acc gta 336Ala Asn Met Ala Val Tyr His Thr Val Leu Glu Pro Gly Asp Thr Val 100 105 110 Ctt ggt atg aac Ctt tca cat ggt gga cat tta aca cat ggt agt cca 384Leu Gly Met 115 Asn Leu Ser His Gly 120 Gly His Leu Thr His 125 Gly Ser Pro gtt aat ttc agt ggt gtt tta tac aat ttt gtt gaa tac ggc gtt cgt 432Val Asn Phe Ser Gly Val Leu Tyr Asn Phe Val Glu Tyr Gly Val Arg 130 135 140 gaa gat aca aaa gag att gat tat gat ate gtc cgt gaa gct gct tta 480Glu Asp Thr Lys Glu Ile Asp Tyr Asp Ile Val Arg Glu Ala Ala Leu 145 150 155 160 aaa cat aaa cca aaa atg att gta gct ggc gca agt gct tat cca cgt 528Lys His Lys Pro Lys 165 Met Ile Val Ala Gly 170 Ala Ser Ala Tyr Pro 175 Arg aaa att gat ttt gct aaa ttc cgt gaa att gct gat gaa gtt ggc gca 576Lys Ile Asp Phe 180 Ala Lys Phe Arg Glu 185 Ile Ala Asp Glu Val 190 Gly Ala tac tta atg gta gat atg gcg cat ate gcc ggt Ctt gtt gct gct ggt 624Tyr Leu Met Val Asp Met Ala His Ile Ala Gly Leu Val Ala Ala Gly 195 200 205 tta cac caa aat cca gtt cct tat gct gat ttt aca acg aca act acc 672Leu His 210 Gln Asn Pro Val Pro 215 Tyr Ala Asp Phe Thr 220 Thr Thr Thr Thr cat aaa acg Ctt cgt gga cct cgc ggt gga atg att tta gcc aaa gca 720His Lys Thr Leu Arg Gly Pro Arg Gly Gly Met Ile Leu Ala Lys Ala 225 230 235 240 gaa tgg gaa caa aaa tta aat aaa tcg att ttc cca gga att caa ggt 768Glu Trp Glu Gln Lys 245 Leu Asn Lys Ser Ile 250 Phe Pro Gly Ile Gln 255 Gly gga cca tta atg cac gta ate gca gcg aaa gca gtg gcg ttt ggt gaa 816Gly Pro Leu Met 260 His Val Ile Ala Ala 265 Lys Ala Val Ala Phe 270 Gly Glu gcg tta caa cct gaa ttc aca acg tat tgc gag caa att att cgt aat 864Ala Leu Gln 275 Pro Glu Phe Thr Thr 280 Tyr Cys Glu Gln Ile 285 Ile Arg Asn tct aag aaa tta gca gaa act Ctt caa gcg aat gat gtt gct gtt tta 912Ser Lys Lys Leu Ala Glu Thr Leu Gln Ala Asn Asp Val Ala Val Leu 290 295 300 aca ggt ggt tcg gat aat cat tta tta tta att gat tta aaa cca Ctt 960Thr Gly Gly Ser Asp Asn His Leu Leu Leu Ile Asp Leu Lys Pro Leu 305 310 315 320 ggc tta aca gga aaa gca gct gag aaa gta tta gat gaa gtt ggt att 1008 Gly Leu Thr Gly Lys Ala Ala Glu Lys Val Leu Asp Glu Val Gly Ile 325 330 335 a cc gtg aat aaa aat acc att cca ttc gaa acg \ gaa age cca ttt gta1056
Thr Val Asn Lys Asn Thr Ile Pro Phe Glu Thr Glu Ser Pro Phe Val
340 345 350
aca agt ggt att cgt gta ggt gtt gct gca gtg acg act cgt gga ttc1104
Thr Ser Gly Ile Arg Val Gly Val Ala Ala Val Thr Thr Arg Gly Phe
355 360 365
gat gaa gtt gcg att gaa aaa gtc ggc gta ctt att tcg gaa gta ctg1152
Asp Glu Val Ala Ile Glu Lys Val Gly Val Leu Ile Ser Glu Val Leu
370 375 380
cat aac tta gaa aat gaa gaa gtt ctc gca gat gta aaa gca cgc gtg1200
His Asn Leu Glu Asn Glu Glu Val Leu Ala Asp Val Lys Ala Arg Val385 390 395 400
gct act tta aca aat gaa tat ccg ctt tat cca agt tta taa1242
Ala Thr Leu Thr Asn Glu Tyr Pro Leu Tyr Pro Ser Leu405 410
<210> 66<211> 413<212> PRT
<213> Listeria monocytogenes<400> 66
Met Val Tyr Leu Gln Lys Gln Asp Lys Glu Val Phe Asp Ala Ile Lys1 5 10 15
Leu Glu Leu Gly 20 Arg Gln Arg Ala Asn 25 Ile Glu Leu Ile Ala 30 Ser GluAsn Phe Val 35 Ser Glu Gln Val Met 40 Glu Ala Met Gly Ser 45 Val Leu ThrAsn Lys 50 Tyr Ala Glu Gly Tyr 55 Pro Gly Lys Arg Tyr 60 Tyr Gly Gly CysGlu Phe Val Asp Ile Val Glu Asp Leu Ala Arg Asp Arg Ala Lys Lys65 70 75 80Leu Phe Gly Ala Glu Tyr Ala Asn Val Gln Pro His Ser Gly Ala Gln 85 90 95 Ala Asn Met Ala Val Tyr His Thr Val Leu Glu Pro Gly Asp Thr Val 100 105 110 Leu Gly Met 115 Asn Leu Ser His Gly 120 Gly His Leu Thr His 125 Gly Ser ProVal Asn Phe Ser Gly Val Leu Tyr Asn Phe Val Glu Tyr Gly Val Arg 130 135 140 Glu Asp Thr Lys Glu Ile Asp Tyr Asp Ile Val Arg Glu Ala Ala Leu145. 150 155 160Lys His Lys Pro Lys Met Ile Val Ala Gly Ala Ser Ala Tyr Pro Arg 165 170 175 Lys Ile Asp Phe Ala Lys Phe Arg Glu Ile Ala Asp Glu Val Gly Ala 180 185 190 Tyr Leu Met 195 Val Asp Met Ala His 200 Ile Ala Gly Leu Val 205 Ala Ala GlyLeu His 210 Gln Asn Pro Val Pro 215 Tyr Ala Asp Phe Thr 220 Thr Thr Thr ThrHis Lys Thr Leu Arg Gly Pro Arg Gly Gly Met Ile Leu Ala Lys Ala225 230 235 240Glu Trp Glu Gln Lys 245 Leu Asn Lys Ser Ile 250 Phe Pro Gly Ile Gln 255 GlyGly Pro Leu Met His Val Ile Ala Ala Lys Ala Val Ala Phe Gly Glu 260 265 270 Ala Leu Gln Pro Glu Phe Thr Thr Tyr Cys Glu Gln Ile Ile Arg Asn 275 280 285 Ser Lys Lys Leu Ala Glu Thr Leu Gln Ala Asn Asp Val Ala Val Leu290 295
Thr Gly Gly Ser Asp Asn His Leu305 310
Gly Leu Thr Gly Lys Ala Ala Glu325
Thr Val Asn Lys Asn Thr Ile Pro340
Thr Ser Gly Ile Arg Val Gly Val355 360
Asp Glu Val Ala Ile Glu Lys Val
370 375
His Asn Leu Glu Asn Glu Glu Val385 390
Ala Thr Leu Thr Asn Glu Tyr Pro405
300
Leu Leu Ile Asp Leu Lys Pro Leu315 320
Lys Val Leu Asp Glu Val Gly Ile
330 335
Phe Glu Thr Glu Ser Pro Phe Val345 350
Ala Ala Val Thr Thr Arg Gly Phe365
Gly Val Leu Ile Ser Glu Val Leu380
Leu Ala Asp Val Lys Ala Arg Val395 400
Leu Tyr Pro Ser Leu410
<210> 67<211> 1248<212> DNA
<213> Lactococcus lactis; IL1403
<220>
<221> CDS
<222> (1) .. (1248)
<400> 67
atg att ttt gat aaa gaa gat ttt gaa agt ttt gac cca gaa ttg tgg 48Met Ile Phe Asp Lys Glu Asp Phe Glu Ser Phe Asp Pro Glu Leu Trp 1 5 10 15 gca gcc att cat gct gag gaã att cgt cag caa caa aat att gaa tta 96Ala Ala Ile His 20 Ala Glu Glu Ile Arg 25 Gln Gln Gln Asn Ile 30 Glu Leu att gct tca gaa aat att gtt tca aaa gca gtt atg gca gca caa ggt 144Ile Ala Ser 35 Glu Asn Ile Val Ser 40 Lys Ala Val Met Ala 45 Ala Gln Gly tct gtt ttg aca aat aaa tat gcc gaa ggt tat cct ggg aaa cgt tat 192Ser Val 50 Leu Thr Asn Lys Tyr 55 Ala Glu Gly Tyr Pro 60 Gly Lys Arg Tyr tat ggc gga aca gaa gcg gtt gat gtt gta gaa aat ttg gct att gaa 240Tyr Gly Gly Thr Glu Ala Val Asp Val Val Glu Asn Leu Ala Ile Glu 65 70 75 80 cga gca aaa gaa Ctt ttc ggt gca aaa ttt gcc aat gtt caa cct cat 288Arg Ala Lys Glu Leu 85 Phe Gly Ala Lys Phe 90 Ala Asn Val Gln Pro 95 His tca ggt tct caa gcc aat gcg gca gct tat atg gca tta att caa cct 336Ser Gly Ser Gln Ala Asn Ala Ala Ala Tyr Met Ala Leu Ile Gln Pro 100 105 110 gga gac aca gtc tta gga atg gat tta aat gct ggc ggt cac ttg act 384Gly Asp Thr 115 Val Leu Gly Met Asp 120 Leu Asn Ala Gly Gly 125 His Leu Thr cat ggg gct tca gtc aat ttt tca gga aaa act tat cat ttt gtt cct 432His Gly 130 Ala Ser Val Asn Phe 135 Ser Gly Lys Thr Tyr 140 His Phe Val Pro tat gga gtt aat tct gaa act gag Ctt tta gat tat gat gaa att tta 480Tyr Gly Val Asn Ser Glu Thr Glu Leu Leu Asp Tyr Asp Glu Ile Leu 145 150 155 160 aaa att gct aaa caa gtt caa cct aaa ctg att gtt gct ggc gct tct 528Lys Ile Ala Lys Gln Val Gln Pro Lys Leu Ile Val Ala Gly Ala Ser 165 170 175 gcc tat tca cgc ctg att gat ttt gct aag ttc cgt gaa ate gct gat 576Ala Tyr Ser Arg Leu Ile Asp Phe Ala Lys Phe Arg Glu Ile Ala Asp 180 185 190 agt gtt gga gca aaa tta atg gtt gat atg gca cat att gct gga ttg 624Ser Val Gly Ala Lys Leu Met Val Asp Met Ala His Ile Ala Gly Leu
195 200 205
gta gcg act ggt gcg cat cct aat cca ctt cct tat gct gat gtc gtt 672
Val Ala Thr Gly Ala His Pro Asn Pro Leu Pro Tyr Ala Asp Val Val
210 215 220
aca aca aca act cat aag aca ctc cgt gga cca cgt ggt gga atg att 720
Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Met Ile225 230 235 240
ttg act aac gat gaa gct ttg gcc aag aaa att aac tct gca ate ttc 768
Leu Thr Asn Asp Glu Ala Leu Ala Lys Lys Ile Asn Ser Ala Ile Phe
245 250 255
cct gga act caa ggt ggg cct tta gaa cat gtc att gca gca aaa gca 816
Pro Gly Thr Gln Gly Gly Pro Leu Glu His Val Ile Ala Ala Lys Ala
260 265 270
gta gct ttt aaa gaa gca ctt gat cca gaa ttc aca acc tat att gaa 864
Val Ala Phe Lys Glu Ala Leu Asp Pro Glu Phe Thr Thr Tyr Ile Glu
275 280 285
caa gtc att aaa aat acg caa gca atg gct gag gaa ttt gct aaa gtg 912
Gln Val Ile Lys Asn Thr Gln Ala Met Ala Glu Glu Phe Ala Lys Val
290 295 300
gaa ggc tta cga ttg ata gct ggt ggt tca gat aat cat ttg ctt aat 960
Glu Gly Leu Arg Leu Ile Ala Gly Gly Ser Asp Asn His Leu Leu Asn305 310 315 320
ctt aaa gtt tta gac tta gga att aat ggg aaa gaa gct caa gat tta1008
Leu Lys Val Leu Asp Leu Gly Ile Asn Gly Lys Glu Ala Gln Asp Leu
325 330 335
ttg gat agt gtt cac ate aca ctt aat aaa gaa gca att cct gat gaa1056
Leu Asp Ser Val His Ile Thr Leu Asn Lys Glu Ala Ile Pro Asp Glu
340 345 350
aca tta tca cca ttt aaa act tca ggg gtg cga att gga gca gca gca1104
Thr Leu Ser Pro Phe Lys Thr Ser Gly Val Arg Ile Gly Ala Ala Ala
355 360 365
att aca tca aga gga ttt aaa gaa gtt gaa gcg aaa aaa gtt gca caa1152
Ile Thr Ser Arg Gly Phe Lys Glu Val Glu Ala Lys Lys Val Ala Gln
370 375 380
ttg gtc tca gaa gct ttg gtt aat cac gat aat caa gaa aaa ctt gcg1200
Leu Val Ser Glu Ala Leu Val Asn His Asp Asn Gln Glu Lys Leu Ala385 390 395 400
gaa gtt agg aaa gca gct tta gaa ctg act cgt caa ttt ccc tta1245
Glu Val Arg Lys Ala Ala Leu Glu Leu Thr Arg Gln Phe Pro Leu405 410 415
taa1248
<210> 68<211> 415<212> PRT
<213> Lactococcus lactis; IL1403<400> 68
Met Ile Phe Asp Lys Glu Asp Phe Glu Ser Phe Asp Pro Glu Leu Trp15 10 15
Ala Ala Ile His Ala Glu Glu Ile Arg Gln Gln Gln Asn Ile Glu Leu
20 25 30
Ile Ala Ser Glu Asn Ile Val Ser Lys Ala Val Met Ala Ala Gln Gly
\35 40 45
Ser Val Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr
50 55 60
Tyr Gly Gly Thr Glu Ala Val Asp Val Val Glu Asn Leu Ala Ile Glu65 70 75 80
Arg Ala Lys Glu Leu Phe Gly Ala Lys Phe Ala Asn Val Gln Pro His
85 90 95
Ser Gly Ser Gln Ala Asn Ala Ala Ala Tyr Met Ala Leu Ile Gln Pro
100 105 110
Gly Asp Thr Val Leu Gly Met Asp Leu Asn Ala Gly Gly His Leu Thr
115 120 125
His Gly Ala Ser Val Asn Phe Ser Gly Lys Thr Tyr His Phe Val Pro
130 135 140
Tyr Gly Val Asn Ser Glu Thr Glu Leu Leu Asp Tyr Asp Glu Ile Leu145 150 155 160
Lys Ile Ala Lys Gln Val Gln Pro Lys Leu Ile Val Ala Gly Ala Ser
165 170 175
Ala Tyr Ser Arg Leu Ile Asp Phe Ala Lys Phe Arg Glu Ile Ala Asp
180 185 190
Ser Val Gly Ala Lys Leu Met Val Asp Met Ala His Ile Ala Gly Leu
195 200 205
Val Ala Thr Gly Ala His Pro Asn Pro Leu Pro Tyr Ala Asp Val Val
210 215 220
Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Met Ile225 230 235 240
Leu Thr Asn Asp Glu Ala Leu Ala Lys Lys Ile Asn Ser Ala Ile Phe
245 250 255
Pro Gly Thr Gln Gly Gly Pro Leu Glu His Val Ile Ala Ala Lys Ala
260 265 270
Val Ala Phe Lys Glu Ala Leu Asp Pro Glu Phe Thr Thr Tyr Ile Glu
275 280 285
Gln Val Ile Lys Asn Thr Gln Ala Met Ala Glu Glu Phe Ala Lys Val
290 295 300
Glu Gly Leu Arg Leu XXe AXsl GXy GXy Seir Asp Asn Hxs Leu Leu Asn305 310 315 320
Leu Lys Val Leu Asp Leu Gly Ile Asn Gly Lys Glu Ala Gln Asp Leu
325 330 335
Leu Asp Ser Val His Ile Thr Leu Asn Lys Glu Ala Ile Pro Asp Glu
340 345 350
Thr Leu Ser Pro Phe Lys Thr Ser Gly Val Arg Ile Gly Ala Ala Ala
355 360 365
Ile Thr Ser Arg Gly Phe Lys Glu Val Glu Ala Lys Lys Val Ala Gln
370 375 380
Leu Val Ser Glu Ala Leu Val Asn His Asp Asn Gln Glu Lys Leu Ala385 390 395 400
Glu Val Arg Lys Ala Ala Leu Glu Leu Thr Arg Gln Phe Pro Leu405 410 415
<210> 69<211> 1878<212> DNA
<213> Triticum aestivum
<220>
<221> CDS
<222> (69).. (1601)
<400> 69
ctcgtgccga attcggcacg agcctaccga gaggtgcacg aggaggccgc ccaccaccac 60
cacccacc atg gcc atg gcg acg gcg ctc cgc aag ctc tcc gcc cgc ggcMet Ala Met Ala Thr Ala Leu Arg Lys Leu Ser Ala Arg Gly15 10
110cag ccc ctc tcc cgc ctc acg ccg ctc tac tcc atg gcg tcc ctg ccg 158
Gln Pro Leu Ser Arg Leu Thr Pro Leu Tyr Ser Met Ala Ser Leu Pro
1 5 20 25 30
gcg acg gag gag aga tcc gca gtc acc tgg ccg aag cag ttg aac gcg 206
Ala Thr Glu Glu Arg Ser Ala Val Thr Trp Pro Lys Gln Leu Asn Ala
35 40 45
ccg ctg gag gag gtc gac ccc gag att gcc gac ate ate gag ctc gag 254
Pro Leu Glu Glu Val Asp Pro Glu Ile Ala Asp Ile Ile Glu Leu Glu
50 55 60
aag gcc cgc caa tgg aag ggg ctg gag ctc ate ccg tcg gag aac ttc 302
Lys Ala Arg Gln Trp Lys Gly Leu Glu Leu Ile Pro Ser Glu Asn Phe
65 70 75
acc tcc ctg tcg gtg atg cag gcg gtg gga tcc gtc atg acc aac aag 350
Thr Ser Leu Ser Val Met Gln Ala Val Gly Ser Val Met Thr Asn Lys
80 85 90
tac age gag ggg tac ccc ggc gcg aga tac tac ggt gga aac gaa tac 398
Tyr Ser Glu Gly Tyr Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Glu Tyr95 100 105 110
att gat atg gcc gag acg ctg tgt cag aaa cgt gct ttg gag gcc ttc 446
Ile Asp Met Ala Glu Thr Leu Cys Gln Lys Arg Ala Leu Glu Ala Phe
115 120 125
aat ttg gac cca gag aag tgg gga gtg aat gtg caa cct cta tcg ggt 494
Asn Leu Asp Pro Glu Lys Trp Gly Val Asn Val Gln Pro Leu Ser Gly
130 135 140
tca cct gcc aac ttc cat gta tac act gct ctg ctg aag cca cat gac 542
Ser Pro Ala Asn Phe His Val Tyr Thr Ala Leu Leu Lys Pro His Asp
145 150 155
aga att atg gct ctg gat ctt cct cac ggt gga cat ctt tcc cat ggc 590
Arg Ile Met Ala Leu Asp Leu Pro His Gly Gly His Leu Ser His Gly
160 165 170
tac cag act gac aca aag aaa ate tca gca gtt tca ata ttc ttt gag 638
Tyr Gln Thr Asp Thr Lys Lys Ile Ser Ala Val Ser Ile Phe Phe Glu175 180 185 190
aca atg cct tac aga ctg gat gaa age act ggc ttg att gat tat gac 686
Thr Met Pro Tyr Arg Leu Asp Glu Ser Thr Gly Leu Ile Asp Tyr Asp
195 200 205
cag ttg gag aaa agt gcc gtt ctg ttt agg cca aag ttg att gtt gct 734
Gln Leu Glu Lys Ser Ala Val Leu Phe Arg Pro Lys Leu Ile Val Ala
210 215 220
ggt gct agt gca tat gcc cgc ctt tat gat tat aac cgc atg cgg aag 782
Gly Ala Ser Ala Tyr Ala Arg Leu Tyr Asp Tyr Asn Arg Met Arg Lys
225 230 235
ate tgt gac aag cag aag gca gtt ctt ctg gca gac atg gca cat ate 830
Ile Cys Asp Lys Gln Lys Ala Val Leu Leu Ala Asp Met Ala His Ile
240 245 250
agt ggg cta gtt gct gct ggt gta att ccg tet cct ttt gag tat gca 878
Ser Gly Leu Val Ala Ala Gly Val Ile Pro Ser Pro Phe Glu Tyr Ala255 260 265 270
gat gtg gtg act acc act acc cac aag tca ctc cgt ggt cca cgt gga 926
Asp Val Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly
275 280 285
gcc atg ate ttt ttc cgg aag gga gtg aaa gaa ata aac aaa caa ggg 974
Ala Met Ile Phe Phe Arg Lys Gly Val Lys Glu Ile Asn Lys Gln Gly
290 295 300
aag gag gtt aag tat gat ttt gag gac aaa ate aat gct gct gtc ttc1022
Lys Glu Val Lys Tyr Asp Phe Glu Asp Lys Ile Asn Ala Ala Val Phe
305 310 315
cca ggt ttg caa ggt gga ccc cat aac cat act att act ggc ctg gca1070
Pro Gly Leu Gln Gly Gly Pro His Asn His Thr Ile Thr Gly Leu Ala
320 325 330
gtt gcg ctt aag cag gca act act cag gag tac aga gct tat caa gag1118
Val Ala Leu Lys Gln Ala Thr Thr Gln Glu Tyr Arg Ala Tyr Gln Glu335 340 345 350
caa gtt atg age aac tet gct aga ttt gct gag age tta act tca aaa1166
Gln Val Met Ser Asn Ser Ala Arg Phe Ala Glu Ser Leu Thr Ser Lys
355 360 365
ggc tac gat att gtt tet ggt ggg act gat aac cat tta gtt ttg gtg1214
Gly Tyr Asp Ile Val Ser Gly Gly Thr Asp Asn His Leu Val Leu Val
370 375 380
aac ctc aag aaa aag gga ata gat ggt tca cgt gtg gag aag gtt tta1262
Asn Leu Lys Lys Lys Gly Ile Asp Gly Ser Arg Val Glu Lys Val Leu
385 390 395
gaa aat gtg cat att gea gea aac aag aac acg gtt cct ggt gat gtt1310
Glu Asn Val His Ile Ala Ala Asn Lys Asn Thr Val Pro Gly Asp Val
400 405 410
tca gct atg gta ccc gga ggc ate agg atg gga acc ccc gea ctt aca1358
Ser Ala Met Val Pro Gly Gly Ile Arg Met Gly Thr Pro Ala Leu Thr415 420 425 430
tca aga gga ttt gtt gag gag gac ttc gcc aag gtt gct gac ttc ttc1406
Ser Arg Gly Phe Val Glu Glu Asp Phe Ala Lys Val Ala Asp Phe Phe
435 440 445
gat tcg gea gtg aac ttg gcc ttg aag gtt aaa gct gea gea gea ggt1454
Asp Ser Ala Val Asn Leu Ala Leu Lys Val Lys Ala Ala Ala Ala Gly
450 455 460
acc aaa ctg aag gac ttt gtt gcc act ttg caa tcc gac age aac ate1502
Thr Lys Leu Lys Asp Phe Val Ala Thr Leu Gln Ser Asp Ser Asn Ile
465 470 475
caa gct gaa att gea aag ctt cgc cac gat gtg gag gaa tat gcg aaa1550
Gln Ala Glu Ile Ala Lys Leu Arg His Asp Val Glu Glu Tyr Ala Lys
480 485 490
caa ttc cca aca att gga ttc gag aag gag acc atg aag tac aag aac1598
Gln Phe Pro Thr Ile Gly Phe Glu Lys Glu Thr Met Lys Tyr Lys Asn495 500 505 510
taagaactgc tgtgtttcaa cagcaaagga agcaaacaag aagcacagct gaggacaagt1658
ccatgtaaac aatagatcca tgatgaagcg ccaccatatg taaaaggaat ccaagcattt1718
tacagaatat gggaactttg tcgatagttt cttattgcag gcacatactg taagatgctt1778
cgctgatatg ctataaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa1838
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa1878
<210> 70<211> 510<212> PRT
<213> Triticuni aestivum<400> 70 Met Ala Met Ala Thr Ala Leu Arg Lys Leu Ser Ala Arg Gly Gln Pro1 5 10 15 Leu Ser Arg Leu Thr Pro Leu Tyr Ser Met Ala Ser Leu Pro Ala Thr 20 25 30 Glu Glu Arg Ser Ala Val Thr Trp Pro Lys Gln Leu Asn Ala Pro Leu 35 40 45 Glu Glu Val Asp Pro Glu Ile Ala Asp Ile Ile Glu Leu Glu Lys Ala 50 55 60 Arg Gln Trp Lys Gly Leu Glu Leu Ile Pro Ser Glu Asn Phe Thr Ser65 70 75 80Leu Ser Val Met Gln Ala Val Gly Ser Val Met Thr Asn Lys Tyr Ser 85 90 95 Glu Gly Tyr Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp 100 105 110 Met Ala Glu Thr Leu Cys Gln Lys Arg Ala Leu Glu Ala Phe Asn Leu 115 120 125 Asp Pro Glu Lys Trp Gly Val Asn Val Gln Pro Leu Ser Gly Ser Pro 130 135 140 Ala Asn Phe His Val Tyr Thr Ala Leu Leu Lys Pro His Asp Arg Ile145 150 155 160Met Ala Leu Asp Leu Pro His Gly Gly His Leu Ser His Gly Tyr Gln 165 170 175 Thr Asp Thr Lys Lys Ile Ser Ala Val Ser Ile Phe Phe Glu Thr Met 180 185 190 Pro Tyr Arg Leu Asp Glu Ser Thr Gly Leu Ile Asp Tyr Asp Gln Leu 195 200 205 Glu Lys Ser Ala Val Leu Phe Arg Pro Lys Leu Ile Val Ala Gly Ala 210 215 220 Ser Ala Tyr Ala Arg Leu Tyr Asp Tyr Asn Arg Met Arg Lys Ile Cys225 230 235 240Asp Lys Gln Lys Ala Val Leu Leu Ala Asp Met Ala His Ile Ser Gly 245 250 255 Leu Val Ala Ala Gly Val Ile Pro Ser Pro Phe Glu Tyr Ala Asp Val 260 265 270 Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala Met 275 280 285 Ile Phe Phe Arg Lys Gly Val Lys Glu Ile Asn Lys Gln Gly Lys Glu 290 295 300 Val Lys Tyr Asp Phe Glu Asp Lys Ile Asn Ala Ala Val Phe Pro Gly305 310 315 320Leu Gln Gly Gly Pro His Asn His Thr Ile Thr Gly Leu Ala Val Ala 325 330 335 Leu Lys Gln Ala Thr Thr Gln Glu Tyr Arg Ala Tyr Gln Glu Gln Val 340 345 350 Met Ser Asn Ser Ala Arg Phe Ala Glu Ser Leu Thr Ser Lys Gly Tyr 355 360 365 Asp Ile Val Ser Gly Gly Thr Asp Asn His Leu Val Leu Val Asn Leu 370 375 380 Lys Lys Lys Gly Ile Asp Gly Ser Arg Val Glu Lys Val Leu Glu Asn385 390 395 400Val His Ile Ala Ala Asn Lys Asn Thr Val Pro Gly Asp Val Ser Ala 405 410 415 Met Val Pro Gly Gly Ile Arg Met Gly Thr Pro Ala Leu Thr Ser Arg 420 425 430 Gly Phe Val Glu Glu Asp Phe Ala Lys Val Ala Asp Phe Phe Asp Ser 435 440 445 Ala Val Asn Leu Ala Leu Lys Val Lys Ala Ala Ala Ala Gly Thr Lys 450 455 460 Leu Lys Asp Phe Val Ala Thr Leu Gln Ser Asp Ser Asn Ile Gln Ala465 470 475 480Glu Ile Ala Lys Leu Arg His Asp Val Glu Glu Tyr Ala Lys Gln Phe485 490 495
Pro Thr Ile Gly Phe Glu Lys Glu Thr Met Lys Tyr Lys Asn500 505 510
<210> 71<211> 1272<212> DKA
<213> IQebsiella pneumoniae
<220>
<221> CDS
<222> (1).. (1272)
<400> 71
ctg agt cag gag atg cgg atg tta aag cgt gaa atg aac att gcc gat 48
Leu Ser Gln Glu Met Arg Met Leu Lys Arg Glu Met Asn Ile Ala Asp1 5 10 15
tat gat gcc gaa ctg tgg cag gct atg gag cag gaa aaa gta cgt cag 96
Tyr Asp Ala Glu Leu Trp Gln Ala Met Glu Gln Glu Lys Val Arg Gln
20 25 30
gaa gag cac ate gaa ctg ate gcc tcc gaa aac tac acc agt ccg cgc 144
Glu Glu His Ile Glu Leu Ile Ala Ser Glu Asn Tyr Thr Ser Pro Arg
35 40 45
gtt atg cag gcg cag ggc tet cag ctg acc aac aaa tat gct gaa ggg 192
Val Met Gln Ala Gln Gly Ser Gln Leu Thr Asn Lys Tyr Ala Glu Gly
50 55 60
tat ccg ggc aag cgt tac tac ggc ggc tgt gaa tac gtc gac gtg gtt 240
Tyr Pro Gly Lys Arg Tyr Tyr Gly Gly Cys Glu Tyr Val Asp Val Val65 70 75 80
gaa cag ctg gea ate gac cgc gcg aaa gaa ctg ttc ggc gct gac tat 288
Glu Gln Leu Ala Ile Asp Arg Ala Lys Glu Leu Phe Gly Ala Asp Tyr
85 90 95
gct aac gtc cag ccg cac tcc ggc tcc cag gct aac ttt gcc gtc tac 336
Ala Asn Val Gln Pro His Ser Gly Ser Gln Ala Asn Phe Ala Val Tyr
100 105 110
acc gcg ctg ctg cag ccg ggc gac acc gtg ctc ggt atg aac ctg gcg 384
Thr Ala Leu Leu Gln Pro Gly Asp Thr Val Leu Gly Met Asn Leu Ala
115 120 125
cag ggc ggc cac ctg act cac ggc tcc ccg gtt aac ttc tcc ggc aaa 432
Gln Gly Gly His Leu Thr His Gly Ser Pro Val Asn Phe Ser Gly Lys
130 135 140
ctg tac aat ate ate cct tac ggt ate gat gag tcc ggt aaa att gac 480
Leu Tyr Asn Ile Ile Pro Tyr Gly Ile Asp Glu Ser Gly Lys Ile Asp145 150 155 160
tat gac gac atg gcg aag cag gct cag gaa cac aaa ccg aag atg ate 528
Tyr Asp Asp Met Ala Lys Gln Ala Gln Glu His Lys Pro Lys Met Ile
165 170 175
ate ggt ggt ttc tcc gct tac tcc ggt ate gtt gac tgg gcg aaa atg 576
Ile Gly Gly Phe Ser Ala Tyr Ser Gly Ile Val Asp Trp Ala Lys Met
180 185 190
cgt gaa ate gct gac age ate ggc gct tac ctg ttc gtc gat atg gcg 624
Arg Glu Ile Ala Asp Ser Ile Gly Ala Tyr Leu Phe Val Asp Met Ala
195 200 205
cac gtg gea ggc ctg att gcc gct ggc gtg tac ccg aac ccg gtt ccg 672
His Val Ala Gly Leu Ile Ala Ala Gly Val Tyr Pro Asn Pro Val Pro
210 215 220
cat gct cac gtt gtg acc acc acc acc cac aaa acc ctg gcg ggt ccg 720
His Ala His Val Val Thr Thr Thr Thr His Lys Thr Leu Ala Gly Pro225 230 235 240
cgc ggc ggc ctg att ctg gcg aaa ggc ggt age gaa gag ctg tac aaa 768
Arg Gly Gly Leu Ile Leu Ala Lys Gly Gly Ser Glu Glu Leu Tyr Lys
245 250 255
aaa ctg aac tet gcg gta ttc cca age gcg cag ggc ggc ccg ctg atg 816Lys Leu Asn Ser Ala Val Phe Pro Ser Ala Gln Gly Gly Pro Leu Met
260 265 270
cac gtt ate gcg gcg aaa gcg gtg gcg ctg aaa gaa gcg atg gag cca 864
His Val Ile Ala Ala Lys Ala Val Ala Leu Lys Glu Ala Met Glu Pro
275 280 285
gag ttt aaa gtt tac cag cag cag gtt gcg aaa aac gct aaa gcg atg 912
Glu Phe Lys Val Tyr Gln Gln Gln Val Ala Lys Asn Ala Lys Ala Met
290 295 300
gtg gaa gtg ttc ctg aac cgc ggc tac aaa gtg gtg tet ggc ggt act 960
Val Glu Val Phe Leu Asn Arg Gly Tyr Lys Val Val Ser Gly Gly Thr305 310 315 320
gag aac cac ctg ttc ctg ctg gat ctg gtg gat aaa aac ctg acc ggt1008
Glu Asn His Leu Phe Leu Leu Asp Leu Val Asp Lys Asn Leu Thr Gly
325 330 335
aaa gaa gct gac gcc gct ctg ggc cgc gcc aac ate acc gtc aac aaa1056
Lys Glu Ala Asp Ala Ala Leu Gly Arg Ala Asn Ile Thr Val Asn Lys
340 345 350
aac age gtg ccg aac gat ccg aag age ccg tte gta acc tcc ggt ate1104
Asn Ser Val Pro Asn Asp Pro Lys Ser Pro Phe Val Thr Ser Gly Ile
355 360 365
cgt ate ggt tet ccg gea gtg act cgc cgc ggc ttt aaa gaa gcg gaa1152
Arg Ile Gly Ser Pro Ala Val Thr Arg Arg Gly Phe Lys Glu Ala Glu
370 375 380
gtc aaa gag ctg gct ggc tgg atg tgt gac gtg ctg gac aat ate aat1200
Val Lys Glu Leu Ala Gly Trp Met Cys Asp Val Leu Asp Asn Ile Asn385 390 395 400
gac gac gcg gtc att gag cgc gtg aaa ggt aaa gtg ctg gat ate tgc1248
Asp Asp Ala Val Ile Glu Arg Val Lys Gly Lys Val Leu Asp Ile Cys
405 410 415
gcc cgc ttc ccg gta tat gcg taa1272
Ala Arg Phe Pro Val Tyr Ala420
<210> 72<211> 423<212> PRT
<213> Klebsiella pneumoniae<400> 72
Leu Ser Gln Glu Met Arg Met Leu Lys Arg Glu Met Asn Ile Ala Asp15 10 15
Tyr Asp Ala Glu Leu Trp Gln Ala Met Glu Gln Glu Lys Val Arg Gln
20 25 30
Glu Glu His Ile Glu Leu Ile Ala Ser Glu Asn Tyr Thr Ser Pro Arg
35 40 45
Val Met Gln Ala Gln Gly Ser Gln Leu Thr Asn Lys Tyr Ala Glu Gly
50 55 60
Tyr Pro Gly Lys Arg Tyr Tyr Gly Gly Cys Glu Tyr Val Asp Val Val65 70 75 80
Glu Gln Leu Ala Ile Asp Arg Ala Lys Glu Leu Phe Gly Ala Asp Tyr
85 90 95
Ala Asn Val Gln Pro His Ser Gly Ser Gln Ala Asn Phe Ala Val Tyr
100 105 110
Thr Ala Leu Leu Gln Pro Gly Asp Thr Val Leu Gly Met Asn Leu Ala
115 120 125
Gln Gly Gly His Leu Thr His Gly Ser Pro Val Asn Phe Ser Gly Lys130 135 140
Leu Tyr Asn Ile Ile Pro Tyr Gly Ile Asp Glu Ser Gly Lys Ile Asp145 150 155 160
Tyr Asp Asp Met Ala Lys Gln Ala Gln Glu His Lys Pro Lys Met Ile
165 170 175
Ile Gly Gly Phe Ser Ala Tyr Ser Gly Ile Val Asp Trp Ala Lys Met
180 185 190
Arg Glu Ile Ala Asp Ser Ile Gly Ala Tyr Leu Phe Val Asp Met Ala
195 200 205
His Val Ala Gly Leu Ile Ala Ala Gly Val Tyr Pro Asn Pro Val Pro
210 215 220
His Ala His Val Val Thr Thr Thr Thr His Lys Thr Leu Ala Gly Pro225 230 235 240
Arg Gly Gly Leu Ile Leu Ala Lys Gly Gly Ser Glu Glu Leu Tyr Lys
245 250 255
Lys Leu Asn Ser Ala Val Phe Pro Ser Ala Gln Gly Gly Pro Leu Met
260 265 270
His Val Ile Ala Ala Lys Ala Val Ala Leu Lys Glu Ala Met Glu Pro
275 280 285
Glu Phe Lys Val Tyr Gln Gln Gln Val Ala Lys Asn Ala Lys Ala Met
290 295 300
Val Glu Val Phe Leu Asn Arg Gly Tyr Lys Val Val Ser Gly Gly Thr305 310 315 320
Glu Asn His Leu Phe Leu Leu Asp Leu Val Asp Lys Asn Leu Thr Gly
325 330 335
Lys Glu Ala Asp Ala Ala Leu Gly Arg Ala Asn Ile Thr Val Asn Lys
340 345 350
Asn Ser Val Pro Asn Asp Pro Lys Ser Pro Phe Val Thr Ser Gly Ile
355 360 365
Arg Ile Gly Ser Pro Ala Val Thr Arg Arg Gly Phe Lys Glu Ala Glu
370 375 380
Val Lys Glu Leu Ala Gly Trp Met Cys Asp Val Leu Asp Asn Ile Asn385 390 395 400
Asp Asp Ala Val Ile Glu Arg Val Lys Gly Lys Val Leu Asp Ile Cys
405 410 415
Ala Arg Phe Pro Val Tyr Ala420
<210> 73<211> 1269<212> DNA
<213> Streptococcus pneumoniae
<220>
<221> CDS
<222> (13)..(1269)
<400> 73
aggagaagac et atg att ttt gac aaa gat gat ttt aaa gca tat gat gct 51Met Ile Phe Asp Lys Asp Asp Phe Lys Ala Tyr Asp Ala15 10
gat ctc tgg aat gct att gcc aaa gaa gaa gaa cgc caa caa aat aat 99
Asp Leu Trp Asn Ala Ile Ala Lys Glu Glu Glu Arg Gln Gln Asn Asn
15 20 25
ate gag tta att gct tcg gaa aac gta gtt tcc aag gct gtt atg gca 147
Ile Glu Leu Ile Ala Ser Glu Asn Val Val Ser Lys Ala Val Met Ala30 35 40 45
gct caa ggg tet ate ttg aca aat aaa tat gcc gag ggt tac cca gga 195
Ala Gln Gly Ser Ile Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly
50 55 60
cgc cgt tat tat ggt gga act gat gta gta gac gtt gta gag act ctt 243
Arg Arg Tyr Tyr Gly Gly Thr Asp Val Val Asp Val Val Glu Thr Leu65 70 75gct att gaa cgc gca aaa gaa att ttc ggt gct aaa ttt gcc aat gtt 291
Ala Ile Glu Arg Ala Lys Glu Ile Phe Gly Ala Lys Phe Ala Asn Val
80 85 90
caa cca cat tca gga age caa gct aac tgt gcg gct tac atg tcc ttg 339
Gln Pro His Ser Gly Ser Gln Ala Asn Cys Ala Ala Tyr Met Ser Leu
95 100 105
att gag cca ggt gat acg gtt atg gga atg gat ttg gca tca ggt ggt 387
Ile Glu Pro Gly Asp Thr Val Met Gly Met Asp Leu Ala Ser Gly Gly110 115 120 125
cat ttg act cat ggg gct cct gtt age ttc tet ggt caa acc tac aac 435
His Leu Thr His Gly Ala Pro Val Ser Phe Ser Gly Gln Thr Tyr Asn
130 135 140
ttt gtt tet tat agt gtt gat cct aaa acg gaa ctc tta gac ttt gat 483
Phe Val Ser Tyr Ser Val Asp Pro Lys Thr Glu Leu Leu Asp Phe Asp
145 150 155
gct ate ttg aaa caa gcc caa gaa gta aaa cca aaa ctg att gta gct 531
Ala Ile Leu Lys Gln Ala Gln Glu Val Lys Pro Lys Leu Ile Val Ala
160 165 170
ggt gct tca gcc tat tet caa att ate gat ttt tca aaa ttc cgt gaa 579
Gly Ala Ser Ala Tyr Ser Gln Ile Ile Asp Phe Ser Lys Phe Arg Glu
175 180 185
ate gca gat gct gtc ggt gcg aag ctc atg gtg gac atg gcc cat ate 627
Ile Ala Asp Ala Val Gly Ala Lys Leu Met Val Asp Met Ala His Ile190 195 200 205
gct ggc ttg gtt gcg gct ggc ctt cat cca age cca gtt cca tac gct 675
Ala Gly Leu Val Ala Ala Gly Leu His Pro Ser Pro Val Pro Tyr Ala
210 215 220
cat ate aca aca aca acg acc cac aaa acc ctt cgt gga cct cgt ggt 723
His Ile Thr Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly
225 230 235
ggt ttg att ttg acc aat gac gaa gaa ctt gct aaa aaa ate aat tca 771
Gly Leu Ile Leu Thr Asn Asp Glu Glu Leu Ala Lys Lys Ile Asn Ser
240 245 250
gct att ttc cca ggt att cag ggc ggt cct tta gag cat gtt gtg gcg 819
Ala Ile Phe Pro Gly Ile Gln Gly Gly Pro Leu Glu His Val Val Ala
255 260 265
gct aag gca gtt tcc ttc aaa gaa gtt ttg gat cca gcc ttc aag gaa 867
Ala Lys Ala Val Ser Phe Lys Glu Val Leu Asp Pro Ala Phe Lys Glu270 - 275 280 285
tat gct gcc aat gta att aag aac age aag gct atg gca gat gtc ttc 915
Tyr Ala Ala Asn Val Ile Lys Asn Ser Lys Ala Met Ala Asp Val Phe
290 295 300
ttg caa gac cct gat ttc cgt att att tca ggt gga act gaa aac cat 963
Leu Gln Asp Pro Asp Phe Arg Ile Ile Ser Gly Gly Thr Glu Asn His
305 310 315
ctc ttc ctt gtt gat gtg act aaa gtt gta gaa aac ggc aaa gtt gct1011
Leu Phe Leu Val Asp Val Thr Lys Val Val Glu Asn Gly Lys Val Ala
320 325 330
caa aac ttg ttg gat gaa gtc aat att acc tta aat aaa aac tca ate1059
Gln Asn Leu Leu Asp Glu Val Asn Ile Thr Leu Asn Lys Asn Ser Ile
335 340 345
cct tac gaa age ttg tca cca ttc aag aca agt ggg att cgt ate gga1107
Pro Tyr Glu Ser Leu Ser Pro Phe Lys Thr Ser Gly Ile Arg Ile Gly350 355 360 365
gca gca gcc att act gca cgt gga ttt ggt gaa gaa gaa agt cgc aaa1155
Ala Ala Ala Ile Thr Ala Arg Gly Phe Gly Glu Glu Glu Ser Arg Lys
370 375 380
gtg gct gaa ctc ate att aaa acc ctt aag aat tca gaa aat gag gct1203Val Ala Glu Leu Ile Ile Lys Thr Leu Lys Asn Ser Glu Asn Glu Ala
385 390 395
gta tta gaa gaa gtg aga agt gca gtc aaa gaa ttg aca gat gcc ttc1251
Val Leu Glu Glu Val Arg Ser Ala Val Lys Glu Leu Thr Asp Ala Phe
400 405 410
cca tta tac gag gac taa1269
Pro Leu Tyr Glu Asp415
<210> 74<211> 418<212> PRT
<213> Streptococcus pneumoniae<400> 74
Met Ile Phe Asp Lys Asp Asp Phe Lys Ala Tyr Asp Ala Asp Leu Trp15 10 15
Asn Ala Ile Ala Lys Glu Glu Glu Arg Gln Gln Asn Asn Ile Glu Leu
20 25 30
Ile Ala Ser Glu Asn Val Val Ser Lys Ala Val Met Ala Ala Gln Gly
35 40 45
Ser Ile Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Arg Arg Tyr
50 55 60
Tyr Gly Gly Thr Asp Val Val Asp Val Val Glu Thr Leu Ala Ile Glu65 70 75 80
Arg Ala Lys Glu Ile Phe Gly Ala Lys Phe Ala Asn Val Gln Pro His
85 90 95
Ser Gly Ser Gln Ala Asn Cys Ala Ala Tyr Met Ser Leu Ile Glu Pro
100 105 110
Gly Asp Thr Val Met Gly Met Asp Leu Ala Ser Gly Gly His Leu Thr
115 120 125
His Gly Ala Pro Val Ser Phe Ser Gly Gln Thr Tyr Asn Phe Val Ser
130 135 140
Tyr Ser Val Asp Pro Lys Thr Glu Leu Leu Asp Phe Asp Ala Ile Leu145 150 155 160
Lys Gln Ala Gln Glu Val Lys Pro Lys Leu Ile Val Ala Gly Ala Ser
165 ^ 170 175
Ala Tyr Ser Gln Ile Ile Asp Phe Ser Lys Phe Arg Glu Ile Ala Asp
180 185 190
Ala Val Gly Ala Lys Leu Met Val Asp Met Ala His Ile Ala Gly Leu
195 200 205
Val Ala Ala Gly Leu His Pro Ser Pro Val Pro Tyr Ala His Ile Thr
210 215 220
Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile225 230 235 240
Leu Thr Asn Asp Glu Glu Leu Ala Lys Lys Ile Asn Ser Ala Ile Phe
245 250 255
Pro Gly Ile Gln Gly Gly Pro Leu Glu His Val Val Ala Ala Lys Ala
260 265 270
Val Ser Phe Lys Glu Val Leu Asp Pro Ala Phe Lys Glu Tyr Ala Ala
275 280 285
Asn Val Ile Lys Asn Ser Lys Ala Met Ala Asp Val Phe Leu Gln Asp
290 295 300
Pro Asp Phe Arg Ile Ile Ser Gly Gly Thr Glu Asn His Leu Phe Leu305 310 315 320
Val Asp Val Thr Lys Val Val Glu Asn Gly Lys Val Ala Gln Asn Leu
325 330 335
Leu Asp Glu Val Asn Ile Thr Leu Asn Lys Asn Ser Ile Pro Tyr Glu
340 345 350
Ser Leu Ser Pro Phe Lys Thr Ser Gly Ile Arg Ile Gly Ala Ala Ala355 360 365Ile Thr Ala Arg Gly Phe Gly Glu Glu Glu Ser Arg Lys Val Ala Glu
370 375 380
Leu Ile Ile Lys Thr Leu Lys Asn Ser Glu Asn Glu Ala Val Leu Glu385 390 395 400
Glu Val Arg Ser Ala Val Lys Glu Leu Thr Asp Ala Phe Pro Leu Tyr405 410 415
Glu Asp
<210> 75<211> 1698<212> DNA
<213> Saccharomyces cerevisiae
<220>
<221> CDS
<222> (1)..(1698)
<400> 75
atg att etc tcc gtt ateMet Ile Leu Ser Val Ile1 5
ccc cct tct gtc caa gagPro Pro Ser Val Gln Glu20
ttt agg tac ttc gct tatPhe Arg Tyr Phe Ala Tyr35
gcc ate gcc tct tgg agaAla Ile Ala Ser Trp Arg50
cat ttc cac ate gag tctHis Phe His Ile Glu Ser65 70
tct gea ttg gcc aaa tgtSer Ala Leu Ala Lys Cys85
acc agt ggt gea caa tcgThr Ser Gly Ala Gln Ser100
cca gag atg ttt gac atePro Glu Met Phe Asp Ile115
tct ate acc ctt ate ccaSer Ile Thr Leu Ile Pro130
gat ttg cta ggt tct gagAsp Leu Leu Gly Ser Glu145 150
ggt gaa aga tac tac ggaGly Glu Arg Tyr Tyr Gly165
ttg tgt caa gea aga gctLeu Cys Gln Ala Arg Ala180
tgg gga gtt aat gtt caaTrp Gly Val Asn Val Gln195
gtt tac tcc gct ate atgVal Tyr Ser Ala Ile Met210
ttg cca gat ggt ggt cacLeu Pro Asp Gly Gly His
tgc tgg ttc tta gtc cacCys Trp Phe Leu Val His10
ata gaa tat aaa aaa gacIle Glu Tyr Lys Lys Asp25
tgg tgg tca atg aga aaaTrp Trp Ser Met Arg Lys40
aga gea aac tat caa aaaArg Ala Asn Tyr Gln Lys55 60
cat agt ctt tca ate atgHis Ser Leu Ser Ile Met75
atg gea act gtt cat cgtMet Ala Thr Val His Arg90
cta gtc tcc aaa cca gtcLeu Val Ser Lys Pro Val105
ttg caa caa gaa cgt cacLeu Gln Gln Glu Arg His120
tca gaa aac ttc acc tcgSer Glu Asn Phe Thr Ser135 140
ctc caa aac aag tat tctLeu Gln Asn Lys Tyr Ser155
ggt aac gaa ate ate gatGly Asn Glu Ile Ile Asp170
ctg gaa ctg tac gga ttaLeu Glu Leu Tyr Gly Leu185
cca tta age ggg gea cctPro Leu Ser Gly Ala Pro200
aac gtt ggt gaa aga ttaAsn Val Gly Glu Arg Leu215 220
ttg tct cac ggg tac caaLeu Ser His Gly Tyr Gln
tgt ctg ttc tgt 48
Cys Leu Phe Cys15
tca tta ttt ttt 96
Ser Leu Phe Phe30
aaa ata cta aaa 144
Lys Ile Leu Lys45
tca tca age cga 192
Ser Ser Ser Arg
ttt ccc aga gct 240
Phe Pro Arg Ala80
cgt ggg cta ctc 288
Arg Gly Leu Leu95
tcg gag gga gat 336
Ser Glu Gly Asp110
aga caa aaa cac 384
Arg Gln Lys His
125
aag gcc gtt atg 432
Lys Ala Val Met
gaa ggt tat cca 480
Glu Gly Tyr Pro160
aag tcc gaa tcc 528
Lys Ser Glu Ser175
gac cct gcc aag 576
Asp Pro Ala Lys190
gcc aat ttg tat 624
Ala Asn Leu Tyr
205
atg gga ttg gat 672
Met Gly Leu Asp
ctt aag tca gga 720
Leu Lys Ser Gly225 230 235 240
acg cca att tct ttc att tcc aaa tac ttc caa agt atg cca tac cat 768
Thr Pro Ile Ser Phe Ile Ser Lys Tyr Phe Gln Ser Met Pro Tyr His
245 250 255
gtc gac cac act acg ggg cta ate gat tac gat aac ttg caa gta ttg 816
Val Asp His Thr Thr Gly Leu Ile Asp Tyr Asp Asn Leu Gln Val Leu
260 265 270
gcc aag gea ttc aga cca aag gtg ate gtg gcc ggt act tcc gcg tac 864
Ala Lys Ala Phe Arg Pro Lys Val Ile Val Ala Gly Thr Ser Ala Tyr
275 280 285
tcg aga tta ata gac tac gct aga ttc aag gaa att tcc caa gga tgc 912
Ser Arg Leu Ile Asp Tyr Ala Arg Phe Lys Glu Ile Ser Gln Gly Cys
290 295 300
ggc gea tat ttg atg agt gat atg gea cac ata tcc ggt ttg gtg gea 960
Gly Ala Tyr Leu Met Ser Asp Met Ala His Ile Ser Gly Leu Val Ala305 310 315 320
gcc aat gtt gtc cca tct cca ttt gaa cat tcc gat ata gtt acc aca1008
Ala Asn Val Val Pro Ser Pro Phe Glu His Ser Asp Ile Val Thr Thr
325 330 335
acc act cac aag tcc ttg aga ggc cca aga ggt gct atg att ttc ttc1056
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala Met Ile Phe Phe
340 345 350
aga aag ggt ate aag tct gtc acc aaa aag ggc aag gaa ate cca tat1104
Arg Lys Gly Ile Lys Ser Val Thr Lys Lys Gly Lys Glu Ile Pro Tyr
355 360 365
gag tta gaa aag aaa ate aac ttc tca gtt ttc cca gga cat caa ggt1152
Glu Leu Glu Lys Lys Ile Asn Phe Ser Val Phe Pro Gly His Gln Gly
370 375 380
ggt cct cac aac cat act ate ggt gea atg gea gtg gea tta aag caa1200
Gly Pro His Asn His Thr Ile Gly Ala Met Ala Val Ala Leu Lys Gln385 390 395 400
gcg atg tct cca gaa ttc aaa gaa tac caa caa aaa att gtc gac aac1248
Ala Met Ser Pro Glu Phe Lys Glu Tyr Gln Gln-Lys Ile Val Asp Asn
405 410 415
age aaa tgg ttt gct cag gaa cta acc aag atg ggt tat aag ttg gtt1296
Ser Lys Trp Phe Ala Gln Glu Leu Thr Lys Met Gly Tyr Lys Leu Val
420 425 430
tcc ggc ggt acc gat aac cac ttg att gtt att gac tta tcc ggt act1344
Ser Gly Gly Thr Asp Asn His Leu Ile Val Ile Asp Leu Ser Gly Thr
435 440 445
cag gta gac ggt gct cgt gtc gag aca att tta agt gcc ttg aac att1392
Gln Val Asp Gly Ala Arg Val Glu Thr Ile Leu Ser Ala Leu Asn Ile
450 455 460
gct gct aac aag aac acc ate cca ggt gat aag agt gct ctt ttc ccc1440
Ala Ala Asn Lys Asn Thr Ile Pro Gly Asp Lys Ser Ala Leu Phe Pro465 470 475 480
tct ggt cta aga ate ggt act cca gea atg acc acg aga gga ttt ggc1488
Ser Gly Leu Arg Ile Gly Thr Pro Ala Met Thr Thr Arg Gly Phe Gly
485 490 495
cgt gaa gag ttt tct caa gtc gea aag tac att gat tct gcc gtt aag1536
Arg Glu Glu Phe Ser Gln Val Ala Lys Tyr Ile Asp Ser Ala Val Lys500 505 510
ctc gct gaa aat ttg aaa act ttg gaa cca aca acg aaa cta gat gca1584
Leu Ala Glu Asn Leu Lys Thr Leu Glu Pro Thr Thr Lys Leu Asp Ala
515 520 525
aga tca aga ctc aat gag ttc aag aag ttg tgt aat gaa tct agt gaa1632
Arg Ser Arg Leu Asn Glu Phe Lys Lys Leu Cys Asn Glu Ser Ser Glu
530 535 540
gtc gct gct ttg tct ggc gag att tcc aag tgg gtc ggt caa tac cct1680
Val Ala Ala Leu Ser Gly Glu Ile Ser Lys Trp Val Gly Gln Tyr Pro545 550 555 560
gtc cca ggt gat ate taa1698
Val Pro Gly Asp Ile565
<210> 76<211> 565<212> PRT
<213> Saccharomyces cerevisiae
<400> 76
Met Ile Leu Ser Val Ile Cys Trp Phe Leu Val His Cys Leu Phe Cys15 10 15
Pro Pro Ser Val Gln Glu Ile Glu Tyr Lys Lys Asp Ser Leu Phe Phe
20 25 30
Phe Arg Tyr Phe Ala Tyr Trp Trp Ser Met Arg Lys Lys Ile Leu Lys
35 40 45
Ala Ile Ala Ser Trp Arg -Arg Ala Asn Tyr Gln Lys Ser Ser Ser Arg
50 55 60
His Phe His Ile Glu Ser His Ser Leu Ser Ile Met Phe Pro Arg Ala65 70 75 80
Ser Ala Leu Ala Lys Cys Met Ala Thr Val His Arg Arg Gly Leu Leu
85 90 95
Thr Ser Gly Ala Gln Ser Leu Val Ser Lys Pro Val Ser Glu Gly Asp
100 105 110
Pro Glu Met Phe Asp Ile Leu Gln Gln Glu Arg His Arg Gln Lys His
115 120 125
Ser Ile Thr Leu Ile Pro Ser Glu Asn Phe Thr Ser Lys Ala Val Met
130 135 140
Asp Leu Leu Gly Ser Glu Leu Gln Asn Lys Tyr Ser Glu Gly Tyr Pro145 150 155 160
Gly Glu Arg Tyr Tyr Gly Gly Asn Glu Ile Ile Asp Lys Ser Glu Ser
165 170 175
Leu Cys Gln Ala Arg Ala Leu Glu Leu Tyr Gly Leu Asp Pro Ala Lys
180 185 190
Trp Gly Val Asn Val Gln Pro Leu Ser Gly Ala Pro Ala Asn Leu Tyr
195 200 205
Val Tyr Ser Ala Ile Met Asn Val Gly Glu Arg Leu Met Gly Leu Asp
210 215 220
Leu Pro Asp Gly Gly His Leu Ser His Gly Tyr Gln Leu Lys Ser Gly225 230 235 240
Thr Pro Ile Ser Phe Ile Ser Lys Tyr Phe Gln Ser Met Pro Tyr His
245 250 255
Val Asp His Thr Thr Gly Leu Ile Asp Tyr Asp Asn Leu Gln Val Leu
260 265 270
Ala Lys Ala Phe Arg Pro Lys Val Ile Val Ala Gly Thr Ser Ala Tyr
275 280 285
Ser Arg Leu Ile Asp Tyr Ala Arg Phe Lys Glu Ile Ser Gln Gly Cys
290 295 300
Gly Ala Tyr Leu Met Ser Asp Met Ala His Ile Ser Gly Leu Val Ala305 310 315 320
Ala Asn Val Val Pro Ser Pro Phe Glu His Ser Asp Ile Val Thr Thr
325 330 335
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala Met Ile Phe Phe
340 345 350
Arg Lys Gly Ile Lys Ser Val Thr Lys Lys Gly Lys Glu Ile Pro Tyr
355 360 365
Glu Leu Glu Lys Lys Ile Asn Phe Ser Val Phe Pro Gly His Gln Gly
370 375 380
Gly Pro His Asn His Thr Ile Gly Ala Met Ala Val Ala Leu Lys Gln385 390 395 400
Ala Met Ser Pro Glu Phe Lys Glu Tyr Gln Gln Lys Ile Val Asp Asn
405 410 415
Ser Lys Trp Phe Ala Gln Glu Leu Thr Lys Met Gly Tyr Lys Leu Val
420 425 430
Ser Gly Gly Thr Asp Asn His Leu Ile Val Ile Asp Leu Ser Gly Thr
435 440 445
Gln Val Asp Gly Ala Arg Val Glu Thr Ile Leu Ser Ala Leu Asn Ile
450 455 460
Ala Ala Asn Lys Asn Thr Ile Pro Gly Asp Lys Ser Ala Leu Phe Pro465 470 475 480
Ser Gly Leu Arg Ile Gly Thr Pro Ala Met Thr Thr Arg Gly Phe Gly
485 490 495
Arg Glu Glu Phe Ser Gln Val Ala Lys Tyr Ile Asp Ser Ala Val Lys
500 505 510
Leu Ala Glu Asn Leu Lys Thr Leu Glu Pro Thr Thr Lys Leu Asp Ala
515 520 525
Arg Ser Arg Leu Asn Glu Phe Lys Lys Leu Cys Asn Glu Ser Ser Glu
530 535 540
Val Ala Ala Leu Ser Gly Glu Ile Ser Lys Trp Val Gly Gln Tyr Pro545 550 555 560
Val Pro Gly Asp Ile565
<210> 77<211> 1410<212> DKA
<213> Saccharomyces cerevisiae
<220>
<221> CDS
<222> (1)..(1410)
<400> 77atg cct tac actMet Pro Tyr Thr1
ttg gtg gac accLeu Val Asp Thr20
gaa aga caa aagGlu Arg Gln Lys35
tca acc tcc gttSer Thr Ser Val50
tct gaa ggt tatSer Glu Gly Tyr65
gac aga atg gaaAsp Arg Met Glu
gtt act cca gac
cta tcc gac gctLeu Ser Asp Ala5
gac cct gaa gtgAsp Pro Glu Val
cac tcc ate gatHis Ser Ile Asp40
ttc gat gcc cttPhe Asp Ala Leu55
cca ggt gct cgtPro Gly Ala Arg70
att cta tgt caaIle Leu Cys Gln85
aaa tgg ggt gtt
cat cat aag ttgHis His Lys Leu10
gac tcc att ateAsp Ser Ile Ile25
ttg att gct tctLeu Ile Ala Ser
gga act cca ttgGly Thr Pro Leu60
tac tac ggt ggtTyr Tyr Gly Gly75
caa aga gct ttgGln Arg Ala Leu90
aac gtc caa act
ate acc tct catIle Thr Ser His15
aag gat gaa attLys Asp Glu Ile30
gaa aat ttc accGlu Asn Phe Thr45
tcc aac aaa tacSer Asn Lys Tyr
aat gaa cac attAsn Glu His Ile80
aaa gct ttc catLys Ala Phe His95
tta tct ggt tctVal Thr Pro Asp100
cct gct aac ttgPro Ala Asn Leu115
ttg atg ggt ctaLeu Met Gly Leu130
gct act gaa aacAla Thr Glu Asn145
ttc cca tac agaPhe Pro Tyr Arg
tta gaa aag aacLeu Glu Lys Asn180
act tca gca tacThr Ser Ala Tyr195
gcc gac aaa tgtAla Asp Lys Cys210
ggt ttg ate gccGly Leu Ile Ala225
ate gtt acc accIle Val Thr Thr
atg att ttc ttcMet Ile Phe Phe260
aag gaa gtt ctaLys Glu Val Leu275
cca ggt cac caaPro Gly His Gln290
act gct ttg aagThr Ala Leu Lys305
caa gtc ttg aag1008
Gln Val Leu Lys
ggc tac aga tta1056
Gly Tyr Arg Leu340
tcc ttg aga gaa1104
Ser Leu Arg Glu355
gaa aag att aac1152
Glu Lys Ile Asn370
tet gct ttg gtt1200
Ser Ala Leu Val385
act aga gga atg1248
Lys Trp Gly Val
cag gtt tat caaGln Val Tyr Gln120
tac cta cca gatTyr Leu Pro Asp135
aga aaa att tetArg Lys Ile Ser150
gtt aac cca gaaVal Asn Pro Glu165
gcc ate cta tatAla Ile Leu Tyr
tgt cgt tta attCys Arg Leu Ile200
ggt gct tac ttgGly Ala Tyr Leu215
gca ggt gtc ateAla Gly Val Ile230
acc act cac aagThr Thr His Lys245
aga aga ggt gtgArg Arg Gly Val
tac gac ttg gaaTyr Asp Leu Glu280
ggt ggt cca cacGly Gly Pro His295
caa gct gcc actGln Ala Ala Thr310
aat gct aag gct
Asn Ala Lys Ala325
gtt tcc aac ggt
Val Ser Asn Gly
aag ggt gtt gat
Lys Gly Val Asp360
att gct ttg aac
Ile Ala Leu Asn375
cca ggt ggt gtc
Pro Gly Gly Val390
ggt gaa gaa gat
Asn Val Gln Thr105
gct att atg aagAla Ile Met Lys
ggt ggt cat ttgGly Gly His Leu140
gct gtt tcc acaAla Val Ser Thr155
acc ggt att ateThr Gly Ile Ile170
aga cca aag gttArg Pro Lys Val185
gac tac aag agaAsp Tyr Lys Arg
atg gta gac atgMet Val Asp Met220
cca tet cct ttcPro Ser Pro Phe235
tet ttg aga ggtSer Leu Arg Gly250
aga tet ate aacArg Ser Ile Asn265
aac cca att aacAsn Pro Ile Asn
aac cat acc attAsn His Thr Ile300
cca gaa ttc aagPro Glu Phe Lys315
ttg gaa agt gaa
Leu Glu Ser Glu330
acc gat tet cac
Thr Asp Ser His345
ggt gct cgt gtt
Gly Ala Arg Val
aaa aac tet att
Lys Asn Ser Ile380
cgt att ggg gct
Arg Ile Gly Ala395
ttc cac aga att
Leu Ser Gly Ser110
cct cat gaa agaPro His Glu Arg125
tet cac ggt tacSer His Gly Tyr
tac ttc gaa tetTyr Phe Glu Ser160
gac tac gat actAsp Tyr Asp Thr175
ctt gtt gct ggtLeu Val Ala Gly190
atg aga gaa ate
Met Arg Glu Ile205
gcc cac att tet
Ala His Ile Ser
gaa tac gct gatGlu Tyr Ala Asp240
cca cgt ggt gctPro Arg Gly Ala255
cct aag acc ggtPro Lys Thr Gly270
ttc tet gtt ttcPhe Ser Val Phe285
gct gct ttg gccAla Ala Leu Ala
gaa tac caa actGlu Tyr Gln Thr320
ttt aag aac ttg
Phe Lys Asn Leu335
atg gtt cta gta
Met Val Leu Val350
gaa tac att tgt
Glu Tyr He Cys365
cca ggt gac aaa
Pro Gly Asp Lys
cca gcc atg acc
Pro Ala Met Thr400
gtt caa tac attThr Arg Gly Met Gly Glu Glu Asp Phe His Arg Ile Val Gln Tyr Ile
405 410 415
aac aag gct gta gaa ttc gct caa caa gtt caa caa age ttg cca aag1296
Asn Lys Ala Val Glu Phe Ala Gln Gln Val Gln Gln Ser Leu Pro Lys
420 425 430
gat gct tgt aga tta aag gac ttc aaa gcc aag gtc gac gaa ggc tet1344
Asp Ala Cys Arg Leu Lys Asp Phe Lys Ala Lys Val Asp Glu Gly Ser
435 440 445
gat gtt ttg aac acc tgg aaa aag gaa att tac gac tgg gct ggc gaa1392
Asp Val Leu Asn Thr Trp Lys Lys Glu Ile Tyr Asp Trp Ala Gly Glu
450 455 460
tac cca ttg gct gtg taa1410
Tyr Pro Leu Ala Val465
<210> 78<211> 469<212> PRT
<213> Saccharomyces cerevisiae<400> 78
Met Pro Tyr Thr Leu Ser Asp Ala His His Lys Leu Ile Thr Ser His15 10 15
Leu Val Asp Thr Asp Pro Glu Val Asp Ser Ile Ile Lys Asp Glu Ile
20 25 30
Glu Arg Gln Lys His Ser Ile Asp Leu Ile Ala Ser Glu Asn Phe Thr
35 40 45
Ser Thr Ser Val Phe Asp Ala Leu Gly Thr Pro Leu Ser Asn Lys Tyr
50 55 60
Ser Glu Gly Tyr Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Glu His Ile65 70 75 80
Asp Arg Met Glu Ile Leu Cys Gln Gln Arg Ala Leu Lys Ala Phe His
85 90 95
Val Thr Pro Asp Lys Trp Gly Val Asn Val Gln Thr Leu Ser Gly Ser
100 105 110
Pro Ala Asn Leu Gln Val Tyr Gln Ala Ile Met Lys Pro His Glu Arg
115 120 125
Leu Met Gly Leu Tyr Leu Pro Asp Gly Gly His Leu Ser His Gly Tyr
130 135 140
Ala Thr Glu Asn Arg Lys Ile Ser Ala Val Ser Thr Tyr Phe Glu Ser145 150 155 160
Phe Pro Tyr Arg Val Asn Pro Glu Thr Gly Ile Ile Asp Tyr Asp Thr
165 170 175
Leu Glu Lys Àsn Ala Ile Leu Tyr Arg Pro Lys Val Leu Val Ala Gly
180 185 190
Thr Ser Ala Tyr Cys Arg Leu Ile Asp Tyr Lys Arg Met Arg Glu Ile
195 200 205
Ala Asp Lys Cys Gly Ala Tyr Leu Met Val Asp Met Ala His Ile Ser
210 215 220
Gly Leu Ile Ala Ala Gly Val Ile Pro Ser Pro Phe Glu Tyr Ala Asp225 230 235 240
Ile Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala
245 250 255
Met Ile Phe Phe Arg Arg Gly Val Arg Ser Ile Asn Pro Lys Thr Gly
260 265 270
Lys Glu Val Leu Tyr Asp Leu Glu Asn Pro Ile Asn Phe Ser Val Phe
275 280 285
Pro Gly His Gln Gly Gly Pro His Asn His Thr Ile Ala Ala Leu Ala290 295 300Thr Ala Leu Lys Gln Ala Ala Thr Pro Glu Phe Lys Glu Tyr Gln Thr305 310 315 320
Gln Val Leu Lys Asn Ala Lys Ala Leu Glu Ser Glu Phe Lys Asn Leu
325 330 335
Gly Tyr Arg Leu Val Ser Asn Gly Thr Asp Ser His Met Val Leu Val
340 345 350
Ser Leu Arg Glu Lys Gly Val Asp Gly Ala Arg Val Glu Tyr Ile Cys
355 360 365
Glu Lys Ile Asn Ile Ala Leu Asn Lys Asn Ser Ile Pro Gly Asp Lys
370 375 380
Ser Ala Leu Val Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr385 390 395 400
Thr Arg Gly Met Gly Glu Glu Asp Phe His Arg Ile Val Gln Tyr Ile
405 410 415
Asn Lys Ala Val Glu Phe Ala Gln Gln Val Gln Gln Ser Leu Pro Lys
420 425 430
Asp Ala Cys Arg Leu Lys Asp Phe Lys Ala Lys Val Asp Glu Gly Ser
435 440 445
Asp Val Leu Asn Thr Trp Lys Lys Glu Ile Tyr Asp Trp Ala Gly Glu
450 455 460
Tyr Pro Leu Ala Val465
<210> 79<211> 1254<212> DNA
<213> Borrelia burgdorferi
<220>
<221> CDS
<222> (1)..(1254)
<400> 79
atg aga gat gat caa ataMet Arg Asp Asp Gln Ile1 5
gaa aga gag cat att gaaGlu Arg Glu His Ile Glu20
gag ata agg cag gct gttGlu Ile Arg Gln Ala Val35
gga tat cct ttg aat cgaGly Tyr Pro Leu Asn Arg50
att gaa act ctg gca attIle Glu Thr Leu Ala Ile65 70
tat gcc aat gtt caa cctTyr Ala Asn Val Gln Pro85
ata atg gct ctt att ageIle Met Ala Leu Ile Ser100
tet cat gga ggg cat ttaSer His Gly Gly His Leu115
ata ttt ttt aac act tatIle Phe Phe Asn Thr Tyr130
att gat tat gat gaa gttIle Asp Tyr Asp Glu Val145 150
ttt aat tta att gaa aagPhe Asn Leu Ile Glu Lys10
ctt att gct tet gaa aatLeu Ile Ala Ser Glu Asn25
ggt agt att tta act aatGly Ser Ile Leu Thr Asn40
tac tac ggt ggt tgt tetTyr Tyr Gly Gly Cys Ser55 60
tcg aga gca aaa gag cttSer Arg Ala Lys Glu Leu75
cat age gga tet cag gccHis Ser Gly Ser Gln Ala90
ccg ggt gac agg att cttPro Gly Asp Arg Ile Leu105
act cac ggc age agg gtaThr His Gly Ser Arg Val120
ttt tat ggt gtt tet agaPhe Tyr Gly Val Ser Arg135 140
ctt aaa ata gct aaa gatLeu Lys Ile Ala Lys Asp155
gaa aaa tta aga 48
Glu Lys Leu Arg15
ttt aca tet tta 96
Phe Thr Ser Leu30
aag tat gcc gaa 144
Lys Tyr Ala Glu45
ttt att gat gag 192
Phe Ile Asp Glu
ttt ggc gca aag 240
Phe Gly Ala Lys80
aat atg gct gcc 288
Asn Met Ala Ala95
ggt atg caa tta 336
Gly Met Gln Leu110
aat ttt tet ggt 384
Asn Phe Ser Gly
125
gat tet gag cta 432
Asp Ser Glu Leu
tgc agg cca aat 480
Cys Arg Pro Asn160tta ata ata gct gga gct tct tct tat tca aga gaa att gat ttt aaa 528
Leu Ile Ile Ala Gly Ala Ser Ser Tyr Ser Arg Glu Ile Asp Phe Lys
165 170 175
aaa ttt aga gaa ata gca gat gat gtt tct gct tat ctt ttg tgt gat 576
Lys Phe Arg Glu Ile Ala Asp Asp Val Ser Ala Tyr Leu Leu Cys Asp
180 185 190
att gct cat att gca ggc ctt att gtt gcc ggt ttt cat aat tcc tca 624
Ile Ala His Ile Ala Gly Leu Ile Val Ala Gly Phe His Asn Ser Ser
195 200 205
att gat gtg gcg cat ctt act aca agt act acg cat aaa act tta aga 672
Ile Asp Val Ala His Leu Thr Thr Ser Thr Thr His Lys Thr Leu Arg
210 215 220
ggg cca aga ggt gga ata ata ctt tct gga aag gat ttt gac aaa tta 720
Gly Pro Arg Gly Gly Ile Ile Leu Ser Gly Lys Asp Phe Asp Lys Leu225 230 235 240
gta aac ttt aat gga aaa gag aag cct ttg ttt aat gct gta aat tct 768
Val Asn Phe Asn Gly Lys Glu Lys Pro Leu Phe Asn Ala Val Asn Ser
245 250 255
aca gtt ttt cct gga act caa ggg ggt cct tta gtt cat gtt att gcg 816
Thr Val Phe Pro Gly Thr Gln Gly Gly Pro Leu Val His Val Ile Ala
260 265 270
ggt aag gct att gca ttc aaa gaa gct ctt caa gaa agt ttt aaa gaa 864
Gly Lys Ala Ile Ala Phe Lys Glu Ala Leu Gln Glu Ser Phe Lys Glu
275 280 285
tac att gct aac gta ata aaa aat act aaa gtt atg gct gaa tat ttc 912
Tyr Ile Ala Asn Val Ile Lys Asn Thr Lys Val Met Ala Glu Tyr Phe
290 295 300
aaa tcg gaa gga ttt cgt att gtt agt ggg ggc aca gac aat cat ttg 960
Lys Ser Glu Gly Phe Arg Ile Val Ser Gly Gly Thr Asp Asn His Leu305 310 315 320
ttt ttg gtt gat ctt agt agt tcg gat ctc acc ggt gct gat gct gag1008
Phe Leu Val Asp Leu Ser Ser Ser Asp Leu Thr Gly Ala Asp Ala Glu
325 330 335
aaa tta ctt gag age gta aat att act tta aat aaa aat gct att cct1056
Lys Leu Leu Glu Ser Val Asn Ile Thr Leu Asn Lys Asn Ala Ile Pro
340 345 350
ttt gat aaa aaa age cct tct ttg gct tct ggt att aga att ggg ggc1104
Phe Asp Lys Lys Ser Pro Ser Leu Ala Ser Gly Ile Arg Ile Gly Gly
355 360 365
gct gct att act tct aga ggc cta aat gaa age gat tct tta aat gtt1152
Ala Ala Ile Thr Ser Arg Gly Leu Asn Glu Ser Asp Ser Leu Asn Val
370 375 380
gct aaa ttt att gtt aga gct tta aag gca aag tct gat att gaa tta1200
Ala Lys Phe Ile Val Arg Ala Leu Lys Ala Lys Ser Asp Ile Glu Leu385 390 395 400
aaa caa ata aaa aag gaa gtt gta aga ttt att aga gat ttt gac atg1248
Lys Gln Ile Lys Lys Glu Val Val Arg Phe Ile Arg Asp Phe Asp Met405 410 415
cct tga
1254
Pro
<210> 80<211> 417<212> PRT
<213> Borrelia burgdorferi<400> 80
Met Arg Asp Asp Gln Ile Phe Asn Leu Ile Glu Lys Glu Lys Leu Arg1 5 10 15
Glu Arg Glu His Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Leu
20 25 30
Glu Ile Arg Gln Ala Val Gly Ser Ile Leu Thr Asn Lys Tyr Ala Glu
35 40 45
Gly Tyr Pro Leu Asn Arg Tyr Tyr Gly Gly Cys Ser Phe Ile Asp Glu
50 55 60
Ile Glu Thr Leu Ala Ile Ser Arg Ala Lys Glu Leu Phe Gly Ala Lys65 70 75 80
Tyr Ala Asn Val Gln Pro His Ser Gly Ser Gln Ala Asn Met Ala Ala
85 90 95
Ile Met Ala Leu Ile Ser Pro Gly Asp Arg Ile Leu Gly Met Gln Leu
100 105 110
Ser His Gly Gly His Leu Thr His Gly Ser Arg Val Asn Phe Ser Gly
115 120 125
Ile Phe Phe Asn Thr Tyr Phe Tyr Gly Val Ser Arg Asp Ser Glu Leu
130 135 140
Ile Asp Tyr Asp Glu Val Leu Lys Ile Ala Lys Asp Cys Arg Pro Asn145 150 155 160
Leu Ile Ile Ala Gly Ala Ser Ser Tyr Ser Arg Glu Ile Asp Phe Lys
165 170 175
Lys Phe Arg Glu Ile Ala Asp Asp Val Ser Ala Tyr Leu Leu Cys Asp
180 185 190
Ile Ala His Ile Ala Gly Leu Ile Val Ala Gly Phe His Asn Ser Ser
195 200 205
Ile Asp Val Ala His Leu Thr Thr Ser Thr Thr His Lys Thr Leu Arg
210 215 220
Gly Pro Arg Gly Gly Ile Ile Leu Ser Gly Lys Asp Phe Asp Lys Leu225 230 235 240
Val Asn Phe Asn Gly Lys Glu Lys Pro Leu Phe Asn Ala Val Asn Ser
245 250 255
Thr Val Phe Pro Gly Thr Gln Gly Gly Pro Leu Val His Val Ile Ala
260 265 270
Gly Lys Ala Ile Ala Phe Lys Glu Ala Leu Gln Glu Ser Phe Lys Glu
275 280 285
Tyr Ile Ala Asn Val Ile Lys Asn Thr Lys Val Met Ala Glu Tyr Phe
290 295 300
Lys Ser Glu Gly Phe Arg Ile Val Ser Gly Gly Thr Asp Asn His Leu305 310 315 320
Phe Leu Val Asp Leu Ser Ser Ser Asp Leu Thr Gly Ala Asp Ala Glu
325 330 335
Lys Leu Leu Glu Ser Val Asn Ile Thr Leu Asn Lys Asn Ala Ile Pro
340 345 350
Phe Asp Lys Lys Ser Pro Ser Leu Ala Ser Gly Ile Arg Ile Gly Gly
355 360 365
Ala Ala Ile Thr Ser Arg Gly Leu Asn Glu Ser Asp Ser Leu Asn Val
370 375 380
Ala Lys Phe Ile Val Arg Ala Leu Lys Ala Lys Ser Asp Ile Glu Leu385 390 395 400
Lys Gln Ile Lys Lys Glu Val Val Arg Phe Ile Arg Asp Phe Asp Met405 410 415
Pro
<210> 81<211> 1236<212> DNA
<213> Clostridium acetobutylicum
<220><221> CDS<222> (1).. (1236)
<400> 81
atg gat ttt gaa aat ata aaa gta agt gat tct gaa gtc tat tct ate 48
Met Asp Phe Glu Asn Ile Lys Val Ser Asp Ser Glu Val Tyr Ser Ile1 5 10 15
ata gaa gaa gaa aat gcg aga caa gaa aat aat ata gaa ctt att gea 96
Ile Glu Glu Glu Asn Ala Arg Gln Glu Asn Asn Ile Glu Leu Ile Ala
20 25 30
tct gaa aac ttc aca age aaa gct gta atg gaa gct atg ggt tca tat 144
Ser Glu Asn Phe Thr Ser Lys Ala Val Met Glu Ala Met Gly Ser Tyr
35 40 45
tta act aat aag tat gea gaa gga tat cca gga aaa aga tat tat ggt 192
Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr Tyr Gly
50 55 60
gga tgt tac gta gtt gat aaa gtt gaa gag ctt gea cgt gaa agg gea 240
Gly Cys Tyr Val Val Asp Lys Val Glu Glu Leu Ala Arg Glu Arg Ala65 70 75 80
aaa aaa ctt ttt aaa gea gag cat gct aat gta cag cca cat tca ggt 288
Lys Lys Leu Phe Lys Ala Glu His Ala Asn Val Gln Pro His Ser Gly
85 90 95
tca caa gct aat atg gct gtt tac ttt gea gta ttg aag ccg gga gac 336
Ser Gln Ala Asn Met Ala Val Tyr Phe Ala Val Leu Lys Pro Gly Asp
100 105 110
act ata atg gga atg aac cta aca gat gga ggt cat tta act cat gga 384
Thr Ile Met Gly Met Asn Leu Thr Asp Gly Gly His Leu Thr His Gly
115 120 125
agt cca gtt aat ttt tca gga aaa ctc ttt aat ata att gcc tat ggt 432
Ser Pro Val Asn Phe Ser Gly Lys Leu Phe Asn Ile Ile Ala Tyr Gly
130 135 140
gta agt gat gaa aca gaa caa ata gat tat gaa gcg ttt aga aaa aaa 480
Val Ser Asp Glu Thr Glu Gln Ile Asp Tyr Glu Ala Phe Arg Lys Lys145 150 155 160
gcc ttg gag tgt aag cca aag atg ata gta tct ggt gct agt gea tat 528
Ala Leu Glu Cys Lys Pro Lys Met Ile Val Ser Gly Ala Ser Ala Tyr
165 170 175
tca aga att att gat ttt aag aaa ata aga gaa ata tgc gat gaa gta 576
Ser Arg Ile Ile Asp Phe Lys Lys Ile Arg Glu Ile Cys Asp Glu Val
180 185 190
gga gea tat atg atg gta gat atg gct cat ata gea gga ctt gta gea 624
Gly Ala Tyr Met Met Val Asp Met Ala His Ile Ala Gly Leu Val Ala
195 200 205
gea gga ctt cat ccg tca cca att cca tat gct gat ttt gta aca aca 672
Ala Gly Leu His Pro Ser Pro Ile Pro Tyr Ala Asp Phe Val Thr Thr
210 215 220
act act cat aag act tta agg gga cca aga ggc gga gea att ttc tgc 720
Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Ala Ile Phe Cys225 230 235 240
aag gaa aag tat gea aag gac att gat aaa tct gta ttc cct gga atg 768
Lys Glu Lys Tyr Ala Lys Asp Ile Asp Lys Ser Val Phe Pro Gly Met
245 250 255
cag ggg gga cct tta atg cac ata att gea gga aaa gea gta tgc ttt 816
Gln Gly Gly Pro Leu Met His Ile Ile Ala Gly Lys Ala Val Cys Phe
260 265 270
gga gaa gct tta aag gat gat ttt aaa gat tat gea cag caa ata gta 864
Gly Glu Ala Leu Lys Asp Asp Phe Lys Asp Tyr Ala Gln Gln Ile Val
275 280 285
aat aat gea aaa gtg ttt gea gat gaa ctt aca aaa tae ggt ttt aga 912
Asn Asn Ala Lys Val Phe Ala Asp Glu Leu Thr Lys Tyr Gly Phe Arg
290 295 300
ata gtt tca ggt gga act gat aat cac ctt tta tta gtt gat tta acg 960
Ile Val Ser Gly Gly Thr Asp Asn His Leu Leu Leu Val Asp Leu Thr305 310 315 320
aac aaa aat ata aca gga aaa gat gca gaa cat ctt ctt gat tca gtt1008
Asn Lys Asn Ile Thr Gly Lys Asp Ala Glu His Leu Leu Asp Ser Val
325 330 335
gga ata act gca aac aaa aat. act ata cca ttt gag aaa aag agt cct1056
Gly Ile Thr Ala Asn Lys Asn Thr Ile Pro Phe Glu Lys Lys Ser Pro
340 345 350
ttt ata aca agt gga ata aga atg ggt aca cct tca gtt aca act aga1104
Phe Ile Thr Ser Gly Ile Arg Met Gly Thr Pro Ser Val Thr Thr Arg
355 360 365
gga ttt aag gaa gag gaa atg aaa aaa gta gcg tat ttc ata aac tat1152
Gly Phe Lys Glu Glu Glu Met Lys Lys Val Ala Tyr Phe Ile Asn Tyr
370 375 380
gtt ata gag cat aga gat gaa gat tta agt gaa ata agg aaa caa gtt1200
Val Ile Glu His Arg Asp Glu Asp Leu Ser Glu Ile Arg Lys Gln Val385 390 395 400
tca gaa tta tgt agt gga ttt cct ata tat aag taa1236
Ser Glu Leu Cys Ser Gly Phe Pro Ile Tyr Lys405 410
<210> 82<211> 411<212> PRT
<213> Clostridium acetobutylicum
<400> 82
Met Asp Phe Glu Asn Ile Lys Val Ser Asp Ser Glu Val Tyr Ser Ile15 10 15
Ile Glu Glu Glu Asn Ala Arg Gln Glu Asn Asn Ile Glu Leu Ile Ala
20 25 30
Ser Glu Asn Phe Thr Ser Lys Ala Val Met Glu Ala Met Gly Ser Tyr
35 40 45
Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr Tyr Gly
50 55 60
Gly Cys Tyr Val Val Asp Lys Val Glu Glu Leu Ala Arg Glu Arg Ala65 70 75 80
Lys Lys Leu Phe Lys Ala Glu His Ala Asn Val Gln Pro His Ser Gly
85 90 95
Ser Gln Ala Asn Met Ala Val Tyr Phe Ala Val Leu Lys Pro Gly Asp
100 105 110
Thr Ile Met Gly Met Asn Leu Thr Asp Gly Gly His Leu Thr His Gly
115 120 125
Ser Pro Val Asn Phe Ser Gly Lys Leu Phe Asn Ile Ile Ala Tyr Gly
130 135 140
Val Ser Asp Glu Thr Glu Gln Ile Asp Tyr Glu Ala Phe Arg Lys Lys145 150 155 160
Ala Leu Glu Cys Lys Pro Lys Met Ile Val Ser Gly Ala Ser Ala Tyr
165 170 175
Ser Arg Ile Ile Asp Phe Lys Lys Ile Arg Glu Ile Cys Asp Glu Val
180 185 190
Gly Ala Tyr Met Met Val Asp Met Ala His Ile Ala Gly Leu Val Ala
195 200 205
Ala Gly Leu His Pro Ser Pro Ile Pro Tyr Ala Asp Phe Val Thr Thr
210 215 220
Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Ala Ile Phe Cys225 230 235 240
Lys Glu Lys Tyr Ala Lys Asp Ile Asp Lys Ser Val Phe Pro Gly Met245 250 255
Gln Gly Gly Pro Leu Met His Ile Ile Ala Gly Lys Ala Val Cys Phe
260 265 270
Gly Glu Ala Leu Lys Asp Asp Phe Lys Asp Tyr Ala Gln Gln Ile Val
275 280 285
Asn Asn Ala Lys Val Phe Ala Asp Glu Leu Thr Lys Tyr Gly Phe Arg
290 295 300
Ile Val Ser Gly Gly Thr Asp Asn His Leu Leu Leu Val Asp Leu Thr305 310 315 320
Asn Lys Asn Ile Thr Gly Lys Asp Ala Glu His Leu Leu Asp Ser Val
325 330 335
Gly Ile Thr Ala Asn Lys Asn Thr Ile Pro Phe Glu Lys Lys Ser Pro
340 345 350
Phe Ile Thr Ser Gly Ile Arg Met Gly Thr Pro Ser Val Thr Thr Arg
355 360 365
Gly Phe Lys Glu Glu Glu Met Lys Lys Val Ala Tyr Phe Ile Asn Tyr
370 375 380
Val Ile Glu His Arg Asp Glu Asp Leu Ser Glu Ile Arg Lys Gln Val385 390 395 400
Ser Glu Leu Cys Ser Gly Phe Pro Ile Tyr Lys405 410
<210> 83<211> 1245<212> DNA
<213> Campylobacter jejuni
<220>
<221> CDS
<222> (1)..(1245)
<400> 83
atg agt tta gaa atg ttt gat aaa gaa att ttt gat tta aca aac aaa 48
Met Ser Leu Glu Met Phe Asp Lys Glu Ile Phe Asp Leu Thr Asn Lys15 10 15
gag tta gag cgt caa tgt gaa ggt ctt gaa atg ata gcg agt gaa aat 96
Glu Leu Glu Arg Gln Cys Glu Gly Leu Glu Met Ile Ala Ser Glu Asn
20 25 30
ttc act tta cct gaa gta atg gaa gtt atg gga agt ate ttg aca aac 144
Phe Thr Leu Pro Glu Val Met Glu Val Met Gly Ser Ile Leu Thr Asn
35 40 45
aaa tac gea gaa ggt tat ccg ggt aaa aga tat tat ggt ggt tgt gaa 192
Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr Tyr Gly Gly Cys Glu
50 55 60
ttt gtt gat gag att gaa act cta gct att gaa aga tgt aaa aaa ctt 240
Phe Val Asp Glu Ile Glu Thr Leu Ala Ile Glu Arg Cys Lys Lys Leu65 70 75 80
ttt aat tgt aaa ttt gct aat gtt cag cct aat tca ggt tet caa gct 288
Phe Asn Cys Lys Phe Ala Asn Val Gln Pro Asn Ser Gly Ser Gln Ala
85 90 95
aat caa ggt gtt tat gcg gct ttg att aat cca ggt gat aaa att tta 336
Asn Gln Gly Val Tyr Ala Ala Leu Ile Asn Pro Gly Asp Lys Ile Leu
100 105 110
gga atg gat tta agt cat ggc gga cat tta act cat ggt gea aaa gta 384
Gly Met Asp Leu Ser His Gly Gly His Leu Thr His Gly Ala Lys Val
115 120 125
agt tet tcg ggc aaa atg tat gaa age tgt ttt tac ggc gta gaa ctt 432
Ser Ser Ser Gly Lys Met Tyr Glu Ser Cys Phe Tyr Gly Val Glu Leu
130 135 140
gat gga aga att gat tat gaa aaa gta aga gaa att gct aaa aaa gaa 480
Asp Gly Arg Ile Asp Tyr Glu Lys Val Arg Glu Ile Ala Lys Lys Glu145 150 155 160
aaa cca aaa ctt ata gtt tgt gga gct agt gct tat gea aga gtg att 528Lys Pro Lys Leu Ile Val Cys Gly Ala Ser Ala Tyr Ala Arg Val Ile
165 170 175
gat ttt gct aaa ttt aga gaa att gct gat gaa ata ggt gcc tat ctt 576
Asp Phe Ala Lys Phe Arg Glu Ile Ala Asp Glu Ile Gly Ala Tyr Leu
180 185 190
ttt gct gat ata gca cat att gca ggt ctt gtt gtg gca ggt gag cat 624
Phe Ala Asp Ile Ala His Ile Ala Gly Leu Val Val Ala Gly Glu His
195 200 205
cca agt cct ttt oca tac gct cat gta gta age tca act aca cat aaa 672
Pro Ser Pro Phe Pro Tyr Ala His Val Val Ser Ser Thr Thr His Lys
210 215 220
act ttg cgt ggc cca aga ggt ggt att att atg aca aat gat gaa gag 720
Thr Leu Arg Gly Pro Arg Gly Gly Ile Ile Met Thr Asn Asp Glu Glu225 230 235 240
ctt gct aaa aaa att aat tet gcc att ttt cca ggt att caa ggt ggt 768
Leu Ala Lys Lys Ile Asn Ser Ala Ile Phe Pro Gly Ile Gln Gly Gly
245 250 255
cct ttg atg cat gta att gct gca aaa gca gta gga ttt aaa ttt aat 816
Pro Leu Met His Val Ile Ala Ala Lys Ala Val Gly Phe Lys Phe Asn
260 265 270
ctt age gat gag tgg aaa gtt tat gca aaa caa gta aga act aat gct 864
Leu Ser Asp Glu Trp Lys Val Tyr Ala Lys Gln Val Arg Thr Asn Ala
275 280 285
caa gtt tta gct aat gtt tta atg gat aga aaa ttt aaa ctt gtt age 912
Gln Val Leu Ala Asn Val Leu Met Asp Arg Lys Phe Lys Leu Val Ser
290 295 300
gat gga acg gat aat cac ctt gtt tta atg agt ttt tta gat cgt gaa 960
Asp Gly Thr Asp Asn His Leu Val Leu Met Ser Phe Leu Asp Arg Glu305 310 315 320
ttt agt gga aaa gat gca gat tta gct ctt gga aat gca ggt att act1008
Phe Ser Gly Lys Asp Ala Asp Leu Ala Leu Gly Asn Ala Gly Ile Thr
325 330 335
gca aat aaa aat acc gtt cca gga gag att aga agt cct ttt ate aca1056
Ala Asn Lys Asn Thr Val Pro Gly Glu Ile Arg Ser Pro Phe Ile Thr
340 345 350
agt gga tta aga ctt gga act cca gcc ctt act gcc aga ggt ttt aaa1104
Ser Gly Leu Arg Leu Gly Thr Pro Ala Leu Thr Ala Arg Gly Phe Lys
355 360 365
gaa aaa gaa atg gaa att gtg tca aat tat att gca gat att tta gat1152
Glu Lys Glu Met Glu Ile Val Ser Asn Tyr Ile Ala Asp Ile Leu Asp
370 375 380
gat gtt aat aat gaa aaa tta caa gag aat att aaa caa gaa tta aaa1200
Asp Val Asn Asn Glu Lys Leu Gln Glu Asn Ile Lys Gln Glu Leu Lys385 390 395 400
aaa ctt gca agt aat ttt att att tat gaa agg gct atg ttt tga1245
Lys Leu Ala Ser Asn Phe Ile Ile Tyr Glu Arg Ala Met Phe405 410
<210> 84<211> 414<212> PRT
<213> Campylobacter jejuni<400> 84
Met Ser Leu Glu Met Phe Asp Lys Glu Ile Phe Asp Leu Thr Asn Lys1 5 10 15
Glu Leu Glu Arg Gln Cys Glu Gly Leu Glu Met Ile Ala Ser Glu Asn20 25 30
Phe Thr Leu Pro Glu Val Met Glu Val Met Gly Ser Ile Leu Thr Asn
35 40 45
Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr Tyr Gly Gly Cys Glu
50 55 60
Phe Val Asp Glu Ile Glu Thr Leu Ala Ile Glu Arg Cys Lys Lys Leu65 70 75 80
Phe Asn Cys Lys Phe Ala Asn Val Gln Pro Asn Ser Gly Ser Gln Ala
85 90 95
Asn Gln Gly Val Tyr Ala Ala Leu Ile Asn Pro Gly Asp Lys Ile Leu
100 105 110
Gly Met Asp Leu Ser His Gly Gly His Leu Thr His Gly Ala Lys Val
115 120 125
Ser Ser Ser Gly Lys Met Tyr Glu Ser Cys Phe Tyr Gly Val Glu Leu
130 135 140
Asp Gly Arg Ile Asp Tyr Glu Lys Val Arg Glu Ile Ala Lys Lys Glu145 150 155 160
Lys Pro Lys Leu Ile Val Cys Gly Ala Ser Ala Tyr Ala Arg Val Ile
165 170 175
Asp Phe Ala Lys Phe Arg Glu Ile Ala Asp Glu Ile Gly Ala Tyr Leu
180 185 190
Phe Ala Asp Ile Ala His Ile Ala Gly Leu Val Val Ala Gly Glu His
195 200 205
Pro Ser Pro Phe Pro Tyr Ala His Val Val Ser Ser Thr Thr His Lys
210 215 220
Thr Leu Arg Gly Pro Arg Gly Gly Ile Ile Met Thr Asn Asp Glu Glu225 230 235 240
Leu Ala Lys Lys Ile Asn Ser Ala Ile Phe Pro Gly Ile Gln Gly Gly
245 250 255
Pro Leu Met His Val Ile Ala Ala Lys Ala Val Gly Phe Lys Phe Asn
260 265 270
Leu Ser Asp Glu Trp Lys Val Tyr Ala Lys Gln Val Arg Thr Asn Ala
275 280 285
Gln Val Leu Ala Asn Val Leu Met Asp Arg Lys Phe Lys Leu Val Ser
290 295 300
Asp Gly Thr Asp Asn His Leu Val Leu Met Ser Phe Leu Asp Arg Glu305 310 315 320
Phe Ser Gly Lys Asp Ala Asp Leu Ala Leu Gly Asn Ala Gly Ile Thr
325 ^ 330 335
Ala Asn Lys Asn Thr Val Pro Gly Glu Ile Arg Ser Pro Phe Ile Thr
340 345 350
Ser Gly Leu Arg Leu Gly Thr Pro Ala Leu Thr Ala Arg Gly Phe Lys
355 360 365
Glu Lys Glu Met Glu Ile Val Ser Asn Tyr Ile Ala Asp Ile Leu Asp
370 375 380
Asp Val Asn Asn Glu Lys Leu Gln Glu Asn Ile Lys Gln Glu Leu Lys385 390 395 400
Lys Leu Ala Ser Asn Phe Ile Ile Tyr Glu Arg Ala Met Phe405 410
<210> 85<211> 1494<212> DNA
<213> Chlamydia trachomatis
<220>
<221> CDS
<222> (1) .. (1494)
<400> 85
atg act tct tta tta gat aaa tat ttg aga aat att tcc ggg aaa ggaMet Thr Ser Leu Leu Asp Lys Tyr Leu Arg Asn Ile Ser Gly Lys Gly15 10 15
\cag caa agt tta gca tcc gta gct tat tta gca gca tta gat cat cta 96
Gln Gln Ser Leu Ala Ser Val Ala Tyr Leu Ala Ala Leu Asp His Leu
20 25 30
tta cac tct ttc cca tcc ata gga caa age ata gta caa gaa ttg aaa 144
Leu His Ser Phe Pro Ser Ile Gly Gln Ser Ile Val Gln Glu Leu Lys
35 40 45
agt cag cga tct cgt ttg aaa atg att gct tca gag aac ttt tct tct 192
Ser Gln Arg Ser Arg Leu Lys Met Ile Ala Ser Glu Asn Phe Ser Ser
50 55 60
cta tct gtt cag ctt gct atg ggt aat tta ctc aca gat aag tat tgt 240
Leu Ser Val Gln Leu Ala Met Gly Asn Leu Leu Thr Asp Lys Tyr Cys65 70 75 80
gag gga agt cca ttc aag cgt ttt tat tct tgt tgt gag aat gtg gac 288
Glu Gly Ser Pro Phe Lys Arg Phe Tyr Ser Cys Cys Glu Asn Val Asp
85 90 95
gct att gag tgg gag tgc gtg gag acg gca aag gaa tta ttt ggt gca 336
Ala Ile Glu Trp Glu Cys Val Glu Thr Ala Lys Glu Leu Phe Gly Ala
100 105 110
gaa agt gct tgt gtt cag cca cat tct gga gct gat gca aac tta ctg 384
Glu Ser Ala Cys Val Gln Pro His Ser Gly Ala Asp Ala Asn Leu Leu
115 120 125
gct att atg tcg att att acg cag aag ate caa age cca gct gtt cag 432
Ala Ile Met Ser Ile Ile Thr Gln Lys Ile Gln Ser Pro Ala Val Gln
130 135 140
aga ctg gga tac aag aca ate aac gat ctc ccg gaa caa gag tat gag 480
Arg Leu Gly Tyr Lys Thr Ile Asn Asp Leu Pro Glu Gln Glu Tyr Glu145 150 155 160
gct tta aag gcc gaa atg tct caa tac aaa tgc cta ggc ccg tct tta 528
Ala Leu Lys Ala Glu Met Ser Gln Tyr Lys Cys Leu Gly Pro Ser Leu
165 170 175
aat tct ggc gga cat tta acg cat ggg act gtg cgt ata aat gtt atg 576
Asn Ser Gly Gly His Leu Thr His Gly Thr Val Arg Ile Asn Val Met
180 185 190
tct aaa ttg atg cat tgt ctt cct tat gag gtc aac tta gat acc gag 624
Ser Lys Leu Met His Cys Leu Pro Tyr Glu Val Asn Leu Asp Thr Glu
195 200 205
tta ttt gat tat gac gtg ata gcg aaa ata gcg aaa gaa cat agg cct 672
Leu Phe Asp Tyr Asp Val Ile Ala Lys Ile Ala Lys Glu His Arg Pro
210 215 220
act gtt ctt att gcg ggc tac tct tct tat tct aga cga tta aac ttt 720
Thr Val Leu Ile Ala Gly Tyr Ser Ser Tyr Ser Arg Arg Leu Asn Phe225 230 235 240
gct aca ctg aag caa att gcg gaa gat tgc ggt gca gtt tta tgg gtg 768
Ala Thr Leu Lys Gln Ile Ala Glu Asp Cys Gly Ala Val Leu Trp Val
245 250 255
gat atg gct cat ttc gca gga tta gtt gct gga ggt gtt ttt ate gga 816
Asp Met Ala His Phe Ala Gly Leu Val Ala Gly Gly Val Phe Ile Gly
260 265 270
gaa gaa aat cct att cct tat gca gat ate gtt aca aca act act cat 864
Glu Glu Asn Pro Ile Pro Tyr Ala Asp Ile Val Thr Thr Thr Thr His
275 280 285
aag act ctg cga ggg cca aga ggg ggg ctt gtt tta gct aaa aaa gaa 912
Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Val Leu Ala Lys Lys Glu
290 295 300
tat tct gat act cta aac aaa gct tgt ccg tta atg atg gga ggt ccg 960
Tyr Ser Asp Thr Leu Asn Lys Ala Cys Pro Leu Met Met Gly Gly Pro305 310 315 320
ctt cct cat gta att gct gcc aaa gca gtg gct ttg aaa gag gct atg1008
Leu Pro His Val Ile Ala Ala Lys Ala Val Ala Leu Lys Glu Ala Met
325 330 335
aca ata aat ttc agg aaa tat gcg cac cag gtt gtc gaa aat gct cga1056Thr Ile Asn Phe Arg Lys Tyr Ala His Gln Val Val Glu Asn Ala Arg
340 345 350
act tta gct gaa att ttt caçr cgt aat ggt ttg aga tta tta act gga1104
Thr Leu Ala Glu Ile Phe Gln Arg Asn Gly Leu Arg Leu Leu Thr Gly
355 360 365
gga acc gat aat cat atg ctg att ate gac ctg act tet ctt gga gtt1152
Gly Thr Asp Asn His Met Leu Ile Ile Asp Leu Thr Ser Leu Gly Val
370 375 380
cct gga cgt ate gcg gag gat atg tta acc tet gta ggt att gcg gtg1200
Pro Gly Arg Ile Ala Glu Asp Met Leu Thr Ser Val Gly Ile Ala Val385 390 395 400
aat cgg aat tet att cca tcg gat gct tet gga cag tgg aaa act tcg1248
Asn Arg Asn Ser Ile Pro Ser Asp Ala Ser Gly Gln Trp Lys Thr Ser
405 410 415
ggt att cgg tta ggt aca cct gct cta aca aca tta ggt atg ggt agt1296
Gly Ile Arg Leu Gly Thr Pro Ala Leu Thr Thr Leu Gly Met Gly Ser
420 425 430
gct gaa atg gag gaa gtt gcg aat att ate gcg aaa gta ttg cga aat1344
Ala Glu Met Glu Glu Val Ala Asn Ile Ile Ala Lys Val Leu Arg Asn
435 440 445
att act gtg aga cgc aat gct gag ggc agt tet agt aaa agt gag gga1392
Ile Thr Val Arg Arg Asn Ala Glu Gly Ser Ser Ser Lys Ser Glu Gly
450 455 460
gtg cta tcg gag gag ate gct caa gaa gcg aga caa cga gta gct gat1440
Val Leu Ser Glu Glu Ile Ala Gln Glu Ala Arg Gln Arg Val Ala Asp465 470 475 480
tta tta gga aga ttc cct ctt tac cct gaa ate gat ctg gaa acg cta1488
Leu Leu Gly Arg Phe Pro Leu Tyr Pro Glu Ile Asp Leu Glu Thr Leu
485 490 495
gtt tag ^
1494Val
<210> 86<211> 497<212> PRT
<213> Chlamydia trachomatis<400> 86
Met Thr Ser Leu Leu Asp Lys Tyr Leu Arg Asn Ile Ser Gly Lys Gly15 10 15
Gln Gln Ser Leu Ala Ser Val Ala Tyr Leu Ala Ala Leu Asp His Leu
20 25 3O^
Leu His Ser Phe Pro Ser Ile Gly Gln Ser Ile Val Gln Glu Leu Lys
35 40 45
Ser Gln Arg Ser Arg Leu Lys Met Ile Ala Ser Glu Asn Phe Ser Ser
50 55 60
Leu Ser Val Gln Leu Ala Met Gly Asn Leu Leu Thr Asp Lys Tyr Cys65 70 75 80
Glu Gly Ser Pro Phe Lys Arg Phe Tyr Ser Cys Cys Glu Asn Val Asp
85 90 95
Ala Ile Glu Trp Glu Cys Val Glu Thr Ala Lys Glu Leu Phe Gly Ala100 105 110
\Glu Ser Ala Cys Val Gln Pro His Ser Gly Ala Asp Ala Asn Leu Leu
115 120 125
Ala Ile Met Ser Ile Ile Thr Gln Lys Ile Gln Ser Pro Ala Val Gln
130 135 140
Arg Leu Gly Tyr Lys Thr Ile Asn Asp Leu Pro Glu Gln Glu Tyr Glu145 150 155 160
Ala Leu Lys Ala Glu Met Ser Gln Tyr Lys Cys Leu Gly Pro Ser Leu
165 170 175
Asn Ser Gly Gly His Leú Thr His Gly Thr Val Arg Ile Asn Val Met
180 185 190
Ser Lys Leu Met His Cys Leu Pro Tyr Glu Val Asn Leu Asp Thr Glu
195 200 205
Leu Phe Asp Tyr Asp Val Ile Ala Lys Ile Ala Lys Glu His Arg Pro
210 215 220
Thr Val Leu Ile Ala Gly Tyr Ser Ser Tyr Ser Arg Arg Leu Asn Phe225 230 235 240
Ala Thr Leu Lys Gln Ile Ala Glu Asp Cys Gly Ala Val Leu Trp Val
245 250 255
Asp Met Ala His Phe Ala Gly Leu Val Ala Gly Gly Val Phe Ile Gly
260 265 270
Glu Glu Asn Pro Ile Pro Tyr Ala Asp Ile Val Thr Thr Thr Thr His
275 280 285
Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Val Leu Ala Lys Lys Glu
290 295 300
Tyr Ser Asp Thr Leu Asn Lys Ala Cys Pro Leu Met Met Gly Gly Pro305 310 315 320
Leu Pro His Val Ile Ala Ala Lys Ala Val Ala Leu Lys Glu Ala Met
325 330 335
Thr Ile Asn Phe Arg Lys Tyr Ala His Gln Val Val Glu Asn Ala Arg
340 345 350
Thr Leu Ala Glu Ile Phe Gln Arg Asn Gly Leu Arg Leu Leu Thr Gly
355 360 365
Gly Thr Asp Asn His Met Leu Ile Ile Asp Leu Thr Ser Leu Gly Val
370 375 380
Pro Gly Arg Ile Ala Glu Asp Met Leu Thr Ser Val Gly Ile Ala Val385 390 395 400
Asn Arg Asn Ser Ile Pro Ser Asp Ala Ser Gly Gln Trp Lys Thr Ser
405 410 415
Gly Ile Arg Leu Gly Thr Pro Ala Leu Thr Thr Leu Gly Met Gly-Ser
420 425 430
Ala Glu Met Glu Glu Val Ala Asn Ile Ile Ala Lys Val Leu Arg Asn
435 440 445
Ile Thr Val Arg Arg Asn Ala Glu Gly Ser Ser Ser Lys Ser Glu Gly
450 455 460
Val Leu Ser Glu Glu Ile Ala Gln Glu Ala Arg Gln Arg Val Ala Asp465 470 475 480
Leu Leu Gly Arg Phe Pro Leu Tyr Pro Glu Ile Asp Leu Glu Thr Leu485 490 495
Val
<210> 87<211> 1281<212> DNA
<213> Mycobacterium leprae
<220>
<221> CDS
<222> (1) .. (1281)
<400> 87
atg gtc gcg ccg ctg gct gaa gtc gac ccg gat ate gcc gag cta ctgMet Val Ala Pro Leu Ala Glu Val Asp Pro Asp Ile Ala Glu Leu Leu1 5 10 15
ggc aaa gag cta ggc cgg caa cgg gac acc ttg gag atg ate gct tca 96
Gly Lys Glu Leu Gly Arg Gln Arg Asp Thr Leu Glu Met Ile Ala Ser
20 25 30
gag aac ttt gtg ccg cgc tcg gtt cta cag gcc caa ggc age gtg ctg 144
Glu Asn Phe Val Pro Arg Ser Val Leu Gln Ala Gln Gly Ser Val Leu
35 40 45
acc aac aag tac gct gag ggg ttg ccc ggc cga cgc tat tac gac ggc 192
Thr Asn Lys Tyr Ala Glu Gly Leu Pro Gly Arg Arg Tyr Tyr Asp Gly
50 55 60
tgc gag cac gtc gac gtc gtg gag aac ate gcc cgc gac cgg gcc aag 240
Cys Glu His Val Asp Val Val Glu Asn Ile Ala Arg Asp Arg Ala Lys65 70 75 80
gcg ctg ttc ggt gcc gac ttc gcc aac gtg cag ccg cac tcg ggg gcc 288
Ala Leu Phe Gly Ala Asp Phe Ala Asn Val Gln Pro His Ser Gly Ala
85 90 95
cag gcc aac gcc gcg gta ctg cac gcg ctg atg tet ccg ggg gag cgg 336
Gln Ala Asn Ala Ala Val Leu His Ala Leu Met Ser Pro Gly Glu Arg
100 105 110
ctg ctg ggt ctg gat ctc gcc aat ggc ggt cat ctg acg cat ggc atg 384
Leu Leu Gly Leu Asp Leu Ala Asn Gly Gly His Leu Thr His Gly Met
115 120 125
cgg ctg aac ttc tcc ggc aag ctg tat gaa acc ggc ttt tat ggc gtc 432
Arg Leu Asn Phe Ser Gly Lys Leu Tyr Glu Thr Gly Phe Tyr Gly Val
130 135 140
gac gcg aca acg cat ctc ate gat atg gac gcg gtg cgg gcc aag gcg 480
Asp Ala Thr Thr His Leu Ile Asp Met Asp Ala Val Arg Ala Lys Ala145 150 155 160
ctc gaa ttc cgc ccg aag gtg ctg ate gct ggc tgg tcg gcc tat ccg 528
Leu Glu Phe Arg Pro Lys Val Leu Ile Ala Gly Trp Ser Ala Tyr Pro
165 170 175
cgg att ctg gac ttc gct gct ttt cgg tcg ate gea gac gaa gtc ggc 576
Arg Ile Leu Asp Phe Ala Ala Phe Arg Ser Ile Ala Asp Glu Val Gly
180 185 190
gcc aag ctg tgg gtc gac atg gcg cat ttc gcg ggc ctg gtt gcg gtg 624
Ala Lys Leu Trp Val Asp Met Ala His Phe Ala Gly Leu Val Ala Val
195 200 205
ggg ttg cac ccg tet cca gtg ccg cat gea gat gtg gtg tcc acg acc 672
Gly Leu His Pro Ser Pro Val Pro His Ala Asp Val Val Ser Thr Thr
210 215 220
gtt cac aag act ctt ggc ggg ggc cgt tcc ggt ttg ate ctg ggc aag 720
Val His Lys Thr Leu Gly Gly Gly Arg Ser Gly Leu Ile Leu Gly Lys225 230 235 240
cag gag ttc gcc acg gcc ate aac tca gcg gtg ttt cct ggc cag cag 768
Gln Glu Phe Ala Thr Ala Ile Asn Ser Ala Val Phe Pro Gly Gln Gln
245 250 255
ggt gga ccg ctt atg cat gtc ate gcg ggc aag gcg gtc gcg ctg aag 816
Gly Gly Pro Leu Met His Val Ile Ala Gly Lys Ala Val Ala Leu Lys
260 265 270
att gct acc acg cct gag ttc acc gac cgg cag cag cgc acg ctg gcc 864
Ile Ala Thr Thr Pro Glu Phe Thr Asp Arg Gln Gln Arg Thr Leu Ala
275 280 285
ggc gcc cgg att ctc gcc gat cgg ctt acc gcc gct gat gtc acc aag 912
Gly Ala Arg Ile Leu Ala Asp Arg Leu Thr Ala Ala Asp Val Thr Lys
290 295 300
gcc ggg gtg tcg gtg gtc agt ggt ggc act gac gtc cac cta gtg ctg 960
Ala Gly Val Ser Val Val Ser Gly Gly Thr Asp Val His Leu Val Leu305 310 315 320
gtc gac ctg cgc aac tcc ccg ttc gac ggc cag gea gea gaa gat ctg1008
Val Asp Leu Arg Asn Ser Pro Phe Asp Gly Gln Ala Ala Glu Asp Leu
325 330 335
ctg cac gag gtc ggc ate act gtc aac cgc aac gtg gtt ccc aat gac1056
Leu His Glu Val Gly Ile Thr Val Asn Arg Asn Val Val Pro Asn Asp 340 345 350 ccc cgg ccg ccg atg gtg acc tca gge ctg cgg ata gga acc ccc gcg1104 Pro Arg Pro Pro Met Val Thr Ser Gly Leu Arg Ile Gly Thr Pro Ala 355 360 365 ctg gca acc cga ggg ttc ggt gaa gcg gag ttc acc gag gtc gcg gac1152 Leu Ala Thr Arg Gly Phe Gly Glu Ala Glu Phe Thr Glu Val Ala Asp370 375 380 ate ate gcg acg gtg ctg acc act ggt ggc agt gtc gat gtg gcc gcg1200 Ile Ile Ala Thr Val Leu Thr Thr Gly Gly Ser Val Asp Val Ala Ala385 390 395 400ctg cgg cag cag gtt acc cga Ctt gee agg gac ttc ccg ctc tac ggg1248 Leu Arg Gln Gln Val Thr Arg Leu Ala Arg Asp Phe Pro Leu Tyr Gly 405 410 415gga ctt gag gac tgg age ttg gee ggt cgc tag 1281 Gly Leu Glu Asp Trp Ser Leu Ala Gly Arg 420 425 <210> 88 <211> 426 <212> PRT <213> Mycobacterium leprae <400> 88 Met Val Ala Pro Leu Ala Glu Val Asp Pro Asp Ile Ala Glu Leu Leu1 5 10 15Gly Lys Glu Leu Gly Arg Gln Arg Asp Thr Leu Glu Met Ile Ala Ser 20 25 30 Glu Asn Phe Val Pro Arg Ser Val Leu Gln Ala Gln Gly Ser Val Leu 35 40 45 Thr Asn Lys Tyr Ala Glu Gly Leu Pro Gly Arg Arg Tyr Tyr Asp Gly50 55 60 Cys Glu His Val Asp Val Val Glu Asn Ile Ala Arg Asp Arg Ala Lys65 70 75 80Ala Leu Phe Gly Ala Asp Phe Ala Asn Val Gln Pro His Ser Gly Ala 85 90 95Gln Ala Asn Ala Ala Val Leu His Ala Leu Met Ser Pro Gly Glu Arg 100 105 110 Leu Leu Gly Leu Asp Leu Ala Asn Gly Gly His Leu Thr His Gly Met 115 120 125 Arg Leu Asn Phe Ser Gly Lys Leu Tyr Glu Thr Gly Phe Tyr Gly Val130 135 140 Asp Ala Thr Thr His Leu Ile Asp Met Asp Ala Val Arg Ala Lys Ala145 150 155 160Leu Glu Phe Arg Pro Lys Val Leu Ile Ala Gly Trp Ser Ala Tyr Pro 165 170 175Arg Ile Leu Asp Phe Ala Ala Phe Arg Ser Ile Ala Asp Glu Val Gly 180 185 190 Ala Lys Leu Trp Val Asp Met Ala His Phe Ala Gly Leu Val Ala Val 195 200 205 Gly Leu His Pro Ser Pro Val Pro His Ala Asp Val Val Ser Thr Thr210 215 220 Val His Lys Thr Leu Gly Gly Gly Arg Ser Gly Leu Ile Leu Gly Lys225 230 235 240Gln Glu Phe Ala Thr Ala Ile Asn Ser Ala Val Phe Pro Gly Gln Gln 245 250 255Gly Gly Pro Leu Met His Val Ile Ala Gly Lys Ala Val Ala Leu Lys260 265 270
Ile Ala Thr Thr Pro Glu Phe Thr Asp Arg Gln Gln Arg Thr Leu Ala
275 280 285
Gly Ala Arg Ile Leu Ala Asp Arg Leu Thr Ala Ala Asp Val Thr Lys
290 295 300
Ala Gly Val Ser Val Val Ser Gly Gly Thr Asp Val His Leu Val Leu305 310 315 320
Val Asp Leu AXg Asn Seir Piro Phe Asp Gly GXn Ala Ais, Glu Asp Leu.
325 330 335
Leu His Glu Val Gly Ile Thr Val Asn Arg Asn Val Val Pro Asn Asp
340 345 350
Pro Arg Pro Pro Met Val Thr Ser Gly Leu Arg Ile Gly Thr Pro Ala
355 360 365
Leu Ala Thr Arg Gly Phe Gly Glu Ala Glu Phe Thr Glu Val Ala Asp
370 375 380
Ile Ile Ala Thr Val Leu Thr Thr Gly Gly Ser Val Asp Val Ala Ala385 390 395 400
Leu Arg Gln Gln Val Thr Arg Leu Ala Arg Asp Phe Pro Leu Tyr Gly
405 410 415
Gly Leu Glu Asp Trp Ser Leu Ala Gly Arg420 425
<210> 89<211> 1278<212> DNA
<213> Mycobacterivim tuberculosis
<220>
<221> CDS
<222> (1).. (1278)
<400> 89
atg aac acc ctc aac gac tcc ctg acc gcc ttc gac ccg gac ate gcc 48
Met Asn Thr Leu Asn Asp Ser Leu Thr Ala Phe Asp Pro Asp Ile Ala15 10 15
gcc ctg ate gac ggc gag ctg cgc cgt caa gaa tcc ggc ttg gag atg 96
Ala Leu Ile Asp Gly Glu Leu Arg Arg Gln Glu Ser Gly Leu Glu Met
20 25 30
ate gct tcg gag aac tat gea ccg ctg gcc gtg atg cag gcc caa ggt 144
Ile Ala Ser Glu Asn Tyr Ala Pro Leu Ala Val Met Gln Ala Gln Gly
35 40 45
tcg gtc ttg acc aac aag tac gcc gaa ggc tac ccg ggc cgg cgc tac 192
Ser Val Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Arg Arg Tyr
50 55 60
tac ggt ggc tgt gaa ttc gtc gac ggt gtc gag cag ttg gct ate gac 240
Tyr Gly Gly Cys Glu Phe Val Asp Gly Val Glu Gln Leu Ala Ile Asp65 70 75 80
cgc gtc aaa gcg ctc ttt ggc gcc gaa tac gcc aac gtg caa cca cat 288
Arg Val Lys Ala Leu Phe Gly Ala Glu Tyr Ala Asn Val Gln Pro His
85 90 95
tcg ggg gcc acc gcc aac gcc gcc acc atg cat gcg ctg cta aac ccc 336
Ser Gly Ala Thr Ala Asn Ala Ala Thr Met His Ala Leu Leu Asn Pro
100 105 110
ggc gac acc ate ctg ggg ttg tcg ctg gct cat ggc ggt cac ctg acc 384
Gly Asp Thr Ile Leu Gly Leu Ser Leu Ala His Gly Gly His Leu Thr
115 120 125
cac ggg atg cgg ate aac ttt tcc ggc aag ctc tac cac gcc acc gcc 432
His Gly Met Arg Ile Asn Phe Ser Gly Lys Leu Tyr His Ala Thr Ala
130 135 140
tac gag gtg tcc aaa gag gac tac ctg gtc gac atg gat gcc gtc gcc 480
Tyr Glu Val Ser Lys Glu Asp Tyr Leu Val Asp Met Asp Ala Val Ala145 150 155 160
gag gea gcg cgc aca cac cgg ccc aaa atg ate ate gcc ggc tgg tcg 528Glu Ala Ala Arg Thr His Arg Pro Lys Met Ile Ile Ala Gly Trp Ser
165 170 175
gcg tac cca cgc cag ctg gat ttc gcc cgc ttc cgc gcc ate gcc gac 576
Ala Tyr Pro Arg Gln Leu Asp Phe Ala Arg Phe Arg Ala Ile Ala Asp
180 185 190
gaa gtc gac gcc gtg ctc atg gtg gat atg gcg cat ttc gcc ggc ctg 624
Glu Val Asp Ala Val Leu Met Val Asp Met Ala His Phe Ala Gly Leu
195 200 205
gtc gcc gct ggc gtg cac ccc age ccg gtg ccg cac gcc cac gtc gtc 672
Val Ala Ala Gly Val His Pro Ser Pro Val Pro His Ala His Val Val
210 215 220
acc tcc acc act cac aag acg ctc ggc ggg ccc cgc ggc ggc ate ate 720
Thr Ser Thr Thr His Lys Thr Leu Gly Gly Pro Arg Gly Gly Ile Ile225 230 235 240
ttg tgc aat gac ccg gcc ate gcc aag aag ate aat tcc gcg gtc ttc 768
Leu Cys Asn Asp Pro Ala Ile Ala Lys Lys Ile Asn Ser Ala Val Phe
245 250 255
cct ggg cag cag ggc ggg ccg ctc gag cat gtc ate gea gcc aag gcc 816
Pro Gly Gln Gln Gly Gly Pro Leu Glu His Val Ile Ala Ala Lys Ala
260 265 270
acc gea ttc aag atg gea gea caa cct gaa ttc gcg cag cgc caa caa 864
Thr Ala Phe Lys Met Ala Ala Gln Pro Glu Phe Ala Gln Arg Gln Gln
275 280 285
cgt tgc ctc gac ggc gcg cgc ate ctt gcc ggc cgg ttg acc cag ccc 912
Arg Cys Leu Asp Gly Ala Arg Ile Leu Ala Gly Arg Leu Thr Gln Pro
290 295 300
gac gtc gcc gaa cgt ggc ate gcg gtg cta acc ggc ggc acc gat gtg 960
Asp Val Ala Glu Arg Gly Ile Ala Val Leu Thr Gly Gly Thr Asp Val305 310 315 320
cac ctc gtc cta gtc gac ctg cgc gac gcc gaa ctc gac ggc cag caa1008
His Leu Val Leu Val Asp Leu Arg Asp Ala Glu Leu Asp Gly Gln Gln
325 330 335
gcc gaa gac cgg ttg gcc gcc gtg gac ate acc gtc aac cgc aac gcg1056
Ala Glu Asp Arg Leu Ala Ala Val Asp Ile Thr Val Asn Arg Asn Ala
340 345 350
gta ccc ttc gac cct cgt ccc ccg atg ate acc tcg ggc ctg cga ate1104
Val Pro Phe Asp Pro Arg Pro Pro Met Ile Thr Ser Gly Leu Arg Ile
355 360 365
ggc acc ccg gcg ctg gcc gea cgc ggc ttc tcc cac aac gac ttc cgc1152
Gly Thr Pro Ala Leu Ala Ala Arg Gly Phe Ser His Asn Asp Phe Arg
370 375 380
gcc gtg gea gac ctc ate gcg gcg gea ctg acg gcc acc aac gac gac1200
Ala Val Ala Asp Leu Ile Ala Ala Ala Leu Thr Ala Thr Asn Asp Asp385 390 395 400
cag ctg ggt ccg ctg cgc gcc cag gtc cag cgg ctg gcc gea cgc tat1248
Gln Leu Gly Pro Leu Arg Ala Gln Val Gln Arg Leu Ala Ala Arg Tyr
405 410 415
ccg ctc tac ccg gaa ctg cac cgg aca tga1278
Pro Leu Tyr Pro Glu Leu His Arg Thr420 425
<210> 90<211> 425<212> PRT
<213> Mycobacterium tuberculosis<400> 90
Met Asn Thr Leu Asn Asp Ser Leu Thr Ala Phe Asp Pro Asp Ile Ala1 5 10 15
Ala Leu Ile Asp Gly Glu Leu Arg Arg Gln Glu Ser Gly Leu Glu Met
20 25 30
Ile Ala Ser Glu Asn Tyr Ala Pro Leu Ala Val Met Gln Ala Gln Gly
35 40 45
Ser Val Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Arg Arg Tyr
50 55 60
Tyr Gly Gly Cys Glu Phe Val Asp Gly Val Glu Gln Leu Ala Ile Asp65 70 75 80
Arg Val Lys Ala Leu Phe Gly Ala Glu Tyr Ala Asn Val Gln Pro His
85 90 95
Ser Gly Ala Thr Ala Asn Ala Ala Thr Met His Ala Leu Leu Asn Pro
100 105 110
Gly Asp Thr Ile Leu Gly Leu Ser Leu Ala His Gly Gly His Leu Thr
115 120 125
His Gly Met Arg Ile Asn Phe Ser Gly Lys Leu Tyr His Ala Thr Ala
130 135 140
Tyr Glu Val Ser Lys Glu Asp Tyr Leu Val Asp Met Asp Ala Val Ala145 150 155 160
Glu Ala Ala Arg Thr His Arg Pro Lys Met Ile Ile Ala Gly Trp Ser
165 170 175
Ala Tyr Pro Arg Gln Leu Asp Phe Ala Arg Phe Arg Ala Ile Ala Asp
180 185 190
Glu Val Asp Ala Val Leu Met Val Asp Met Ala His Phe Ala Gly Leu
195 200 205
Val Ala Ala Gly Val His Pro Ser Pro Val Pro His Ala His Val Val
210 215 220
Thr Ser Thr Thr His Lys Thr Leu Gly Gly Pro Arg Gly Gly Ile Ile225 230 235 240
Leu Cys Asn Asp Pro Ala Ile Ala Lys Lys Ile Asn Ser Ala Val Phe
245 250 255
Pro Gly Gln Gln Gly Gly Pro Leu Glu His Val Ile Ala Ala Lys Ala
260 265 270
Thr Ala Phe Lys Met Ala Ala Gln Pro Glu Phe Ala Gln Arg Gln Gln
275 280 285
Arg Cys Leu Asp Gly Ala Arg Ile Leu Ala Gly Arg Leu Thr Gln Pro
290 295 300
Asp Val Ala Glu Arg Gly Ile Ala Val Leu Thr Gly Gly Thr Asp Val305 310 315 320
His Leu Val Leu Val Asp Leu Arg Asp Ala Glu Leu Asp Gly Gln Gln
325 330 335
Ala Glu Asp Arg Leu Ala Ala Val Asp Ile Thr Val Asn Arg Asn Ala
340 345 350
Val Pro Phe Asp Pro Arg Pro Pro Met Ile Thr Ser Gly Leu Arg Ile
355 360 365
Gly Thr Pro Ala Leu Ala Ala Arg Gly Phe Ser His Asn Asp Phe Arg
370 375 380
Ala Val Ala Asp Leu Ile Ala Ala Ala Leu Thr Ala Thr Asn Asp Asp385 390 395 400
Gln Leu Gly Pro Leu Arg Ala Gln Val Gln Arg Leu Ala Ala Arg Tyr
405 410 415
Pro Leu Tyr Pro Glu Leu His Arg Thr420 425
<210> 91<211> 1251<212> DNA
<213> Neisseria meningitidis
<220><221> CDS<222> (1)..(1251)
<400> 91atg ttt tca aaaMet Phe Ser Lys1
gca gcc att gccAla Ala Ile Ala20
att gcc tct gaaIle Ala Ser Glu35
tcc cag ctg accSer Gln Leu Thr50
tac ggc ggc tgcTyr Gly Gly Cys65
cgc gtc aaa aaaArg Val Lys Lys
tcc ggc tcg caaSer Gly Ser Gln100
ggc gac acc attGly Asp Thr Ile115
cac ggc gcg ageHis Gly Ala Ser130
tat ggt ttg gatTyr Gly Leu Asp145
ctc gcg ctc gaaLeu Ala Leu Glu
tac gcg ttg caaTyr Ala Leu Gln180
gtc ggc gca tacVal Gly Ala Tyr195
gcc ggc ggc gaaAla Gly Gly Glu210
acc acc acc cacThr Thr Thr His225
tgc cgc gac aatCys Arg Asp Asn
age ctg caa ggtSer Leu Gln Gly260
gcg ttt aaa gaaAla Phe Lys Glu275
gtg aaa ate aatVal Lys Ile Asn290
ttg cgc ate gttLeu Arg Ile Val305
age gtt acc ctcSer Val Thr Leu5
caa gaa gac caaGln Glu Asp Gln
aac tac gtc ageAsn Tyr Val Ser40
aac aaa tac gccAsn Lys Tyr Ala55
gaa tac gtc gatGlu Tyr Val Asp70
ctg ttc ggc gcgLeu Phe Gly Ala85
gcc aac caa gccAla Asn Gln Ala
ttg ggt atg tctLeu Gly Met Ser120
gtt aat ate tcaVal Asn Ile Ser135
gaa aac gaa gtgGlu Asn Glu Val150
cac aaa ccc aaaHis Lys Pro Lys165
ate gac tgg gcaIle Asp Trp Ala
ctc ttt gtc gatLeu Phe Val Asp200
tat ccc aat cccTyr Pro Asn Pro215
aaa acc ctg cgcLys Thr Leu Arg230
acc cac gaa aaaThr His Glu Lys245
ggc ccg ctg atgGly Pro Leu Met
gca ttg caa cccAla Leu Gln Pro280
gca gcc gcc atgAla Ala Ala Met295
tcc ggc cgc accSer Gly Arg Thr310
gca caa tat gacAla Gln Tyr Asp10
cgc cag caa gacArg Gln Gln Asp25
tgc gcc gta atgCys Ala Val Met
gaa ggc tac cccGlu Gly Tyr Pro60
att gtc gaa caaIle Val Glu Gln75
caa tac gcc aacGln Tyr Ala Asn90
gtg tac gct tccVal Tyr Ala Ser105
ctg gcg cac ggcLeu Ala His Gly
ggc aaa ctc tacGly Lys Leu Tyr140
ctc gat tat gccLeu Asp Tyr Ala155
atg att gtg gcgMet Ile Val Ala170
aaa ttc cgc gaaLys Phe Arg Glu185
atg gcg cac tatMet Ala His Tyr
gtg ccg ttc tgcVal Pro Phe Cys220
ggt cct cgc ggcGly Pro Arg Gly235
gcg ttg aac tctAla Leu Asn Ser250
cac gtt ate gccHis Val Ile Ala265
gag ttc aaa caaGlu Phe Lys Gln
gcg gaa gag ttgAla Glu Glu Leu300
gaa age cac gttGlu Ser His Val315
ccc gat ttg gcaPro Asp Leu Ala15
cac gtc gag ctgHis Val Glu Leu30
gaa gcg caa ggtGlu Ala Gln Gly45
ggc aaa cgc tacGly Lys Arg Tyr
ttg gcg att gacLeu Ala Ile Asp80
gtc caa ccg cacVal Gln Pro His95
gtt tta aaa ccaVal Leu Lys Pro110
ggc cac ctg accGly His Leu Thr125
aac gct gtt actAsn Ala Val Thr
gaa gtc gaa cgcGlu Val Glu Arg160
ggt gcg tct gccGly Ala Ser Ala175
ate gcc gat aaaIle Ala Asp Lys190
gcc ggt ctg gttAla Gly Leu Val205
gac ttc gtt accAsp Phe Val Thr
ggc gta att ttgGly Val Ile Leu240
tcc ate ttc ccaSer Ile Phe Pro255
gcc aaa gcc gtgAla Lys Ala Val270
tac gca aaa caaTyr Ala Lys Gln285
gtt aaa cgc ggtVal Lys Arg Gly
ttc ctc gtt gacPhe Leu Val Asp320ctg caa ccg atg aaa att acc ggc aaa gcc gcc gaa gct gct ttg ggc1008
Leu Gln Pro Met Lys Ile Thr Gly Lys Ala Ala Glu Ala Ala Leu Gly
325 330 335
aaa gcg cac ate act gtc aac aaa aac gcc ate ccg aat gat ccg gaa1056
Lys Ala His Ile Thr Val Asn Lys Asn Ala Ile Pro Asn Asp Pro Glu
340 345 350
aaa ccc ttc gtt acc tcc ggc ate cgc ate ggt tcc gce gcc atg acc1104
Lys Pro Phe Val Thr Ser Gly Ile Arg Ile Gly Ser Ala Ala Met Thr
355 360 365
aca cgc ggt ttt aac gaa gcc gac gcg cgc gta ttg gcg aac ttg gtt1152
Thr Arg Gly Phe Asn Glu Ala Asp Ala Arg Val Leu Ala Asn Leu Val
370 375 380
gcc gac gta ttg tet aac ccc gaa gac gaa gcc aac ctc gcc aaa gtc1200
Ala Asp Val Leu Ser Asn Pro Glu Asp Glu Ala Asn Leu Ala Lys Val385 390 395 400
cgc gaa caa gta act gct ttg tgc aat aaa tac ccc gtt tac ggc gcg1248
Arg Glu Gln Val Thr Ala Leu Cys Asn Lys Tyr Pro Val Tyr Gly Ala405 410 415
taa1251
<210> 92<211> 416<212> PRT
<400> 92 Met Phe Ser Lys Ser Val Thr Leu Ala Gln Tyr Asp Pro Asp Leu Ala1 5 10 15 Ala Ala Ile Ala Gln Glu Asp Gln Arg Gln Gln Asp His Val Glu Leu 20 25 30 Ile Ala Ser Glu Asn Tyr Val Ser Cys Ala Val Met Glu Ala Gln Gly 35 40 45 Ser Gln Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr 50 55 60 Tyr Gly Gly Cys Glu Tyr Val Asp Ile Val Glu Gln Leu Ala Ile Asp65 70 75 80Arg Val Lys Lys Leu Phe Gly Ala Gln Tyr Ala Asn Val Gln Pro His 85 90 95 Ser Gly Ser Gln Ala Asn Gln Ala Val Tyr Ala Ser Val Leu Lys Pro 100 105 110 Gly Asp Thr Ile Leu Gly Met Ser Leu Ala His Gly Gly His Leu Thr 115 120 125 His Gly Ala Ser Val Asn Ile Ser Gly Lys Leu Tyr Asn Ala Val Thr 130 135 140 Tyr Gly Leu Asp Glu Asn Glu Val Leu Asp Tyr Ala Glu Val Glu Arg 145 150 155 160Leu Ala Leu Glu His Lys Pro Lys Met Ile Val Ala Gly Ala Ser Ala 165 170 175 Tyr Ala Leu Gln Ile Asp Trp Ala Lys Phe Arg Glu Ile Ala Asp Lys 180 185 190 Val Gly Ala Tyr Leu Phe Val Asp Met Ala His Tyr Ala Gly Leu Val 195 200 205 Ala Gly Gly Glu Tyr Pro Asn Pro Val Pro Phe Cys Asp Phe Val Thr 210 215 220Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Val Ile Leu225 230 235 240Cys Arg Asp Asn Thr 245 His Glu Lys Ala Leu 250 Asn Ser Ser Ile Phe 255 ProSer Leu Gln Gly 260 Gly Pro Leu Met His 265 Val Ile Ala Ala Lys 270 Ala ValAla Phe Lys 275 Glu Ala Leu Gln Pro 280 Glu Phe Lys Gln Tyr 285 Ala Lys GlnVal Lys Ile Asn Ala Ala Ala Met Ala Glu Glu Leu Val Lys Arg Gly 290 295 300 Leu Arg Ile Val Ser Gly Arg Thr Glu Ser His Val Phe Leu Val Asp305 310 315 320Leu Gln Pro Met Lys 325 Ile Thr Gly Lys Ala 330 Ala Glu Ala Ala Leu 335 GlyLys Ala His Ile 340 Thr Val Asn Lys Asn 345 Ala Ile Pro Asn Asp 350 Pro GluLys Pro Phe 355 Val Thr Ser Gly Ile 360 Arg Ile Gly Ser Ala 365 Ala Met ThrThr Arg Gly Phe Asn Glu Ala Asp Ala Arg Val Leu Ala Asn Leu Val 370 375 380 Ala Asp Val Leu Ser Asn Pro Glu Asp Glu Ala Asn Leu Ala Lys Val385 390 395 400Arg Glu Gln Val Thr Ala Leu Cys Asn Lys Tyr Pro Val Tyr Gly Ala 405 410 415
<210> 93<211> 1263<212> DNA
<213> Pasteurella multocida
<220>
<221> CDS
<222> (1)..(1263)
<400> 93
atg tta aaa aga agt atg aac ate gct gat tac gat ccg gtt tta tgg 48Met Leu Lys Arg Ser Met Asn Ile Ala Asp Tyr Asp Pro Val Leu Trp 1 5 10 15 cag gca att caa gac gaa aat cgc cgt caa gaa gaa cac att gaa tta 96Gln Ala Ile Gln Asp Glu Asn Arg Arg Gln Glu Glu His Ile Glu Leu 20 25 30 att gca tca gaa aac tat gcc age cca cgc gtg atg gaa gca cag ggt 144Ile Ala Ser Glu Asn Tyr Ala Ser Pro Arg Val Met Glu Ala Gln Gly 35 40 45 tct caa ttt acc aat aaa tat gcg gaa ggt tac ccg ggt aaa cgt tat 192Ser Gln Phe Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr 50 55 60 tat ggt ggt tgt gaa tat gca gat ate gtt gag caa tta gcg att gat 240Tyr Gly Gly Cys Glu Tyr Ala Asp Ile Val Glu Gln Leu Ala Ile Asp 65 70 75 80 cgt gca aaa gag tta ttt cat gcg gat tat gtg aac gta caa CCC cac 288Arg Ala Lys Glu Leu Phe His Ala Asp Tyr Val Asn Val Gln Pro His 85 90 95 tcg ggt tcg caa gct aac gcg gca gtg tat ggt gcc tta tta cag cca 336Ser Gly Ser Gln Ala Asn Ala Ala Val Tyr Gly Ala Leu Leu Gln Pro 100 105 110 cat gac act att Ctt ggt atg age Ctt gca cac ggg gga cac tta acg 384His Asp Thr Ile Leu Gly Met Ser Leu Ala His Gly Gly His Leu Thr 115 120 125 cac ggt gca tca gtg age ttt tcg ggt aaa ate tat aat gca gtg caa 432His Gly Ala Ser Val Ser Phe Ser Gly Lys Ile Tyr Asn Ala Val Gln 130 135 140 tat gga att act gcc gaa ggt tta att gat tat gaa gat gtg cgt caa 480Tyr Gly Ile Thr Ala Glu Gly Leu Ile Asp Tyr Glu Asp Val Arg Gln 145 150 155 160 aaa gcc tta gag tgc aag cca aaa atg ate gtg gcg ggt ttc tet gcc 528Lys Ala Leu Glu Cys 165 Lys Pro Lys Met Ile 170 Val Ala Gly Phe Ser 175 Ala tat tcg caa gta gtg gat tgg gcg aaa atg cgt gaa ate gct gat gaa 576Tyr Ser Gln Val Val Asp Trp Ala Lys Met Arg Glu Ile Ala Asp Glu 180 185 190 gtg gga gcg tat Ctt ttc gtg gat atg gcg cac gtg gca ggg ctg att 624Val Gly Ala Tyr Leu Phe Val Asp Met Ala His Val Ala Gly Leu Ile 195 200 205 gca gca ggt gtt tac cca agt ccg tta cca cat gca cat gtt gtg act 672Ala Ala Gly Val Tyr Pro Ser Pro Leu Pro His Ala His Val Val Thr 210 215 220 act acc aca cac aaa acc tta ggg gga cct cgt ggt ggt tta att cta 720Thr Thr Thr His Lys Thr Leu Gly Gly Pro Arg Gly Gly Leu Ile Leu 225 230 235 240 tcg gct gcg aaa gat gaa gat Ctt tat aaa aaa tta caa agt tet gtt 768Ser Ala Ala Lys Asp 245 Glu Asp Leu Tyr Lys 250 Lys Leu Gln Ser Ser 255 Val ttc cct gcc aac caa ggt ggt ccg tta gtg cat gtg ate gcc gca aaa 816Phe Pro Ala Asn 260 Gln Gly Gly Pro Leu 265 Val His Val Ile Ala 270 Ala Lys gcg gtc tgt ttt aaa gaa gcg Ctt gag cct gaa tac aaa gtg tat caa 864Ala Val Cys 275 Phe Lys Glu Ala Leu 280 Glu Pro Glu Tyr Lys 285 Val Tyr Gln caa caa gtg gtg aaa aat gcg aaa gcc atg gtg gac gtg ttt aaa caa 912Gln Gln Val Val Lys Asn Ala Lys Ala Met Val Asp Val Phe Lys Gln 290 295 300 cgt ggt tat aac gtg gta tcc aat ggc aca gaa aac cat tta ttc tta 960Arg Gly Tyr Asn Val Val Ser Asn Gly Thr Glu Asn His Leu Phe Leu 305 310 315 320 gta gat tta gtt age cac ggt tta acc ggt aaa gca gca gat gct gcg 1008 Val Asp Leu Val Ser His Gly Leu Thr Gly Lys Ala Ala Asp Ala Ala 325 330 335 tta ggc agt gca aac att acc gtc aac aaa aat gcg gta cca aac gat 1056 Leu Gly Ser Ala 340 Asn Ile Thr Val Asn 345 Lys Asn Ala Val Pro 350 Asn Asp cca caa aaa cca ttt gtg acc tca ggt ate cgt gtg ggc aca cca tet 1104 Pro Gln Lys Pro Phe Val Thr Ser Gly Ile Arg Val Gly Thr Pro Ser 355 360 365 ate acc cgt cgt ggc ttt aaa gaa gct gaa tcg gca gaa tta gcc ggt 1152 Ile Thr Arg Arg Gly Phe Lys Glu Ala Glu Ser Ala Glu Leu Ala Gly 370 375 380 tgg atg tgt gat gtg ttg gat gcg atg ggt aaa gac aac gaa gca caa 1200 Trp Met Cys Asp Val Leu Asp Ala Met Gly Lys Asp Asn Glu Ala Gln 385 390 395 400 gtg att gca cag aca aaa gag aaa gtc tta gca att tgt aaa cgt Ctt 1248 Val Ile Ala Gln Thr 405 Lys Glu Lys Val Leu 410 Ala Ile Cys Lys Arg 415 Leu cct gtt tat gct taa
1263
Pro Val Tyr Ala420
<210> 94<211> 420<212> PRT
<213> Pasteurella multocida<400> 94
Met Leu Lys Arg Ser Met Asn Ile Ala Asp Tyr Asp Pro Val Leu Trp1 5 10 15
Gln Ala Ile Gln Asp Glu Asn Arg Arg Gln Glu Glu His Ile Glu Leu
20 25 30
Ile Ala Ser Glu Asn Tyr Ala Ser Pro Arg Val Met Glu Ala Gln Gly
35 40 45
Ser Gln Phe Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr
50 55 60
Tyr Gly Gly Cys Glu Tyr Ala Asp Ile Val Glu Gln Leu Ala Ile Asp65 70 75 80
Arg Ala Lys Glu Leu Phe His Ala Asp Tyr Val Asn Val Gln Pro His
85 90 95
Ser Gly Ser Gln Ala Asn Ala Ala Val Tyr Gly Ala Leu Leu Gln Pro
100 105 110
His Asp Thr Ile Leu Gly Met Ser Leu Ala His Gly Gly His Leu Thr
115 120 125
His Gly Ala Ser Val Ser Phe Ser Gly Lys Ile Tyr Asn Ala Val Gln
130 135 140
Tyr Gly Ile Thr Ala Glu Gly Leu Ile Asp Tyr Glu Asp Val Arg Gln145 150 155 160
Lys Ala Leu Glu Cys Lys Pro Lys Met Ile Val Ala Gly Phe Ser Ala
165 170 175
Tyr Ser Gln Val Val Asp Trp Ala Lys Met Arg Glu Ile Ala Asp Glu
180 185 190
Val Gly Ala Tyr Leu Phe Val Asp Met Ala His Val Ala Gly Leu Ile
195 200 205
Ala Ala Gly Val Tyr Pro Ser Pro Leu Pro His Ala His Val Val Thr
210 215 220
Thr Thr Thr His Lys Thr Leu Gly Gly Pro Arg Gly Gly Leu Ile Leu225 230 235 240
Ser Ala Ala Lys Asp Glu Asp Leu Tyr Lys Lys Leu Gln Ser Ser Val
245 250 255
Phe Pro Ala Asn Gln Gly Gly Pro Leu Val His Val Ile Ala Ala Lys
260 265 270
Ala Val Cys Phe Lys Glu Ala Leu Glu Pro Glu Tyr Lys Val Tyr Gln
275 280 285
Gln Gln Val Val Lys Asn Ala Lys Ala Met Val Asp Val Phe Lys Gln
290 295 300
Arg Gly Tyr Asn Val Val Ser Asn Gly Thr Glu Asn His Leu Phe Leu305 310 315 320
Val Asp Leu Val Ser His Gly Leu Thr Gly Lys Ala Ala Asp Ala Ala
325 330 335
Leu Gly Ser Ala Asn Ile Thr Val Asn Lys Asn Ala Val Pro Asn Asp
340 345 350
Pro Gln Lys Pro Phe Val Thr Ser Gly Ile Arg Val Gly Thr Pro Ser
355 360 365
Ile Thr Arg Arg Gly Phe Lys Glu Ala Glu Ser Ala Glu Leu Ala Gly
370 375 380
Trp Met Cys Asp Val Leu Asp Ala Met Gly Lys Asp Asn Glu Ala Gln385 390 395 400
Val Ile Ala Gln Thr Lys Glu Lys Val Leu Ala Ile Cys Lys Arg Leu405 410 415
Pro Val Tyr Ala420
<210> 95<211> 1257<212> DNA
<213> Streptococcus pyogenes
\<220>
<221> CDS
<222> (1).. (1257)
<400> 95
atg att ttt gat aaa ggt aat gtt gaa gac ttt gat aaa gag Ctt tgg 48Met Ile Phe Asp Lys Gly Asn Val Glu Asp Phe Asp Lys Glu Leu Trp 1 5 10 15 gat gcc att cat gct gaa gaa gaa aga caa gaa cat cat ate gaa ttg 96Asp Ala Ile His Ala Glu Glu Glu Arg Gln Glu His His Ile Glu Leu 20 25 30 att gca tct gaa aac atg gtt tca aaa gct gtc atg gca gct caa ggt 144Ile Ala Ser 35 Glu Asn Met Val Ser 40 Lys Ala Val Met Ala 45 Ala Gln Gly tct gtt tta acc aat aag tat gca gaa ggc tat cca ggt aat cgc tat 192Ser Val 50 Leu Thr Asn Lys Tyr 55 Ala Glu Gly Tyr Pro 60 Gly Asn Arg Tyr tat ggt gga aca gaa tgt gtg gat att gtc gaa acg Ctt gct att gaa 240Tyr Gly Gly Thr Glu Cys Val Asp Ile Val Glu Thr Leu Ala Ile Glu 65 70 75 80 cgt gct aag aaa Ctt ttc ggt gcc gca ttt gcc aat gtt caa gcc cat 288Arg Ala Lys Lys Leu Phe Gly Ala Ala Phe Ala Asn Val Gln Ala His 85 90 95 tcc gga agt caa gcc aat gca gca gct tat atg gcc ttg att gag gct 336Ser Gly Ser Gln 100 Ala Asn Ala Ala Ala 105 Tyr Met Ala Leu Ile 110 Glu Ala ggt gac acc gta tta gga atg gat ttg gct gca ggt ggt cat ctc acg 384Gly Asp Thr Val Leu Gly Met Asp Leu Ala Ala Gly Gly His Leu Thr 115 120 125 cat ggc tct cca gta aat ttt tct gga aaa acc tac cat ttt gtg ggt 432His Gly 130 Ser Pro Val Asn Phe 135 Ser Gly Lys Thr Tyr 140 His Phe Val Gly tac tca gta gat act gat act gaa atg tta aat tat gag gcg att tta 480Tyr Ser Val Asp Thr TVsp Thr Glu Met Leu Asn Tyr Glu Ala Ile Leu 145 150 155 160 gaa caa gca aag gcg gtc caa cca aag Ctt ate gtt gca ggg gct tcg 528Glu Gln Ala Lys Ala 165 Val Gln Pro Lys Leu 170 Ile Val Ala Gly Ala 175 Ser gcc tac tct aga age att gat ttt gaa aag ttt cgt gcc att gct gat 576Ala Tyr Ser Arg 180 Ser Ile Asp Phe Glu 185 Lys Phe Arg Ala Ile 190 Ala Asp cac gta ggt gct tac tta atg gtg gac atg gct cac ate gct ggc Ctt 624His Val Gly Ala Tyr Leu Met Val Asp Met Ala His Ile Ala Gly Leu 195 200 205 gta gca gca ggt gtg cac ccg agt cct gtc cct tat gcg cat att gtg 672Val Ala 210 Ala Gly Val His Pro 215 Ser Pro Val Pro Tyr 220 Ala His Ile Val aca tca aca acc cat aaa acc tta cgt ggt cct cgt gga ggc ttg ata 720Thr Ser Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile 225 230 235 240 tta acc aat gac gaa gct Ctt gct aaa aag att aat tcg gcc gtt ttc 768Leu Thr Asn Asp Glu 245 Ala Leu Ala Lys Lys 250 Ile Asn Ser Ala Val 255 Phe CCt ggt tta caa gga gga cct ctg gaa cac gtg att gct gcc aaa gcg 816Pro Gly Leu Gln 260 Gly Gly Pro Leu Glu 265 His Val Ile Ala Ala 270 Lys Ala gtt gcc ttc aaa gaa gcc ttg gat cca gcc ttt aaa gac tat gca caa 864Val Ala Phe 275 Lys Glu Ala Leu Asp 280 Pro Ala Phe Lys Asp 285 Tyr Ala Gln gct att att gat aat act gcg gct atg gca gca gtt ttt gca caa gat 912Ala Ile Ile Asp Asn Thr Ala Ala Met Ala Ala Val Phe Ala Gln Asp 290 295 300
\gat cgt ttc cgt ctg ate tca ggt ggt aca gat aat cat gtc ttt tta 960
Asp Arg Phe Arg Leu Ile Ser Gly Gly Thr Asp Asn His Val Phe Leu305 310 315 320
gta gat gtc act aag gtt att gct aat ggt aaa cta gcg caa aat ctt1008
Val Asp Val Thr Lys Val Ile Ala Asn Gly Lys Leu Ala Gln Asn Leu
325 330 335
ctg gat gag gtt aat att acc ctt aat aaa aat gcc att cct ttt gaa1056
Leu Asp Glu Val Asn Ile Thr Leu Asn Lys Asn Ala Ile Pro Phe Glu
340 345 350
acc ttg tcg cca ttt aaa acc tca ggt att cgc att ggt tgt gct gcc1104
Thr Leu Ser Pro Phe Lys Thr Ser Gly Ile Arg Ile Gly Cys Ala Ala
355 360 365
ata acc age cgt ggt atg ggt gtt aaa gag agt cag acc att gcc cgt1152
Ile Thr Ser Arg Gly Met Gly Val Lys Glu Ser Gln Thr Ile Ala Arg
370 375 380
ctt ate ate aaa gcc ttg gtt aat cat gat caa gaa act att ctt gaa1200
Leu Ile Ile Lys Ala Leu Val Asn His Asp Gln Glu Thr Ile Leu Glu385 390 395 400
gaa gtc cgt cag gaa gtg cgt cag tta acc gat gcc ttc cca ctc tat1248
Glu Val Arg Gln Glu Val Arg Gln Leu Thr Asp Ala Phe Pro Leu Tyr405 410 415
aaa aag taa
1257
Lys Lys
<210> 96<211> 418<212> PRT
<213> Streptococcus pyogenes<400> 96
Met Ile Phe Asp Lys Gly Asn Val Glu Asp Phe Asp Lys Glu Leu Trp15 10 15
Asp Ala Ile His Ala Glu Glu Glu Arg Gln Glu His His Ile Glu Leu
20 25 30
Ile Ala Ser Glu Asn Met Val Ser Lys Ala Val Met Ala Ala Gln Gly
35 40 45
Ser Val Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Asn Arg Tyr
50 55 60
Tyr Gly Gly Thr Glu Cys Val Asp Ile Val Glu Thr Leu Ala Ile Glu65 70 75 80
Arg Ala Lys Lys Leu Phe Gly Ala Ala Phe Ala Asn Val Gln Ala His
85 90 95
Ser Gly Ser Gln Ala Asn Ala Ala Ala Tyr Met Ala Leu Ile Glu Ala
100 105 110
Gly Asp Thr Val Leu Gly Met Asp Leu Ala Ala Gly Gly His Leu Thr
115 120 125
His Gly Ser Pro Val Asn Phe Ser Gly Lys Thr Tyr His Phe Val Gly
130 135 140
Tyr Ser Val Asp Thr Asp Thr Glu Met Leu Asn Tyr Glu Ala Ile Leu145 150 155 160
Glu Gln Ala Lys Ala Val Gln Pro Lys Leu Ile Val Ala Gly Ala Ser
165 170 175
Ala Tyr Ser Arg Ser Ile Asp Phe Glu Lys Phe Arg Ala Ile Ala Asp
180 185 190
His Val Gly Ala Tyr Leu Met Val Asp Met Ala His Ile Ala Gly Leu195 200 205
Val Ala Ala Gly Val His Pro Ser Pro Val Pro Tyr Ala His Ile Val
210 215 220
Thr Ser Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile225 230 235 240
Leu Thr Asn Asp Glu Ala Leu Ala Lys Lys Ile Asn Ser Ala Val Phe
245 250 255
Pro Gly Leu Gln Gly Gly Pro Leu Glu His Val Ile Ala Ala Lys Ala
260 265 270
Val Ala Phe Lys Glu Ala Leu Asp Pro Ala Phe Lys Asp Tyr Ala Gln
275 280 285
Ala Ile Ile Asp Asn Thr Ala Ala Met Ala Ala Val Phe Ala Gln Asp
290 295 300
Asp Arg Phe Arg Leu Ile Ser Gly Gly Thr Asp Asn His Val Phe Leu305 310 315 320
Val Asp Val Thr Lys Val Ile Ala Asn Gly Lys Leu Ala Gln Asn Leu
325 330 335
Leu Asp Glu Val Asn Ile Thr Leu Asn Lys Asn Ala Ile Pro Phe Glu
340 345 350
Thr Leu Ser Pro Phe Lys Thr Ser Gly Ile Arg Ile Gly Cys Ala Ala
355 360 365
Ile Thr Ser Arg Gly Met Gly Val Lys Glu Ser Gln Thr Ile Ala Arg
370 375 380
Leu Ile Ile Lys Ala Leu Val Asn His Asp Gln Glu Thr Ile Leu Glu385 390 395 400
Glu Val Arg Gln Glu Val Arg Gln Leu Thr Asp Ala Phe Pro Leu Tyr405 410 415
Lys Lys
<210> 97<211> 1254<212> DNA
<213> Salmomella typhi
<220>
<221> CDS
<222> (1)..(1254)
<400> 97
atg tta aag cgt gaa atg aac att gcc gat tat gat gcc gaa ttg tggMet Leu Lys Arg Glu Met Asn Ile Ala Asp Tyr Asp Ala Glu Leu Trp15 10 15
cag gct atg gag cag gaa aaa gta cgt cag gaa gag cac ate gaa ctgGln Ala Met Glu Gln Glu Lys Val Arg Gln Glu Glu His Ile Glu Leu
20 25 30
ate gcc tcc gaa aac tac acc age ccg cgc gtg atg cag gcg cag gggIle Ala Ser Glu Asn Tyr Thr Ser Pro Arg Val Met Gln Ala Gln Gly
35 40 45
tet cag ctg acc aac aaa tac gct gaa gga tat ccg ggc aag cgc tacSer Gln Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr
50 55 60
tac ggc ggt tgc gaa tac gtt gat gtc gta gag cag ctg gct ate gacTyr Gly Gly Cys Glu Tyr Val Asp Val Val Glu Gln Leu Ala Ile Asp65 70 75 80
cgc gcg aaa gaa ctg ttc ggc gcc gac tac gct aac gtg cag ccg cacArg Ala Lys Glu Leu Phe Gly Ala Asp Tyr Ala Asn Val Gln Pro His
85 90 95
tcc ggt tet cag gct aac ttc gct gtt tac acc gcg ctg ctg cag ccgSer Gly Ser Gln Ala Asn Phe Ala Val Tyr Thr Ala Leu Leu Gln Pro
100 105 110
ggc gat acc gtt ctg ggt atg aac ctg gcg cag ggc ggc cac ctg actGly Asp Thr Val Leu Gly Met Asn Leu Ala Gln Gly Gly His Leu Thr115
cac ggc tcc ccgHis Gly Ser Pro130
tac ggt ate gatTyr Gly Ile Asp145
ctg gcc aaa gagLeu Ala Lys Glu
tac tcc ggt gtgTyr Ser Gly Val180
ate ggc gea tacIle Gly Ala Tyr195
gcc gea ggc gttAla Ala Gly Val210
acc acc acc cacThr Thr Thr His225
gcg aaa ggc ggcAla Lys Gly Gly
ttc cca age gcgPhe Pro Ser Ala260
gcg gta gcg ctgAla Val Ala Leu275
cag cag gtg gcgGln Gln Val Ala290
cgc ggc tac aaaArg Gly Tyr Lys305
ctg gac ctg gtg1008
Leu Asp Leu Val
ctg ggc cgt gct1056
Leu Gly Arg Ala340
ccg aag age ccg1104
Pro Lys Ser Pro355
gtt act cgt cgc1152
Val Thr Arg Arg370
tgg atg tgt gac1200
Trp Met Cys Asp385
cgc gtg aaa gcg1248
Arg Val Lys Ala
gcg taa1254
120
gtt aac ttc tccVal Asn Phe Ser135
gag tcc ggt aaaGlu Ser Gly Lys150
cac aag ccg aagHis Lys Pro Lys165
gtt gac tgg geaVal Asp Trp Ala
ctg·ttt gtc gacLeu Phe Val Asp200
tac ccg aac ccgTyr Pro Asn Pro215
aaa acc ctg gcgLys Thr Leu Ala230
gac gaa gag ctgAsp Glu Glu Leu245
cag ggc ggc ccgGln Gly Gly Pro
aaa gaa gcg atgLys Glu Ala Met280
aaa aac gcc aaaLys Asn Ala Lys295
gtg gtg tet ggcVal Val Ser Gly310
gat aaa aac ctg
Asp Lys Asn Leu325
aac ate acc gtg
Asn Ile Thr Val
ttc gtg acc tcc
Phe Val Thr Ser360
ggc ttc aaa gaa
Gly Phe Lys Glu375
gtg ctg gac aac
Val Leu Asp Asn390
aaa gtg ctg gat
Lys Val Leu Asp405
ggt aaa ctg tacGly Lys Leu Tyr140
att gac tat gacIle Asp Tyr Asp155
atg att ate ggtMet Ile Ile Gly170
aaa atg cgt gaaLys Met Arg Glu185
atg gcg cac gtgMet Ala His Val
gtt ccg cac gctVal Pro His Ala220
ggt ccg cgc ggcGly Pro Arg Gly235
tac aaa aaa ctgTyr Lys Lys Leu250
ctg atg cac gtgLeu Met His Val265
gag ccg gag ttcGlu Pro Glu Phe
gcg atg gtg gaaAla Met Val Glu300
ggc act gag aacGly Thr Glu Asn315
acc ggt aaa gaa
Thr Gly Lys Glu330
aac aaa aac age
Asn Lys Asn Ser345
ggt ate cgt att
Gly Ile Arg Ile
gcg gaa gtg aaa
Ala Glu Val Lys380
ate aat gat gaa
Ile Asn Asp Glu395
ate tgc gcc cgc
Ile Cys Ala Arg410
125
aac ate gta cctAsn Ile Val Pro
gag atg gcg aagGlu Met Ala Lys160
ggc ttc tet gccGly Phe Ser Ala175
ate gct gac ageIle Ala Asp Ser190
gcg ggc ctg attAla Gly Leu Ile205
cac gtt gtc accHis Val Val Thr
ggc ctg ate ctgGly Leu Ile Leu240
aac tcc gcc gtcAsn Ser Ala Val255
ate gcg ggt aaaIle Ala Gly Lys270
aaa gtt tac cagLys Val Tyr Gln285
gtg ttc ctg aacVal Phe Leu Asn
cac ctg ttc ctgHis Leu Phe Leu320
gct gac gcc gcg
Ala Asp Ala Ala335
gtg ccg aac gat
Val Pro Asn Asp350
ggt tet ccg gcg
Gly Ser Pro Ala365
gag ctg gct ggc
Glu Leu Ala Gly
gcc acc att gaa
Ala Thr Ile Glu400
ttc ccg gtt tac
Phe Pro Val Tyr415Ala
<210> 98<211> 417<212> PRT
<213> Salmomella typhi<400> 98
Met Leu Lys Arg Glu Met Asn Ile Ala Asp Tyr Asp Ala Glu Leu Trp1 5 10 15
Gln Ala Met Glu Gln Glu Lys Val Arg Gln Glu Glu His Ile Glu Leu
20 25 30
Ile Ala Ser Glu Asn Tyr Thr Ser Pro Arg Val Met Gln Ala Gln Gly
35 40 45
Ser Gln Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr
50 55 60
Tyr Gly Gly Cys Glu Tyr Val Asp Val Val Glu Gln Leu Ala Ile Asp65 70 75 80
Arg Ala Lys Glu Leu Phe Gly Ala Asp Tyr Ala Asn Val Gln Pro His
85 90 95
Ser Gly Ser Gln Ala Asn Phe Ala Val Tyr Thr Ala Leu Leu Gln Pro
100 105 110
Gly Asp Thr Val Leu Gly Met Asn Leu Ala Gln Gly Gly His Leu Thr
115 120 125
His Gly Ser Pro Val Asn Phe Ser Gly Lys Leu Tyr Asn Ile Val Pro
130 135 140
Tyr Gly Ile Asp Glu Ser Gly Lys Ile Asp Tyr Asp Glu Met Ala Lys145 150 155 160
Leu Ala Lys Glu His Lys Pro Lys Met Ile Ile Gly Gly Phe Ser Ala
165 170 175
Tyr Ser Gly Val Val Asp Trp Ala Lys Met Arg Glu Ile Ala Asp Ser
180 185 190
Ile Gly Ala Tyr Leu Phe Val Asp Met Ala His Val Ala Gly Leu Ile
195 200 205
Ala Ala Gly Val Tyr Pro Asn Pro Val Pro His Ala His Val Val Thr
210 215 220
Thr Thr Thr His Lys Thr Leu Ala Gly Pro Arg Gly Gly Leu Ile Leu225 230 235 240
Ala Lys Gly Gly Asp Glu Glu Leu Tyr Lys Lys Leu Asn Ser Ala Val
245 250 255
Phe Pro Ser Ala Gln Gly Gly Pro Leu Met His Val Ile Ala Gly Lys
260 265 270
Ala Val Ala Leu Lys Glu Ala Met Glu Pro Glu Phe Lys Val Tyr Gln
275 280 285
Gln Gln Val Ala Lys Asn Ala Lys Ala Met Val Glu Val Phe Leu Asn
290 295 300
Arg Gly Tyr Lys Val Val Ser Gly Gly Thr Glu Asn His Leu Phe Leu305 310 315 320
Leu Asp Leu Val Asp Lys Asn Leu Thr Gly Lys Glu Ala Asp Ala Ala
325 330 335
Leu Gly Arg Ala Asn Ile Thr Val Asn Lys Asn Ser Val Pro Asn Asp
340 345 350
Pro Lys Ser Pro Phe Val Thr Ser Gly Ile Arg Ile Gly Ser Pro Ala
355 360 365
Val Thr Arg Arg Gly Phe Lys Glu Ala Glu Val Lys Glu Leu Ala Gly
370 375 380
Trp Met Cys Asp Val Leu Asp Asn Ile Asn Asp Glu Ala Thr Ile Glu385 390 395 400
Arg Val Lys Ala Lys Val Leu Asp Ile Cys Ala Arg Phe Pro Val Tyr405 410 415
Ala<210> 99<211> 1308<212> DNA
<213> Vibrio cholerae
<220>
<221> CDS
<222> (1) .. (1308)
<400> 99
atg aat gca aat cta aac aaa gct tat ccc aac gtt age ctt gag aac 48
Met Asn Ala Asn Leu Asn Lys Ala Tyr Pro Asn Val Ser Leu Glu Asn1 5 10 15
ttc ttc tet acc cca ctg gcg gcg acc aac gat gcg gta ttt gcc gcc 96
Phe Phe Ser Thr Pro Leu Ala Ala Thr Asn Asp Ala Val Phe Ala Ala
20 25 30
att caa gct gaa tac acc cgc caa aat gaa cag ate gaa ctg att gcc 144
Ile Gln Ala Glu Tyr Thr Arg Gln Asn Glu Gln Ile Glu Leu Ile Ala
35 40 45
tet gaa aac ate gtc tet aaa gcc gta atg cag gcg caa ggc act tgc 192
Ser Glu Asn Ile Val Ser Lys Ala Val Met Gln Ala Gln Gly Thr Cys
50 55 60
ctg act aac aaa tac gcc gaa ggt tat ccc ggc cgt cgt tac tac ggc 240
Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Arg Arg Tyr Tyr Gly65 70 75 80
ggt tgt gag cat gtt gac age gtt gag cag att gct ate gaa cgc gcc 288
Gly Cys Glu His Val Asp Ser Val Glu Gln Ile Ala Ile Glu Arg Ala
85 90 95
aaa atg ctt ttt cag tgt caa tac gca aac gtt caa cca cac tca ggc 336
Lys Met Leu Phe Gln Cys Gln Tyr Ala Asn Val Gln Pro His Ser Gly
100 105 110
gct caa gcc aat ggc gct gtg atg ctt gct ctg ctg caa ccg ggc gac 384
Ala Gln Ala Asn Gly Ala Val Met Leu Ala Leu Leu Gln Pro Gly Asp
115 120 125
act att atg ggt atg tcg cta gat gca ggc ggt cat ctc acg cat ggt 432
Thr Ile Met Gly Met Ser Leu Asp Ala Gly Gly His Leu Thr His Gly
130 135 140
gcg cgc cct gct ctt tca ggt aaa tgg ttc aat gcg gtg caa tac ggt 480
Ala Arg Pro Ala Leu Ser Gly Lys Trp Phe Asn Ala Val Gln Tyr Gly145 150 155 160
gtg gat cgc caa acc ctc gaa att aac tac gat tet gtt cgt gca ctg 528
Val Asp Arg Gln Thr Leu Glu Ile Asn Tyr Asp Ser Val Arg Ala Leu
165 170 175
gcg tta gag cac aaa ccc aaa atg ate ate gca gge ggc agt gcc att 576
Ala Leu Glu His Lys Pro Lys Met Ile Ile Ala Gly Gly Ser Ala Ile
180 185 190
ccc cgc act ate gat ttt gct caa ttt cgc tca att gtg gac gaa gtt 624
Pro Arg Thr Ile Asp Phe Ala Gln Phe Arg Ser Ile Val Asp Glu Val
195 200 205
ggc gcg ctg ttg atg gtc gat atg gcg cac att gcc gga ttg gta gca 672
Gly Ala Leu Leu Met Val Asp Met Ala His Ile Ala Gly Leu Val Ala
210 215 220
act ggc gca cat cca age cca ttg ccg cat gct cat gtc gtc acc act 720
Thr Gly Ala His Pro Ser Pro Leu Pro His Ala His Val Val Thr Thr225 230 235 240
acc aca cac aaa act cta cgt ggc ccg cgc ggc ggc atg att ttg acc 768
Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Met Ile Leu Thr
245 250 255
aac age gaa gag ate cac aaa aag ate aat tet gcg gtg ttc ccc ggt 816
Asn Ser Glu Glu Ile His Lys Lys Ile Asn Ser Ala Val Phe Pro Gly
260 265 270
tta caa ggt ggc cca ctg atg cac gtg att gcc gct aaa gca gtg gca 864Leu Gln Gly Gly Pro Leu Met His Val Ile Ala Ala Lys Ala Val Ala
275 280 285
ttt ggt gaa gcg ctc ggc cct gaa ttc cgt act tat att gat tcg gtg 912
Phe Gly Glu Ala Leu Gly Pro Glu Phe Arg Thr Tyr Ile Asp Ser Val
290 295 300
ate gat aac gea aaa gtg ctg gct gaa gtg ttg caa act cgc ggg tgt 960
Ile Asp Asn Ala Lys Val Leu Ala Glu Val Leu Gln Thr Arg Gly Cys305 310 315 320
gac att gtg act ggc gga acg gat acg cat ctc atg ttg gtc gac ctt1008
Asp Ile Val Thr Gly Gly Thr Asp Thr His Leu Met Leu Val Asp Leu
325 330 335
aga cct aaa ggt ttg aaa ggc aac caa gtt gaa caa gcc tta gag cgt1056
Arg Pro Lys Gly Leu Lys Gly Asn Gln Val Glu Gln Ala Leu Glu Arg
340 345 350
gcc ggg ate acg tgt aac aaa aat ggc ate cca ttt gac gaa gag aag1104
Ala Gly Ile Thr Cys Asn Lys Asn Gly Ile Pro Phe Asp Glu Glu Lys
355 360 365
cct atg att aca tcg ggc att cgt tta ggt acg cct gcc gga acc age1152
Pro Met Ile Thr Ser Gly Ile Arg Leu Gly Thr Pro Ala Gly Thr Ser
370 375 380
cgt ggt ttc ggt cgt gaa gaa ttc aaa ctc ate ggt gag tgg att ggg1200
Arg Gly Phe Gly Arg Glu Glu Phe Lys Leu Ile Gly Glu Trp Ile Gly385 390 395 400
gac gtt ctg gat ggt ttg gtg gcc age cca gaa ggc aac cca gac gtt1248
Asp Val Leu Asp Gly Leu Val Ala Ser Pro Glu Gly Asn Pro Asp Val
405 410 415
gag caa caa gtg cgt aaa caa gtg aaa gea ctg tgc caa cgc ttc ccg1296
Glu Gln Gln Val Arg Lys Gln Val Lys Ala Leu Cys Gln Arg Phe Pro
420 425 430
ctc tat caa tag1308
Leu Tyr Gln435
<210> 100<211> 435<212> PRT
<213> Vibrio cholerae
<400> 100
Met Asn Ala Asn Leu Asn Lys Ala Tyr Pro Asn Val Ser Leu Glu Asn15 10 15
Phe Phe Ser Thr Pro Leu Ala Ala Thr Asn Asp Ala Val Phe Ala Ala
20 25 30
Ile Gln Ala Glu Tyr Thr Arg Gln Asn Glu Gln Ile Glu Leu Ile Ala
35 40 45
Ser Glu Asn Ile Val Ser Lys Ala Val Met Gln Ala Gln Gly Thr Cys
50 55 60
Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Arg Arg Tyr Tyr Gly65 70 75 80
Gly Cys Glu His Val Asp Ser Val Glu Gln Ile Ala Ile Glu Arg Ala
85 90 95
Lys Met Leu Phe Gln Cys Gln Tyr Ala Asn Val Gln Pro His Ser Gly
100 105 110
Ala Gln Ala Asn Gly Ala Val Met Leu Ala Leu Leu Gln Pro Gly Asp115 120 125Thr Ile Met Gly Met Ser Leu Asp Ala Gly Gly His Leu Thr His Gly
130 135 140
Ala Arg Pro Ala Leu Ser Gly Lys Trp Phe Asn Ala Val Gln Tyr Gly145 150 155 160
Val Asp Arg Gln Thr Leu Glu Ile Asn Tyr Asp Ser Val Arg Ala Leu
165 170 175
Ala Leu Glu His Lys Pro Lys Met Ile Ile Ala Gly Gly Ser Ala Ile
180 185 190
Pro Arg Thr Ile Asp Phe Ala Gln Phe Arg Ser Ile Val Asp Glu Val
195 200 205
Gly Ala Leu Leu Met Val Asp Met Ala His Ile Ala Gly Leu Val Ala
210 215 220
Thr Gly Ala His Pro Ser Pro Leu Pro His Ala His Val Val Thr Thr225 230 235 240
Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Met Ile Leu Thr
245 250 255
Asn Ser Glu Glu Ile His Lys Lys Ile Asn Ser Ala Val Phe Pro Gly
260 265 270
Leu Gln Gly Gly Pro Leu Met His Val Ile Ala Ala Lys Ala Val Ala
275 280 285
Phe Gly Glu Ala Leu Gly Pro Glu Phe Arg Thr Tyr Ile Asp Ser Val
290 295 300
Ile Asp Asn Ala Lys Val Leu Ala Glu Val Leu Gln Thr Arg Gly Cys305 310 315 320
Asp Ile Val Thr Gly Gly Thr Asp Thr His Leu Met Leu Val Asp Leu
325 330 335
Arg Pro Lys Gly Leu Lys Gly Asn Gln Val Glu Gln Ala Leu Glu Arg
340 345 350
Ala Gly Ile Thr Cys Asn Lys Asn Gly Ile Pro Phe Asp Glu Glu Lys
355 360 365
Pro Met Ile Thr Ser Gly Ile Arg Leu Gly Thr Pro Ala Gly Thr Ser
370 375 380
Arg Gly Phe Gly Arg Glu Glu Phe Lys Leu Ile Gly Glu Trp Ile Gly385 390 395 400
Asp Val Leu Asp Gly Leu Val Ala Ser Pro Glu Gly Asn Pro Asp Val
405 410 415
Glu Gln Gln Val Arg Lys Gln Val Lys Ala Leu Cys Gln Arg Phe Pro420 425 430
Leu Tyr Gln435
<210> 101<211> 1254<212> DNA
<213> Yersinia pestis
<220>
<221> CDS
<222> (1).. (1254)
<400> 101atg tta aag cgtMet Leu Lys Arg1
cgt gca atg gagArg Ala Met Glu20
att gcg tct gagIle Ala Ser Glu35
tct cag tta acgSer Gln Leu Thr50
gaa atg aac attGlu Met Asn Ile5
caa gaa gtc gtgGln Glu Val Val
aac tac acc ageAsn Tyr Thr Ser40
aac aaa tat gctAsn Lys Tyr Ala55
gcc gat tac gatAla Asp Tyr Asp10
cgt cag gaa gaaArg Gln Glu Glu25
ccg cgt gtt atgPro Arg Val Met
gaa ggc tat ccaGlu Gly Tyr Pro60
gca gat ctg tggAla Asp Leu Trp15
cac ate gaa ctgHis Ile Glu Leu30
caa gcg cag ggaGln Ala Gln Gly45
ggc aag cgt tatGly Lys Arg Tyrtac ggt ggc tgt gaa tat gtt gat gtt gtt gaa caa ttg gea ate gat 240Tyr Gly Gly Cys Glu Tyr Val Asp Val Val Glu Gln Leu Ala Ile Asp 65 70 75 80 cgc gct aaa gea tta ttt ggt gct gat tac gea aac gtt caa cct cat 288Arg Ala Lys Ala Leu Phe Gly Ala Asp Tyr Ala Asn Val Gln Pro His 85 90 95 tct ggt tcg caa gct aac gtt gct gtt tac tcc gcg ctg ctg aaa CCC 336Ser Gly Ser Gln 100 Ala Asn Val Ala Val 105 Tyr Ser Ala Leu Leu 110 Lys Pro ggt gac acc gta ttg ggg atg aat ctg gea cac ggc ggt cac ttg acg 384Gly Asp Thr 115 Val Leu Gly Met Asn 120 Leu Ala His Gly Gly 125 His Leu Thr cat ggt tca cca gtg aac ttc tcc ggc aaa ctc tac aac ate gtc cct 432His Gly 130 Ser Pro Val Asn Phe 135 Ser Gly Lys Leu Tyr 140 Asn Ile Val Pro tat ggt att gat gag tcg ggt caa att gat tat gaa gat ctg gea cgt 480Tyr Gly Ile Asp Glu Ser Gly Gln Ile Asp Tyr Glu Asp Leu Ala Arg 145 150 155 160 cag gea gaa ata cat aaa CCC aaa atg att ate ggt ggc ttc tcc gcc 528Gln Ala Glu Ile His 165 Lys Pro Lys Met Ile 170 Ile Gly Gly Phe Ser 175 Ala tat tct ggt ate gtt gat tgg gea aaa atg cgt gaa att gcc gac age 576Tyr Ser Gly Ile Val Asp Trp Ala Lys Met Arg Glu Ile Ala Asp Ser 180 185 190 att gac gea tgg ttc ttt gtt gat atg gct cat gtt gct ggt ctg gtt 624Ile Asp Ala Trp Phe Phe Val Asp Met Ala His Val Ala Gly Leu Val 195 200 205 gct gcg ggg gtt tat cct aac ccg gtt cca cat gcc cac ate gtt acc 672Ala Ala Gly Val Tyr Pro Asn Pro Val Pro His Ala His Ile Val Thr 210 215 220 acc acg acg cac aag act ctg gct ggc cca cgt ggc ggt ttg att ctg 720Thr Thr Thr His Lys Thr Leu Ala Gly Pro Arg Gly Gly Leu Ile Leu 225 230 235 240 gcg aaa ggg ggc gat gaa gac ttg tac aaa aaa ctg aac tct tct gtt 768Ala Lys Gly Gly Asp 245 Glu Asp Leu Tyr Lys 250 Lys Leu Asn Ser Ser 255 Val ttc cct ggt aac cag ggt ggc cca ttg atg cat gtt ate gea ggt aaa 816Phe Pro Gly Asn Gln Gly Gly Pro Leu Met His Val Ile Ala Gly Lys 260 265 270 gcg gtc gcg ctg aaa gaa gea atg gaa cct gag ttt aaa att tac caa 864Ala Val Ala 275 Leu Lys Glu Ala Met 280 Glu Pro Glu Phe Lys 285 Ile Tyr Gln cag caa gtg gct aaa aat gcg aaa gcc atg gtg gcg gtg ttc ttg gag 912Gln Gln 290 Val Ala Lys Asn Ala 295 Lys Ala Met Val Ala 300 Val Phe Leu Glu cgc ggt tac aaa gtg gtt tct ggt ggt acg gat aac cac ctg ttc ttg 960Arg Gly Tyr Lys Val Val Ser Gly Gly Thr Asp Asn His Leu Phe Leu 305 310 315 320 cta gat ttg gtg gat aaa gac ate acc ggt aaa gac gct gat gcg gct 1008 Leu Asp Leu Val Asp Lys Asp Ile Thr Gly Lys Asp Ala Asp Ala Ala 325 330 335 tta ggc cgt gcg aat ate acc gtg aac aaa aac age gta cct aac gat 1056 Leu Gly Arg Ala Asn Ile Thr Val Asn Lys Asn Ser Val Pro Asn Asp 340 345 350 ccg aag age ccg ttt gtg aca tct ggt gtg cgt att ggt age cca gcg 1104 Pro Lys Ser Pro Phe Val Thr Ser Gly Val Arg Ile Gly Ser Pro Ala 355 360 365 ate acc cgc cgt ggc ttc aaa gaa gcg gaa tcc cgt gaa ttg gct ggc 1152 Ile Thr Arg Arg Gly Phe Lys Glu Ala Glu Ser Arg Glu Leu Ala Gly370 375 380 tgg atg tgt gat gtg tta gat aac ate aac gat gaa gcg acc att gag1200 Trp Met Cys Asp Val Leu Asp Asn Ile Asn Asp Glu Ala Thr Ile Glu385 390 395 400cgt gtg aaa cag aaa gtt ctg gct ate tgc gct cgt tta ccg gtt tac1248 Arg Val Lys Gln Lys Val Leu Ala Ile Cys Ala Arg Leu Pro Val Tyr 405 410 415 gca taa
1254Ala
<210> 102<211> 417<212> PRT
<213> Yersinia pestis
<400> 102
Met Leu Lys Arg Glu Met Asn Ile Ala Asp Tyr Asp Ala Asp Leu Trp1 5 10 15 Arg Ala Met Glu 20 Gln Glu Val Val Arg 25 Gln Glu Glu His Ile 30 Glu LeuIle Ala Ser Glu Asn Tyr Thr Ser Pro Arg Val Met Gln Ala Gln Gly 35 40 45 Ser Gln Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr 50 55 60 Tyr Gly Gly Cys Glu Tyr Val Asp Val Val Glu Gln Leu Ala Ile Asp65 70 75 80Arg Ala Lys Ala Leu Phe Gly Ala Asp Tyr Ala Asn Val Gln Pro His 85 90 95 Ser Gly Ser Gln 100 Ala Asn Val Ala Val 105 Tyr Ser Ala Leu Leu 110 Lys ProGly Asp Thr Val Leu Gly Met Asn Leu Ala His Gly Gly His Leu Thr 115 120 125 His Gly Ser Pro Val Asn Phe Ser Gly Lys Leu Tyr Asn Ile Val Pro 130 135 140 Tyr Gly Ile Asp Glu Ser Gly Gln Ile Asp Tyr Glu Asp Leu Ala Arg 145 150 155 160Gln Ala Glu Ile His Lys Pro Lys Met Ile Ile Gly Gly Phe Ser Ala 165 170 175 Tyr Ser Gly Ile Val Asp Trp Ala Lys Met Arg Glu Ile Ala Asp Ser 180 185 190 Ile Asp Ala Trp Phe Phe Val Asp Met Ala His Val Ala Gly Leu Val 195 200 205 Ala Ala 210 Gly Val Tyr Pro Asn 215 Pro Val Pro His Ala 220 His Ile Val ThrThr Thr Thr His Lys Thr Leu Ala Gly Pro Arg Gly Gly Leu Ile Leu225 230 235 240Ala Lys Gly Gly Asp 245 Glu Asp Leu Tyr Lys 250 Lys Leu Asn Ser Ser 255 ValPhe Pro Gly Asn Gln Gly Gly Pro Leu Met His Val Ile Ala Gly Lys 260 265 270 Ala Val Ala 275 Leu Lys Glu Ala Met 280 Glu Pro Glu Phe Lys Ile 285 Tyr GlnGln Gln 290 Val Ala Lys Asn Ala 295 Lys Ala Met Val Ala 300 Val Phe Leu GluArg Gly Tyr Lys Val Val Ser Gly Gly Thr Asp Asn His Leu Phe Leu305 310 315 320Leu Asp Leu Val Asp Lys Asp Ile Thr Gly Lys Asp Ala Asp Ala Ala 325 330 335 Leu Gly Arg Ala Asn Ile Thr Val Asn Lys Asn Ser Val Pro Asn Asp340 345 350 Pro Lys Ser 355 Pro Phe Val Thr Ser 360 Gly Val Arg Ile Gly 365 Ser Pro AlaIle Thr Arg Arg Gly Phe Lys Glu Ala Glu Ser Arg Glu Leu Ala Gly 370 375 380 Trp Met Cys Asp Val Leu Asp Asn Ile Asn Asp Glu Ala Thr Ile Glu385 390 395 400Arg Val Lys Gln Lys 405 Val Leu Ala Ile Cys 410 Ala Arg Leu Pro Val 415 TyrAla
<210> 103<211> 1266<212> DNA
<213> Alloiococcus otitis
<220>
<221> CDS
<222> (31)..(1266)
<400> 103
tggtgtggta agatagagga ggaaacagga atg acc aag caa tat ttt gac aaa 54
Met Thr Lys Gln Tyr Phe Asp Lys1 5
gaa att ttt gca aca att gag aag gag agg caa aga caa gaa gac aat 102
Glu Ile Phe Ala Thr Ile Glu Lys Glu Arg Gln Arg Gln Glu Asp Asn
10 15 20
att gaa ttg att gct tct gaa aac ttt gtc tct gaa gaa gtt tta cag 150
Ile Glu Leu Ile Ala Ser Glu Asn Phe Val Ser Glu Glu Val Leu Gln25 30 35 40
gct caa ggg tct att ttg acc aac aag tac gca gaa ggc tac cct ggc 198
Ala Gln Gly Ser Ile Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly
45 50 55
aaa cgc tat tat ggg ggc tgt gaa ttt gtc gat gtc ate gag cag ttg 246
Lys Arg Tyr Tyr Gly Gly Cys Glu Phe Val Asp Val Ile Glu Gln Leu
60 65 70
gcc ata gac cgg gtc aaa gac ttg ttc gaa gct gat tat gcc aat gtc 294
Ala Ile Asp Arg Val Lys Asp Leu Phe Glu Ala Asp Tyr Ala Asn Val
75 80 85
caa ccc cac tcc ggg tcc cag gcc aat aac gcc gtc ttc caa gcc ctg 342
Gln Pro His Ser Gly Ser Gln Ala Asn Asn Ala Val Phe Gln Ala Leu
90 95 100
ctc cag cct ggg gac act tac ttg ggt atg gac ttg age cac ggg ggg 390
Leu Gln Pro Gly Asp Thr Tyr Leu Gly Met Asp Leu Ser His Gly Gly105 110 115 120
cac tta acc cac ggg tct ccg gtt aac ttt tct ggc att ttg tat cat 438
His Leu Thr His Gly Ser Pro Val Asn Phe Ser Gly Ile Leu Tyr His
125 130 135
gct gtc cac tac gga gtt aac aag gaa aca gaa cta att gac tac gac 486
Ala Val His Tyr Gly Val Asn Lys Glu Thr Glu Leu Ile Asp Tyr Asp
140 145 150
caa gtc cgc caa ctc gcc ata gac cac cag cca aag atg ate att gct 534
Gln Val Arg Gln Leu Ala Ile Asp His Gln Pro Lys Met Ile Ile Ala
155 160 165
ggc tac tcg gcc tat cca agg gag ttg gac ttt aag aag ttt aga gac 582
Gly Tyr Ser Ala Tyr Pro Arg Glu Leu Asp Phe Lys Lys Phe Arg Asp
170 175 180
att gct gac gag gtt ggt gcc tat ctg atg gtg gat atg gcc cac ttt 630
Ile Ala Asp Glu Val Gly Ala Tyr Leu Met Val Asp Met Ala His Phe185 190 195 200
gct ggt tta gtc gca gca ggc gtc tat cct gac cct gtt cct tat gcg 678
Ala Gly Leu Val Ala Ala Gly Val Tyr Pro Asp Pro Val Pro Tyr Ala205 210 215 gat gtc ate acc tet act acc cac aag acc ttg cgg gga CCt cgg ggaAsp Val Ile Thr Ser Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly 220 225 230 ggc tta ate cta gcc aag gca aaa tat gct aaa aaa tta aac tcg gctGly Leu Ile 235 Leu Ala Lys Ala Lys 240 Tyr Ala Lys Lys Leu 245 Asn Ser Alaatt ttt CCC ggt age cag ggc ggt CCC ttg gaa cac gtg att gct gggIle Phe 250 Pro Gly Ser Gln Gly 255 Gly Pro Leu Glu His 260 Val Ile Ala Glyaag gca gtg gcc ttt tta gaa gct gcc cag cct gcc ttt aaa gac tatLys Ala Val Ala Phe Leu Glu Ala Ala Gln Pro Ala Phe Lys Asp Tyr265 270 275 280gct aag eag att aaa aag aat gcc aaa gct atg gca gag gtt ttt gccAla Lys Gln Ile Lys 285 Lys Asn Ala Lys Ala 290 Met Ala Glu Val Phe 295 Alacaa tca gac aag gcc cga ctg ate tcg aat gga acg gac aac cac ttgGln Ser Asp Lys Ala Arg Leu Ile Ser Asn Gly Thr Asp Asn His Leu 300 305 310 etc ctc Ctt gat gta aca ggt ttt ggc Ctt acc ggt aaa gag gcc gag1014 Leu Leu Leu 315 Asp Val Thr Gly Phe 320 Gly Leu Thr Gly Lys 325 Glu Ala Gluaag Ctt tta gac cag gcc aaa att acc gtt aat aaa aac acc att cct1062 Lys Leu 330 Leu Asp Gln Ala Lys 335 Ile Thr Val Asn Lys 340 Asn Thr Ile Prottt gaa acc cgg tca cca caa gtg acg tet ggt ate cgc tta ggg aca1110 Phe Glu Thr Arg Ser Pro Gln Val Thr Ser Gly Ile Arg Leu Gly Thr345 350 355 360ccg gct gtg acc act cgg ggc ttc aaa gaa gaa gat tgc cag caa gtt1158 Pro Ala Val Thr Thr Arg Gly Phe Lys Glu Glu Asp Cys Gln Gln Val 365 370 375 gcc cgt ttg att ate caa gca ttg gaa tca aat gac caa gaa gag gtc1206 Ala Arg Leu Ile Ile Gln Ala Leu Glu Ser Asn Asp Gln Glu Glu Val 380 385 390 etc gac caa gtt cgt caa ggt gta gcc aac tta acc aag gct ate cca1254 Leu Asp Gln Val Arg Gln Gly Val Ala Asn Leu Thr Lys Ala Ile Pro 395 400 405 cta tac aaa taa 1266 Leu Tyr Lys
410
<210> 104<211> 411<212> PRT
<213> Alloiococcus otitis
<400> 104
Met Thr Lys Gln Tyr Phe Asp Lys Glu Ile Phe Ala Thr Ile Glu Lys1 5 10 15 Glu Arg Gln Arg Gln Glu Asp Asn Ile Glu Leu Ile Ala Ser Glu Asn 20 25 30 Phe Val Ser 35 Glu Glu Val Leu Gln 40 Ala Gln Gly Ser Ile 45 Leu Thr AsnLys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr Tyr Gly Gly Cys Glu 50 55 60 Phe Val Asp Val Ile Glu Gln Leu Ala Ile Asp Arg Val Lys Asp Leu
\65 70 75 80Phe Glu Ala Asp Tyr Ala Asn Val Gln Pro His Ser Gly Ser Gln Ala 85 90 95 Asn Asn Ala Val Phe Gln Ala Leu Leu Gln Pro Gly Asp Thr Tyr Leu 100 105 110 Gly Met Asp Leu Ser His Gly Gly His Leu Thr His Gly Ser Pro Val 115 120 125 Asn Phe Ser Gly Ile Leu Tyr His Ala Val His Tyr Gly Val Asn Lys 130 135 140 Glu Thr Glu Leu Ile Asp Tyr Asp Gln Val Arg Gln Leu Ala Ile Asp145 150 155 160His Gln Pro Lys Met 165 Ile Ile Ala Gly Tyr 170 Ser Ala Tyr Pro Arg 175 GluLeu Asp Phe Lys Lys Phe Arg Asp Ile Ala Asp Glu Val Gly Ala Tyr 180 185 190 Leu Met Val Asp Met Ala His Phe Ala Gly Leu Val Ala Ala Gly Val 195 200 205 Tyr Pro Asp Pro Val Pro Tyr Ala Asp Val Ile Thr Ser Thr Thr His 210 215 220 Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile Leu Ala Lys Ala Lys225 230 235 240Tyr Ala Lys Lys Leu 245 Asn Ser Ala Ile Phe 250 Pro Gly Ser Gln Gly 255 GlyPro Leu Glu His Val Ile Ala Gly Lys Ala Val Ala Phe Leu Glu Ala 260 265 270 Ala Gln Pro Ala Phe Lys Asp Tyr Ala Lys Gln Ile Lys Lys Asn Ala 275 280 285 Lys Ala Met Ala Glu Val Phe Ala Gln Ser Asp Lys Ala Arg Leu Ile 290 295 300 Ser Asn Gly Thr Asp Asn His Leu Leu Leu Leu Asp Val Thr Gly Phe305 310 315 320Gly Leu Thr Gly Lys 325 Glu Ala Glu Lys Leu 330 Leu Asp Gln Ala Lys 335 IleThr Val Asn Lys Asn Thr Ile Pro Phe Glu Thr Arg Ser Pro Gln Val 340 345 350 Thr Ser Gly 355 Ile Arg Leu Gly Thr 360 Pro Ala Val Thr Thr 365 Arg Gly PheLys Glu 370 Glu Asp Cys Gln Gln 375 Val Ala Arg Leu Ile 380 Ile Gln Ala LeuGlu Ser Asn Asp Gln Glu Glu Val Leu Asp Gln Val Arg Gln Gly Val 385 390 395 400Ala Asn Leu Thr Lys 405 Ala Ile Pro Leu Tyr 410 Lys
<210> 105<211> 1835<212> DNA
<213> Nicotiana tabacum
<220>
<221> CDS
<222> (56)..(1612)
<400> 105
gcacccaaaa cacaagtcat ttgggtgtgt gtaacagggg gagaagctca caatt atg 58
Met1
gcc atg gca acg gct ctt cga aga ctt tcc tct tct gtt gac aaa cca 106
Ala Met Ala Thr Ala Leu Arg Arg Leu Ser Ser Ser Val Asp Lys Pro
5 10 15
att aag cgt ctc tat aat ggc ggc tct ctc tat tac atg tca tcg ttg 154
Ile Lys Arg Leu Tyr Asn Gly Gly Ser Leu Tyr Tyr Met Ser Ser Leu20 25 30
\cct aat gaa gct gtt tac gag aag gaa aaa aat ggt gtc acg tgg cca 202
Pro Asn Glu Ala Val Tyr Glu Lys Glu Lys Asn Gly Val Thr Trp Pro
35 40 45
aag caa ctt aat gct cct cta gag gag gtt gat cca gaa att gct gac 250
Lys Gln Leu Asn Ala Pro Leu Glu Glu Val Asp Pro Glu Ile Ala Asp50 55 60 65
att att gag ctt gag aaa gca cgc cag tgg aag gga ctt gaa ctc att 298
Ile Ile Glu Leu Glu Lys Ala Arg Gln Trp Lys Gly Leu Glu Leu Ile
70 75 80
cct tca gaa aat ttc act tct gtg tct gta atg caa gct gtt gga tct 346
Pro Ser Glu Asn Phe Thr Ser Val Ser Val Met Gln Ala Val Gly Ser
85 90 95
gtt atg aca aac aag tac agt gaa gga tac cct ggg gct aga tac tat 394
Val Met Thr Asn Lys Tyr Ser Glu Gly Tyr Pro Gly Ala Arg Tyr Tyr
100 105 110
gga gga aat gag tat att gac atg gcg gaa acc tta tgc cag aaa cgt 442
Gly Gly Asn Glu Tyr Ile Asp Met Ala Glu Thr Leu Cys Gln Lys Arg
115 120 125
gct tta gaa gcc ttc agg ttg gat cct gca aaa tgg gga gtg aat gtg 490
Ala Leu Glu Ala Phe Arg Leu Asp Pro Ala Lys Trp Gly Val Asn Val130 135 140 145
cag cct ctg tca gga tca cct gct aat ttt cat gtt tac act gca ctt 538
Gln Pro Leu Ser Gly Ser Pro Ala Asn Phe His Val Tyr Thr Ala Leu
150 155 160
tta aaa cct cat gaa aga ate atg gcc ctt gat ctt ccc cac ggt gga 586
Leu Lys Pro His Glu Arg Ile Met Ala Leu Asp Leu Pro His Gly Gly
165 170 175
cat ctt tct cat gga tat cag act gat aca aag aag ata tct gcc gtc 634
His Leu Ser His Gly Tyr Gln Thr Asp Thr Lys Lys Ile Ser Ala Val
180 185 190
tct ata ttt ttt gag acc atg cca tat aga ctg aat gag age act ggc 682
Ser Ile Phe Phe Glu Thr Met Pro Tyr Arg Leu Asn Glu Ser Thr Gly
195 200 205
tac att gac tat gac cag ctt gag aaa agt gcc aca ctc ttt agg cca 730
Tyr Ile Asp Tyr Asp Gln Leu Glu Lys Ser Ala Thr Leu Phe Arg Pro210 215 220 225
aag tta att gtc gct ggt gct agt gct tat gca cgt ctt tat gac tat 778
Lys Leu Ile Val Ala Gly Ala Ser Ala Tyr Ala Arg Leu Tyr Asp Tyr
230 ^ 235 240
gca cgt ate cga aag gtt tgt gac aaa cag aag gct ate atg ttg gca 826
Ala Arg Ile Arg Lys Val Cys Asp Lys Gln Lys Ala Ile Met Leu Ala
245 250 255
gat atg gct cat att agt ggg tta gtt gca gct gga gtc ate cca tca 874
Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Gly Val Ile Pro Ser
260 265 270
cca ttt gat tat gca gat gtt gtg acc acc aca acc cac aaa tcc ctt 922
Pro Phe Asp Tyr Ala Asp Val Val Thr Thr Thr Thr His Lys Ser Leu
275 280 285
cgc ggg cct cgt ggt gcc atg att ttc ttc cgg aag ggt gtg aag gag 970
Arg Gly Pro Arg Gly Ala Met Ile Phe Phe Arg Lys Gly Val Lys Glu290 295 300 305
gtt aac aag caa ggc aag gag gtg ttg tac gac tat gaa gat aaa att1018
Val Asn Lys Gln Gly Lys Glu Val Leu Tyr Asp Tyr Glu Asp Lys Ile
310 315 320
aac cag gca gtc ttt ccc gga ctt caa ggt ggt cct cac aac cat aca1066
Asn Gln Ala Val Phe Pro Gly Leu Gln Gly Gly Pro His Asn His Thr
325 330 335
att act ggc ttg gca gtt gct ttg aaa cag gca atg act cca gaa tac1114
Ile Thr Gly Leu Ala Val Ala Leu Lys Gln Ala Met Thr Pro Glu Tyr340 345 350aga gct tac caa gag caa tgc ctt age aac tgc tca aaa ttt gcc cag1162
Arg Ala Tyr Gln Glu Gln Cys Leu Ser Asn Cys Ser Lys Phe Ala Gln
355 360 365
gct tta gcg gga atg ggt tat gaa ctt gtt tet ggt gga aca gag aat1210
Ala Leu Ala Gly Met Gly Tyr Glu Leu Val Ser Gly Gly Thr Glu Asn370 375 380 385
cac ttg gtt ttg gtg aac ttg aaa aac aag ggt att gat ggt tet agg1258
His Leu Val Leu Val Asn Leu Lys Asn Lys Gly Ile Asp Gly Ser Arg
390 395 400
gtt gaa aaa gtt ttg gaa gcg gta cat att gea gcg aat aag aac act1306
Val Glu Lys Val Leu Glu Ala Val His Ile Ala Ala Asn Lys Asn Thr
405 410 415
gtt cct gga gat gta tet gcc atg gtc cct ggt ggc ate aga atg ggg1354
Val Pro Gly Asp Val Ser Ala Met Val Pro Gly Gly Ile Arg Met Gly
420 425 430
act cct gea etc aca tca agg gga ttt att gag gaa gat ttt gtg aaa1402
Thr Pro Ala Leu Thr Ser Arg Gly Phe Ile Glu Glu Asp Phe Val Lys
435 440 445
gtt gct gaa ttc ttt gat gct gct gtg aag ata gea gtg aaa ata aag1450
Val Ala Glu Phe Phe Asp Ala Ala Val Lys Ile Ala Val Lys Ile Lys450 455 460 465
act gaa gct caa gga aca aag ttg aaa gac ttt gtg aca aca cta cag1498
Thr Glu Ala Gln Gly Thr Lys Leu Lys Asp Phe Val Thr Thr Leu Gln
470 475 480
tet age gct tca ate cag tcg gag att gea aaa etc cgc cat ggt gtg1546
Ser Ser Ala Ser Ile Gln Ser Glu Ile Ala Lys Leu Arg His Gly Val
485 490 495
gag gag tat gea aag cag ttc cct aca att ggg ttt gag aag gaa acc1594
Glu Glu Tyr Ala Lys Gln Phe Pro Thr Ile Gly Phe Glu Lys Glu Thr
500 505 510
atg aag tac aaa aac tgagagctcg actgagtata tacacaaggg accaatatcc1649
Met Lys Tyr Lys Asn515
aacatcctca aggtgaatgg gatagacatc caaactgcag ttcgctccca aggattggat1709
tgtcatcttt tactaatact atgtaaaatc cagcagtgtt tggttcccaa gtttgccact1769
ttgtatatta acgattgtaa ttcttctgag gtccttgaaa gcaataaact cctgttgtca1829
cggtaa1835
<210> 106<211> 518<212> PRT
<213> Nicotiana tabacum
<400> 106Met Ala Met Ala Thr Ala Leu Arg Arg Leu Ser Ser Ser Val Asp Lys1 5 10 15
Pro Ile Lys Arg Leu Tyr Asn Gly Gly Ser Leu Tyr Tyr Met Ser Ser
20 25 30
Leu Pro Asn Glu Ala Val Tyr Glu Lys Glu Lys Asn Gly Val Thr Trp
35 40 45
Pro Lys Gln Leu Asn Ala Pro Leu Glu Glu Val Asp Pro Glu Ile Ala
50 55 60
Asp Ile Ile Glu Leu Glu Lys Ala Arg Gln Trp Lys Gly Leu Glu Leu65 70 75 80
Ile Pro Ser Glu Asn Phe Thr Ser Val Ser Val Met Gln Ala Val Gly
85 90 95
Ser Val Met Thr Asn Lys Tyr Ser Glu Gly Tyr Pro Gly Ala Arg Tyr
100 105 110
Tyr Gly Gly Asn Glu Tyr Ile Asp Met Ala Glu Thr Leu Cys Gln Lys
115 120 125
Arg Ala Leu Glu Ala Phe Arg Leu Asp Pro Ala Lys Trp Gly Val Asn
130 135 140
Val Gln Pro Leu Ser Gly Ser Pro Ala Asn Phe His Val Tyr Thr Ala145 150 155 160
Leu Leu Lys Pro His Glu Arg Ile Met Ala Leu Asp Leu Pro His Gly
165 170 175
Gly His Leu Ser His Gly Tyr Gln Thr Asp Thr Lys Lys Ile Ser Ala
180 185 190
Val Ser Ile Phe Phe Glu Thr Met Pro Tyr Arg Leu Asn Glu Ser Thr
195 200 205
Gly Tyr Ile Asp Tyr Asp Gln Leu Glu Lys Ser Ala Thr Leu Phe Arg
210 215 220
Pro Lys Leu Ile Val Ala Gly Ala Ser Ala Tyr Ala Arg Leu Tyr Asp225 230 235 240
Tyr Ala Arg Ile Arg Lys Val Cys Asp Lys Gln Lys Ala Ile Met Leu
245 250 255
Ala Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Gly Val Ile Pro
260 265 270
Ser Pro Phe Asp Tyr Ala Asp Val Val Thr Thr Thr Thr His Lys Ser
275 280 285
Leu Arg Gly Pro Arg Gly Ala Met Ile Phe Phe Arg Lys Gly Val Lys
290 295 300
Glu Val Asn Lys Gln Gly Lys Glu Val Leu Tyr Asp Tyr Glu Asp Lys305 310 315 320
Ile Asn Gln Ala Val Phe Pro Gly Leu Gln Gly Gly Pro His Asn His
325 330 335
Thr Ile Thr Gly Leu Ala Val Ala Leu Lys Gln Ala Met Thr Pro Glu
340 345 350
Tyr Arg Ala Tyr Gln Glu Gln Cys Leu Ser Asn Cys Ser Lys Phe Ala
355 360 365
Gln Ala Leu Ala Gly Met Gly Tyr Glu Leu Val Ser Gly Gly Thr Glu
370 375 380
Asn His Leu Val Leu Val Asn Leu Lys Asn Lys Gly Ile Asp Gly Ser385 390 395 400
Arg Val Glu Lys Val Leu Glu Ala Val His Ile Ala Ala Asn Lys Asn
405 410 415
Thr Val Pro Gly Asp Val Ser Ala Met Val Pro Gly Gly Ile Arg Met
420 425 430
Gly Thr Pro Ala Leu Thr Ser Arg Gly Phe Ile Glu Glu Asp Phe Val
435 440 445
Lys Val Ala Glu Phe Phe Asp Ala Ala Val Lys Ile Ala Val Lys Ile
450 455 460
Lys Thr Glu Ala Gln Gly Thr Lys Leu Lys Asp Phe Val Thr Thr Leu465 470 475 480
Gln Ser Ser Ala Ser Ile Gln Ser Glu Ile Ala Lys Leu Arg His Gly
485 490 495
Val Glu Glu Tyr Ala Lys Gln Phe Pro Thr Ile Gly Phe Glu Lys Glu
\500 505 510
Thr Met Lys Tyr Lys Asn515
<210> 107<211> 1239<212> DNA
<213> Staphylococcus aureus
<220>
<221> CDS
<222> (1)..(1239)
<400> 107
atg tct tat ate acc aag caa gat aaa gtt ate gca gaa gca ate gag 48
Met Ser Tyr Ile Thr Lys Gln Asp Lys Val Ile Ala Glu Ala Ile Glu15 10 15
aga gaa ttt cag aga caa aat age aac ata gag tta ate gca tcg gaa 96
Arg Glu Phe Gln Arg Gln Asn Ser Asn Ile Glu Leu Ile Ala Ser Glu
20 25 30
aat ttt gta tcg gaa gcg gtt atg gaa gca caa ggt tca gtg ttg act 144
Asn Phe Val Ser Glu Ala Val Met Glu Ala Gln Gly Ser Val Leu Thr
35 40 45
aat aag tat gct gaa ggc tat cca gga cgc cga tat tat ggt ggc tgt 192
Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Arg Arg Tyr Tyr Gly Gly Cys
50 55 60
gag ttt gta gat gtt act gaa age ate gca att gat cgt gct aaa gca 240
Glu Phe Val Asp Val Thr Glu Ser Ile Ala Ile Asp Arg Ala Lys Ala65 70 75 80
ttg ttt gga gct gaa cat gtc aat gtt caa cca cat tca ggt tca caa 288
Leu Phe Gly Ala Glu His Val Asn Val Gln Pro His Ser Gly Ser Gln
85 90 95
gcg aac atg gct gtt tac tta gtt gca tta gaa atg ggc gac aca gtt 336
Ala Asn Met Ala Val Tyr Leu Val Ala Leu Glu Met Gly Asp Thr Val
100 105 110
tta ggt atg aat ttg agt cat ggt ggt cac ttg aca cat gga gcg cct 384
Leu Gly Met Asn Leu Ser His Gly Gly His Leu Thr His Gly Ala Pro
115 120 125
gtt aat ttt agt ggt aaa ttc tac aat ttc gtt gaa tat gga gta gat 432
Val Asn Phe Ser Gly Lys Phe Tyr Asn Phe Val Glu Tyr Gly Val Asp
130 135 140
aaa gac aca gaa cga ate aat tat gat gaa gtt cgt aaa tta gcg gta 480
Lys Asp Thr Glu Arg Ile Asn Tyr Asp Glu Val Arg Lys Leu Ala Val145 150 155 160
gag cat aag cct aag ctt att gtg gca gga gca tca gca tat tca aga 528
Glu His Lys Pro Lys Leu Ile Val Ala Gly Ala Ser Ala Tyr Ser Arg
165 170 175
aca att gac ttc aaa aag ttt aaa gaa ate gca gat gaa gta aac gct 576
Thr Ile Asp Phe Lys Lys Phe Lys Glu Ile Ala Asp Glu Val Asn Ala
180 185 190
aag tta atg gta gac atg gca eat att gca gga tta gta gcg gca ggt 624
Lys Leu Met Val TVsp Met Ala His Ile Ala Gly Leu Val Ala Ala Gly
195 200 205
tta cat cca aat cca gta gaa tat gct gat ttt gta aca act aca aca 672
Leu His Pro Asn Pro Val Glu Tyr Ala Asp Phe Val Thr Thr Thr Thr
210 215 220
cac aaa aca tta cgc gga cca cgt ggt ggt atg att tta tgt aag gaa 720
His Lys Thr Leu Arg Gly Pro Arg Gly Gly Met Ile Leu Cys Lys Glu225 230 235 240
gaa tat aaa aaa gac ata gat aaa aca att ttc cct ggt att caa ggt 768
Glu Tyr Lys Lys Asp Ile Asp Lys Thr Ile Phe Pro Gly Ile Gln Gly
245 250 255
gga cct ctt gag cat gtt att gca gca aaa gca gtt gct ttt gga gaa 816Gly Pro Leu Glu His Val Ile Ala Ala Lys Ala Val Ala Phe Gly Glu
260 265 270
gcg tta gaa aat aat ttc aaa acg tat caa caa caa gtg gtt aaa aac 864
Ala Leu Glu Asn Asn Phe Lys Thr Tyr Gln Gln Gln Val Val Lys Asn
275 280 285
gca aaa gtt ctt gca gaa gca tta att aat gaa gga ttt aga att gtt 912
Ala Lys Val Leu Ala Glu Ala Leu Ile Asn Glu Gly Phe Arg Ile Val
290 295 300
tct ggc ggt aca gat aat cac tta gta gct gtt gat gta aaa ggg tct 960
Ser Gly Gly Thr Asp Asn His Leu Val Ala Val Asp Val Lys Gly Ser305 310 315 320
ata gga ctt act ggt aaa gaa gct gaa gag act tta gat tca gtt ggt1008
Ile Gly Leu Thr Gly Lys Glu Ala Glu Glu Thr Leu Asp Ser Val Gly
325 330 335
ate aca tgt aac aaa aat acc att ccg ttc gat caa gaa aaa cct ttt1056
Ile Thr Cys Asn Lys Asn Thr Ile Pro Phe Asp Gln Glu Lys Pro Phe
340 345 350
gta acg agt ggt ata cgt tta ggt aca cct gct gca aca acg cgt gga1104
Val Thr Ser Gly Ile Arg Leu Gly Thr Pro Ala Ala Thr Thr Arg Gly
355 360 365
ttt gat gaa aaa gct ttt gag gaa gtt gca aaa ate ate agt tta gca1152
Phe Asp Glu Lys Ala Phe Glu Glu Val Ala Lys Ile Ile Ser Leu Ala
370 375 380
ttg aaa aat agt aaa gat gaa gaa aaa tta caa caa gct aaa gaa cgc1200
Leu Lys Asn Ser Lys Asp Glu Glu Lys Leu Gln Gln Ala Lys Glu Arg385 390 395 400
gtt gcg aaa tta aca gct gaa tat cct cta tat caa taa1239
Val Ala Lys Leu Thr Ala Glu Tyr Pro Leu Tyr Gln405 410
<210> 108<211> 412<212> PRT
<213> Staphylococcus aureus<400> 108
Met Ser Tyr Ile Thr Lys Gln Asp Lys Val Ile Ala Glu Ala Ile Glu1 5 10 15
Arg Glu Phe Gln Arg Gln Asn Ser Asn Ile Glu Leu Ile Ala Ser Glu
20 25 30Asn Phe Val Ser Glu Ala Val Met Glu Ala Gln Gly Ser Val Leu Thr 35 40 45Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Arg Arg Tyr Tyr Gly Gly Cys 50 55 60 Glu Phe Val Asp Val Thr Glu Ser Ile Ala Ile Asp Arg Ala Lys Ala 65 70 75 80Leu Phe Gly Ala Glu His Val Asn Val Gln Pro His Ser Gly Ser Gln 85 90 95Ala Asn Met Ala Val Tyr Leu Val Ala Leu Glu Met Gly Asp Thr Val 100 105 110Leu Gly Met Asn Leu Ser His Gly Gly His Leu Thr His Gly Ala Pro 115 120 125Val Asn Phe Ser Gly Lys Phe Tyr Asn Phe Val Glu Tyr Gly Val Asp 130 135 140 Lys Asp Thr Glu Arg Ile Asn Tyr Asp Glu Val Arg Lys Leu Ala Val145 150 155 160Glu His Lys Pro Lys Leu Ile Val Ala Gly Ala Ser Ala Tyr Ser Arg
\165 170 175
Thr Ile Asp Phe 180 Lys Lys Phe Lys Glu 185 Ile Ala Asp Glu Val 190 Asn AlaLys Leu Met Val Asp Met Ala His Ile Ala Gly Leu Val Ala Ala Gly 195 200 205 Leu His Pro Asn Pro Val Glu Tyr Ala Asp Phe Val Thr Thr Thr Thr 210 215 220 His Lys Thr Leu Arg Gly Pro Arg Gly Gly Met Ile Leu Cys Lys Glu225 230 235 240Glu Tyr Lys Lys Asp 245 Ile Asp Lys Thr Ile 250 Phe Pro Gly Ile Gln 255 GlyGly Pro Leu Glu His Val Ile Ala Ala Lys Ala Val Ala Phe Gly Glu 260 265 270 Ala Leu Glu 275 Asn Asn Phe Lys Thr 280 Tyr Gln Gln Gln Val 285 Val Lys AsnAla Lys 290 Val Leu Ala Glu Ala 295 Leu Ile Asn Glu Gly 300 Phe Arg Ile ValSer Gly Gly Thr Asp Asn His Leu Val Ala Val Asp Val Lys Gly Ser305 310 315 320Ile Gly Leu Thr Gly Lys Glu Ala Glu Glu Thr Leu Asp Ser Val Gly 325 330 335 Ile Thr Cys Asn 340 Lys Asn Thr Ile Pro 345 Phe Asp Gln Glu Lys 350 Pro PheVal Thr Ser Gly Ile Arg Leu Gly Thr Pro Ala Ala Thr Thr Arg Gly 355 360 365 Phe Asp 370 Glu Lys Ala Phe Glu 375 Glu Val Ala Lys Ile 380 Ile Ser Leu AlaLeu Lys Asn Ser Lys Asp Glu Glu Lys Leu Gln Gln Ala Lys Glu Arg385 390 395 400Val Ala Lys Leu Thr 405 Ala Glu Tyr Pro Leu 410 Tyr Gln
<210> 109<211> 1257<212> DNA
<213> Streptococcus pneumoniae
<220>
<221> CDS
<222> (1).. (1257)
<400> 109 atg att tct gac aaa gat gat ttt aaa gea tat gat gct gat ctc tgg 48Met Ile Ser Asp Lys Asp Asp Phe Lys Ala Tyr Asp Ala Asp Leu Trp 1 5 10 15 aat gct att gcc aca gaa gaa gaa cgc caa caa aat aat ate gag tta 96Asn Ala Ile Ala Thr Glu Glu Glu Arg Gln Gln Asn Asn Ile Glu Leu 20 25 30 att gct tcg gaa aac gta gtt tcc aag gct gtt atg gea gct caa ggg 144Ile Ala Ser Glu Asn Val Val Ser Lys Ala Val Met Ala Ala Gln Gly 35 40 45 tct ate ttg aca aat aaa tat gcc gag ggt tac cca gga cgc cgt tat 192Ser Ile Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Arg Arg Tyr 50 55 60 tat ggt gga act gat gta gta gac gtt gta gag act Ctt gct att gaa 240Tyr Gly Gly Thr Asp Val Val Asp Val Val Glu Thr Leu Ala Ile Glu 65 70 75 80 cgc gea aaa gaa att ttc ggt gct aaa ttt gcc aat gtc caa cca cat 288Arg Ala Lys Glu Ile 85 Phe Gly Ala Lys Phe 90 Ala Asn Val Gln Pro 95 His tca gga age caa gct aac tgt gcg gct tac atg tcc ttg att gag cca 336Ser Gly Ser Gln Ala Asn Cys Ala Ala Tyr Met Ser Leu Ile Glu Pro 100 105 110ggt gat acg gtt atg gga atg gat ttg gca gca ggt gga cac ttg acc 384Gly Asp Thr Val Met Gly Met Asp Leu Ala Ala Gly Gly His Leu Thr 115 120 125 cac gga gct cca gtt age ttc tet ggt caa acc tac aac ttt Ctt tcc 432His Gly Ala Pro Val Ser Phe Ser Gly Gln Thr Tyr Asn Phe Leu Ser 130 135 140 tat agt gtg gat cct gaa acg gaa Ctt ttg gac ttt gat gct ate ttg 480Tyr Ser Val Asp Pro Glu Thr Glu Leu Leu Asp Phe Asp Ala Ile Leu 145 150 155 160 aaa caa gcc caa gaa gta aaa cca aaa ctg att gta gct ggt gct tca 528Lys Gln Ala Gln Glu Val Lys Pro Lys Leu Ile Val Ala Gly Ala Ser 165 170 175 gcc tat tet caa att att gac ttt tca aaa ttc cgt gaa att gca gat 576Ala Tyr Ser Gln 180 Ile Ile Asp Phe Ser 185 Lys Phe Arg Glu Ile 190 Ala Asp gct gtt ggg gct aag Ctt atg gtt gat atg gcc cac ate gct ggc ttg 624Ala Val Gly 195 Ala Lys Leu Met Val 200 Asp Met Ala His Ile 205 Ala Gly Leu gtt gca gct ggt Ctt cac cca age cca gtg cca tac gct cat ate act 672Val Ala Ala Gly Leu His Pro Ser Pro Val Pro Tyr Ala His Ile Thr 210 215 220 aca aca acg acc cac aaa acc Ctt cgt ggt cct cgt ggt ggt ttg att 720Thr Thr Thr Thr His Lys Thr Leu Axg Gly Pro Arg Gly Gly Leu Ile 225 230 235 240 ttg acc aat gat gag gat tta gct aag aaa ate aat tca gct att ttc 768Leu Thr Asn Asp Glu 245 Asp Leu Ala Lys Lys 250 Ile Asn Ser Ala Ile 255 Phe CCt ggt att cag ggt ggt cct ttg gag cat gtt gtg gct gct aag gca 816Pro Gly Ile Gln 260 Gly Gly Pro Leu Glu 265 His Val Val Ala Ala 270 Lys Ala gtt tcc ttc aaa gaa gtt ttg gat cca gct ttc aag gaa tat gct gcc 864Val Ser Phe Lys Glu Val Leu Asp Pro Ala Phe Lys Glu Tyr Ala Ala 275 280 285 aat gta att aag aac age aag gct atg gca gat gte ttc ttg caa gac 912Asn Val Ile Lys Asn Ser Lys Ala Met Ala Asp Val Phe Leu Gln Asp 290 295 300 CCt gat ttc cgt att att tca ggt gga act gaa aac cat ctc ttc Ctt 960Pro Asp Phe Arg Ile Ile Ser Gly Gly Thr Glu Asn His Leu Phe Leu 305 310 315 320 gtt gat gtg act aag gtt gta gaa aac gga aaa gtt gct caa aac ttg 1008 Val Asp Val Thr Lys Val Val Glu Asn Gly Lys Val Ala Gln Asn Leu 325 330 335 ctg gat gaa gtc aat att acc cta aat aaa aat tca ate cct tac gaa 1056 Leu Asp Glu Val 340 Asn Ile Thr Leu Asn 345 Lys Asn Ser Ile Pro 350 Tyr Glu acc ttg tca cca ttc aag aca agt ggg att cgt ate gga gca gca gct 1104 Thr Leu Ser Pro Phe Lys Thr Ser Gly Ile Arg Ile Gly Ala Ala Ala 355 360 365 att act gca cgt gga ttt ggt gaa gaa gaa agt cgc aaa gtg gct gaa 1152 Ile Thr Ala Arg Gly Phe Gly Glu Glu Glu Ser Arg Lys Val Ala Glu 370 375 380 ctc ate att aaa acc Ctt aag aat tca gaa aat gag gct gta tta gaa 1200 Leu Ile Ile Lys Thr Leu Lys Asn Ser Glu Asn Glu Ala Val Leu Glu 385 390 395 400 gaa gtg aga agt gca gtc aaa gaa ttg aca gat gcc ttc cca tta tac 1248 Glu Val Arg Ser Ala Val Lys Glu Leu Thr Asp Ala Phe Pro Leu Tyr
405 410 415gag gaa taa
1257
Glu Glu
<210> 110<211> 418<212> PRT
<213> Streptococcus pneumoniae
<400> 110 Met Ile Ser Asp Lys Asp Asp Phe Lys Ala Tyr Asp Ala Asp Leu Trp1 5 10 15 Asn Ala Ile Ala 20 Thr Glu Glu Glu Arg 25 Gln Gln Asn Asn Ile Glu 30 LeuIle Ala Ser Glu Asn Val Val Ser Lys Ala Val Met Ala Ala Gln Gly 35 40 45 Ser Ile Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Arg Arg Tyr 50 55 60 Tyr Gly Gly Thr Asp Val Val Asp Val Val Glu Thr Leu Ala Ile Glu65 70 75 80Arg Ala Lys Glu Ile Phe Gly Ala Lys Phe Ala Asn Val Gln Pro His 85 90 95 Ser Gly Ser Gln Ala Asn Cys Ala Ala Tyr Met Ser Leu Ile Glu Pro 100 105 110 Gly Asp Thr Val Met Gly Met Asp Leu Ala Ala Gly Gly His Leu Thr 115 120 125 His Gly 130 Ala Pro Val Ser Phe 135 Ser Gly Gln Thr Tyr 140 Asn Phe Leu SerTyr Ser Val Asp Pro Glu Thr Glu Leu Leu Asp Phe Asp Ala Ile Leu145 150 155 160Lys Gln Ala Gln Glu 165 Val Lys Pro Lys Leu 170 Ile Val Ala Gly Ala 175 SerAla Tyr Ser Gln 180 Ile Ile Asp Phe Ser 185 Lys Phe Arg Glu Ile Ala 190 AspAla Val Gly Ala Lys Leu Met Val Asp Met Ala His Ile Ala Gly Leu 195 200 205 Val Ala Ala Gly Leu His Pro Ser Pro Val Pro Tyr Ala His Ile Thr 210 215 220 Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile225 230 235 240Leu Thr Asn Asp Glu Asp Leu Ala Lys Lys Ile Asn Ser Ala Ile Phe 245 250 255 Pro Gly Ile Gln 260 Gly Gly Pro Leu Glu 265 His Val Val Ala Ala Lys 270 AlaVal Ser Phe Lys Glu Val Leu Asp Pro Ala Phe Lys Glu Tyr Ala Ala 275 280 285 Asn Val Ile Lys Asn Ser Lys Ala Met Ala Asp Val Phe Leu Gln Asp 290 295 300 Pro Asp Phe Arg Ile Ile Ser Gly Gly Thr Glu Asn His Leu Phe Leu305 310 315 320Val Asp Val Thr Lys Val Val Glu Asn Gly Lys Val Ala Gln Asn Leu 325 330 335 Leu Asp Glu Val Asn Ile Thr Leu Asn Lys Asn Ser Ile Pro Tyr Glu 340 345 350 Thr Leu Ser Pro Phe Lys Thr Ser Gly Ile Arg Ile Gly Ala Ala Ala 355 360 365 Ile Thr Ala Arg Gly Phe Gly Glu Glu Glu Ser Arg Lys Val Ala Glu 370 375 380 Leu Ile Ile Lys Thr Leu Lys Asn Ser Glu Asn Glu Ala Val Leu Glu385 390 395 400Glu Val Arg Ser Ala Val Lys Glu Leu Thr Asp Ala Phe Pro Leu Tyr 405 410 415Glu Glu
<210> 111<211> 1239<212> DNA
<213> Staphylococcus epidermidis
<220>
<221> CDS
<222> (1).. (1239)
<400> 111
atg tct tat ate gag aaa aag gat aaa gtt gtt tac gat gct att caa 48
Met Ser Tyr Ile Glu Lys Lys Asp Lys Val Val Tyr Asp Ala Ile Gln15 10 15
aag gag ttt caa cga caa aat agt aat att gaa etc att gca tca gaa 96
Lys Glu Phe Gln Arg Gln Asn Ser Asn Ile Glu Leu Ile Ala Ser Glu
20 25 30
aat ttc gta tca caa gca gtt atg gaa gcc caa ggt tca gta tta acg 144
Asn Phe Val Ser Gln Ala Val Met Glu Ala Gln Gly Ser Val Leu Thr
35 40 45
aat aaa tat gct gag ggt tat cct ggg cgt cgt tat tat gga ggg tgt 192
Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Arg Arg Tyr Tyr Gly Gly Cys
50 55 60
gag cat gta gat gta act gag tcc att gcc att gaa aga gca aaa gct 240
Glu His Val Asp Val Thr Glu Ser Ile Ala Ile Glu Arg Ala Lys Ala65 70 75 80
tta ttt gga gca gaa cat gtt aat gtt caa ccc cat tca ggt tct caa 288
Leu Phe Gly Ala Glu His Val Asn Val Gln Pro His Ser Gly Ser Gln
85 90 95
gct aat atg gct gtg tat ttg gtt gct tta gaa atg ggc gat act gtg 336
Ala Asn Met Ala Val Tyr Leu Val Ala Leu Glu Met Gly Asp Thr Val
100 105 110
tta ggt atg aat ttg agt cat ggt ggt cat tta aca cat ggg gca act 384
Leu Gly Met Asn Leu Ser His Gly Gly His Leu Thr His Gly Ala Thr
115 120 125
gtc aat ttt agt ggt aaa ttt tat cat ttt gtt gaa tat ggt gtg gac 432
Val Asn Phe Ser Gly Lys Phe Tyr His Phe Val Glu Tyr Gly Val Asp
130 135 140
caa gaa aat gaa tta ata aac tat gat gaa gtg aga cgt tta gca att 480
Gln Glu Asn Glu Leu Ile Asn Tyr Asp Glu Val Arg Arg Leu Ala Ile145 150 155 160
gag cat caa cct aaa tta att gta gct ggt gct tca gca tat tca aga 528
Glu His Gln Pro Lys Leu Ile Val Ala Gly Ala Ser Ala Tyr Ser Arg
165 170 175
act att gac ttt aaa aaa ttt aaa gaa att gct gat gaa gta gga gct 576
Thr Ile Asp Phe Lys Lys Phe Lys Glu Ile Ala Asp Glu Val Gly Ala
180 185 190
aaa ttg atg gta gat atg gca cat att gct ggt tta gta gct gct ggt 624
Lys Leu Met Val Asp Met Ala His Ile Ala Gly Leu Val Ala Ala Gly
195 200 205
tta cat cct aat cct tta gaa tat gct gat ttt gtg act act aca act 672
Leu His Pro Asn Pro Leu Glu Tyr Ala Asp Phe Val Thr Thr Thr Thr
210 215 220
cat aaa act tta cgc ggt cca cgt ggt ggt atg att tta tgt aaa gaa 720
His Lys Thr Leu Arg Gly Pro Arg Gly Gly Met Ile Leu Cys Lys Glu225 230 235 240
gaa tat aaa aaa gat ata gat aaa aca ate ttc cca ggt att caa ggc 768
Glu Tyr Lys Lys Asp Ile Asp Lys Thr Ile Phe Pro Gly Ile Gln Gly
245 250 255
ggt cca tta gaa cat gtc ate gcc gca aaa gct gtt gca ttt gga gaa 816
Gly Pro Leu Glu His Val Ile Ala Ala Lys Ala Val Ala Phe Gly Glu260 265 270 gct ttg aac gac gat ttt aaa gat tat caa aat caa gtc att aaa aatAla Leu Asn Asp Asp Phe Lys Asp Tyr Gln Asn Gln Val Ile Lys Asn 275 280 285 gca caa gct tta gct caa aca tta att gaa gaa ggc ttc aga gtt gtaAla Gln Ala Leu Ala Gln Thr Leu Ile Glu Glu Gly Phe Arg Val Val 290 295 300 tct ggc gga aca gac aat cat tta gtt gca gtt gat gtt aaa ggt tctSer Gly Gly Thr Asp Asn His Leu Val Ala Val Asp Val Lys Gly Ser305 310 315 320ate aat atg act ggt aaa tta gct gaa gag aca Ctt gat aaa gta gga1008 Ile Asn Met Thr Gly Lys Leu Ala Glu Glu Thr Leu Asp Lys Val Gly 325 330 335 att aca tgt aat aag aat act att cca ttt gat aaa gaa aaa ccg ttt1056 Ile Thr Cys Asn Lys Asn Thr Ile Pro Phe Asp Lys Glu Lys Pro Phe 340 345 350 gta aca agt ggt gtt aga cta gga aca cca gca gct aca act cgt ggt1104 Val Thr Ser Gly Val Arg Leu Gly Thr Pro Ala Ala Thr Thr Arg Gly 355 360 365 ttt gat gaa tct gca ttt gtg gaa gta gca aaa att att agt tta gca1152 Phe Asp Glu Ser Ala Phe Val Glu Val Ala Lys Ile Ile Ser Leu Ala370 375 380 tta aat aac tat gat aat gat act aaa cta aat gaa gct aaa gag aga1200 Leu Asn Asn Tyr Asp Asn Asp Thr Lys Leu Asn Glu Ala Lys Glu Arg 385 390 395 400gtt cac gca ctc aca tct aaa tat cca tta tat aat taa 1239 Val His Ala Leu Thr Ser Lys Tyr Pro Leu Tyr Asn
405 410
<210> 112<211> 412<212> PRT
<213> Staphylococcus epidermidis
<400> 112 Met Ser Tyr Ile Glu Lys Lys Asp Lys Val Val Tyr Asp Ala Ile Gln1 5 10 15 Lys Glu Phe Gln Arg Gln Asn Ser Asn Ile Glu Leu Ile Ala Ser Glu 20 25 30 Asn Phe Val Ser Gln Ala Val Met Glu Ala Gln Gly Ser Val Leu Thr 35 40 45 Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Arg Arg Tyr Tyr Gly Gly Cys 50 55 60 Glu His Val Asp Val Thr Glu Ser Ile Ala Ile Glu Arg Ala Lys Ala65 70 75 80Leu Phe Gly Ala Glu His Val Asn Val Gln Pro His Ser Gly Ser Gln 85 90 95 Ala Asn Met Ala Val Tyr Leu Val Ala Leu Glu Met Gly Asp Thr Val 100 105 110 Leu Gly Met Asn Leu Ser His Gly Gly His Leu Thr His Gly Ala Thr 115 120 125 Val Asn Phe Ser Gly Lys Phe Tyr His Phe Val Glu Tyr Gly Val Asp 130 135 140 Gln Glu Asn Glu Leu Ile Asn Tyr Asp Glu Val Arg Arg Leu Ala Ile145 150 155 160Glu His Gln Pro Lys Leu Ile Val Ala Gly Ala Ser Ala Tyr Ser Arg
165 170 175Thr Ile Asp Phe 180 Lys Lys Phe Lys Glu 185 Ile Ala Asp Glu Val 190 Gly AlaLys Leu Met Val Asp Met Ala His Ile Ala Gly Leu Val Ala Ala Gly 195 200 205 Leu His 210 Pro Asn Pro Leu Glu 215 Tyr Ala Asp Phe Val 220 Thr Thr Thr ThrHis Lys Thr Leu Arg Gly Pro Arg Gly Gly Met Ile Leu Cys Lys Glu225 230 235 240Glu Tyr Lys Lys Asp 245 Ile Asp Lys Thr Ile 250 Phe Pro Gly Ile Gln Gly 255Gly Pro Leu Glu 260 His Val Ile Ala Ala 265 Lys Ala Val Ala Phe 270 Gly GluAla Leu Asn 275 Asp Asp Phe Lys Asp 280 Tyr Gln Asn Gln Val 285 Ile Lys AsnAla Gln Ala Leu Ala Gln Thr Leu Ile Glu Glu Gly Phe Arg Val Val 290 295 300 Ser Gly Gly Thr Asp Asn His Leu Val Ala Val Asp Val Lys Gly Ser305 310 315 320Ile Asn Met Thr Gly Lys Leu Ala Glu Glu Thr Leu Asp Lys Val Gly 325 330 335Ile Thr Cys Asn 340 Lys Asn Thr Ile Pro 345 Phe Asp Lys Glu Lys 350 Pro PheVal Thr Ser Gly Val Arg Leu Gly Thr Pro Ala Ala Thr Thr Arg Gly 355 360 365 Phe Asp 370 Glu Ser Ala Phe Val 375 Glu Val Ala Lys Ile 380 Ile Ser Leu AlaLeu Asn Asn Tyr Asp Asn Asp Thr Lys Leu Asn Glu Ala Lys Glu Arg385 390 395 400Val His Ala Leu Thr Ser Lys Tyr Pro Leu Tyr Asn 405 410
<210> 113<211> 1257<212> DNA
<213> Pseudomonas aeruginosa
<220>
<221> CDS
<222> (1).. (1257)
<400> 113
atg ttc age aag cac gac cag ctc cag ggc tac gac gac gaa ctg ctc 48
Met Phe Ser Lys His Asp Gln Leu Gln Gly Tyr Asp Asp Glu Leu Leu15 10 15
gcc gcg atg gac gcc gaa gac cgg cgg cag gaa gac cac ate gaa ctg 96
Ala Ala Met Asp Ala Glu Asp Arg Arg Gln Glu Asp His Ile Glu Leu
20 25 30
ate gcc tcg gag aac tac gcc age aag cgg gtc atg cag gcg cag ggc 144
Ile Ala Ser Glu Asn Tyr Ala Ser Lys Arg Val Met Gln Ala Gln Gly
35 40 45
ggc ggc ctg acc aac aag tat gcc gag ggc tat ccg ggc aag cgt tac 192
Gly Gly Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr
50 55 60
tac ggc ggc tgc gaa cac gtc gac aag gtc gag cgg ctg gcc ate gac 240
Tyr Gly Gly Cys Glu His Val Asp Lys Val Glu Arg Leu Ala Ile Asp65 70 75 80
cgc gcc agg caa ctg ttc ggc gcc gac tac gcc aac gtc cag ccg cac 288
Arg Ala Arg Gln Leu Phe Gly Ala Asp Tyr Ala Asn Val Gln Pro His
85 90 95
tcc ggt tcc tcg gcc aac gct gcg gtg tac ctg gcg ctg ctc aac gcc 336
Ser Gly Ser Ser Ala Asn Ala Ala Val Tyr Leu Ala Leu Leu Asn Ala
100 105 110
ggc gac acc ate ctc ggc atg age ctg gcc cac ggc ggc cat ctc acc 384
\Gly Asp Thr Ile Leu Gly Met Ser Leu Ala His Gly Gly His Leu Thr
115 120 125
cac ggc gcc aag gtg tcc tcc tcc ggc aag ctg tac aac gcc gtg cag 432
His Gly Ala Lys Val Ser Ser Ser Gly Lys Leu Tyr Asn Ala Val Gln
130 135 140
tac ggc ctg gac acc gct acc ggg ctg ate gac tac gac gaa gtc gag 480
Tyr Gly Leu Asp Thr Ala Thr Gly Leu Ile Asp Tyr Asp Glu Val Glu145 150 155 160
cgc ctg gcc gtg gag cat aag ccg aag atg ate gtc gcc ggc ttc tcc 528
Arg Leu Ala Val Glu His Lys Pro Lys Met Ile Val Ala Gly Phe Ser
165 170 175
gcc tac tcc aag acc ctc gac ttc ccg cgc ttc cgc gcc ate gce gac 576
Ala Tyr Ser Lys Thr Leu Asp Phe Pro Arg Phe Arg Ala Ile Ala Asp
180 185 190
aag gtc ggc gcg ctg ctg ttc gtc gac atg gcc cac gtc gcc ggg ctg 624
Lys Val Gly Ala Leu Leu Phe Val Asp Met Ala His Val Ala Gly Leu
195 200 205
gtc gcc gcc ggc ctc tac ccg aac ccg ate ccc ttc gcc gac gtg gtc 672
Val Ala Ala Gly Leu Tyr Pro Asn Pro Ile Pro Phe Ala Asp Val Val
210 215 220
acc acc acc acc cac aag acc ctg cgc ggc ccg cgc ggc ggc ctg ate 720
Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile225 230 235 240
ctg gcg cgc gcc aac gag gag ate gag aag aag ctc aac tcc gcg gta 768
Leu Ala Arg Ala Asn Glu Glu Ile Glu Lys Lys Leu Asn Ser Ala Val
245 250 255
ttc ccc ggc gcc cag ggc ggc ccg ctg atg cac gtg ate gcg gcc aag 816
Phe Pro Gly Ala Gln Gly Gly Pro Leu Met His Val Ile Ala Ala Lys
260 265 270
gcg gtg tgc ttc aag gaa gcg ctg gag ccg ggc ttc aag gac tac cag 864
Ala Val Cys Phe Lys Glu Ala Leu Glu Pro Gly Phe Lys Asp Tyr Gln
275 280 285
gcg cag gtg ate cgc aac gcc aag gcg atg gcc gag gtg ttc ate ggg 912
Ala Gln Val Ile Arg Asn Ala Lys Ala Met Ala Glu Val Phe Ile Gly
290 295 300
cgc ggc tac gac gtg gtt tcc ggt ggc acc gac aac cac ctg atg ctg 960
Arg Gly Tyr Asp Val Val Ser Gly Gly Thr Asp Asn His Leu Met Leu305 310 315 320
ate age ctg gtg aag cag ggg ctg acc ggc aag gcc gcc gac gcg gcg1008
Ile Ser Leu Val Lys Gln Gly Leu Thr Gly Lys Ala Ala Asp Ala Ala
325 330 335
ctc gga gcg gcg cac ate acg gtg aac aag aac gcc gtg ccg aac gat1056
Leu Gly Ala Ala His Ile Thr Val Asn Lys Asn Ala Val Pro Asn Asp
340 345 350
ccg cag age ccg ttc gtc acc tcc ggc ate cgc ate ggc acc cca gcg1104
Pro Gln Ser Pro Phe Val Thr Ser Gly Ile Arg Ile Gly Thr Pro Ala
355 360 365
gtg acc act cgc ggt ttc cgc gag ggc gag tgc cga gaa ctg gct ggc1152
Val Thr Thr Arg Gly Phe Arg Glu Gly Glu Cys Arg Glu Leu Ala Gly
370 375 380
tgg ate tgc gac ate ctc gac gat ate gac aat ccc gag gtc ggc gaa1200
Trp Ile Cys Asp Ile Leu Asp Asp Ile Asp Asn Pro Glu Val Gly Glu385 390 395 400
cgg gtc agg ggc cag gtc ggc gaa ttc tgc cgg cac ttc ccg gtc tac1248
Arg Val Arg Gly Gln Val Gly Glu Phe Cys Arg His Phe Pro Val Tyr405 410 415
gct gat tga1257Ala Asp
<210> 114<211> 418<212> PRT
<213> Pseudomonas aeruginosa<400> 114
Met Phe Ser Lys His Asp Gln Leu Gln Gly Tyr Asp Asp Glu Leu Leu1 5 10 15
Ala Ala Met Asp Ala Glu Asp Arg Arg Gln Glu Asp His Xle Glu Leu
20 25 30
Ile Ala Ser Glu Asn Tyr Ala Ser Lys Arg Val Met Gln Ala Gln Gly
35 40 45
Gly Gly Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr
50 55 60
Tyr Gly Gly Cys Glu His Val Asp Lys Val Glu Arg Leu Ala Ile Asp65 70 75 80
Arg Ala Arg Gln Leu Phe Gly Ala Asp Tyr Ala Asn Val Gln Pro His
85 90 95
Ser Gly Ser Ser Ala Asn Ala Ala Val Tyr Leu Ala Leu Leu Asn Ala
100 105 110
Gly Asp Thr Ile Leu Gly Met Ser Leu Ala His Gly Gly His Leu Thr
115 120 125
His Gly Ala Lys Val Ser Ser Ser Gly Lys Leu Tyr Asn Ala Val Gln
130 135 140
Tyr Gly Leu Asp Thr Ala Thr Gly Leu Ile Asp Tyr Asp Glu Val Glu145 150 155 160
Arg Leu Ala Val Glu His Lys Pro Lys Met Ile Val Ala Gly Phe Ser
165 170 175
Ala Tyr Ser Lys Thr Leu Asp Phe Pro Arg Phe Arg Ala Ile Ala Asp
180 185 190
Lys Val Gly Ala Leu Leu Phe Val Asp Met Ala His Val Ala Gly Leu
195 200 205
Val Ala Ala Gly Leu Tyr Pro Asn Pro Ile Pro Phe Ala Asp Val Val
210 215 220
Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile225 230 235 240
Leu Ala Arg Ala Asn Glu Glu Ile Glu Lys Lys Leu Asn Ser Ala Val
245 250 255
Phe Pro Gly Ala Gln Gly Gly Pro Leu Met His Val Ile Ala Ala Lys
260 265 270
Ala Val Cys Phe Lys Glu Ala Leu Glu Pro Gly Phe Lys Asp Tyr Gln
275 280 285
Ala Gln Val Ile Arg Asn Ala Lys Ala Met Ala Glu Val Phe Ile Gly
290 295 300
Arg Gly Tyr Asp Val Val Ser Gly Gly Thr Asp Asn His Leu Met Leu305 310 315 320
Ile Ser Leu Val Lys Gln Gly Leu Thr Gly Lys Ala Ala Asp Ala Ala
325 330 335
Leu Gly Ala Ala His Ile Thr Val Asn Lys Asn Ala Val Pro Asn Asp
340 345 350
Pro Gln Ser Pro Phe Val Thr Ser Gly Ile Arg Ile Gly Thr Pro Ala
355 360 365
Val Thr Thr Arg Gly Phe Arg Glu Gly Glu Cys Arg Glu Leu Ala Gly
370 375 380
Trp Ile Cys Asp Ile Leu Asp Asp Ile Asp Asn Pro Glu Val Gly Glu385 390 395 400
Arg Val Arg Gly Gln Val Gly Glu Phe Cys Arg His Phe Pro Val Tyr405 410 415
Ala Asp<210> 115<211> 1254<212> DNA
<213> Pseudomonas aeruginosa
<220>
<221> CDS
<222> (1).. (1254)
<400> 115
atg ttc age aag cat gac cag ate cgc ggc tac gac gac gaa ctg ctc 48
Met Phe Ser Lys His Asp Gln Ile Arg Gly Tyr Asp Asp Glu Leu Leu15 10 15
gcc gcg atg gac gcc gaa gag gcc cgc cag gaa gac cat ctc gaa ctg 96
Ala Ala Met Asp Ala Glu Glu Ala Arg Gln Glu Asp His Leu Glu Leu
20 25 30
ate gcc tcg gag aac tac acc age aag cgg gtc atg cag gcg cag ggc 144
Ile Ala Ser Glu Asn Tyr Thr Ser Lys Arg Val Met Gln Ala Gln Gly
35 40 45
age ggc ctg acc aac aag tat gcc gag ggc tat ccg ggc aag cgc tac 192
Ser Gly Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr
50 55 60
tac ggc ggc tgc gaa cac gtc gac aag gtc gag cgg ctg gcc ate gac 240
Tyr Gly Gly Cys Glu His Val Asp Lys Val Glu Arg Leu Ala Ile Asp65 70 75 80
cgc gcc agg caa ctg ttc ggc gcc gac tac gcc aac gtc cag ccg cac 288
Arg Ala Arg Gln Leu Phe Gly Ala Asp Tyr Ala Asn Val Gln Pro His
85 90 95
tcc ggt tcc tcg gcc aac gct gcg gtg tac ctg gcg ctg ctc aac gcc 336
Ser Gly Ser Ser Ala Asn Ala Ala Val Tyr Leu Ala Leu Leu Asn Ala
100 105 110
ggc gac acc ate ctc ggc atg age ctg gcc cac ggc ggc cat ctc acc 384
Gly Asp Thr Ile Leu Gly Met Ser Leu Ala His Gly Gly His Leu Thr
115 120 125
cac ggc gcc aag gtg tcc tcc tcc ggc aag ctt tac aac gcc gtg cag 432
His Gly Ala Lys Val Ser Ser Ser Gly Lys Leu Tyr Asn Ala Val Gln
130 135 140
tac ggc ctg gac acc gct acc ggg ctg ate gac tac gac gaa gtc gag 480
Tyr Gly Leu Asp Thr Ala Thr Gly Leu Ile Asp Tyr Asp Glu Val Glu145 150 155 160
cgc ctg gcc gtg gag cat aag ccg aag atg ate gtc gcc ggc ttc tcc 528
Arg Leu Ala Val Glu His Lys Pro Lys Met Ile Val Ala Gly Phe Ser
165 170 175
gcc tac tcc aag acc ctc gac ttc ccg cgc ttc cgc gcc ate gcc gac 576
Ala Tyr Ser Lys Thr Leu Asp Phe Pro Arg Phe Arg Ala Ile Ala Asp
180 185 190
aag gtc ggc gcg ctg ctg ttc gtc gac atg gcc cac gtc gcc ggg ctg 624
Lys Val Gly Ala Leu Leu Phe Val Asp Met Ala His Val Ala Gly Leu
195 200 205
gtc gcc gcc ggc ctc tac ccg aac ccg ate ccc ttc gcc gac gtg gtc 672
Val Ala Ala Gly Leu Tyr Pro Asn Pro Ile Pro Phe Ala Asp Val Val
210 215 220
acc acc acc acc cac aag acc ctg cgc ggc ccg cgc ggc ggc ctg ate 720
Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile225 230 235 240
ctg gcg cgc gcc aac gag gag ate gag aag aag etc aac tcc gcg gta 768
Leu Ala Arg Ala Asn Glu Glu Ile Glu Lys Lys Leu Asn Ser Ala Val
245 250 255
ttt ccc ggc gcc cag ggc ggc ccg ctg atg cac gtg ate gcg gcc aag 816
Phe Pro Gly Ala Gln Gly Gly Pro Leu Met His Val Ile Ala Ala Lys260 265 270
\gcg gtg Ala Val tgc Cys 275 ttc Phe aag Lys gaa Glu gcg Ala ctg Leu 280 gag Glu ccg Pro ggc Gly ttc Phe aag Lys 285 gac Asp tac Tyr cag Gln 864gcg cag Ala Gln 290 gtg Val ate Ile cgc Arg aac Asn gcc Ala 295 aag Lys gcg Ala atg Met gcc Ala gag Glu 300 gtg Val ttc Phe ate Ile ggg Gly 912cgc ggc Arg Gly 305 tac Tyr gac Asp gtg Val gtt Val 310 tcc Ser ggt Gly ggc Gly acc gac aac Thr Asp Asn 315 cac His ctg Leu atg Met ctg Leu 320 960ate age 1008 ctg gtg cgc cag ggc ctg acc ggc aag gaa gcc gac gcc gcc Ile Ser Leu Val Arg 325 Gln Gly Leu Thr Gly Lys 330 Glu Ala Asp Ala Ala 335 ctc ggc 1056 cgg gtc ggc ate acg gtg aac aag aac gcc gtg ccg aac gat Leu Gly Arg Val 340 Gly Ile Thr Val Asn 345 Lys Asn Ala Val Pro 350 Asn Asp ccg cag 1104 age ccg ttc gtc acc tcc ggc ate cgc ate ggc acc ccg gcc Pro Gln Ser 355 Pro Phe Val Thr Ser 360 Gly Ile Arg Ile Gly 365 Thr Pro Ala ate acc 1152 acc cgc ggg ctg cag gaa gcg cag age cgc gaa ctg gcc ggc Ile Thr 370 Thr Arg Gly Leu Gln 375 Glu Ala Gln Ser Arg 380 Glu Leu Ala Gly tgg ate 1200 tgc gac ate ctc gac cac ctc ggc gat gcc gac gtg gag gcc Trp Ile 385 Cys Asp Ile Leu 390 Asp His Leu Gly Asp Ala Asp Val 395 Glu Ala 400 aag gtc 1248 gcc acc cag gtc gcc ggt ctc tgc gcg gac ttc ccg gtc tat Lys Val Ala Thr Gln 405 Val Ala Gly Leu Cys Ala Asp 410 Phe Pro Val 415 Tyr
cgc tga
1254
Arg
<210> 116<211> 417<212> PRT
<213> Pseudomonas aeruginosa
<400> 116
Met Phe Ser Lys His Asp Gln Ile Arg Gly Tyr Asp Asp Glu Leu Leu1 5 10 15 Ala Ala Met Asp Ala Glu Glu Ala Arg Gln Glu Asp His Leu Glu Leu 20 25 30 Ile Ala Ser Glu Asn Tyr Thr Ser Lys Arg Val Met Gln Ala Gln Gly 35 40 45 Ser Gly Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr 50 55 60 Tyr Gly Gly Cys Glu His Val Asp Lys Val Glu Arg Leu Ala Ile Asp 65 70 75 80Arg Ala Arg Gln Leu Phe Gly Ala Asp Tyr Ala Asn Val Gln Pro His 85 90 95 Ser Gly Ser Ser Ala Asn Ala Ala Val Tyr Leu Ala Leu Leu Asn Ala 100 105 110 Gly Asp Thr Ile Leu Gly Met Ser Leu Ala His Gly Gly His Leu Thr 115 120 125 His Gly Ala Lys Val Ser Ser Ser Gly Lys Leu Tyr Asn Ala Val Gln 130 135 140 Tyr Gly Leu Asp Thr Ala Thr Gly Leu Ile Asp Tyr Asp Glu Val Glu145 150 155 160
Arg Leu Ala Val Glu 165 His Lys Pro Lys Met 170 Ile Val Ala Gly Phe 175 SerAla Tyr Ser Lys Thr Leu Asp Phe Pro Arg Phe Arg Ala Ile Ala Asp 180 185 190 Lys Val Gly Ala Leu Leu Phe Val Asp Met Ala His Val Ala Gly Leu 195 200 205 Val Ala Ala Gly Leu Tyr Pro Asn Pro Ile Pro Phe Ala Asp Val Val 210 215 220 Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile225 230 235 240Leu Ala Arg Ala Asn 245 Glu Glu Ile Glu Lys 250 Lys Leu Asn Ser Ala 255 ValPhe Pro Gly Ala 260 Gln Gly Gly Pro Leu 265 Met His Val Ile Ala 270 Ala LysAla Val Cys 275 Phe Lys Glu Ala Leu 280 Glu Pro Gly Phe Lys 285 Asp Tyr GlnAla Gln 290 Val Ile Arg Asn Ala 295 Lys Ala Met Ala Glu 300 Val Phe Ile GlyArg Gly Tyr Asp Val Val Ser Gly Gly Thr Asp Asn His Leu Met Leu305 310 315 320Ile Ser Leu Val Arg Gln Gly Leu Thr Gly Lys Glu Ala Asp Ala Ala 325 330 335 Leu Gly Arg Val 340 Gly Ile Thr Val Asn 345 Lys Asn Ala Val Pro 350 Asn AspPro Gln Ser 355 Pro Phe Val Thr Ser 360 Gly Ile Arg Ile Gly 365 Thr Pro AlaIle Thr 370 Thr Arg Gly Leu Gln 375 Glu Ala Gln Ser Arg 380 Glu Leu Ala GlyTrp Ile Cys Asp Ile Leu Asp His Leu Gly Asp Ala Asp Val Glu Ala385 390 395 400Lys Val Ala Thr Gln Val Ala Gly Leu Cys Ala Asp Phe Pro Val Tyr
405 410 415
Arg
<210> 117<211> 1257<212> DNA
<213> Streptococcus agalactiae
<220>
<221> CDS
<222> (1).. (1257)
<400> 117atg att ttt gatMet Ile Phe Asp1
cag gct att catGln Ala Ile His20
att gca tca gaaIle Ala Ser Glu35
tct gtt ttg acaSer Val Leu Thr50
tat gga gga acaTyr Gly Gly Thr65
cga gct aag acgArg Ala Lys Thr
aaa gacLys Asp5
gat gagAsp Glu
aac gttAsn Val
aat aaaAsn Lys
gat tgtAsp Cys
70tta tttLeu Phe
aat tttAsn Phe
gaa attGlu Ile
gtt tcaVal Ser
40tat gccTyr Ala55
gtt gatVal Asp
aat gctAsn Ala
aaa gaaLys Glu10cgc caaArg Gln25
aaa gctLys Ala
gaa gggGlu Gly
gta gttVal Val
gag tttGlu Phe
ttt gacPhe Asp
caa aatGln Asn
gtt atgVal Met
tat cctTyr Pro60gaa agtGlu Ser75
gct aatAla Asn
caa gaaGln Glu
aat attAsn Ile
30gca gcaAla Ala45
agt catSer His
tta gctLeu Ala
gtt caaVal Gln
ctt tggLeu Trp15
gaa ttaGlu Leu
caa ggtGln Gly
cgt tatArg Tyr
ata gaaIle Glu80cca catPro His85 90 95
tct ggt agt cag gct aat gca gca gct tac atg gct tta ate gag ccg 336
Ser Gly Ser Gln Ala Asn Ala Ala Ala Tyr Met Ala Leu Ile Glu Pro
100 105 110
gga gat act gtc tta ggg atg gac tta gca gca ggt ggg cac tta aca 384
Gly Asp Thr Val Leu Gly Met Asp Leu Ala Ala Gly Gly His Leu Thr
115 120 125
cat ggc gct tca gtt age ttc tca gga aaa act tat cat ttt gtt tct 432
His Gly Ala Ser Val Ser Phe Ser Gly Lys Thr Tyr His Phe Val Ser
130 135 140
tat tct gtt gat cct aag acg gag atg cta gac tat gat aac att ttg 480
Tyr Ser Val Asp Pro Lys Thr Glu Met Leu Asp Tyr Asp Asn Ile Leu145 150 155 160
aaa ata gca cag gaa acg cag cct aaa tta att gtt gca ggg gca tcg 528
Lys Ile Ala Gln Glu Thr Gln Pro Lys Leu Ile Val Ala Gly Ala Ser
165 170 175
gct tat tct cgc att att gat ttt gaa aaa ttt cgt caa ata gca gac 576
Ala Tyr Ser Arg Ile Ile Asp Phe Glu Lys Phe Arg Gln Ile Ala Asp
180 185 190
gca gta gat gct tac tta atg gtt gat atg gct cac att gca ggt tta 624
Ala Val Asp Ala Tyr Leu Met Val Asp Met Ala His Ile Ala Gly Leu
195 200 205
gtt gct tct ggt cat cac cct agt cct att cct tat gct cat gta acg 672
Val Ala Ser Gly His His Pro Ser Pro Ile Pro Tyr Ala His Val Thr
210 215 220
aca acg aca aca cat aag act cta cgt gga cct aga ggt ggt ttg att 720
Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile225 230 235 240
tta acc aat gat gaa gca att gct aaa aaa att aat tct gca gtc ttt 768
Leu Thr Asn Asp Glu Ala Ile Ala Lys Lys Ile Asn Ser Ala Val Phe
245 250 255
cca gga ctc caa ggt gga cca tta gaa cat gta att gct gca aaa gct 816
Pro Gly Leu Gln Gly Gly Pro Leu Glu His Val Ile Ala Ala Lys Ala
260 265 270
gta gct ttg aaa gaa gcc cta gat cct tcc ttt aaa ata tac ggt gag 864
Val Ala Leu Lys Glu Ala Leu Asp Pro Ser Phe Lys Ile Tyr Gly Glu
275 280 285
gat att att aaa aat gct caa gcc atg gct aaa gtt ttt aaa gaa gat 912
Asp Ile Ile Lys Asn Ala Gln Ala Met Ala Lys Val Phe Lys Glu Asp
290 295 300
gat gac ttt cat ttg att tct gat ggt act gat aat cat ttg ttc tta 960
Asp Asp Phe His Leu Ile Ser Asp Gly Thr Asp Asn His Leu Phe Leu305 310 315 320
gta gac gtc aca aaa gtt att gag aat ggc aaa aag gca caa aat gtt1008
Val Asp Val Thr Lys Val Ile Glu Asn Gly Lys Lys Ala Gln Asn Val
325 330 335
ctt gaa gaa gtc aat ate act ctt aac aag aac tct ata ccg ttt gag1056
Leu Glu Glu Val Asn Ile Thr Leu Asn Lys Asn Ser Ile Pro Phe Glu
340 345 350
cga cta tca cca ttt aaa aca tca ggt att cga att ggt act cca gca1104
Arg Leu Ser Pro Phe Lys Thr Ser Gly Ile Arg Ile Gly Thr Pro Ala
355 360 365
att act agt cga gga atg gga gtt gaa gaa tct cga aga ate gct gaa1152
Ile Thr Ser Arg Gly Met Gly Val Glu Glu Ser Arg Arg Ile Alá Glu
370 375 380
tta atg att aag gca ctc aaa aat cat gaa aat caa gat ate ctc aca1200
Leu Met Ile Lys Ala Leu Lys Asn His Glu Asn Gln Asp Ile Leu Thr385 390 395 400gaa gtt cgt caa gaa att aaa tca tta acg gac gct ttc ccc ttg tat1248
Glu Val Arg Gln Glu Ile Lys Ser Leu Thr Asp Ala Phe Pro Leu Tyr405 410 415
gag aat taa
1257
Glu Asn
<210> 118<211> 418<212> PRT
<213> Streptococcus agalactiae
<400> 118
Met Ile Phe Asp Lys Asp Asn Phe Lys Glu Phe Asp Gln Glu Leu Trp1 5 10 15 Gln Ala Ile His 20 Asp Glu Glu Ile Arg 25 Gln Gln Asn Asn Ile 30 Glu LeuIle Ala Ser 35 Glu Asn Val Val Ser 40 Lys Ala Val Met Ala 45 Ala Gln GlySer Val 50 Leu Thr Asn Lys Tyr 55 Ala Glu Gly Tyr Pro 60 Ser His Arg TyrTyr Gly Gly Thr Asp Cys Val Asp Val Val Glu Ser Leu Ala Ile Glu65 70 75 80Arg Ala Lys Thr Leu 85 Phe Asn Ala Glu Phe 90 Ala Asn Val Gln Pro 95 HisSer Gly Ser Gln Ala Asn Ala Ala Ala Tyr Met Ala Leu Ile Glu Pro 100 105 110 Gly Asp Thr 115 Val Leu Gly Met Asp 120 Leu Ala Ala Gly Gly 125 His Leu ThrHls Gly Ala Ser Val Ser Phe Ser Gly Lys Thr Tyr His Phe Val Ser 130 135 140 Tyr Ser Val Asp Pro Lys Thr Glu Met Leu Asp Tyr Asp Asn Ile Leu145 150 155 160Lys Ile Ala Gln Glu Thr Gln Pro Lys Leu Ile Val Ala Gly Ala Ser 165 170 175 Ala Tyr Ser Arg Ile Ile Asp Phe Glu Lys Phe Arg Gln Ile Ala Asp 180 185 190 Ala Val Asp Ala Tyr Leu Met Val Asp Met Ala His Ile Ala Gly Leu 195 200 205 Val Ala Ser Gly His His Pro Ser Pro Ile Pro Tyr Ala His Val Thr 210 215 220 Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile225 230 235 240Leu Thr Asn Asp Glu 245 Ala Ile Ala Lys Lys 250 Ile Asn Ser Ala Val 255 PhePro Gly Leu Gln 260 Gly Gly Pro Leu Glu 265 His Val Ile Ala Ala 270 Lys AlaVal Ala Leu Lys Glu Ala Leu Asp Pro Ser Phe Lys Ile Tyr Gly Glu 275 280 285 Asp Ile Ile Lys Asn Ala Gln Ala Met Ala Lys Val Phe Lys Glu Asp 290 295 300 Asp Asp Phe His Leu Ile Ser Asp Gly Thr Asp Asn His Leu Phe Leu305 310 315 320Val Asp Val Thr Lys Val Ile Glu Asn Gly Lys Lys Ala Gln Asn Val 325 330 335 Leu Glu Glu Val 340 Asn Ile Thr Leu Asn 345 Lys Asn Ser Ile Pro 350 Phe GluArg Leu Ser Pro Phe Lys Thr Ser Gly Ile Arg Ile Gly Thr Pro Ala 355 360 365 Ile Thr Ser Arg Gly Met Gly Val Glu Glu Ser Arg Arg Ile Ala Glu 370 375 380Leu Met Ile Lys Alâ Lôu Lys Asn HdLs Glu Asn Gln Asp He L6u Thir385 390 395 400
Glu Val Arg Gln Glu Ile Lys Ser Leu Thr Asp Ala Phe Pro Leu Tyr405 410 415
Glu Asn
<210> 119<211> 1254<212> DNA
<213> Legionella pneumophila
<220><221> CDS
<222> (1).. (1254) <400> 119 atg ttt gac gaa agt tat agt ata aaa aat ttt gat gat gtt Ctt ttt 48Met Phe Asp Glu Ser Tyr Ser Ile Lys Asn Phe Asp Asp Val Leu Phe 1 5 10 15 aaa gca att tct gat gaa aaa cga cgc caa gaa gaa cac att gaa tta 96Lys Ala Ile Ser Asp Glu Lys Arg Arg Gln Glu Glu His Ile Glu Leu 20 25 30 ata gca tct gaa aat tat gtc age ccg aga gta ttg gag gct cag ggt 144Ile Ala Ser Glu Asn Tyr Val Ser Pro Arg Val Leu Glu Ala Gln Gly 35 40 45 tct gtg ttg acg aat aaa tac gct gaa gga tat cca ggc aaa cgc tat 192Ser Val Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr 50 55 60 tac gga ggt tgt gag ttt gtt gat gtc gct gag gag tta gcc att tca 240Tyr Gly Gly Cys Glu Phe Val Asp Val Ala Glu Glu Leu Ala Ile Ser 65 70 75 80 agg gca aaa tta Ctt ttt ggc gct cat tat gtc aat gtg caa ccg cat 288Arg Ala Lys Leu Leu Phe Gly Ala His Tyr Val Asn Val Gln Pro His 85 90 95 tcg gga tca caa gcg aac gca gca gtc atg atg gca tta ttg tcc cca 336Ser Gly Ser Gln Ala Asn Ala Ala Val Met Met Ala Leu Leu Ser Pro 100 105 110 ggc gat act ttt atg ggc atg gct tta cct cat ggt ggg cac ttg act 384Gly Asp Thr Phe Met Gly Met Ala Leu Pro His Gly Gly His Leu Thr 115 120 125 cat ggg tca aag gtt aat ttt tca ggt aaa tta tac cat tct gtc gag 432His Gly Ser Lys Val Asn Phe Ser Gly Lys Leu Tyr His Ser Val Glu 130 135 140 tat ggt gtt gat age aat acg ggt ttg att gat tat gat gct ctg gaa 480Tyr Gly Val Asp Ser Asn Thr Gly Leu Ile Asp Tyr Asp Ala Leu Glu 145 150 155 160 aaa Ctt gcg Ctt caa cac aaa cca aaa ttg ate att gcc ggt ttt tca 528Lys Leu Ala Leu Gln His Lys Pro Lys Leu Ile Ile Ala Gly Phe Ser 165 170 175 gct tat tcc agg ate ctg gat tgg gct cga ttt aga gaa att gcc gat 576Ala Tyr Ser Arg Ile Leu Asp Trp Ala Arg Phe Arg Glu Ile Ala Asp 180 185 190 aag gtc ggc gct tat tta atg gcg gac ate gct cat gta gct ggt ctg 624Lys Val Gly Ala Tyr Leu Met Ala Asp Ile Ala His Val Ala Gly Leu 195 200 205 gtg gct gta ggg tta tat cct tct CCt gtt cct tat gcg gat gtt gtg 672Val Ala Val Gly Leu Tyr Pro Ser Pro Val Pro Tyr Ala Asp Val Val 210 215 220 aca acg aca act cat aaa act tta aga gga cct cgc ggt ggt tta ate 720Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile 225 230 235 240 Ctt tgt aag gaa aac gaa gaa att gag aaa aaa tta aat tct tct gta 768Leu Cys Lys Glu Asn 245 Glu Glu Ile Glu Lys 250 Lys Leu Asn Ser Ser 255 Val ttt CCt ggt atg caa ggt ggg CCC tta atg cat gta att gca gcc aag 816Phe Pro Gly Met Gln Gly Gly Pro Leu Met His Val Ile Ala Ala Lys 260 265 270 gca gtt gct ttt gca gaa gct ctg tta CCC gaa ttc aaa act tat cag 864Ala Val Ala 275 Phe Ala Glu Ala Leu 280 Leu Pro Glu Phe Lys 285 Thr Tyr Gln caa cag gtt tta gct aat gcc aga acg atg tgc agt gtg tta caa age 912Gln Gln Val Leu Ala Asn Ala Arg Thr Met Cys Ser Val Leu Gln Ser 290 295 300 aga ggc tat gat att gtt tct ggc gga act gat aat cat Ctt ttg cta 960Arg Gly Tyr Asp Ile Val Ser Gly Gly Thr Asp Asn His Leu Leu Leu 305 310 315 320 gtg gat ttg ata aat aaa gga att aca ggt aaa gaa gct gac gct gct 1008 Val Asp Leu Ile Asn Lys Gly Ile Thr Gly Lys Glu Ala Asp Ala Ala 325 330 335 gta ggc aga gct aac ata aca gtc aat aaa aat tcg gtt CCC aat gat 1056 Val Gly Arg Ala Asn Ile Thr Val Asn Lys Asn Ser Val Pro Asn Asp 340 345 350 cct cgc tcg cct ttt gta acg agt ggt tta cgt ttg ggt acg cct gct 1104 Pro Arg Ser Pro Phe Val Thr Ser Gly Leu Arg Leu Gly Thr Pro Ala 355 360 365 gca acc aca aga ggc ttt aaa gaa aga gag att act ttg tta tct aac 1152 Ala Thr Thr Arg Gly Phe Lys Glu Arg Glu Ile Thr Leu Leu Ser Asn 370 375 380 tgg gta gcg gat gtc Ctt gat aat gtt cat gat gaa act aat att tca 1200 Trp Val Ala Asp Val Leu Asp Asn Val His Asp Glu Thr Asn Ile Ser 385 390 395 400 aga gtg aaa acc cag gtg ttg cta CtC tgt cgt gaa ttt ccg gtt tat 1248 Arg Val Lys Thr Gln Val Leu Leu Leu Cys Arg Glu Phe Pro Val Tyr 405 410 415
gcc taa
1254
Ala
<210> 120<211> 417<212> PRT
<213> Legionella pneumophila
<400> 120
Met Phe Asp Glu Ser Tyr Ser Ile Lys Asn Phe Asp Asp Val Leu Phe1 5 10 15 Lys Ala Ile Ser Asp Glu Lys Arg Arg Gln Glu Glu His Ile Glu Leu 20 25 30 Ile Ala Ser Glu Asn Tyr Val Ser Pro Arg Val Leu Glu Ala Gln Gly 35 40 45 Ser Val Leu Thr Asn Lys Tyr Ala Glu Gly Tyr Pro Gly Lys Arg Tyr 50 55 60 Tyr Gly Gly Cys Glu Phe Val Asp Val Ala Glu Glu Leu Ala Ile Ser65 70 75 80Arg Ala Lys Leu Leu Phe Gly Ala His Tyr Val Asn Val Gln Pro His 85 90 95 Ser Gly Ser Gln 100 Ala Asn Ala Ala Val 105 Met Met Ala Leu Leu 110 Ser ProGly Asp Thr Phe Met Gly Met Ala Leu Pro His Gly Gly His Leu Thr 115 120 125 His Gly Ser Lys Val Asn Phe Ser Gly Lys Leu Tyr His Ser Val Glu 130 135 140 Tyr Gly Val Asp Ser Asn Thr Gly Leu Ile Asp Tyr Asp Ala Leu Glu145 150 155 160Lys Leu Ala Leu Gln His Lys Pro Lys Leu Ile Ile Ala Gly Phe Ser 165 170 175 Ala Tyr Ser Arg Ile Leu Asp Trp Ala Arg Phe Arg Glu Ile Ala Asp 180 185 190 Lys Val Gly Ala Tyr Leu Met Ala Asp Ile Ala His Val Ala Gly Leu 195 200 205 Val Ala Val Gly Leu Tyr Pro Ser Pro Val Pro Tyr Ala Asp Val Val 210 215 220 Thr Thr Thr Thr His Lys Thr Leu Arg Gly Pro Arg Gly Gly Leu Ile225 230 235 240Leu Cys Lys Glu Asn Glu Glu Ile Glu Lys Lys Leu Asn Ser Ser Val 245 250 255 Phe Pro Gly Met Gln Gly Gly Pro Leu Met His Val Ile Ala Ala Lys 260 265 270 Ala Val Ala Phe Ala Glu Ala Leu Leu Pro Glu Phe Lys Thr Tyr Gln 275 280 285 Gln Gln Val Leu Ala Asn Ala Arg Thr Met Cys Ser Val Leu Gln Ser 290 295 300 Arg Gly Tyr Asp Ile Val Ser Gly Gly Thr Asp Asn His Leu Leu Leu305 310 315 320Val Asp Leu Ile Asn Lys Gly Ile Thr Gly Lys Glu Ala Asp Ala Ala 325 330 335 Val Gly Arg Ala Asn Ile Thr Val Asn Lys Asn Ser Val Pro Asn Asp 340 345 350 Pro Arg Ser Pro Phe Val Thr Ser Gly Leu Arg Leu Gly Thr Pro Ala 355 360 365 Ala Thr Thr Arg Gly Phe Lys Glu Arg Glu Ile Thr Leu Leu Ser Asn 370 375 380 Trp Val Ala Asp Val Leu Asp Asn Val His Asp Glu Thr Asn Ile Ser385 390 395 400Arg Val Lys Thr Gln Val Leu Leu Leu Cys Arg Glu Phe Pro Val Tyr
405 410 415
Ala
<210> 121
<211> 1981
<212> DNA
<213> Oryza sativa
<220>
<221> CDS
<222> (43).. (1584)
<400> 121
cccccgcctc caccaccacc cgccgctcgc cgctcgccca cc atg gcc atg gcg 54
Met Ala Met Ala1
acg gcg ctc cgc aag ctc tcc tcc gac gcc ctc cgc cgc cag ccg ctc 102
Thr Ala Leu Arg Lys Leu Ser Ser Asp Ala Leu Arg Arg Gln Pro Leu5 10 15 20
tcc cgc ate acc ccg ctc tac tac atg gcg tcc ctg ccg gcg acg gag 150
Ser Arg Ile Thr Pro Leu Tyr Tyr Met Ala Ser Leu Pro Ala Thr Glu
25 30 35
gag aga tcc gga gtc acc tgg ccg aag cag ctg aac gcg ccg ctg gag 198
Glu Arg Ser Gly Val Thr Trp Pro Lys Gln Leu Asn Ala Pro Leu Glu40 45 50gag gtg gat ccc gag ate gcc gac ate ate gag cac gag aag gcc cgc 246
Glu Val Asp Pro Glu Ile Ala Asp Ile Ile Glu His Glu Lys Ala Arg
55 60 65
caa tgg aag ggt ctg gag ctc ate ccg tcg gag aac ttc acc tcg gtg 294
Gln Trp Lys Gly Leu Glu Leu Ile Pro Ser Glu Asn Phe Thr Ser Val
70 75 80
tca gtg atg cag gcg gtg gga tcc gtc atg acc aac aag tac age gag 342
Ser Val Met Gln Ala Val Gly Ser Val Met Thr Asn Lys Tyr Ser Glu85 90 95 100
ggg tac ccc ggc gcg aga tac tac ggt gga aac gaa tac att gat atg 390
Gly Tyr Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Met
105 110 115
gcc gag tca ttg tgc cag aaa cgt gct ttg gag gcc ttc cgc ttg gac 438
Ala Glu Ser Leu Cys Gln Lys Arg Ala Leu Glu Ala Phe Arg Leu Asp
120 125 130
cca gcg aaa tgg gga gtg aat gtg caa oct cta tca ggg tca cct gcc 486
Pro Ala Lys Trp Gly Val Asn Val Gln Pro Leu Ser Gly Ser Pro Ala
135 140 145
aac ttc cat gtt tac act gcc cta ttg aaa cca cat gag aga ate atg 534
Asn Phe His Val Tyr Thr Ala Leu Leu Lys Pro His Glu Arg Ile Met
150 155 160
gct ttg gat ctt cct cat ggt gga cat ctt tet cac ggc tac cag act 582
Ala Leu Asp Leu Pro His Gly Gly His Leu Ser His Gly Tyr Gln Thr165 170 175 180
gat act aag aag att tca gea gtt tcg ata ttc ttt gag aca atg ccc 630
Asp Thr Lys Lys Ile Ser Ala Val Ser Ile Phe Phe Glu Thr Met Pro
185 190 195
tac aga ttg gat gaa age act ggc ttg att gat tat gat cag atg gag 678
Tyr Arg Leu Asp Glu Ser Thr Gly Leu Ile Asp Tyr Asp Gln Met Glu
200 205 210
aaa agt gcc gtt ctt ttt agg cca aag ttg ate gtt gcg ggt gea agt 726
Lys Ser Ala Val Leu Phe Arg Pro Lys Leu Ile Val Ala Gly Ala Ser
215 220 225
gea tat gcg cgt ctt tat gac tat gac cgc atg cgg aag gtt tgt gac 774
Ala Tyr Ala Arg Leu Tyr Asp Tyr Asp Arg Met Arg Lys Val Cys Asp
230 235 240
aag cag aag gea ata ctt cta gea gat atg gea cat ate agt ggg ctt 822
Lys Gln Lys Ala Ile Leu Leu Ala Asp Met Ala His Ile Ser Gly Leu245 250 255 260
gtc gea gct ggt gtt gtt cca tet cct ttt gat tat gea gat gta gtg 870
Val Ala Ala Gly Val Val Pro Ser Pro Phe Asp Tyr Ala Asp Val Val
265 270 275
act acc act act cac aag tca ctc cgt gga cca cgt gga gcc atg ate 918
Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala Met Ile
280 285 290
ttt tac agg aag ggg gtg aaa gga gta aac aag caa ggc aaa gag gtt 966
Phe Tyr Arg Lys Gly Val Lys Gly Val Asn Lys Gln Gly Lys Glu Val
295 300 305
atg tat gac ttt gag gac aag ate aat gct gct gtc ttc cca ggt ctg1014
Met Tyr Asp Phe Glu Asp Lys Ile Asn Ala Ala Val Phe Pro Gly Leu
310 315 320
caa ggt gga cca cat aat cat acc att act ggc tta gct gtt gcg ctt1062
Gln Gly Gly Pro His Asn His Thr Ile Thr Gly Leu Ala Val Ala Leu325 330 335 340
aag cag gea act act ccg gag tac aga gct tat caa gag caa gtt atg1110
Lys Gln Ala Thr Thr Pro Glu Tyr Arg Ala Tyr Gln Glu Gln Val Met
345 350 355
agt aac tgt gea aaa ttt gea cag age ttg aca gea aaa ggc tac gaa1158
Ser Asn Cys Ala Lys Phe Ala Gln Ser Leu Thr Ala Lys Gly Tyr Glu360 365 370 ctt gtc 1206 tet ggt ggg act gac aac cat tta gtg ttg gta aat CtC aagLeu Val Ser 375 Gly Gly Thr Asp Asn 380 His Leu Val Leu Val 385 Asn Leu Lysage aag 1254 ggc ata gat ggt tca aga gtg gag aag gtt tta gaa aac gtgSer Lys 390 Gly Ile Asp Gly Ser 395 Arg Val Glu Lys Val 400 Leu Glu Asn Valcac att 1302 gca gca aac aag aac aca gtt CCt ggt gat gtt tca gct atgHis Ile 405 Ala Ala Asn Lys 410 Asn Thr Val Pro Gly Asp Val 415 Ser Ala Met 420gta cca 1350 gga ggc ate agg atg gga acc cca gca ctg acc tca aga ggaVal Pro Gly Gly Ile 425 Arg Met Gly Thr Pro 430 Ala Leu Thr Ser Arg 435 Glyttt gtt 1398 gag gag gac ttt gct aag gtt gct gat ttc ttc gat gca gcaPhe Val Glu Glu 440 Asp Phe Ala Lys Val 445 Ala Asp Phe Phe Asp 450 Ala Alagtg aac 1446 ttg gct ttg aag gtt aag gct gca gca ggt gga aca aaa ctgVal Asn Leu 455 Ala Leu Lys Val Lys 460 Ala Ala Ala Gly Gly 465 Thr Lys Leuaag gac 1494 ttt gtt gcc act ttg caa tet gat age aac att caa tcc gagLys Asp 470 Phe Val Ala Thr Leu 475 Gln Ser Asp Ser Asn 480 Ile Gln Ser Gluatt gca 1542 aaa Ctt cgc cat gat gtg gag gaa tat gca aaa cag ttc CCCZle Ala 485 Lys Leu Arg His 490 Asp Val Glu Glu Tyr Ala 495 Lys Gln Phe Pro 500aca att 1594 ggg ttt gag aaa gaa acc atg aag tac aag aac taa gaaacttt Thr Ile Gly Phe Glu 505 Lys Glu Thr Met Lys 510 Tyr Lys Asn
atggaacagc aagggtaaaa gaaaaggcat caagctgaat tcctgaggtg actgttggaa1654
ttcttgcaag aacaagtcgg tgtaaacata tatccatgga gtgccatctt atgtaaaagg1714
gacccctggc attttacagc gtgtggaaac tttgtcaata gttcttatcg tagacaccta1774
ctgtaagatg ttatgctaat gctatattaa ccttcactat cttcttggac aagcagttac1834
acatactttg gtgtattctg tgaataattc gcatgattgc ggaatttttc gtgtttataa1894
atcgtaactt gtaatctttt ggccctgcac gcaatttgaa agccctcgat cggattgtcg1954
tttactgcac acaaaaaaaa aaaaaaa1981
<210> 122<211> 513<212> PRT
<213> Oryza sativa<400> 122
Met Ala Met Ala Thr Ala Leu Arg Lys Leu Ser Ser Asp Ala Leu Arg1 5 10 15
Arg Gln Pro Leu Ser Arg Ile Thr Pro Leu Tyr Tyr Met Ala Ser Leu
20 25 30
Pro Ala Thr Glu Glu Arg Ser Gly Val Thr Trp Pro Lys Gln Leu Asn
35 40 45
Ala Pro Leu Glu Glu Val Asp Pro Glu Ile Ala Asp Ile Ile Glu His
50 55 60
Glu Lys Ala Arg Gln Trp Lys Gly Leu Glu Leu Ile Pro Ser Glu Asn65 70 75 80
Phe Thr Ser Val Ser Val Met Gln Ala Val Gly Ser Val Met Thr Asn
85 90 95
Lys Tyr Ser Glu Gly Tyr Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Glu
100 105 110
Tyr Ile Asp Met Ala Glu Ser Leu Cys Gln Lys Arg Ala Leu Glu Ala
115 120 125
Phe Arg Leu Asp Pro Ala Lys Trp Gly Val Asn Val Gln Pro Leu Ser
130 135 140
Gly Ser Pro Ala Asn Phe His Val Tyr Thr Ala Leu Leu Lys Pro His145 150 155 160
Glu Arg Ile Met Ala Leu Asp Leu Pro His Gly Gly His Leu Ser His
165 170 175
Gly Tyr Gln Thr Asp Thr Lys Lys Ile Ser Ala Val Ser Ile Phe Phe
180 185 190
Glu Thr Met Pro Tyr Arg Leu Asp Glu Ser Thr Gly Leu Ile Asp Tyr
195 200 205
Asp Gln Met Glu Lys Ser Ala Val Leu Phe Arg Pro Lys Leu Ile Val
210 215 220
Ala Gly Ala Ser Ala Tyr Ala Arg Leu Tyr Asp Tyr Asp Arg Met Arg225 230 235 240
Lys Val Cys Asp Lys Gln Lys Ala Ile Leu Leu Ala Asp Met Ala His
245 250 255
Ile Ser Gly Leu Val Ala Ala Gly Val Val Pro Ser Pro Phe Asp Tyr
260 265 270
Ala Asp Val Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg
275 280 285
Gly Ala Met Ile Phe Tyr Arg Lys Gly Val Lys Gly Val Asn Lys Gln
290 295 300
Gly Lys Glu Val Met Tyr Asp Phe Glu Asp Lys Ile Asn Ala Ala Val305 310 315 320
Phe Pro Gly Leu Gln Gly Gly Pro His Asn His Thr Ile Thr Gly Leu
325 330 335
Ala Val Ala Leu Lys Gln Ala Thr Thr Pro Glu Tyr Arg Ala Tyr Gln
340 345 350
Glu Gln Val Met Ser Asn Cys Ala Lys Phe Ala Gln Ser Leu Thr Ala
355 360 365
Lys Gly Tyr Glu Leu Val Ser Gly Gly Thr Asp Asn His Leu Val Leu
370 375 380
Val Asn Leu Lys Ser Lys Gly Ile Asp Gly Ser Arg Val Glu Lys Val385 390 395 400
Leu Glu Asn Val His Ile Ala Ala Asn Lys Asn Thr Val Pro Gly Asp
405 410 415
Val Ser Ala Met Val Pro Gly Gly Ile Arg Met Gly Thr Pro Ala Leu
420 425 430
Thr Ser Arg Gly Phe Val Glu Glu Asp Phe Ala Lys Val Ala Asp Phe
435 440 445
Phe Asp Ala Ala Val Asn Leu Ala Leu Lys Val Lys Ala Ala Ala Gly
450 455 460
Gly Thr Lys Leu Lys Asp Phe Val Ala Thr Leu Gln Ser Asp Ser Asn465 470 475 480
Ile Gln Ser Glu Ile Ala Lys Leu Arg His Asp Val Glu Glu Tyr Ala485 490 495
Lys Gln Phe Pro Thr Ile Gly Phe Glu Lys Glu Thr Met Lys Tyr Lys500 505 510
Asn
<210> 123<211> 1761<212> DNA
<213> Brassica napus
<220>
<221> CDS
<222> (28) .. (1581)
<400> 123
gagagagagg cagagaggtt ggtgaga atg gcg atg gct atg gct ctt cgg agg 54
Met Ala Met Ala Met Ala Leu Arg Arg1 5
ctt tct tct tca gtt gac aaa cct att cgt cct ctt ate aga tca tet 102
Leu Ser Ser Ser Val Asp Lys Pro Ile Arg Pro Leu Ile Arg Ser Ser
10 15 20 25
tca tgc tac atg tct tct tta cca agt gaa gct gtt gat gac aag gag 150
Ser Cys Tyr Met Ser Ser Leu Pro Ser Glu Ala Val Asp Asp Lys Glu
30 35 40
agg tct cgt gtc act tgg cca aaa cag ctt aac gea tct ttg gag gaa 198
Arg Ser Arg Val Thr Trp Pro Lys Gln Leu Asn Ala Ser Leu Glu Glu
45 50 55
gtt gat cct gag att gct gac ate att gag cat gag aaa gct aga caa 246
Val Asp Pro Glu Ile Ala Asp Ile Ile Glu His Glu Lys Ala Arg Gln
60 65 70
tgg aag gga ctt gaa etc att cca tct gag aat ttc aca tct gtc tcg 294
Trp Lys Gly Leu Glu Leu Ile Pro Ser Glu Asn Phe Thr Ser Val Ser
75 80 85
gtg atg caa gct gtt ggc tct gtg atg act aac aag tac agt gaa ggg 342
Val Met Gln Ala Val Gly Ser Val Met Thr Asn Lys Tyr Ser Glu Gly90 95 100 105
tac cct ggt gct aga tac tat gga gga aat gag tac ata gac atg gcg 390
Tyr Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Met Ala
110 115 120
gaa acc ttg tgc cag aag cgt gct ctt gaa gct ttc cgg tta gac cct 438
Glu Thr Leu Cys Gln Lys Arg Ala Leu Glu Ala Phe Arg Leu Asp Pro
125 130 135
gag aag tgg gga gtc aat gtg caa cct ttg tct gga tct cct gcc aac 486
Glu Lys Trp Gly Val Asn Val Gln Pro Leu Ser Gly Ser Pro Ala Asn
140 145 150
ttc cat gtg tac act gea ttg ttg aag cct cat gag aga ate atg gea 534
Phe His Val Tyr Thr Ala Leu Leu Lys Pro His Glu Arg Ile Met Ala
155 160 165
ctt gat ctt cct cat ggt ggt cat ctt tct cat ggt tac cag act gac 582
Leu Asp Leu Pro His Gly Gly His Leu Ser His Gly Tyr Gln Thr Asp170 175 180 185
acc aag aag ata tct gct gtg tct ate ttt ttt gaa act atg ccc tac 630
Thr Lys Lys Ile Ser Ala Val Ser Ile Phe Phe Glu Thr Met Pro Tyr
190 195 200
cgc ttg gac gag age act ggc ttc ate gac tac gac cag atg gag aag 678
Arg Leu Asp Glu Ser Thr Gly Phe Ile Asp Tyr Asp Gln Met Glu Lys
205 210 215
agt gct act ctt ttc agg cca aaa ctg att gtt gct ggt gea agt gct 726
Ser Ala Thr Leu Phe Arg Pro Lys Leu Ile Val Ala Gly Ala Ser Ala
220 225 230
tat gct cga ttg tat gac tat gcc cgc ate cga aag gtg tgt aac aag 774
Tyr Ala Arg Leu Tyr Asp Tyr Ala Arg Ile Arg Lys Val Cys Asn Lys
\235 240 245
caa aaa gct gtg atg cta gca gat atg gca cac ata age ggt ttg gtt 822
Gln Lys Ala Val Met Leu Ala Asp Met Ala His Ile Ser Gly Leu Val250 255 260 265
gca gct ggt gta ate cct tca ccg ttc gaa tat gca gat gtt gta acc 870
Ala Ala Gly Val Ile Pro Ser Pro Phe Glu Tyr Ala Asp Val Val Thr
270 275 280
acc aca act cac aag tca ctt cgt gga cct cgt ggt gcc atg att ttc 918
Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala Met Ile Phe
285 290 295
tac aga aag ggt gtt aag gaa att aac aaa caa ggg aaa gag gtt atg 966
Tyr Arg Lys Gly Val Lys Glu Ile Asn Lys Gln Gly Lys Glu Val Met
300 305 310
tat gat ttt gaa gac aag ate aat caa gct gtc ttc cct ggt ctt caa1014
Tyr Asp Phe Glu Asp Lys Ile Asn Gln Ala Val Phe Pro Gly Leu Gln
315 320 325
ggt ggt cca cac aac cac act att aca gga cta gct gtt gct tta aaa1062
Gly Gly Pro His Asn His Thr Ile Thr Gly Leu Ala Val Ala Leu Lys330 335 340 345
cag gca act act tca gag tac aaa gca tac caa gag caa gtc ctc agt1110
Gln Ala Thr Thr Ser Glu Tyr Lys Ala Tyr Gln Glu Gln Val Leu Ser
350 355 360
aac tet gca aag ttt gct cag act ctg atg gag aaa ggt tat gaa ctt1158
Asn Ser Ala Lys Phe Ala Gln Thr Leu Met Glu Lys Gly Tyr Glu Leu
365 370 375
gtt tet ggt gga act gac aac cat ctg gtt cta gtg aac ctg aag ccc1206
Val Ser Gly Gly Thr Asp Asn His Leu Val Leu Val Asn Leu Lys Pro
380 385 390
aag gga att gat gga tet aga gtt gag aaa gta ctg gaa gct gtt cac1254
Lys Gly Ile Asp Gly Ser Arg Val Glu Lys Val Leu Glu Ala Val His
395 400 405
att gca tcc aac aaa aac act gtt cct gga gat gtt tet gcc atg gtt1302
Ile Ala Ser Asn Lys Asn Thr Val Pro Gly Asp Val Ser Ala Met Val410 415 420 425
cct ggt gga ate aga atg ggt act cct gct ctc act tcc aga ggc ttt1350
Pro Gly Gly Ile Arg Met Gly Thr Pro Ala Leu Thr Ser Arg Gly Phe
430 435 440
gtt gag gaa gac ttt gcc aaa gta gct gag tac ttt gac aaa gct gtg1398
Val Glu Glu Asp Phe Ala Lys Val Ala Glu Tyr Phe Asp Lys Ala Val
445 450 455
aag ttg gct ctc aaa gtc aaa tet gaa gct caa gga acc aaa ctg aaa1446
Lys Leu Ala Leu Lys Val Lys Ser Glu Ala Gln Gly Thr Lys Leu Lys
460 465 470
gat ttt gtg tca gca atg gaa tca tet tca gcc att caa tca gag att1494
Asp Phe Val Ser Ala Met Glu Ser Ser Ser Ala Ile Gln Ser Glu Ile
475 480 485
gcc aag ctg cgc cac gac gtg gag gag ttc gct aag cag ttc cca act1542
Ala Lys Leu Arg His Asp Val Glu Glu Phe Ala Lys Gln Phe Pro Thr490 495 500 505
att ggg ttt gag aaa gaa acc atg aag tac aag aac tga acatgtcttt1591
\Ile Gly Phe Glu Lys Glu Thr Met Lys Tyr Lys Asn
510 515
atccctacaa acaagtcttt tattatgatg atgctttgaa cttccatgta atgtatagat1651
aatatgatac atgtactcta tctttatggt atgcgaaaag atactgtact ttctatgcaa1711
atctttttct taaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa1761
<210> 124<211> 517<212> PRT
<213> Brassica napus<400> 124
Met Ala Met Ala Met Ala Leu Arg Arg Leu Ser Ser Ser Val Asp Lys1 5 10 15
Pro Ile Arg Pro Leu Ile Arg Ser Ser Ser Cys Tyr Met Ser Ser Leu
20 25 30
Pro Ser Glu Ala Val Asp Asp Lys Glu Arg Ser Arg Val Thr Trp Pro
35 40 45
Lys Gln Leu Aisn Ala Ser Leu Glu Glu Val Asp Pro Glu Ile Ala Asp
50 55 60
Ile Ile Glu His Glu Lys Ala Arg Gln Trp Lys Gly Leu Glu Leu Ile65 70 75 80
Pro Ser Glu Asn Phe Thr Ser Val Ser Val Met Gln Ala Val Gly Ser
85 90 95
Val Met Thr Asn Lys Tyr Ser Glu Gly Tyr Pro Gly Ala Arg Tyr Tyr
100 105 110
Gly Gly Asn Glu Tyr Ile Asp Met Ala Glu Thr Leu Cys Gln Lys Arg
115 120 125
Ala Leu Glu Ala Phe Arg Leu Asp Pro Glu Lys Trp Gly Val Asn Val
130 135 140
Gln Pro Leu Ser Gly Ser Pro Ala Asn Phe His Val Tyr Thr Ala Leu145 150 155 160
Leu Lys Pro His Glu Arg Ile Met Ala Leu Asp Leu Pro His Gly Gly
165 170 175
His Leu Ser His Gly Tyr Gln Thr Asp Thr Lys Lys Ile Ser Ala Val
180 185 190
Ser Ile Phe Phe Glu Thr Met Pro Tyr Arg Leu Asp Glu Ser Thr Gly
195 200 205
Phe Ile Asp Tyr Asp Gln Met Glu Lys Ser Ala Thr Leu Phe Arg Pro
210 215 220
Lys Leu Ile Val Ala Gly Ala Ser Ala Tyr Ala Arg Leu Tyr Asp Tyr225 230 235 240
Ala Arg Ile Arg Lys Val Cys Asn Lys Gln Lys Ala Val Met Leu Ala
245 250 255
Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Gly Val Ile Pro Ser
260 265 270
Pro Phe Glu Tyr Ala Asp Val Val Thr Thr Thr Thr His Lys Ser Leu
275 280 285
Arg Gly Pro Arg Gly Ala Met Ile Phe Tyr Arg Lys Gly Val Lys Glu
290 295 300
Ile Asn Lys Gln Gly Lys Glu Val Met Tyr Asp Phe Glu Asp Lys Ile305 310 315 320
Asn Gln Ala Val Phe Pro Gly Leu Gln Gly Gly Pro His Asn His Thr
325 330 335
Ile Thr Gly Leu Ala Val Ala Leu Lys Gln Ala Thr Thr Ser Glu Tyr
340 345 350
Lys Ala Tyr Gln Glu Gln Val Leu Ser Asn Ser Ala Lys Phe Ala Gln
\355 360 365
Thr Leu Met Glu Lys Gly Tyr Glu Leu Val Ser Gly Gly Thr Asp Asn
370 375 380
His Leu Val Leu Val Asn Leu Lys Pro Lys Gly Ile Asp Gly Ser Arg385 390 395 400
Val Glu Lys Val Leu Glu Ala Val His Ile Ala Ser Asn Lys Asn Thr
405 410 415
Val Pro Gly Asp Val Ser Ala Met Val Pro Gly Gly Ile Arg Met Gly
420 425 430
Thr Pro Ala Leu Thr Ser Arg Gly Phe Val Glu Glu Asp Phe Ala Lys
435 440 445
Val Ala Glu Tyr Phe Asp Lys Ala Val Lys Leu Ala Leu Lys Val Lys
450 455 460
Ser Glu Ala Gln Gly Thr Lys Leu Lys TVsp Phe Val Ser Ala Met Glu465 470 475 480
Ser Ser Ser Ala Ile Gln Ser Glu Ile Ala Lys Leu Arg His Asp Val
485 490 495
Glu Glu Phe Ala Lys Gln Phe Pro Thr Ile Gly Phe Glu Lys Glu Thr
500 505 510
Met Lys Tyr Lys Asn515
<210> 125<211> 1845<212> DNA
<213> Brassica napus
<220><221> CDS
<222> (148) .. (1701)<400> 125
gccaaaagca gaggccaaaa ttctctctgt catctctcca caggataaac ccactagtct 60
tttttttttc tctcgttcat gattcaaatc tatctctagg gtgtttccaa agagagaggg 120
agctaggcag agagaggttc agcgaaa atg gcg atg gcc atg gct ctt cgg aga 174
Met Ala Met Ala Met Ala Leu Arg Arg
Ctt tct tct tca gtt gac aaa 1 cct att cgt cct 5 Ctt ate aga tca act 222Leu Ser Ser Ser Val Asp Lys Pro Ile Arg Pro Leu Ile Arg Ser Thr 10 15 20 25 aca tgc tac atg tca tct ctg CCC agt gaa gct gtt gat gac aag gag 270Thr Cys Tyr Met Ser 30 Ser Leu Pro Ser Glu 35 Ala Val Asp Asp Lys 40 Glu aga tct cgt gtc act tgg cca aaa cag Ctt aac gca tct ttg gag gag 318Arg Ser Arg Val 45 Thr Trp Pro Lys Gln 50 Leu Asn Ala Ser Leu 55 Glu Glu gtt gat cct gag att gct gac att att gag cat gag aaa gct aga caa 366Val Asp Pro 60 Glu Ile Ala Asp Ile 65 Ile Glu His Glu Lys 70 Ala Arg Gln tgg aag gga Ctt gaa ctc att cca tct gag aat ttc aca tct gtc tcg 414Trp Lys 75 Gly Leu Glu Leu Ile 80 Pro Ser Glu Asn Phe 85 Thr Ser Val Ser gtg atg caa gct gtt ggc tct gtg atg act aac aag tac agt gaa ggg 462Val Met Gln Ala Val Gly Ser Val Met Thr Asn Lys Tyr Ser Glu Gly 90 95 100 105 tac cct ggt gct aga tac tat gga gga aat gag tac ata gac atg gca 510Tyr Pro Gly Ala Arg 110 Tyr Tyr Gly Gly Asn 115 Glu Tyr Ile Asp Met 120 Ala gag act tta tgc caa aag cgc gct Ctt gag gct ttc aga tta gat cct 558Glu Thr Leu Cys 125 Gln Lys Arg Ala Leu 130 Glu Ala Phe Arg Leu 135 Asp Progaa aag tgg gga gtg aat gtg caa CCC ttg tct gga tct cct gcc aac 606Glu Lys Trp 140 Gly Val Asn Val Gln 145 Pro Leu Ser Gly Ser 150 Pro Ala Asn ttc cat gtc tac act gca ttg ctc aaa CCt cat gag aga ate atg gca 654Phe His 155 Val Tyr Thr Ala Leu 160 Leu Lys Pro His Glu 165 Arg Ile Met Ala Ctt gat Ctt CCt cat ggt ggt cat Ctt tct cat ggt tat cag act gac 702Leu Asp Leu Pro His Gly Gly His Leu Ser His Gly Tyr Gln Thr Asp 170 175 180 185 acc aag aag ata tct gct gtg tct ate ttc ttt gag aca atg cct tat 750Thr Lys Lys Ile Ser 190 Ala Val Ser Ile Phe 195 Phe Glu Thr Met Pro 200 Tyr cgc ttg gac gag age act ggc tac att gac tat gat cag atg gag aaa 798Arg Leu Asp Glu Ser Thr Gly Tyr Ile Asp Tyr Asp Gln Met Glu Lys 205 210 215 agt gct act Ctt ttc agg cca aaa ctg att gtt gct ggt gcg agt gct 846Ser Ala Thr Leu Phe Arg Pro Lys Leu Ile Val Ala Gly Ala Ser Ala 220 225 230 tat gct cga ttg tat gac tat gcc cgc ate cga aag gtg tgt aac aag 894Tyr Ala Arg Leu Tyr Asp Tyr Ala Arg Ile Arg Lys Val Cys Asn Lys 235 240 245 caa aaa gct gtg atg cta gca gat atg gca cac ate agt ggt ttg gtt 942Gln Lys Ala Val Met Leu Ala Asp Met Ala His Ile Ser Gly Leu Val 250 255 260 265 gct gct ggt gta ate CCt tca ccg ttc gac tat gca gat gtt gtg acc 990Ala Ala Gly Val Ile Pro Ser Pro Phe Asp Tyr Ala Asp Val Val Thr 270 275 280 acc aca act cac aag tca Ctt cgt gga CCC cgt gga gcc atg att ttc 1038 Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala Met Ile Phe 285 290 295 tac aga aag ggt gtt aag gaa att aac aaa caa ggg aaa gag gtt ttg 1086 Tyr Arg Lys Gly Val Lys Glu Ile Asn Lys Gln Gly Lys Glu Val Leu 300 305 310 tat gat ttt gaa gac aag ata aat caa gct gtc ttc CCt ggt Ctt caa 1134 Tyr Asp Phe Glu Asp Lys Ile Asn Gln Ala Val Phe Pro Gly Leu Gln 315 320 325 ggt ggt cca cat aac cac act att aca gga cta gct gtt gct tta aaa 1182 Gly Gly Pro His Asn His Thr Ile Thr Gly Leu Ala Val Ala Leu Lys 330 335 340 345 cag gca act act tca gag tac aaa gca tac caa gag caa gtc ctc agt 1230 Gln Ala Thr Thr Ser 350 Glu Tyr Lys Ala Tyr 355 Gln Glu Gln Val Leu 360 Ser aac tct gca aag ttt gct cag act ctg atg gag aaa ggt tat gaa Ctt 1278 Asn Ser Ala Lys 365 Phe Ala Gln Thr Leu 370 Met Glu Lys Gly Tyr 375 Glu Leu gtt tct ggt gga act gac aac cat ctg gtt cta gtg aac ctg aag CCC 1326 Val Ser Gly Gly Thr Asp Asn His Leu Val Leu Val Asn Leu Lys Pro 380 385 390 aag gga att gat gga tct aga gtt gag aaa gtg ttg gaa gct gtt cac 1374 Lys Gly Ile Asp Gly Ser Arg Val Glu Lys Val Leu Glu Ala Val His 395 400 405 att gca tcc aac aaa aac act gtt CCt gga gat gtt tct gcc atg gtt 1422 Ile Ala Ser Asn Lys Asn Thr Val Pro Gly Asp Val Ser Ala Met Val 410 415 420 425cct ggt gga ate aga atg ggt aca cct gct ctc act tcc aga ggc ttt1470
Pro Gly Gly Ile Arg Met Gly Thr Pro Ala Leu Thr Ser Arg Gly Phe
430 435 440
gtt gag gaa gac ttt gct aaa gta gct gaa tac ttt gac aaa gct gta1518
Val Glu Glu Asp Phe Ala Lys Val Ala Glu Tyr Phe Asp Lys Ala Val
445 450 455
acg ttg gct ctc aaa gtc aaa tet gaa gct caa ggg acc aag ctg aaa1566
Thr Leu Ala Leu Lys Val Lys Ser Glu Ala Gln Gly Thr Lys Leu Lys
460 465 470
gac ttt gtg tca gea atg gaa gct tet tca acc att caa tca gag att1614
Asp Phe Val Ser Ala Met Glu Ala Ser Ser Thr Ile Gln Ser Glu Ile
475 480 485
gct aag ctg cgc cat gaa gtt gag gaa ttt gct aaa cag ttt cca aca1662
Ala Lys Leu Arg His Glu Val Glu Glu Phe Ala Lys Gln Phe Pro Thr490 495 500 505
att ggg ttt gag aaa gaa acc atg aag tac aag aac taa atgttttatc1711
Ile Gly Phe Glu Lys Glu Thr Met Lys Tyr Lys Asn
510 515
ctacaagtct ttttattatg ctttgaactt ccatggaatg tatagatgat aataatccac1771
gtacactcta aactctgtct tatgctatga gaaaaaaata atgggcgttc tatgcaagaa1831
aaaaaaaaaa aaaa1845
<210> 126<211> 517<212> PRT<213> Brassica
<400> 126Met Ala Met Ala1
Pro Ile Arg Pro20
Pro Ser Glu Ala35
Lys Gln Leu Asn50
Ile Ile Glu His65
Pro Ser Glu Asn
Val Met Thr Asn100
Gly Gly Asn Glu115
Ala Leu Glu Ala130
Gln Pro Leu Ser145
Leu Lys Pro HisHis Leu Ser His
napus
Met Ala Leu Arg Arg Leu5 10
Leu Ile Arg Ser Thr Thr25
Val Asp Asp Lys Glu Arg40
Ala Ser Leu Glu Glu Val55
Glu Lys Ala Arg Gln Trp70
Phe Thr Ser Val Ser Val85 90
Lys Tyr Ser Glu Gly Tyr105
Tyr Ile Asp Met Ala Glu120
Phe Arg Leu Asp Pro Glu135
Gly Ser Pro Ala Asn Phe150
Glu Arg Ile Met Ala Leu165 170
Gly Tyr Gln Thr Asp Thr
Ser Ser Ser Val Asp 15 LysCys Tyr Met Ser 30 Ser LeuSer Arg Val 45 Thr Trp ProAsp Pro 60 Glu Ile Ala AspLys Gly Leu Glu Leu Ile75 80Met Gln Ala Val Gly 95 SerPro Gly Ala Arg 110 Tyr TyrThr Leu Cys 125 Gln Lys ArgLys Trp Gly Val Asn Val 140 His Val Tyr Thr Ala Leu155 160Asp Leu Pro His Gly 175 GlyLys Lys Ile Ser Ala Val180 185 190 Ser Ile Phe Phe Glu Thr Met Pro Tyr Arg Leu Asp Glu Ser Thr Gly 195 200 205 Tyr Ile Asp Tyr Asp Gln Met Glu Lys Ser Ala Thr Leu Phe Arg Pro 210 215 220 Lys Leu Ile Val Ala Gly Ala Ser Ala Tyr Ala Arg Leu Tyr Asp Tyr225 230 235 240Ala Arg Ile Arg Lys Val Cys Asn Lys Gln Lys Ala Val Met Leu Ala 245 250 255 Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Gly Val Ile Pro Ser 260 265 270 Pro Phe Asp Tyr Ala Asp Val Val Thr Thr Thr Thr His Lys Ser Leu 275 280 285 Arg Gly Pro Arg Gly Ala Met Ile Phe Tyr Arg Lys Gly Val Lys Glu 290 295 300 Ile Asn Lys Gln Gly Lys Glu Val Leu Tyr Asp Phe Glu Asp Lys Ile305 310 315 320Asn Gln Ala Val Phe Pro Gly Leu Gln Gly Gly Pro His Asn His Thr 325 330 335 Ile Thr Gly Leu Ala Val Ala Leu Lys Gln Ala Thr Thr Ser Glu Tyr 340 345 350 Lys Ala Tyr Gln Glu Gln Val Leu Ser Asn Ser Ala Lys Phe Ala Gln 355 360 365 Thr Leu Met Glu Lys Gly Tyr Glu Leu Val Ser Gly Gly Thr Asp Asn 370 375 380 His Leu Val Leu Val Asn Leu Lys Pro Lys Gly Ile Asp Gly Ser Arg385 390 395 400Val Glu Lys Val Leu Glu Ala Val His Ile Ala Ser Asn Lys Asn Thr 405 410 415 Val Pro Gly Asp Val Ser Ala Met Val Pro Gly Gly Ile Arg Met Gly 420 425 430 Thr Pro Ala Leu Thr Ser Arg Gly Phe Val Glu Glu Asp Phe Ala Lys 435 440 445 Val Ala Glu Tyr Phe Asp Lys Ala Val Thr Leu Ala Leu Lys Val Lys 450 455 460 Ser Glu Ala Gln Gly Thr Lys Leu Lys Asp Phe Val Ser Ala Met Glu465 470 475 480Ala Ser Ser Thr Ile Gln Ser Glu Ile Ala Lys Leu Arg His Glu Val 485 490 495 Glu Glu Phe Ala Lys Gln Phe Pro Thr Ile Gly Phe Glu Lys Glu Thr 500 505 510 Met Lys Tyr Kl K Lys Asn
515
<210> 127<211> 1846<212> DNA
<213> Brassica napus
<220><221> CDS
<222> (146)..(1699)<400> 127
gccaaaagca gaggccaaaa ttctctctgt catctctcca caggataaac ccactagtct 60
tttttttttc tctcgttcat gattcaaatc tatctctagg gtttccaaag agagagggag 120
ctaggcagag agaggttcag cgaaa atg gcg atg gcc atg gct ctt cgg cga 172
Met Ala Met Ala Met Ala Leu Arg Arg1 5
ctt tct tct tca gtt gac aaa cct att cgt cct ctt ate aga tca act 220
Leu Ser Ser Ser Val Asp Lys Pro Ile Arg Pro Leu Ile Arg Ser Thr
\10 15 20 25 aca tgc tac atg tca tct ctg CCC agt gaa gct gtt gat gac aag gag 268Thr Cys Tyr Met Ser Ser Leu Pro Ser Glu Ala Val Asp Asp Lys Glu 30 35 40 aga tct cgt gtc act tgg cca aaa aag ctt aac gea tct ttg gag gag 316Arg Ser Arg Val 45 Thr Trp Pro Lys Lys 50 Leu Asn Ala Ser Leu 55 Glu Glu gtt gat CCt gag att gct gac att att gag cat gag aaa gct aga caa 364Val Asp Pro Glu Ile Ala Asp Ile Ile Glu His Glu Lys Ala Arg Gln 60 65 70 tgg aag gga ctt gaa ctc att cca tct gag aat ttc aca tct gtc tcg 412Trp Lys 75 Gly Leu Glu Leu Ile 80 Pro Ser Glu Asn Phe 85 Thr Ser Val Ser gtg atg caa gct gtt ggc tct gtg atg act aac aag tac agt gaa ggg 460Val Met Gln Ala Val Gly Ser Val Met Thr Asn Lys Tyr Ser Glu Gly 90 95 100 105 cac CCt ggt gct aga tac tat gga gga aat gag tac ata gac atg gea 508His Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Met Ala 110 115 120 gag act tta tgc caa aag cgc gct ctt gag gct ttc aga tta gat cct 556Glu Thr Leu Cys Gln Lys Arg Ala Leu Glu Ala Phe Arg Leu Asp Pro 125 130 135 gaa aag tgg gga gtg aat gtg caa CCC ttg tct gga tct cct gcc aac 604Glu Lys Trp Gly Val Asn Val Gln Pro Leu Ser Gly Ser Pro Ala Asn 140 145 150 ttc cat gtc tac act gea ttg CtC aaa cct cat gag aga ate atg gea 652Phe His 155 Val Tyr Thr Ala Leu 160 Leu Lys Pro His Glu 165 Arg Ile Met Ala Ctt gat Ctt cct cat ggt ggt cat ctt tct cat ggt tat cag act gac 700Leu Asp Leu Pro His Gly Gly His Leu Ser His Gly Tyr Gln Thr Asp 170 175 180 185 acc aag aag ata tct gct gtg tct ate ttc ttt gag aca atg cct tat 748Thr Lys Lys Ile Ser 190 Ala Val Ser Ile Phe 195 Phe Glu Thr Met Pro 200 Tyr cgc ttg gac gag age act ggc tac att gac tat gat cag atg gag aaa 796Arg Leu Asp Glu 205 Ser Thr Gly Tyr Ile 210 Asp Tyr Asp Gln Met 215 Glu Lys agt gct act ctt ttc agg cca aaa ctg att gtt gct ggt gcg agt gct 844Ser Ala Thr Leu Phe Arg Pro Lys Leu Ile Val Ala Gly Ala Ser Ala 220 225 230 tat gct cga ttg tat gac tat gcc cgc ate cga aag gtg tgt aac aag 892Tyr Ala 235 Arg Leu Tyr Asp Tyr 240 Ala Arg Ile Arg Lys 245 Val Cys Asn Lys caa aaa gct gtg atg cta gea gat atg gea cac ate agt ggt ttg gtt 940Gln Lys Ala Val Met Leu Ala Asp Met Ala His Ile Ser Gly Leu Val 250 255 260 265 gct gct ggt gta ate cct tca ccg ttc gac tat gea gat gtt gtg acc 988Ala Ala Gly Val Ile Pro Ser Pro Phe Asp Tyr Ala Asp Val Val Thr 270 275 280 acc aca act cac aag tca ctt cgt gga CCC cgt gga gcc gtg att ttc 1036 Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala Val Ile Phe 285 290 295 tac aga aag ggt gtt aaa gaa att aac aaa caa ggg aaa gag gtt ttg
1084
Tyr Arg Lys Gly Val Lys Glu Ile Asn Lys Gln Gly Lys Glu Val Leu
300 305 310
tat gat ttt gaa gac aag ata aat caa gcc gtc ttc cct ggt ctt caa1132
Tyr Asp Phe Glu Asp Lys Ile Asn Gln Ala Val Phe Pro Gly Leu Gln
315 320 325
ggt ggt cca cat aac cac act att aca gga cta gct gtt gct tta aaa1180Gly Gly Pro His Asn His Thr Ile Thr Gly Leu Ala Val Ala Leu Lys330 335 340 345
cag gca act act tca gag tac aaa gca tac caa gag caa gtc ctg age1228
Gln Ala Thr Thr Ser Glu Tyr Lys Ala Tyr Gln Glu Gln Val Leu Ser
350 355 360
aac tet gca aag ttc gct cag act ctg atg gag aaa ggt tat gaa ctt1276
Asn Ser Ala Lys Phe Ala Gln Thr Leu Met Glu Lys Gly Tyr Glu Leu
365 370 375
gtt tet ggt gga acc gac aac cat ctg gtt cta gtg aac ctg aag ccc1324
Val Ser Gly Gly Thr Asp Asn His Leu Val Leu Val Asn Leu Lys Pro
380 385 390
aag gga att gat gga tet aga gtt gag aaa gtg ttg gaa gct gtt cac1372
Lys Gly Ile Asp Gly Ser Arg Val Glu Lys Val Leu Glu Ala Val His
395 400 405
att gca tca aac aaa aac act gtt cct gga gat gtt tet gcc atg gtt1420
Ile Ala Ser Asn Lys Asn Thr Val Pro Gly Asp Val Ser Ala Met Val410 415 420 425
cct ggt gga ate aga atg ggt aca cct gct ctc act tcc aga ggc ttt1468
Pro Gly Gly Ile Arg Met Gly Thr Pro Ala Leu Thr Ser Arg Gly Phe
430 435 440
gtt gag gaa gac ttt gct aaa gta gct gaa tac ttt gac aaa gct gta1516
Val Glu Glu Asp Phe Ala Lys Val Ala Glu Tyr Phe Asp Lys Ala Val
445 450 455
acg ttg gct ctc aaa gtc aaa tet gaa gct caa ggg acc aag ctg aaa1564
Thr Leu Ala Leu Lys Val Lys Ser Glu Ala Gln Gly Thr Lys Leu Lys
460 465 470
gac ttt gtg tca gca atg gaa gct tet tca acc att caa tca gag att1612
Asp Phe Val Ser Ala Met Glu Ala Ser Ser Thr Ile Gln Ser Glu Ile
475 480 485
gct aag ctg cgc cat gaa gtt gag gaa ttt gct aaa cag ttt cca aca1660
Ala Lys Leu Arg His Glu Val Glu Glu Phe Ala Lys Gln Phe Pro Thr490 495 500 505
att ggg ttt gag aaa gaa acc atg aag tac aag aac taa atgttttatc1709
Ile Gly Phe Glu Lys Glu Thr Met Lys Tyr Lys Asn
510 515
ctacaagtct ttttttatta tgctttgaac ttccatggaa tgtatagatg ataataatcc1769
acgtacactc taaactctgt cttatgctat gagaaaaaat aatgaacgtt ctatgcaaat1829
cgaaaaaaaa aaaaaaa1846
<210> 128<211> 517<212> PRT
<213> Brassica napus<400> 128
Met Ala Met Ala Met Ala Leu Arg Arg Leu Ser Ser Ser Val Asp Lys1 5 10 15
Pro Ile Arg Pro Leu Ile Arg Ser Thr Thr Cys Tyr Met Ser Ser Leu
20 25 30
Pro Ser Glu Ala Val Asp Asp Lys Glu Arg Ser Arg Val Thr Trp Pro
35 40 45
Lys Lys Leu Asn Ala Ser Leu Glu Glu Val Asp Pro Glu Ile Ala Asp
50 55 60
Ile Ile Glu His Glu Lys Ala Arg Gln Trp Lys Gly Leu Glu Leu Ile65 70 75 80
Pro Ser Glu Asn Phe Thr Ser Val Ser Val Met Gln Ala Val Gly Ser
85 90 95
Val Met Thr Asn Lys Tyr Ser Glu Gly His Pro Gly Ala Arg Tyr Tyr
100 105 110
Gly Gly Asn Glu Tyr Ile Asp Met Ala Glu Thr Leu Cys Gln Lys Arg
115 120 125
Ala Leu Glu Ala Phe Arg Leu Asp Pro Glu Lys Trp Gly Val Asn Val
130 135 140
Gln Pro Leu Ser Gly Ser Pro Ala Asn Phe His Val Tyr Thr Ala Leu145 150 155 160
Leu Lys Pro His Glu Arg Ile Met Ala Leu Asp Leu Pro His Gly Gly
165 170 175
His Leu Ser His Gly Tyr Gln Thr Asp Thr Lys Lys Ile Ser Ala Val
180 185 190
Ser Ile Phe Phe Glu Thr Met Pro Tyr Arg Leu Asp Glu Ser Thr Gly
195 200 205
Tyr Ile Asp Tyr Asp Gln Met Glu Lys Ser Ala Thr Leu Phe Arg Pro
210 215 220
Lys Leu Ile Val Ala Gly Ala Ser Ala Tyr Ala Arg Leu Tyr Asp Tyr225 230 235 240
Ala Arg Ile Arg Lys Val Cys Asn Lys Gln Lys Ala Val Met Leu Ala
245 250 255
Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Gly Val Ile Pro Ser
260 265 270
Pro Phe Asp Tyr Ala Asp Val Val Thr Thr Thr Thr His Lys Ser Leu
275 280 285
Arg Gly Pro Arg Gly Ala Val Ile Phe Tyr Arg Lys Gly Val Lys Glu
290 295 300
Ile Asn Lys Gln Gly Lys Glu Val Leu Tyr Asp Phe Glu Asp Lys Ile305 310 315 320
Asn Gln Ala Val Phe Pro Gly Leu Gln Gly Gly Pro His Asn His Thr
325 330 335
Ile Thr Gly Leu Ala Val Ala Leu Lys Gln Ala Thr Thr Ser Glu Tyr
340 345 350
Lys Ala Tyr Gln Glu Gln Val Leu Ser Asn Ser Ala Lys Phe Ala Gln
355 360 365
Thr Leu Met Glu Lys Gly Tyr Glu Leu Val Ser Gly Gly Thr Asp Asn
370 375 380
His Leu Val Leu Val Asn Leu Lys Pro Lys Gly Ile Asp Gly Ser Arg385 390 395 400
Val Glu Lys Val Leu Glu Ala Val His Ile Ala Ser Asn Lys Asn Thr
405 410 415
Val Pro Gly Asp Val Ser Ala Met Val Pro Gly Gly Ile Arg Met Gly
420 425 430
Thr Pro Ala Leu Thr Ser Arg Gly Phe Val Glu Glu Asp Phe Ala Lys
435 440 445
Val Ala Glu Tyr Phe Asp Lys Ala Val Thr Leu Ala Leu Lys Val Lys
450 455 460
Ser Glu Ala Gln Gly Thr Lys Leu Lys Asp Phe Val Ser Ala Met Glu465 470 475 480
Ala Ser Ser Thr Ile Gln Ser Glu Ile Ala Lys Leu Arg His Glu Val
485 490 495
Glu Glu Phe Ala Lys Gln Phe Pro Thr Ile Gly Phe Glu Lys Glu Thr500 505 510Met Lys Tyr Lys Asn515
<210> 129<211> 1145<212> DNA
<213> Linum usit.at.issImum
<220>
<221> CDS
<222> (62)..(1003)
<220>
<221> misc_feature<222> (940).. (1037)
<223> η localizado nas posições 940, 1014, 1020 and 1037; cada η é a, c,g, ou t
<400> 129
cctcaaactc ccccaatcct ctgtttcctt ttctctctct ctctctctga atctcagcaa 60
a atg gat cca gtc aag gta tgg gga aac act cct ttg caa acc gtg gac 109
Met Asp Pro Val Lys Val Trp Gly Asn Thr Pro Leu Gln Thr Val Asp15 10 15
cct gag ate cac gac ctc ate gag aag gag aag cgc cgt caa tgc cgc 157
Pro Glu Ile His Asp Leu Ile Glu Lys Glu Lys Arg Arg Gln Cys Arg
20 25 30
ggg ate gag ctc ate gcc tcc gag aac ttc acc tcc ttc gcc gtc ate 205
Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Ile
35 40 45
gaa gcc ctc ggc age gcc ctc acc aac aag tac tcc gag ggc atg ccc 253
Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro
50 55 60
gga aat cgc tac tac ggc ggc aac gag tac ate gat cag ate gag aac 301
Gly Asn Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Gln Ile Glu Asn65 70 75 80
ctc tgc gta tcc cgc gcc ttg acc gct ttc cac ttg gac gac acc aag 349
Leu Cys Val Ser Arg Ala Leu Thr Ala Phe His Leu Asp Asp Thr Lys
85 90 95
tTO 99a aat gtc cag cct tac tcc ggc tcc cct gcc aat ttc gcc 397
Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala
100 105 110
gcc tac acc gcc att ctc aag ccc cat gat cgt ate atg gga ttg gat 445
Ala Tyr Thr Ala Ile Leu Lys Pro His Asp Arg Ile Met Gly Leu Asp
115 120 125
ctc cca tet ggt ggt cat ctg act cat gga tac tac acc tcc age ggg 493
Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ser Ser Gly
130 135 140
aag aag ate tcc gcc act tcc ate tac ttc gag age ttg cct tac aag 541
Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys145 150 155 160
gtg aat tcc age act ggc tac ate gac tac gat aag ctg gaa gag aag 589
Val Asn Ser Ser Thr Gly Tyr Ile Asp Tyr Asp Lys Leu Glu Glu Lys
165 170 175
gct ttg gat ttc agg cca cgg ttg ate ate tgt ggt ggc agt gct tac 637
Ala Leu Asp Phe Arg Pro Arg Leu Ile Ile Cys Gly Gly Ser Ala Tyr
180 185 190
cct agg gac tgg gat tac gct agg ttc agg gct att gct gat aaa tgc 685
Pro Arg Asp Trp Asp Tyr Ala Arg Phe Arg Ala Ile Ala Asp Lys Cys
195 200 205
ggc gea ctt ttg ctc tgc gat atg gct cac att age ggc cta gtt gct 733
Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala210 215 220gct cag gaa gct gcc aac ccc ttt gag ttc tgt gac att gtc aca accAla Gln Glu Ala Ala Asn Pro Phe Glu Phe Cys Asp Ile Val Thr Thr225 230 235 240
acc acc cac aag agt ttg agg ggt ccc aga gct ggt atg ate ttc tacThr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr
245 250 255
cgc aag aga cct aag cca gcc aac aag aag ggt cag cct cag gga aacArg Lys Arg Pro Lys Pro Ala Asn Lys Lys Gly Gln Pro Gln Gly Asn
260 265 270
tat gaa ttc gag gac aac ate aac ttc tet gtc ttc cct gcc ctc cagTyr Glu Phe Glu Asp Asn Ile Asn Phe Ser Val Phe Pro Ala Leu Gln
275 280 285
gga gcc ccc ata ate acc aga tcg gtg ccc ttg ctg ttg cat tgn aagGly Ala Pro Ile Ile Thr Arg Ser Val Pro Leu Leu Leu His Xaa Lys
290 295 300
caa ggc tgc aac ccc tgc att caa gcc taa cccaagcaat ngaagcncaa1023
Gln Gly Cys Asn Pro Cys Ile Gln Ala305 310
gctgttgctg ttgngaaact atttgatgag caaaggctac accttggtta ctggaggaac1083
tgagaaccac cttgttctgt gggatctgag acctcttggg ttgactggca acaaggtcga1143
ga1145
<210> 130<211> 313<212> PRT
<213> Linum usitatissimum<220>
<221> misc_feature<222> (303)..(303)
<223> Xaa pode ser qualquer aminoácido de ocorrência natural<400> 130
Met Asp Pro Val Lys Val Trp Gly Asn Thr Pro Leu Gln Thr Val Asp15 10 15
Pro Glu Ile His Asp Leu Ile Glu Lys Glu Lys Arg Arg Gln Cys Arg
20 25 30
Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Ile
35 40 45
Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro
50 55 60
Gly Asn Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Gln Ile Glu Asn65 70 75 80
Leu Cys Val Ser Arg Ala Leu Thr Ala Phe His Leu Asp Asp Thr Lys
85 90 95
Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala
100 105 110
Ala Tyr Thr Ala Ile Leu Lys Pro His Asp Arg Ile Met Gly Leu Asp
115 120 125
Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ser Ser Gly
130 135 140
Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys145 150 155 160
Val Asn Ser Ser Thr Gly Tyr Ile Asp Tyr Asp Lys Leu Glu Glu Lys
165 170 175
Ala Leu Asp Phe Arg Pro Arg Leu Ile Ile Cys Gly Gly Ser Ala Tyr180 185 190
Pro Arg Asp Trp Asp Tyr Ala Arg Phe Arg Ala Ile Ala Asp Lys Cys
195 200 205
Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala
210 215 220
Ala Gln Glu Ala Ala Asn Pro Phe Glu Phe Cys Asp Ile Val Thr Thr225 230 235 240
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr
245 250 255
Arg Lys Arg Pro Lys Pro Ala Asn Lys Lys Gly Gln Pro Gln Gly Asn
260 265 270
Tyr Glu Phe Glu Asp Asn Ile Asn Phe Ser Val Phe Pro Ala Leu Gln
275 280 285
Gly Ala Pro Ile Ile Thr Arg Ser Val Pro Leu Leu Leu His Xaa Lys
290 295 300
Gln Gly Cys Asn Pro Cys Ile Gln Ala305 310
<210> 131<211> 1824<212> DNA<213> Zea mays
<220><221> CDS
<222> (105).. (1520)<400> 131
ggtcgacttc gctgtcgacg atttcgttcc gcccccgccc ccgcccacgc ccactcctcg 60
ctgccaccac tcctgtcacc tcttcccgcg ccgacgcagc cgcc atg gac ccc gtc 116
Met Asp Pro Val1
gcc aca tgg ggg cta acc ccg ccc gcg ggc gcc gac ccg gag ate tac 164
Ala Thr Trp Gly Leu Thr Pro Pro Ala Gly Ala Asp Pro Glu Ile Tyr5 10 15 20
gac ctc ctg gag cgc gag aag cgg cgc cag cgt cgc ggc ate gag ctc 212
Asp Leu Leu Glu Arg Glu Lys Arg Arg Gln Arg Arg Gly Ile Glu Leu
25 30 35
ate gcc tcc gag aac ttc acc tcc ttc gcc gtc atg gaa gcg ctc ggc 260
Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Met Glu Ala Leu Gly
40 45 50
tcc gcg ctc act aac aag tac tcc gag ggc atg ccc ggc gcc cgc tac 308
Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro Gly Ala Arg Tyr
55 60 65
tac ggc ggc aac gac gtc ate gac gag ate gag aac ctc tgc cgg tca 356
Tyr Gly Gly Asn Asp Val Ile Asp Glu Ile Glu Asn Leu Cys Arg Ser
70 75 80
cgc gcg ctc gct gcc ttc cac ctt gac gcc gcg tcc tgg ggc gtc aac 404
Arg Ala Leu Ala Ala Phe His Leu Asp Ala Ala Ser Trp Gly Val Asn85 90 95 100
gtg cag ccc tac tcg ggc tcc ccc gcc aac ttc gcc gcc tac acc gcg 452
Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala Ala Tyr Thr Ala
105 110 115
ctg ctc aac ccg cac gac cgg ate atg ggg ctc gac ctt ccc tcc ggc 500
Leu Leu Asn Pro His Asp Arg Ile Met Gly Leu Asp Leu Pro Ser Gly
120 125 130
gga cac ctc act cac ggg tac tac acg gcc ggc ggt aag aag ate tcc 548
Gly His Leu Thr His Gly Tyr Tyr Thr Ala Gly Gly Lys Lys Ile Ser
135 140 145
gec acc tcg ate tac ttt gag age ctg ccg tac aag gtg age gcc gea 596
Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys Val Ser Ala Ala150 155 160acg ggg tac ate gac tac gag aag ctc gag gag aag gca Ctt gac ttcThr Gly Tyr Ile Asp Tyr Glu Lys Leu Glu Glu Lys Ala Leu Asp Phe165 170 175 180cgc CCC aag ctc ate ate tgc ggt ggc agt gcg tac ccg agg gac tggArg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala Tyr Pro Arg Asp Trp 185 190 195 gat tac gcc aag ctc agg gcc gtc gcc gac aag gtc ggg gcc ctg ctgAsp Tyr Ala Lys Leu Arg Ala Val Ala Asp Lys Val Gly Ala Leu Leu 200 205 210 ctc tgc gac atg gcg cac ate age ggg ctc gtc gcc gcg cag gaa gctLeu Cys Asp 215 Met Ala His Ile Ser 220 Gly Leu Val Ala Ala 225 Gln Glu Alagca aat CCt ttt gaa tat tgt gat gtg gtt acc aca acc acg cac aagAla Asn Pro Phe Glu Tyr Cys Asp Val Val Thr Thr Thr Thr His Lys 230 235 240 tcc ctc aga ggg cca agg gct ggc atg ate ttc tac agg aaa ggc cctSer Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr Arg Lys Gly Pro245 250 255 260aag CCC CCC aag aag ggc cag cct gag ggt gct gtt tat gat tac gaaLys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala Val Tyr Asp Tyr Glu 265 270 275 gac aag ate aac ttt gca gtg ttc cca tet ctc caa ggt ggc cct cacAsp Lys Ile Asn Phe Ala Val Phe Pro Ser Leu Gln Gly Gly Pro His 280 285 290 aac cac cag att gct gca Ctt gct gtt gct cta cag caa act atg tcg1028 Asn His Gln 295 Ile Ala Ala Leu Ala 300 Val Ala Leu Gln Gln 305 Thr Met SerCCt ggc ttc aag gcc tat gca aag caa gtg aag gcc aat gct gtt gca1076 Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Lys Ala Asn Ala Val Ala 310 315 320 att gga aac tat ctc atg age aag ggc tac aag atg gtg act gat gga1124 Ile Gly Asn Tyr Leu Met Ser Lys Gly Tyr Lys Met Val Thr Asp Gly325 330 335 340act gag aac cac Ctt gtt ctc tgg gat ctc cgc CCC Ctt ggc ttg act1172 Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro Leu Gly Leu Thr 345 350 355 gga aac aag gtc gaa aag cta tgt gat Ctt tgc cac ate aca ttg aac1220 Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys His Ile Thr Leu Asn 360 365 370 aag aat gct gtc ttc ggt gac age agt gca ttg tet ccg ggt ggt gtc1268 Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ser Pro Gly Gly Val 375 380 385 cgc att ggc gcg cca gca atg acc tcg agg ggt cta ctg gag aag gat1316 Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly Leu Leu Glu Lys Asp 390 395 400 ttc gag cag att ggg gag ttc ctc cac cag gca gtg acc ate tgc ctg1364 Phe Glu Gln Ile Gly Glu Phe Leu His Gln Ala Val Thr Ile Cys Leu405 410 415 420aac ate cag aag gag tac ggc aag ctc CtC aag gac ttc aac aag ggc1412 Asn Ile Gln Lys Glu 425 Tyr Gly Lys Leu Leu 430 Lys Asp Phe Asn Lys 435 Glyctg gtg aac aac aag gac ate gag aac ctc aag gtc cag gtg gag aag1460 Leu Val Asn Asn Lys Asp Ile Glu Asn Leu Lys Val Gln Val Glu Lys
644
692
740
788
836
884
932
980440 445 450
ttt gcc gac tcc ttc gac atg cct ggg ttc acg ctt gag age atg aaa1508
Phe Ala Asp Ser Phe Asp Met Pro Gly Phe Thr Leu Glu Ser Met Lys
455 460 465
tac aag gag tag atatgcctct ttcatgcgcg gcaaggtcct cctgtaccga1560
Tyr Lys Glu470
tgtctttcct tgtggtggcg cagggtgcca tggcactgca ttgccgccac acttacgatg1620
atgatgatgg gttatggatt ttgtctacaa tgtcagcagg ataggctcac aattgccccc1680
tgccctccgg tttggtcgcc tctcaggttt tcatttggta gttgttcgca gggaaccata1740
tgagaattgc aatgtcaatc aggtgtttgc caataataat tgggtggttt ctgctcttgc1800
tctggccaaa aaaaaaaaaa aaaa1824
<210> 132<211> 471<212> PRT
<213> Zea mays <400> 132 Met Asp Pro Val Ala Thr Trp Gly Leu Thr Pro Pro Ala Gly Ala Asp1 5 10 15 Pro Glu Ile Tyr Asp Leu Leu Glu Arg Glu Lys Arg Arg Gln Arg Arg 20 25 30 Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Met 35 40 45 Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro 50 55 60 Gly Ala Arg Tyr Tyr Gly Gly Asn Asp Val Ile Asp Glu Ile Glu Asn65 70 75 80Leu Cys Arg Ser Arg Ala Leu Ala Ala Phe His Leu Asp Ala Ala Ser 85 90 95 Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala 100 105 110 Ala Tyr Thr Ala Leu Leu Asn Pro His Asp Arg Ile Met Gly Leu Asp 115 120 125 Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ala Gly Gly 130 135 140 Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys145 150 155 160Val Ser Ala Ala Thr Gly Tyr Ile Asp Tyr Glu Lys Leu Glu Glu Lys 165 170 175 Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala Tyr 180 185 190 Pro Arg Asp Trp Asp Tyr Ala Lys Leu Arg Ala Val Ala Asp Lys Val 195 200 205 Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala 210 215 220 Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr Thr225 230 235 240Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr
245 250 255
\Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala Val
260 265 270
Tyr Asp Tyr Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser Leu Gln
275 280 285
Gly Gly Pro His Asn His Gln Ile Ala Ala Leu Ala Val Ala Leu Gln
290 295 300
Gln Thr Met Ser Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Lys Ala305 310 315 320
Asn Ala Val Ala Ile Gly Asn Tyr Leu Met Ser Lys Gly Tyr Lys Met
325 330 335
Val Thr Asp Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro
340 345 350
Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys His
355 360 365
Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ser
370 375 380
Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly Leu385 390 395 400
Leu Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu His Gln Ala Val
405 410 415
Thr Ile Cys Leu Asn Ile Gln Lys Glu Tyr Gly Lys Leu Leu Lys Asp
420 425 430
Phe Asn Lys Gly Leu Val Asn Asn Lys Asp Ile Glu Asn Leu Lys Val
435 440 445
Gln Val Glu Lys Phe Ala Asp Ser Phe Asp Met Pro Gly Phe Thr Leu
450 455 460
Glu Ser Met Lys Tyr Lys Glu465 470
<210> 133<211> 1748<212> DNA<213> Glycine max<220> <221> CDS<222> (91)..(1503)<400> 133
cggtcgacga tttcgtcaca acaacactct ctcttctcgc tcttggcttt tcgctcttca 60
ctcactctca ttcattcatt tccaccgttc atg gat cca gta age gtg tgg ggt 114
Met Asp Pro Val Ser Val Trp Gly1 5
ccc gag ate cat gac ctc ate gag 162
Pro Glu Ile His Asp Leu Ile Glu20
gga ate gag ctc ate gcc tcc gag 210
Gly Ile Glu Leu Ile Ala Ser Glu
35 40
gag gcc ctc ggc age gct ctc acg 258
Glu Ala Leu Gly Ser Ala Leu Thr
50 55
ggc aac cgc tac tac ggc ggc aat 306
Gly Asn Arg Tyr Tyr Gly Gly Asn65 70
ctc tgc cgc tca cgc gcc ctc caa 354
Leu Cys Arg Ser Arg Ala Leu Gln85
tgg ggc gtc aac gtc cag ccc tac 402
Trp Gly Val Asn Val Gln Pro Tyr100
aac acgAsn Thr10aag gagLys Glu25
aac ttcAsn Phe
aac aaaAsn Lys
gaa tacGlu Tyr
gcc ttcAla Phe90
ccc ttgPro Leu
aag cgcLys Arg
acc tccThr Ser
tac tccTyr Ser60ate gacIle Asp75
cac ctcHis Leu
gcg acgAla Thr
cgt caaArg Gln
30ttc gccPhe Ala45
gag ggcGlu Gly
cag ateGln Ile
gac gccAsp Ala
gtg gatVal Asp15
tgc cgcCys Arg
gtc ateVal Ile
atg ccgMet Pro
gaa aacGlu Asn80caa tccGln Ser95tcc ggc tcc ccg gcc aac ttc gcc gcc tac acc gcc gtc ctc aac CCC 450Ser Gly Ser Pro Ala Asn Phe Ala Ala Tyr Thr Ala Val Leu Asn Pro 105 110 115 120 cac gac cgc ate atg ggg cta gat ctc CCC tcc ggc ggc cac ctc acc 498His Asp Arg Ile Met Gly Leu Asp Leu Pro Ser Gly Gly His Leu Thr 125 130 135 cac ggc tac tac acc tcc ggc gga aag aag ate tcc gcc acc tcc att 546His Gly Tyr Tyr Thr Ser Gly Gly Lys Lys Ile Ser Ala Thr Ser Ile 140 145 150 tac ttc gag age ctc cct tac aag gta aac tcc acc acc ggc tac ate 594Tyr Phe Glu Ser Leu Pro Tyr Lys Val Asn Ser Thr Thr Gly Tyr Ile 155 160 165 gac tac gac cgc ttg gaa gaa aaa gcc cta gac ttc agg cca aaa ctc 642Asp Tyr Asp Arg Leu Glu Glu Lys Ala Leu Asp Phe Arg Pro Lys Leu 170 175 180 ata. ate tgc ggt ggc age gcg tac cct cgc gat tgg gac tac aaa cgt 690Ile Ile Cys Gly Gly Ser Ala Tyr Pro Arg Asp Trp Asp Tyr Lys Arg 185 190 195 200 ttc agg gaa gtc gct gat aag tgc gga gea ttg Ctt ctc tgc gac atg 738Phe Arg Glu Val Ala Asp Lys Cys Gly Ala Leu Leu Leu Cys Asp Met 205 210 215 gcg cac act age ggc Ctt gtg gcc gcg cag gaa gtg aac age ccc ttc 786Ala His Thr Ser Gly Leu Val Ala Ala Gln Glu Val Asn Ser Pro Phe 220 225 230 gag tat tgc gac att gtg acc acc acg act cac aag age ttg cgg ggc 834Glu Tyr Cys Asp Ile Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly 235 240 245 cca cgt gcg ggg atg ate ttt tac cgg aag ggc CCC aag ccg ccg aag 882Pro Arg Ala Gly Met Ile Phe Tyr Arg Lys Gly Pro Lys Pro Pro Lys 250 255 260 aag ggg cag ccg gag aac gcg gtt tat gat ttc gag gac aag att aac 930Lys Gly Gln Pro Glu Asn Ala Val Tyr Asp Phe Glu Asp Lys Ile Asn 265 270 275 280 ttc gcg gtg ttc cct tcg ctg cag ggt ggg CCC cac aac cac cag ate 978Phe Ala Val Phe Pro Ser Leu Gln Gly Gly Pro His Asn His Gln Ile 285 290 295 ggt gct ctc gcc gtg gcg ctg aag cag gcc gcg tcg CCC ggg ttt aag 1026Gly Ala Leu Ala Val Ala Leu Lys Gln Ala Ala Ser Pro Gly Phe Lys 300 305 310 gcc tac gcg aag cag gtt aag gcg aac gcc gtt gcg Ctt gga aaa tac 1074Ala Tyr Ala Lys Gln Val Lys Ala Asn Ala Val Ala Leu Gly Lys Tyr 315 320 325 ttg atg ggg aaa ggg tac age Ctt gtc act ggc gga acg gag aac cat 1122Leu Met Gly Lys Gly Tyr Ser Leu Val Thr Gly Gly Thr Glu Asn His 330 335 340 Ctt gtt ttg tgg gat ctg aga cct Ctt gga ttg act ggg aat aag gtg 1170Leu Val Leu Trp Asp Leu Arg Pro Leu Gly Leu Thr Gly Asn Lys Val 345 350 355 360 gag aaa ctc tgt gat ctc tgt aac att act gtt aac aag aac gct gtt 1218Glu Lys Leu Cys Asp Leu Cys Asn Ile Thr Val Asn Lys Asn Ala Val 365 370 375 ttt ggt gat age agt gcc ttg gcc cct ggt gga gtg cga att ggt gcc 1266Phe Gly Asp Ser Ser Ala Leu Ala Pro Gly Gly Val Arg Ile Gly Ala 380 385 390 cct gcc atg act tet agg ggt ttg gtt gaa aaa gac ttt gag cag att 1314Pro Ala Met Thr Ser Arg Gly Leu Val Glu Lys Asp Phe Glu Gln Ile 395 400 405 ggt gag ttc Ctt cac cgt gct gtg act ctc aca ctg gag ate cag aag 1362Gly Glu Phe Leu His Arg Ala Val Thr Leu Thr Leu Glu Ile Gln Lys 410 415 420 gag cat ggc aaa Ctt ctc aag gat ttc aac aag ggt ctc gtc aac aac 1410Glu His Gly Lys Leu Leu Lys Asp Phe Asn Lys Gly Leu Val Asn Asn 425 430 435 440aag gct att gaa gat ctc aaa gct gat gtt gag aag ttc tct gcc ttg 1458
Lys Ala Ile Glu Asp Leu Lys Ala Asp Val Glu Lys Phe Ser Ala Leu
445 450 455
ttt gac atg cct ggc ttc ctg gta tct gaa atg aag tac aag gat 1503
Phe Asp Met Pro Gly Phe Leu Val Ser Glu Met Lys Tyr Lys Asp460 465 470
taggttcaac cataccactt tctactaaat tgtgtcactc aagttcgaca caaagtgcag 1563aaatggagaa aaaggaaata tgtgtcttcc tttcctggga gtgatagggt ttatcgccat 1623ggtgtttcaa ttcaaaagtt tgaagtttct ttgtctttga tttcatgttt aattttgtta 1683gcctgattga tatcatattt tttttcttat ttaacaattg aaataatacg tgctgccttt 1743CtttC 1748
<210> 134<211> 471<212> PRT<213> Glycine max
<400> 134
Met Asp Pro Val Ser Val Trp Gly Asn Thr Pro Leu Ala Thr Val Asp15 10 15
Pro Glu Ile His Asp Leu Ile Glu Lys Glu Lys Arg Arg Gln Cys Arg
20 25 30
Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Ile
35 40 45
Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro
50 55 60
Gly Asn Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Gln Ile Glu Asn65 70 75 80
Leu Cys Arg Ser Arg Ala Leu Gln Ala Phe His Leu Asp Ala Gln Ser
85 90 95
Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala
100 105 110
Ala Tyr Thr Ala Val Leu Asn Pro His Asp Arg Ile Met Gly Leu Asp
115 120- 125
Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ser Gly Gly
130 135 140
Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys145 150 155 160
Val Asn Ser Thr Thr Gly Tyr Ile Asp Tyr Asp Arg Leu Glu Glu Lys
165 170 175
Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala Tyr
180 185 190
Pro Arg Asp Trp Asp Tyr Lys Arg Phe Arg Glu Val Ala Asp Lys Cys
195 200 205
Gly Ala Leu Leu Leu Cys Asp Met Ala His Thr Ser Gly Leu Val Ala
210 215 220
Ala Gln Glu Val Asn Ser Pro Phe Glu Tyr Cys Asp Ile Val Thr Thr225 230 235 240
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr
245 250 255
Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Asn Ala Val
260 265 270
Tyr Asp Phe Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser Leu Gln
275 280 285
Gly Gly Pro His Asn His Gln Ile Gly Ala Leu Ala Val Ala Leu Lys
290 295 300
Gln Ala Ala Ser Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Lys Ala305 310 315 320Asn Ala Val Ala Leu Gly Lys Tyr Leu Met Gly Lys Gly Tyr Ser Leu
325 330 335
Val Thr Gly Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro
340 345 350
Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys Asn
355 360 365
Ile Thr Val Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ala
370 375 380
Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly Leu385 390 395 400
Val Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu His Arg Ala Val
405 410 415
Thr Leu Thr Leu Glu Ile Gln Lys Glu His Gly Lys Leu Leu Lys Asp
420 425 430
Phe Asn Lys Gly Leu Val Asn Asn Lys Ala Ile Glu Asp Leu Lys Ala
435 440 445
Asp Val Glu Lys Phe Ser Ala Leu Phe Asp Met Pro Gly Phe Leu Val
450 455 460
Ser Glu Met Lys Tyr Lys Asp465 470
<210> 135
<211> 1655
<212> DNA
<213> Brassica napus
<220>
<221> CDS
<222> (21) .. (1433)
<400> 135
ctcactcact cattetcacc atg gat cca gtc tca tcc tgg gga aac acc cct 53
Met Asp Pro Val Ser Ser Trp Gly Asn Thr Pro15 10
ctc gtc acg gtc gat ccc gag ate cac gac ctc ate gag aag gag aaa 101
Leu Val Thr Val Asp Pro Glu Ile His Asp Leu Ile Glu Lys Glu Lys
15 20 25
cgc cgc cag tgc cgc gga ate gaa ctc ate gcc tcc gag aat ttc acc 149
Arg Arg Gln Cys Arg Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr
30 35 40
tcc ttc gcc gtc ate gaa gct ctc gga age gcg ctg acc aac aaa tac 197
Ser Phe Ala Val Ile Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr
45 50 55
tcc gaa ggc atg ccc ggt aac cgt tac tac gga ggc aac gag ttc ate 245
Ser Glu Gly Met Pro Gly Asn Arg Tyr Tyr Gly Gly Asn Glu Phe Ile60 65 70 75
gac cag ate gag aac ctc tgc cag tca cgc gct ctc gaa gcc ttc cgt 293
Asp Gln Ile Glu Asn Leu Cys Gln Ser Arg Ala Leu Glu Ala Phe Arg
80 85 90
ctc gag tca gea tcc tgg ggc gtc aat gtg cag ccc tac tcc gga tet 341
Leu Glu Ser Ala Ser Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser
95 100 105
ccg gcc aac ttc gcc gct tac acc gcc ttg ctt cag cct cac gat cga 389
Pro Ala Asn Phe Ala Ala Tyr Thr Ala Leu Leu Gln Pro His Asp Arg
110 115 120
ate atg ggg ctt gat ctg ccg tcg ggt ggt cat ctc acg cat gga tac 437
Ile Met Gly Leu Asp Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr
125 130 135
tac aca tcc gga ggg aag aag ate tet gct act tcc ate tac ttt gag 485
Tyr Thr Ser Gly Gly Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu140 145 150 155
age ctt cct tat aag gtg aac ttc acc act ggt tac ate gat tac gat 533
\Ser Leu Pro
aagLys
ggcGly
gttVal
agtSer220gacAsp
ggtGly
CCC
Pro
ttcPhe
gctAla300aaaLys
aagLys
tggTrp
tgcCys
ageSer380acaThr
ttgLeu
aaaLys
gagGlu
cctPro460
cttLeu
ggtGly
gctAla205ggcGly
gttVal
atgMet
gagGlu
cctPro285gttVal
cagGln
ggaGly
gatAsp
gatAsp365agtSer
tcaSer
ageSer
ctgLeu
gagGlu445ggaGly
gagGlu
agtSer190gatAsp
ctcLeu
gtgVal
ateIle
ggtGly270gcgAla
gcgAla
gtgVal
tacTyr
cttLeu350ctgLeu
gctAla
aggArg
cgaArg
ttgLeu430ctcLeu
ttcPhe
Tyr Lys160gag aagGlu Lys175
gcc tacAla Tyr
aag gttLys Val
gtt gctVal Ala
Val Asn Phe Thr
gcc atg gatAla Met Asp
acaThr
ttcPhe255geaAla
acaThr240tacTyr
gtcVal
cctPro
ggaGly
gctAla225acaThr
agg gacArg Asp195gct cttAla Leu210
cag gaaGln Glu
acc cacThr His
agg aag ggcArg Lys Gly
tat gacTyr Asp
ctt caaLeu Gln
ttg aagLeu Lys
aaaLys
agtSer335cgcArg
gccAla320attIle
cctPro
ggtGly
cagGln305aatAsn
ggtGly290gctAla
gctAla
tttPhe275cctPro
aacAsn
gttVal
gta acc ggtVal Thr Gly
tgc aacCys Asn
ctt gctLeu Ala
gga ttgGly Leu400tca gtgSer Val415
aag gacLys Asp
aag gctLys Ala
ctc atgLeu Met
cttLeu
attIle
cctPro385gtgVal
ggaGly
actThr370ggaGly
ttgLeu355ttgLeu
ggtGly
gag aagGlu Lys
aca ctg acaThr Leu Thr
tttPhe
gatAsp
tetSer465
aacAsn
gtcVal450gcgAla
aagLys435gagGlu
atgMet
ttcPhe180tggTrp
ttgLeu
gctAla
aagLys
ccaPro260gagGlu
cacHis
actThr
gccAla
ggaGly340accThr
aacAsn
gtaVal
gacAsp
ttgLeu420ggtGly
aagLys
aagLys
Thr165aggArg
gatAsp
ctcLeu
geaAla
agtSer245aaaLys
gacAsp
aacAsn
cctPro
cttLeu325actThr
ggtGly
aagLys
agaArg
tttPhe405aacAsn
ttgLeu
ttcPhe
tacTyr
Gly Tyr Ile Asp
cctPro
tacTyr
tgtCys
aacAsn230ttgLeu
ccaPro
aaaLys
cacHis
ggtGly310geaAla
gagGlu
aacAsn
aatAsn
ateIle390gagGlu
ateIle
gtgVal
tcaSer
cagGln470
aagLys
gctAla
gacAsp215ccaPro
aggArg
ccaPro
ateIle
cagGln295ttcPhe
aacAsn
aacAsn
aagLys
gctAla375ggtGly
atgMet
cagGln
aacAsn
gccAla455gatAsp
ttgLeu
agaArg200atgMet
tttPhe
ggtGly
aagLys
aacAsn280ateIle
aagLys
tacTyr
cacHis
gttVal360gtcVal
actThr
ataIle
aagLys
aacAsn440tccSer
ctcLeu185ttgLeu
gctAla
Tyr Asp170
ate tgtIle Cys
aga gccArg Ala
cac attHis Ile
gag tacGlu Tyr
cca aggPro Arg250aag ggaLys Gly265
ttt gctPhe Ala
tgtCys235gctAla
caaGln
gtgVal
ggt gct ctaGly Ala Leu
gtc tatVal Tyr
ctg atgLeu Met330ctt gttLeu Val345
gag aagGlu Lys
gcgAla315ggtGly
cttLeu
cttLeu
ttt gga gacPhe Gly Asp
cctPro
ggaGly
gagGlu425aaaLys
gcgAla
gagGlu410catHis
atgMet395ttcPhe
ggtGly
gag ateGlu Ile
tat gag atgTyr Glu Met
tagagatttc
ctctctctat caaagagtaa tcttttatta tetetatata taatatgctt ttgtagggccgcctgattgg aattcacaag gcgaagagat gaagaaacaa acagtaaaat acaaaaaggg
5816296777257738218699179651013106111091157120512531301134913971443
15031563
\tttttttttt gagtaatttc ttcttgaatg tttttatttt atcttattga aattgttgta 1623ttttgttggc tttttaataa tatcaagcga gt 1655
<210> 136<211> 471<212> PRT
<213> Brassica napus<400> 136
Met Asp Pro Val Ser Ser Trp Gly Asn Thr Pro Leu Val Thr Val Asp1 5 10 15
Pro Glu Ile His Asp Leu Ile Glu Lys Glu Lys Arg Arg Gln Cys Arg
20 25 30
Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Ile
35 40 45
Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro
50 55 60
Gly Asn Arg Tyr Tyr Gly Gly Asn Glu Phe Ile Asp Gln Ile Glu Asn65 70 75 80
Leu Cys Gln Ser Arg Ala Leu Glu Ala Phe Arg Leu Glu Ser Ala Ser
85 90 95
Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala
100 105 110
Ala Tyr Thr Ala Leu Leu Gln Pro His Asp Arg Ile Met Gly Leu Asp
115 120 125
Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ser Gly Gly
130 135 140
Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys145 150 155 160
Val Asn Phe Thr Thr Gly Tyr Ile Asp Tyr Asp Lys Leu Glu Glu Lys
165 170 175
Ala Met Asp Phe Arg Pro Lys Leu Leu Ile Cys Gly Gly Ser Ala Tyr
180 185 190
Pro Arg Asp Trp Asp Tyr Ala Arg Leu Arg Ala Val Ala Asp Lys Val
195 200 205
Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala
210 215 220
Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr Thr225 230 235 240
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr
245 250 255
Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala Val
260 265 270
Tyr Asp Phe Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ala Leu Gln
275 280 285
Gly Gly Pro His Asn His Gln Ile Gly Ala Leu Ala Val Ala Leu Lys
290 295 300
Gln Ala Asn Thr Pro Gly Phe Lys Val Tyr Ala Lys Gln Val Lys Ala305 310 315 320
Asn Ala Val Ala Leu Ala Asn Tyr Leu Met Gly Lys Gly Tyr Ser Ile
325 330 335
Val Thr Gly Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro
340 345 350
Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys Asn
355 360 365
Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ala
370 375 380
Pro Gly Gly Val Arg Ile Gly Thr Pro Ala Met Thr Ser Arg Gly Leu385 390 395 400
Val Glu Lys Asp Phe Glu Met Ile Gly Glu Phe Leu Ser Arg Ser Val405
Thr Leu Thr Leu.Asn Ile Gln Lys420
Phe Asn Lys Gly Leu Val Asn Asn435 440
Asp Val Glu Lys Phe Ser Ala Ser
450 455
Ser Ala Met Lys Tyr Gln Asp465 470
410 415
Glu His Gly Lys Leu Leu Lys Asp425 430
Lys Glu Ile Glu Glu Leu Lys Ala445
Tyr Glu Met Pro Gly Phe Leu Met460
<210> 137
<211> 1711
<212> DNA
<213> Zea mays
<220>
<221> CDS
<222> (11).. (1282)
<400> 137
cttcgccgtc atg gag gcg ctc ggc tcc ggg ctc act aac aag tac tcc 49
Met Glu Ala Leu Gly Ser Gly Leu Thr Asn Lys Tyr Ser15 10
gag ggc atg ccc ggc gcc cgc tac tac ggc ggc aac gac gtc ate gac 97Glu Gly Met Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Asp Val Ile Asp 15 20 25 gag ate gag aac ctc tgc cgg tca cgc gcg ctc gct gcc ttc cac Ctt 145Glu Ile Glu Asn Leu Cys Arg Ser Arg Ala Leu Ala Ala Phe His Leu 30 35 40 45 gac gcc gcg tcc tgg ggc gtc aac gtg cag ccc tac tcg ggc tcc CCC 193Asp Ala Ala Ser Trp 50 Gly Val Asn Val Gln 55 Pro Tyr Ser Gly Ser 60 Pro gcc aac ttc gcc gcc tac acc gcg ctg ctc aac ccg cac gac cgg ate 241Ala Asn Phe Ala Ala Tyr Thr Ala Leu Leu Asn Pro His Asp Arg Ile 65 70 75 atg ggg ctc gac Ctt ccc tcc ggc gga cac ctc act cac ggg tac tac 289Met Gly Leu 80 Asp Leu Pro Ser Gly 85 Gly His Leu Thr His 90 Gly Tyr Tyr acg gcc ggc ggt aag aag ate tcc gcc acc tcg ate tac ttt gag age 337Thr Ala 95 Gly Gly Lys Lys Ile 100 Ser Ala Thr Ser Ile 105 Tyr Phe Glu Ser ctg ccg tac aag gtg age gcc gea acg ggg tac ate gac tac gag aag 385Leu Pro Tyr Lys Val Ser Ala Ala Thr Gly Tyr Ile Asp Tyr Glu Lys 110 115 120 125 ctc gag gag aag gea Ctt gac ttc cgc ccc aag ctc ate ate tgc ggt 433Leu Glu Glu Lys Ala 130 Leu Asp Phe Arg Pro 135 Lys Leu Ile Ile Cys 140 Gly ggc agt gcg tac ccg agg gac tgg gat tac gcc aag ctc agg gcc gtc 481Gly Ser Ala Tyr Pro Arg Asp Trp Asp Tyr Ala Lys Leu Arg Ala Val 145 150 155 gcc gac aag gtc ggg gcc ctg ctg ctc tgc gac atg gcg cac ate age 529Ala Asp Lys Val Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser 160 165 170 ggg ctc gtc gcc gcg cag gaa gct gea aat cct ttt gaa tat tgt gat 577Gly Leu Val Ala Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp 175 180 185 gtg gtt acc aca acc acg cac aag tcc ctc aga ggg cca agg gct ggc 625Val Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly 190 195 200 205 atg ate ttc tac agg aaa ggc cct aag ccc ccc aag aag ggc cag cct 673Met Ile Phe Tyr Arg 210 Lys Gly Pro Lys Pro 215 Pro Lys Lys Gly Gln 220 Progag ggt gct gtt tat gat tac gaa gac aag ate aac ttt gca gtg ttc 721Glu Gly Ala Val 225 Tyr Asp Tyr Glu Asp 230 Lys Ile Asn Phe Ala 235 Val Phe cca tct ctc caa ggt ggc cct cac aac cac cag att gct gca Ctt gct 769Pro Ser Leu 240 Gln Gly Gly Pro His 245 Asn His Gln Ile Ala 250 Ala Leu Ala gtt gct cta cag caa act atg tcg cct ggc ttc aag gcc tat gca aag 817Val Ala Leu Gln Gln Thr Met Ser Pro Gly Phe Lys Ala Tyr Ala Lys 255 260 265 caa gtg aag gcc aat gct gtt gca att gga aac tat ctc atg age aag 865Gln Val Lys Ala Asn Ala Val Ala Ile Gly Asn Tyr Leu Met Ser Lys 270 275 280 285 ggc tac aag atg gtg act gat gga act gag aac cac Ctt gtt ctc tgg 913Gly Tyr Lys Met Val 290 Thr Asp Gly Thr Glu 295 Asn His Leu Val Leu 300 Trp gat CtC cgc CCC Ctt ggc ttg act gga aac aag gtc gaa aag cta tgt 961Asp Leu Arg Pro 305 Leu Gly Leu Thr Gly 310 Asn Lys Val Glu Lys 315 Leu Cys gat Ctt tgc cac ate aca ttg aac aag aat gct gtc ttc ggt gac age 1009Asp Leu Cys His Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser 320 325 330 agt gca ttg tct ccg ggt ggt gtc cgc att ggc gcg cca gca atg acc 1057Ser Ala Leu Ser Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr 335 340 345 tcg agg ggt cta ctg gag aag gat ttc gag cag att ggg gag ttc ctc 1105Ser Arg Gly Leu Leu Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu 350 355 360 365 cac cag gca gtg acc ate tgc ctg aac ate cag aag gag tac ggc aag 1153His Gln Ala Val Thr 370 Ile Cys Leu Asn Ile 375 Gln Lys Glu Tyr Gly 380 Lys CtC CtC aag gac ttc aac aag ggc ctg gtg aac aac aag gac ate gag 1201Leu Leu Lys Asp 385 Phe Asn Lys Gly Leu 390 Val Asn Asn Lys Asp 395 Ile Glu aac CtC aag gtc cag gtg gag aag ttt gcc gac tcc ttc gac atg cct 1249Asn Leu Lys Val Gln Val Glu Lys Phe Ala Asp Ser Phe Asp Met Pro 400 405 410 ggg ttc acg Ctt gag age atg aaa tac aag gag tagacatgcc tcccatgcgc 1302Gly Phe Thr Leu Glu Ser Met Lys Tyr Lys Glu
415 420
ggcaaggtcc tcctgtaccg atgtctttcc ttgtggtggc gcagggtgcc atggcactgc 1362
attgccgcca cacttacgat gatgatgatg ggttatggat tttgtctaca atgtcagcag 1422
gataggctca caattgcccc ctgccctccg gtttggtcgc ctctcaggtt ttcatttggt 1482
agttgttcgc agggaaccat atgagaattg caatgtcaat caggtgtttg ccaataataa 1542
ttgggtggtt tctgctcttg ctctggtcat taccatgcat tttttattct gttggtgagt 1602
tggtcgattt attatctcct gcagtcctgc tggcactgcc ggtggtcgtt tgattatcat 1662
gtatgaatct tcctggagac tgttgctcga ttaacatatc gcctgctcc 1711
<210> 138
<211> 424
<212> PRT
<213> Zea mays
<400> 138
Met Glu Ala Leu Gly Ser Gly Leu Thr Asn Lys Tyr Ser Glu Gly Met15 10 15
Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Asp Val Ile Asp Glu Ile Glu20 25 30
Asn Leu Cys Arg Ser Arg Ala Leu Ala Ala Phe His Leu Asp Ala Ala 35 40 45 Ser Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe 50 55 60 Ala Ala Tyr Thr Ala Leu Leu Asn Pro His Asp Arg Ile Met Gly Leu 65 70 75 80Asp Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ala Gly 85 90 95 Gly Lys Lys Ile 100 Ser Ala Thr Ser Ile 105 Tyr Phe Glu Ser Leu 110 Pro TyrLys Val Ser 115 Ala Ala Thr Gly Tyr 120 Ile Asp Tyr Glu Lys 125 Leu Glu GluLys Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala 130 135 140 Tyr Pro Arg Asp Trp Asp Tyr Ala Lys Leu Arg Ala Val Ala Asp Lys145 150 155 160Val Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val 165 170 175 Ala Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr 180 185 190 Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe 195 200 205 Tyr Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala 210 215 220 Val Tyr Asp Tyr Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ser Leu225 230 235 240Gln Gly Gly Pro His Asn His Gln Ile Ala Ala Leu Ala Val Ala Leu 245 250 255 Gln Gln Thr Met 260 Ser Pro Gly Phe Lys 265 Ala Tyr Ala Lys Gln 270 Val LysAla Asn Ala Val Ala Ile Gly Asn Tyr Leu Met Ser Lys Gly Tyr Lys 275 280 285 Met Val Thr Asp Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg 290 295 300 Pro Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys305 310 315 320His Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu 325 330 335 Ser Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly 340 345 350 Leu Leu Glu 355 Lys Asp Phe Glu Gln 360 Ile Gly Glu Phe Leu 365 His Gln AlaVal Thr 370 Ile Cys Leu Asn Ile 375 Gln Lys Glu Tyr Gly 380 Lys Leu Leu LysAsp Phe Asn Lys Gly Leu Val Asn Asn Lys Asp Ile Glu Asn Leu Lys385 390 395 400Val Gln Val Glu Lys Phe Ala Asp Ser Phe Asp Met Pro Gly Phe Thr 405 410 415 Leu Glu Ser Met Lys Tyr Lys Glu
420
<210> 139<211> 1845<212> DNA<213> Helianthus annuus<220> <221> CDS<222> (348) .. (1760)<400> 139aatctcccct ctctccacga caatttcgac acccattttc cacacatcac tcaagtacct 60ggtgttaacc ttttggtctg cgtcaaacgg gtggcatagc atcggaaccc cttcagacat 120gctttccaat gtcgaattcc aaccgcaatg gctccaaaat cctccaattg cagaatgtgc 180caagacttcc ttctgcggtg cccatttcac gatcaaacct ctcgccttca tctcactcac 240caaaccctcc ggcaaaaact caatccattc aaacccttta accgaaccgg gtcgaaccac 300ccccaacaac ctctcctctc tctatactct actctctcta gaccagc atg gat ccc 356
Met Asp Pro1
gtt aat gtg tgg ggc aac acc ccc cta gac gcc gcc gac cca gag ate 404
Val Asn Val Trp Gly Asn Thr Pro Leu Asp Ala Alsi Asp Pro Glu Ile
5 10 15
ttc gac ctc att gag aaa gaa aaa cgc cgc caa tgt cgc gga ate gaa 452
Phe Asp Leu Ile Glu Lys Glu Lys Arg Arg Gln Cys Arg Gly Ile Glu20 25 30 35
ctg att gea tcc gaa aac ttc acc tca ttt gea gtc ate caa gct ttg 500
Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Ile Gln Ala Leu
40 45 50
gga tcc ccc ttg acc aac aaa tac tcc gag ggc atg cct gga aac cgt 548
Gly Ser Pro Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro Gly Asn Arg
55 60 65
tac tac ggt ggc aac gag tac ate gac cag ate gaa aac ctc tgc cgt 596
Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Gln Ile Glu Asn Leu Cys Arg
70 75 80
tet cgc gcc tta cag gct tac cgt cta gat ccc acc aaa tgg ggt gtt 644
Ser Arg Ala Leu Gln Ala Tyr Arg Leu Asp Pro Thr Lys Trp Gly Val
85 90 95
aat gtc cag ccc tat tet gga tet cct gcc aat ttt gct gcc tat aca 692
Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala Ala Tyr Thr100 105 110 115
gcc ctc tta gag ccc cat gat cgg ate atg ggc ctt gat ttg cca tca 740
Ala Leu Leu Glu Pro His Asp Arg Ile Met Gly Leu Asp Leu Pro Ser
120 125 130
ggt ggg cat ttg acg cat gga tat tat act tcc ggt ggg aag aag ata 788
Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ser Gly Gly Lys Lys Ile
135 140 145
tca gct acc tcg att tac ttt gag agt ttg ccg tat aaa gtg aat tcg 836
Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys Val Asn Ser
150 155 160
act acg gga tat ate gat tac gag aag atg gag gag aag gcc ttg gac 884
Thr Thr Gly Tyr Ile Asp Tyr Glu Lys Met Glu Glu Lys Ala Leu Asp
165 170 175
ttt aga ccc aag ttg att att tgt ggg ggg agt gcg tac ccg aga gat 932
Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala Tyr Pro Arg Asp180 185 190 195
tgg gat tac aag agg ate agg ggc att gct gat aaa tgt ggg gcc ctc 980
Trp Asp Tyr Lys Arg Ile Arg Gly Ile Ala Asp Lys Cys Gly Ala Leu
200 205 210
atg ttg tgt gat atg gct cat ate agt ggc ctt gtt gct gea cag gaa 1028
Met Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Gln Glu
215 220 225
gct gea gat ccg ttc gaa tac tgt gac gtg gtc act acc acc acc cac 1076
Ala Ala Asp Pro Phe Glu Tyr Cys Asp Val Val Thr Thr Thr Thr His
230 235 240
aag agt ctc agg gga cca aga gct ggt atg ate ttc tac cgc aaa ggt 1124
Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr Arg Lys Gly
245 250 255
cca aaa cca ccg aag aag ggt cag cca gaa gat gct gtt tat gac ttt 1172
Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Asp Ala Val Tyr Asp Phe260 265 270 275
gaa gac aag ate aat ttt gct gtg ttc ccg gct ctg caa ggt ggg ccg 1220
Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ala Leu Gln Gly Gly Pro
280 285 290
cac aac cao cag att ggt gct cta gcg gtt gcg ttg aaa cag gcc atg 1268
His Asn His Gln Ile Gly Ala Leu Ala Val Ala Leu Lys Gln Ala Met
295 300 305
tca cct gga ttc aag gea tat gct aag caa gtt aga gcc aat gct gtt 1316
Ser Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Arg Ala Asn Ala Val
310 315 320
gea ctt ggt aac tac ttg atg age aaa gac tac aag ctt gtg acc ggt 1364
Ala Leu Gly Asn Tyr Leu Met Ser Lys Asp Tyr Lys Leu Val Thr Gly
325 330 335
gga act gaa aac cat ctt gtg ttg tgg gat ctt cgt cct ctt ggc ttg 1412
Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro Leu Gly Leu340 345 350 355
acc ggg aac aag gtg gag aag ctt tgc gat ctt gea aac ate act gtt 1460
Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Ala Asn Ile Thr Val
360 365 370
aac aag aat gct gtg ttt ggt gac age agt gct ttg gcc cea gga ggt 1508
Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ala Pro Gly Gly
375 380 385
gtt cgt att ggt aca cct gea atg acc tca agg ggt tta gtt gag aag 1556
Val Arg Ile Gly Thr Pro Ala Met Thr Ser Arg Gly Leu Val Glu Lys
390 395 400
gat ttt gag caa att ggg gag ttt ctt cac cgt gea att caa ate act 1604
Asp Phe Glu Gln Ile Gly Glu Phe Leu His Arg Ala Ile Gln Ile Thr
405 410 415
tta age ate cag aag gag ttc ggg aaa tta ttg aag gat ttc aac aag 1652
Leu Ser Ile Gln Lys Glu Phe Gly Lys Leu Leu Lys Asp Phe Asn Lys420 425 430 435
ggt ttg gtg aac aac aag gag ate gaa caa etc aag gct gat gtc gag 1700
Gly Leu Val Asn Asn Lys Glu Ile Glu Gln Leu Lys Ala Asp Val Glu
440 445 450
aag ttt tet ggt tcg ttt gac atg cct ggg ttc tcg ttg gcc gac atg 1748
Lys Phe Ser Gly Ser Phe Asp Met Pro Gly Phe Ser Leu Ala Asp Met
455 460 465
aag tat aag gat tgagaagatg aagagateta tgtaatgaat gatgtttgtg 1800
Lys Tyr Lys Asp470
ttgttattag taacattttc tggtgtttgt tttgatgtct agtac 1845
<210> 140<211> 471<212> PRT
<213> Helianthus annuus<400> 140
Met Asp Pro Val Asn Val Trp Gly Asn Thr Pro Leu Asp Ala Ala Asp15 10 15
Pro Glu Ile Phe Asp Leu Ile Glu Lys Glu Lys Arg Arg Gln Cys Arg
20 25 30
Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Ile
35 40 45
Gln Ala Leu Gly Ser Pro Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro
50 55 60
Gly Asn Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Gln Ile Glu Asn65 70 75 80
Leu Cys Arg Ser Arg Ala Leu Gln Ala Tyr Arg Leu Asp Pro Thr Lys
85 90 95
Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala100 105 110Ala Tyr Thr Ala Leu Leu Glu Pro His Asp Arg Ile Met Gly Leu Asp
115 120 125
Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ser Gly Gly
130 135 140
Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys145 150 155 160
Val Asn Ser Thr Thr Gly Tyr Ile Asp Tyr Glu Lys Met Glu Glu Lys
165 170 175
Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala Tyr
180 185 190
Pro Arg Asp Trp Asp Tyr Lys Arg Ile Arg Gly Ile Ala Asp Lys Cys
195 200 205
Gly Ala Leu Met Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala
210 215 220
Ala Gln Glu Ala Ala Asp Pro Phe Glu Tyr Cys Asp Val Val Thr Thr225 230 235 240
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr
245 250 255
Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Asp Ala Val
260 265 270
Tyr Asp Phe Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ala Leu Gln
275 280 285
Gly Gly Pro His Asn His Gln Ile Gly Ala Leu Ala Val Ala Leu Lys
290 295 300
Gln Ala Met Ser Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Arg Ala305 310 315 320
Asn Ala Val Ala Leu Gly Asn Tyr Leu Met Ser Lys Asp Tyr Lys Leu
325 330 335
Val Thr Gly Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro
340 345 350
Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Ala Asn
355 360 365
Ile Thr Val Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ala
370 375 380
Pro Gly Gly Val Arg Ile Gly Thr Pro Ala Met Thr Ser Arg Gly Leu385 390 395 400
Val Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu His Arg Ala Ile
405 410 415
Gln Ile Thr Leu Ser Ile Gln Lys Glu Phe Gly Lys Leu Leu Lys Asp
420 425 430
Phe Asn Lys Gly Leu Val Asn Asn Lys Glu Ile Glu Gln Leu Lys Ala
435 440 445
Asp Val Glu Lys Phe Ser Gly Ser Phe Asp Met Pro Gly Phe Ser Leu
450 455 460
Ala Asp Met Lys Tyr Lys Asp465 470
<210> 141 <211> 2228 <212> DNA <213> Oryza sativa<220> <221> CDS <222> (43) . . (1581)<400> 141
cccccgcctc caccaccacc cgccgctcgc cgctcgccca cc atg gcc atg gcg 54
Met Ala Met Ala1
acg gcg ctc cgc aag ctc tcc tcc gac gcc ctc cgc cgc cag ccg ctc 102
Thr Ala Leu Arg Lys Leu Ser Ser Asp Ala Leu Arg Arg Gln Pro Leu5 10 15 20
tcc cgc ate acc ccg ctc tac tac atg gcg tcc ctg ccg gcg acg gag 150
Ser Arg Ile Thr Pro Leu Tyr Tyr Met Ala Ser Leu Pro Ala Thr Glu
25 30 35
gag aga tcc gga gtc acc tgg ccg aag cag ctg aac gcg ccg ctg gag 198
Glu Arg Ser Gly Val Thr Trp Pro Lys Gln Leu Asn Ala Pro Leu Glu
40 45 50
gag gtg gat ccc gag ate gcc gac ate ate gag cac gag aag gcc cgc 246
Glu Val Asp Pro Glu Ile Ala Asp Ile Ile Glu His Glu Lys Ala Arg
55 60 65
caa tgg aag ggt ctg gag ctc ate ccg tcg gag aac ttc acc tcg gtg 294
Gln Trp Lys Gly Leu Glu Leu Ile Pro Ser Glu Asn Phe Thr Ser Val
70 75 80
tca gtg atg cag gcg gtg gga tcc gtc atg acc aac aag tac age gag 342
Ser Val Met Gln Ala Val Gly Ser Val Met Thr Asn Lys Tyr Ser Glu85 90 95 100
ggg tac ccc ggc gcg aga tac tac ggt gga aac gaa tac att gat atg 390
Gly Tyr Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Met
105 110 115
gcc gag tca ttg tgc cag aaa cgt gct ttg gag gcc ttc cgc ttg gac 438
Ala Glu Ser Leu Cys Gln Lys Arg Ala Leu Glu Ala Phe Arg Leu Asp
120 125 130
cca gcg aaa tgg gga gtg aat gtg caa cct cta tca ggg tca cct gcc 486
Pro Ala Lys Trp Gly Val Asn Val Gln Pro Leu Ser Gly Ser Pro Ala
135 140 145
aac ttc cat gtt tac act gcc cta ttg aaa cca cat gag aga ate atg 534
Asn Phe His Val Tyr Thr Ala Leu Leu Lys Pro His Glu Arg Ile Met
150 155 160
gct ttg gat ctt cct cat ggt gga cat ctt tet cac ggc tac cag act 582
Ala Leu Asp Leu Pro His Gly Gly His Leu Ser His Gly Tyr Gln Thr165 170 175 180
gat act aag aag att tca gea gtt tcg ata ttc ttt gag aca atg ccc 630
Asp Thr Lys Lys Ile Ser Ala Val Ser Ile Phe Phe Glu Thr Met Pro
185 190 195
tac aga ttg gat gaa age act ggc ttg att gat tat gat cag atg gag 678
Tyr Arg Leu Asp Glu Ser Thr Gly Leu Ile Asp Tyr Asp Gln Met Glu
200 205 210
aaa agt gcc gtt ctt ttt agg cca aag ttg ate gtt gcg ggt gea agt 726
Lys Ser Ala Val Leu Phe Arg Pro Lys Leu Ile Val Ala Gly Ala Ser
215 220 225
gea tat gcg cgt ctt tat gac tat gac cgc atg cgg aag gtt tgt gac 774
Ala Tyr Ala Arg Leu Tyr Asp Tyr Asp Arg Met Arg Lys Val Cys Asp
230 235 240
aag cag aag gea ata ctt cta gea gat atg gea cat ate agt ggg ctt 822
Lys Gln Lys Ala Ile Leu Leu Ala Asp Met Ala His Ile Ser Gly Leu245 250 255 260
gtc gea gct ggt gtt gtt cca tet cct ttt gat tat gea gat gta gtg 870
Val Ala Ala Gly Val Val Pro Ser Pro Phe Asp Tyr Ala Asp Val Val
265 270 275
act acc act act cac aag tca ctc cgt gga cca cgt gga gcc atg ate 918
Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala Met Ile
280 285 290
ttt tac agg aag ggg gtg aaa gga gta aac aag caa ggc aaa gag gtt 966
Phe Tyr Arg Lys Gly Val Lys Gly Val Asn Lys Gln Gly Lys Glu Val
295 300 305
atg tat gac ttt gag gac aag ate aat gct gct gtc ttc cca ggt ctg 1014
Met Tyr Asp Phe Glu Asp Lys Ile Asn Ala Ala Val Phe Pro Gly Leu
310 315 320
caa ggt gga cca cat aat cat acc att act ggc tta gct gtt gcg ctt 1062
Gln Gly Gly Pro His Asn His Thr Ile Thr Gly Leu Ala Val Ala Leu325 330 335 340
aag cag gea act act ccg gag tac aga gct tat caa gag caa gtt atg 1110
Lys Gln Ala Thr Thr Pro Glu Tyr Arg Ala Tyr Gln Glu Gln Val Met345 350 355
agt aac tgt gca aaa ttt gca cag age ttg aca gea aaa ggc tac gaa 1158
Ser Asn Cys Ala Lys Phe Ala Gln Ser Leu Thr Ala Lys Gly Tyr Glu
360 365 370
ctt gtc tet ggt ggg act gac aac cat tta gtg ttg gta aat ctc aag 1206
Leu Val Ser Gly Gly Thr Asp Asn His Leu Val Leu Val Asn Leu Lys
375 380 385
age aag ggc ata gat ggt tca aga gtg gag aag gtt tta gaa aac gtg 1254
Ser Lys Gly Ile Asp Gly Ser Arg Val Glu Lys Val Leu Glu Asn Val
390 395 400
cac att gca gca aac aag aac aca gtt cct ggt gat gtt tca gct atg 1302
His Ile Ala Ala Asn Lys Asn Thr Val Pro Gly Asp Val Ser Ala Met405 410 415 420
gta cca gga ggc ate agg atg gga acc cca gca ctg acc tca aga gga 1350
Val Pro Gly Gly Ile Arg Met Gly Thr Pro Ala Leu Thr Ser Arg Gly
425 430 435
ttt gtt gag gag gac ttt gct aag gtt gct gat ttc ttc gat gca gca 1398
Phe Val Glu Glu Asp Phe Ala Lys Val Ala Asp Phe Phe Asp Ala Ala
440 445 450
gtg aac ttg gct ttg aag gtt aag gct gca gca ggt gga aca aaa ctg 1446
Val Asn Leu Ala Leu Lys Val Lys Ala Ala Ala Gly Gly Thr Lys Leu
455 460 465
aag gac ttt gtt gcc act ttg caa tet gat age aac att caa tcc gag 1494
Lys Asp Phe Val Ala Thr Leu Gln Ser Asp Ser Asn Ile Gln Ser Glu
470 475 480
att gca aaa ctt cgc cat gat gtg gag gaa tat gca aaa cag ttc ccc 1542
Ile Ala Lys Leu Arg His Asp Val Glu Glu Tyr Ala Lys Gln Phe Pro485 490 495 500
aca att ggg ttt gag aaa gaa acc atg aag tac aag aac taagaaactt 1591
Thr Ile Gly Phe Glu Lys Glu Thr Met Lys Tyr Lys Asn
505 510
tgaatggaac agcaagggta aaagaaaagg catcaagctg aattcctgag gtgactgttg 1651
gaattcttgc aagaacaagt cggtgtaaac atatatccat ggagtgccat cttatgtaaa 1711
agggacccct ggcattttac agcgtgtgga aactttgtca atagttctta tcgtagacac 1771
ctactgtaag atgttatgct aatgctatat taaccttcac tatcttcttg gacaagcagt 1831
tacacatact ttggtgtatt ctgtgaataa ttcgcatgat tgcggaattt ttcgtgttta 1891
taaatcgtaa cttgtaatct tttggccctg cacgcaattt gaaagccctc gatcggattg 1951
tcgtttactg cacacaactg tgaaaaaaaa aggcatatga taactgtgga caaaggctac 2011
caagggcaat gggatttttt ttacctttta cctttttaat cttagaaata aactccttca 2071
aaatttattt tgaagatctg aatttttttt gacaccgatc tggttggcgt gttagcattg 2131
tcttgccatg ccacctggct gatgtgatag gacgttcgtt gcaggtgatg tgccagcgtt 2191
gtattactct tttggaaata agttttgaaa gtattta 2228
<210> 142
<211> 513
<212> PRT
<213> Oryza sativa
<400> 142
Met Ala Met Ala Thr Ala Leu Arg Lys Leu Ser Ser Asp Ala Leu Arg1 5 10 15
Arg Gln Pro Leu Ser Arg Ile Thr Pro Leu Tyr Tyr Met Ala Ser Leu20 25 30
Pro Ala Thr Glu Glu Arg Ser Gly Val Thr Trp Pro Lys Gln Leu Asn
35 40 45
Ala Pro Leu Glu Glu Val Asp Pro Glu Ile Ala Asp Ile Ile Glu His
50 55 60
Glu Lys Ala Arg Gln Trp Lys Gly Leu Glu Leu Ile Pro Ser Glu Asn65 70 75 80
Phe Thr Ser Val Ser Val Met Gln Ala Val Gly Ser Val Met Thr Asn
85 90 95
Lys Tyr Ser Glu Gly Tyr Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Glu
100 105 110
Tyr Ile Asp Met Ala Glu Ser Leu Cys Gln Lys Arg Ala Leu Glu Ala
115 120 125
Phe Arg Leu Asp Pro Ala Lys Trp Gly Val Asn Val Gln Pro Leu Ser
130 135 140
Gly Ser Pro Ala Asn Phe His Val Tyr Thr Ala Leu Leu Lys Pro His145 150 155 160
Glu Arg Ile Met Ala Leu Asp Leu Pro His Gly Gly His Leu Ser His
165 170 175
Gly Tyr Gln Thr Asp Thr Lys Lys Ile Ser Ala Val Ser Ile Phe Phe
180 185 190
Glu Thr Met Pro Tyr Arg Leu Asp Glu Ser Thr Gly Leu Ile Asp Tyr
195 200 205
Asp Gln Met Glu Lys Ser Ala Val Leu Phe Arg Pro Lys Leu Ile Val
210 215 220
Ala Gly Ala Ser Ala Tyr Ala Arg Leu Tyr Asp Tyr Asp Arg Met Arg225 230 235 240
Lys Val Cys Asp Lys Gln Lys Ala Ile Leu Leu Ala Asp Met Ala His
245 250 255
Ile Ser Gly Leu Val Ala Ala Gly Val Val Pro Ser Pro Phe Asp Tyr
260 265 270
Ala Asp Val Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg
275 280 285
Gly Ala Met Ile Phe Tyr Arg Lys Gly Val Lys Gly Val Asn Lys Gln
290 295 300
Gly Lys Glu Val Met Tyr Asp Phe Glu Asp Lys Ile Asn Ala Ala Val305 310 315 320
Phe Pro Gly Leu Gln Gly Gly Pro His Asn His Thr Ile Thr Gly Leu
- 325 330 335
Ala Val Ala Leu Lys Gln Ala Thr Thr Pro Glu Tyr Arg Ala Tyr Gln
340 345 350
Glu Gln Val Met Ser Asn Cys Ala Lys Phe Ala Gln Ser Leu Thr Ala
355 360 365
Lys Gly Tyr Glu Leu Val Ser Gly Gly Thr Asp Asn His Leu Val Leu
370 375 380
Val Asn Leu Lys Ser Lys Gly Ile Asp Gly Ser Arg Val Glu Lys Val385 390 395 400
Leu Glu Asn Val His Ile Ala Ala Asn Lys Asn Thr Val Pro Gly Asp
405 410 415
Val Ser Ala Met Val Pro Gly Gly Ile Arg Met Gly Thr Pro Ala Leu
420 425 430
Thr Ser Arg Gly Phe Val Glu Glu Asp Phe Ala Lys Val Ala Asp Phe
435 440 445
Phe Asp Ala Ala Val Asn Leu Ala Leu Lys Val Lys Ala Ala Ala Gly
450 455 460
Gly Thr Lys Leu Lys Asp Phe Val Ala Thr Leu Gln Ser Asp Ser Asn465 470 475 480
Ile Gln Ser Glu Ile Ala Lys Leu Arg His Asp Val Glu Glu Tyr Ala
485 490 495
Lys Gln Phe Pro Thr Ile Gly Phe Glu Lys Glu Thr Met Lys Tyr Lys500 505 510
Asn<210> 143
<211> 1943
<212> DNA
<213> Hordetim vulgare
<220>
<221> CDS
<222> (56).. (1585)
<400> 143
gctccaaccc ctacccagaa ggagaggagg aggccgccca ccaccaccac ccacc atg 58
Met1
gcc atg gcg acg gcg ctc cgc aag ctc tcc gcc cgc ggt cag ccc ctc 106
Ala Met Ala Thr Ala Leu Arg Lys Leu Ser Ala Arg Gly Gln Pro Leu
5 10 15
tcc cga ctc acg ccg ctc tac tcc atg gcg tcc ctg ccg gcg acg gag 154
Ser Arg Leu Thr Pro Leu Tyr Ser Met Ala Ser Leu Pro Ala Thr Glu
20 25 30
gag aga tcc gca gtc acc tgg ccg aag cag ctc aac gcg ccg ctg gag 202
Glu Arg Ser Ala Val Thr Trp Pro Lys Gln Leu Asn Ala Pro Leu Glu
35 40 45
gag gtc gac ccg gag att gcc gac ate ate gag ctc gag aag gcc cgc 250
Glu Val Asp Pro Glu Ile Ala Asp Ile Ile Glu Leu Glu Lys Ala Arg50 55 60 65
caa tgg aag ggg ctg gag ctc ate ccg tcg gag aac ttc acc tcc ctg 298
Gln Trp Lys Gly Leu Glu Leu Ile Pro Ser Glu Asn Phe Thr Ser Leu
70 75 80
tcg gtg atg cag gcc gtg gga tcc gtc atg acg aac aag tac age gag 346
Ser Val Met Gln Ala Val Gly Ser Val Met Thr Asn Lys Tyr Ser Glu
85 90 95
ggg tac ccc ggc gcc aga tac tac ggt gga aac gaa tac att gat atg 394
Gly Tyr Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Met
100 105 110
gcc gag acg ctg tgc cag aaa cgt gct ttg gag gcc ttc aat ttg gac 442
Ala Glu Thr Leu Cys Gln Lys Arg Ala Leu Glu Ala Phe Asn Leu Asp
115 120 125
ccg gag aag tgg gga gtg aat gtg caa cct ctg tcg ggt tca cct gcc 490
Pro Glu Lys Trp Gly Val Asn Val Gln Pro Leu Ser Gly Ser Pro Ala130 135 140 145
aac ttc cat gta tac act gct ctg ctg aag cca cat gac aga att atg 538
Asn Phe His Val Tyr Thr Ala Leu Leu Lys Pro His Asp Arg Ile Met
150 155 160
gcc ctg gat ctt cct cac ggt gga cat ctt tcc cat ggt tac cag act 586
Ala Leu Asp Leu Pro His Gly Gly His Leu Ser His Gly Tyr Gln Thr
165 170 175
gac aca aag aaa ate tca gca gtt tca ata ttc ttt gag aca atg cct 634
Asp Thr Lys Lys Ile Ser Ala Val Ser Ile Phe Phe Glu Thr Met Pro
180 185 190
tac aga ctg gat gaa age act ggc ttg att gat tat gac cag ttg gag 682
Tyr Arg Leu Asp Glu Ser Thr Gly Leu Ile Asp Tyr Asp Gln Leu Glu
195 200 205
aaa agt gcc gtt ctt ttt agg cca aag ttg att gtt gct ggt gct agt 730
Lys Ser Ala Val Leu Phe Arg Pro Lys Leu Ile Val Ala Gly Ala Ser210 215 220 225
gca tat gct cgc ctt tat gat tat aac cgc atg cgg aag ate tgt gac 778
Ala Tyr Ala Arg Leu Tyr Asp Tyr Asn Arg Met Arg Lys Ile Cys Asp
230 235 240
aag cag aag gca gtt ctt ctc gca gac atg gca cat ate agt ggg cta 826
Lys Gln Lys Ala Val Leu Leu Ala Asp Met Ala His Ile Ser Gly Leu
245 250 255
gtt gct gct ggt gtc att ccc tet cct ttt gag tat gcc gat gtg gtg 874
Val Ala Ala Gly Val Ile Pro Ser Pro Phe Glu Tyr Ala Asp Val Val260 265 270
act acc act acc cac aag tca ctc cgt ggt cca cgt gga gcc atg ate 922
Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala Met Ile
275 280 285
ttt ttc cgg aag ggg gtg aaa gaa ata aac aaa caa ggg aag gag gtt 970
Phe Phe Arg Lys Gly Val Lys Glu Ile Asn Lys Gln Gly Lys Glu Val290 295 300 305
aag tat gat ttt gag gac aaa ate aat gct gct gtc ttc cct ggt ctg 1018
Lys Tyr Asp Phe Glu Asp Lys Ile Asn Ala Ala Val Phe Pro Gly Leu
310 315 320
caa ggt gga cca cat aac cat act att act ggc ctg gcc gtt gcg ctt 1066
Gln Gly Gly Pro His Asn His Thr Ile Thr Gly Leu Ala Val Ala Leu
325 330 335
aag cag gea act act cag gag tac cga gct tat caa gag caa gtt atg 1114
Lys Gln Ala Thr Thr Gln Glu Tyr Arg Ala Tyr Gln Glu Gln Val Met
340 345 350
age aac tet gct aga ttt gct gag age ttg act tcc aaa ggc tac gac 1162
Ser Asn Ser Ala Arg Phe Ala Glu Ser Leu Thr Ser Lys Gly Tyr Asp
355 360 365
att gtc tet ggt ggg act gat aac cat tta gtt ttg gtg aac ctc aag 1210
Ile Val Ser Gly Gly Thr Asp Asn His Leu Val Leu Val Asn Leu Lys370 375 380 385
aaa aag gga ata gat ggt tca aga gtg gag aag gtt tta gaa aat gtg 1258
Lys Lys Gly Ile Asp Gly Ser Arg Val Glu Lys Val Leu Glu Asn Val
390 395 400
cat att gea gea aac aag aac aca gtt cct ggt gat gtt tca gct atg 1306
His Ile Ala Ala Asn Lys Asn Thr Val Pro Gly Asp Val Ser Ala Met
405 410 415
gta ccc gga ggc ate agg atg gga acc ccc gcg ctt aca tca aga gga 1354
Val Pro Gly Gly Ile Arg Met Gly Thr Pro Ala Leu Thr Ser Arg Gly
420 425 430
ttt gtt gag gag gac ttc gcc aag gtt gcc gaa ttc ttc gat tcg gea 1402
Phe Val Glu Glu Asp Phe Ala Lys Val Ala Glu Phe Phe Asp Ser Ala
435 440 445
gtg aac ttg gct ttg aag gtt aaa gct gea gea gea ggt acc aaa ctg 1450
Val Asn Leu Ala Leu Lys Val Lys Ala Ala Ala Ala Gly Thr Lys Leu450 455 460 465
aag gac ttt gtt gcc act ttg caa tcc gac age aac ate caa gct gaa 1498
Lys Asp Phe Val Ala Thr Leu Gln Ser Asp Ser Asn Ile Gln Ala Glu
470 475 480
att gea aag ctt cgc cac gat gtg gag gaa tat gea aaa caa ttc cca 1546
Ile Ala Lys Leu Arg His Asp Val Glu Glu Tyr Ala Lys Gln Phe Pro
485 490 495
aca ate gga ttc gag aaa gag acc atg aag tac aag aac taagcactgc 1595
Thr Ile Gly Phe Glu Lys Glu Thr Met Lys Tyr Lys Asn500 505 510
tgtgtttcaa cagcaaggaa gcaaacagga agcacaactg aggacaagtc catgtaaaca 1655
atagatccat gatgaagcgc catcttatgt aaaaggaatc caagcatttt acagaatatg 1715
ggaactttgt caatagtttc ttattgcagg cacatactgt aagatgtttc gctgatatgc 1775
tatatgaacc accatccttc ttggataagc atttacttac acaaaaaaaa aaaaaagctc 1835
cgtggataac acgtatgatt cggctttgag atcttgagcg gtttgtgagc ttcatgtatg 1895
gacattatct ttgtgatgaa attcctgcca taaaaaaaaa aaaaaaaa 1943
<210> 144
<211> 510
<212> PRT
<213> Hordeum vulgare<400> 144
Met Ala Met Ala Thr Ala Leu Arg Lys Leu Ser Ala Arg Gly Gln Pro1 5 10 15
Leu Ser Arg Leu Thr Pro Leu Tyr Ser Met Ala Ser Leu Pro Ala Thr
20 25 30
Glu Glu Arg Ser Ala Val Thr Trp Pro Lys Gln Leu Asn Ala Pro Leu
35 40 45
Glu Glu Val Asp Pro Glu Ile Ala Asp Ile Ile Glu Leu Glu Lys Ala
50 55 60
Arg Gln Trp Lys Gly Leu Glu Leu Ile Pro Ser Glu Asn Phe Thr Ser65 70 75 80
Leu Ser Val Met Gln Ala Val Gly Ser Val Met Thr Asn Lys Tyr Ser
85 90 95
Glu Gly Tyr Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp
100 105 110
Met Ala Glu Thr Leu Cys Gln Lys Arg Ala Leu Glu Ala Phe Asn Leu
115 120 125
Asp Pro Glu Lys Trp Gly Val Asn Val Gln Pro Leu Ser Gly Ser Pro
130 135 140
Ala Asn Phe His Val Tyr Thr Ala Leu Leu Lys Pro His Asp Arg Ile145 150 155 160
Met Ala Leu Asp Leu Pro His Gly Gly His Leu Ser His Gly Tyr Gln
165 170 175
Thr Asp Thr Lys Lys Ile Ser Ala Val Ser Ile Phe Phe Glu Thr Met
180 185 190
Pro Tyr Arg Leu Asp Glu Ser Thr Gly Leu Ile Asp Tyr Asp Gln Leu
195 200 205
Glu Lys Ser Ala Val Leu Phe Arg Pro Lys Leu Ile Val Ala Gly Ala
210 215 220
Ser Ala Tyr Ala Arg Leu Tyr Asp Tyr Asn Arg Met Arg Lys Ile Cys225 230 235 240
Asp Lys Gln Lys Ala Val Leu Leu Ala Asp Met Ala His Ile Ser Gly
245 250 255
Leu Val Ala Ala Gly Val Ile Pro Ser Pro Phe Glu Tyr Ala Asp Val
260 265 270
Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala Met
275 280 285
Ile Phe Phe Arg Lys Gly Val Lys Glu Ile Asn Lys-Gln Gly Lys Glu
290 295 300
Val Lys Tyr Asp Phe Glu Asp Lys Ile Asn Ala Ala Val Phe Pro Gly305 310 315 320
Leu Gln Gly Gly Pro His Asn His Thr Ile Thr Gly Leu Ala Val Ala
325 330 335
Leu Lys Gln Ala Thr Thr Gln Glu Tyr Arg Ala Tyr Gln Glu Gln Val
340 345 350
Met Ser Asn Ser Ala Arg Phe Ala Glu Ser Leu Thr Ser Lys Gly Tyr
355 360 365
Asp Ile Val Ser Gly Gly Thr Asp Asn His Leu Val Leu Val Asn Leu
370 375 380
Lys Lys Lys Gly Ile Asp Gly Ser Arg Val Glu Lys Val Leu Glu Asn385 390 395 400
Val His Ile Ala Ala Asn Lys Asn Thr Val Pro Gly Asp Val Ser Ala
405 410 415
Met Val Pro Gly Gly Ile Arg Met Gly Thr Pro Ala Leu Thr Ser Arg
420 425 430
Gly Phe Val Glu Glu Asp Phe Ala Lys Val Ala Glu Phe Phe Asp Ser
435 440 445
Ala Val Asn Leu Ala Leu Lys Val Lys Ala Ala Ala Ala Gly Thr Lys
450 455 460
Leu Lys Asp Phe Val Ala Thr Leu Gln Ser Asp Ser Asn Ile Gln Ala465 470 475 480
Glu Ile Ala Lys Leu Arg His Asp Val Glu Glu Tyr Ala Lys Gln Phe485 490 495
Pro Thr Ile Gly Phe Glu Lys Glu Thr Met Lys Tyr Lys Asn500 505 510
<210> 145<211> 1800<212> DNA
<213> Arabidopsis thaliana
<220>
<221> CDS
<222> (64).. (1473)
<400> 145
gatctcagat ctctccctcc ctctttctcc gatctcagat ccattcaaca atctccaaag 60
aag atg gaa cca gtc tet tca tgg ggt aac acc tet ctc gtc tcc gta 108 Met Glu Pro Val Ser Ser Trp Gly Asn Thr Ser Leu Val Ser Val 1 5 10 15 gat cca gag ate cac gac cta ate gag aag gag aaa cgt cgg caa tgt 156Asp Pro Glu Ile His Asp Leu Ile Glu Lys Glu Lys Arg Arg Gln Cys 20 25 30 cga gga ate gaa Ctt ate gct tcc gag aat ttc act tcc ttc gcc gtc 204Arg Gly Ile Glu 35 Leu Ile Ala Ser Glu 40 Asn Phe Thr Ser Phe 45 Ala Val ate gaa gct etc gga agt gcc tta acc aac aaa tac tcc gaa ggt att 252Ile Glu Ala 50 Leu Gly Ser Ala Leu 55 Thr Asn Lys Tyr Ser 60 Glu Gly Ile CCt ggt aat cgt tat tac gga ggt aac gaa ttc ate gat gag ate gag 300Pro Gly Asn Arg Tyr Tyr Gly Gly Asn Glu Phe Ile Asp Glu Ile Glu 65 70 75 aat Ctt tgc cgt tca aga gct ctc gaa gct ttc cat tgt gat cca gea 348Asn Leu Cys Arg Ser Arg Ala Leu Glu Ala Phe His Cys Asp Pro Ala 80 85 90 95 gcg tgg ggc gtt aat gtt cag ccg tat tet gga tet ccg gea aat ttc 396Ala Trp Gly Val Asn 100 Val Gln Pro Tyr Ser 105 Gly Ser Pro Ala Asn 110 Phe gct gct tac acg gct ttg Ctt cag cct cac gat cgt ate atg ggg Ctt 444Ala Ala Tyr Thr Ala Leu Leu Gln Pro His Asp Arg Ile Met Gly Leu 115 120 125 gat ttg cct tca ggt ggt cat ttg act cat ggt tac tat aca tet ggt 492Asp Leu Pro 130 Ser Gly Gly His Leu 135 Thr His Gly Tyr Tyr 140 Thr Ser Gly ggt aag aag ate tet gcg act tcg ate tac ttt gag agt Ctt ccg tat 540Gly Lys 145 Lys Ile Ser Ala Thr 150 Ser Ile Tyr Phe Glu 155 Ser Leu Pro Tyr aag gtg aat ttc acc act ggt tac att gat tac gat aag Ctt gaa gag 588Lys Val Asn Phe Thr Thr Gly Tyr Ile Asp Tyr Asp Lys Leu Glu Glu 160 165 170 175 aag gcg ttg gat ttc agg cct aag ttg Ctt ate tgt ggt ggt agt gcg 636Lys Ala Leu Asp Phe 180 Arg Pro Lys Leu Leu 185 Ile Cys Gly Gly Ser 190 Ala tat cct agg gat tgg gat tac gct aga ttt aga gct att gct gat aag 684Tyr Pro Arg Asp Trp Asp Tyr Ala Arg Phe Arg Ala Ile Ala Asp Lys 195 200 205 gtt gga gct Ctt ttg Ctt tgt gac atg gct cac ate agt ggt ctc gtt 732Val Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val 210 215 220 gct gct cag gaa gct gea aac cca ttt gag tac tgt gac gtt gtg aca 780Ala Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr 225 230 235 acc aca acc cac aag agt ttg agg ggt cca agg gct ggt atg att ttc 828Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe240 245 250 255
tac agg aag ggt cca aaa cca cca aag aag ggt caa ccc gag ggt gca 876
Tyr Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala
260 265 270
gtc tat gat ttt gag gac aaa ate aac ttt gct gta ttc cct gcg ctt 924
Val Tyr Asp Phe Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ala Leu
275 280 285
caa ggt ggt cct cac aat cac cag att ggt gct cta gct gtt gcg ttg 972
Gln Gly Gly Pro His Asn His Gln Ile Gly Ala Leu Ala Val Ala Leu
290 295 300
aag cag gct aat act cct ggg ttc aag gtc tac gca aaa caa gtg aaa 1020
Lys Gln Ala Asn Thr Pro Gly Phe Lys Val Tyr Ala Lys Gln Val Lys
305 310 315
gcc aat gct gtt gcc ctt gga aac tac cta atg age aag ggt tac cag 1068
Ala Asn Ala Val Ala Leu Gly Asn Tyr Leu Met Ser Lys Gly Tyr Gln320 325 330 335
att gtg acc aat gga act gag aac cac ctt gtt ctc tgg gat ctt cgc 1116
Ile Val Thr Asn Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg
340 345 350
cct ctt gga ttg acc gga aac aag gtt gag aag ctc tgc gat ctg tgc 1164
Pro Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys
355 360 365
age att aca ttg aac aag aac gca gta ttt gga gac agt agt gct ctt 1212
Ser Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu
370 375 380
gct cct gga ggt gta aga ate ggt gca ccc gcg atg aca tcg aga gga 1260
Ala Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly
385 390 395
ttg gtg gag aag gac ttt gag cag ata gga gaa ttc ctg age cgt gca 1308
Leu Val Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu Ser Arg Ala400 405 410 415
gtg aca ctg acg ttg gac ate caa aag aca tac ggt aag ttg ttg aag 1356
Val Thr Leu Thr Leu Asp Ile Gln Lys Thr Tyr Gly Lys Leu Leu Lys
420 425 430
gac ttc aac aag ggt ttg gtg aac aac aaa gat ctc gat cag ctc aag 1404
Asp Phe Asn Lys Gly Leu Val Asn Asn Lys Asp Leu Asp Gln Leu Lys
435 440 445
gct gat gtc gag aag ttc tcg gcg tet tat gag atg cct gga ttc ctc 1452
Ala Asp Val Glu Lys Phe Ser Ala Ser Tyr Glu Met Pro Gly Phe Leu
450 455 460
atg tet gag atg aag tac aag gattagagat ctttctctat atgcaagagt 1503
Met Ser Glu Met Lys Tyr Lys465 470
aatcttctat tattatctac catatatata aaatatgctt ttgtaggatc gccttaaagg 1563
cgaagagatg aagatgcaaa cagtaaaaaa aaagggtttt cttttcagct atttcttctt 1623
gaatgttttt tttctttttc ttttggtttc ttattgaaat tgttgtattt ttgttggctt 1683
ttttctaata atatcagcga gtttttcttt ccactgtttc aattaaatac ggtgtgtttg 1743
tatgggtttt agtttcatag attgaattat ttgtactcaa ctaaggaatt cgtgtaa 1800
<210> 146
<211> 470
<212> PRT
<213> Arabidopsis thaliana
<400> 146
Met Glu Pro Val Ser Ser Trp Gly Asn Thr Ser Leu Val Ser Val Asp1 5 10 15
Pro Glu Ile His Asp Leu Ile Glu Lys Glu Lys Arg Arg Gln Cys Arg20 25 30
Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Ile
35 40 45
Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Ile Pro
50 55 60
Gly Asn Arg Tyr Tyr Gly Gly Asn Glu Phe Ile Asp Glu Ile Glu Asn65 70 75 80
Leu Cys Arg Ser Arg Ala Leu Glu Ala Phe His Cys Asp Pro Ala Ala
85 90 95
Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala
100 105 110
Ala Tyr Thr Ala Leu Leu Gln Pro His Asp Arg Ile Met Gly Leu Asp
115 120 125
Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr Tyr Thr Ser Gly Gly
130 135 140
Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys145 150 155 160
Val Asn Phe Thr Thr Gly Tyr Ile Asp Tyr Asp Lys Leu Glu Glu Lys
165 170 175
Ala Lêu Asp Phe Arg Pro Lys Leu Leu Ile Cys Gly Gly Ser Ala Tyr
180 185 190
Pro Arg Asp Trp Asp Tyr Ala Arg Phe Arg Ala Ile Ala Asp Lys Val
195 200 205
Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala
210 215 220
Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr Cys Asp Val Val Thr Thr225 230 235 240
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr
245 250 255
Arg Lys Gly Pro Lys Pro Pro Lys Lys Gly Gln Pro Glu Gly Ala Val
260 265 270
Tyr Asp Phe Glu Asp Lys Ile Asn Phe Ala Val Phe Pro Ala Leu Gln
275 280 285
Gly Gly Pro His Asn His Gln Ile Gly Ala Leu Ala Val Ala Leu Lys
290 295 300
Gln Ala Asn Thr Pro Gly Phe Lys Val Tyr Ala Lys Gln Val Lys Ala305 310 315 320
Asn Ala Val Ala Leu Gly Asn Tyr Leu Met Ser Lys Gly Tyr Gln Ile
325 330 335
Val Thr Asn Gly Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro
340 345 350
Leu Gly Leu Thr Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Cys Ser
355 360 365
Ile Thr Leu Asn Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ala
370 375 380
Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly Leu385 390 395 400
Val Glu Lys Asp Phe Glu Gln Ile Gly Glu Phe Leu Ser Arg Ala Val
405 410 415
Thr Leu Thr Leu Asp Ile Gln Lys Thr Tyr Gly Lys Leu Leu Lys Asp
420 425 430
Phe Asn Lys Gly Leu Val Asn Asn Lys Asp Leu Asp Gln Leu Lys Ala
435 440 445
Asp Val Glu Lys Phe Ser Ala Ser Tyr Glu Met Pro Gly Phe Leu Met
450 455 460
Ser Glu Met Lys Tyr Lys465 470
<210> 147
<211> 664
<212> DNA
<213> Brassica napus<220>
<221> CDS
<222> (88)..(570)
<400> 147
attcccgggt cgactccatc tccatcttct tagctacctc gtcctgaaag ctcaaacatt 60
tatccacagt accggactag agaaaga atg gaa gct tgt tgt gga gct act tca 114
Met Glu Ala Cys Cys Gly Ala Thr Ser1 5
atg ggt tct ctt cag caa tct gga ggg gtt aaa gga cct gtc ttt gct 162
Met Gly Ser Leu Gln Gln Ser Gly Gly Val Lys Gly Pro Val Phe Ala
10 15 20 25
cca gta atg tcc cca gtg aac aag ttt tct cag caa ctg aag ttc aat 210
Pro Val Met Ser Pro Val Asn Lys Phe Ser Gln Gln Leu Lys Phe Asn
30 35 40
ttt gcc gga cct aac cgt tct ctg ttt cta aaa gaa gcc tgg tcg ttg 258
Phe Ala Gly Pro Asn Arg Ser Leu Phe Leu Lys Glu Ala Trp Ser Leu
45 50 55
aaa gga aag cgt ctc aag tct cgg tac ctg ccg tcg aga cta gca gca 306
Lys Gly Lys Arg Leu Lys Ser Arg Tyr Leu Pro Ser Arg Leu Ala Ala
60 65 70
atg aaa tcc ctt ttg agg act atg gcc gta ctg aag ttg ate cag agg 354
Met Lys Ser Leu Leu Arg Thr Met Ala Val Leu Lys Leu Ile Gln Arg
75 80 85
tcg atg aga tta tca aaa agg aga aaa aca gac agt tca gga gct tgg 402
Ser Met Arg Leu Ser Lys Arg Arg Lys Thr Asp Ser Ser Gly Ala Trp90 95 100 105
age tca ttg cct ccg aga att tca cgt ctc gtg ctg tta tgg aga ctg 450
Ser Ser Leu Pro Pro Arg Ile Ser Arg Leu Val Leu Leu Trp Arg Leu
110 115 120
ttg gat cat gcc tta cca aca agt att ctg agg gac ttc ctg gta aaa 498
Leu Asp His Ala Leu Pro Thr Ser Ile Leu Arg Asp Phe Leu Val Lys
125 130 135
ggt att atg gtg gca atg agt tca tcg ate age tgg aga cac ttt gcc 546
Gly Ile Met Val Ala Met Ser Ser Ser Ile Ser Trp Arg His Phe Ala
140 145 150
aga acc ggg cct tag cga cct tcc gcttagattc aaccaaatgg ggagttaacg 600
Arg Thr Gly Pro Arg Pro Ser
155 160
ttcagccctt atctggttca cctgcaaact ttgctgtgta cactgccata cttaagcctc 660
atga 664
<210> 148<211> 157<212> PRT
<213> Brassica napus<400> 148
Met Glu Ala Cys Cys Gly Ala Thr Ser Met Gly Ser Leu Gln Gln Ser1 5 10 15
Gly Gly Val Lys Gly Pro Val Phe Ala Pro Val Met Ser Pro Val Asn
20 25 30
Lys Phe Ser Gln Gln Leu Lys Phe Asn Phe Ala Gly Pro Asn Arg Ser
35 40 45
Leu Phe Leu Lys Glu Ala Trp Ser Leu Lys Gly Lys Arg Leu Lys Ser
50 55 60
Arg Tyr Leu Pro Ser Arg Leu Ala Ala Met Lys Ser Leu Leu Arg Thr65 70 75 80
Met Ala Val Leu Lys Leu Ile Gln Arg Ser Met Arg Leu Ser Lys Arg
85 90 95
Arg Lys Thr Asp Ser Ser Gly Ala Trp Ser Ser Leu Pro Pro Arg Ile100
Ser Arg Leu Val Leu Leu Trp Arg115 120
Ser Ile Leu Arg Asp Phe Leu Val
130 135
Ser Ser Ile Ser Trp Arg His Phe145 150
105 110
Leu Leu Asp His Ala Leu Pro Thr125
Lys Gly Ile Met Val Ala Met Ser140
Ala Arg Thr Gly Pro155
<210> 149
<211> 1186
<212> DNA
<213> Linum usitatissimum
<220>
<221> CDS
<222> (103).. (1041)
<220>
<221> misc_feature<222> (1011)..(1078)
<223> η localizado nas posições 1011, 1055, 1061 and 1078; cada η é a,c, g, ou t
<400> 149
ttgtaccaaa aagcaggctg gtaccggtcc ggaattcccg ggatcaaact cccccaatcc 60
tctgtttcct tttctctctc tctctctctg aatctcagca aa atg gat cca gtc 114
Met Asp Pro Val1
aag gta tgg gga aac act cct ttg caa acc gtg gac cct gag ate cac 162
Lys Val Trp Gly Asn Thr Pro Leu Gln Thr Val Asp Pro Glu Ile His5 10 15 20
gac ctc ate gag aag gag aag cgc cgt caa tgc cgc ggg ate gag ctc 210
Asp Leu Ile Glu Lys Glu Lys Arg Arg Gln Cys Arg Gly Ile Glu Leu
25 30 35
ate gcc tcc gag aac ttc acc tcc ttc gcc gtc ate gaa gcc ctc ggc 258
Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Ile Glu Ala Leu Gly
40 45 50
age gcc ctc acc aac aag tac tcc gag ggc atg ccc gga aat cgc tac 306
Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro Gly Asn Arg Tyr
55 60 65
tac ggc ggc aac gag tac ate gat cag ate gag aac ctc tgc gta tcc 354
Tyr Gly Gly Asn Glu Tyr Ile Asp Gln Ile Glu Asn Leu Cys Val Ser
70 75 80
cgc gcc ttg acc gct ttc cac ttg gac gac acc aag tgg ggc gtc aat 402
Arg Ala Leu Thr Ala Phe His Leu Asp Asp Thr Lys Trp Gly Val Asn85 90 95 100
gtc cag cct tac tcc ggc tcc cct gcc aat ttc gcc gcc tac acc gcc 450
Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala Ala Tyr Thr Ala
105 110 115
att ctc aag ccc cat gat cgt ate atg gga ttg gat ctc cca tet ggt 498
Ile Leu Lys Pro His Asp Arg Ile Met Gly Leu Asp Leu Pro Ser Gly
120 125 130
ggt cat ctg act cat gga tac tac acc tcc age ggg aag aag ate tcc 546
Gly His Leu Thr His Gly Tyr Tyr Thr Ser Ser Gly Lys Lys Ile Ser
135 140 145
gcc act tcc ate tac ttc gag age ttg cct tac aag gtg aat tcc age 594
Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys Val Asn Ser Ser
150 155 160
act ggc tac ate gac tac gat aag ctg gaa gag aag gct ttg gat ttc 642
Thr Gly Tyr Ile Asp Tyr Asp Lys Leu Glu Glu Lys Ala Leu Asp Phe165 170 175 180
agg cca cgg ttg ate ate tgt ggt ggc agt gct tac cct agg gac tgg 690Arg Pro Arg Leu Ile Ile Cys Gly Gly Ser Ala Tyr Pro Arg Asp Trp
185 190 195
gat tac gct agg ttc agg gct att gct gat aaa tgc ggc gca ctt ttg 738
Asp Tyr Ala Arg Phe Arg Ala Ile Ala Asp Lys Cys Gly Ala Leu Leu
200 205 210
ctc tgc gat atg gct cac att age ggc cta gtt gct gct cag gaa gct 786
Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Gln Glu Ala
215 220 225
gcc aac ccc ttt gag ttc tgt gac att gtc aca acc acc acc cac aag 834
Ala Asn Pro Phe Glu Phe Cys Asp Ile Val Thr Thr Thr Thr His Lys
230 235 240
agt ttg agg ggt ccc aga gct ggt atg ate ttc tac cgc aag aga cct 882
Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr Arg Lys Arg Pro245 250 255 260
aag cca gcc aac aag aag ggt cag cct cag gga aac tat gaa ttc gag 930
Lys Pro Ala Asn Lys Lys Gly Gln Pro Gln Gly Asn Tyr Glu Phe Glu
265 270 275
gac aac ate aac ttc tet gtc ttc cct gcc ctc cag gga gcc ccc ata 978
Asp Asn Ile Asn Phe Ser Val Phe Pro Ala Leu Gln Gly Ala Pro Ile
280 285 290
ate acc aga tcg gtg ccc ttg ctg ttg cat tgn aag caa ggc tgc aac 1026
Ile Thr Arg Ser Val Pro Leu Leu Leu His Xaa Lys Gln Gly Cys Asn
295 300 305
ccc tgc att caa gcc taacccaagc aatngaagcn caagctgttg ctgttgngaa 1081
Pro Cys Ile Gln Ala310
actatttgat gagcaaaggc tacaccttgg ttactggagg aactgagaac caccttgttc 1141tgtgggatct gagacctctt gggttgactg gcaacaaggt cgaga 1186
<210> 150
<211> 313
<212> PRT
<213> Linum usitatissimum<220>
<221> misc_feature
<222> (303)..(303)
<223> Xaa é Trp ou Cys
<400> 150
Met Asp Pro Val Lys Val Trp Gly Asn Thr Pro1 5 10
Pro Glu Ile His Asp Leu Ile Glu Lys Glu Lys
20 25
Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr
35 40
Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr
50 55
Gly Asn Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile65 70 75
Leu Cys Val Ser Arg Ala Leu Thr Ala Phe His
85 90
Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser
100 105
Ala Tyr Thr Ala Ile Leu Lys Pro His Asp Arg
115 120
Leu Pro Ser Gly Gly His Leu Thr His Gly Tyr
130 135
Lys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu145 150 155
Val Asn Ser Ser Thr Gly Tyr Ile Asp Tyr Asp
Leu Gln Thr
Arg Arg Gln30
Ser Phe Ala45
Ser Glu Gly60
Asp Gln Ile
Leu Asp Asp
Pro Ala Asn110
Ile Met Gly
125Tyr Thr Ser140
Ser Leu ProLys Leu Glu
Val Asp15
Cys Arg
Val Ile
Met Pro
Glu Asn80Thr Lys95
Phe Ala
Leu Asp
Ser Gly
Tyr Lys160Glu Lys165 170 175
Ala Leu Asp Phe Arg Pro Arg Leu Ile Ile Cys Gly Gly Ser Ala Tyr
180 185 190
Pro Arg Asp Trp Asp Tyr Ala Arg Phe Arg Ala Ile Ala Asp Lys Cys
195 200 205
Gly Ala Leu Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala
210 215 220
Ala Gln Glu Ala Ala Asn Pro Phe Glu Phe Cys Asp Ile Val Thr Thr225 230 235 240
Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr
245 250 255
Arg Lys Arg Pro Lys Pro Ala Asn Lys Lys Gly Gln Pro Gln Gly Asn
260 265 270
Tyr Glu Phe Glu Asp Asn Ile Asn Phe Ser Val Phe Pro Ala Leu Gln
275 280 285
Gly Ala Pro Ile Ile Thr Arg Ser Val Pro Leu Leu Leu His Xaa Lys
290 295 300
Gln Gly Cys Asn Pro Cys Ile Gln Ala305 310
<210> 151
<211> 1844
<212> DNA
<213> Helianthus annuus
<220>
<221> CDS
<222> (119)..(1759)
<400> 151
aatctcccct ctctccacga caatttcgac acccattttc cacacatcac tcaagtacct 60
ggtgttaacc ttttggtctg cgtcaaacgg gtggcatagc atcggaaccc cttcagac 118
atg ctt tcc aat gtc gaa ttc caa ccg caa tgg ctc caa aat cct cca 166
Met Leu Ser Asn Val Glu Phe Gln Pro Gln Trp Leu Gln Asn Pro Pro1 5 10 15
att gca gaa tgt gcc aag act tcc ttc tgc ggt gcc cat ttc acg ate 214
Ile Ala Glu Cys Ala Lys Thr Ser Phe Cys Gly Ala His Phe Thr Ile
20 25 30
aaa cct ctc gcc ttc ate tca ctc acc aaa ccc tcc ggc aaa aac tca 262
Lys Pro Leu Ala Phe Ile Ser Leu Thr Lys Pro Ser Gly Lys Asn Ser
35 40 45
ate cat tca aac cct tta acc gaa ccg ggt cga acc acc ccc aac aac 310
Ile His Ser Asn Pro Leu Thr Glu Pro Gly Arg Thr Thr Pro Asn Asn
50 55 60
ctc tcc tet ctc tat act cta ctc tet cta gac cgc atg gat ccc gtt 358
Leu Ser Ser Leu Tyr Thr Leu Leu Ser Leu Asp Arg Met Asp Pro Val65 70 75 80
aat gtg tgg ggc aac acc ccc cta gac gcc gcc gac cca gag ate ttc 406
Asn Val Trp Gly Asn Thr Pro Leu Asp Ala Ala Asp Pro Glu Ile Phe
85 90 95
gac ctc att gag aaa gaa aaa cgc cgc caa tgt cgc gga ate gaa ctg 454
Asp Leu Ile Glu Lys Glu Lys Arg Arg Gln Cys Arg Gly Ile Glu Leu
100 105 110
att gca tcc gaa aac ttc acc tca ttt gca gtc ate caa gct ttg gga 502
Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Ile Gln Ala Leu Gly
115 120 125
tcc ccc ttg acc aac aaa tac tcc gag ggc atg cct gga aac cgt tac 550
Ser Pro Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro Gly Asn Arg Tyr
130 135 140
tac ggt ggc aac gag tac ate gac cag ate gaa aac ctc tgc cgt tet 598Tyr Gly Gly Asn Glu Tyr Ile Asp Gln Ile Glu Asn Leu Cys Arg Ser 145 150 155 160 cgc gcc tta cag gct tac cgt cta gat ccc acc aaa tgg ggt gtt aat 646Arg Ala Leu Gln Ala Tyr Arg Leu Asp Pro Thr Lys Trp Gly Val Asn 165 170 175 gtc cag CCC tat tet gga tet CCt gcc aat ttt gct gcc tat aca gcc 694Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala Ala Tyr Thr Ala 180 185 190 CtC tta gag ccc cat gat cgg ate atg ggc Ctt gat ttg cca tca ggt 742Leu Leu Glu Pro His Asp Arg Ile Met Gly Leu Asp Leu Pro Ser Gly 195 200 205 ggg cat ttg acg cat gga tat tat act tcc ggt ggg aag aag ata tca 790Gly His Leu Thr His Gly Tyr Tyr Thr Ser Gly Gly Lys Lys Ile Ser 210 215 220 gct acc tcg att tac ttt gag agt ttg ccg tat aaa gtg aat tcg act 838Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys Val Asn Ser Thr 225 230 235 240 acg gga tat ate gat tac gag aag atg gag gag aag gcc ttg gac ttt 886Thr Gly Tyr Ile Asp Tyr Glu Lys Met Glu Glu Lys Ala Leu Asp Phe 245 250 255 aga CCC aag ttg att att tgt ggg ggg agt gcg tac ccg aga gat tgg 934Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala Tyr Pro Arg Asp Trp 260 265 270 gat tac aag agg ate agg ggc att gct gat aaa tgt ggg gcc ctc atg 982Asp Tyr Lys Arg Ile Arg Gly Ile Ala Asp Lys Cys Gly Ala Leu Met 275 280 285 ttg tgt gat atg gct cat ate agt ggc Ctt gtt gct gca cag gaa gct 1030Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Gln Glu Ala 290 295 300 gca gat ccg ttc gaa tac tgt gac gtg gtc act acc acc acc cac aag 1078Ala Asp Pro Phe Glu Tyr Cys Asp Val Val Thr Thr Thr Thr His Lys 305 310 315 320 agt ctc agg gga cca aga gct ggt atg ate ttc tac cgc aaa ggt cca 1126Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr Arg Lys Gly Pro 325 330 335 aaa cca ccg aag aag ggt cag cca gaa gat gct gtt tat gac ttt gaa 1174Lys Pro Pro Lys Lys Gly Gln Pro Glu Asp Ala Val Tyr Asp Phe Glu 340 345 350 gac aag ate aat ttt gct gtg ttc ccg gct ctg caa ggt ggg ccg cac 1222Asp Lys Ile Asn Phe Ala Val Phe Pro Ala Leu Gln Gly Gly Pro His 355 360 365 aac cac cag att ggt gct cta gcg gtt gcg ttg aaa cag gcc atg tca 1270Asn His Gln Ile Gly Ala Leu Ala Val Ala Leu Lys Gln Ala Met Ser 370 375 380 CCt gga ttc aag gca tat gct aag caa gtt aga gcc aat gct gtt gca 1318Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Arg Ala Asn Ala Val Ala 385 390 395 400 Ctt ggt aac tac ttg atg age aaa gac tac aag Ctt gtg acc ggt gga 1366Leu Gly Asn Tyr Leu Met Ser Lys Asp Tyr Lys Leu Val Thr Gly Gly 405 410 415 act gaa aac cat Ctt gtg ttg tgg gat Ctt cgt CCt Ctt ggc ttg acc 1414Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro Leu Gly Leu Thr 420 425 430 ggg aac aag gtg gag aag Ctt tgc gat Ctt gca aac ate act gtt aac 1462Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Ala Asn Ile Thr Val Asn 435 440 445 aag aat gct gtg ttt ggt gac age agt gct ttg gcc cca gga ggt gtt 1510Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ala Pro Gly Gly Val 450 455 460 cgt att ggt aca CCt gca atg acc tca agg ggt tta gtt gag aag gat 1558Arg Ile Gly Thr Pro Ala Met Thr Ser Arg Gly Leu Val Glu Lys Asp 465 470 475 480 ttt gag caa att ggg gag ttt Ctt cac cgt gca att caa ate act tta 1606Phe Glu Gln Ile Gly Glu Phe Leu His Arg Ala Ile Gln Ile Thr Leu
485 490 495
age ate cag aag gag ttc ggg aaa tta ttg aag gat ttc aac aag ggt 1654
Ser Ile Gln Lys Glu Phe Gly Lys Leu Leu Lys Asp Phe Asn Lys Gly
500 505 510
ttg gtg aac aac aag gag ate gaa caa ctc aag gct gat gtc gag aag 1702
Leu Val Asn Asn Lys Glu Ile Glu Gln Leu Lys Ala Asp Val Glu Lys
515 520 525
ttt tet ggt tcg ttt gac atg cct ggg ttc tcg ttg gcc gac atg aag 1750
Phe Ser Gly Ser Phe Asp Met Pro Gly Phe Ser Leu Ala Asp Met Lys
530 535 540
tat aag gat tgagaagatg aagagateta tgtaatgaat gatgtttgtg 1799
Tyr Lys Asp545
ttgttattag taacattttc tggtgtttgt tttgatgtct agtac 1844
<210> 152
<211> 547
<212> PRT
<213> Helianthus annuus
<400> 152
Met Leu Ser Asn Val Glu Phe Gln Pro Gln Trp Leu Gln Asn Pro Pro15 10 15
Ile Ala Glu Cys Ala Lys Thr Ser Phe Cys Gly Ala His Phe Thr Ile
20 25 30
Lys Pro Leu Ala Phe Ile Ser Leu Thr Lys Pro Ser Gly Lys Asn Ser
35 40 45
Ile His Ser Asn Pro Leu Thr Glu Pro Gly Arg Thr Thr Pro Asn Asn
50 55 60
Leu Ser Ser Leu Tyr Thr Leu Leu Ser Leu Asp Arg Met Asp Pro Val65 70 75 80
Asn Val Trp Gly Asn Thr Pro Leu Asp Ala Ala Asp Pro Glu Ile Phe
85 90 95
Asp Leu Ile Glu Lys Glu Lys Arg Arg Gln Cys Arg Gly Ile Glu Leu
100 105 110
Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Ile Gln Ala Leu Gly
115 120 125
Ser Pro Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro Gly Asn Arg Tyr
130 135 140
Tyr Gly Gly Asn Glu Tyr Ile Asp Gln Ile Glu Asn Leu Cys Arg Ser145 150 155 160
Arg Ala Leu Gln Ala Tyr Arg Leu Asp Pro Thr Lys Trp Gly Val Asn
165 170 175
Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala Ala Tyr Thr Ala
180 185 190
Leu Leu Glu Pro His Asp Arg Ile Met Gly Leu Asp Leu Pro Ser Gly
195 200 205
Gly His Leu Thr His Gly Tyr Tyr Thr Ser Gly Gly Lys Lys Ile Ser
210 215 220
Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys Val Asn Ser Thr225 230 235 240
Thr Gly Tyr Ile Asp Tyr Glu Lys Met Glu Glu Lys Ala Leu Asp Phe
245 250 255
Arg Pro Lys Leu Ile Ile Cys Gly Gly Ser Ala Tyr Pro Arg Asp Trp
260 265 270
Asp Tyr Lys Arg Ile Arg Gly Ile Ala Asp Lys Cys Gly Ala Leu Met
275 280 285
Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala Ala Gln Glu Ala
290 295 300
Ala Asp Pro Phe Glu Tyr Cys Asp Val Val Thr Thr Thr Thr His Lys305 310 315 320
Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr Arg Lys Gly Pro325 330 335 Lys Pro Pro Lys Lys Gly Gln Pro Glu Asp Ala Val Tyr Asp Phe Glu 340 345 350 Asp Lys Ile Asn Phe Ala Val Phe Pro Ala Leu Gln Gly Gly Pro His 355 360 365 Asn His Gln Ile Gly Ala Leu Ala Val Ala Leu Lys Gln Ala Met Ser 370 375 380 Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Arg Ala Asn Ala Val Ala385 390 395 400Leu Gly Asn Tyr Leu Met Ser Lys Asp Tyr Lys Leu Val Thr Gly Gly 405 410 415 Thr Glu Asn His Leu Val Leu Trp Asp Leu Arg Pro Leu Gly Leu Thr 420 425 430 Gly Asn Lys Val Glu Lys Leu Cys Asp Leu Ala Asn Ile Thr Val Asn 435 440 445 Lys Asn Ala Val Phe Gly Asp Ser Ser Ala Leu Ala Pro Gly Gly Val 450 455 460 Arg Ile Gly Thr Pro Ala Met Thr Ser Arg Gly Leu Val Glu Lys Asp465 470 475 480Phe Glu Gln Ile Gly Glu Phe Leu His Arg Ala Ile Gln Ile Thr Leu 485 490 495 Ser Ile Gln Lys Glu Phe Gly Lys Leu Leu Lys Asp Phe Asn Lys Gly 500 505 510 Leu Val Asn Asn Lys Glu Ile Glu Gln Leu Lys Ala Asp Val Glu Lys 515 520 525 Phe Ser Gly Ser Phe Asp Met Pro Gly Phe Ser Leu Ala Asp Met Lys 530 535 540 Tyr Lys Asp 545 <210> 153 <211> 1801 <212> DNA
<213> Triticum aestivum
<400> 153
cccactggtg cctccccctc tccactcccc ccctccgccg acgccccacc actcccccct 60
tcctcctcct cctccgccgc cgccgccgca atggactccg tcgcgtcgtg ggggctgacc 120
ccgctggcgg acgcggaccc ggacgtcttc gacctcatcg agcgggagaa gcggcgccag 180
cggagcggga tcgagctcat cgcctccgag aacttcacct ccttcgccgt catcgaggcg 240
ctcggctcgg ccctcaccaa caagtactcc gagggcatgc cgggggcgcg ctactacggc 300
ggcaacgacg tcatcgacga gatcgagaac ctctgccgcg accgcgccct cgccgccttc 360
cgcctcgacg ccgcctcctg gggcgtcaac gtgcagccct actccggctc gcccgcaaac 420
ttcgccgcat acaccgcgct cctcaacccg cacgaccgga tcatggggct cgacctcccc 480
tcaggcggac acctcaccca cggctactac accgccgggg ggaaaaagat ctccgccacc 540
tccatctact tcgagagcct gccctacaag gtcagcgcgc caacggctac atcgactacg 600
acaagctcga ggagaaggca atggacttcc gccccaagct catcatctgc ggaggcagcg 660
cctaccccag ggattgggac tacgccaggc tcagggccgt cgccgacaag gtcggggcca 720
tgctcctctg cgacatgçjcçj cacatcagcg gactgçftcgc cgcgcaggaa gctgcaaatc 780cttttgagtt ctgtgatgtg gttaccacta caacacacaa gtctctccgg ggaccgaggg 840ctggtatgat cttctacagg aaaggcccta agcctgcgaa gaagggccag cctgagggtg 900ctgtgtatga ctatgaggac aagatcaact ttgcggtgtt cccatcgctc cagggcggtc 960cgcacaacca ccagattgct gcccttgcag ttgccctgaa gcaaactttg actcctggat 1020tcaaggccta cgcaaagcag gtcaaggcca acgctgttgc cgttggaaaa tatctcatga 1080gcaagggtta caagatggtg accgatggaa ctgacaacca tcttgttcta tgggatctcc 1140gccctcttgg cttgactgga aacaaggtcg aaaagatgtg tgacctttgc agcattacat 1200tgaacaagaa tgctgtcttc ggtgacagca gtgcattgtc cccgggtggt gtccgcattg 1260gtgctcccgc gatgacttcc aggggtctgg tcgagaagga cttcgagcag atcgccgagt 1320tcctccacca ggctgtgacc atctgcctga acatccagaa ggagcacggc aagctgctca 1380aggacttctc caagggcctg gtgaacaaca aggacatcga gaacctcaag gttgaggtcg 1440agaagtttgc cctctccttc gacatgcctg ggttctcgct cgagagcatg aagtacaagg 1500agtaggatga tgatacatat gtcgtggttg tctccgctaa tcgtccatac gccatgcgct 1560tctaagcctt cttggccgcc gcgcaatgcc acagtgctgt gcttctatga gatttgtctg 1620ctcgccctgg agccctggat agttctgtaa acgcgtccca cctttatgct ctgtttgccg 1680tccacattcc atcatatttc tttctaggaa ttgttcgcct gggatcatgg aatgtcgagt 1740atttgccaat aatcttccat attatttttg tgtatgctct gcatatggga aaaatatagt 1800g 1801
<210> 154
<211> 517
<212> PRT
<213> Triticum aestivum<220>
<221> misc_feature
<222> (163)..(467)
<223> Xaa localizado nas posições 163 e 467; cada xaa pode ser qualqueraminoácido de ocorrência natural
<400> 154
Met Asp Ser Val Ala Ser Trp Gly Leu Thr Pro Leu Ala Asp Ala Asp1 5 10 15
Pro Asp Val Phe Asp Leu Ile Glu Arg Glu Lys Arg Arg Gln Arg Ser
20 25 30
Gly Ile Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Ile
35 40 45
Glu Ala Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro
50 55 60
Gly Ala Arg Tyr Tyr Gly Gly Asn Asp Val Ile Asp Glu Ile Glu Asn65 70 75 80
Leu Cys Arg Asp Arg Ala Leu Ala Ala Phe Arg Leu Asp Ala Ala Ser
85 90 95
Trp Gly Val Asn Val Gln Pro Tyr Ser Gly Ser Pro Ala Asn Phe Ala
100 105 110
Ala Tyr Thr Ala Leu Leu Asn Pro His Asp Arg Ile Met Gly Leu Asp115 120 125 Leu Pro 130 Ser Gly Gly His Leu 135 Thr His Gly Tyr Tyr 140 Thr Ala Gly GlyLys Lys Ile Ser Ala Thr Ser Ile Tyr Phe Glu Ser Leu Pro Tyr Lys145 150 155 160Val Ser Xaa Ala Asn 165 Gly Tyr Ile Asp Tyr 170 Asp Lys Leu Glu Glu 175 LysAla Met Asp Phe 180 Arg Pro Lys Leu Ile 185 Ile Cys Gly Gly Ser 190 Ala TyrPro Arg Asp Trp Asp Tyr Ala Arg Leu Arg Ala Val Ala Asp Lys Val 195 200 205 Gly Ala Met Leu Leu Cys Asp Met Ala His Ile Ser Gly Leu Val Ala 210 215 220 Ala Gln Glu Ala Ala Asn Pro Phe Glu Phe Cys Asp Val Val Thr Thr225 230 235 240Thr Thr His Lys Ser Leu Arg Gly Pro Arg Ala Gly Met Ile Phe Tyr 245 250 255 Arg Lys Gly Pro Lys Pro Ala Lys Lys Gly Gln Pro Glu Gly Ala Val 260 265 270 Tyr Asp Tyr 275 Glu Asp Lys Ile Asn 280 Phe Ala Val Phe Pro 285 Ser Leu GlnGly Gly 290 Pro His Asn His Gln 295 Ile Ala Ala Leu Ala 300 Val Ala Leu LysGln Thr Leu Thr Pro Gly Phe Lys Ala Tyr Ala Lys Gln Val Lys Ala305 310 315 320Asn Ala Val Ala Val 325 Gly Lys Tyr Leu Met 330 Ser Lys Gly Tyr Lys 335 MetVal Thr Asp Gly Thr Asp Asn His Leu Val Leu Trp Asp Leu Arg Pro 340 345 350 Leu Gly Leu 355 Thr Gly Asn Lys Val 360 Glu Lys Met Cys Asp 365 Leu Cys SerIle Thr 370 Leu Asn Lys Asn Ala 375 Val Phe Gly Asp Ser 380 Ser Ala Leu SerPro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr Ser Arg Gly Leu385 390 395 400Val Glu Lys Asp Phe 405 Glu Gln Ile Ala Glu 410 Phe Leu His Gln Ala 415 ValThr Ile Cys Leu 420 Asn Ile Gln Lys Glu 425 His Gly Lys Leu Leu 430 Lys AspPhe Ser Lys 435 Gly Leu Val Asn Asn 440 Lys Asp Ile Glu Asn 445 Leu Lys ValGlu Val 450 Glu Lys Phe Ala Leu 455 Ser Phe Asp Met Pro 460 Gly Phe Ser LeuGlu Ser Xaa Glu Val Gln Gly Glu Asp Asp Asp Thr Tyr Val Val Val465 470 475 480Val Ser Ala Asn Arg 485 Pro Tyr Ala Met Arg 490 Phe Lys Pro Ser Trp 495 ProPro Arg Asn Ala Thr Val Leu Cys Phe Tyr Glu Ile Cys Leu Leu Ala
500 505 510
Leu Glu Pro Trp Ile515
<210> 155
<211> 293
<212> PRT
<213> Oryza sativa
<220>
<221> misc_feature<222> (29)..(293)
<223> Xaa localizado nas posições 29, 274-275, 278-279, 285-286, 289-e 292-293; cada Xaa pode ser qualquer aminoácido de ocorrência natural<400> 155
His Ala Leu Cys Val Asn Val His Ala Ala Arg Ser Thr Glu Ala Glu1 5 10 15
Ala Glu Ala Gly Gln Glu Val Glu Glu Glu Glu Glu Xaa Glu Ala Ser
20 25 30
Ser Cys Ser Ser Ser Ser Ser Ser Leu His Pro Ala Lys Arg Gln Ala
35 40 45
Thr Ala Glu Arg Gly Ala Asp Leu Glu Ala Arg Arg Gly Ala Val Arg
50 55 60
Ala Trp Gly Asn Gln Ala Leu Ala Glu Ala Asp Pro Asp Val His Ala65 70 75 80
Leu Met Glu Leu Glu Arg Asp Arg Gln Val Arg Gly Ile Glu Leu Ile
85 90 95
Ala Ser Glu Asn Phe Val Cys Arg Ala Val Leu Glu Ala Leu Gly Ser
100 105 110
His Leu Thr Asn Lys Tyr Ser Glu Gly His Pro Gly Ala Arg Tyr Tyr
115 120 125
Gly Gly Asn Gln His Ile Asp Gly Ile Glu Arg Leu Cys His Glu Arg
130 135 140
Ala Leu Ala Ala Phe Gly Leu Asp Pro Ala Cys Trp Gly Val Asn Val145 150 155 160
Gln Pro Tyr Ser Cys Thr Ser Ala Asn Leu Ala Val Tyr Thr Gly Leu
165 170 175
Leu Leu Pro Lys Asp Arg Ile Met Gly Leu Glu Pro Pro Ser Gly Gly
180 185 190
His Val Ser His Gly Tyr Tyr Thr Pro Ser Gly Lys Lys Val Ser Gly
195 200 205
Ala Ser Ile Phe Phe Glu Ser Leu Ser Tyr Lys Val Asn Pro Gln Thr
210 215 220
Gly Tyr Ile Asp Tyr Asp Lys Leu Glu Glu Arg Ala Met Asp Phe His225 230 235 240
Pro Lys Ile Leu Ile Cys Gly Gly Ser Ser Tyr Pro Arg Glu Trp Asp
245 250 255
Phe Ala Arg Met Arg Leu Ile Ala Asp Lys Cys Gly Ala Val Leu Met
260 265 270
Cys Xaa Xaa Ala His Xaa Xaa Gly Leu Val Ala Ala Xaa Xaa Cys Arg
275 280 285
Xaa Xaa Phe Xaa Xaa290
<210> 156
<211> 382
<212> PRT
<213> Desconhecido
<220>
<223> Seqüência de aminoácido consensus<400> 156
Met Asp Pro Val Ser Ser Trp Gly Asn Thr Pro Leu Val Asp Pro Glu15 10 15
Ile His Asp Leu Ile Glu Lys Glu Lys Arg Arg Gln Cys Arg Gly Ile
20 25 30
Glu Leu Ile Ala Ser Glu Asn Phe Thr Ser Phe Ala Val Ile Glu Ala
35 40 45
Leu Gly Ser Ala Leu Thr Asn Lys Tyr Ser Glu Gly Met Pro Gly Asn
50 55 60
Arg Tyr Tyr Gly Gly Asn Glu Tyr Ile Asp Ile Glu Asn Leu Cys Arg65 70 75 80
Ala Leu Ala Phe Leu Asp Pro Lys Trp Gly Val Asn Val Gln Pro Tyr
85 90 95
Ser Gly Ser Pro Ala Asn Phe Ala Ala Tyr Thr Ala Leu Leu Pro His100 105 110
Asp Arg Ile Met Gly Leu Asp Leu Pro Ser Gly Gly His Leu Thr His
115 120 125
Gly Tyr Tyr Thr Ser Gly Gly Lys Lys Ile Ser Ala Thr Ser Ile Tyr
130 135 140
Phe Glu Ser Leu Pro Tyr Lys Val Asn Thr Thr Gly Tyr Ile Asp Tyr145 150 155 160
Asp Lys Leu Glu Glu Lys Ala Leu Asp Phe Arg Pro Lys Leu Ile Ile
165 170 175
Cys Gly Gly Ser Ala Tyr Pro Arg Asp Trp Asp Tyr Ala Arg Phe Arg
180 185 190
Ala Ile Ala Asp Lys Cys Gly Ala Leu Leu Leu Cys Asp Met Ala His
195 200 205
Ile Ser Gly Leu Val Ala Ala Gln Glu Ala Ala Asn Pro Phe Glu Tyr
210 215 220
Cys Asp Val Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg225 230 235 240
Ala Gly Met Ile Phe Tyr Arg Lys Gly Pro Lys Pro Lys Lys Gly Gln
245 250 255
Pro Glu Ala Val Tyr Asp Phe Glu Asp Lys Ile Asn Phe Ala Val Phe
260 265 270
Ala Leu Gln Gly Gly Pro His Asn His Gln Ile Gly Ala Leu Ala Val
275 280 285
Ala Leu Lys Gln Ala Thr Pro Gly Phe Lys Ala Tyr Ala Gln Val Lys
290 295 300
Ala Asn Ala Ala Leu Gly Lys Gly Asn Arg Gly Leu Glu Lys Leu Cys305 310 315 320
Asp Ile Thr Leu Asn Lys Ala Val Phe Gly Asp Leu Pro Gly Gly Val
325 330 335
Arg Ile Gly Pro Ala Met Thr Ser Arg Gly Val Glu Asp Phe Glu Ile
340 345 350
Gly Glu Phe Leu Ala Ile Ile Gln Lys Gly Lys Leu Lys Lys Gly Leu
355 360 365
Lys Ile Leu Lys Val Glu Phe Ser Phe Met Pro Gly Phe Leu370 375 380
<210> 157
<211> 8
<212> PRT
<213> Desconhecido
<220>
<223> Motivo conservado para o homólogo SHSRP isolado<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa is Leu or Met
<400> 157
Xaa Thr Asn Lys Tyr Ser Glu Gly1 5
<210> 158
<211> 10
<212> PRT
<213> Desconhecido
<220>
<223> Motivo conservado para o homólogo SHSRP isolado<220>
<221> MI SC_FE ATURE
<222> (5)..(5)
<223> Xaa is Gly or Ala
<220>
<221> MI SC_FE ATURE
<222> (7)..(7)
<223> Xaa is Asp or Glu
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa is Thr, Pro or Leu
<400> 158
Asp Arg Ile Met Xaa Leu Xaa Xaa Pro Ser1 5 10
<210> 159
<211> 20
<212> DNA
<213> Desconhecido
<220>
<223> Iniciador direto AtSHMT4
<400> 159
atggaaccag tctcttcatg
<210> 160
<211> 20
<212> DNA
<213> Desconhecido
<220>
<223> Iniciador reverso AtSHMT4
<400> 160
ctaatccttg tacttcatct
<210> 161
<211> 20
<212> DNA
<213> Desconhecido
<220>
<223> Iniciador direto de terminador NOS
<400> 161
tccccgatcg ttcaaacatt
<210> 162
<211> 25
<212> DNA
<213> Desconhecido
<220>
<223> Iniciador reverso de terminador NOS
<400> 162
ccatctcata aataacgtca tgcat

Claims (23)

1. Acido nucleico, caracterizada pelo fato de ser compreendidoem uma célula de planta de cultivo transgênica, em que o ácido nucleicocompreende um polinucleotídeo selecionado do grupo que consiste de:a) um polinucleotídeo que tem uma seqüência comoapresentada em SEQ ID N0 1;b) um polinucleotídeo que codifica um polipeptídeo que temuma seqüência como apresentada em SEQ ID N0 2;c) um polinucleotídeo que tem pelo menos 70 % de identidadede seqüência a um polinucleotídeo de acordo com a);d) um polinucleotídeo que codifica um polipeptídeo que tempelo menos 70 % de identidade de seqüência ao polipeptídeo que tem umaseqüência como apresentada em SEQ ID N0 2e) um polinucleotídeo que hibridiza-se sob condiçõesestringentes ao complemento de qualquer um dos polinucleotídeos de a) até d)acima.
2. Método de produção de uma planta de cultivo transgênicaque contém um ácido nucleico isolado que codifica um polipeptídeo,caracterizado pelo fato de que o método compreende as etapas de, transformaruma célula vegetal com um vetor de expressão que compreende o ácidonucleico e gerar de uma célula vegetal a planta transgênica que expressa opolipeptídeo, em que o ácido nucleico compreende um polinucleotídeoselecionado do grupo que consiste de:a) um polinucleotídeo que tem uma seqüência comoapresentada em SEQ ID N0 1;b) um polinucleotídeo que codifica um polipeptídeo que temuma seqüência como apresentada em qualquer uma das SEQ ID N0 2;c) um polinucleotídeo que tem pelo menos 70 % de identidadede seqüência a um polinucleotídeo de acordo com a);d) um polinucleotídeo que codifica um polipeptídeo que tempelo menos 70 % de identidade de seqüência a um polipeptídeo que tem umaseqüência como apresentada em SEQID N0 2; ee) um polinucleotídeo que hibridiza-se sob condiçõesestringentes ao complemento de qualquer um dos polinucleotídeos de a) até d)acima.
3. Método de acordo com a reivindicação 2, caracterizado pelofato de que a expressão do polinucleotídeo na planta resulta emdesenvolvimento de raiz aumentado sob condições normais ou de tensão emcomparação com uma variedade do tipo selvagem da planta.
4. Método de acordo com qualquer uma das reivindicações 2ou 3, caracterizado pelo fato de que o ácido nucleico é operacionalmenteligado a uma ou mais seqüências reguladoras.
5. Método de acordo com a reivindicação 4, caracterizado pelofato de que a seqüência reguladora é um promotor.
6. Método de acordo com a reivindicação 5, caracterizado pelofato de que o promotor é específico de tecido e/ou em que o promotor éevolucionalmente regulado.
7. Acido nucleico, caracterizado pelo fato de que o ácidonucleico compreende um polinucleotídeo selecionado do grupo que consistede:a) um polinucleotídeo que tem uma seqüência comoapresentada em SEQ ID N0 1;b) um polinucleotídeo que codifica um polipeptídeo que temuma seqüência como apresentada em SEQ ID N0 2.
8. Cassete de expressão, caracterizado pelo fato de quecompreende um ácido nucleico, em que o ácido nucleico compreende umpolinucleotídeo selecionado do grupo consistindo de:a) um polinucleotídeo que tem uma seqüência comoapresentada em SEQ ID N0 1;b) um polinucleotídeo que codifica um polipeptídeo que temuma seqüência como apresentada em SEQ ID N0 2.c) um polinucleotídeo que tem pelo menos 90 % de identidadede seqüência a um polinucleotídeo que tem uma seqüência como apresentadaem SEQIDN0I;d) um polinucleotídeo que codifica um polipeptídeo que tempelo menos 92 % de identidade de seqüência a um polipeptídeo que tem umaseqüência como apresentada em SEQ ID N0 2;e) um polinucleotídeo que hibridiza-se sob condiçõesestringentes ao complemento de qualquer um dos polinucleotídeos de a) até d)acima ef) um polinucleotídeo complementar a qualquer um dospolinucleotídeos de a) até d) acima.
9. Vetor de expressão recombinante, caracterizado pelo fato deque compreende um ácido nucleico, em que o ácido nucleico compreende umpolinucleotídeo selecionado do grupo que consiste de:a) um polinucleotídeo que tem uma seqüência comoapresentada em SEQ ID N0 1;b) um polinucleotídeo que codifica um polipeptídeo que temuma seqüência como apresentada em SEQ ED N0 2;c) um polinucleotídeo que tem pelo menos 90 % de identidadede seqüência a um polinucleotídeo que tem uma seqüência como apresentadaem SEQIDN0 1;d) um polinucleotídeo que codifica um polipeptídeo que tempelo menos 92 % de identidade de seqüência a um polipeptídeo que tem umaseqüência como apresentada em SEQ ID N0 2;e) um polinucleotídeo que hibridiza-se sob condiçõesestringentes ao complemento de qualquer um dos polinucleotídeos de a) até d)acima; ef) um polinucleotídeo complementar a qualquer um dospolinucleotídeos de a) até d) acima.
10. Vetor de expressão recombinante de acordo com areivindicação 9 ou cassete de expressão de acordo com a reivindicação 8,caracterizado pelo fato de que o vetor ou cassete ainda compreende uma oumais seqüências reguladoras.
11. Vetor de expressão recombinante de acordo com areivindicação 9 ou cassete de expressão de acordo com a reivindicação 8,caracterizado pelo fato de que a seqüência reguladora é um promotor.
12. Vetor de expressão recombinante ou cassete de expressãode acordo com a reivindicação 10, caracterizado pelo fato de que o promotor éespecífico de tecido e/ou em que o promotor é evolucionalmente regulado.
13. Célula hospedeira, caracterizada pelo fato de quecompreende o vetor de expressão recombinante ou o cassete de expressãocomo definido em qualquer uma das reivindicações 8 a 12, em que a célulahospedeira é selecionada do grupo consistindo de células bacterianas, célulasfungicas, algas, ciliados, fungos ou outros microorganismos.
14. Célula hospedeira de acordo com a reivindicação 13,caracterizada pelo fato de ser uma célula de Agrobacterium.
15. Método para aumentar desenvolvimento de raiz de umaplanta, caracterizado pelo fato de que compreende transformar uma célulavegetal com o ácido nucleico como definido na reivindicação 6, o cassete deexpressão como definido em qualquer uma das reivindicações 8, 10 a 12 ou ovetor de expressão como definido em qualquer uma das reivindicações 9 a 12,gerar a partir da célula vegetal, a planta transgênica que expressa o ácidonucleico como definido em qualquer uma das reivindicações 5 a 8 edesenvolver a planta.
16. Método para aumentar o desenvolvimento de raiz de umaplanta, caracterizado pelo fato de que compreende transformar uma célula deplanta com um ácido nucleico, em que o ácido nucleico compreende umpolinucleotídeo selecionado do grupo consistindo de:a) um polinucleotídeo que tem uma seqüência comoapresentada em SEQ ID N0 1;b) um polinucleotídeo que codifica um polipeptídeo que temuma seqüência como apresentada em SEQ ID N0 2;c) um polinucleotídeo que tem pelo menos 70 % de identidadede seqüência a um polinucleotídeo de acordo com a);d) um polinucleotídeo que codifica um polipeptídeo que tempelo menos 70 % de identidade de seqüência a um polipeptídeo que tem umaseqüência como apresentada em SEQ ID N0 2; ee) um polinucleotídeo que hibridiza-se sob condições estringentesao complemento de qualquer um dos polinucleotídeos de a) até d) acima;gerar a partir da célula vegetal, a planta transgênica queexpressa o ácido nucleico, e desenvolver a planta.
17. Método de acordo com qualquer uma das reivindicações 2a 6, 15 ou 16, caracterizado pelo fato de que a planta de cultivo é umamonocotiledônea ou uma dicotiledônea.
18. Método de acordo com a reivindicação 2 a 6, 15 ou 16,caracterizado pelo fato de que a planta de cultivo é selecionada do grupo queconsiste de milho, trigo, centeio, aveia, triticale, arroz, cevada, sorgo, painço,cana de açúcar, soja, amendoim, algodão, semente de colza, canola,mandioca, pimenta, girassol, tagetes, plantas solanáceas, batata, tabaco,berinjela, tomate, espécies Vicia, ervilha, alfafa, café, cacau, chá, espéciesSalix, dendezeiro, coco, grama perene e uma planta de cultivo de forragem.
19. Produto agrícola, caracterizado pelo fato de quecompreende:a) um ácido nucleico, em que o ácido nucleico compreende umpolinucleotídeo selecionado do grupo consistindo de:i. um polinucleotídeo que tem uma seqüência comoapresentada em SEQ ID N0 1;ii. um polinucleotídeo que codifica um polipeptídeo que temuma seqüência como apresentada em SEQ ID N0 2;iii. um polinucleotídeo que tem pelo menos 70 % de identidadede seqüência a um polinucleotídeo de acordo com a);iv. um polinucleotídeo que codifica um polipeptídeo que tempelo menos 70 % de identidade de seqüência a um polipeptídeo que tem umaseqüência como apresentada em SEQ ED N0 2; ev. um polinucleotídeo que hibridiza-se sob condições estringentesao complemento de qualquer um dos polinucleotídeos de a) até d) acima; oub) o cassete de expressão como definido em qualquer uma dasreivindicações 8, 10 a 12; ouc) o vetor de expressão como definido em qualquer uma dasreivindicações 9 a 12.
20. Uso de um polinucleotídeo selecionado do grupoconsistindo de:a) um polinucleotídeo que tem uma seqüência comoapresentada em SEQ ID N0 1;b) um polinucleotídeo que codifica um polipeptídeo que temuma seqüência como apresentada em SEQ ID N0 2;c) um polinucleotídeo que tem pelo menos 70 % de identidadede seqüência a um polinucleotídeo de acordo com a);d) um polinucleotídeo que codifica um polipeptídeo que tempelo menos 70 % de identidade de seqüência a um polipeptídeo que tem umaseqüência como apresentada em SEQ ID N0 2;e) um polinucleotídeo que hibridiza-se sob condições estringentesao complemento de qualquer um dos polinucleotídeos de a) até d) acima;caracterizado pelo fato de ser para aumentar desenvolvimentode raiz sob condições normais ou de tensão em comparação com umavariedade do tipo selvagem da planta.
21. Uso de um polinucleotídeo selecionado do grupoconsistindo de:a) um polinucleotídeo que tem uma seqüência comoapresentada em SEQ ID N0 1;b) um polinucleotídeo que codifica um polipeptídeo que temuma seqüência como apresentada em SEQ ID N0 2;c) um polinucleotídeo que tem pelo menos 90 % de identidadede seqüência a um polinucleotídeo tendo uma seqüência como apresentada emSEQIDN0I;d) um polinucleotídeo que codifica um polipeptídeo que tempelo menos 92 % de identidade de seqüência a um polipeptídeo que tem umaseqüência como apresentada em SEQ ID N0 2;e) um polinucleotídeo que hibridiza-se sob condições estringentesao complemento de qualquer um dos polinucleotídeos de a) até d) acima; ef) um polinucleotídeo complementar a qualquer um dospolinucleotídeos de a) até d) acimacaracterizado pelo fato de ser como marcadores para regiõesespecíficas do genoma.
22. Uso de um polinucleotídeo selecionado do grupoconsistindo de:a) um polinucleotídeo que tem uma seqüência comoapresentada em SEQ ID N0 1;b) um polinucleotídeo que codifica um polipeptídeo que temuma seqüência como apresentada em SEQ ID N0 2;c) um polinucleotídeo que tem pelo menos 90 % de identidadede seqüência a um polinucleotídeo tendo uma seqüência como apresentada emSEQ ID N 1;d) um polinucleotídeo que codifica um polipeptídeo que tempelo menos 92 % de identidade de seqüência a um polipeptídeo que tem umaseqüência como apresentada em SEQ ID N0 2;e) um polinucleotídeo que hibridiza-se sob condições estringentesao complemento de qualquer um dos polinucleotídeos de a) até d) acima; ef) um polinucleotídeo complementar a qualquer um dospolinucleotídeos de a) até d) acimacaracterizado pelo fato de ser em um processo para gerarmutações de nocaute no genoma de bactéria, células de mamífero, células delevedura ou células vegetais.
23. Uso do vetor de expressão recombinante ou do cassete deexpressão como definido em qualquer uma das reivindicações 8 a 11, ou doácido nucleico como definido na reivindicação 6, caracterizado pelo fato deser para aumentar desenvolvimento de células de inseto, células fungicas,células de mamífero, fungos, algas, ciliados, células vegetais, Saccharomyceseerevisiae, C. glutamieum ou ciliados.
BRPI0613395-9A 2005-07-18 2006-07-13 ácido nucleico, método de produção de uma planta de cultivo transgênica, cassete de expressão, vetor de expressão recombinante, célula hospedeira, método para aumentar desenvolvimento de raiz de uma planta, produto agrìcola, e, usos de um polinucleotìdeo, do vetor de expressão recombinante ou do cassete de expressão ou do ácido nucleico BRPI0613395A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US70026705P 2005-07-18 2005-07-18
US60/700,267 2005-07-18
PCT/US2006/027384 WO2007011736A2 (en) 2005-07-18 2006-07-13 Yield increase in plants overexpressing the shsrp genes

Publications (1)

Publication Number Publication Date
BRPI0613395A2 true BRPI0613395A2 (pt) 2011-01-11

Family

ID=37261502

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0613395-9A BRPI0613395A2 (pt) 2005-07-18 2006-07-13 ácido nucleico, método de produção de uma planta de cultivo transgênica, cassete de expressão, vetor de expressão recombinante, célula hospedeira, método para aumentar desenvolvimento de raiz de uma planta, produto agrìcola, e, usos de um polinucleotìdeo, do vetor de expressão recombinante ou do cassete de expressão ou do ácido nucleico

Country Status (10)

Country Link
US (2) US20100162434A1 (pt)
EP (3) EP2333087A1 (pt)
CN (1) CN101228278A (pt)
AR (1) AR054170A1 (pt)
AU (1) AU2006270158C1 (pt)
BR (1) BRPI0613395A2 (pt)
CA (1) CA2615943A1 (pt)
MX (1) MX2008000118A (pt)
WO (1) WO2007011736A2 (pt)
ZA (1) ZA200801546B (pt)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2011004270A (es) * 2008-10-23 2011-07-13 Basf Plant Science Gmbh Plantas con rendimiento aumentado (nue).
WO2013181411A1 (en) * 2012-05-30 2013-12-05 Board Of Trustees Of Southern Illinois University Soybean resistant to cyst nematodes
CN103173424A (zh) * 2013-04-16 2013-06-26 中国农业科学院生物技术研究所 一种可提高植物光合效率的蛋白rprp-1及其编码基因与应用
CN116121298B (zh) * 2023-04-18 2023-06-16 河南大学三亚研究院 抑制hsrp1基因的表达在提高植物耐热性中的应用

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4024222A (en) 1973-10-30 1977-05-17 The Johns Hopkins University Nucleic acid complexes
US4283393A (en) 1979-03-13 1981-08-11 Merck & Co., Inc. Topical application of interferon inducers
US5504200A (en) 1983-04-15 1996-04-02 Mycogen Plant Science, Inc. Plant gene expression
US5428147A (en) 1983-04-15 1995-06-27 Mycogen Plant Science, Inc. Octopine T-DNA promoters
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US5420034A (en) 1986-07-31 1995-05-30 Calgene, Inc. Seed-specific transcriptional regulation
JPS62291904A (ja) 1986-06-12 1987-12-18 Namiki Precision Jewel Co Ltd 永久磁石の製造方法
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5116742A (en) 1986-12-03 1992-05-26 University Patents, Inc. RNA ribozyme restriction endoribonucleases and methods
ATE105585T1 (de) 1987-12-21 1994-05-15 Univ Toledo Transformation von keimenden pflanzensamen mit hilfe von agrobacterium.
US5614395A (en) 1988-03-08 1997-03-25 Ciba-Geigy Corporation Chemically regulatable and anti-pathogenic DNA sequences and uses thereof
US5990387A (en) 1988-06-10 1999-11-23 Pioneer Hi-Bred International, Inc. Stable transformation of plant cells
NZ230375A (en) 1988-09-09 1991-07-26 Lubrizol Genetics Inc Synthetic gene encoding b. thuringiensis insecticidal protein
DE3843628A1 (de) 1988-12-21 1990-07-05 Inst Genbiologische Forschung Wundinduzierbare und kartoffelknollenspezifische transkriptionale regulation
JP3364616B2 (ja) 1989-02-24 2003-01-08 モンサント テクノロジー エルエルシー 合成植物遺伝子と調製方法
US5034323A (en) 1989-03-30 1991-07-23 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5231020A (en) 1989-03-30 1993-07-27 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5086169A (en) 1989-04-20 1992-02-04 The Research Foundation Of State University Of New York Isolated pollen-specific promoter of corn
US5225347A (en) 1989-09-25 1993-07-06 Innovir Laboratories, Inc. Therapeutic ribozyme compositions and expression vectors
US5322783A (en) 1989-10-17 1994-06-21 Pioneer Hi-Bred International, Inc. Soybean transformation by microparticle bombardment
WO1991013980A1 (en) 1990-03-16 1991-09-19 Calgene, Inc. Novel sequences preferentially expressed in early seed development and methods related thereto
WO1991016432A1 (en) 1990-04-18 1991-10-31 Plant Genetic Systems N.V. Modified bacillus thuringiensis insecticidal-crystal protein genes and their expression in plant cells
US5217903A (en) 1990-05-15 1993-06-08 Trustees Of Boston University Measuring connective tissue breakdown products in body fluids
US5187267A (en) 1990-06-19 1993-02-16 Calgene, Inc. Plant proteins, promoters, coding sequences and use
WO1993007256A1 (en) 1991-10-07 1993-04-15 Ciba-Geigy Ag Particle gun for introducing dna into intact cells
TW261517B (pt) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
FR2685346B1 (fr) 1991-12-18 1994-02-11 Cis Bio International Procede de preparation d'arn double-brin, et ses applications.
DE69331055T2 (de) 1992-04-13 2002-06-20 Syngenta Ltd Dna-konstruktionen und diese enthaltende pflanzen
US5496698A (en) 1992-08-26 1996-03-05 Ribozyme Pharmaceuticals, Inc. Method of isolating ribozyme targets
DK0651814T3 (da) 1992-07-09 1997-06-30 Pioneer Hi Bred Int Majspollenspecifikt polygalacturonasegen
US5470353A (en) 1993-10-20 1995-11-28 Hollister Incorporated Post-operative thermal blanket
AU687961B2 (en) 1993-11-19 1998-03-05 Biotechnology Research And Development Corporation Chimeric regulatory regions and gene cassettes for expression of genes in plants
GB9324707D0 (en) 1993-12-02 1994-01-19 Olsen Odd Arne Promoter
GB9403512D0 (en) 1994-02-24 1994-04-13 Olsen Odd Arne Promoter
US5470359A (en) 1994-04-21 1995-11-28 Pioneer Hi-Bred Internation, Inc. Regulatory element conferring tapetum specificity
GB9421286D0 (en) 1994-10-21 1994-12-07 Danisco Promoter
GB9524395D0 (en) 1995-11-29 1996-01-31 Nickerson Biocem Ltd Promoters
DE19626564A1 (de) 1996-07-03 1998-01-08 Hoechst Ag Genetische Transformation von Ciliatenzellen durch Microcarrier-Bombardement mit DNA beladenen Goldpartikeln
US5977436A (en) 1997-04-09 1999-11-02 Rhone Poulenc Agrochimie Oleosin 5' regulatory region for the modification of plant seed lipid composition
ES2276475T5 (es) 1997-09-30 2014-07-11 The Regents Of The University Of California Producción de proteínas en semillas de plantas
US6004804A (en) 1998-05-12 1999-12-21 Kimeragen, Inc. Non-chimeric mutational vectors
EP1033405A3 (en) * 1999-02-25 2001-08-01 Ceres Incorporated Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
US7319013B2 (en) * 2002-03-20 2008-01-15 Basf Aktiengesellschaft Serine hydroxymethyltransferase as a target for herbicides
WO2004000015A2 (en) * 2002-06-19 2003-12-31 Basf Plant Science Gmbh Compositions and methods for improving plant performance
US20060064784A1 (en) * 2002-08-07 2006-03-23 Basf Plant Science Gmbh Nucleic acid sequences encoding proteins associated with abiotic stress response
EP2316953A3 (en) * 2003-10-20 2011-10-05 CropDesign N.V. Identification of novel E2F target genes and use thereof

Also Published As

Publication number Publication date
EP1907555A2 (en) 2008-04-09
US8993838B2 (en) 2015-03-31
AU2006270158B2 (en) 2011-04-14
CN101228278A (zh) 2008-07-23
ZA200801546B (en) 2009-09-30
US20100162434A1 (en) 2010-06-24
AU2006270158C1 (en) 2012-03-29
EP3222729A3 (en) 2017-11-08
AU2006270158A1 (en) 2007-01-25
WO2007011736A3 (en) 2007-05-24
WO2007011736A2 (en) 2007-01-25
EP2333087A1 (en) 2011-06-15
EP3222729A2 (en) 2017-09-27
AR054170A1 (es) 2007-06-06
US20140230094A1 (en) 2014-08-14
MX2008000118A (es) 2008-03-24
CA2615943A1 (en) 2007-01-25

Similar Documents

Publication Publication Date Title
CA2614333C (en) Increased root growth in plants overexpressing the accdp genes
AU762390B2 (en) Genes involved in tolerance to environmental stress
AU2008252998A1 (en) Plant cells and plants with increased tolerance and/or resistance to environmental stress and increased biomass production-KO
AU2009284172A2 (en) Plants with increased yield by increasing or generating one or more activities in a plant or a part thereof
MX2008013027A (es) Polipeptidos relacionados con estres y metodos de uso en plantas.
US20080052794A1 (en) Casein Kinase Stress-Related Polypeptides And Methods Of Use In Plants
AU2005302590B2 (en) Vesicle Trafficking Stress-Related Polypeptides and methods of use in plants
US20110154531A1 (en) Yield Increase in Plants Overexpressing the MTP Genes
US8993838B2 (en) Yield increase in plants overexpressing the SHSRP genes
US7880055B2 (en) Lecitin-like protein kinase stress-related polypeptides and methods of use in plants
US20090055970A1 (en) Yield increase in plants overexpressing the hsrp genes
US7763777B2 (en) Protein phosphatase stress-related polypeptides and methods of use in plants
BRPI0709258A2 (pt) métodos para melhorar caracterìsticas relacionadas a rendimento em plantas, para a produção de uma planta transgênica, para aumentar rendimento de planta em relação a plantas de controle adequadas e para aumentar resistência a estresse abiótico em plantas em relação a plantas de controle, planta ou parte da mesma, construção, uso de uma construção, planta, parte de planta ou célula de planta, planta transgênica, partes colhìveis de uma planta, produtos, usos de um ácido nucleico, polipeptìdeo isolado, e, molécula isolada de ácido nucleico
MX2007003358A (en) Nucleic acid sequences encoding proteins associated with abiotic stress response and plant cells and plants with increased tolerance to environmental stress

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 10A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2385 DE 20-09-2016 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.