BRPI0719299A2 - Célula de levedura transformada que expressa uma pluralidade de genes, métodos para seleção de célula transformada de levedura com afinidade aumentada de ligação à celulose insolúvel e para produção de etanol, organismo transformado, polinucleotídeo isolado, vetor, célula hospedeira geneticamente construída e construto genético - Google Patents

Célula de levedura transformada que expressa uma pluralidade de genes, métodos para seleção de célula transformada de levedura com afinidade aumentada de ligação à celulose insolúvel e para produção de etanol, organismo transformado, polinucleotídeo isolado, vetor, célula hospedeira geneticamente construída e construto genético Download PDF

Info

Publication number
BRPI0719299A2
BRPI0719299A2 BRPI0719299-1A BRPI0719299A BRPI0719299A2 BR PI0719299 A2 BRPI0719299 A2 BR PI0719299A2 BR PI0719299 A BRPI0719299 A BR PI0719299A BR PI0719299 A2 BRPI0719299 A2 BR PI0719299A2
Authority
BR
Brazil
Prior art keywords
leu
gly
thr
arg
val
Prior art date
Application number
BRPI0719299-1A
Other languages
English (en)
Inventor
John E E Mcbride
Kristen M Deleault
Lee R Lynd
Jack T Pronk
Original Assignee
Dartmouth College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dartmouth College filed Critical Dartmouth College
Publication of BRPI0719299A2 publication Critical patent/BRPI0719299A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2445Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • C12P7/10Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01004Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01021Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01091Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Description

Relatório Descritivo da Patente de Invenção para "CÉLULA DE LEVEDURA TRANSFORMADA QUE EXPRESSA UMA PLURALIDADE DE GENES, MÉTODOS PARA SELEÇÃO DE CÉLULA TRANSFORMADA DE LEVEDURA COM AFINIDADE AUMENTADA DE LIGAÇÃO À CELULOSE 5 INSOLÚVEL E PARA PRODUÇÃO DE ETANOL, ORGANISMO TRANS- FORMADO, POLINUCLEOTÍDEO ISOLADO, VETOR, CÉLULA HOSPE- DEIRA GENETICAMENTE CONSTRUÍDA E CONSTRUTO GENÉTICO". Pedidos de patente relacionados
Este pedido de patente reivindica prioridade do Pedido de Paten- te Provisório U.S. N0 de série 60/867 018, depositado em 22 de novembro de 2006, cujo conteúdo é aqui incorporado em sua totalidade por referência neste pedido de patente.
Direitos de governo
O governo dos Estados Unidos detém certos direitos nesta in-
venção, conforme estipulados pelos termos do Financiamento de Pesquisa N0 60NANB1D0064, concedido pelo National Institute of Standards and Te- chnology.
Antecedentes Campo da invenção
A presente invenção refere-se ao campo de processamento de
biomassa para produção de etanol e de outros produtos. Em especial, a or- ganismos recombinantes que hidrolisam, fermentam e crescem utilizando formas solúveis e insolúveis de celulose, bem como métodos para a produ- ção e uso dos organismos.
Descrição da técnica relacionada
Biomassa representa uma matéria-prima para celulose, barata e de fácil disponibilidade, a partir da qual açúcares podem ser produzidos. Es- tes açúcares podem ser recuperados ou fermentados para produção de ál- coois e/ou de outros produtos. Entre os produtos da bioconversão, há gran- 30 de interesse em etanol uma vez que este pode ser utilizado como combustí- vel doméstico renovável.
Um grande número de pesquisas tem sido conduzido em áreas 1a *■ que envolvem desenho de reator, protocolos de pré-tratamento e tecnologias de separação, de modo que processos de bioconversão estão se tornando economicamente competitivos em relação a tecnologias de combustível à base de petróleo. Além do mais, foi observado que é possível obter grandes reduções de custo quando duas ou mais etapas do processo são combina- das. Por exemplo, processos de sacarificação e fermentação simultânea (SSF) e de sacarificação e cofermentação simultânea (SSCF) combinados à sacarificação mediada por enzimas com fermentação em um único reator ou 5 equipamento de processamento contínuo.
Além de redução de custo associada aos tempos mais curtos de reação e menores custos de capital, os processos de cofermentação podem proporcionar também melhores rendimentos do produto porque certos com- postos que se acumulariam de outra forma em níveis inibidores da metabóli- 10 se ou hidrólise são consumidos pelos organismos cofermentadores. Em um desses exemplos, β-glicosidase deixa de hidrolisar celobiose na presença de glicose e, por sua vez, o aumento de celobiose impede a degradação da ce- lulose. Um processo de SSCF, envolvendo cofermentação de celulose e hemicelulose, produzida por hidrólise, pode melhorar esse problema pela 15 conversão da glicose em um ou mais produtos que não inibem a atividade hidrolítica da β-glicosidase.
A combinação final de etapas de processamento de biomassa é referida como bioprocessamento consolidado (CBP). CBP envolve quatro eventos mediados biologicamente: (1) produção de enzimas, (2) hidrólise de 20 substrato, (3) fermentação de hexose e (4) fermentação de pentose. Estes eventos podem ser conduzidos em uma única etapa por um microorganismo que degrada e utiliza tanto celulose como hemicelulose. O desenvolvimento de organismos para CBP poderia potencialmente resultar em reduções muito grandes de custo quando comparado à abordagem mais convencional de 25 produzir enzimas sacarolíticas em uma etapa exclusiva do processo. Pro- cessos de CBP que utilizam mais de um organismo para executar os quatro eventos mediados biologicamente são referidos como fermentações de bio- processamento consolidado com cocultura.
Organismos para bioprocessamento consolidado Foram efetuadas inúmeras tentativas para criar organismos para
CBP. Por exemplo, vários genes de celulase foram expressos em Saccha- romyces cerevisiae com o objetivo de direcionar a produção de etanol a par- tir de celulose. Embora fermentações de vida curta tenham sido observadas utilizando organismos recombinantes, o crescimento sustentável dos orga- nismos utilizando celulose não foi obtido. Isso se deve, parcialmente, ao fato de que as enzimas heterólogas de celulase são geralmente produzidas pelos 5 organismos recombinantes em concentrações tão baixas que a quantidade de substrato sacarificado disponível não é capaz de sustentar o crescimento dos organismos. Este déficit em concentração é exacerbado quando as en- zimas são secretadas em meios nos quais estas estão ainda mais diluídas.
Visando compensar as deficiências de concentrações enzimáti- cas, cepas de levedura exibindo proteínas de superfície celular foram de- senvolvidas recentemente. Fujita, Y., Takahashi, S., Ueda, M., Tanaka, A., Okada, H., Morikawa, Y., Kawaguchi, T., Arai, M., Fukuda, H., Kondo, A. "Di- rect and Efficient Production of Ethanol From Cellulosic Material with a Yeast Strain Displaying Cellulolytic Enzimes'', Applied and Environmental Mierobio- Iogy, 68(1), 5136-5141, (2002), descrevem uma cepa de S. eerevisiae que expressa β-glicosidase I (BGLI) e endoglicanase Il (EGII) presas (tethered). A cepa é capaz de crescer utilizando β-glicano, polissacarídeo linear solúvel, de cevada. Até esta data, no entanto, não há relatos de cepas de levedura expressando enzimas presas na superfície celular que sejam capazes de crescer utilizando celulose insolúvel, nem há relatos de quaisquer cepas de leveduras capazes de crescer utilizando celulose cristalina.
Conforme relatado por Fan et al. em PCT/US05/018430, a ex- pressão de enzimas presas na superfície celular pode oferecer uma vanta- gem para o crescimento celular, onde o substrato sacarificado não é capaz 25 de se difundir e afastar-se da célula antes de ser metabolizado. Ademais, uma parte de uma população de células que expressam enzimas presas po- de exibir expressão aumentada da única ou mais enzimas presas em rela- ção à população total. Esta parte pode exibir ligação aumentada ao substra- to e características melhoradas de crescimento. Como tal, a observação 30 desses traços pode ser um critério útil para seleção de organismos.
Sumário
Os presentes meios trazem avanços à técnica e superam as questões descritas acima ao fornecer cepas recombinantes de leveduras que expressam enzimas celulases presas e que possuem a capacidade de sacarificar celulose insolúvel. Métodos para uso dos organismos recombi- nantes para produção de etanol são expostos também.
Em uma concretização, uma célula transformada de levedura
expressa uma pluralidade de genes, em que os genes codificam a expres- são de enzimas presas, incluindo endoglicanase, celobio-hidrolase e β- glicosidase.
Em uma concretização, um organismo transformado inclui uma levedura que em estado nativo não possui a capacidade para sacarificar ce- lulose, em que a levedura é transformada com polinucleotídeos heterólogos que expressam uma pluralidade de enzimas que conferem à levedura a ca- pacidade de sacarificar celulose cristalina.
Em uma concretização, um polinucleotídeo inclui (a) uma se- 15 quência de polinucleotídeo igual a SEQ ID NO:11; (b) uma seqüência de po- linucleotídeo igual a SEQ ID NO: 12; (c) uma seqüência de polinucleotídeo igual a SEQ ID NO:28; (d) uma seqüência de polinucleotídeo igual a SEQ ID NO:29; e (e) uma seqüência de polinucleotídeo igual a SEQ ID N0:30; ou (f) uma seqüência de polinucleotídeo com, pelo menos, 90% de identidade de 20 seqüência com as seqüências de nucleotídeos iguais a (a)-(e).
Um hospedeiro de levedura, de acordo com qualquer uma das concretizações supramencionadas, pode ser utilizada para produção de eta- nol, a qual inclui a produção de um hospedeiro de levedura transformada e o cultivo do hospedeiro de levedura transformada em meio que contenha celu- 25 Iose sob as condições adequadas e por período de tempo suficiente que permita a sacarificação e fermentação da celulose para etanol.
Um hospedeiro de levedura, de acordo com qualquer uma das concretizações supramencionadas, pode ser utilizada em um método para seleção de célula transformada de levedura com afinidade de ligação au- 30 mentada por celulose insolúvel. O método inclui a produção do hospedeiro de levedura transformada, o cultivo do hospedeiro de levedura transformada sob condições adequadas e por período de tempo suficiente que permita o crescimento e replicação do hospedeiro de levedura transformada, a exposi- ção de uma amostra de levedura hospedeira transformada, proveniente da cultura, à celulose insolúvel e a seleção da amostra de levedura hospedeira transformada que forneça redução de pelo menos duas vezes em densidade óptica do sobrenandante, em relação a uma amostra igualmente cultivada e exposta do organismo nativo.
Breve descrição dos desenhos
A Figura 1 é um desenho esquemático de um exemplo de vetor de integração-δ com duas enzimas celulases e um marcador de canamicina.
A Figura 2 apresenta uma comparação do crescimento utilizando celulose expandida com ácido fosfórico (PASC) das leveduras recombinan- tes Y294 e CEN.PK, transformadas para expressar as enzimas β-glicosidase I, endoglicanase I, celobio-hidrolase I e celobio-hidrolase Il e as leveduras Y294 e CEN.PK não-transformadas, de acordo com uma concretização.
A Figura 3 apresenta uma comparação do crescimento utilizando celulose microcristalina bacteriana (BMCC) das leveduras recombinantes Y294 e CEN.PK, transformadas para expressar as enzimas β-glicosidase I, endoglicanase I, celobio-hidrolase I e celobio-hidrolase Il e as leveduras Y294 e CEN.PK não-transformadas, de acordo com uma concretização.
A Figura 4 apresenta uma comparação do crescimento utilizando celulose microcristalina bacteriana (BMCC) da levedura recombinante Y294, transformada para expressar as enzimas β-glicosidase I e endoglicanase I, a levedura Y294, transformada para expressar as enzimas β-glicosidase I, en- doglicanase I, celobio-hidrolase I e celobio-hidrolase II, e a levedura Y294 não-transformada, de acordo com uma concretização.
A Figura 5 apresenta uma comparação da ligação em partículas de celulose de levedura recombinante transformada para expressar as en- zimas β-glicosidase I e endoglicanase I e levedura não-transformada, de a- cordo com uma concretização.
A Figura 6 apresenta a concentração celular e contagens de cé- lulas viáveis de culturas semi-contínuas de cepas transformadas e não- transformadas de cepas de CEN.PK, crescendo utilizando Avicell como fonte de carbono, de acordo com uma concretização.
Descrição detalhada
Serão apresentados e descritos abaixo métodos para a constru- ção e utilização de levedura recombinada na conversão de biomassa para 5 etanol. As cepas expostas de levedura expressam enzimas celulases pre- sas, as quais conferem à levedura a capacidade de crescer utilizando formas insolúveis não-cristalinas e cristalinas de celulose.
Conforme utilizado aqui, um organismo está em "estado nativo" se não tiver sido geneticamente construído ou, de outra forma, manipulado pelo homem de maneira que altere intencionalmente a constituição genética e/ou fenotípica do organismo. Por exemplo, organismos do tipo selvagem podem ser considerados como estando em estado nativo.
Conforme utilizado nesta exposição, uma proteína está "presa" {tethered) à superfície celular de um organismo se, pelo menos, uma parte 15 final da proteína estiver ligada covalentemente e/ou eletrostaticamente à membrana celular ou à parede celular. Será apreciado que uma proteína presa pode incluir uma ou mais regiões enzimáticas que podem ser unidas a um ou mais outros tipos de regiões (por exemplo, promotora, terminadora, domínio ancoradouro, ligante, região sinalizadora, etc.). Embora a única ou 20 mais regiões enzimáticas possam não estar diretamente ligadas à membra- na celular (por exemplo, quando a ligação ocorre por meio de um domínio ancoradouro), esta proteína pode, mesmo assim, ser considerada uma "en- zima presa", de acordo com o presente relatório descritivo.
O travamento (tethering) pode ser conseguido, por exemplo, por 25 incorporação de um domínio ancoradouro na proteína recombinante que é expresso de modo heterólogo por uma célula, por exemplo, uma ligação a ácido graxo, âncora glicosil fosfatidil inosotol ou outra molécula âncora ade- quada que pode ligar a proteína presa à membrana celular da célula hospe- deira. Além disso, o travamento pode ser conseguido por prenilação, ou se- 30 ja, a união de uma cadeia hidrofóbica a uma proteína para facilitar a intera- ção entre a proteína modificada e a região hidrofóbica da bicamada lipídica.
Embora os resultados relatados nesta exposição sejam para Saccharomyces cerevisiae, os métodos e materiais aplicam-se também a outros tipos de levedura, incluindo Schizosaccharomyces pombe, Candida albieans, Kluyveromyces laetis, Piehia pastoris, Piehia stipitis, Yarrowia Ii- polytiea, Hansenula polimorpha, Phaffia rhodozyma, Candida utilis, Arxula 5 adeninivorans, Debaryomyees hansenii, Debaryomyees polymorphus, Kluy- veromyees marxianus, Issatehenkia orientalis e Sehwanniomyces occidenta- lis. Os métodos e materiais expostos são úteis geralmente na técnica de en- genharia de leveduras.
As cepas descritas de levedura recombinante possuem o poten- 10 ciai para contribuir de modo significante na redução de custo da conversão de biomassa lignocelulósica em etanol. Por exemplo, cepas de levedura re- combinante podem ser adequadas para bioprocessamento consolidado de fermentação em cocultura, onde converteriam celulose em etanol, e hemice- lulose seria degradada por um organismo que utiliza pentose, como Saccha- 15 romyees cerevisiae RWB218, exposto por Kuyper, M., Hartog, M.M.P., Toir- kens, M.J., Almering, M.J.H., Winkler, A.A., van Dijken, J.P., Pronk, J.T. "Me- tabolie engineering of a xylose-isomerase-expressing Saccharomyees cere- visiae strain for rapid anaerobie xylose fermentation", FEMS Yeast Research, 5:399-409 (2005).
Será apreciado que material lignocelulósico adequado pode ser
qualquer matéria-prima que contenha celulose solúvel ou insolúvel, onde a celulose insolúvel pode estar em forma cristalina ou não-cristalina. Em várias concretizações, a biomassa lignocelulósica compreende madeira, milho, hí- bridos de milho, serragem, casca e folhas de árvore, resíduos agrícolas e de 25 florestas, gramas como as do tipo switchgrass, produtos de digestão de ru- minantes, resíduos urbanos, celulose efluente de produção de papel, jornal, papel-cartão ou combinações dos mesmos.
Em algumas concretizações, endoglicanase, celobio-hidrolase e β-glicosidase podem ser qualquer endoglicanase, celobio-hidrolase e/ou β- glicosidase adequada derivada de, por exemplo, fungo ou de origem bacteri- ana.
Em certas concretizações, a endoglicanase expressa pelas célu- Ias hospedeiras pode ser uma isoforma, paráloga ou ortóloga de endoglica- nase I e/ou endoglicanase II. Em uma outra concretização, a endoglicanase expressa pelas células hospedeiras pode ser endo-1,4-p-glicanase recombi- nante. Em algumas concretizações, a endoglicanase e uma endoglicanase 5 de Trichoderma reesei. Em uma outra concretização, a endoglicanase é co- dificada pela seqüência de polinucleotídeo igual a SEQ ID NO:28.
Em certas concretizações, a β-glicosidase é derivada de Sac- charomycopsis fibuligera. Em algumas concretizações, a β-glicosidase pode ser uma isoforma, paráloga ou ortóloga de β-glicosidase I e/ou β-glicosidase 10 II. Em uma outra concretização, a β-glicosidase expressa pelas células hos- pedeiras pode ser β-glicosidase I recombinante, originária da fonte Saeeha- romyeopsis fibuligera.
Em certas concretizações, a(s) celobio-hidrolase(s) pode(m) ser uma isoforma, paráloga ou ortóloga de celobio-hidrolase I e/ou celebiohidro- 15 Iase II. Em algumas concretizações, as celobio-hidrolases são celobiodrola- se I e/ou celebiohidrolase Il de Triehoderma reesei. Em uma outra concreti- zação, as celobio-hidrolases são codificadas pelas seqüências de polinu- cleotídeos iguais às SEQ ID NOS: 29 e/ou 30.
Genes com domínio catalítico de celulases, adequados para uso nos organismos recombinantes expostos, incluem, por exemplo, aqueles apresentados na Tabela 1. Genes de celulase adequados para incorporação em levedura, de acordo com os presentes meios (por exemplo, BFLI, EGI, CBHI, CBHIIj Endo-1, EG19, glicosídeo hidrolase, Cel3AC, gghA e BGLA) podem ser sintetizados ou isolados de vários organismos. Estes genes de celulase, e métodos para síntese e/ou isolamento dos genes, são conheci- dos na técnica. Por exemplo, muitos domínios catalíticos de celulases po- dem ser localizados no banco de dados online ExPASy (http://www.expasv.org/), sob E.C. n° 3.2.1.4 (endo-1,4,beta-D-glicanase), E.C. n° 3.2.1.91 (celulose a,4-beta-celobiosidase) e E.C. n° 3.2.1.21 (beta- glicosidase) [resgatados em 14 de novembro de 2007]. Resgatados do site da Internet: <URL: www.expasv.org/>. θ Tabela 1: Domínios catalíticos de celulase
Nome Domínio catalítico de celulase Organismo de ori¬ SEQ Seqüência de aminoácidos gem ID NO BLGI mvsftsllagvaaisgvlaapaaevepvave Saccharomycopsis 36 kreaeaeamlmivqllvfa Iglavavpiqnytq fibuliga spsqrdes&qwvsphyyptpqggrlqdvwq eayarakaivgqmtivekvnlttgtgwqldpc vgntgsvprfgipniclqdgplgvrfadívígyp sgiatgatfrikdiflqrgqalghefnskgvhialg pavgplgvkarggmfeafgsdpylqgtaaaa trkglqennvmacvkhfigneqekyrqpddin patnqttkeaisanipdramha Iylwpfadsv ragvgsvmcsynrvnntyacensymmnhll keelgfqgfwsdwgaqlsgvysaisgldms mpgevyggwmgtsfwgqnltkaiynetvpi erfddmairilaaSyatnsfptedhlpnfsswttk eygn k yyad ntteivkvnynvd psndftedta Ikvaeesrvllknenntlplspekakiillsgiaa gpdpigyqcedqsctngalfqgwgsgsvgs pkyqvtpfeeísylarknkmqídyiresydiaq vtkvasdahisivvvsaasgegyitvdgnqgd rknltlwnngd klletvaencantwwtstgqi nfegíadhpnvtaivwagplgdrsgtaianilf gkanpsghlpftiaktdddyipletyspssgep ednhl vend Ilvdyryfee kntepryafgygls yneyevsna kvsaakkvdeelpepatylsef syqnakdsknpsdafapadlnrvneyiypyl dsn vtlkdgn yeypdgysteqrttpnqpgggl ggndalwevaynstd kfvpqgnstd kfvpql ylkhpedg kfetpiqlrgfekvelspgekktvdl rllrrdlsvwdttrqswivesgtyealigvavnd i ktsvtfti EGI mnrfyrfffllsfvqgslncürdsqqkslvmsgp Triehoderma reesei 37 yelkasld kreaeaeaqq pgtstpevhpkltty kctksggcvaqdtsvvkiwnyrwrnhdanyn sctvngg vnttlcpdeatcgkncfiegvdyaa sgvttsgssltmnqympsssggyssvsprlyl Idsdgeyvmlklnigqelsfdvdlsalpcgeng slylsqmdengganqyntaganygsgycda qcpvqtwmgtlntshqgfccnemdilegnsr analtphsctatacdsagcgfnpygsgyksy yg pgdt vdtsktft i itqfntd ngspsgnlvsitrk yqqngvd ipsaqpggdtisscpsasaygg Ia tmgkalssgmvlvfsiwndnsqymnwldsg nagpcsstegnpsnllannpnthwfsn i rwg dlgsttnstapppppassttfsttrrssttsssps ctqthwgqcggigysgcktctsgttcqysndy ysqci Nome Domínio catalítico de celulase Organismo de ori¬ SEQ Seqüência de aminoácidos gem ID NO CBHI rnnifyíflfllsfvqgslnctlrdsqqksivmsgp Trichoderma reesi 38 yelkasldkreaeaeaqsactlqsethppltw qkcssggtctqqtgsvvidanwrwthatnsst ncydgntwsstlcpdnetcaknccldgaaya stygvttsgnslsigfvtqsaqknvgarlylmas dttyqeftllgnefsfdvdvsqlpcglngalyfvs mdadggvskyptntagakygtgycdsqcpr dlkfingqanvegwepssnnantgigghgsc csemdiweansiseattphpcttvgqeiceg dgcggtysdnryggtcdpdgcdwnpyrtgnl sfygpgssftldttkkltwtqfetsgainryyvq ngvtfqqpnaelgsysgnelnddyctaeeae fggssf sdkgg Itqfkkatsggmvtvtnstwdd yyanmlwldstyptnetsstpgavrgscstss gvpaqvesqspnakvtfsnikfgpigstgnps ggnppggnrgttttrrpatttgsspgptqshyg qcggigysg ptvcasgttcq vlnpyysqc! CHII mvsftsllagvaaisgvlaapaaevepvave Trichoderma reesei 39 kreaeaeavpleerqacssvwgqcggqnw sgptccasgstcvysndyysqCIpgaasss sstraasttsrvspttsrsssatpppgstttrvpp vgsgtatysgnpfvg vtpwanayyase vssl aipsItgamataaAavakvpsfmwIdtldktp Imeqtladirtanknggnyagqfwydlpdfd caalasngeysiadggvakyknytdtirqiwe Ysdirtll viepdsla nlvtnlgtpkca naqsayl ecinyavtqlnlpnvamyldaghagwlgwp anqdpaaqlfanvyknassprAlrg Iatnvan yngwnitsppsytqgnavyneklyíhaigplla nhgwsnaffitdqgrsgkqptgqqqwgdwc nvigtgfgirpsantgdslkJsfvwvkpggecd gtsdssaprfdshcalpdalqpapqagawfq ayfvqlltnanpsfl Nome Domínio catalítico de celulase Organismo de ori¬ SEQ Seqüência de aminoácidos gem ID NO Endo-1 mrivnslg rrkil IjlavivafsMIfakIwgrktsst Clostridium thermo- 40 Idevgskthgdltaenknggylpeeeipdqp cellum patgafnygealqkaiffyecqrsgkldpstlrtn wrgd sg Iddgkdagid ttggwydagdhvkfn Ipmsysaamlgwavyeyedafkqsgqynh ilnnikwacdyfikchpekdvyyyqvgdgha dhawwgpaevmpmerpsykvdrsspgst vvaetsaalalasiifkkvdgeyskeclkhake IfefadttksddgytaangfynswsgfydeIs waavwlyiatndssykJkaesysd kwgyep qtnipkykwaqcwddvtygtylllarikndngk ykeaietfildwwttgyngeiitytpkglawldq wgslryatttaflacvysdwengdkekaktyle farsqadyalgstgrsfwgfgenppkrphhrt ahgswadsqmeppehrhvlygalvggpds tdnytddisnytcnevacdynagfvgllakmy klyggspdpkfngieevpedeíf veag vna s gnnfieikaivnnksgwparvcenlsfryfinie eívnagksasdlqvsssynqgaklsdvkhyk dniyyvevdlsgtkiypggqsaykkevqfrisa pegtvfnpendysyqglsagtwkseyipvy dagvlvfgrepgsaskstskdnglskatptvkt esqptakhtqnpasdfktpanqnsvkkdqgi kgewlqyangnagatsnsinprfkiinngtka In Isd vkí ryyytkeggasqnfwcdwssagn snvtgnffnlsspkegadtclevgfgsgagtld pggsvevqirfskedwsnynqsndysíkqa clrartlivlvatwlr EG19 mgsittisilwlllglvqlaisghdykqalsksilff Arabidopsis thaliana 41 eaqrsg hl ppnqrvswrshsglydgkssgvd Ivggyydagdnvkfglpmaftvttmcwsiiey ggqlesngelghaidavkwgtdyfikahpep nvlygevgdgksdhycwqrpeemttdrray kkjmnpgsdlagetaaamaaasivfrrsdps ysaellrhahqlfefadkyrgkyd ssitvaqky yrsvsgyndellwaaawlyqatndkyyldylg kngdsmggtgwsmtefgwdvkyagvqtlv akvlmqgkggehtavferyqqkaeqfmcsll gkstknikktpgglifrqswnnmqfvtsasflat vysdylsyskrdllcsqgnispsqllefsksqvd yilgdopratsymvgygenyprqvhhrgssiv sfnvdqkfvtcrggyatwfsrkgsdpnvftgal vggpdaydnfadqrdnyeqtepatynnapll gvlarlisgstgfdqllpgvsptpspviikpapvp qrkptkppasspspitisqkmtnswknegkv yyrystiltnrstlrtlkilkisiWygpiwgvtlctgn sfsfpswmqslpsgksmefvyíhsaspadvl vsnvsle Nome Domínio catalítico de celulase Organismo de ori¬ SEQ Seqüência de aminoácidos gem ID NO EGI mkafhllaalagaavaqqaqlcdqyatytggv Apergillus aculeauts 42 ytinnnlwgkdagsgsqcttvnsassagtsw síkwnwsggensvksyansgltfnkklvsqis qipttarwsydntgíradvaydlftaad inhvtw sgdyelmiwlaryggvqpigsq iatatvdgqt we Iwygangsqktysfvaptpitsfqgdvndf fkyltqnhgfpassqylitlqfgtepftggpatlsv snwsasva Glicosí- mnfrrmlcaaivltívlsimipstvfaledkspkl Clostridium thermo- 43 deo hi- pdykndllyertfd eg Icfpwhtcedsggkcdf cellum drolase awdvpgepgnkafrltvidkgqnkwsvqmr hrgitleqghtytvrftiwsdkscrvyakigqmg epyteywnnnwnpfnltpgqkltveqnftmn yptddtceftfhlggelaagtpyyvylddvslyd prfvkpveyvlpqpdvrvnqvgylpfakkyat wssstspíkwqllnsanqwlegntipkgkik dsqdy vhwidfsnfkteg kgyyf kl ptvnsdtn yshpfdisadiyskmkfdalaffyhkrsgípie mpyaggeqwtrpaghigvapnkgdtnvpt wpqddeyagrpqkyytkdvtggwydagd h gkywnggiavwtlmnmyerakirgianqga ykdggmnipemngypdildearweieffkk mqvtekedpsiagmvfthkibdfrwta Igmlp hedpqprylrpvstaatlnfaatlaqsariwkd ydptfaadclekaeiawqaalkhpdiyaeytp gsggpgggpynddyvgdefywaacelyvtt gkdeykrrylmnsphylempakmgengga nged nglwgcftwgttqgigitrtlal venglpsa díqkamniakaadkwlenieeqgyrip!kqa ederggypwgsnsfilnqmivmgyaydftgn skyldgmqdgmsyllgmgldqsyvtgyger plqnphdrfwtpqtskkfpapppgííaggpns rfedptitaavkkdtppqkcyídhtdswstneit inwnapfawvtayldekJlitppggvdpeepe viygdcngdgkvnstdavaikryilrsgisíntd nadvnadarvnstdlailkryilkeidvlphk Cel3AC mfkfaallalaslvpgfvqaqspvwgqcggn Agaricus bisporus 44 gwtgpttcasgstcvkqndfysqclpnnqap psfflqpgttppatttsggtgptsgagnpytgkt vwlspfyadevaqaaadisnpslatkaasva kíptfvwfdtvakvpdiggyladarsknqlvqiv vyd I pdrdcaalasngefslandglnkyknyv dqiaaqikqfpdvswaviepdslanlvtnlnv qkcanaqsaykegviyavqklnavgvtmytó aghagwlgwpanlspaaqlfaqiyrdagspr ntrgiatnvanfnalrasspdpitqgnsnydei hyiealapmlsnagfpahfivdqgrsgvqnir dqwgdwcnvkgagfgqrpttntgsslidaiv wvkpggecdgtsd nssprfdshcslsda hq DaoeaatwfaavfetlvananDal Nome Domínio catalítico de celulase Organismo de ori¬ SEQ Seqüência de aminoácidos gem ID NO CBHI mfrtatlIaftrnaarrivfgqqvgtntaenhrtJts Phaneroehaete ehry- 45 qkciksggcsnlntkividanwrwlhstsgyin sosporium cytgnqwdatlcpdgktcaanealdgadytgt ygitasgsslklqfvtgsnvgsrvyfmaddthy qmfqllnqeftfdvdmsnlpcglngaiylsam dadggma kyptnkagakygtgycd sqcpr díkfingeanvegwoaisanagtgnygtcGte mdweanndaaaytphpctínaqtrcsgsd ctrdtgicdadgcdfnsfrmgdqtflgkgHvdt skpflvvt qíitndgtsagttteirrfyvqngkviq nssvkipgidpvnsrtdnfcsqqktafgdtnyf aq hgg Ikqvgealrlgmvlalsiwddyaa n m Iwldsnyptnkdpstpgvarg teattsgvpaqí eaqspnaywfsníkfgd Inttytgtvssssvs sshsststssshsssstpptqptgvtvpqwgq eggigytgsttcaspyichvinpyysqcy gghA mkkfpegflwgvaiasyqiegspladgagm Thermotoga neapoli- 46 siwhtfshtpg n vkngdtgd vacxJhy n rwke tana dieiiekigakayrfsiswprilpegtgkvnqkgl dfynri idt I Ieknitpfitiy hwd Ipfsiq Ikgg wa nrdiadwfaeysrvIfenfgdrvkhwitJnepw waivghíygvhapgmkdiyvafhtvhnllra haksvkvfretvkdgkigivfnngyfepasene ediraarfmhqfnnyplflnpiyrgeypdlvlef areylpmyeddmeeikqeidfvglnyysgh mvkyd pnsparvsfvem Ipkta mgweivp egiywilkgvkeeynpqevyitefigaafddw seggkvhdq nridy frahieq vwra iqdgvpl kgyfvwsltónfewaegyskrfgivyvdyntq kriikdsgywysngiknngltd BLGA mdmsfpkgflwgaatasyqiegawnedgk Caldocellum saeeha- 47 gesh/vdrfthqkmilyghngdvacdhyhrfe rolytieum edvslmkelglkayrfeiawtrifpdgfgtvnqk glefydriinklvengÍepvvtlyhwd Ipqkiqdi ggwanpeivnyyfdyamivinrykdkvkkwi tfnepyciaflgyftigÍhapgikdfkvamdwh slmlshfkwkavkennidvevgitlnltpvyiq terlgykvseieremvslssqldnqlfldpvlkg sypqkildylvqkdlidsqkalsmqqevkenfi fpdflginyytravrlydensswifpírwehpag eytemgwevfpqglfdllíwikesypqipiyite ngaayndivtedgkvhdskríeylkqhfeaar kaieng vd Irgyfvwsl mdnfewamgytkrf ail wdvetakrikkdsfvfvaa vikens Exemplos
Materiais
A cepa Y294 foi obtida do Dr. W.H. Emile van Zyl1 Universidade de Stellenbosch, África do Sul. BGLI de Saccharomycopsis fibuligera foi de- rivado de um plasmídeo fornecido pelo Dr. Van Zyl. CEN.PK 113-11C foi obtido do Dr. Peter Kõtter, Universidade de Frankfurt, Alemanha. O marca- dor KanMX4, utilizado no vetor de integração, foi derivado por PCR do Plasmídeo M4297, fornecido pelo Dr. David Stillman, Universidade de Utah, 5 U.S.A.. O marcador zeocina foi derivado por PCR do vetor pTEF1-Zeo, ad- quirido da Invitrogen, Carlsbad, CA.
Meio e cultivo de cepas
A cepa DH5a de Escherichia coli (Invitrogen) foi utilizada para transformação e propagação do plasmídeo. As células foram cultivadas em 10 meio LB (5 g/l de extrato de levedura, 5g/l de NaCI1 10 g/l de triptona), com- plementado com ampicilina (100 mg/l), canamicina (50 mg/l) ou zeocina (20 mg/l). Quando a seleção por zeocina era a desejada, o meio LB foi ajustado para pH 7,0. Quinze gramas por litro de Agar foram adicionados quando meio sólido era o desejado.
As cepas de Saccharomyees cerevisiae - Y294 (alfaleu2-3,112
ura3-52 his3 trpl-289); BJ5464 (MAT alfa ura3-52 trpl Ieu2-delta1 his3- delta200 pep4::HIS3 prbl-deitai.6R can1 GAL) e CEN.PK 113-11C (MATa, ura3-52, his3-delta1) - foram cultivadas nos meios YPD (1 Og/I de extrato de levedura, 20 g/l de peptona, 20 g/l de glicose) ou YPC (10/1 de extrato de 20 levedura, 20 g/l de peptona, 20 g/l de celobiose) com G418 (250 mg/l, a não ser se especificado) ou zeocina (20 mg/l, a não ser se especificado) para seleção. Quinze gramas por litro de Agar foram adicionados quando meio sólido era o desejado.
Exemplo 1
Métodos para engenharia de cepas de Saccharomvces cerevisiae com en- zimas celulases presas Métodos moleculares
Protocolos-padrão foram seguidos para manipulações de DNA (Sambrook J., Fritsch, E., Maniatis, T. Molecular doning: A Iaboratory manu- al. New York: Cold Spring Harbor Laboratory Press; 1989). PCR foi conduzi- da utilizando Phusion Polymerase (New England Biolabs, Ipswitch, MA) para clonagem, e Taq polimerase (New England Biolabs) para triagem de trans- formantes. As orientações do fabricante foram seguidas, conforme forneci- das. Enzimas de restrição foram adquiridas do New England Biolabs, e as digestões foram definidas de acordo com as orientações fornecidas. As liga- ções foram utilizadas com o Kit de Ligação Quick (New England Biolabs), 5 conforme especificadas pelo fabricante. A purificação em gel foi realizada empregando os kits de pesquisa Qiagen ou Zymo, sendo as purificações do produto da PCR e da digestão realizadas com os kits de pesquisa Zymo, e os kits midi e miniprep da Qiagen foram utilizados para purificação do DNA de plasmídeos. O sequenciamento foi realizado pela Molecular Biology Core 10 Facility na Faculdade de Dartmouth.
Construções sintéticas de DNA
Seqüências para CBHI, CBHII e EGI, de Trichoderma reesei, proteínas ligantes, sinais de secreção e domínios ancoradouros foram otimi- zados, quanto ao códon, para expressão em Saccharomyces cerevisiae, 15 utilizando o software fornecido pela DNA 2.0, Menlo Park, CA1 ou utilizando o "Synthetic Gene Designer1' (Wu, G., Bashir-Bello, N., Freeland, S.J. "The Synthetic Gene Designer: A flexible web platform to explore sequence mani- pulation for heterologous expressiori', Protein Expr. Purif. 47(2):441-445, (2006)). As seqüências otimizadas são expostas como as SEQ ID NOS:27- 20 35.
Construção de vetor de inteqracão-δ
Os vetores para integração no genoma de S. cerevisiae, em múl- tiplas cópias, foram produzidos em algumas etapas. A Figura 1 apresenta um exemplo do vetor final incluindo dois operons. Cada operon inclui um 25 gene de celulase (9 ou BGLI de 10), unido a um sinal de secreção (8 ou xyn2 de 10), que direciona expressão constitutiva, bem como um domínio ancoradouro (6) que facilita a união da celulase à membrana celular. O gene de celulase, o sinal de secreção e o domínio ancoradouro são flanqueados por um conjunto de seqüências promotoras/terminadoras (4 ou 5). O vetor foi 30 construído com dois marcadores selecionáveis dominantes diferentes, KanMX e TEF1/zeo. Estes marcadores foram adicionados ao plasmídeo p- Bluescript Il SK+, iniciando com geração de fragmentos por PCR (iniciadores SEQ ID N0S:7 e 8, com plasmídeo 3, Tabela 2; SEQ ID NOS:9 e 10 com plasmídeo 2, Tabela 2), digestão dos fragmentos com EcoRI e Spel1 e união na cadeia principal do pBluescript duplamente digerida (EcoRI/Spel). As construções foram inicialmente confirmadas por seleção de cepas de E. coli 5 resistentes à ampicilina (cadeia principal pBluescript) e a canamicina ou ze- ocina, bem como por digesto por restrição para confirmar o tamanho do fragmento inserido.
Tabela 2. Plasmídeos
N0 Nome do plasmídeo Utilizado para/genes Referência/ n° de transportados acesso 1 pBluescript Il SK+ Cadeia principal do vetor X52328 de expressão para mon¬ tagem de cassetes de expressão 2 pTEF1-zeo Marcador TEF-1/Zeo Invitrogen 3 M4297 Marcador KanMX Prof. David Still- man 4 ySFI BGLI Van Rooyen (2005) pBK pBluescript; marcador Este trabalho KanMX 6 p BZ pBluescript; marcador Este trabalho TE F1/Zeo 7 pBK_1 pBK + PGK P/T* Este trabalho 8 pBK_2 pBK + EN01 P/T* Este trabalho 9 pBZ_1 pBZ + PGK PfT* Este trabalho pBZ_2 pBZ + EN01 P/T* Este trabalho 11 pBKD1_1 pBK__1 + 1 seqüência δ Este trabalho 12 pBKD1_2 pBK_2 + 1 seqüência δ Este trabalho 13 pBZD1_1 pBZ_1 + 1 seqüência δ Este trabalho 14 pBZD1_2 pBZ_2 + 1 seqüência δ Este trabalho pBKD1_1 pBK_1 + 2 seqüências δ Este trabalho 16 pBKD1_2 pBK_2 + 2 seqüências δ Este trabalho 17 pBZD1_1 pBZ_1 + 2 seqüências δ Este trabalho 18 pBZD1_2 pBZ_2 + 2 seqüências δ Este trabalho N0 Nome do plasmídeo Utilizado para/genes Referência/ n° de transportados acesso 19 pBKD_10001 pBKD_1 + L1_A1 (otimi¬ Este trabalho zação original) pBKD_20001 pBKD_2 + L1_A1 (otimi¬ Este trabalho zação original) 21 pBZD_20001a pBZD_2 + L2 A2 (re- Este trabalho otimizado) 22 pBKD_20511 pBKD_20001 + BGL1 Este trabalho 23 pBKD_11621 pBKD_10001 +S16 + C2 Este trabalho 24 pBKD_10621 pBKD_10001 +S06 + C2 Este trabalho pBKD_10621 20511 pBKD_10621 +20511 (ou Este trabalho seja, somente a constru¬ ção de celulase) 26 pBKD_10621_20511 pBKD_11621 +20511 (ou Este trabalho seja, somente a constru¬ ção de celulase) 27 pBZD_11631 pBZD_1 + S16 + Este trabalho C3_L2_A1 28 pBZD_20641 pBZD_20001a + C4_L3 Este trabalho 29 pBZD_11631 20641 pBZD_11631 +20641 (ou Este trabalho seja, somente a constru¬ ção de celulase) P/T* = Promotora/Terminadora
As regiões de expressão de Promotora/Terminadora (P/T), con- tendo um sítio múltiplo de clonagem, foram produzidas por sobreposição em PCR, utilizando DNA genômico purificado da cepa Y294 de S. cerevisiae e 5 SEQ ID NOS:1-3 e SEQ ID NOS:4-6 para enolase 1 (EN01) e fosfogIicerato quinase (PGK), respectivamente. A primeira rodada de PCR utilizou os inici- adores forward e overiap (da sobreposição) (SEQ ID NOS: 1-2 ou SEQ ID NOS:4-5), e a segunda utilizou o produto da primeira reação e o iniciador reverso (SEQ ID N0:3 ou SEQ ID N0:6). Os produtos dessas reações foram 10 adicionalmente amplificados, utilizando somente os iniciadores forward (SEQ ID NO:1 ou SEQ ID NO:4) e o reverso (SEQ ID NO:3 ou SEQ ID NO:6). Es- sas regiões foram clonadas com restrição em pBK e PBZ, utilizando os sítios Apal e EcoRI, codificados nos iniciadores e em pBK e pBZ, criando os pias- mídeos 7-10, Tabela 2. As construções P/T foram sequenciadas utilizando os iniciadores das SEQ ID NOS: 15 e 16. As seqüências corresponderam exatamente às seqüências esperadas, com exceção de poucas variações, das seqüências terminadoras publicadas de PGK.
As seqüências para integração nos sítios δ, no genoma do S.
cerevisiae, foram clonadas na cadeia principal da forma como segue. Uma cópia foi inserida pela digestão da SEQ ID NO:27 do plasmídeo fornecido pelo DNA 2.0 com Apal e Kpnl, e ligação da peça resultante com os plasmí- deos duplamente digeridos com Apal/Kpnl 7-10, criando os plasmídeos 11- ΙΟ 14 (Tabela 2). Uma segunda cópia foi gerada pela execução de PCR com as SEQ ID NOS:13 e 14 no plasmídeo do DNA 2.0, contendo a região δ, dige- rindo-se o fragmento resultante e os plasmídeos 11-14 (Tabela 2) com Notl e Sacll, e efetuando as ligações. O resultado foi os plasmídeos 15-18 (Tabela 2). As construções resultantes foram novamente sequenciadas com iniciado- 15 res das SEQ ID NOS: 15 e 16 para verificar a presença de duas seqüências δ.
Uma porção otimizada do gene da parede celular cwp2 e uma região Iigante flexível entre a celulase e a âncora da parede celular (cwp2) foram adicionadas em seguida à cadeia principal. Os plasmídeos 19 e 20 20 (Tabela 2) foram construídos pela digestão da SEQ ID NO:31 com BamHI e Ascl e os plasmídeos 15 e 17 (Tabela 2) e ligação dos fragmentos resultan- tes. Da mesma forma, o plasmídeo 21 (Tabela 2) foi criado pela digestão da SEQ ID NO:29 e plasmídeo 17 com BamHI e Ascl e ligação dos fragmentos apropriados.
As construções de celulase poderiam então ser adicionadas aos
vetores de expressão de cadeia principal em uma etapa única de ligação tripla. Β-glicosidase, de Saccharomycopsis fibuligera (BGLI) não requereu a ligação tripla, uma vez que já possuía sinal de secreção. Por conseguinte, foi preparada por PCR do plasmídeo 4 (Tabela 2), utilizando iniciadores com- 30 preendendo as SEQ ID NOS:11 e 12, digeridos com Pacl e BamHI e ligados com um plasmídeo 20 digerido por Pacl/BamHI, para criar o plasmídeo 22 (Tabela 2). Os plasmídeos 23 e 24, para expressão sintética de EGI, foram criados por digestão das SEQ ID NOS:32 e 34 com Mlyl e Pacl1 SEQ ID NO:28 com Mlyl e BamHI1 e o plasmídeo 19 (Tabela 2) com Pacl e BamHI1 purificando-se os fragmentos apropriados e ligação de todos juntos. O plas- mídeo 27, para expressão de CBHI1 foi criado por digestão da SEQ ID NO: 5 34 com Mlyl e Pacl, SEQ ID NO:29 com Mlyl e Ascl, o plasmídeo 16 com Pacl e Ascl e união destes fragmentos em ligação tripla. O plasmídeo 28 foi criado por ligação tripla da SEQ ID NO:32, digerida com Mlyl e Pacl, SEQ ID N0:30, digerida com Mlyl e Blpl, e o plasmídeo 21 digerido com Pacl e Blpl. As seqüências dessas novas construções foram verificadas utilizando os 10 iniciadores das SEQ ID NOS:6 e 17 para as construções de EGI e CBHI, e os iniciadores das SEQ ID NOS:3 e 18 para as construções de BGL e CBHII.
Construções para expressão simultânea de duas construções de celulase (quer EGI e BGLI ou CBHI e CBHII) foram construídas pela ligação do fragmento Notl/Spel do plasmídeo 22 com os plasmídeos 23 e 24, digeri- 15 dos com Notl/Spel, ou pela ligação do fragmento Notl/Spel do plasmídeo 28 com o plasmídeo 27 digerido com Notl/Spel. Essas reações resultaram nos plasmídeos 25, 26 e 29 que foram sequenciados para confirmar a presença de ambas as construções de celulase, utilizando iniciadores compreendendo as SEQ ID NOS:1, 3, 4 e 6.
Transformação de leveduras
Um protocolo para eletrotransformação de levedura foi desen- volvido com base em Cho1 K.M., Yoo1 Y.J., Kang1 H.S. "delta-integration o fendo/exo-glucanase and beta-glucosidase genes into the yeast chromoso- mes for direct conversion of cellulose to ethanof', Enzyme And Microbial Te- 25 chnology, 25:23-30, (1999) e Ausubel, F.M., Brent1 R., Kingston1 R., Moore1 D., Seidman, J., Smith1 J., Struhl, K. Current protocols in molecular biology. USA: John Wiley and Sons, Inc., 1994. Fragmentos lineares de DNA foram criados pela digestão do vetor desejado com Accl e Bgll (para os plasmídeos 22-26) ou Fspl (para o plasmídeo 29). Accl possui um único sítio na sequên- 30 cia δ, e cada uma das outras duas enzimas corta a cadeia principal do pBlu- escript em dois lugares. Os fragmentos foram purificados por precipitação com acetato de sódio a 3 M e etanol gelado, lavagem subsequente com 70% de etanol e ressuspensão em USB dH20 (sem DNAse e RNAse1 água esté- ril), após secagem em forno a vácuo a 70 0C.
Células de levedura para transformação foram preparadas pelo cultivo até saturação em culturas com 5 ml de YPD. Foi coletada amostra de 5 4 ml da cultura que foi lavada duas vezes com água destilada gelada e res- suspendida em 640 μ! de água destilada fria. 80 μΙ de Tris-HCI a 100 mM, EDTA a 10 mM, pH 7,5 (10 x tampão TE - filtro esterilizado) e 80 μΙ de ace- tato de lítio a 1 M1 pH 7,5 (10 x IiAc - filtro esterilizado) foram adicionados, e a suspensão celular foi incubada a 30 0C por 45 minutos sob ligeira agitação.
20 μΙ de DTT a 1 M foram adicionados, e a incubação continuou por 15 mi- nutos. As células foram centrifugadas em seguida, lavadas uma vez com água destilada fria e uma vez com tampão de eletroporação (sorbitol a 1 M, HEPES a 20 mM), e finalmente ressuspendidas em 267 μΙ de tampão de eletroporação.
Para eletroporação, 10 pg de DNA Iinearizado (medido por esti-
mativa em gel) foram combinados a 50 μΙ da suspensão celular em tubo es- téril de microcentrífuga de 1,5 ml. A mistura foi transferida em seguida para uma cubeta de eletroporação de 0,2 cm, e um pulso de 1,4 kV (200 Ω, 25 pF) foi aplicado à amostra, utilizando o aparelho Biorad Gene Pulser. 1 ml de
YPD com sorbitol a 1 M ajustado para pH 7,0 (YPDS) foi colocado na cube- ta, e as células deixadas em repouso por ~3 horas. 100-200 μΙ de suspensão celular foram espalhados em placas de YPDS agar com o antibiótico apro- priado e incubados a 30 0C por 3-4 dias até o surgimento de colônias. A Ta- bela 3 contém os genótipos das cepas criadas de leveduras.
Tabela 3. Cepas criadas de S. cerevisiae
Nome Cepa inicial Contém construções de celulase deste(s) plasmídeo(s) YA1 Y294 pBKD_11621 20511 Y_A2 Y294 pBKD_10621_20511 Y_A3 Y294 pBKD_10421_20511 Y_A4 Y294 pBKD_11721_20511 CP1_A1 CEN.PK 113-11C pBKD_11621_20511 CP1_2 CEN.PK 113-11C pBKD_10621 20511 Nome Cepa inicial Contém construções de celulase deste(s) plasmídeo(s) CP1A3 CEN.PK 113-11C pBKD_10421 20511 CP1A4 CEN.PK 113-11C pBKD_11721 20511 BJ1_A1 BJ5464 pBKD_11621_20511 BJ1_A2 BJ5464 pBKD_10621_20511 BJ1A3 BJ5464 pBKD_10421_20511 BJ1A4 BJ5464 pBKD_11721_20511 Y_A1_C1 #1 Y_A1 pBKD_11621 20511; pBZD_11631_20641 Y_A1_C1 #2 Y_A1 pBKD_11621_20511; pBZD_11631_20641 YA1C1 #3 YA1 pBKD_1621_20511; pBZD_11631_20641 Y_A1_C1 #5 Y_A1 pBKD_11621_20511; pBZD_11631_20641 YA1C1 #6 Y_A1 pBKD_11621 20511; pBZD_11631 _20641 CP1_A1_C1 #1 CP1A1 pBKD_11621_20511; pBZD_11631 20641 CP1_A1_C1 #6A CP1_A1 pBKD_11621_20511; pBZD_11631_20641 CP1_A1_C1 #11 CP1A1 pBKD_11621_20511; pBZD_11631_20641 CP1_A1_C1 #12 CP1_A1 pBKD_11621_20511; pBZD_11631_20641 CP1_A1_C1 #17 CP1_A1 pBKD_11621_20511; pBZD_11631_20641 BJ1A1C1 #7 BJ1A1 pBKD_11621_20511; pBZD_11631_20641 CP1_A1_C1 #10 BJ1A1 pBKD_11621_20511; pBZD_11631_20641 Ensaios enzimáticos
A atividade da β-glicosidase foi medida de maneira semelhante à descrita por McBride, J.E., Zietsman, J.J., Van Zyl1 W.H. e Lynd, L.R. ''Utili- zation of cellobiose by beta-glucosidase-expressing strains of Saccharomy- ces cerevisiae: characterization and evaluation of the sufficiency of expres- sion'' Enzyme And Microbial Technology, 37:93-101, (2005), exceto que o volume do ensaio foi diminuído e a reação, conduzida em placa de microtitu- lação. Resumidamente, cepas de levedura foram cultivadas até a saturação em meio YPD ou YPC com ou sem os antibióticos apropriados; a densidade 5 óptica a 600 nm (OD(6ÜO)) foi medida; e uma amostra de 0,5 ml da cultura foi centrifugada, o sobrenadante, separado e guardado e o grânulo celular foi lavado duas vezes com tampão citrato a 50 mM, pH 5,0. As reações para sobrenadantes foram constituídas de 50 μΙ de amostra,75 μΙ de tampão citra- to e 50 μΙ de substrato p-nitrofenil-p-glicopiranosideo (PNPG) a 20 mM. As 10 reações com células lavadas consistiu em 25 μΙ de células, 75 μΙ de tampão citrato e 50 μΙ de substrato PNPG. Se a atividade estivesse muito alta para o intervalo da curva padrão, uma concentração celular mais baixa era utilizada e o ensaio, refeito. A curva padrão consistiu em uma série de diluição em duas vezes de padrões de nitrofenol (PNP), iniciando em 500 nM e finalizan- 15 do em 7,8 nM, tendo sido incluído um tampão branco. Depois que diluições apropriadas de sobrenadante ou de células foram preparadas, a placa de microtitulação foi incubada a 37 0C por 10 minutos, juntamente com o subs- trato da reação. A reação foi conduzida, adicionando-se o substrato, incu- bando por 30 minutos e interrompendo a reação com 150 μΙ de Na2CCb a 2 20 M. A placa foi centrifugada, em seguida, a 2500 rpm por 5 minutos, e 150 μΙ de sobrenadante foram transferidos para uma outra placa. Foi efetuada a leitura da absorvência a 405 nm de cada poço.
A atividade da endoglicanase foi detectada qualitativamente pela observação de zonas claras em placas com meio sintético completo (como 25 acima, porém incluindo 20 g/l de glicose) com 0,1% de carboximetil celulose (CMS), corado com vermelho do Congo (Béguin P., ''Detection of Cellulase Activity in Polyacrylamide Gels using Congo Red-Stained Agar Réplicas" Analytical Biochemistry, 131:333-336 (1983)). As células foram cultivadas por 2-3 dias sobre as placas e lavadas e retiradas da placa com tampão Tris- 30 HCI a 1 M, pH 7,5. As placas foram em seguida coradas por 10 minutos com solução de vermelho do Congo as 0,1%, e o corante extra foi lavado e reti- rado subsequentemente com NaCI a 1 M. Verificação de transformantes
Para transformantes de EGI e BGLI, as atividades foram verifi- cadas por ensaio enzimático conforme especificado acima. Para cepas nas quais todas as quatro celulases foram transformadas, PCR com iniciadores com as SEQ ID NOS: 19-26 foi utilizada para verificar a presença de DNA genômico de cada um genes sendo expressados.
Após confirmação genética da presença dos genes, as cepas foram cultivadas em meio enriquecido (YPD) até a saturação e inoculadas em 10 ml de meio líquido em um tubo lacrado do tipo Hungate com ar at- 10 mosférico. As contagens de células foram realizadas em amostras coletadas ao longo do tempo utilizando um hemocitômetro. A densidade celular foi me- dida por espectrofotometria após digestão das amostras com um preparado comercial de celulase (Spezyme CP), adicionado com tampão e azida sódica para inibir o crescimento subsequente das culturas. O procedimento da di- 15 gestão foi verificado pelo traçado, em gráfico, do número de células/ml con- tra a OD(600). Foi obtido um valor de 3*107 células/ml = 1 OD(600)
Os meios de crescimento com substratos de celulose, como a única fonte de carbono, foram produzidos utilizando os componentes, exclu- indo a glicose, de meio sintético completo para levedura, incluindo nitrogênio 20 básico de levedura sem aminoácidos - 1,7 g/l, sulfato de amônia - 5g/l, e complementado com aminoácidos. Dez mililitros do meio PASC (preparado a 2% de peso seco) ou meio BMCC (preparado a 1% de peso seco) foram co- locados em tubos lacrados do tipo Hungate para experimentos de cresci- mento.
Exemplo 2
Cepas de Saccharomvces cerevisiae com enzimas celulases presas, capa- zes de crescer em celulose expandida com ácido fosfórico (PASC)
Endoglicanase I (EGI), celobio-hidrolase I (CHBI) e celobio- hidrolase Il (CBHII) de Trichoderma reesei, juntamente com β-glicosidase I (BGLI) de Saccharomycopsis fibuligera, foram expressas como proteínas presas à superfície celular de Saccharomyces cerevisiae por fusão com a porção C-terminal de cwp2 de S. cerevisiae, conforme descrito acima. Para experimentos de crescimento em meio contendo celulose expandida com ácido fosfórico (PASC), PASC foi adicionado como a única fonte de carbono ao meio sintético completo para levedura em concentração de 20 g/l. Celulose expandida com ácido fosfórico (PASC) foi preparada con- 5 forme em Zhang, Y.H., Cui, J., Lynd, L.R., Kuang1 L.S. "A transition from eel- Iulose swelling to cellulose dissolution by o-phosphoric acid: evidence from enzymatic hydrolisis and supramolecular structure" Biomacromolecules, 7, 644-648 (2006), com ligeira modificação. Avicel PH105 (10 g) foi umedecido com 100 ml de água destilada em um frasco de 4 litros. Oitocentos mililitros 10 de ácido fosfórico a 86,2% foram adicionados lentamente ao frasco com adi- ção inicial de 300 ml, seguida por mistura e adições subsequentes de alíquo- tas de 50 ml. A solução transparente foi mantida a 4 0C por 1 hora para per- mitir solubilização completa da celulose, em cujo ponto não há mais caroços na mistura da reação. Em seguida, 2 litros de água destilada gelada foram 15 adicionados em alíquotas de 500 ml com mistura entre as adições. Alíquotas de trezentos mililitros da mistura foram centrifugadas a 5.000 rpm por 20 mi- nutos a 2 0C, e o sobrenadante removido. A adição de 300 ml de água desti- lada fria e centrifugação subsequente foram repetidas quatro vezes. 4,2 ml de carbonato de sódio a 2 M e 300 ml de água foram adicionados à celulose, 20 seguido por duas ou três lavagens com água destilada até que o pH final estivesse ~6. As amostras foram secadas até peso constante em um forno a vácuo a 70 0C para medição do peso seco.
Foram coletadas amostras por seringa de experimentos de cres- cimento conduzidos em tubos lacrados do tipo Hungate, conforme descritos 25 acima, e as células foram contadas. Adicionalmente, as amostras foram di- geridas a 37 0C com um preparado comercial de celulase e azida sódica até que todo o substrato tivesse sido digerido. Em seguida, foi obtida a absor- vência a 60 nm para medir a densidade celular. Medições de OD(600) pós- digestão correlacionaram-se conforme esperado com as contagens celulares 30 efetuadas por hemocitometria.
A Figura 2 apresenta os resultados de OD(600) para crescimen- to de cepas naturais (não-transformadas) e recombinantes de Saeeharomy- ces cerevisiae em PASC. Cepas criadas em antecedentes de Y294 e CEN.PK que expressam todas as quatro enzimas celulases exibiram aumen- tos lentos, porém significativos em C)D(600) durante o experimento de cres- cimento. Controles não-transformados de ambas as cepas não exibiram au- 5 mento em OD(600) durante 800 horas do experimento de crescimento. Exemplo 3
Cepas de Saccharomvces cerivisiae com enzimas celulases presas capazes de crescerem utilizando celulose microcristalina bacteriana (BMCC).
Endoglicanase I (EGI), celobio-hidrolase I (CBHI) e celobio- hidrolase Il (CBHII) de Trichoderma reesei, juntamente com β-glicosidase I (BGLI) de Saccharomycopsis fibuligera, foram expressas sob a forma de proteínas presas à superfície celular de Saccharomyees cerevisiae por fusão com a porção C-terminal de cwp2 de S. cerevisiae conforme descrita acima.
Para quatro experimentos de crescimento em meio contendo celulose microcristalina bacteriana (BMCC), foi adicionada BMCC como a única fonte de carbono ao meio sintético completo para levedura em concen- tração 10 g/l. A celulose microcristalina bacteriana (BMCC) foi preparada em maneira semelhante à descrita em Jung H., Wilson, D.B., Walker, L.P. ''Bin- ding and Reversibility of Thermobifida fusca Cel5A, Cel6B, and Cel48A and their respective catalytic domains to bacterial microcrystalline cellulose" Bio- technology and Bioengineering, 84, 151-159, (2003), exceto que azida sódi- ca não foi adicionada durante a reconstituição e a lavagem foi conduzida cinco vezes com água destilada acompanhada por centrifugação. Quatro amostras idênticas de 1 ml foram congeladas e, em seguida, Iiofilizadas para determinação do peso seco da suspensão final de BMCC.
As Figuras 3 e 4 apresentam resultados de contagem celular para crescimento de cepas de levedura naturais (não-transformadas) e re- combinantes de Saccharomyees cerevisiae, utilizando BMCC. Cepas criadas em antecedentes de Y294 e CEN.PK que expressam todas as quatro enzi- 30 mas celulases exibiram aumento lento, porém significativo, em contagens de células/ml durante o transcurso do experimento de crescimento. Y294 ex- pressando somente BGLI e EGI não exibiram crescimento em contagens de células/ml no transcurso do experimento. Os controles não-transformados de ambas as cepas não exibiram aumento em contagens de células no trans- curso de aproximadamente setecentas horas do experimento de crescimen- to. Estes resultados demonstram a necessidade de utilizar todas as quatro 5 celulases para ser obtido crescimento em BMCC quando as celulases são presas.
Exemplo 4
Cepas recombinantes de levedura com propriedades intensificadas de liga- ção à celulose
Endoglicanase I (EGI) de Trichoderma reesei e β-glicosidase I
(BGLI) de Saccharomycopsis fibuligera foram expressas sob a forma de pro- teínas presas à superfície celular de Saccharomyees cerevisiae por fusão com a porção C-terminal de cwp2 de S. cerevisiae, conforme descrita acima.
A fim de efetuar a triagem das cepas transformadas quanto às melhores em função de ligação à celulose, as cepas que expressavam en- zimas presas foram cultivadas até a saturação em meio enriquecido de 5 ml (~10Λ9 células totais). Quinze, dez ou 0,25 mg de celulose ELCHEMA P100 foram lavados 5-8 vezes com água destilada e autoclavados. A celulose foi adicionada em seguida a cada preparado enzimático, tendo sido permitida a acomodação no fundo do tubo. O sobrenadante contendo as células foi re- movido em seguida, e o grânulo de celulose foi ressuspenso em tampão es- téril Tris-HCI a 50 mM, pH 7,5. Foi permitido que o pélete se acomodasse novamente, e o tampão foi removido. Esse processo foi repetido quatro ve- zes mais, antes que o meio enriquecido fosse adicionado de novo ao tubo contendo o grânulo de celulose, e foi permitido que as células crescessem novamente até a saturação. O procedimento de seleção foi conduzido várias vezes tanto para células transformadas que expressam as enzimas celula- ses como para as não-transformadas.
Um ensaio de ligação à celulose foi utilizado para examinar as cepas originais e as selecionadas. O ensaio foi adaptado de lto, J., Fujita, Y., Ueda, M., Fukuda, H., Kondo, A. "Improvement of cellulose-degrading ability of a yeast strain displaying Triehoderma reesei endoglucanase Il by recom- bination of cellulose-binding domains" Biotechnology Progress, 20:688-691 (2004) e Nam, J., Fujita, Y., Arai, T., Kondo, A., Morikawa1 Y., Okada1 H., Ueda1 M., Tanka, A. ''Construction of engineered yeast with the ability of bin- ding to eellulose" Journal of Molecular Catalysis B: Enzymatic 17:197-202, (2002).
Células de cultura saturada, cultivadas em meio enriquecido, foram lavadas duas vezes em tampão citrato, pH 5,0. Foram resuspendidas em tampão citrato em OD(600) = 2,0, ou ~6*10Λ7 células/ml, em volume de 2,75 ml e deixadas em tubo de teste em posição vertical para se acomoda- 10 rem por dez minutos. Uma amostra de 0,25 ml foi coletada para medir a OD(600) inicial da suspensão. Meio mililitro de uma solução a 10% de celu- lose (Avicel PH101) foi adicionado a cada tubo. Os tubos foram, em seguida, misturados em temperatura ambiente e deixados em posição vertical por dez minutos (lto e Nam utilizaram incubações a 4 0C por 24 horas antes que os 15 tubos fossem deixados em posição vertical). Uma segunda amostra de 0,25 ml foi coletada, e a OD(600), medida.
Os resultados de ligação à celulose das duas cepas, as quais foram submetidas seis vezes à lavagem e procedimento de novo crescimen- to com uma variedade de concentrações iniciais de ELCHEMA, estão resu- midos na Figura 5. Cabe salientar especialmente que cepas com reduções altas de OD(600) pela celulose foram obtidas para cepas com celulases ex- pressadas, quando selecionadas com ELCHELMA a 0,2 ou 0,05%, enquanto cepas não-transformadas aumentaram sua capacidade de ligação em grau menor. Em relação às cepas transformadas que expressavam as celulases, as reduções de OD(600) aumentaram 5,5; 12,7 e 11,3 vezes para as con- centrações de ELCHEMA a 1%, 0,2% e 0,05%, utilizadas durante a seleção, respectivamente. Por comparação, o controle não-transformado aumentou sua capacidade de redução de OD(6ÜO) somente em 1,6; 1,7 e 1,3 vez, sob as mesmas condições. Estes resultados demonstram a capacidade aumen- tada de ligação à celulose das populações transformadas.
Para comparação, as reduções mais altas de OD(600), relatadas para Avicel, foram: 24,2% em Nam et al. E ~23% em Ito et ai (incubação de 24 horas a 4 0C). Fukuda, T., Ishikawa, T., Ogawa, M., Shiraga, S., Kato1 M., Suye1 S., Ueda, M. "Enhancement of Cellulase Activity by Clones Seleeted from the Combinatorial Library of the Cellulose-Binding Domain by Cell Sur- faee Engineering", Bioteehnology Progress 22:933-938 (2006) não relatam o 5 percentual de redução de OD(600) para suas cepas, porém indicam que su- as técnicas aumentaram a capacidade de ligação da cepas em 1,5 vez, con- forme comparado à melhora de 12,7 vezes, observada com as presentes cepas.
Exemplo 5
Cepas de Saccharomyees cerevisiae com enzimas celulases presas capa- zes de crescerem em cultura semicontínua com AVICEL PH105
Endoglicanase I (EGI), celobio-hidrolase I (CBHI) e celobio- hidrolase Il (CBHII) de Trichoderma reesei, juntamente com β-glicosidase I (BGLI) de Saccharomycopsis fibuligera, foram expressas sob a forma de proteínas presas à superfície celular de Saccharomyees cerevisiae por fusão com a porção C-terminal de cwp2 de S. cerevisiae conforme descrita acima.
Culturas semicontínuas da cepa CEN.PK 113-11C de Saccha- romyces cerevisiae (transformada e não-transforma com BGLI1 EGI1 CBHI e CBHII) foram conduzidas em bioreatores Applikon de 3 litros (volume total). 20 Avicel (-20 g/l; PH105 da FMC Biopolymer1 Filadélfia, PA) foi adicionado ao meio sintético completo para levedura (1,7 g/l de nitrogênio básico de leve- dura sem aminoácidos, 5 g/l de sulfato de amônio, complementado com a- minoácidos) sem fonte de carbono. O meio contendo Avicel foi agitado em bombona de 5 litros e bombeado intermitentemente (a cada 80 minutos) em 25 dois sistemas reatores Applikon, montados lado a lado, com volumes de tra- balho de 1,8 litro. Os reatores foram agitados a 400 rpm, e o meio foi bom- beado para fora após alimentação, seguido por espera de 2 minutos. O con- trole da bomba, controle do pH e controle da temperatura foram conduzidos, todos, utilizando o sistema de controle DeItaV da Emerson Process Mana- 30 gement, St. Louis, Missouri. As condições nos reatores foram mantidas em pH 5,0, utilizando HCI a 1 N e KOH a 2 N, agitação a 400 rpm, taxa de aera- ção de 2 WM e temperatura de 30°C. A taxa de diluição foi mantida em ~0,01 hA-1, a qual foi verificada por medição do volume do meio acumulado em bombona de resíduo. O peso seco total de um sistema contendo somen- te água e avicel foi monitorado para verificar se o avicel estava sendo ali- mentado uniformemente por todo o tempo. As culturas de inoculação foram 5 pré-cultivadas em YPD (10 g/l de extrato de levedura, 20 g/l de peptona, 20 g/l de glicose) e lavadas uma vez com tampão Tris-HCI (pH 7,5) antes de serem inoculadas. As células foram quantificadas por contagens diretas e a diluição em placas revestidas com YPD, conforme descrito acima.
A Figura 6 apresenta os resultados dos dois reatores montados 10 lado a lado. A cepa não-transformada exibiu contagens celulares e conta- gens de células viáveis ao longo do tempo decrescentes, conforme esperado na ausência de replicação. Linhas tracejadas mostram as curvas calculadas de enfraquecimento (wash out) para células não replicantes, na taxa de dilu- ição medida. A correlação observada entre os dados e as curvas calculadas 15 de wash-out confirmam que a cepa CEN.PK não-transformada não conse- gue replicar no meio testado.
Por outro lado, a cepa transformada de CEN.PK, expressando todas as quatro enzimas celulases, cresceu e manteve sua concentração celular pelo tempo em que durou o experimento da cultura contínua (-1000 20 horas). De fato, a cepa transformada exibiu aumento modesto em concen- tração celular no transcurso do experimento, conforme medida por conta- gens de células e contagens de células viáveis.
Depósito de cepas recombinantes de levedura
As cepas Y294 e CEN.PK de leveduras, contendo os genes de
celulase BGLI, EGI, CBHI e CBHII, foram depositadas junto à coleção Ame- rican Type Culture Collection, Manassas, VA 20110-2209. Os depósitos fo- ram efetuados em 21 de novembro de 2007 e receberam os Números de Designação de Depósito de Patente PTA - XXXX e PTA-XXXX, respectiva- mente. Estes depósitos foram efetuados de acordo com os requisitos do Tra- 30 tado de Budapeste que estabelece que a duração dos depósitos deva ser por trinta (30) anos a partir da data de depósito, ou por cinco (5) anos após o último requerimento para o depósito, no depositário, ou pela vida executável de uma Patente Norte-Americana que vence a partir de seu pedido, o perío- do mais longo. Os depósitos serão supridos novamente caso um ou mais se tornem inviáveis no depositário.
A descrição das concretizações específicas revela conceitos ge- 5 rais que podem ser modificados e/ou adaptados por outrem, para várias a- plicações ou usos que não se afastam dos conceitos gerais. Por conseguin- te, essas adaptações e modificações devem e se destinam a serem incluí- das no significado e variação de equivalentes das concretizações expostas. Deve se entender que a fraseologia ou terminologia empregada neste pedi- 10 do de patente tem como propósito descrever e não limitar.
Todas as referências mencionadas neste pedido de patente são aqui incorporadas na mesma medida conforme se integralmente repetidas no mesmo. LISTAGEM DE SEQÜÊNCIA <110> The Trustees of Dartmouth College McBride, John E.E. Deleault, Kirsten M. Lynd, Lee R. Pronk, Jack T. <120> CEPAS RECOMBINANTES DE LEVEDURAS QUE EXI PRESAS <130> 474292 <150> 60/867,018 <151> 2006-11-22 <160> 47 <170> PatentIn versão 3.2 <210> 1 <211> 43 <212> DNA <213> Seqüência artificial <220> <223> Iniciador forward da Enolase I (ENOl) <220> <221> exon <222> (1) .· (43) <4 00> 1 tat atg ggc cca cta gtc ttc tag gcg ggt tat cta ctg Tyr Met Gly Pro Leu Val Phe Ala Gly Tyr Leu Leu 1 5 10 <210> 2 <211> 72 <212> DNA <213> Seqüência artificial <220> <223> Iniciador overlap da Enolase I (ENOl) 43 <220>
<221> exon
<222> (1) .. (72)
<4 00> 2
gga cta gaa ggc tta ate aaa age ggc gcg ccg gat cct taa tta agt 48
Gly Leu Glu Gly Leu He Lys Ser Gly Ala Pro Asp Pro Leu Ser
1 5 10 15
gtg ttg ata age agt tgc ttg gtt 72
Val Leu He Ser Ser Cys Leu Val 20 <210> 3
<211> 42
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador reverso da Enolase I (ENOl)
<220>
<221> exon
<222> (1) .. (42)
<400> 3
gct acg aat tcg cgg ccg ccg tcg aac aac gtt cta tta gga 42
Ala Thr Asn Ser Arg Pro Pro Ser Asn Asn Val Leu Leu Gly 15 10 <210> 4
<211> 33
<212> DNA
<213> Seqüência artificial <220>
<223> Iniciador forward da fosfoglicerato quinase (PGK)
<220>
<221> exon
<222> (1) .. (33) <4 00> 4 tat atg ggc cct ccc tcc ttc ttg aat tga tgt Tyr Met Gly Pro Pro Ser Phe Leu Asn Cys I 5 10 <210> 5 <211> 79 <212> DNA <213> Seqüência artificial <220> <223> Iniciador overlap da fosfoglicerato quinase (PGK) <220> <221> exon <222> (1)··(79) <400> 5 gat cta tcg att tca att caa ttc aat ggc gcg ccg gat cct taa tta Asp Leu Ser Ile Ser Ile Gln Phe Asn Gly Ala Pro Asp Pro Leu 1 5 10 15 atg taa aaa gta gat aat tac ttc ctt gat g Met Lys Val Asp Asn Tyr Phe Leu Asp 20 <210> 6 <211> 31 <212> DNA <213> Seqüência artificial <220> <223> Iniciador reverso da fosfoglicerato quinase (PGK) <220> <221> exon <222> (1)..(31) <4 00> 6 ctt agg aat tct ttc gaa acg cag aat ttt C Leu Arg Asn Ser Phe Glu Thr Gln Asn Phe 33
48
79
31 10
<210> 7
<211> 30
<212> DNA
<213> Seqüência artificial
<220>
<223> Jniciador forward de canamicina (kanMX)
<220>
<221> exon
<222> (1)..(30)
<4 00> 7
gat ccg aat tcg ttt age ttg cct cgt ccc 30
Asp Pro Asn Ser Phe Ser Leu Pro Arg Pro 15 10
<210> 8
<211> 30
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador reverso de canamicina (kanMX)
<220>
<221> exon
<222> (1)..(30)
<400> 8
cag tcg act agt ttt cga cac tgg atg gcg 30
Gln Ser Thr Ser Phe Arg His Trp Met Ala 15 10
<210> 9
<211> 33
<212> DNA
<213> Seqüência artificial
<220> <223> Iniciador forward de Zeocina (Zeo)
<220>
<221> exon
<222> (1)..(33)
<400> 9
gcg cta gaa ttc ccc aca cac cat age ttc aaa 33
Ala Leu Glu Phe Pro Thr His His Ser Phe Lys 15 10
<210> 10 <211> 41
<212> DNA
<213> Seqüência artificial <220>
<223> Iniciador reverso de Zeocina (Zeo)
<22 0>
<221> exon
<222> (1)..(41)
<4 00> 10
ccg cat act agt aat tea gct tgc aaa tta aag cct tcg ag 41
Pro His Thr Ser Asn Ser Ala Cys Lys Leu Lys Pro Ser 15 10
<210> 11 <211> 41
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador forward de Beta-glicosidase I (BGLI)
<220>
<221> exon
<222> (1) . . (41)
<400> 11
gcc gcc tta att aaa aac aaa atg gtc tcc ttc acc tcc ct 41 Ala Ala Leu Ile Lys Asn Lys Met Val Ser Phe Thr Ser 15 10
<210> 12 <211> 38
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador reverso de Beta-glicosidase I (BGLI)
<220>
<221> exon
<222> (1)..(38)
<400> 12
cgg ttg gat cca ata gta aac agg aca gat gtc ttg at 38
Arg Leu Asp Pro Ile Val Asn Arg Thr Asp Val Leu
1 5 10
<210> 13
<211> 37
<212> DNA
<213> Seqüência artificial <220>
<223> Iniciador forward de Delta2 <220>
<221> exon
<222> (1)..(37)
<4 00> 13
agt cgc ggc cgc tgt tgg aat aaa aat cca cta tcg t 37
Ser Arg Gly Arg Cys Trp Asn Lys Asn Pro Leu Ser
10 <210> 14
<211> 40
<212> DNA
<213> Seqüência artificial <220> <223> Iniciador reverso de Delta2 <220> <221> exon <222> (I)..(40) <400> 14 gcg ccc gcg gtg aga tat atg tgg gta att Ala Pro Ala Val Arg Tyr Met Trp Val Ile 1 5 10 <210> 15 <211> 18 <212> DNA <213> Seqüência artificial <220> <223> Iniciador forward de M13 <220> <221> exon <222> (1)··(18) <400> 15 tcc cag tca cga cgt cgt Ser Gln Ser Arg Arg Arg 1 5 <210> 16 <211> 19 <212> DNA <213> Seqüência artificial <220> <223> Iniciador reverso de M13 <220> <221> exon <222> (1) ■· (19) <400> 16 40
Leu
18 10
15
20
25
30
gga aac age tat gac cat g Gly Asn Ser Tyr Asp His I 5 <210> 17 <211> 27 <212> DNA <213> Seqüência artificial <220> <223> Iniciador forward de seq <220> <221> exon <222> (1)..(27) <400> 17 tct ttt tct ctt ttt tac aga tca tca Ser Phe Ser Leu Phe Tyr Arg Ser Ser 1 5 <210> 18 <211> 27 <212> DNA <213> Seqüência artificial <220> <223> Iniciador forward de seq <22 0> <221> exon <222> (1)..(27) <400> 18 tcc ttc tag cta ttt ttc ata aaa aac Ser Phe Leu Phe Phe Ile Lys Asn 1 5 <210> 19 <211> 20 <212> DNA 19
27
27 <213> Seqüência artificial <220>
<223> Iniciador forward de detecção de Endoglicase I (EGI)
<220>
<221> exon
<222> (1)..(20)
<400> 19
cgc tag tgg tgt tac gac ga 20
Arg Trp Cys Tyr Asp
1 5
<210> 20
<211> 20
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador forward de detecção de Endoglicanase I (EGI)
<220>
<221> exon
<222> (1) . . (20)
<400> 20
ctc caa gtc tgc act gga ca 20
Leu Gln Val Cys Thr Gly
1 5
<210> 21
<211> 20
<212> DNA
<213> Seqüência artificial <220>
<223> Iniciador forward de detecção de Beta-glicosidase I (BGLI)
<220>
<221> exon
<222> (1) .. (20) 10
15
20
25
30
<4 00> 21 gag ccc gca tta tta tcc aa Glu Pro Ala Leu Leu Ser I 5 <210> 22 <211> 20 <212> DNA <213> Seqüência artificial <220> <223> Iniciador reverso de <220> <221> exon <222> (1)..(20) <400> 22 caa agt cag cga ate gaa ca Gln Ser Gln Arg Ile Glu 1 5 <210> 23 <211> 20 <212> DNA <213> Seqüência artificial <22 0> <22 3> Iniciador forward de <220> <221> exon <222> (1).·(20) <400> 23 aga cgg ttg tga ctg gaa cc Arg Arg Leu Leu Glu 1 5 <210> 24 <211> 20 20
20
20 <212> DNA
<213> Seqüência artificial <220>
<223> Iniciador reverso de detecção Celobio-hidrolase I (CBHI)
<220>
<221> exon
<222> (1) . . (20)
<400> 24
caa ctt gag ctg gaa cac ca 20
Gln Leu Glu Leu Glu His 1 5
<210> 25
<211> 20
<212> DNA
<213> Seqüência artificial <220>
<223> Iniciador forward de detecção Celobio-hidrolase II (CBHII) <220>
<221> exon
<222> (1) . . (20)
<4 00> 25
cag aga ctg tgc tgc ttt gg 20
Gln Arg Leu Cys Cys Phe 1 5
<210> 26
<211> 20
<212> DNA
<213> Seqüência artificial <220>
<223> Iniciador reverso de detecção Celobio-hidrolase II (CBHII)
<220>
<221> exon <222> (I)..(20)
<400> 26
gga tct acc ttg gtc ggt ga
Gly Ser Thr Leu Val Gly
1 5
<210> 27
<211> 358
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<221> exon
<222> (1)..(358)
< 4 0 0 > 27
agt cgg tac ctg ttg gaa taa aaa tcc act ate gtc tat caa cta ata Ser Arg Tyr Leu Leu Glu Lys Ser Thr Ile Val Tyr Gln Leu Ile 10 15
gtt ata tta tca ata tat tat cat ata cgg tgt taa gat gat gac ata Val Ile Leu Ser Ile Tyr Tyr His Ile Arg Cys Asp Asp Asp Ile
25 30
agt tat gag aag ctg tca tcg atg tta gag gaa gct gaa acg caa gga Ser Tyr Glu Lys Leu Ser Ser Met Leu Glu Glu Ala Glu Thr Gln Gly 40 45
ttg ata atg taa tag gat caa tga ata taa aca tat aaa acg gaa tga Leu Ile Met Asp Gln Ile Thr Tyr Lys Thr Glu
50 55
gga ata ate gta ata tta gta tgt aga aat ata gat tcc att ttg agg Gly Ile Ile Val Ile Leu Val Cys Arg Asn Ile Asp Ser Ile Leu Arg 60 65 70
att cct ata tcc tcg agg aga act tct agt ata ttc tgt ata cct aat Ile Pro Ile Ser Ser Arg Arg Thr Ser Ser Ile Phe Cys Ile Pro Asn 75 80 85
att ata gcc ttt ate aac aat gga ate cca aca att ate taa tta ccc
48
96
144
192
240
288
336 Ile Ile Ala Phe Ile Asn Asn Gly Ile Pro Thr Ile Ile Leu Pro
90 95 100
aca tat atc tca ggg ccc gcg c Thr Tyr Ile Ser Gly Pro Ala
105 110
<210> 28 <211> 1354
<212> DNA
<213> Trichoderma reesei
<220>
<221> exon
<222> (1) .. (1354)
<400> 28
gag tcc cgg gca aca acc agg aac atc aac acc aga agt cca tcc aaa Glu Ser Arg Ala Thr Thr Arg Asn He Asn Thr Arg Ser Pro Ser Lys 10 15
gtt aac aac cta taa atg tac taa gag tgg agg gtg tgt age gca gga Val Asn Asn Leu Met Tyr Glu Trp Arg Val Cys Ser Ala Gly
25 30
cac aag tgt ggt ctt aga ctg gaa tta tcg ttg gat gca tga tgc caa His Lys Cys Gly Leu Arg Leu Glu Leu Ser Leu Asp Ala Cys Gln
40 45
tta taa ttc ctg tac tgt taa cgg cgg tgt taa cac tac gtt atg ccc Leu Phe Leu Tyr Cys Arg Arg Cys His Tyr Val Met Pro
50 55
cga tga age gac ttg tgg taa gaa ttg ttt tat tga agg ggt tga cta
Arg Ser Asp Leu Trp Glu Leu Phe Tyr Arg Gly Leu
60 65 70
cgc cgc tag tgg tgt tac gac gag tgg gtc atc ctt gac gat gaa tca
Arg Arg Trp Cys Tyr Asp Glu Trp Val He Leu Asp Asp Glu Ser
75 80 85
ata cat gcc ttc ttc tag tgg tgg gta ttc ctc tgt gtc tcc aag gct
358
48
96
144
192
240
288
336 Ile His Ala Phe Phe Trp Trp Val Phe Leu Cys Val Ser Lys Ala
90 95 100
gta ttt att gga ttc cga tgg gga ata tgt tat gtt aaa att aaa tgg
Val Phe Ile Gly Phe Arg Trp Gly Ile Cys Tyr Val Lys Ile Lys Trp
105 110 115
gca aga act gag ttt tga tgt gga tct atc tgc att acc ttg tgg aga
Ala Arg Thr Glu Phe Cys Gly Ser Ile Cys Ile Thr Leu Trp Arg
120 125 130
aaa tgg tag tct tta ttt atc aca aat gga cga aaa cgg cgg age caa
Lys Trp Ser Leu Phe Ile Thr Asn Gly Arg Lys Arg Arg Ser Gln
135 140 145
tca gta caa tac age tgg tgc taa tta tgg ttc agg cta ttg tga tgc
Ser Val Gln Tyr Ser Trp Cys Leu Trp Phe Arg Leu Leu Cys
150 155 160
tca atg tcc agt gca gac ttg gag gaa tgg cac ctt aaa cac atc aca
Ser Met Ser Ser Ala Asp Leu Glu Glu Trp His Leu Lys His Ile Thr 165 170 175
tca agg att ttg ctg taa cga aat gga cat att aga agg taa ttc aag Ser Arg Ile Leu Leu Arg Asn Gly His Ile Arg Arg Phe Lys
180 185 190
age taa tgc act aac tcc gca ctc ttg tac tgc gac cgc atg tga ttc
Ser Cys Thr Asn Ser Ala Leu Leu Tyr Cys Asp Arg Met Phe
195 200
tgc cgg ttg tgg ttt caa ccc tta tgg ttc tgg tta taa gag tta cta
Cys Arg Leu Trp Phe Gln Pro Leu Trp Phe Trp Leu Glu Leu Leu 205 210 215
cgg tcc ggg aga cac cgt gga tac gtc aaa gac ctt cac tat aat cac
Arg Ser Gly Arg His Arg Gly Tyr Val Lys Asp Leu His Tyr Asn His 220 225 230 235
tca gtt taa cac aga taa cgg atc tcc gag tgg taa ttt ggt gag tat
Ser Val His Arg Arg Ile Ser Glu Trp Phe Gly Glu Tyr
240 245
384
432
480
528
576
624
672
720
768
816 tac tag gaa ata tca Tyr Glu Ile Ser
250
agg cgg tga cac tat Arg Arg His Tyr 265
act tgc tac aat ggg Thr Cys Tyr Asn Gly 280
ttc tat ttg gaa tga Phe Tyr Leu Glu 295
taa tgc agg ccc ttg Cys Arg Pro Leu
15
age taa taa ccc aaa Ser Pro Lys
320
cga tat agg tag cac Arg Tyr Arg His
tag ctc cac gac att Leu His Asp Ile
atc acc atc ttg tac
Ile Thr Ile Leu Tyr 360
tta cag cgg ttg caa
Leu Gln Arg Leu Gln
380
taa tga cta tta ctc Leu Leu Leu
gca gaa cgg tgt tga tat tcc Ala Glu Arg Cys Tyr Ser
255
atc tag ctg tcc ttc cgc cag Ile Leu Ser Phe Arg Gln
270
taa ggc att gtc ctc agg tat Gly Ile Val Leu Arg Tyr 285
taa ttc aca ata cat gaa ttg Phe Thr Ile His Glu Leu 300
ctc ctc tac aga agg taa ccc Leu Leu Tyr Arg Arg Pro
310 315
tac tca tgt tgt ctt tag taa Tyr Ser Cys Cys Leu 325
tac gaa cag tac cgc acc tcc Tyr Glu Gln Tyr Arg Thr Ser 335 340
ttc cac tac tag aag gtc cag Phe His Tyr Lys Val Gln
350 355
tca aac cca ttg ggg aca gtg Ser Asn Pro Leu Gly Thr Val 365 370
aac ttg cac atc tgg tac tac Asn Leu His Ile Trp Tyr Tyr 385
aca atg ttt acc agg tgc tgc Thr Met Phe Thr Arg Cys Cys
gtc cgc gca gcc 864
Val Arg Ala Ala 260
tgc cta tgg cgg 912
Cys Leu Trp Arg 275
ggt cct agt att 960
Gly Pro Ser Ile 290
gct gga ttc tgg 1008
Ala Gly Phe Trp 305
aag caa tat act 1056
Lys Gln Tyr Thr
tat tag atg ggg 1104
Tyr Met Gly
330
tcc tcc acc tgc 1152
Ser Ser Thr Cys 345
cac tac cag ctc 1200
His Tyr Gln Leu
tgg tgg tat agg 1248
Trp Trp Tyr Arg 375
atg cca ata cag 1296
Met Pro Ile Gln 390
gtc aag ttc aag 1344
Val Lys Phe Lys 10
15
20
25
30
tag tgg Trp <210> <211> <212> <213> <220> <221> <222>
<4 00> gag tcc Glu Ser 1
gtt aac Val Asn
cac aag His Lys
tta taa Leu
cga tga Arg
cgc cgc Arg Arg
ata cat Ile His
395
atc c Ile
29
2520
DNA
Trichoderma reesei
400
405
(I)..(2520)
29
cgg gca aca acc agg aac atc aac Arg Ala Thr Thr Arg Asn Ile Asn 5 10
aac cta taa atg tac taa gag tgg Asn Leu Met Tyr Glu Trp
20
tgt ggt ctt aga ctg gaa tta tcg Cys Gly Leu Arg Leu Glu Leu Ser 35 40
ttc ctg tac tgt taa cgg cgg tgt Phe Leu Tyr Cys Arg Arg Cys 50
age gac ttg tgg taa gaa ttg ttt Ser Asp Leu Trp Glu Leu Phe 60 65
tag tgg tgt tac gac gag tgg gtc Trp Cys Tyr Asp Glu Trp Val 75
gcc ttc ttc tag tgg tgg gta ttc Ala Phe Phe Trp Trp Val Phe
90
acc aga agt Thr Arg Ser
agg gtg tgt Arg Val Cys 25
ttg gat gca Leu Asp Ala
taa cac tac His Tyr 55
tat tga agg Tyr Arg
atc ctt gac Ile Leu Asp
80
ctc tgt gtc Leu Cys Val 95
cca tcc aaa Pro Ser Lys 15
age gca gga Ser Ala Gly 30
tga tgc caa Cys Gln 45
gtt atg ccc Val Met Pro
ggt tga cta Gly Leu
70
gat gaa tca Asp Glu Ser 85
tcc aag gct Ser Lys Ala 100
1354
48
96
144
192
240
288
336 gta ttt att gga ttc cga tgg gga ata tgt tat gtt aaa att aaa tgg Val Phe Ile Gly Phe Arg Trp Gly Ile Cys Tyr Val Lys Ile Lys Trp 105 110 115
gca aga act gag ttt tga tgt gga tct atc tgc att acc ttg tgg aga Ala Arg Thr Glu Phe Cys Gly Ser Ile Cys Ile Thr Leu Trp Arg
120 125 130
aaa tgg tag tct tta ttt atc aca aat gga cga aaa cgg cgg age caa Lys Trp Ser Leu Phe Ile Thr Asn Gly Arg Lys Arg Arg Ser Gln
135 140 145
tca gta caa tac age tgg tgc taa tta tgg ttc agg cta ttg tga tgc Ser Val Gln Tyr Ser Trp Cys Leu Trp Phe Arg Leu Leu Cys
150 155 160
tca atg tcc agt gca gac ttg gag gaa tgg cac ctt aaa cac atc aca Ser Met Ser Ser Ala Asp Leu Glu Glu Trp His Leu Lys His Ile Thr 165 170 175
tca agg att ttg ctg taa cga aat gga cat att aga agg taa ttc aag Ser Arg Ile Leu Leu Arg Asn Gly His Ile Arg Arg Phe Lys
180 185 190
age taa tgc act aac tcc gca ctc ttg tac tgc gag tcc cgg gca atc Ser Cys Thr Asn Ser Ala Leu Leu Tyr Cys Glu Ser Arg Ala Ile
195 200 205
cgc ttg tac cct aca atc cga aac tca ccc acc att gac ctg gca aaa Arg Leu Tyr Pro Thr Ile Arg Asn Ser Pro Thr Ile Asp Leu Ala Lys 210 215 220
gtg ttc tag cgg tgg aac ttg tac tca aca aac tgg ttc tgt tgt tat Val Phe Arg Trp Asn Leu Tyr Ser Thr Asn Trp Phe Cys Cys Tyr
225 230 235
cga cgc taa ctg gag atg gac aca cgc cac taa ctc ttc tac caa ctg Arg Arg Leu Glu Met Asp Thr Arg His Leu Phe Tyr Gln Leu
240 245 250
tta cga cgg taa cac ttg gtc ttc cac ttt atg tcc aga taa cga aac Leu Arg Arg His Leu Val Phe His Phe Met Ser Arg Arg Asn
384
432
480
528
576
624
672
720
768
816 255 260
ttg tgc taa gaa ttg ctg ttt gga cgg tgc cgc cta cgc ttc tac cta Leu Cys Glu Leu Leu Phe Gly Arg Cys Arg Leu Arg Phe Tyr Leu
265 270 275
cgg tgt tac cac ctc cgg taa ctc ctt gtc tat tgg ttt cgt cac tca Arg Cys Tyr His Leu Arg Leu Leu Val Tyr Trp Phe Arg His Ser
280 285 290
atc cgc tca aaa gaa cgt tgg tgc tag att gta ctt gat ggc ttc tga Ile Arg Ser Lys Glu Arg Trp Cys Ile Val Leu Asp Gly Phe
295 300 305
cac tac tta tca aga att tac ttt gtt ggg taa cga att ttc ttt cga His Tyr Leu Ser Arg Ile Tyr Phe Val Gly Arg Ile Phe Phe Arg
310 315 320
tgt tga cgt ttc cca att gcc atg tgg ctt gaa cgg tgc ttt gta ctt Cys Arg Phe Pro Ile Ala Met Trp Leu Glu Arg Cys Phe Val Leu 325 330 335
tgt ctc tat gga tgc tga cgg tgg tgt ttc taa gta ccc aac taa cac Cys Leu Tyr Gly Cys Arg Trp Cys Phe Val Pro Asn His
340 345 350
tgc cgg tgc taa gta cgg tac tgg tta ctg tga ttc tca atg tcc acg Cys Arg Cys Val Arg Tyr Trp Leu Leu Phe Ser Met Ser Thr
355 360 365
tga ctt gaa gtt cat taa cgg tca age caa cgt cga agg ttg gga acc Leu Glu Val His Arg Ser Ser Gln Arg Arg Arg Leu Gly Thr
370 375
atc ctc caa caa cgc taa cac cgg tat cgg tgg tca cgg ttc ctg ttg Ile Leu Gln Gln Arg His Arg Tyr Arg Trp Ser Arg Phe Leu Leu
380 385 390
ttc cga aat gga cat ctg gga age taa cag tat ttc tga age ttt gac Phe Arg Asn Gly His Leu Gly Ser Gln Tyr Phe Ser Phe Asp 395 400 405
acc aca ccc atg cac cac tgt cgg tca aga aat ttg tga agg tga tgg
912
960
1008
1056
1104
1152
1200
1248
1296
1344
1392 Thr Thr Pro Met His His Cys Arg Ser Arg Asn Leu Arg Trp
410 415 420
atg tgg tgg aac cta ctc tga taa cag ata cgg tgg tac ttg tga ccc Met Trp Trp Asn Leu Leu Gln Ile Arg Trp Tyr Leu Pro
425 430 435
aga cgg ttg tga ctg gaa ccc ata cag att ggg taa cac ttc ttt cta Arg Arg Leu Leu Glu Pro Ile Gln Ile Gly His Phe Phe Leu
440 445
tgg tcc agg ttc ttc ttt cac ctt gga tac cac caa gaa gtt gac tgt Trp Ser Arg Phe Phe Phe His Leu Gly Tyr His Gln Glu Val Asp Cys 450 455 460 465
tgt tac cca att cga aac ttc tgg tgc tat caa cag ata cta cgt tca Cys Tyr Pro Ile Arg Asn Phe Trp Cys Tyr Gln Gln Ile Leu Arg Ser 470 475 480
aaa cgg tgt cac ctt cca aca acc aaa cgc tga att ggg ttc tta ctc Lys Arg Cys His Leu Pro Thr Thr Lys Arg Ile Gly Phe Leu Leu
485 490 495
tgg taa tga att gaa cga cga cta ctg tac cgc tga aga age tga att Trp Ile Glu Arg Arg Leu Leu Tyr Arg Arg Ser Ile
500 505
tgg tgg ttc ctc ttt ctc cga caa ggg tgg ttt gac cca att caa gaa Trp Trp Phe Leu Phe Leu Arg Gln Gly Trp Phe Asp Pro Ile Gln Glu 510 515 520
ggc tac ctc cgg tgg tat ggt ttt ggt tat gtc ctt gtg gga tga tta Gly Tyr Leu Arg Trp Tyr Gly Phe Gly Tyr Val Leu Val Gly Leu 525 530 535
cta cgc aaa cat gtt atg gtt aga cag tac tta ccc aac taa cga aac Leu Arg Lys His Val Met Val Arg Gln Tyr Leu Pro Asn Arg Asn 540 545 550
ctc ctc tac tcc agg tgc tgt cag agg ttc ctg ttc tac ctc ttc tgg Leu Leu Tyr Ser Arg Cys Cys Gln Arg Phe Leu Phe Tyr Leu Phe Trp 555 560 565 570
1440
1488
1536
1584
1632
1680
1728
1776
1824
1872 tgt tcc age tca agt tga atc tca atc tcc aaa cgc taa ggt cac ttt Cys Ser Ser Ser Ser Ile Ser Ile Ser Lys Arg Gly His Phe
575 580
ctc caa cat caa gtt cgg tcc aat cgg ttc cac tgg taa tcc atc tgg Leu Gln His Gln Val Arg Ser Asn Arg Phe His Trp Ser Ile Trp 585 590 595
tgg aaa ccc tcc agg tgg taa cag agg tac tac cac tac tcg tag gcc Trp Lys Pro Ser Arg Trp Gln Arg Tyr Tyr His Tyr Ser Ala
600 605 610
age tac tac aac tgg ttc ttc ccc agg ccc aac cca atc cca cta cgg Ser Tyr Tyr Asn Trp Phe Phe Pro Arg Pro Asn Pro Ile Pro Leu Arg 615 620 625
tca atg tgg tgg tat cgg tta ctc tgg tcc aac cgt ctg tgc ttc tgg Ser Met Trp Trp Tyr Arg Leu Leu Trp Ser Asn Arg Leu Cys Phe Trp 630 635 640 645
tac tac ctg tca agt ttt aaa ccc ata cta ctc tca atg ttt gcc tgg Tyr Tyr Leu Ser Ser Phe Lys Pro Ile Leu Leu Ser Met Phe Ala Trp 650 655 660
tgc tgc ttc cag ttc atc tag tgg atc cgg tgg cgg tgg atc tgg agg Cys Cys Phe Gln Phe Ile Trp Ile Arg Trp Arg Trp Ile Trp Arg
665 670 675
agg cgg ttc ttg gtc tca ccc aca att tga aaa ggg tgg aga aaa ctt Arg Arg Phe Leu Val Ser Pro Thr Ile Lys Gly Trp Arg Lys Leu
680 685 690
gta ctt tca agg cgg tgg tgg agg ttc tgg cgg agg tgg ctc cgg ctc Val Leu Ser Arg Arg Trp Trp Arg Phe Trp Arg Arg Trp Leu Arg Leu 695 700 705
age tat ctc tca aat cac cga cgg tca aat cca age cac tac cac age Ser Tyr Leu Ser Asn His Arg Arg Ser Asn Pro Ser His Tyr His Ser 710 715 720
tac cac tga age tac aac tac cgc tgc tcc ttc atc tac tgt tga aac Tyr His Ser Tyr Asn Tyr Arg Cys Ser Phe Ile Tyr Cys Asn
1920
1968
2016
2064
2112
2160
2208
2256
2304
2352
2400 725 730 735
tgt ttc tcc atc ttc cac cga aac cat ctc tca aca aac cga aaa cgg
Cys Phe Ser Ile Phe His Arg Asn His Leu Ser Thr Asn Arg Lys Arg
740 745 750
tgc tgc taa ggc tgc tgt tgg tat ggg tgc tgg tgc ttt ggc tgc tgc
Cys Cys Gly Cys Cys Trp Tyr Gly Cys Trp Cys Phe Gly Cys Cys
755 760 765 tgc tat gtt gtt gta ggg cgc gcc Cys Tyr Val Val Val Gly Arg Ala
770
775
<210> 30
<211> 3314
<212> DNA
<213> Trichoderma reesei
<220>
<221> exon
<222> (1) . . (3314)
<4 00> 30
gag tcc cgg gca aca acc agg aac atc aac acc aga agt cca tcc aaa
Glu Ser Arg Ala Thr Thr Arg Asn Ile Asn Thr Arg Ser Pro Ser Lys
10 15
gtt aac aac cta taa atg tac taa gag tgg agg gtg tgt age gca gga
Val Asn Asn Leu Met Tyr Glu Trp Arg Val Cys Ser Ala Gly
25 30
cac aag tgt ggt ctt aga ctg gaa tta tcg ttg gat gca tga tgc caa
His Lys Cys Gly Leu Arg Leu Glu Leu Ser Leu Asp Ala Cys Gln
40 45
tta taa ttc ctg tac tgt taa cgg cgg tgt taa cac tac gtt atg ccc
Leu Phe Leu Tyr Cys Arg Arg Cys His Tyr Val Met Pro
50 55
cga tga age gac ttg tgg taa gaa ttg ttt tat tga agg ggt tga cta Arg Ser Asp Leu Trp Glu Leu Phe Tyr Arg Gly Leu
2448
2496
2520
48
96
144
192
240 60 65 70
cgc cgc tag tgg tgt tac gac gag tgg gtc atc ctt gac gat gaa tca Arg Arg Trp Cys Tyr Asp Glu Trp Val Ile Leu Asp Asp Glu Ser
75 80 85
ata cat gcc ttc ttc tag tgg tgg gta ttc ctc tgt gtc tcc aag gct Ile His Ala Phe Phe Trp Trp Val Phe Leu Cys Val Ser Lys Ala
90 95 100
gta ttt att gga ttc cga tgg gga ata tgt tat gtt aaa att aaa tgg Val Phe Ile Gly Phe Arg Trp Gly Ile Cys Tyr Val Lys Ile Lys Trp 105 110 115
gca aga act gag ttt tga tgt gga tct atc tgc att acc ttg tgg aga Ala Arg Thr Glu Phe Cys Gly Ser Ile Cys Ile Thr Leu Trp Arg
120 125 130
aaa tgg tag tct tta ttt atc aca aat gga cga aaa cgg cgg age caa Lys Trp Ser Leu Phe Ile Thr Asn Gly Arg Lys Arg Arg Ser Gln
135 140 145
tca gta caa tac age tgg tgc taa tta tgg ttc agg cta ttg tga tgc Ser Val Gln Tyr Ser Trp Cys Leu Trp Phe Arg Leu Leu Cys
150 155 160
tca atg tcc agt gca gac ttg gag gaa tgg cac ctt aaa cac atc aca Ser Met Ser Ser Ala Asp Leu Glu Glu Trp His Leu Lys His Ile Thr 165 170 175
tca agg att ttg ctg taa cga aat gga cat att aga agg taa ttc aag Ser Arg Ile Leu Leu Arg Asn Gly His Ile Arg Arg Phe Lys
180 185 190
age taa tgc act aac tcc gca ctc ttg tac tgc gag tcc cgg gca atc
Ser Cys Thr Asn Ser Ala Leu Leu Tyr Cys Glu Ser Arg Ala Ile
195 200 205
cgc ttg tac cct aca atc cga aac tca ccc acc att gac ctg gca aaa
Arg Leu Tyr Pro Thr Ile Arg Asn Ser Pro Thr Ile Asp Leu Ala Lys
210 215 220
gtg ttc tag cgg tgg aac ttg tac tca aca aac tgg ttc tgt tgt tat
288
336
384
432
480
528
576
624
672
720
768 Val Phe Arg Trp Asn Leu Tyr Ser Thr Asn Trp Phe Cys Cys Tyr
225 230 235
cga cgc taa ctg gag atg gac aca cgc cac taa ctc ttc tac caa ctg Arg Arg Leu Glu Met Asp Thr Arg His Leu Phe Tyr Gln Leu
240 245 250
tta cga cgg taa cac ttg gtc ttc cac ttt atg tcc aga taa cga aac Leu Arg Arg His Leu Val Phe His Phe Met Ser Arg Arg Asn
255 260
ttg tgc taa gaa ttg ctg ttt gga cgg tgc cgc cta cgc ttc tac cta Leu Cys Glu Leu Leu Phe Gly Arg Cys Arg Leu Arg Phe Tyr Leu
265 270 275
cgg tgt tac cac ctc cgg taa ctc ctt gtc tat tgg ttt cgt cac tca Arg Cys Tyr His Leu Arg Leu Leu Val Tyr Trp Phe Arg His Ser
280 285 290
atc cgc tca aaa gaa cgt tgg tgc tag att gta ctt gat ggc ttc tga Ile Arg Ser Lys Glu Arg Trp Cys Ile Val Leu Asp Gly Phe
295 300 305
cac tac tta tca aga att tac ttt gtt ggg taa cga att ttc ttt cga His Tyr Leu Ser Arg Ile Tyr Phe Val Gly Arg Ile Phe Phe Arg
310 315 320
tgt tga cgt ttc cca att gcc atg tgg ctt gaa cgg tgc ttt gta ctt Cys Arg Phe Pro Ile Ala Met Trp Leu Glu Arg Cys Phe Val Leu
325 330 335
tgt ctc tat gga tgc tga cgg tgg tgt ttc taa gta ccc aac taa cac Cys Leu Tyr Gly Cys Arg Trp Cys Phe Val Pro Asn His 340 345 350
tgc cgg tgc taa gta cgg tac tgg tta ctg tga ttc tca atg tcc acg Cys Arg Cys Val Arg Tyr Trp Leu Leu Phe Ser Met Ser Thr
355 360 365
tga ctt gaa gtt cat taa cgg tca age caa cgt cga agg ttg gga acc Leu Glu Val His Arg Ser Ser Gln Arg Arg Arg Leu Gly Thr
370 375
816
864
912
960
1008
1056
1104
1152
1200
1248 atc ctc caa caa cgc taa cac cgg tat cgg tgg tca cgg ttc ctg ttg Ile Leu Gln Gln Arg His Arg Tyr Arg Trp Ser Arg Phe Leu Leu
380 385 390
ttc cga aat gga cat ctg gga age taa cag tat ttc tga age ttt gac Phe Arg Asn Gly His Leu Gly Ser Gln Tyr Phe Ser Phe Asp 395 400 405
acc aca ccc atg cac cac tgt cgg tca aga aat ttg tga agg tga tgg Thr Thr Pro Met His His Cys Arg Ser Arg Asn Leu Arg Trp
410 415 420
atg tgg tgg aac cta ctc tga taa cag ata cgg tgg tac ttg tga ccc Met Trp Trp Asn Leu Leu Gln Ile Arg Trp Tyr Leu Pro
425 430 435
aga cgg ttg tga ctg gaa ccc ata cag att ggg taa cac ttc ttt cta Arg Arg Leu Leu Glu Pro He Gln Ile Gly His Phe Phe Leu
440 445
tgg tcc agg ttc ttc ttt cac ctt gga tac cac caa gaa gtt gac tgt Trp Ser Arg Phe Phe Phe His Leu Gly Tyr His Gln Glu Val Asp Cys 450 455 460 465
tgt tac cca att cga aac ttc tgg tgc tat caa cag ata cta cgt tca Cys Tyr Pro Ile Arg Asn Phe Trp Cys Tyr Gln Gln Ile Leu Arg Ser
470 475 480
aaa cgg tgt cac ctt cca aca acc aaa cgc tga att ggg ttc tta ctc Lys Arg Cys His Leu Pro Thr Thr Lys Arg Ile Gly Phe Leu Leu
485 490 495
tgg taa tga att gaa cga cga cta ctg tac cgc tga aga age tga att Trp Ile Glu Arg Arg Leu Leu Tyr Arg Arg Ser Ile
500 505
tgg tgg ttc ctc ttt ctc cga caa ggg tgg ttt gac cca att caa gaa Trp Trp Phe Leu Phe Leu Arg Gln Gly Trp Phe Asp Pro Ile Gln Glu 510 515 520
ggc tac ctc cgg tgg tat ggt ttt ggt tat gtc ctt gtg gga tga tta Gly Tyr Leu Arg Trp Tyr Gly Phe Gly Tyr Val Leu Val Gly Leu
1296
1344
1392
1440
1488
1536
1584
1632
1680
1728
1776 525 530 535
cta cgc aaa cat gtt atg gtt aga cag tac tta ccc aac taa cga aac
Leu Arg Lys His Val Met Val Arg Gln Tyr Leu Pro Asn Arg Asn
540 545 550
cga gtc ccg ggg tcc cat tag aag aaa gac aag cct gct cct ctg ttt
Arg Val Pro Gly Ser His Lys Lys Asp Lys Pro Ala Pro Leu Phe
555 560 565
ggg gtc aat gtg gtg gtc aaa act ggt ctg gtc caa ctt gtt gtg ctt
Gly Val Asn Val Val Val Lys Thr Gly Leu Val Gln Leu Val Val Leu
570 575 580 585
ccg gtt cta cct gtg ttt act cca acg act act att ccc aat gtt tgc
Pro Val Leu Pro Val Phe Thr Pro Thr Thr Thr Ile Pro Asn Val Cys
590 595 600
cag gtg ctg ctt cct ctt cct ctt caa cta gag ctg ctt cta caa ctt
Gln Val Leu Leu Pro Leu Pro Leu Gln Leu Glu Leu Leu Leu Gln Leu
605 610 615
cta ggg tct ccc caa cca ctt cca gat cct ctt ctg cta ctc cac cac
Leu Gly Ser Pro Gln Pro Leu Pro Asp Pro Leu Leu Leu Leu His His
620 625 630
cag gtt cta cta cca cta gag ttc cac cag tcg gtt ccg gta ctg cta
Gln Val Leu Leu Pro Leu Glu Phe His Gln Ser Val Pro Val Leu Leu
635 640 645
ctt act ctg gta acc ctt tcg tcg gtg tta ctc cat ggg cta acg ctt
Leu Thr Leu Val Thr Leu Ser Ser Val Leu Leu His Gly Leu Thr Leu
650 655 660 665
act acg ctt ctg aag ttt ctt ctt tgg cta tcc cat ctt tga ctg gtg
Thr Thr Leu Leu Lys Phe Leu Leu Trp Leu Ser His Leu Leu Val
670 675 680 cta tgg cta ccg ctg ctg ctg ctg tcg cca aag ttc cat cct tca tgt Leu Trp Leu Pro Leu Leu Leu Leu Ser Pro Lys Phe His Pro Ser Cys
685 690 695
ggt tgg aca cct tgg aca aaa ctc cat taa tgg aac aaa cct tgg cag
1824
1872
1920
1968
2016
2064
2112
2160
2208
2256
2304 Gly Trp Thr Pro Trp Thr Lys Leu His Trp Asn Lys Pro Trp Gln
700 705 710
aca taa gga ctg cta aca aga acg gcg gta act acg ctg gtc aat ttg Thr Gly Leu Leu Thr Arg Thr Ala Val Thr Thr Leu Val Asn Leu
715 720 725
ttg tgt acg act tgc cag aca gag act gtg ctg ctt tgg ctt cca acg Leu Cys Thr Thr Cys Gln Thr Glu Thr Val Leu Leu Trp Leu Pro Thr 730 735 740
gtg aat act cca tcg ctg acg gtg gtg tcg cca agt aca aga act aca Val Asn Thr Pro Ser Leu Thr Val Val Ser Pro Ser Thr Arg Thr Thr 745 750 755
ttg ata cca tta gac aaa tcg ttg tcg aat act ctg aca tca gaa cct Leu Ile Pro Leu Asp Lys Ser Leu Ser Asn Thr Leu Thr Ser Glu Pro 760 765 770
tgt tag tca tcg aac cag att ctt tag cca att tag tca cca act tgg Cys Ser Ser Asn Gln He Leu Pro Ile Ser Pro Thr Trp
775 780 785
gta ctc caa agt gtg cta acg ctc aat ctg cct act tag aat gta tca Val Leu Gln Ser Val Leu Thr Leu Asn Leu Pro Thr Asn Val Ser
790 795 800
att atg cag tta ccc aat tga act tgc caa acg ttg cta tgt act tgg Ile Met Gln Leu Pro Asn Thr Cys Gln Thr Leu Leu Cys Thr Trp 805 810 815
acg ctg gtc acg ccg gtt ggt tgg gtt ggc cag cta acc aag acc cag Thr Leu Val Thr Pro Val Gly Trp Val Gly Gln Leu Thr Lys Thr Gln 820 825 830
ccg ctc aat tat tcg cca acg ttt aca aga atg cct ctt ctc cta gag Pro Leu Asn Tyr Ser Pro Thr Phe Thr Arg Met Pro Leu Leu Leu Glu 835 840 845
cct tgc gtg gtt tgg cta cta acg tcg cta act aca acg gtt gga aca Pro Cys Val Val Trp Leu Leu Thr Ser Leu Thr Thr Thr Val Gly Thr 850 855 860 865
2352
2400
2448
2496
2544
2592
2640
2688
2736
2784 tca ctt ctc cac cat ctt aca ccc aag gta acg ctg ttt aca acg aaa
Ser Leu Leu His His Leu Thr Pro Lys Val Thr Leu Phe Thr Thr Lys
870 875 880
agt tgt aca ttc acg cta tcg gtc cat tat tgg cta acc atg gtt ggt
Ser Cys Thr Phe Thr Leu Ser Val His Tyr Trp Leu Thr Met Val Gly
885 890 895
cta acg cct tct tca tca ccg acc aag gta gat ccg gta aac aac caa
Leu Thr Pro Ser Ser Ser Pro Thr Lys Val Asp Pro Val Asn Asn Gln
900 905 910
ctg gtc aac aac aat ggg gtg att ggt gta acg tca tcg gta ctg gtt Leu Val Asn Asn Asn Gly Val He Gly Val Thr Ser Ser Val Leu Val
915 920 925
tcg gta tca gac cat ccg cta aca ctg gtg att cct tgt tgg att cct
Ser Val Ser Asp His Pro Leu Thr Leu Val Ile Pro Cys Trp Ile Pro
930 935 940 945
tcg tct ggg tta age cag gtg gtg aat gtg atg gca cct ctg att cct Ser Ser Gly Leu Ser Gln Val Val Asn Val Met Ala Pro Leu Ile Pro
950 955 960
ctg ctc caa gat tcg att ccc act gcg cct tgc cag acg ctt tgc aac
Leu Leu Gln Asp Ser Ile Pro Thr Ala Pro Cys Gln Thr Leu Cys Asn
965 970 975 cag ccc cac aag ctg gtg cat ggt tcc aag ctt act ttg tcc aat tgt
Gln Pro His Lys Leu Val His Gly Ser Lys Leu Thr Leu Ser Asn Cys
980 985 990 tga cca acg cta acc cat ctt tct tgg gat ccg gtg gcg gtg gat ctg Pro Thr Leu Thr His Leu Ser Trp Asp Pro Val Ala Val Asp Leu
995 1000 1005 gtg gag gcg gtt ctc atc acc acc atc atc acg gtg gcg aaa act Val Glu Ala Val Leu Ile Thr Thr Ile Ile Thr Val Ala Lys Thr
1010 1015 1020
tgt act ttc aag gcg gcg gtg gag gta gtg gag gag gtg gct ccg Cys Thr Phe Lys Ala Ala Val Glu Val Val Glu Glu Val Ala Pro
2832
2880
2928
2976
3024
3072
3120
3168
3216
3261
3306 1025 1030 1035
gct cag ct Ala Gln 1040
<210> 31
<211> 2996
<212> DNA
<213> Seqüência artificial
<220>
<223> 68 AA em C-terminal de CWP2p
<220>
<221> exon
<222> (1)..(2996)
<400> 31
gag tcc cgg gca aca acc agg aac atc aac acc aga agt cca tcc aaa Glu Ser Arg Ala Thr Thr Arg Asn Ile Asn Thr Arg Ser Pro Ser Lys 15 10 15
gtt aac aac cta taa atg tac taa gag tgg agg gtg tgt age gca gga Val Asn Asn Leu Met Tyr Glu Trp Arg Val Cys Ser Ala Gly
20 25 30
cac aag tgt ggt ctt aga ctg gaa tta tcg ttg gat gca tga tgc caa
His Lys Cys Gly Leu Arg Leu Glu Leu Ser Leu Asp Ala Cys Gln
40 45
tta taa ttc ctg tac tgt taa cgg cgg tgt taa cac tac gtt atg ccc
Leu Phe Leu Tyr Cys Arg Arg Cys His Tyr Val Met Pro
50 55
cga tga age gac ttg tgg taa gaa ttg ttt tat tga agg ggt tga cta
Arg Ser Asp Leu Trp Glu Leu Phe Tyr Arg Gly Leu
60 65 70
cgc cgc tag tgg tgt tac gac gag tgg gtc atc ctt gac gat gaa tca
Arg Arg Trp Cys Tyr Asp Glu Trp Val Ile Leu Asp Asp Glu Ser
75 80 85
3314
48
96
144
192
240
288 ata cat gcc ttc ttc tag tgg tgg gta ttc ctc tgt gtc tcc aag gct Ile His Ala Phe Phe Trp Trp Val Phe Leu Cys Val Ser Lys Ala
90 95 100
gta ttt att gga ttc cga tgg gga ata tgt tat gtt aaa att aaa tgg Val Phe Ile Gly Phe Arg Trp Gly Ile Cys Tyr Val Lys Ile Lys Trp
105 110 115
gca aga act gag ttt tga tgt gga tct atc tgc att acc ttg tgg aga Ala Arg Thr Glu Phe Cys Gly Ser Ile Cys Ile Thr Leu Trp Arg
120 125 130
aaa tgg tag tct tta ttt atc aca aat gga cga aaa cgg cgg age caa Lys Trp Ser Leu Phe Ile Thr Asn Gly Arg Lys Arg Arg Ser Gln
135 140 145
tca gta caa tac age tgg tgc taa tta tgg ttc agg cta ttg tga tgc Ser Val Gln Tyr Ser Trp Cys Leu Trp Phe Arg Leu Leu Cys
150 155 160
tca atg tcc agt gca gac ttg gag gaa tgg cac ctt aaa cac atc aca Ser Met Ser Ser Ala Asp Leu Glu Glu Trp His Leu Lys His Ile Thr 165 170 175
tca agg att ttg ctg taa cga aat gga cat att aga agg taa ttc aag Ser Arg Ile Leu Leu Arg Asn Gly His Ile Arg Arg Phe Lys
180 185 190
age taa tgc act aac tcc gca ctc ttg tac tgc gag tcc cgg gca atc Ser Cys Thr Asn Ser Ala Leu Leu Tyr Cys Glu Ser Arg Ala Ile
195 200 205
cgc ttg tac cct aca atc cga aac tca ccc acc att gac ctg gca aaa Arg Leu Tyr Pro Thr Ile Arg Asn Ser Pro Thr Ile Asp Leu Ala Lys 210 215 220
gtg ttc tag cgg tgg aac ttg tac tca aca aac tgg ttc tgt tgt tat Val Phe Arg Trp Asn Leu Tyr Ser Thr Asn Trp Phe Cys Cys Tyr
225 230 235
cga cgc taa ctg gag atg gac aca cgc cac taa ctc ttc tac caa ctg Arg Arg Leu Glu Met Asp Thr Arg His Leu Phe Tyr Gln Leu
336
384
432
480
528
576
624
672
720
768
816 240 245 250
tta cga cgg taa cac ttg gtc ttc cac ttt atg tcc aga taa cga aac
Leu Arg Arg His Leu Val Phe His Phe Met Ser Arg Arg Asn
255 260
ttg tgc taa gaa ttg ctg ttt gga cgg tgc cgc cta cgc ttc tac cta
Leu Cys Glu Leu Leu Phe Gly Arg Cys Arg Leu Arg Phe Tyr Leu 265 270 275
cgg tgt tac cac ctc cgg taa ctc ctt gtc tat tgg ttt cgt cac tca
Arg Cys Tyr His Leu Arg Leu Leu Val Tyr Trp Phe Arg His Ser 280 285 290
atc cgc tca aaa gaa cgt tgg tgc tag att gta ctt gat ggc ttc tga
Ile Arg Ser Lys Glu Arg Trp Cys Ile Val Leu Asp Gly Phe 295 300 305
cac tac tta tca aga att tac ttt gtt ggg taa cga att ttc ttt cga
His Tyr Leu Ser Arg Ile Tyr Phe Val Gly Arg Ile Phe Phe Arg
310 315 320
tgt tga cgt ttc cca att gcc atg tgg ctt gaa cgg tgc ttt gta ctt
Cys Arg Phe Pro Ile Ala Met Trp Leu Glu Arg Cys Phe Val Leu
325 330 335
tgt ctc tat gga tgc tga cgg tgg tgt ttc taa gta ccc aac taa cac
Cys Leu Tyr Gly Cys Arg Trp Cys Phe Val Pro Asn His
340 345 350
tgc cgg tgc taa gta cgg tac tgg tta ctg tga ttc tca atg tcc acg
Cys Arg Cys Val Arg Tyr Trp Leu Leu Phe Ser Met Ser Thr
355 360 365
tga ctt gaa gtt cat taa cgg tca age caa cgt cga agg ttg gga acc Leu Glu Val His Arg Ser Ser Gln Arg Arg Arg Leu Gly Thr
370 375
atc ctc caa caa cgc taa cac cgg tat cgg tgg tca cgg ttc ctg ttg Ile Leu Gln Gln Arg His Arg Tyr Arg Trp Ser Arg Phe Leu Leu
380 385 390
ttc cga aat gga cat ctg gga age taa cag tat ttc tga age ttt gac
864
912
960
1008
1056
1104
1152
1200
1248
1296
1344 Phe Arg Asn 395
acc aca ccc Thr Thr Pro 410
atg tgg tgg Met Trp Trp 425
aga cgg ttg Arg Arg Leu
tgg tcc agg Trp Ser Arg 450
tgt tac cca Cys Tyr Pro
aaa cgg tgt Lys Arg Cys
20
tgg taa tga Trp
tgg tgg ttc Trp Trp Phe 510 ggc tac ctc Gly Tyr Leu 525
cta cgc aaa Leu Arg Lys 540
Gly His Leu Gly 400
atg cac cac tgt Met His His Cys 415
aac cta ctc tga Asn Leu Leu
tga ctg gaa ccc Leu Glu Pro 440
ttc ttc ttt cac Phe Phe Phe His 455
att cga aac ttc Ile Arg Asn Phe 470
cac ctt cca aca His Leu Pro Thr 485
att gaa cga cga Ile Glu Arg Arg 500
ctc ttt ctc cga Leu Phe Leu Arg 515
cgg tgg tat ggt Arg Trp Tyr Gly 530
cat gtt atg gtt His Val Met Val 545
Ser Gln Tyr Phe
405
cgg tca aga aat ttg Arg Ser Arg Asn Leu 420
taa cag ata cgg tgg Gln Ile Arg Trp 430
ata cag att ggg taa Ile Gln Ile Gly 445
ctt gga tac cac Leu Gly Tyr His 460
tgg tgc tat caa Trp Cys Tyr Gln 475
acc aaa cgc tga Thr Lys Arg 490
cta ctg tac cgc Leu Leu Tyr Arg 505
caa ggg tgg ttt Gln Gly Trp Phe
ttt ggt tat gtc Phe Gly Tyr Val 535
aga cag tac tta Arg Gln Tyr Leu 550
Ser Phe Asp
tga agg tga tgg Arg Trp
tac ttg tga ccc Tyr Leu Pro
435
cac ttc ttt cta His Phe Phe Leu
caa gaa gtt gac tgt
Gln Glu Val Asp Cys 465
cag ata cta cgt tca
Gln Ile Leu Arg Ser 480
att ggg ttc tta ctc Ile Gly Phe Leu Leu 495
tga aga age tga att
Arg Ser Ile
gac cca att caa gaa Asp Pro Ile Gln Glu 520
ctt gtg gga tga tta Leu Val Gly Leu
ccc aac taa cga aac Pro Asn Arg Asn
1392
1440
1488
1536
1584
1632
1680
1728
1776
1824 cga gtc ccg ggg Arg Val Pro Gly 555
ggg gtc aat gtg Gly Val Asn Val
570
ccg gtt cta cct Pro Val Leu Pro
cag gtg ctg ctt Gln Val Leu Leu 605
cta ggg tct ccc Leu Gly Ser Pro
620
cag gtt cta cta
Gln Val Leu Leu 635
ctt act ctg gta
Leu Thr Leu Val 650
act acg ctt ctg
Thr Thr Leu Leu
cta tgg cta ccg
Leu Trp Leu Pro
ggt tgg aca cct Gly Trp Thr Pro
700
aca taa gga ctg Thr Gly Leu
tcc cat tag aag aaa gac Ser His Lys Lys Asp
560
gtg gtc aaa act ggt ctg Val Val Lys Thr Gly Leu 575
gtg ttt act cca acg act Val Phe Thr Pro Thr Thr 590 595
cct ctt cct ctt caa cta Pro Leu Pro Leu Gln Leu 610
caa cca ctt cca gat cct Gln Pro Leu Pro Asp Pro 625
cca cta gag ttc cac cag Pro Leu Glu Phe His Gln 640
acc ctt tcg tcg gtg tta Thr Leu Ser Ser Val Leu 655
aag ttt ctt ctt tgg cta Lys Phe Leu Leu Trp Leu 670 675
ctg ctg ctg ctg tcg cca Leu Leu Leu Leu Ser Pro 685 690
tgg aca aaa ctc cat taa Trp Thr Lys Leu His 705
cta aca aga acg gcg gta Leu Thr Arg Thr Ala Val
aag cct gct cct ctg ttt Lys Pro Ala Pro Leu Phe 565
gtc caa ctt gtt gtg ctt Val Gln Leu Val Val Leu 580 585
act att ccc aat gtt tgc Thr Ile Pro Asn Val Cys 600
gag ctg ctt cta caa ctt Glu Leu Leu Leu Gln Leu 615
ctt ctg cta ctc cac cac Leu Leu Leu Leu His His 630
tcg gtt ccg gta ctg cta Ser Val Pro Val Leu Leu 645
ctc cat ggg cta acg ctt Leu His Gly Leu Thr Leu 660 665
tcc cat ctt tga ctg gtg Ser His Leu Leu Val
680
aag ttc cat cct tca tgt Lys Phe His Pro Ser Cys 695
tgg aac aaa cct tgg cag Trp Asn Lys Pro Trp Gln 710
act acg ctg gtc aat ttg Thr Thr Leu Val Asn Leu
1872
1920
1968
2016
2064
2112
2160
2208
2256
2304
2352 715 720 725
ttg tgt acg act tgc cag aca gag act gtg ctg ctt tgg ctt cca acg
Leu Cys Thr Thr Cys Gln Thr Glu Thr Val Leu Leu Trp Leu Pro Thr 730 735 740
gtg aat act cca tcg ctg acg gtg gtg tcg cca agt aca aga act aca
Val Asn Thr Pro Ser Leu Thr Val Val Ser Pro Ser Thr Arg Thr Thr 745 750 755
ttg ata cca tta gac aaa tcg ttg tcg aat act ctg aca tca gaa cct
Leu Ile Pro Leu Asp Lys Ser Leu Ser Asn Thr Leu Thr Ser Glu Pro 760 765 770
tgt tag tca tcg aac cag att ctt tag cca att tag tca cca act tgg
Cys Ser Ser Asn Gln Ile Leu Pro Ile Ser Pro Thr Trp 775 780 785
gta ctc caa agt gtg cta acg ctc aat ctg cct act tag aat gta tca
Val Leu Gln Ser Val Leu Thr Leu Asn Leu Pro Thr Asn Val Ser 790 795 800
att atg cag tta ccc aat tga act tgc caa acg ttg gga tcc gga ggt
Ile Met Gln Leu Pro Asn Thr Cys Gln Thr Leu Gly Ser Gly Gly 805 810 815
ggt tca gga ggt ggt ggg tct gct tgg cat cca caa ttt gga gga ggc Gly Ser Gly Gly Gly Gly Ser Ala Trp His Pro Gln Phe Gly Gly Gly 820 825 830
ggt ggt gaa aat ctg tat ttc cag gga ggc gga ggt gat tac aag gat Gly Gly Glu Asn Leu Tyr Phe Gln Gly Gly Gly Gly Asp Tyr Lys Asp 835 840 845
gac gac aaa gga ggt ggt gga tca gga ggt ggt ggc tcc ggc tca gct Asp Asp Lys Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ser Ala
850 855 860 865 att age caa ata act gat ggt caa ata caa gca act aca aca gca aca Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala Thr
870 875 880 acc gaa gct act acc aca gcc gcg cct tct tca act gtt gag act gtt
2400
2448
2496
2544
2592
2640
2688
2736
2784
2832
2880 Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr Val 885 890 895 agt CCt tcc tcc acg gaa acg att tct caa cag act gaa aac ggt gca Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly Ala 900 905 910 gcc aaa gca gca gtc ggc atg ggt gcc gga gcc cta gca gct gca gca Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala Ala 915 920 925 atg Ctt ttg taa ggc gcg CC Met Leu Leu Gly Ala 930 <210> 32 <211> 2776 <212> DNA <213> Trichoderma reesei <220> <221> exon <222> (1) · . (2776) <4 00> 32 gag tcc cgg gca aca acc agg aac atc aac acc aga agt cca tcc aaa Glu Ser Arg Ala Thr Thr Arg Asn Ile Asn Thr Arg Ser Pro Ser Lys 1 5 10 15 gtt aac aac cta taa atg tac taa gag tgg agg gtg tgt age gca gga Val Asn Asn Leu Met Tyr Glu Trp Arg Val Cys Ser Ala Gly 20 25 30 cac aag tgt ggt ctt aga ctg gaa tta tcg ttg gat gca tga tgc caa His Lys Cys Gly Leu Arg Leu Glu Leu Ser Leu Asp Ala Cys Gln 35 40 45 tta taa ttc ctg tac tgt taa cgg cgg tgt taa cac tac gtt atg CCC Leu Phe Leu Tyr Cys Arg Arg Cys His Tyr Val Met Pro 50 55 cga tga age gac ttg tgg taa gaa ttg ttt tat tga agg ggt tga cta 2928
2976
2996
48
96
144
192
240 Arg Ser Asp Leu Trp Glu Leu Phe Tyr Arg Gly Leu
60 65 70
cgc cgc tag tgg tgt tac gac gag tgg gtc atc ctt gac gat gaa tca Arg Arg Trp Cys Tyr Asp Glu Trp Val Ile Leu Asp Asp Glu Ser
75 80 85
ata cat gcc ttc ttc tag tgg tgg gta ttc ctc tgt gtc tcc aag gct Ile His Ala Phe Phe Trp Trp Val Phe Leu Cys Val Ser Lys Ala
90 95 100
gta ttt att gga ttc cga tgg gga ata tgt tat gtt aaa att aaa tgg Val Phe Ile Gly Phe Arg Trp Gly Ile Cys Tyr Val Lys Ile Lys Trp
105 110 115
gca aga act gag ttt tga tgt gga tct atc tgc att acc ttg tgg aga Ala Arg Thr Glu Phe Cys Gly Ser Ile Cys Ile Thr Leu Trp Arg
120 125 130
aaa tgg tag tct tta ttt atc aca aat gga cga aaa cgg cgg age caa Lys Trp Ser Leu Phe Ile Thr Asn Gly Arg Lys Arg Arg Ser Gln
135 140 145
tca gta caa tac age tgg tgc taa tta tgg ttc agg cta ttg tga tgc Ser Val Gln Tyr Ser Trp Cys Leu Trp Phe Arg Leu Leu Cys
150 155 160
tca atg tcc agt gca gac ttg gag gaa tgg cac ctt aaa cac atc aca Ser Met Ser Ser Ala Asp Leu Glu Glu Trp His Leu Lys His Ile Thr 165 170 175
tca agg att ttg ctg taa cga aat gga cat att aga agg taa ttc aag Ser Arg Ile Leu Leu Arg Asn Gly His Ile Arg Arg Phe Lys 180 185 190
age taa tgc act aac tcc gca ctc ttg tac tgc gag tcc cgg gca atc Ser Cys Thr Asn Ser Ala Leu Leu Tyr Cys Glu Ser Arg Ala Ile
195 200 205
cgc ttg tac cct aca atc cga aac tca ccc acc att gac ctg gca aaa Arg Leu Tyr Pro Thr Ile Arg Asn Ser Pro Thr Ile Asp Leu Ala Lys 210 215 220
288
336
384
432
480
528
576
624
672
720 gtg ttc tag cgg tgg aac ttg tac tca aca aac tgg ttc tgt tgt tat
Val Phe Arg Trp Asn Leu Tyr Ser Thr Asn Trp Phe Cys Cys Tyr
225 230 235
cga cgc taa ctg gag atg gac aca cgc cac taa ctc ttc tac caa ctg
Arg Arg Leu Glu Met Asp Thr Arg His Leu Phe Tyr Gln Leu
240 245 250
tta cga cgg taa cac ttg gtc ttc cac ttt atg tcc aga taa cga aac
Leu Arg Arg His Leu Val Phe His Phe Met Ser Arg Arg Asn
255 260
ttg tgc taa gaa ttg ctg ttt gga cgg tgc cgc cta cgc ttc tac cta Leu Cys Glu Leu Leu Phe Gly Arg Cys Arg Leu Arg Phe Tyr Leu 265 270 275
cgg tgt tac cac ctc cgg taa ctc ctt gtc tat tgg ttt cgt cac tca Arg Cys Tyr His Leu Arg Leu Leu Val Tyr Trp Phe Arg His Ser
280 285 290
atc cgc tca aaa gaa cgt tgg tgc tag att gta ctt gat ggc ttc tga Ile Arg Ser Lys Glu Arg Trp Cys Ile Val Leu Asp Gly Phe
295 300 305
cac tac tta tca aga att tac ttt gtt ggg taa cga att ttc ttt cga His Tyr Leu Ser Arg Ile Tyr Phe Val Gly Arg Ile Phe Phe Arg
310 315 320
tgt tga cgt ttc cca att gcc atg tgg ctt gaa cgg tgc ttt gta ctt Cys Arg Phe Pro Ile Ala Met Trp Leu Glu Arg Cys Phe Val Leu
325 330 335
tgt ctc tat gga tgc tga cgg tgg tgt ttc taa gta ccc aac taa cac Cys Leu Tyr Gly Cys Arg Trp Cys Phe Val Pro Asn His
340 345 350
tgc cgg tgc taa gta cgg tac tgg tta ctg tga ttc tca atg tcc acg Cys Arg Cys Val Arg Tyr Trp Leu Leu Phe Ser Met Ser Thr
355 360 365
tga ctt gaa gtt cat taa cgg tca age caa cgt cga agg ttg gga acc Leu Glu Val His Arg Ser Ser Gln Arg Arg Arg Leu Gly Thr
768
816
864
912
960
1008
1056
1104
1152
1200
1248 atc ctc caa caa cgc
Ile Leu Gln Gln Arg 380
ttc cga aat gga cat
Phe Arg Asn Gly His 395
acc aca ccc atg cac
Thr Thr Pro Met His
410
atg tgg tgg aac cta Met Trp Trp Asn Leu 425
aga cgg ttg tga ctg Arg Arg Leu Leu
tgg tcc agg ttc ttc
Trp Ser Arg Phe Phe 450
tgt tac cca att cga
Cys Tyr Pro Ile Arg 470
aaa cgg tgt cac ctt
Lys Arg Cys His Leu
485
tgg taa tga att gaa Trp Ile Glu
tgg tgg ttc ctc ttt Trp Trp Phe Leu Phe 510
ggc tac ctc cgg tgg
370
taa cac cgg tat cgg tgg
His Arg Tyr Arg Trp 385
ctg gga age taa cag tat
Leu Gly Ser Gln Tyr 400
cac tgt cgg tca aga aat
His Cys Arg Ser Arg Asn 415
ctc tga taa cag ata cgg
Leu Gln Ile Arg 430
gaa ccc ata cag att ggg
Glu Pro Ile Gln Ile Gly
440 445
ttt cac ctt gga tac cac
Phe His Leu Gly Tyr His
455 460
aac ttc tgg tgc tat caa
Asn Phe Trp Cys Tyr Gln 475
cca aca acc aaa cgc tga Pro Thr Thr Lys Arg 490
cga cga cta ctg tac cgc
Arg Arg Leu Leu Tyr Arg
500 505
ctc cga caa ggg tgg ttt
Leu Arg Gln Gly Trp Phe 515
tat ggt ttt ggt tat gtc
375
tca cgg ttc ctg ttg
Ser Arg Phe Leu Leu 390
ttc tga age ttt gac
Phe Ser Phe Asp 405
ttg tga agg tga tgg
Leu Arg Trp 420
tgg tac ttg tga ccc
Trp Tyr Leu Pro 435
taa cac ttc ttt cta
His Phe Phe Leu
caa gaa gtt gac tgt Gln Glu Val Asp Cys 465
cag ata cta cgt tca Gln Ile Leu Arg Ser 480
att ggg ttc tta ctc Ile Gly Phe Leu Leu 495
tga aga age tga att Arg Ser Ile
gac cca att caa gaa Asp Pro Ile Gln Glu 520
ctt gtg gga tga tta
1296
1344
1392
1440
1488
1536
1584
1632
1680
1728
1776 Gly Tyr Leu Arg Trp Tyr Gly Phe Gly Tyr Val Leu Val Gly Leu 525 530 535
cta cgc aaa cat gtt atg gtt aga cag tac tta ccc aac taa cga aac
Leu Arg Lys His Val Met Val Arg Gln Tyr Leu Pro Asn Arg Asn 540 545 550
cga gtc ccg ggg tcc cat tag aag aaa gac aag cct gct cct ctg ttt
Arg Val Pro Gly Ser His Lys Lys Asp Lys Pro Ala Pro Leu Phe
555 560 565
ggg gtc aat gtg gtg gtc aaa act ggt ctg gtc caa ctt gtt gtg ctt
Gly Val Asn Val Val Val Lys Thr Gly Leu Val Gln Leu Val Val Leu
570 575 580 585
ccg gtt cta cct gtg ttt act cca acg act act att ccc aat gtt tgc
Pro Val Leu Pro Val Phe Thr Pro Thr Thr Thr Ile Pro Asn Val Cys
590 595 600
cag gtg ctg ctt cct ctt cct ctt caa cta gag ctg ctt cta caa ctt
Gln Val Leu Leu Pro Leu Pro Leu Gln Leu Glu Leu Leu Leu Gln Leu
605 610 615
cta ggg tct ccc caa cca ctt cca gat cct ctt ctg cta ctc cac cac
Leu Gly Ser Pro Gln Pro Leu Pro Asp Pro Leu Leu Leu Leu His His 620 625 630
cag gtt cta cta cca cta gag ttc cac cag tcg gtt ccg gta ctg cta
Gln Val Leu Leu Pro Leu Glu Phe His Gln Ser Val Pro Val Leu Leu
635 640 645
ctt act ctg gta acc ctt tcg tcg gtg tta ctc cat ggg cta acg ctt
Leu Thr Leu Val Thr Leu Ser Ser Val Leu Leu His Gly Leu Thr Leu
650 655 660 665
act acg ctt ctg aag ttt ctt ctt tgg cta tcc cat ctt tga ctg gtg
Thr Thr Leu Leu Lys Phe Leu Leu Trp Leu Ser His Leu Leu Val
670 675 680
cta tgg cta ccg ctg ctg ctg ctg tcg cca aag ttc cat cct tca tgt
Leu Trp Leu Pro Leu Leu Leu Leu Ser Pro Lys Phe His Pro Ser Cys
685 690 695
1824
1872
1920
1968
2016
2064
2112
2160
2208
2256 ggt tgg aca cct Gly Trp Thr Pro
700
aca taa gga ctg Thr Gly Leu
ttg tgt acg act
Leu Cys Thr Thr 730
gtg aat act cca
Val Asn Thr Pro 745
ttg ata cca tta
Leu Ile Pro Leu
760
tgt tag tca tcg Cys Ser Ser
775
gta ctc caa agt Val Leu Gln Ser 790
att atg cag tta Ile Met Gln Leu 805
aaa aac aaa atg Lys Asn Lys Met 820
atc tct ggt gtc Ile Ser Gly Val
835
gtt gag aaa cgt Val Glu Lys Arg
tgg aca aaa ctc cat taa Trp Thr Lys Leu His 705
cta aca aga acg gcg gta Leu Thr Arg Thr Ala Val 715 720
tgc cag aca gag act gtg Cys Gln Thr Glu Thr Val 735
tcg ctg acg gtg gtg tcg Ser Leu Thr Val Val Ser 750
gac aaa tcg ttg tcg aat Asp Lys Ser Leu Ser Asn 765
aac cag att ctt tag cca Asn Gln Ile Leu Pro
780
gtg cta acg ctc aat ctg Val Leu Thr Leu Asn Leu 795
ccc aat tga act tgc caa Pro Asn Thr Cys Gln
810
gtc tcc ttc acc tcc ctg Val Ser Phe Thr Ser Leu 825
cta gca gcc cct gcc gca Leu Ala Ala Pro Ala Ala 840
gag gcc gaa gca gaa gct Glu Ala Glu Ala Glu Ala
tgg aac aaa cct tgg cag Trp Asn Lys Pro Trp Gln 710
act acg ctg gtc aat ttg Thr Thr Leu Val Asn Leu 725
ctg ctt tgg ctt cca acg Leu Leu Trp Leu Pro Thr 740
cca agt aca aga act aca Pro Ser Thr Arg Thr Thr 755
act ctg aca tca gaa cct Thr Leu Thr Ser Glu Pro 770
att tag tca cca act tgg Ile Ser Pro Thr Trp
785
cct act tag aat gta tca Pro Thr Asn Val Ser
800
acg ttg gaa ttc tta att Thr Leu Glu Phe Leu Ile 815
ctg gcc ggc gtt gcc gct Leu Ala Gly Val Ala Ala 830
gaa gtt gaa cct gtc gca Glu Val Glu Pro Val Ala 845
ccc ggg act c Pro Gly Thr
2304
2352
2400
2448
2496
2544
2592
2640
2688
2736
2776 10
15
850 <210> <211> <212> <213> <220> <223> <220> <221> <222> <400> gag tcc Glu Ser 1
gtt aac Val Asn
cac aag His Lys
tta taa Leu
cga tga
Arg
cgc cgc Arg Arg
ata cat
Ile His
20
855 860
33
2932
DNA
Seqüência artificial
Sinal e espaçador pré-pro secreçaão Mfalpha
(1)..(2932) 33
cgg gca aca acc Arg Ala Thr Thr 5
aac cta taa atg Asn Leu Met
20
tgt ggt ctt aga Cys Gly Leu Arg 35
ttc ctg tac tgt Phe Leu Tyr Cys 50
age gac ttg tgg Ser Asp Leu Trp 60
tag tgg tgt tac Trp Cys Tyr 75
gcc ttc ttc tag Ala Phe Phe 90
agg aac atc aac acc aga Arg Asn Ile Asn Thr Arg 10
tac taa gag tgg agg gtg Tyr Glu Trp Arg Val
25
ctg gaa tta tcg ttg gat Leu Glu Leu Ser Leu Asp 40
taa cgg cgg tgt taa cac Arg Arg Cys His
taa gaa ttg ttt tat tga Glu Leu Phe Tyr 65
gac gag tgg gtc atc ctt Asp Glu Trp Val Ile Leu 80
tgg tgg gta ttc ctc tgt Trp Trp Val Phe Leu Cys 95
agt cca tcc aaa Ser Pro Ser Lys 15
tgt age gca gga Cys Ser Ala Gly 30
gca tga tgc caa Ala Cys Gln
45
tac gtt atg ccc Tyr Val Met Pro 55
agg ggt tga cta
Arg Gly Leu
70
gac gat gaa tca Asp Asp Glu Ser
85
gtc tcc aag gct Val Ser Lys Ala 100
96
144
192
240
288
336 gta ttt att gga ttc cga tgg gga ata tgt tat gtt aaa att aaa tgg Val Phe Ile Gly Phe Arg Trp Gly Ile Cys Tyr Val Lys Ile Lys Trp 105 110 115
gca aga act gag ttt tga tgt gga tct atc tgc att acc ttg tgg aga Ala Arg Thr Glu Phe Cys Gly Ser Ile Cys Ile Thr Leu Trp Arg 120 125 130
aaa tgg tag tct tta ttt atc aca aat gga cga aaa cgg cgg age caa Lys Trp Ser Leu Phe Ile Thr Asn Gly Arg Lys Arg Arg Ser Gln
135 140 145
tca gta caa tac age tgg tgc taa tta tgg ttc agg cta ttg tga tgc Ser Val Gln Tyr Ser Trp Cys Leu Trp Phe Arg Leu Leu Cys
150 155 160
tca atg tcc agt gca gac ttg gag gaa tgg cac ctt aaa cac atc aca Ser Met Ser Ser Ala Asp Leu Glu Glu Trp His Leu Lys His Ile Thr 165 170 175
tca agg att ttg ctg taa cga aat gga cat att aga agg taa ttc aag Ser Arg Ile Leu Leu Arg Asn Gly His Ile Arg Arg Phe Lys
180 185 190
age taa tgc act aac tcc gca ctc ttg tac tgc gag tcc cgg gca atc Ser Cys Thr Asn Ser Ala Leu Leu Tyr Cys Glu Ser Arg Ala Ile
195 200 205
cgc ttg tac cct aca atc cga aac tca ccc acc att gac ctg gca aaa Arg Leu Tyr Pro Thr Ile Arg Asn Ser Pro Thr Ile Asp Leu Ala Lys 210 215 220
gtg ttc tag cgg tgg aac ttg tac tca aca aac tgg ttc tgt tgt tat Val Phe Arg Trp Asn Leu Tyr Ser Thr Asn Trp Phe Cys Cys Tyr
225 230 235
cga cgc taa ctg gag atg gac aca cgc cac taa ctc ttc tac caa ctg Arg Arg Leu Glu Met Asp Thr Arg His Leu Phe Tyr Gln Leu
240 245 250
tta cga cgg taa cac ttg gtc ttc cac ttt atg tcc aga taa cga aac Leu Arg Arg His Leu Val Phe His Phe Met Ser Arg Arg Asn
384
432
480
528
576
624
672
720
768
816
864 255 260
ttg tgc taa gaa ttg ctg ttt gga cgg tgc cgc cta cgc ttc tac cta Leu Cys Glu Leu Leu Phe Gly Arg Cys Arg Leu Arg Phe Tyr Leu
265 270 275
cgg tgt tac cac ctc cgg taa ctc ctt gtc tat tgg ttt cgt cac tca Arg Cys Tyr His Leu Arg Leu Leu Val Tyr Trp Phe Arg His Ser
280 285 290
atc cgc tca aaa gaa cgt tgg tgc tag att gta ctt gat ggc ttc tga Ile Arg Ser Lys Glu Arg Trp Cys Ile Val Leu Asp Gly Phe
295 300 305
cac tac tta tca aga att tac ttt gtt ggg taa cga att ttc ttt cga His Tyr Leu Ser Arg Ile Tyr Phe Val Gly Arg Ile Phe Phe Arg
310 315 320
tgt tga cgt ttc cca att gcc atg tgg ctt gaa cgg tgc ttt gta ctt Cys Arg Phe Pro Ile Ala Met Trp Leu Glu Arg Cys Phe Val Leu 325 330 335
tgt ctc tat gga tgc tga cgg tgg tgt ttc taa gta ccc aac taa cac Cys Leu Tyr Gly Cys Arg Trp Cys Phe Val Pro Asn His
340 345 350
tgc cgg tgc taa gta cgg tac tgg tta ctg tga ttc tca atg tcc acg Cys Arg Cys Val Arg Tyr Trp Leu Leu Phe Ser Met Ser Thr
355 360 365
tga ctt gaa gtt cat taa cgg tca age caa cgt cga agg ttg gga acc Leu Glu Val His Arg Ser Ser Gln Arg Arg Arg Leu Gly Thr 370 375
atc ctc caa caa cgc taa cac cgg tat cgg tgg tca cgg ttc ctg ttg Ile Leu Gln Gln Arg His Arg Tyr Arg Trp Ser Arg Phe Leu Leu
380 385 390
ttc cga aat gga cat ctg gga age taa cag tat ttc tga age ttt gac Phe Arg Asn Gly His Leu Gly Ser Gln Tyr Phe Ser Phe Asp 395 400 405
acc aca ccc atg cac cac tgt cgg tca aga aat ttg tga agg tga tgg
912
960
1008
1056
1104
1152
1200
1248
1296
1344
1392 Thr Thr Pro Met His His Cys Arg Ser Arg Asn Leu Arg Trp
410 415 420
atg tgg tgg aac cta ctc tga taa cag ata cgg tgg tac ttg tga ccc Met Trp Trp Asn Leu Leu Gln Ile Arg Trp Tyr Leu Pro
425 430 435
aga cgg ttg tga ctg gaa ccc ata cag att ggg taa cac ttc ttt cta Arg Arg Leu Leu Glu Pro Ile Gln Ile Gly His Phe Phe Leu
440 445
tgg tcc agg ttc ttc ttt cac ctt gga tac cac caa gaa gtt gac tgt Trp Ser Arg Phe Phe Phe His Leu Gly Tyr His Gln Glu Val Asp Cys 450 455 460 465
tgt tac cca att cga aac ttc tgg tgc tat caa cag ata cta cgt tca Cys Tyr Pro Ile Arg Asn Phe Trp Cys Tyr Gln Gln Ile Leu Arg Ser 470 475 480
aaa cgg tgt cac ctt cca aca acc aaa cgc tga att ggg ttc tta ctc Lys Arg Cys His Leu Pro Thr Thr Lys Arg Ile Gly Phe Leu Leu
485 490 495
tgg taa tga att gaa cga cga cta ctg tac cgc tga aga age tga att Trp Ile Glu Arg Arg Leu Leu Tyr Arg Arg Ser Ile
500 505
tgg tgg ttc ctc ttt ctc cga caa ggg tgg ttt gac cca att caa gaa Trp Trp Phe Leu Phe Leu Arg Gln Gly Trp Phe Asp Pro Ile Gln Glu 510 515 520
ggc tac ctc cgg tgg tat ggt ttt ggt tat gtc ctt gtg gga tga tta Gly Tyr Leu Arg Trp Tyr Gly Phe Gly Tyr Val Leu Val Gly Leu
525 530 535
cta cgc aaa cat gtt atg gtt aga cag tac tta ccc aac taa cga aac Leu Arg Lys His Val Met Val Arg Gln Tyr Leu Pro Asn Arg Asn
540 545 550
cga gtc ccg ggg tcc cat tag aag aaa gac aag cct gct cct ctg ttt Arg Val Pro Gly Ser His Lys Lys Asp Lys Pro Ala Pro Leu Phe
555 560 565
1440
1488
1536
1584
1632
1680
1728
1776
1824
1872 ggg gtc Gly Val 570
ccg gtt Pro Val
cag gtg Gln Val
cta ggg Leu Gly
cag gtt Gln Val
635
ctt act Leu Thr 650
act acg Thr Thr
cta tgg Leu Trp
ggt tgg
Gly Trp
aca taa Thr
30
ttg tgt Leu Cys
aat gtg gtg Asn Val Val
cta cct gtg Leu Pro Val 590
ctg ctt cct Leu Leu Pro 605
tct ccc caa Ser Pro Gln 620
cta cta cca Leu Leu Pro
ctg gta acc Leu Val Thr
ctt ctg aag Leu Leu Lys 670
cta ccg ctg Leu Pro Leu 685
aca cct tgg Thr Pro Trp 700 gga ctg cta Gly Leu Leu 715
acg act tgc Thr Thr Cys
gtc aaa act ggt Val Lys Thr Gly 575
ttt act cca acg Phe Thr Pro Thr
ctt cct ctt caa Leu Pro Leu Gln 610
cca ctt cca gat Pro Leu Pro Asp 625
cta gag ttc cac Leu Glu Phe His 640
ctt tcg tcg gtg Leu Ser Ser Val 655
ttt ctt ctt tgg Phe Leu Leu Trp
ctg ctg ctg tcg Leu Leu Leu Ser
aca aaa ctc cat Thr Lys Leu His 705
aca aga acg gcg Thr Arg Thr Ala
cag aca gag act Gln Thr Glu Thr
ctg gtc caa ctt Leu Val Gln Leu 580
act act att ccc Thr Thr Ile Pro
595
cta gag ctg ctt Leu Glu Leu Leu
cct ctt ctg cta Pro Leu Leu Leu 630
cag tcg gtt ccg Gln Ser Val Pro 645
tta ctc cat ggg Leu Leu His Gly 660
cta tcc cat ctt Leu Ser His Leu 675
cca aag ttc cat Pro Lys Phe His 690
taa tgg aac aaa Trp Asn Lys
gta act acg ctg Val Thr Thr Leu 720
gtg ctg ctt tgg Val Leu Leu Trp
gtt gtg ctt Val Val Leu 585
aat gtt tgc Asn Val Cys 600
cta caa ctt Leu Gln Leu 615
ctc cac cac Leu His His
gta ctg cta Val Leu Leu
cta acg ctt Leu Thr Leu 665
tga ctg gtg Leu Val 680
cct tca tgt Pro Ser Cys 695 cct tgg cag Pro Trp Gln 710 gtc aat ttg Val Asn Leu 725 ctt cca acg Leu Pro Thr
1920
1968
2016
2064
2112
2160
2208
2256
2304
2352
2400 730 735 740
gtg aat act cca tcg ctg acg gtg gtg tcg cca agt aca aga act aca Val Asn Thr Pro Ser Leu Thr Val Val Ser Pro Ser Thr Arg Thr Thr 745 750 755
ttg ata cca tta gac aaa tcg ttg tcg aat act ctg aca tca gaa cct Leu Ile Pro Leu Asp Lys Ser Leu Ser Asn Thr Leu Thr Ser Glu Pro 760 765 770
tgt tag tca tcg aac cag att ctt tag cca att tag tca cca act tgg Cys Ser Ser Asn Gln Ile Leu Pro Ile Ser Pro Thr Trp
775 780 785
gta ctc caa agt gtg cta acg ctc aat ctg cct act tag aat gta tca Val Leu Gln Ser Val Leu Thr Leu Asn Leu Pro Thr Asn Val Ser
790 795 800
att atg cag tta ccc aat tga act tgc caa acg ttg gaa ttc tta att Ile Met Gln Leu Pro Asn Thr Cys Gln Thr Leu Glu Phe Leu Ile 805 810 815
aaa aac aaa atg aga ttt cca tca ata ttt aca gca gtt ttg ttt gcg Lys Asn Lys Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala 820 825 830
gcg agt tca gcc ctt gca gca ccc gtc aat acc acg acg gag gat gag Ala Ser Ser Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu 835 840 845
aca gcc cag atc cca gca gag gct gtg ata gga tat tta gac ctg gaa Thr Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu 850 855 860 865
ggc gat ttt gat gtg gcc gta tta ccg ttt tct aac tct acg aat aat Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn 870 875 880
gga ttg tta ttt att aat act aca att gcc tct ata gcc gca aag gaa Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu 885 890 895
gaa ggg gtg tct tta gat aag aga gaa gct gag gct gaa gcc ccc ggg
2448
2496
2544
2592
2640
2688
2736
2784
2832
2880
2928 Glu Gly Val Ser Leu Asp Lys Arg Glu Ala Glu Ala Glu Ala Pro Gly 900 905 910
act c
34
2812
DNA
Seqüência artificial Toxina assasina híbrida
Thr
<210>
<211>
<212>
<213>
<220>
<223>
<220>
<221> exon
<222> (1) .. (2812)
<4 00> 34
gag tcc cgg gca aca acc agg aac atc aac acc aga agt cca tcc aaa Glu Ser Arg Ala Thr Thr Arg Asn Ile Asn Thr Arg Ser Pro Ser Lys 15 10 15
gtt aac aac cta taa atg tac taa gag tgg agg gtg tgt age gca gga Val Asn Asn Leu Met Tyr Glu Trp Arg Val Cys Ser Ala Gly
20 25 30
cac aag tgt ggt ctt aga ctg gaa tta tcg ttg gat gca tga tgc caa His Lys Cys Gly Leu Arg Leu Glu Leu Ser Leu Asp Ala Cys Gln
35 40 45
tta taa ttc ctg tac tgt taa cgg cgg tgt taa cac tac gtt atg ccc
Leu Phe Leu Tyr Cys Arg Arg Cys His Tyr Val Met Pro
50 55
cga tga age gac ttg tgg taa gaa ttg ttt tat tga agg ggt tga cta
Arg Ser Asp Leu Trp Glu Leu Phe Tyr Arg Gly Leu
60 65 70
cgc cgc tag tgg tgt tac gac gag tgg gtc atc ctt gac gat gaa tca
Arg Arg Trp Cys Tyr Asp Glu Trp Val Ile Leu Asp Asp Glu Ser
75 80 85
2932
48
96
144
192
240
288 ata cat gcc ttc ttc tag tgg tgg gta ttc ctc tgt gtc tcc aag gct
Ile His Ala Phe Phe Trp Trp Val Phe Leu Cys Val Ser Lys Ala
90 95 100
gta ttt att gga ttc cga tgg gga ata tgt tat gtt aaa att aaa tgg
5 Val Phe Ile Gly Phe Arg Trp Gly Ile Cys Tyr Val Lys Ile Lys Trp
105 110 115
gca aga act gag ttt tga tgt gga tct atc tgc att acc ttg tgg aga
Ala Arg Thr Glu Phe Cys Gly Ser Ile Cys Ile Thr Leu Trp Arg
120 125 130
aaa tgg tag tct tta ttt atc aca aat gga cga aaa cgg cgg age caa
Lys Trp Ser Leu Phe Ile Thr Asn Gly Arg Lys Arg Arg Ser Gln
135 140 145
tca gta caa tac age tgg tgc taa tta tgg ttc agg cta ttg tga tgc
Ser Val Gln Tyr Ser Trp Cys Leu Trp Phe Arg Leu Leu Cys
150 155 160
tca atg tcc agt gca gac ttg gag gaa tgg cac ctt aaa cac atc aca Ser Met Ser Ser Ala Asp Leu Glu Glu Trp His Leu Lys His Ile Thr 165 170 175
tca agg att ttg ctg taa cga aat gga cat att aga agg taa ttc aag Ser Arg Ile Leu Leu Arg Asn Gly His Ile Arg Arg Phe Lys
180 185 190
age taa tgc act aac tcc gca ctc ttg tac tgc gag tcc cgg gca atc Ser Cys Thr Asn Ser Ala Leu Leu Tyr Cys Glu Ser Arg Ala Ile
195 200 205
cgc ttg tac cct aca atc cga aac tca ccc acc att gac ctg gca aaa Arg Leu Tyr Pro Thr Ile Arg Asn Ser Pro Thr Ile Asp Leu Ala Lys 210 215 220
gtg ttc tag cgg tgg aac ttg tac tca aca aac tgg ttc tgt tgt tat Val Phe Arg Trp Asn Leu Tyr Ser Thr Asn Trp Phe Cys Cys Tyr
225 230 235
cga cgc taa ctg gag atg gac aca cgc cac taa ctc ttc tac caa ctg Arg Arg Leu Glu Met Asp Thr Arg His Leu Phe Tyr Gln Leu
336
384
432
480
528
576
624
672
720
768 240 245 250
tta cga cgg taa cac ttg gtc ttc cac ttt atg tcc aga taa cga aac Leu Arg Arg His Leu Val Phe His Phe Met Ser Arg Arg Asn
255 260
ttg tgc taa gaa ttg ctg ttt gga cgg tgc cgc cta cgc ttc tac cta Leu Cys Glu Leu Leu Phe Gly Arg Cys Arg Leu Arg Phe Tyr Leu
265 270 275
cgg tgt tac cac ctc cgg taa ctc ctt gtc tat tgg ttt cgt cac tca Arg Cys Tyr His Leu Arg Leu Leu Val Tyr Trp Phe Arg His Ser
280 285 290
atc cgc tca aaa gaa cgt tgg tgc tag att gta ctt gat ggc ttc tga Ile Arg Ser Lys Glu Arg Trp Cys Ile Val Leu Asp Gly Phe
295 300 305
cac tac tta tca aga att tac ttt gtt ggg taa cga att ttc ttt cga His Tyr Leu Ser Arg Ile Tyr Phe Val Gly Arg Ile Phe Phe Arg
310 315 320
tgt tga cgt ttc cca att gcc atg tgg ctt gaa cgg tgc ttt gta ctt
Cys Arg Phe Pro Ile Ala Met Trp Leu Glu Arg Cys Phe Val Leu
325 330 335
tgt ctc tat gga tgc tga cgg tgg tgt ttc taa gta ccc aac taa cac
Cys Leu Tyr Gly Cys Arg Trp Cys Phe Val Pro Asn His
340 345 350
tgc cgg tgc taa gta cgg tac tgg tta ctg tga ttc tca atg tcc acg
Cys Arg Cys Val Arg Tyr Trp Leu Leu Phe Ser Met Ser Thr
355 360 365
tga ctt gaa gtt cat taa cgg tca age caa cgt cga agg ttg gga acc
Leu Glu Val His Arg Ser Ser Gln Arg Arg Arg Leu Gly Thr
370 375
atc ctc caa caa cgc taa cac cgg tat cgg tgg tca cgg ttc ctg ttg
Ile Leu Gln Gln Arg His Arg Tyr Arg Trp Ser Arg Phe Leu Leu
380 385 390
ttc cga aat gga cat ctg gga age taa cag tat ttc tga age ttt gac
864
912
960
1008
1056
1104
1152
1200
1248
1296
1344 Phe Arg Asn Gly 395
acc aca ccc atg Thr Thr Pro Met 410
atg tgg tgg aac Met Trp Trp Asn 425
aga cgg ttg tga Arg Arg Leu
tgg tcc agg ttc Trp Ser Arg Phe 450
tgt tac cca att Cys Tyr Pro Ile
aaa cgg tgt cac Lys Arg Cys His 485
tgg taa tga att Trp Ile
tgg tgg ttc ctc Trp Trp Phe Leu 510
ggc tac ctc cgg Gly Tyr Leu Arg 525
cta cgc aaa cat Leu Arg Lys His 540
His Leu Gly Ser 400
cac cac tgt cgg His His Cys Arg 415
cta ctc tga taa Leu Leu
ctg gaa ccc ata Leu Glu Pro Ile 440
ttc ttt cac ctt Phe Phe His Leu 455
cga aac ttc tgg Arg Asn Phe Trp 470
ctt cca aca acc Leu Pro Thr Thr
gaa cga cga cta Glu Arg Arg Leu 500
ttt ctc cga caa Phe Leu Arg Gln 515
tgg tat ggt ttt Trp Tyr Gly Phe 530
gtt atg gtt aga Val Met Val Arg 545
Gln Tyr Phe 405
tca aga aat ttg Ser Arg Asn Leu 420
cag ata cgg tgg Gln Ile Arg Trp 430
cag att ggg taa Gln Ile Gly 445
gga tac cac caa Gly Tyr His Gln 460
tgc tat caa cag Cys Tyr Gln Gln 475
aaa cgc tga att Lys Arg Ile
490
ctg tac cgc tga Leu Tyr Arg 505
ggg tgg ttt gac Gly Trp Phe Asp 520
ggt tat gtc ctt Gly Tyr Val Leu 535
cag tac tta ccc Gln Tyr Leu Pro 550
Ser Phe Asp
tga agg tga tgg Arg Trp
tac ttg tga ccc Tyr Leu Pro
435
cac ttc ttt cta His Phe Phe Leu
gaa gtt gac tgt Glu Val Asp Cys 465
ata cta cgt tca Ile Leu Arg Ser 480
ggg ttc tta ctc Gly Phe Leu Leu 495
aga age tga att Arg Ser Ile
cca att caa gaa Pro Ile Gln Glu
gtg gga tga tta Val Gly Leu
aac taa cga aac Asn Arg Asn
1392
1440
1488
1536
1584
1632
1680
1728
1776
1824 cga gtc ccg ggg tcc cat tag aag aaa gac aag cct gct cct ctg ttt Arg Val Pro Gly Ser His Lys Lys Asp Lys Pro Ala Pro Leu Phe
555 560 565
ggg gtc aat gtg gtg gtc aaa act ggt ctg gtc caa ctt gtt gtg ctt Gly Val Asn Val Val Val Lys Thr Gly Leu Val Gln Leu Val Val Leu 570 575 580 585
ccg gtt cta cct gtg ttt act cca acg act act att ccc aat gtt tgc Pro Val Leu Pro Val Phe Thr Pro Thr Thr Thr Ile Pro Asn Val Cys 590 595 600
cag gtg ctg ctt cct ctt cct ctt caa cta gag ctg ctt cta caa ctt Gln Val Leu Leu Pro Leu Pro Leu Gln Leu Glu Leu Leu Leu Gln Leu 605 610 615
cta ggg tct ccc caa cca ctt cca gat cct ctt ctg cta ctc cac cac Leu Gly Ser Pro Gln Pro Leu Pro Asp Pro Leu Leu Leu Leu His His 620 625 630
cag gtt cta cta cca cta gag ttc cac cag tcg gtt ccg gta ctg cta Gln Val Leu Leu Pro Leu Glu Phe His Gln Ser Val Pro Val Leu Leu 635 640 645
ctt act ctg gta acc ctt tcg tcg gtg tta ctc cat ggg cta acg ctt Leu Thr Leu Val Thr Leu Ser Ser Val Leu Leu His Gly Leu Thr Leu 650 655 660 665
act acg ctt ctg aag ttt ctt ctt tgg cta tcc cat ctt tga ctg gtg Thr Thr Leu Leu Lys Phe Leu Leu Trp Leu Ser His Leu Leu Val
670 675 680
cta tgg cta ccg ctg ctg ctg ctg tcg cca aag ttc cat cct tca tgt Leu Trp Leu Pro Leu Leu Leu Leu Ser Pro Lys Phe His Pro Ser Cys 685 690 695
ggt tgg aca cct tgg aca aaa ctc cat taa tgg aac aaa cct tgg cag Gly Trp Thr Pro Trp Thr Lys Leu His Trp Asn Lys Pro Trp Gln
700 705 710
aca taa gga ctg cta aca aga acg gcg gta act acg ctg gtc aat ttg Thr Gly Leu Leu Thr Arg Thr Ala Val Thr Thr Leu Val Asn Leu
1872
1920
1968
2016
2064
2112
2160
2208
2256
2304
2352 715 720 725
ttg tgt acg act tgc cag aca gag act gtg ctg ctt tgg ctt cca acg
Leu Cys Thr Thr Cys Gln Thr Glu Thr Val Leu Leu Trp Leu Pro Thr 730 735 740
gtg aat act cca tcg ctg acg gtg gtg tcg cca agt aca aga act aca
Val Asn Thr Pro Ser Leu Thr Val Val Ser Pro Ser Thr Arg Thr Thr 745 750 755
ttg ata cca tta gac aaa tcg ttg tcg aat act ctg aca tca gaa cct
Leu Ile Pro Leu Asp Lys Ser Leu Ser Asn Thr Leu Thr Ser Glu Pro 760 765 770
tgt tag tca tcg aac cag att ctt tag cca att tag tca cca act tgg
Cys Ser Ser Asn Gln Ile Leu Pro Ile Ser Pro Thr Trp
775 780 785
gta ctc caa agt gtg cta acg ctc aat ctg cct act tag aat gta tca
Val Leu Gln Ser Val Leu Thr Leu Asn Leu Pro Thr Asn Val Ser
790 795 800
att atg cag tta ccc aat tga act tgc caa acg ttg gaa ttc tta att
Ile Met Gln Leu Pro Asn Thr Cys Gln Thr Leu Glu Phe Leu Ile
805 810 815
aaa aac aaa atg aat ata ttt tat att ttc cta ttt ctt tta tca ttt
Lys Asn Lys Met Asn Ile Phe Tyr Ile Phe Leu Phe Leu Leu Ser Phe 820 825 830
gtg cag gga tca tta aat tgt aca tta aga gat tca caa caa aag tct
Val Gln Gly Ser Leu Asn Cys Thr Leu Arg Asp Ser Gln Gln Lys Ser 835 840 845
tta gta atg tca ggt cca tat gaa tta aaa gca tcc ctt gat aaa agg
Leu Val Met Ser Gly Pro Tyr Glu Leu Lys Ala Ser Leu Asp Lys Arg 850 855 860 865
gaa gcc gaa gcc gaa gct ccc ggg act c
Glu Ala Glu Ala Glu Ala Pro Gly Thr
870
<210> 35
2400
2448
2496
2544
2592
2640
2688
2736
2784
2812 <211> 2881
<212> DNA
<213> Seqüência artificial <220>
<223> Kjeldsen sintético e espaçador <22 0>
<221> exon
<222> (1) .. (2881)
<400> 35
gag tcc cgg gca aca acc agg aac atc aac acc aga agt cca tcc aaa
Glu Ser Arg Ala Thr Thr Arg Asn Ile Asn Thr Arg Ser Pro Ser Lys
10 15
gtt aac aac cta taa atg tac taa gag tgg agg gtg tgt age gca gga
Val Asn Asn Leu Met Tyr Glu Trp Arg Val Cys Ser Ala Gly
15-------20---------------------------------------------25_____________________________ 30__
cac aag tgt ggt ctt aga ctg gaa tta tcg ttg gat gca tga tgc caa His Lys Cys Gly Leu Arg Leu Glu Leu Ser Leu Asp Ala Cys Gln
35 40 45
tta taa ttc ctg tac tgt taa cgg cgg tgt taa cac tac gtt atg ccc Leu Phe Leu Tyr Cys Arg Arg Cys His Tyr Val Met Pro
50 55
cga tga age gac ttg tgg taa gaa ttg ttt tat tga agg ggt tga cta Arg Ser Asp Leu Trp Glu Leu Phe Tyr Arg Gly Leu
60 65 7 0
cgc cgc tag tgg tgt tac gac gag tgg gtc atc ctt gac gat gaa tca Arg Arg Trp Cys Tyr Asp Glu Trp Val Ile Leu Asp Asp Glu Ser
75 80 85
ata cat gcc ttc ttc tag tgg tgg gta ttc ctc tgt gtc tcc aag gct Ile His Ala Phe Phe Trp Trp Val Phe Leu Cys Val Ser Lys Ala
90 95 100
gta ttt att gga ttc cga tgg gga ata tgt tat gtt aaa att aaa tgg Val Phe Ile Gly Phe Arg Trp Gly Ile Cys Tyr Val Lys Ile Lys Trp
96
144
192
240
288
336
384 105 110 115
gca aga act gag ttt tga tgt gga tct atc tgc att acc ttg tgg aga Ala Arg Thr Glu Phe Cys Gly Ser Ile Cys Ile Thr Leu Trp Arg
120 125 130
aaa tgg tag tct tta ttt atc aca aat gga cga aaa cgg cgg age caa Lys Trp Ser Leu Phe Ile Thr Asn Gly Arg Lys Arg Arg Ser Gln
135 140 145
tca gta caa tac age tgg tgc taa tta tgg ttc agg cta ttg tga tgc Ser Val Gln Tyr Ser Trp Cys Leu Trp Phe Arg Leu Leu Cys
150 155 160
tca atg tcc agt gca gac ttg gag gaa tgg cac ctt aaa cac atc aca Ser Met Ser Ser Ala Asp Leu Glu Glu Trp His Leu Lys His Ile Thr 165 170 175
tca agg att ttg ctg taa cga aat gga cat att aga agg taa ttc aag Ser Arg Ile Leu Leu Arg Asn Gly His Ile Arg Arg Phe Lys 180 185 190
age taa tgc act aac tcc gca ctc ttg tac tgc gag tcc cgg gca atc Ser Cys Thr Asn Ser Ala Leu Leu Tyr Cys Glu Ser Arg Ala Ile
195 200 205
cgc ttg tac cct aca atc cga aac tca ccc acc att gac ctg gca aaa Arg Leu Tyr Pro Thr Ile Arg Asn Ser Pro Thr Ile Asp Leu Ala Lys 210 215 220
gtg ttc tag cgg tgg aac ttg tac tca aca aac tgg ttc tgt tgt tat Val Phe Arg Trp Asn Leu Tyr Ser Thr Asn Trp Phe Cys Cys Tyr
225 230 235
cga cgc taa ctg gag atg gac aca cgc cac taa ctc ttc tac caa ctg Arg Arg Leu Glu Met Asp Thr Arg His Leu Phe Tyr Gln Leu
240 245 250
tta cga cgg taa cac ttg gtc ttc cac ttt atg tcc aga taa cga aac Leu Arg Arg His Leu Val Phe His Phe Met Ser Arg Arg Asn
255 260
ttg tgc taa gaa ttg ctg ttt gga cgg tgc cgc cta cgc ttc tac cta
432
480
528
576
624
672
720
768
816
864
912 Leu Cys Glu Leu 265
cgg tgt tac cac ctc
Arg Cys Tyr His Leu
280
atc cgc tca aaa gaa Ile Arg Ser Lys Glu 295
cac tac tta tca aga His Tyr Leu Ser Arg 310
tgt tga cgt ttc cca Cys Arg Phe Pro
325
tgt ctc tat gga tgc
Cys Leu Tyr Gly Cys 340
tgc cgg tgc taa gta
Cys Arg Cys Val
355
tga ctt gaa gtt cat Leu Glu Val His
atc ctc caa caa cgc Ile Leu Gln Gln Arg 380
ttc cga aat gga cat Phe Arg Asn Gly His 395
acc aca ccc atg cac Thr Thr Pro Met His 410
Leu Phe Gly Arg Cys Arg 270
cgg taa ctc ctt gtc tat Arg Leu Leu Val Tyr
285
cgt tgg tgc tag att gta Arg Trp Cys Ile Val
300
att tac ttt gtt ggg taa Ile Tyr Phe Val Gly 315
att gcc atg tgg ctt gaa Ile Ala Met Trp Leu Glu 330
tga cgg tgg tgt ttc taa Arg Trp Cys Phe 345
cgg tac tgg tta ctg tga Arg Tyr Trp Leu Leu 360
taa cgg tca age caa cgt Arg Ser Ser Gln Arg 370
taa cac cgg tat cgg tgg His Arg Tyr Arg Trp 385
ctg gga age taa cag tat Leu Gly Ser Gln Tyr
400
cac tgt cgg tca aga aat His Cys Arg Ser Arg Asn 415
Leu Arg Phe Tyr Leu 275
tgg ttt cgt cac tca 960
Trp Phe Arg His Ser
290
ctt gat ggc ttc tga 1008
Leu Asp Gly Phe
305
cga att ttc ttt cga 1056
Arg Ile Phe Phe Arg 320
cgg tgc ttt gta ctt 1104
Arg Cys Phe Val Leu 335
gta ccc aac taa cac 1152
Val Pro Asn His
350
ttc tca atg tcc acg 1200
Phe Ser Met Ser Thr 365
cga agg ttg gga acc 1248
Arg Arg Leu Gly Thr
375
tca cgg ttc ctg ttg 1296
Ser Arg Phe Leu Leu
390
ttc tga age ttt gac 1344
Phe Ser Phe Asp
405
ttg tga agg tga tgg 1392
Leu Arg Trp
420 atg tgg tgg aac cta ctc tga taa cag ata cgg tgg tac ttg tga ccc Met Trp Trp Asn Leu Leu Gln Ile Arg Trp Tyr Leu Pro
425 430 435
aga cgg ttg tga ctg gaa ccc ata cag att ggg taa cac ttc ttt cta Arg Arg Leu Leu Glu Pro Ile Gln Ile Gly His Phe Phe Leu
440 445
tgg tcc agg ttc ttc ttt cac ctt gga tac cac caa gaa gtt gac tgt Trp Ser Arg Phe Phe Phe His Leu Gly Tyr His Gln Glu Val Asp Cys 450 455 460 465
tgt tac cca att cga aac ttc tgg tgc tat caa cag ata cta cgt tca Cys Tyr Pro Ile Arg Asn Phe Trp Cys Tyr Gln Gln Ile Leu Arg Ser 470 475 480
aaa cgg tgt cac ctt cca aca acc aaa cgc tga att ggg ttc tta ctc Lys Arg Cys His Leu Pro Thr Thr Lys Arg Ile Gly Phe Leu Leu
485 490 495
tgg taa tga att gaa cga cga cta ctg tac cgc tga aga age tga att Trp Ile Glu Arg Arg Leu Leu Tyr Arg Arg Ser Ile
500 505
tgg tgg ttc ctc ttt ctc cga caa ggg tgg ttt gac cca att caa gaa Trp Trp Phe Leu Phe Leu Arg Gln Gly Trp Phe Asp Pro Ile Gln Glu 510 515 520
ggc tac ctc cgg tgg tat ggt ttt ggt tat gtc ctt gtg gga tga tta Gly Tyr Leu Arg Trp Tyr Gly Phe Gly Tyr Val Leu Val Gly Leu
525 530 535
cta cgc aaa cat gtt atg gtt aga cag tac tta ccc aac taa cga aac Leu Arg Lys His Val Met Val Arg Gln Tyr Leu Pro Asn Arg Asn
540 545 550
cga gtc ccg ggg tcc cat tag aag aaa gac aag cct gct cct ctg ttt Arg Val Pro Gly Ser His Lys Lys Asp Lys Pro Ala Pro Leu Phe
555 560 565
ggg gtc aat gtg gtg gtc aaa act ggt ctg gtc caa ctt gtt gtg ctt Gly Val Asn Val Val Val Lys Thr Gly Leu Val Gln Leu Val Val Leu
1440
1488
1536
1584
1632
1680
1728
1776
1824
1872
1920 570 575 580 585
ccg gtt cta cct gtg ttt act cca acg act act att ccc aat gtt tgc Pro Val Leu Pro Val Phe Thr Pro Thr Thr Thr Ile Pro Asn Val Cys 590 595 600
cag gtg ctg ctt cct ctt cct ctt caa cta gag ctg ctt cta caa ctt Gln Val Leu Leu Pro Leu Pro Leu Gln Leu Glu Leu Leu Leu Gln Leu 605 610 615
cta ggg tct ccc caa cca ctt cca gat cct ctt ctg cta ctc cac cac Leu Gly Ser Pro Gln Pro Leu Pro Asp Pro Leu Leu Leu Leu His His 620 625 630
cag gtt cta cta cca cta gag ttc cac cag tcg gtt ccg gta ctg cta Gln Val Leu Leu Pro Leu Glu Phe His Gln Ser Val Pro Val Leu Leu 635 640 645
ctt act ctg gta acc ctt tcg tcg gtg tta ctc cat ggg cta acg ctt Leu Thr Leu Val Thr Leu Ser Ser Val Leu Leu His Gly Leu Thr Leu 650 655 660 665
act acg ctt ctg aag ttt ctt ctt tgg cta tcc cat ctt tga ctg gtg Thr Thr Leu Leu Lys Phe Leu Leu Trp Leu Ser His Leu Leu Val
670 675 680
cta tgg cta ccg ctg ctg ctg ctg tcg cca aag ttc cat cct tca tgt Leu Trp Leu Pro Leu Leu Leu Leu Ser Pro Lys Phe His Pro Ser Cys 685 690 695
ggt tgg aca cct tgg aca aaa ctc cat taa tgg aac aaa cct tgg cag Gly Trp Thr Pro Trp Thr Lys Leu His Trp Asn Lys Pro Trp Gln
700 705 710
aca taa gga ctg cta aca aga acg gcg gta act acg ctg gtc aat ttg Thr Gly Leu Leu Thr Arg Thr Ala Val Thr Thr Leu Val Asn Leu
715 720 725
ttg tgt acg act tgc cag aca gag act gtg ctg ctt tgg ctt cca acg Leu Cys Thr Thr Cys Gln Thr Glu Thr Val Leu Leu Trp Leu Pro Thr 730 735 740
gtg aat act cca tcg ctg acg gtg gtg tcg cca agt aca aga act aca
1968
2016
2064
2112
2160
2208
2256
2304
2352
2400
2448 Val Asn Thr Pro Ser Leu Thr Val Val Ser Pro Ser Thr Arg Thr Thr 745 750 755
ttg ata cca tta gac aaa tcg ttg tcg aat act ctg aca tca gaa cct Leu Ile Pro Leu Asp Lys Ser Leu Ser Asn Thr Leu Thr Ser Glu Pro 760 765 770
tgt tag tca tcg aac cag att ctt tag cca att tag tca cca act tgg Cys Ser Ser Asn Gln Ile Leu Pro Ile Ser Pro Thr Trp
775 780 785
gta ctc caa agt gtg cta acg ctc aat ctg cct act tag aat gta tca Val Leu Gln Ser Val Leu Thr Leu Asn Leu Pro Thr Asn Val Ser 790 795 800
att atg cag tta ccc aat tga act tgc caa acg ttg gaa ttc tta att Ile Met Gln Leu Pro Asn Thr'Cys Gln Thr Leu Glu Phe Leu Ile
805 810 815
aaa aac aaa atg aag ttg aag act gtt agg tca gcc gtt ttg agt agt Lys Asn Lys Met Lys Leu Lys Thr Val Arg Ser Ala Val Leu Ser Ser 820 825 830
tta ttt gcc tct caa gtc ttg ggt caa cca att gat gat acg gaa agt Leu Phe Ala Ser Gln Val Leu Gly Gln Pro Ile Asp Asp Thr Glu Ser 835 840 845
aat acc act tca gtt aat ttg atg gct gac gat acg gaa tct agg ttt Asn Thr Thr Ser Val Asn Leu Met Ala Asp Asp Thr Glu Ser Arg Phe 850 855 860 865
gca acg aac acg acc tta gct cta gat gtt gtg aat tta att tca atg Ala Thr Asn Thr Thr Leu Ala Leu Asp Val Val Asn Leu Ile Ser Met
870 875 880
gct aaa aga gaa gag gct gaa gct gag gcg gag ccc aag ccc ggg act c Ala Lys Arg Glu Glu Ala Glu Ala Glu Ala Glu Pro Lys Pro Gly Thr 885 890 895
<210> 36
<211> 915
<212> PRT
2496
2544
2592
2640
2688
2736
2784
2832
2881 <213> Saccharomycopsis fibuliga
<4 00> 36
Met Val Ser Phe Thr Ser Leu Leu Ala Gly Val Ala Ala Ile Ser Gly 15 10 15
Val Leu Ala Ala Pro Ala Ala Glu Val Glu Pro Val Ala Val Glu Lys 20 25 30
Arg Glu Ala Glu Ala Glu Ala Met Leu Met Ile Val Gln Leu Leu Val 35 40 45
Phe Ala Leu Gly Leu Ala Val Ala Val Pro Ile Gln Asn Tyr Thr Gln 50 55 60
Ser Pro Ser Gln Arg Asp Glu Ser Ser Gln Trp Val Ser Pro His Tyr 65 70 75 80
Tyr Pro Thr Pro Gln Gly Gly Arg Leu Gln Asp Val Trp Gln Glu Ala 85 90 95
Tyr Ala Arg Ala Lys Ala Ile Val Gly Gln Met Thr Ile Val Glu Lys 100 105 110
Val Asn Leu Thr Thr Gly Thr Gly Trp Gln Leu Asp Pro Cys Val Gly 115 120 125
Asn Thr Gly Ser Val Pro Arg Phe Gly Ile Pro Asn Leu Cys Leu Gln 130 135 140
Asp Gly Pro Leu Gly Val Arg Phe Ala Asp Phe Val Thr Gly Tyr Pro 145 150 155 160
Ser Gly Leu Ala Thr Gly Ala Thr Phe Asn Lys Asp Leu Phe Leu Gln 165 170 175
Arg Gly Gln Ala Leu Gly His Glu Phe Asn Ser Lys Gly Val His Ile 180 185 190
Ala Leu Gly Pro Ala Val Gly Pro Leu Gly Val Lys Ala Arg Gly Gly 195 200 205
Arg Asn Phe Glu Ala Phe Gly Ser Asp Pro Tyr Leu Gln Gly Thr Ala
210 215 220
Ala Ala Ala Thr Ile Lys Gly Leu Gln Glu Asn Asn Val Met Ala Cys 225 230 235 240 Val Lys His
Asp Ile Asn
Asn Ile Pro 275
Asp Ser Val 290 Val Asn Asn
305
Leu Lys Glu
Ala Gln Leu
Met Pro Gly 355
Gly Gln Asn 370
Arg Leu Asp
385
Asn Ser Phe Thr Lys Glu
Val Lys Val 435
Thr Ala Leu 450
Asn Asn Thr
465
Ser Gly Ile
Phe Ile Gly Asn 245
Pro Ala Thr Asn 260
Asp Arg Ala Met
Arg Ala Gly Val 295
Thr Tyr Ala Cys 310
Glu Leu Gly Phe 325
Ser Gly Val Tyr 340
Glu Val Tyr Gly
Leu Thr Lys Ala 375
Asp Met Ala Thr 390
Pro Thr Glu Asp 405
Tyr Gly Asn Lys 420
Asn Tyr Asn Val
Lys Val Ala Glu 455
Leu Pro Ile Ser 470
Ala Ala Gly Pro 485
Glu Gln Glu Lys Tyr 250
Gln Thr Thr Lys Glu 265
His Ala Leu Tyr Leu 280
Gly Ser Val Met Cys 300
Glu Asn Ser Tyr Met 315
Gln Gly Phe Val Val 330
Ser Ala Ile Ser Gly 345
Gly Trp Asn Thr Gly 360
Ile Tyr Asn Glu Thr 380
Arg Ile Leu Ala Ala 395
His Leu Pro Asn Phe 410
Tyr Tyr Ala Asp Asn 425
Asp Pro Ser Asn Asp 440
Glu Ser Ile Val Leu 460
Pro Glu Lys Ala Lys 475
Asp Pro Ile Gly Tyr 490
Arg Gln Pro Asp 255
Ala Ile Ser Ala 270
Trp Pro Phe Ala 285
Ser Tyr Asn Arg
Met Asn His Leu 320
Ser Asp Trp Gly 335
Leu Asp Met Ser 350
Thr Ser Phe Trp 365
Val Pro Ile Glu
Leu Tyr Ala Thr 400
Ser Ser Trp Thr 415
Thr Thr Glu Ile 430
Phe Thr Glu Asp 445
Leu Lys Asn Glu
Arg Leu Leu Leu 480
Gln Cys Glu Asp 495 Gln Ser Cys Thr Asn Gly Ala Leu Phe Gln Gly Trp Gly Ser Gly Ser 500 505 510
Val Gly Ser Pro Lys Tyr Gln Val Thr Pro Phe Glu Glu Ile Ser Tyr 515 520 525
Leu Ala Arg Lys Asn Lys Met Gln Phe Asp Tyr Ile Arg Glu Ser Tyr 530 535 540
Asp Leu Ala Gln Val Thr Lys Val Ala Ser Asp Ala His Leu Ser Ile 545 550 555 560
Val Val Val Ser Ala Ala Ser Gly Glu Gly Tyr Ile Thr Val Asp Gly 565 570 575
Asn Gln Gly Asp Arg Lys Asn Leu Thr Leu Trp Asn Asn Gly Asp Lys 580 585 590
Leu Ile Glu Thr Val Ala Glu Asn Cys Ala Asn Thr Val Val Val Val 595 600 605
Thr Ser Thr Gly Gln Ile Asn Phe Glu Gly Phe Ala Asp His Pro Asn 610 615 620
Val Thr Ala Ile Val Trp Ala Gly Pro Leu Gly Asp Arg Ser Gly Thr 625 630 635 640
Ala Ile Ala Asn Ile Leu Phe Gly Lys Ala Asn Pro Ser Gly His Leu 645 650 655
Pro Phe Thr Ile Ala Lys Thr Asp Asp Asp Tyr Ile Pro Ile Glu Thr 660 665 670
Tyr Ser Pro Ser Ser Gly Glu Pro Glu Asp Asn His Leu Val Glu Asn 675 680 685
Asp Leu Leu Val Asp Tyr Arg Tyr Phe Glu Glu Lys Asn Ile Glu Pro 690 695 700
Arg Tyr Ala Phe Gly Tyr Gly Leu Ser Tyr Asn Glu Tyr Glu Val Ser 705 710 715 720
Asn Ala Lys Val Ser Ala Ala Lys Lys Val Asp Glu Glu Leu Pro Glu 725 730 735
Pro Ala Thr Tyr Leu Ser Glu Phe Ser Tyr Gln Asn Ala Lys Asp Ser 740 745 750 Lys Asn Pro Ser Asp Ala Phe Ala Pro Ala Asp Leu Asn Arg Val Asn 755 760 765
Glu Tyr Leu Tyr Pro Tyr Leu Asp Ser Asn Val Thr Leu Lys Asp Gly 770 775 780
Asn Tyr Glu Tyr Pro Asp Gly Tyr Ser Thr Glu Gln Arg Thr Thr Pro 785 790 795 800
Asn Gln Pro Gly Gly Gly Leu Gly Gly Asn Asp Ala Leu Trp Glu Val 805 810 815
Ala Tyr Asn Ser Thr Asp Lys Phe Val Pro Gln Gly Asn Ser Thr Asp 820 825 830
Lys Phe Val Pro Gln Leu Tyr Leu Lys His Pro Glu Asp Gly Lys Phe 835 840 845
Glu Thr Pro Ile Gln Leu Arg Gly Phe Glu Lys Val Glu Leu Ser Pro 850 855 860
Gly Glu Lys Lys Thr Val Asp Leu Arg Leu Leu Arg Arg Asp Leu Ser 865 870 875 880
Val Trp Asp Thr Thr Arg Gln Ser Trp Ile Val Glu Ser Gly Thr Tyr 885 890 895
Glu Ala Leu Ile Gly Val Ala Val Asn Asp Ile Lys Thr Ser Val Leu 900 905 910
Phe Thr Ile 915
<210> 37
<211> 488
<212> PRT
<213> Trichoderma reesei
<4 00> 37
Met Asn Ile Phe Tyr Ile Phe Leu Phe Leu Leu Ser Phe Val Gln Gly 15 10 15
Ser Leu Asn Cys Thr Leu Arg Asp Ser Gln Gln Lys Ser Leu Val Met
20 25 30
Ser Gly Pro Tyr Glu Leu Lys Ala Ser Leu Asp Lys Arg Glu Ala Glu 40 45
Ala Glu Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val His Pro Lys 50 55 60
Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val Ala Gln Asp 65 70 75 80
Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His Asp Ala Asn 85 90 95
Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr Leu Cys Pro 100 105 110
Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly Val Asp Tyr 115 120 125
Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr Met Asn Gln 130 135 140
Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser Pro Arg Leu 145 150 155 160
Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys Leu Asn Gly 165 170 175
Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro Cys Gly Glu 180 185 190
Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly Gly Ala Asn 195 200 205
Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr Cys Asp Ala 210 215 220
Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn Thr Ser His 225 230 235 240
Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly Asn Ser Arg 245 250 255
Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala Cys Asp Ser 260 265 270
Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys Ser Tyr Tyr 275 280 285
Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr Ile Ile Thr 290 295 300
Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu Val Ser Ile 305 310 315 320
Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser Ala Gln Pro 325 330 335
Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala Tyr Gly Gly 340 345 350
Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val Leu Val Phe 355 360 365
Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu Asp Ser Gly 370 375 380
Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser Asn Ile Leu 385 390 395 400
Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile Arg Trp Gly 405 410 415
Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro Pro Pro Ala 420 425 430
Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr Thr Ser Ser 435 440 445
Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly Gly Ile Gly 450 455 460
Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys Gln Tyr Ser 465 470 475 480
Asn Asp Tyr Tyr Ser Gln Cys Leu
485
<210> 38
<211> 547
<212> PRT
<213> Trichoderma reesei
<4 00> 38
Met Asn Ile Phe Tyr Ile Phe Leu Phe Leu Leu Ser Phe Val Gln Gly 15 10 15 Ser Leu Asn Cys Thr Leu Arg Asp Ser Gln Gln Lys Ser Leu Val Met 20 25 30
Ser Gly Pro Tyr Glu Leu Lys Ala Ser Leu Asp Lys Arg Glu Ala Glu 35 40 45
Ala Glu Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro 50 55 60
Leu Thr Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr 65 70 75 80
Gly Ser Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn 85 90 95
Ser Ser Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys 100 105 110
Pro Asp Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala 115 120 125
Tyr Ala Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile 130 135 140
Gly Phe Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr 145 150 155 160
Leu Met Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn 165 170 175
Glu Phe Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn 180 185 190
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys 195 200 205
Tyr Pro Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp 210 215 220
Ser Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val 225 230 235 240
Glu Gly Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly 245 250 255
His Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile 260 265 270 Ser Glu Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile 275 280 285
Cys Glu Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly 290 295 300
Gly Thr Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly 305 310 315 320
Asn Thr Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr 325 330 335
Lys Lys Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn 340 345 350
Arg Tyr Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu 355 360 365
Leu Gly Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala 370 375 380
Glu Glu Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu 385 390 395 400
Thr Gln Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser 405 410 415
Leu Trp Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr 420 425 430
Pro Thr Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys 435 440 445
Ser Thr Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn 450 455 460
Ala Lys Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr 465 470 475 480
Gly Asn Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Arg Gly Thr Thr 485 490 495
Thr Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr 500 505 510
Gln Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr 515 520 525 Val Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser 530 535 540
Gln Cys Leu 545 <210> 39 <211> 492 <212> PRT <213> Trichoderma reesei <4 00> 39 Met Val Ser Phe Thr Ser Leu Leu Ala Gly Val Ala Ala Ile Ser 1 5 10 15 Val Leu Ala Ala Pro Ala Ala Glu Val Glu Pro Val Ala Val Glu 20 25 30 Arg Glu Ala Glu Ala Glu Ala Val Pro Leu Glu Glu Arg Gln Ala 35 40 45 Ser Ser Val Trp Gly Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro 50 55 60 Cys Cys Ala Ser Gly Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr 65 70 75 Gln Cys Leu Pro Gly Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala 85 90 95 Ser Thr Thr Ser Arg Val Ser Pro Thr Thr Ser Arg Ser Ser Ser 100 105 110 Thr Pro Pro Pro Gly Ser Thr Thr Thr Arg Val Pro Pro Val Gly 115 120 125 Gly Thr Ala Thr Tyr Ser Gly Asn Pro Phe Val Gly Val Thr Pro 130 135 140 Ala Asn Ala Tyr Tyr Ala Ser Glu Val Ser Ser Leu Ala Ile Pro 145 150 155 Leu Thr Gly Ala Met Ala Thr Ala Ala Ala Ala Val Ala Lys Val 165 170 175 Ser Phe Met Trp Leu Asp Thr Leu Asp Lys Thr Pro Leu Met Glu 80
160 180 185 190
Thr Leu Ala Asp Ile Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr 195 200 205
Gly Gln Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala 210 215 220
Ala Ser Asn Gly Glu Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys 225 230 235
Lys Asn Tyr Ile Asp Thr Ile Arg Gln Ile Val Val Glu Tyr Ser 245 250 255
Ile Arg Thr Leu Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Leu 260 265 270
Thr Asn Leu Gly Thr Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr 275 280 285
Glu Cys Ile Asn Tyr Ala Val Thr Gln Leu Asn Leu Pro Asn Val 290 295 300
Met Tyr Leu Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala 305 310 315
Gln Asp Pro Ala Ala Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala 325 330 335
Ser Pro Arg Ala Leu Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr 340 345 350
Gly Trp Asn Ile Thr Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala 355 360 365
Tyr Asn Glu Lys Leu Tyr Ile His Ala Ile Gly Pro Leu Leu Ala 370 375 380
His Gly Trp Ser Asn Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser 385 390 395
Lys Gln Pro Thr Gly Gln Gln Gln Trp Gly Asp Trp Cys Asn Val 405 410 415
Gly Thr Gly Phe Gly Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser 420 425 430
Leu Asp Ser Phe Val Trp Val Lys Pro Gly Gly Glu Cys Asp Gly
Ala
Leu
Tyr
240
Asp
Val
Leu
Ala
Asn
320
Ser
Asn
Val
Asn
Gly
400
Ile
Leu
Thr 435 440 445
Ser Asp Ser Ser Ala Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp 450 455 460
Ala Leu Gln Pro Ala Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe 465 470 475 480
Val Gln Leu Leu Thr Asn Ala Asn Pro Ser Phe Leu 485 490
<210> 40
<211> 879
<212> PRT
<213> Clostridium thermocellum
<400> 40
Met Arg Leu Val Asn Ser Leu Gly Arg Arg Lys Ile Leu Leu Ile Leu 15 10 15
Ala Val Ile Val Ala Phe Ser Thr Val Leu Leu Phe Ala Lys Leu Trp 20 25 30
Gly Arg Lys Thr Ser Ser Thr Leu Asp Glu Val Gly Ser Lys Thr His 35 40 45
Gly Asp Leu Thr Ala Glu Asn Lys Asn Gly Gly Tyr Leu Pro Glu Glu 50 55 60
Glu Ile Pro Asp Gln Pro Pro Ala Thr Gly Ala Phe Asn Tyr Gly Glu 65 70 75 80
Ala Leu Gln Lys Ala Ile Phe Phe Tyr Glu Cys Gln Arg Ser Gly Lys 85 90 95
Leu Asp Pro Ser Thr Leu Arg Leu Asn Trp Arg Gly Asp Ser Gly Leu 100 105 110
Asp Asp Gly Lys Asp Ala Gly Ile Asp Leu Thr Gly Gly Trp Tyr Asp 115 120 125
Ala Gly Asp His Val Lys Phe Asn Leu Pro Met Ser Tyr Ser Ala Ala 130 135 140
Met Leu Gly Trp Ala Val Tyr Glu Tyr Glu Asp Ala Phe Lys Gln Ser 145 150 155 160 Gly Gln Tyr Asn His Ile Leu Asn Asn Ile Lys Trp Ala Cys Asp Tyr 165 170 175
Phe Ile Lys Cys His Pro Glu Lys Asp Val Tyr Tyr Tyr Gln Val Gly 180 185 190
Asp Gly His Ala Asp His Ala Trp Trp Gly Pro Ala Glu Val Met Pro 195 200 205
Met Glu Arg Pro Ser Tyr Lys Val Asp Arg Ser Ser Pro Gly Ser Thr 210 215 220
Val Val Ala Glu Thr Ser Ala Ala Leu Ala Ile Ala Ser Ile Ile Phe 225 230 235 240
Lys Lys Val Asp Gly Glu Tyr Ser Lys Glu Cys Leu Lys His Ala Lys 245 250 255
Glu Leu Phe Glu Phe Ala Asp Thr Thr Lys Ser Asp Asp Gly Tyr Thr 260 265 270
Ala Ala Asn Gly Phe Tyr Asn Ser Trp Ser Gly Phe Tyr Asp Glu Leu 275 280 285
Ser Trp Ala Ala Val Trp Leu Tyr Leu Ala Thr Asn Asp Ser Ser Tyr 290 295 300
Leu Asp Lys Ala Glu Ser Tyr Ser Asp Lys Trp Gly Tyr Glu Pro Gln 305 310 315 320
Thr Asn Ile Pro Lys Tyr Lys Trp Ala Gln Cys Trp Asp Asp Val Thr 325 330 335
Tyr Gly Thr Tyr Leu Leu Leu Ala Arg Ile Lys Asn Asp Asn Gly Lys 340 345 350
Tyr Lys Glu Ala Ile Glu Arg His Leu Asp Trp Trp Thr Thr Gly Tyr 355 360 365
Asn Gly Glu Arg Ile Thr Tyr Thr Pro Lys Gly Leu Ala Trp Leu Asp 370 375 380
Gln Trp Gly Ser Leu Arg Tyr Ala Thr Thr Thr Ala Phe Leu Ala Cys 385 390 395 400
Val Tyr Ser Asp Trp Glu Asn Gly Asp Lys Glu Lys Ala Lys Thr Tyr 405 410 415 Leu Glu Phe Ala Arg Ser Gln Ala Asp Tyr Ala Leu Gly Ser Thr Gly 420 425 430
Arg Ser Phe Val Val Gly Phe Gly Glu Asn Pro Pro Lys Arg Pro His 435 440 445
His Arg Thr Ala His Gly Ser Trp Ala Asp Ser Gln Met Glu Pro Pro 450 455 460
Glu His Arg His Val Leu Tyr Gly Ala Leu Val Gly Gly Pro Asp Ser 465 470 475 480
Thr Asp Asn Tyr Thr Asp Asp Ile Ser Asn Tyr Thr Cys Asn Glu Val 485 490 495
Ala Cys Asp Tyr Asn Ala Gly Phe Val Gly Leu Leu Ala Lys Met Tyr 500 505 510
Lys Leu Tyr Gly Gly Ser Pro Asp Pro Lys Phe Asn Gly Ile Glu Glu 515 520 525
Val Pro Glu Asp Glu Ile Phe Val Glu Ala Gly Val Asn Ala Ser Gly 530 535 540
Asn Asn Phe Ile Glu Ile Lys Ala Ile Val Asn Asn Lys Ser Gly Trp 545 550 555 560
Pro Ala Arg Val Cys Glu Asn Leu Ser Phe Arg Tyr Phe Ile Asn Ile 565 570 575
Glu Glu Ile Val Asn Ala Gly Lys Ser Ala Ser Asp Leu Gln Val Ser 580 585 590
Ser Ser Tyr Asn Gln Gly Ala Lys Leu Ser Asp Val Lys His Tyr Lys 595 600 605
Asp Asn Ile Tyr Tyr Val Glu Val Asp Leu Ser Gly Thr Lys Ile Tyr 610 615 620
Pro Gly Gly Gln Ser Ala Tyr Lys Lys Glu Val Gln Phe Arg Ile Ser 625 630 635 640
Ala Pro Glu Gly Thr Val Phe Asn Pro Glu Asn Asp Tyr Ser Tyr Gln 645 650 655
Gly Leu Ser Ala Gly Thr Val Val Lys Ser Glu Tyr Ile Pro Val Tyr 660 665 670 Asp Ala Gly Val Leu Val Phe Gly 675 680
Ser Thr Ser Lys Asp Asn Gly Leu 690 695
Thr Glu Ser Gln Pro Thr Ala Lys
705 710
Phe Lys Thr Pro Ala Asn Gln Asn 725
Lys Gly Glu Val Val Leu Gln Tyr
740
Ser Asn Ser Ile Asn Pro Arg Phe 755 760
Ala Ile Asn Leu Ser Asp Val Lys 770 775
Gly Gly Ala Ser Gln Asn Phe 785 790
Ser Asn Val Thr Gly Asn Phe 805
Ala Asp Thr Cys Leu Glu Val 820
Asp Pro Gly Gly Ser Val Glu 835
Trp Ser Asn Tyr Asn Gln Ser 850 855
Leu Arg Gln Arg Thr Leu Ile
865 870
<210> 41
<211> 625
<212>
<213>
<4 00>
Met Gly
Arg Glu Pro Gly Ser Ala Ser Lys 685
Ser Lys Ala Thr Pro Thr Val Lys 700
His Thr Gln Asn Pro Ala Ser Asp 715 720
Ser Val Lys Lys Asp Gln Gly Ile 730 735
Ala Asn Gly Asn Ala Gly Ala Thr 745 750
Lys Ile Ile Asn Asn Gly Thr Lys 765
Ile Arg Tyr Tyr Tyr Thr Lys Glu 780
Cys Asp Trp Ser Ser Ala Gly Asn 795 800
Asn Leu Ser Ser Pro Lys Glu Gly 810 815
Phe Gly Ser Gly Ala Gly Thr Leu 825 830
Gln Ile Arg Phe Ser Lys Glu Asp 845
Asp Tyr Ser Phe Lys Gln Ala Cys 860
Leu Tyr Ala Thr Trp Leu Arg 875
Leu Val Val Leu Leu Leu Gly
Trp
Phe
Gly
Val
840
Asn
Tyr
PRT
Arabidopsis thaliana 41
Ser Arg Thr Thr Ile Ser Ile 10 15
Leu Val Gln Leu Ala Ile Ser Gly His Asp Tyr Lys Gln Ala Leu Ser 20 25 30
Lys Ser Ile Leu Phe Phe Glu Ala Gln Arg Ser Gly His Leu Pro Pro 35 40 45
Asn Gln Arg Val Ser Trp Arg Ser His Ser Gly Leu Tyr Asp Gly Lys 50 55 60
Ser Ser Gly Val Asp Leu Val Gly Gly Tyr Tyr Asp Ala Gly Asp Asn 65 70 75 80
Val Lys Phe Gly Leu Pro Met Ala Phe Thr Val Thr Thr Met Cys Trp
85 90 95
Ser Ile Ile Glu Tyr Gly Gly Gln Leu Glu Ser Asn Gly Glu Leu Gly 100 105 110
His Ala Ile Asp Ala Val Lys Trp Gly Thr Asp Tyr Phe Ile Lys Ala 115 120 125
His Pro Glu Pro Asn Val Leu Tyr Gly Glu Val Gly Asp Gly Lys Ser 130 135 140
Asp His Tyr Cys Trp Gln Arg Pro Glu Glu Met Thr Thr Asp Arg Arg 145 150 155 160
Ala Tyr Lys Ile Asp Arg Asn Asn Pro Gly Ser Asp Leu Ala Gly Glu
165 170 175
Thr Ala Ala Ala Met Ala Ala Ala Ser Ile Val Phe Arg Arg Ser Asp 180 185 190
Pro Ser Tyr Ser Ala Glu Leu Leu Arg His Ala His Gln Leu Phe Glu
195 200 205
Phe Ala Asp Lys Tyr Arg Gly Lys Tyr Asp Ser Ser Ile Thr Val Ala 210 215 220
Gln Lys Tyr Tyr Arg Ser Val Ser Gly Tyr Asn Asp Glu Leu Leu Trp 225 230 235 240
Ala Ala Ala Trp Leu Tyr Gln Ala Thr Asn Asp Lys Tyr Tyr Leu Asp
245 250 255
Tyr Leu Gly Lys Asn Gly Asp Ser Met Gly Gly Thr Gly Trp Ser Met 260 265 270
Thr Glu Phe Gly Trp Asp Val Lys Tyr Ala Gly Val Gln Thr Leu Val 275 280 285
Ala Lys Val Leu Met Gln Gly Lys Gly Gly Glu His Thr Ala Val Phe 290 295 300
Glu Arg Tyr Gln Gln Lys Ala Glu Gln Phe Met Cys Ser Leu Leu Gly 305 310 315 320
Lys Ser Thr Lys Asn Ile Lys Lys Thr Pro Gly Gly Leu Ile Phe Arg 325 330 335
Gln Ser Trp Asn Asn Met Gln Phe Val Thr Ser Ala Ser Phe Leu Ala 340 345 350
Thr Val Tyr Ser Asp Tyr Leu Ser Tyr Ser Lys Arg Asp Leu Leu Cys 355 360 365
Ser Gln Gly Asn Ile Ser Pro Ser Gln Leu Leu Glu Phe Ser Lys Ser 370 375 380
Gln Val Asp Tyr Ile Leu Gly Asp Asn Pro Arg Ala Thr Ser Tyr Met 385 390 395 400
Val Gly Tyr Gly Glu Asn Tyr Pro Arg Gln Val His His Arg Gly Ser 405 410 415
Ser Ile Val Ser Phe Asn Val Asp Gln Lys Phe Val Thr Cys Arg Gly 420 425 430
Gly Tyr Ala Thr Trp Phe Ser Arg Lys Gly Ser Asp Pro Asn Val Leu 435 440 445
Thr Gly Ala Leu Val Gly Gly Pro Asp Ala Tyr Asp Asn Phe Ala Asp 450 455 460
Gln Arg Asp Asn Tyr Glu Gln Thr Glu Pro Ala Thr Tyr Asn Asn Ala 465 470 475 480
Pro Leu Leu Gly Val Leu Ala Arg Leu Ile Ser Gly Ser Thr Gly Phe 485 490 495
Asp Gln Leu Leu Pro Gly Val Ser Pro Thr Pro Ser Pro Val Ile Ile 500 505 510
Lys Pro Ala Pro Val Pro Gln Arg Lys Pro Thr Lys Pro Pro Ala Ser 515 520 525
Ser Pro Ser Pro Ile Thr Ile Ser Gln Lys Met Thr Asn Ser Trp Lys 530 535 540
Asn Glu Gly Lys Val Tyr Tyr Arg Tyr Ser Thr Ile Leu Thr Asn Arg 545 550 555 560
Ser Thr Lys Thr Leu Lys Ile Leu Lys Ile Ser Ile Thr Lys Leu Tyr 565 570 575
Gly Pro Ile Trp Gly Val Thr Lys Thr Gly Asn Ser Phe Ser Phe Pro 580 585 590
Ser Trp Met Gln Ser Leu Pro Ser Gly Lys Ser Met Glu Phe Val Tyr 595 600 605
Ile His Ser Ala Ser Pro Ala Asp Val Leu Val Ser Asn Tyr Ser Leu 610 615 620
Glu
625
<210> 42
<211> 237
<212> PRT
<213> Aspergillus aculeauts
<4 00> 42
Met Lys Ala Phe His Leu Leu Ala Ala Leu Ala Gly Ala Ala Val Ala
10 15
Gln Gln Ala Gln Leu Cys Asp Gln Tyr Ala Thr Tyr Thr Gly Gly Val 20 25 30
Tyr Thr Ile Asn Asn Asn Leu Trp Gly Lys Asp Ala Gly Ser Gly Ser 35 40 45
Gln Cys Thr Thr Val Asn Ser Ala Ser Ser Ala Gly Thr Ser Trp Ser 50 55 60
Thr Lys Trp Asn Trp Ser Gly Gly Glu Asn Ser Val Lys Ser Tyr Ala
65 70 75 80
Asn Ser Gly Leu Thr Phe Asn Lys Lys Leu Val Ser Gln Ile Ser Gln
85 90 95 Ile Pro Thr Thr Ala Arg Trp Ser Tyr Asp Asn Thr Gly Ile Arg Ala 100 105 110
Asp Val Ala Tyr Asp Leu Phe Thr Ala Ala Asp Ile Asn His Val Thr 115 120 125
Trp Ser Gly Asp Tyr Glu Leu Met Ile Trp Leu Ala Arg Tyr Gly Gly 130 135 140
Val Gln Pro Ile Gly Ser Gln Ile Ala Thr Ala Thr Val Asp Gly Gln 145 150 155 160
Thr Trp Glu Leu Trp Tyr Gly Ala Asn Gly Ser Gln Lys Thr Tyr Ser 165 170 175
Phe Val Ala Pro Thr Pro Ile Thr Ser Phe Gln Gly Asp Val Asn Asp 180 185 190
Phe Phe Lys Tyr Leu Thr Gln Asn His Gly Phe Pro Ala Ser Ser Gln 195 200 205
Tyr Leu Ile Thr Leu Gln Phe Gly Thr Glu Pro Phe Thr Gly Gly Pro 210 215 220
Ala Thr Leu Ser Val Ser Asn Trp Ser Ala Ser Val Gln 225 230 235
<210> 43
<211> 895
<212> PRT
<213> Clostridium thermocellum
<4 00> 43
Met Asn Phe Arg Arg Met Leu Cys Ala Ala Ile Val Leu Thr Ile Val
1 5 10 15
Leu Ser Ile Met Leu Pro Ser Thr Val Phe Ala Leu Glu Asp Lys Ser
20 25 30
Pro Lys Leu Pro Asp Tyr Lys Asn Asp Leu Leu Tyr Glu Arg Thr Phe
40 45
Asp Glu Gly Leu Cys Phe Pro Trp His Thr Cys Glu Asp Ser Gly Gly 50 55 60
Lys Cys Asp Phe Ala Val Val Asp Val Pro Gly Glu Pro Gly Asn Lys 65 70 75
Ala Phe Arg Leu Thr Val Ile Asp Lys Gly Gln Asn Lys Trp Ser 85 90 95
Gln Met Arg His Arg Gly Ile Thr Leu Glu Gln Gly His Thr Tyr 100 105 110
Val Arg Phe Thr Ile Trp Ser Asp Lys Ser Cys Arg Val Tyr Ala 115 120 125
Ile Gly Gln Met Gly Glu Pro Tyr Thr Glu Tyr Trp Asn Asn Asn
130 135 140
Asn Pro Phe Asn Leu Thr Pro Gly Gln Lys Leu Thr Val Glu Gln
145 150 155
Phe Thr Met Asn Tyr Pro Thr Asp Asp Thr Cys Glu Phe Thr Phe
165 170 175
Leu Gly Gly Glu Leu Ala Ala Gly Thr Pro Tyr Tyr Val Tyr Leu
180 185 190
Asp Val Ser Leu Tyr Asp Pro Arg Phe Val Lys Pro Val Glu Tyr 195 200 205
Leu Pro Gln Pro Asp Val Arg Val Asn Gln Val Gly Tyr Leu Pro 210 215 220
Ala Lys Lys Tyr Ala Thr Val Val Ser Ser Ser Thr Ser Pro Leu 225 230 235
Trp Gln Leu Leu Asn Ser Ala Asn Gln Val Val Leu Glu Gly Asn 245 250 255
Ile Pro Lys Gly Leu Asp Lys Asp Ser Gln Asp Tyr Val His Trp 260 265 270
Asp Phe Ser Asn Phe Lys Thr Glu Gly Lys Gly Tyr Tyr Phe Lys 275 280 285
Pro Thr Val Asn Ser Asp Thr Asn Tyr Ser His Pro Phe Asp Ile 290 295 300
Ala Asp Ile Tyr Ser Lys Met Lys Phe Asp Ala Leu Ala Phe Phe 305 310 315
His Lys Arg Ser Gly Ile Pro Ile Glu Met Pro Tyr Ala Gly Gly
80
Val
Thr
Lys
Trp
Asn
160
His
Asp
Val
Phe
Lys
240
Thr
Ile
Leu
Ser
Tyr
320
Glu 325 330 335
Gln Trp Thr Arg Pro Ala Gly His Ile Gly Val Ala Pro Asn Lys Gly 340 345 350
Asp Thr Asn Val Pro Thr Trp Pro Gln Asp Asp Glu Tyr Ala Gly Arg 355 360 365
Pro Gln Lys Tyr Tyr Thr Lys Asp Val Thr Gly Gly Trp Tyr Asp Ala 370 375 380
Gly Asp His Gly Lys Tyr Val Val Asn Gly Gly Ile Ala Val Trp Thr 385 390 395 400
Leu Met Asn Met Tyr Glu Arg Ala Lys Ile Arg Gly Ile Ala Asn Gln
405 410 415
Gly Ala Tyr Lys Asp Gly Gly Met Asn Ile Pro Glu Arg Asn Asn Gly 420 425 430
Tyr Pro Asp Ile Leu Asp Glu Ala Arg Trp Glu Ile Glu Phe Phe Lys 435 440 445
Lys Met Gln Val Thr Glu Lys Glu Asp Pro Ser Ile Ala Gly Met Val 450 455 460
His His Lys Ile His Asp Phe Arg Trp Thr Ala Leu Gly Met Leu Pro 465 470 475 480
His Glu Asp Pro Gln Pro Arg Tyr Leu Arg Pro Val Ser Thr Ala Ala
485 490 495
Thr Leu Asn Phe Ala Ala Thr Leu Ala Gln Ser Ala Arg Leu Trp Lys 500 505 510
Asp Tyr Asp Pro Thr Phe Ala Ala Asp Cys Leu Glu Lys Ala Glu Ile 515 520 525
Ala Trp Gln Ala Ala Leu Lys His Pro Asp Ile Tyr Ala Glu Tyr Thr 530 535 540
Pro Gly Ser Gly Gly Pro Gly Gly Gly Pro Tyr Asn Asp Asp Tyr Val 545 550 555 560
Gly Asp Glu Phe Tyr Trp Ala Ala Cys Glu Leu Tyr Val Thr Thr Gly
565 570 575
Lys Asp Glu Tyr Lys Asn Tyr Leu Met Asn Ser Pro His Tyr Leu Glu 580 585 590
Met Pro Ala Lys Met Gly Glu Asn Gly Gly Ala Asn Gly Glu Asp Asn
595 600 605
Gly Leu Trp Gly Cys Phe Thr Trp Gly Thr Thr Gln Gly Leu Gly Thr
610 615 620
Ile Thr Leu Ala Leu Val Glu Asn Gly Leu Pro Ser Ala Asp Ile Gln 625 630 635 640
Lys Ala Arg Asn Asn Ile Ala Lys Ala Ala Asp Lys Trp Leu Glu Asn 645 650 655
Ile Glu Glu Gln Gly Tyr Arg Leu Pro Ile Lys Gln Ala Glu Asp Glu 660 665 670
Arg Gly Gly Tyr Pro Trp Gly Ser Asn Ser Phe Ile Leu Asn Gln Met 675 680 685
Ile Val Met Gly Tyr Ala Tyr Asp Phe Thr Gly Asn Ser Lys Tyr Leu 690 695 700
Asp Gly Met Gln Asp Gly Met Ser Tyr Leu Leu Gly Arg Asn Gly Leu 705 710 715 720
Asp Gln Ser Tyr Val Thr Gly Tyr Gly Glu Arg Pro Leu Gln Asn Pro 725 730 735
His Asp Arg Phe Trp Thr Pro Gln Thr Ser Lys Lys Phe Pro Ala Pro 740 745 750
Pro Pro Gly Ile Ile Ala Gly Gly Pro Asn Ser Arg Phe Glu Asp Pro 755 760 765
Thr Ile Thr Ala Ala Val Lys Lys Asp Thr Pro Pro Gln Lys Cys Tyr 770 775 780
Ile Asp His Thr Asp Ser Trp Ser Thr Asn Glu Ile Thr Ile Asn Trp 785 790 795 800
Asn Ala Pro Phe Ala Trp Val Thr Ala Tyr Leu Asp Glu Ile Asp Leu 805 810 815
Ile Thr Pro Pro Gly Gly Val Asp Pro Glu Glu Pro Glu Val Ile Tyr 820 825 830
Gly Asp Cys Asn Gly Asp Gly Lys Val Asn Ser Thr Asp Ala Val Ala 835 840 845
Leu Lys Arg Tyr Ile Leu Arg Ser Gly Ile Ser Ile Asn Thr Asp Asn 850 855 860
Ala Asp Val Asn Ala Asp Gly Arg Val Asn Ser Thr Asp Leu Ala Ile 865 870 875 880
Leu Lys Arg Tyr Ile Leu Lys Glu Ile Asp Val Leu Pro His Lys 885 890 895
<210> 44
<211> 438
<212> PRT
<213> Agaricus bisporus
<4 00> 44
Met Phe Lys Phe Ala Ala Leu Leu Ala Leu Ala Ser Leu Val Pro Gly 15 10 15
Phe Val Gln Ala Gln Ser Pro Val Trp Gly Gln Cys Gly Gly Asn Gly 20 25 30
Trp Thr Gly Pro Thr Thr Cys Ala Ser Gly Ser Thr Cys Val Lys Gln 35 40 45
Asn Asp Phe Tyr Ser Gln Cys Leu Pro Asn Asn Gln Ala Pro Pro Ser 50 55 60
Thr Thr Thr Gln Pro Gly Thr Thr Pro Pro Ala Thr Thr Thr Ser Gly 65 70 75 80
Gly Thr Gly Pro Thr Ser Gly Ala Gly Asn Pro Tyr Thr Gly Lys Thr 85 90 95
Val Trp Leu Ser Pro Phe Tyr Ala Asp Glu Val Ala Gln Ala Ala Ala 100 105 110
Asp Ile Ser Asn Pro Ser Leu Ala Thr Lys Ala Ala Ser Val Ala Lys 115 120 125
Ile Pro Thr Phe Val Trp Phe Asp Thr Val Ala Lys Val Prο Asp Leu 130 135 140
Gly Gly Tyr Leu Ala Asp Ala Arg Ser Lys Asn Gln Leu Val Gln Ile 145 150 155 160 Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn 165 170 175
Gly Glu Phe Ser Leu Ala Asn Asp Gly Leu Asn Lys Tyr Lys Asn Tyr 180 185 190
Val Asp Gln Ile Ala Ala Gln Ile Lys Gln Phe Pro Asp Val Ser Val 195 200 205
Val Ala Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu 210 215 220
Asn Val Gln Lys Cys Ala Asn Ala Gln Ser Ala Tyr Lys Glu Gly Val 225 230 235 240
Ile Tyr Ala Val Gln Lys Leu Asn Ala Val Gly Val Thr Met Tyr Ile 245 250 255
Asp Ala Gly Hls Ala Gly Trp Leu Gly Trp Pro Ala Asn Leu Ser Pro 260 265 270
Ala Ala Gln Leu Phe Ala Gln Ile Tyr Arg Asp Ala Gly Ser Pro Arg 275 280 285
Asn Leu Arg Gly Ile Ala Thr Asn Val Ala Asn Phe Asn Ala Leu Arg 290 295 300
Ala Ser Ser Pro Asp Pro Ile Thr Gln Gly Asn Ser Asn Tyr Asp Glu 305 310 315 320
Ile His Tyr Ile Glu Ala Leu Ala Pro Met Leu Ser Asn Ala Gly Phe 325 330 335
Pro Ala His Phe Ile Val Asp Gln Gly Arg Ser Gly Val Gln Asn Ile 340 345 350
Arg Asp Gln Trp Gly Asp Trp Cys Asn Val Lys Gly Ala Gly Phe Gly 355 360 365
Gln Arg Pro Thr Thr Asn Thr Gly Ser Ser Leu Ile Asp Ala Ile Val 370 375 380
Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Asn Ser Ser 385 390 395 400
Pro Arg Phe Asp Ser His Cys Ser Leu Ser Asp Ala His Gln Pro Ala 405 410 415 Pro Glu Ala Gly Thr Trp Phe Gln Ala Tyr Phe Glu Thr Leu Val Ala 420 425 430
Asn Ala Asn Pro Ala Leu 435
<210> 45
<211> 516
<212> PRT
<213> Phanerochaete chrysosporium
<400> 45
Met Phe Arg Thr Ala Thr Leu Leu Ala Phe Thr Met Ala Ala Met Val 15 10 15
Phe Gly Gln Gln Val Gly Thr Asn Thr Ala Glu Asn His Arg Thr Leu 20 25 30
Thr Ser Gln Lys Cys Thr Lys Ser Gly Gly Cys Ser Asn Leu Asn Thr 35 40 45
Lys Ile Val Leu Asp Ala Asn Trp Arg Trp Leu His Ser Thr Ser Gly 50 55 60
Tyr Thr Asn Cys Tyr Thr Gly Asn Gln Trp Asp Ala Thr Leu Cys Pro 65 70 75 80
Asp Gly Lys Thr Cys Ala Ala Asn Cys Ala Leu Asp Gly Ala Asp Tyr
85 90 95
Thr Gly Thr Tyr Gly Ile Thr Ala Ser Gly Ser Ser Leu Lys Leu Gln 100 105 110
Phe Val Thr Gly Ser Asn Val Gly Ser Arg Val Tyr Leu Met Ala Asp
115 120 125
Asp Thr His Tyr Gln Met Phe Gln Leu Leu Asn Gln Glu Phe Thr Phe
130 135 140
Asp Val Asp Met Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr
145 150 155 160
Leu Ser Ala Met Asp Ala Asp Gly Gly Met Ala Lys Tyr Pro Thr Asn
165 170 175
Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro 180 185 190
Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Val Glu Gly Trp 195 200 205
Ala Thr Ser Ala Asn Ala Gly Thr Gly Asn Tyr Gly Thr Cys Cys 210 215 220
Glu Met Asp Ile Trp Glu Ala Asn Asn Asp Ala Ala Ala Tyr Thr 225 230 235
His Pro Cys Thr Thr Asn Ala Gln Thr Arg Cys Ser Gly Ser Asp 245 250 255
Thr Arg Asp Thr Gly Leu Cys Asp Ala Asp Gly Cys Asp Phe Asn 260 265 270
Phe Arg Met Gly Asp Gln Thr Phe Leu Gly Lys Gly Leu Thr Val 275 280 285
Thr Ser Lys Pro Phe Thr Val Val Thr Gln Phe Ile Thr Asn Asp 290 295 300
Thr Ser Ala Gly Thr Leu Thr Glu Ile Arg Arg Leu Tyr Val Gln
305 310 315
Gly Lys Val Ile Gln Asn Ser Ser Val Lys Ile Pro Gly Ile Asp 325 330 335
Val Asn Ser Ile Thr Asp Asn Phe Cys Ser Gln Gln Lys Thr Ala 340 345 350
Gly Asp Thr Asn Tyr Phe Ala Gln His Gly Gly Leu Lys Gln Val 355 360 365
Glu Ala Leu Arg Thr Gly Met Val Leu Ala Leu Ser Ile Trp Asp 370 375 380
Tyr Ala Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr Asn 385 390 395
Asp Pro Ser Thr Pro Gly Val Ala Arg Gly Thr Cys Ala Thr Thr 405 410 415
Gly Val Pro Ala Gln Ile Glu Ala Gln Ser Pro Asn Ala Tyr Val 420 425 430
Phe Ser Asn Ile Lys Phe Gly Asp Leu Asn Thr Thr Tyr Thr Gly
Asn
Thr
Pro
240
Cys
Ser
Asp
Gly
Asn
320
Pro
Phe
Gly
Asp
Lys
400
Ser
Val
Thr 435 440 445
Val Ser Ser Ser Ser Val Ser Ser Ser His Ser Ser Thr Ser Thr Ser 450 455 460
Ser Ser His Ser Ser Ser Ser Thr Pro Pro Thr Gln Pro Thr Gly Val 465 470 475 480
Thr Val Pro Gln Trp Gly Gln Cys Gly Gly Ile Gly Tyr Thr Gly Ser 485 490 495
Thr Thr Cys Ala Ser Pro Tyr Thr Cys His Val Leu Asn Pro Tyr Tyr 500 505 510
Ser Gln Cys Tyr 515
<210> 46
<211> 444
<212> PRT
<213> Thermotoga neapolitana
<400> 46
Met Lys Lys Phe Pro Glu Gly Phe Leu Trp Gly Val Ala Thr Ala Ser 15 10 15
Tyr Gln Ile Glu Gly Ser Pro Leu Ala Asp Gly Ala Gly Met Ser Ile
20 25 30
Trp His Thr Phe Ser His Thr Pro Gly Asn Val Lys Asn Gly Asp Thr
40 45
Gly Asp Val Ala Cys Asp His Tyr Asn Arg Trp Lys Glu Asp Ile Glu 50 55 60
Ile Ile Glu Lys Ile Gly Ala Lys Ala Tyr Arg Phe Ser Ile Ser Trp 65 70 75 80
Pro Arg Ile Leu Pro Glu Gly Thr Gly Lys Val Asn Gln Lys Gly Leu 85 90 95
Asp Phe Tyr Asn Arg Ile Ile Asp Thr Leu Leu Glu Lys Asn Ile Thr
100 105 110
Pro Phe Ile Thr Ile Tyr His Trp Asp Leu Pro Phe Ser Leu Gln Leu 115 120 125 Lys Gly Gly Trp Ala Asn Arg Asp Ile Ala Asp Trp Phe Ala Glu 130 135 140
Ser Arg Val Leu Phe Glu Asn Phe Gly Asp Arg Val Lys His Trp 145 150 155
Thr Leu Asn Glu Pro Trp Val Val Ala Ile Val Gly His Leu Tyr
165 170 175
Val His Ala Pro Gly Met Lys Asp Ile Tyr Val Ala Phe His Thr 180 185 190
His Asn Leu Leu Arg Ala His Ala Lys Ser Val Lys Val Phe Arg 195 200 205
Thr Val Lys Asp Gly Lys Ile Gly Ile Val Phe Asn Asn Gly Tyr 210 215 220
Glu Pro Ala Ser Glu Arg Glu Glu Asp Ile Arg Ala Ala Arg Phe 225 230 235
His Gln Phe Asn Asn Tyr Pro Leu Phe Leu Asn Pro Ile Tyr Arg
245 250 255
Glu Tyr Pro Asp Leu Val Leu Glu Phe Ala Arg Glu Tyr Leu Pro 260 265 270
Asn Tyr Glu Asp Asp Met Glu Glu Ile Lys Gln Glu Ile Asp Phe 275 280 285
Gly Leu Asn Tyr Tyr Ser Gly His Met Val Lys Tyr Asp Pro Asn 290 295 300
Pro Ala Arg Val Ser Phe Val Glu Arg Asn Leu Pro Lys Thr Ala 305 310 315
Gly Trp Glu Ile Val Pro Glu Gly Ile Tyr Trp Ile Leu Lys Gly
325 330 335
Lys Glu Glu Tyr Asn Pro Gln Glu Val Tyr Ile Thr Glu Asn Gly 340 345 350
Ala Phe Asp Asp Val Val Ser Glu Gly Gly Lys Val His Asp Gln 355 360 365
Arg Ile Asp Tyr Leu Arg Ala His Ile Glu Gln Val Trp Arg Ala 370 375 380
Tyr
Ile
160
Gly
Val
Glu
Phe
Met
240
Gly
Arg
Val
Ser
Met
320
Val
Ala
Asn
Ile Gln Asp Gly Val Pro Leu Lys Gly Tyr Phe Val Trp Ser Leu Leu Asp 385 390 395 400
Asn Phe Glu Trp Ala Glu Gly Tyr Ser Lys Arg Phe Gly Ile Val Tyr 405 410 415
Val Asp Tyr Asn Thr Gln Lys Arg Ile Ile Lys Asp Ser Gly Tyr Trp 420 425 430
Tyr Ser Asn Gly Ile Lys Asn Asn Gly Leu Thr Asp 435 440
<210> 47
<211> 455
<212> PRT
<213> Caldocellum saccharolyticum
<400> 47
Met Asp Met Ser Phe Pro Lys Gly Phe Leu Trp Gly Ala Ala Thr Ala
1 5 10 15
Ser Tyr Gln Ile Glu Gly Ala Trp Asn Glu Asp Gly Lys Gly Glu Ser 20 25 30
Ile Trp Asp Arg Phe Thr His Gln Lys Arg Asn Ile Leu Tyr Gly His 35 40 45
Asn Gly Asp Val Ala Cys Asp His Tyr His Arg Phe Glu Glu Asp Val 50 55 60
Ser Leu Met Lys Glu Leu Gly Leu Lys Ala Tyr Arg Phe Ser Ile Ala 65 70 75 80
Trp Thr Arg Ile Phe Pro Asp Gly Phe Gly Thr Val Asn Gln Lys Gly 85 90 95
Leu Glu Phe Tyr Asp Arg Leu Ile Asn Lys Leu Val Glu Asn Gly Ile 100 105 110
Glu Pro Val Val Thr Leu Tyr His Trp Asp Leu Pro Gln Lys Leu Gln 115 120 125
Asp Ile Gly Gly Trp Ala Asn Pro Glu Ile Val Asn Tyr Tyr Phe Asp 130 135 140
Tyr Ala Met Leu Val Ile Asn Arg Tyr Lys Asp Lys Val Lys Lys Trp 145 150 155 160
Ile Thr Phe Asn Glu Pro Tyr Cys Ile Ala Phe Leu Gly Tyr Phe His 165 170 175
Gly Ile His Ala Pro Gly Ile Lys Asp Phe Lys Val Ala Met Asp Val 180 185 190
Val His Ser Leu Met Leu Ser His Phe Lys Val Val Lys Ala Val Lys 195 200 205
Glu Asn Asn Ile Asp Val Glu Val Gly Ile Thr Leu Asn Leu Thr Pro 210 215 220
Val Tyr Leu Gln Thr Glu Arg Leu Gly Tyr Lys Val Ser Glu Ile Glu 225 230 235 240
Arg Glu Met Val Ser Leu Ser Ser Gln Leu Asp Asn Gln Leu Phe Leu 245 250 255
Asp Pro Val Leu Lys Gly Ser Tyr Pro Gln Lys Leu Leu Asp Tyr Leu
260 265 270
Val Gln Lys Asp Leu Leu Asp Ser Gln Lys Ala Leu Ser Met Gln Gln 275 280 285
Glu Val Lys Glu Asn Phe Ile Phe Pro Asp Phe Leu Gly Ile Asn Tyr 290 295 300
Tyr Thr Arg Ala Val Arg Leu Tyr Asp Glu Asn Ser Ser Trp Ile Phe 305 310 315 320
Pro Ile Arg Trp Glu His Pro Ala Gly Glu Tyr Thr Glu Met Gly Trp 325 330 335
Glu Val Phe Pro Gln Gly Leu Phe Asp Leu Leu Ile Trp Ile Lys Glu 340 345 350
Ser Tyr Pro Gln Ile Pro Ile Tyr Ile Thr Glu Asn Gly Ala Ala Tyr 355 360 365
Asn Asp Ile Val Thr Glu Asp Gly Lys Val His Asp Ser Lys Arg Ile 370 375 380
Glu Tyr Leu Lys Gln His Phe Glu Ala Ala Arg Lys Ala Ile Glu Asn 385 390 395 400
Gly Val Asp Leu Arg Gly Tyr Phe Val Trp Ser Leu Met Asp Asn Phe 405 410 415
Glu Trp Ala Met Gly Tyr Thr Lys Arg Phe Gly Ile Ile Tyr Val Asp 420 425 430
Tyr Glu Thr Gln Lys Arg Ile Lys Lys Asp Ser Phe Tyr Phe Tyr Gln 435 440 445
Gln Tyr Ile Lys Glu Asn Ser 450 455

Claims (37)

1. Célula de levedura transformada que expressa uma pluralida- de de genes, caracterizada pelo fato de que os genes codificam a expressão de enzimas presas, incluindo endoglicanase, celobio-hidrolase e β- glicosidase.
2. Levedura como definida na reivindicação 1, caracterizada pelo fato de que a levedura é membro do gênero Saccharomyces.
3. Levedura como definida na reivindicação 1, caracterizada pelo fato de que a levedura é selecionada do grupo que consiste em Saccha- romyees eerevisiae, Schizosacchormyces pombe, Candida albieans, Kluyve- romyees iaetis, Piehia pastoris, Piehia stipitis, Yarrowia lipolytiea, Hansenula polymorpha, Phaffia rhodozyma, Candida utilis, Arxula adeninivorans, De- baryomyees hansenii, Debaryomyees polymorphus, Kluyveromyces marxia- nus, Issatehenkia orientalis e Schwanniomyees oeeidentalis.
4. Levedura como definida na reivindicação 1, caracterizada pelo fato de que a levedura é Saccharomyees eerevisiae.
5. Levedura como definida na reivindicação 1, caracterizada pelo fato de que os genes codificam endoglicanase I (EGI), celobio-hidrolase I (CBHI), celobio-hidrolase Il (CHBII) e β-glicosidase (BGLI).
6. Método para seleção de célula transformada de levedura com afinidade aumentada de ligação à celulose insolúvel, caracterizado pelo fato de que compreende: transformação de um organismo nativo para produção da leve- dura como definida na reivindicação 1, para produzir um hospedeiro de Ieve- dura transformada; cultura do hospedeiro de levedura transformada, sob condições adequadas por um e período suficiente para permitir o crescimento e repli- cação do hospedeiro de levedura transformada; exposição de uma amostra do hospedeiro de levedura transfor- mada a partir da cultura à celulose solúvel; e seleção da amostra do hospedeiro de levedura transformada que forneça uma redução de pelo menos duas vezes em densidade óptica de sobrenadante, em relação a uma amostra igualmente cultivada e exposta do organismo nativo.
7. Método para produção de etanol, caracterizado pelo fato de que o referido método compreende: transformação de um organismo nativo para produção da leve- dura como definida na reivindicação 1, para produzir um hospedeiro de leve- dura transformada; e cultura do hospedeiro de levedura transformada em meio que contenha celulose, sob condições adequadas e por um período suficiente que permita a sacarificação e fermentação da celulose para etanol.
8. Método de acordo com a reivindicação 7, caracterizado pelo fato de que o hospedeiro de levedura é um membro do gênero Saceharomy- ces.
9. Método de acordo com a reivindicação 7, caracterizado pelo fato de que o hospedeiro de levedura é selecionado do grupo constituído por Saccharomyees eerevisiae, Schizosacehormyees pombe, Candida albieans, Kluyveromyces laetis, Piehia pastoris, Piehia stipitis, Yarrowia lipolytiea, Han- senula polymorpha, Phaffia rhodozyma, Candida utilis, Arxula adeninivorans, Debaryomyees hansenii, Debaryomyees polymorphus, Kluyveromyces mar- xianus, Issatehenkia orientalis e Schwanniomyees oeeidentalis.
10. Método de acordo com a reivindicação 7, caracterizado pelo fato de que a levedura é Saccharomyees eerevisiae.
11. Método de acordo com a reivindicação 7, caracterizado pelo fato de que os genes codificam endoglicanase I (EGI), celobio-hidrolase I (CBHI), celobio-hidrolase Il (CHBII) e β-glicosidase (BGLI).
12. Organismo transformado, caracterizado pelo fato de que compreende: uma levedura que em estado nativo não possui a capacidade para sacarificar celulose, em que a levedura é transformada com polinucleotídeos heteró- Iogos que expressam uma pluralidade de enzimas que conferem à levedura a capacidade para sacarificar celulose cristalina.
13. Levedura como definida na reivindicação 12, caracterizada pelo fato de que a referida levedura é membro do gênero Saccharomyces.
14. Levedura como definida na reivindicação 12, caracterizada pelo fato de que a levedura é selecionada do grupo constituído por Saecha- romyees eerevisiae, Schizosacchormyces pombe, Candida albieans, Kluyve- romyees laetis, Piehia pastoris, Piehia stipitis, Yarrowia lipolytiea, Hansenula polymorpha, Phaffia rhodozyma, Candida utilis, Arxula adeninivorans, De- baryomyees hansenii, Debaryomyees polymorphus, Kluyveromyces marxia- nus, Issatehenkia orientalis e Schwanniomyees oceidentalis.
15. Levedura como definida na reivindicação 12, caracterizada pelo fato de que a levedura é Saccharomyces eerevisiae.
16. Levedura como definida na reivindicação 12, caracterizada pelo fato de que os polinucleotídeos codificam a expressão de pelo menos, uma endoglicanase, pelo menos, uma celobio-hidrolase e pelo menos uma β-glicosidase.
17. Levedura de acordo com a reivindicação 16, caracterizada pelo fato de que a endoglicanase, celobio-hidrolase e β-glicosidase estão presas à superfície celular da levedura.
18. Levedura como definida na reivindicação 12, caracterizada pelo fato de que os polinucleotídeos codificam endoglicanase I (EGI), celo- bio-hidrolase I (CBHI), celobio-hidrolase Il (CHBII) e β-glicosidase (BGLI).
19. Método para seleção de célula transformada de levedura com afinidade aumentada de ligação à celulose insolúvel, caracterizado pelo fato de que compreende: transformação de um organismo nativo para produção da leve- dura como definida na reivindicação 12, para produzir um hospedeiro de le- vedura transformada; cultura do hospedeiro de levedura transformada, sob condições adequadas por um período suficiente para permitir o crescimento e replica- ção do hospedeiro de levedura transformada; exposição de uma amostra do hospedeiro de levedura transfor- mada, proveniente da cultura, à celulose insolúvel; e seleção da amostra de levedura hospedeira transformada que forneça uma redução de pelo menos duas vezes em densidade óptica de sobrenadante, em relação a uma amostra igualmente cultivada e exposta do organismo nativo.
20. Método para produção de etanol, caracterizado pelo fato de que o referido método compreende: transformação de um organismo nativo para produção da leve- dura como definida na reivindicação 12, para produzir um hospedeiro de le- vedura transformada; e cultura do hospedeiro de levedura transformada em meio que contenha celulose, sob condições adequadas e por um período suficiente que permita a sacarificação e fermentação da celulose para etanol.
21. Método de acordo com a reivindicação 20, caracterizado pe- lo fato de que o hospedeiro de levedura é membro do gênero Saccharomy- ces.
22. Método de acordo com a reivindicação 20, caracterizado pe- lo fato de que o hospedeiro de levedura é selecionada do grupo constituído por Saccharomyces eerevisiae, Schizosacchormyces pombe, Candida albi- cans, Kluyveromyces lactis, Pichia pastoris, Pichia stipitis, Yarrowia Iipolyti- ca, Hansenula polymorpha, Phaffia rhodozyma, Candida utilis, Arxula adeni- nivorans, Debaryomyces hansenii, Debaryomyees polymorphus, Kluyve- romyces marxianus, Issatchenkia orientalis e Schwanniomyces occidentalis.
23. Método de acordo com a reivindicação 20, caracterizado pe- lo fato de que a levedura é Saccharomyces eerevisiae.
24. Método de acordo com a reivindicação 20, caracterizado pe- lo fato de que os polinucleotídeos codificam pelo menos uma endoglicanase, pelo menos uma celobio-hidrolase e pelo menos uma β-glicosidase.
25. Levedura como definida na reivindicação 24, caracterizada pelo fato de que a endoglicanase, a celobio-hidrolase e a β-glicosidase estão presas à superfície celular da levedura.
26. Polinucleotídeo isolado, caracterizado pelo fato de que com- preende: (a) uma seqüência de polinucleotídeos igual a SEQ ID NO:11; (b) uma seqüência de polinucleotídeos igual a SEQ ID NO:12; (c) uma seqüência de polinucleotídeos igual a SEQ ID NO:28; (d) uma seqüência de polinucleotídeos igual a SEQ ID NO:29; e (e) uma seqüência de polinucleotídeos igual a SEQ ID N0:30; ou (f) uma seqüência de polinucleotídeos com pelo menos aproxi- madamente 90% de identidade de seqüência com as seqüências de polinu- cleotídeos iguais a (a)-(e).
27. Polinucleotídeo de acordo com a reivindicação 26, caracteri- zado pelo fato de que tem aproximadamente 95% de identidade de seqüên- cia com as seqüências de polinucleotídeos iguais a (a)-(e).
28. Vetor, caracterizado pelo fato de que compreende o polinu- cleotídeo isolado como definido na reivindicação 27.
29. Célula hospedeira geneticamente construída, caracterizada pelo fato de que é para expressar um complemento do polinucleotídeo como definido na reivindicação 27.
30. Célula hospedeira de acordo com a reivindicação 29, carac- terizada pelo fato de que a célula hospedeira é uma célula de levedura.
31. Método de produção de etanol, caracterizado pelo fato de que compreende: cultura de uma célula hospedeira de levedura como definida na reivindicação 29, em meio contendo celulose sob condições adequadas e por um período de tempo suficiente para permitir a sacarificação e fermenta- ção da celulose para etanol.
32. Método de acordo com a reivindicação 31, caracterizado pe- lo fato de que a levedura da célula hospedeira é membro do gênero Saccha- romyces.
33. Método de acordo com a reivindicação 31, caracterizado pe- lo fato de que a levedura da célula hospedeira é selecionado do grupo cons- tituído por Saccharomyces eerevisiae, Schizosacchormyces pombe, Candida albicans, Kluyveromyces lactis, Pichia pastoris, Pichia stipitis, Yarrowia Ii- polytica, Hansenula polymorpha, Phaffia rhodozyma, Candida utilis, Arxula < adeninivorans, Debaryomyces hansenii, Debaryomyces polymorphus, Kluy- veromyees marxianus, Issatehenkia orientalis e Schwanniomyees occidenta- Hs.
34. Método de acordo com a reivindicação 31, caracterizado pe- lo fato de que a levedura da célula é Saccharomyces eerevisiae.
35. Construto genético, caracterizado pelo fato de que compre- ende as SEQ ID N0:11, SEQ ID N0:12, SEQ ID NO:28, SEQ ID NO:29 e SEQ ID N0:30, conectadas operacionalmente a promotores capazes de se expressarem em levedura.
36. Levedura recombinante, caracterizada pelo fato de que com- preende o construto genético como definido na reivindicação 35.
37. Levedura recombinante de acordo com a reivindicação 36, caracterizada pelo fato de que compreende Saccharomyces eerevisiae.
BRPI0719299-1A 2006-11-22 2007-11-21 Célula de levedura transformada que expressa uma pluralidade de genes, métodos para seleção de célula transformada de levedura com afinidade aumentada de ligação à celulose insolúvel e para produção de etanol, organismo transformado, polinucleotídeo isolado, vetor, célula hospedeira geneticamente construída e construto genético BRPI0719299A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US86701806P 2006-11-22 2006-11-22
US60/867,018 2006-11-22
PCT/US2007/085390 WO2008064314A2 (en) 2006-11-22 2007-11-21 Recombinant yeast strains expressing tethered cellulase enzymes

Publications (1)

Publication Number Publication Date
BRPI0719299A2 true BRPI0719299A2 (pt) 2014-03-18

Family

ID=39430591

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0719299-1A BRPI0719299A2 (pt) 2006-11-22 2007-11-21 Célula de levedura transformada que expressa uma pluralidade de genes, métodos para seleção de célula transformada de levedura com afinidade aumentada de ligação à celulose insolúvel e para produção de etanol, organismo transformado, polinucleotídeo isolado, vetor, célula hospedeira geneticamente construída e construto genético

Country Status (5)

Country Link
US (1) US20100075363A1 (pt)
EP (2) EP2099923A2 (pt)
BR (1) BRPI0719299A2 (pt)
CA (1) CA2670102A1 (pt)
WO (1) WO2008064314A2 (pt)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3021166C (en) 2008-05-11 2024-01-09 Universiteit Stellenbosch Heterologous expression of fungal cellobiohydrolases in yeast
CA2724036C (en) 2008-05-11 2018-09-25 Mascoma Corporation Construction of protrophic/celluloytic yeast strains expressing tethered and secreted cellulases
US8563272B2 (en) 2008-06-27 2013-10-22 Edeniq, Inc. Cellulosic protein expression in yeast
JP2010046034A (ja) * 2008-08-22 2010-03-04 Toyota Central R&D Labs Inc 変異体のスクリーニング方法
CN108315272A (zh) 2008-11-21 2018-07-24 拉勒曼德匈牙利流动性管理有限责任公司 用于使用纤维素进行同时糖化和发酵的表达纤维素酶的酵母
KR101106061B1 (ko) * 2009-06-05 2012-01-18 고려대학교 산학협력단 바이오 에탄올 생산능이 향상된 재조합 벡터 및 그 형질 전환체
CA2778998A1 (en) 2009-10-26 2011-05-05 Universiteit Stellenbosch (Also Known As Stellenbosch University) Heterologous expression of fungal cellobiohydrolase 2 genes in yeast
US20130071884A1 (en) 2009-11-06 2013-03-21 Agrivida, Inc. Plants expressing cell wall degrading enzymes and expression vectors
FR2957922A1 (fr) * 2010-03-26 2011-09-30 Inst Francais Du Petrole Nouvelles proteines de fusion cbh1-eg1 et leur utilisation
JP2011234683A (ja) * 2010-05-12 2011-11-24 Bio−energy株式会社 セルロースの糖化力が増強された酵母
BR112012031362A2 (pt) 2010-06-03 2015-10-13 Mascoma Corp levedura expressando enzimas sacarolíticas para bioprocessamento consolidado usando amido e celulose
US9598700B2 (en) 2010-06-25 2017-03-21 Agrivida, Inc. Methods and compositions for processing biomass with elevated levels of starch
US10443068B2 (en) 2010-06-25 2019-10-15 Agrivida, Inc. Plants with engineered endogenous genes
US8557586B2 (en) * 2010-12-10 2013-10-15 National University Corporation Kobe University Cellulose degradable yeast and method for production thereof
CN106244622B (zh) * 2011-03-07 2020-06-12 谷万达公司 在工程植物中表达多种蛋白的表达盒和表达载体及制备工程植物和生产可溶性糖的方法
MX2015007234A (es) 2012-12-12 2015-10-29 Danisco Us Inc Variantes de celobiohidrolasas.
CN103103221B (zh) * 2013-01-29 2014-12-03 广州分子生物技术有限公司 一种利用基因重组酵母混合培养将纤维素转化为乙醇的方法
US8778641B1 (en) * 2013-02-12 2014-07-15 Novozymes Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
WO2018167670A1 (en) * 2017-03-13 2018-09-20 Lallemand Hungary Liquidity Management Llc Recombinant yeast host cells expressing cell-associated heterologous proteins
US20200087672A1 (en) * 2017-03-13 2020-03-19 Lallemand Hungary Liquidity Management Llc Cell-associated heterologous food and/or feed enzymes
JP7194112B2 (ja) * 2017-03-13 2022-12-21 ラレマンド ハンガリー リクィディティー マネジメント エルエルシー 細胞結合型異種タンパク質を発現する組換え酵母宿主細胞
CN113322270A (zh) * 2021-03-12 2021-08-31 上海国龙生物科技有限公司 一种表达混合酶制剂的毕赤酵母的制备方法及其应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2322607B1 (en) * 2002-08-16 2015-09-16 Danisco US Inc. Novel variant Hyprocrea jecorina CBH1 cellulases with increase thermal stability comprising substitution or deletion at position S113
EP1827079A4 (en) * 2004-12-21 2012-04-11 Monsanto Technology Llc TRANSGENIC PLANTS HAVING SUPERIOR AGRONOMIC CHARACTERS

Also Published As

Publication number Publication date
EP2505655A3 (en) 2012-11-28
EP2505655A2 (en) 2012-10-03
US20100075363A1 (en) 2010-03-25
WO2008064314A3 (en) 2008-10-23
EP2099923A2 (en) 2009-09-16
WO2008064314A2 (en) 2008-05-29
CA2670102A1 (en) 2008-05-29

Similar Documents

Publication Publication Date Title
BRPI0719299A2 (pt) Célula de levedura transformada que expressa uma pluralidade de genes, métodos para seleção de célula transformada de levedura com afinidade aumentada de ligação à celulose insolúvel e para produção de etanol, organismo transformado, polinucleotídeo isolado, vetor, célula hospedeira geneticamente construída e construto genético
US20210388398A1 (en) Yeast expressing cellulases for simultaneous saccharification and fermentation using cellulose
US20230028975A1 (en) Yeast expressing saccharolytic enzymes for consolidated bioprocessing using starch and cellulose
US11530428B2 (en) Nucleic acids encoding fungal cellobiohydrolases for expression in yeast
US8470592B2 (en) Isolation and characterization of Schizochytrium aggregatum cellobiohydrolase I (Cbh 1)
Lynd et al. Microbial cellulose utilization: fundamentals and biotechnology
CA2657684C (en) Construction of highly efficient cellulase compositions for enzymatic hydrolysis of cellulose
Chang et al. Assembling a cellulase cocktail and a cellodextrin transporter into a yeast host for CBP ethanol production
JP2013500019A (ja) 糖輸送、混合糖の発酵および生物燃料の産生を促進させる方法ならびに組成物
BR122018013596B1 (pt) Células hospedeiras de saccharomyces cerevisiae bem como processos para hidrólise de um substrato celulósico e para fermentação de celulose
Xu et al. Expression and secretion of fungal endoglucanase II and chimeric cellobiohydrolase I in the oleaginous yeast Lipomyces starkeyi
Zhang et al. Saccharomyces cerevisiae cell surface display technology: Strategies for improvement and applications
WO2014078716A1 (en) Recombinant bacillus subtilis that can grow on plant biomass
CN103562216A (zh) 纤维糊精和β-D-葡萄糖的增强型发酵
US20130230888A1 (en) Heterologous Expression of Fungal Cellobiohydrolase 2 Genes in Yeast
JP7319652B2 (ja) タンパク質細胞表層発現酵母
Bae Construction of an efficient degradation system for cellulosic biomass
JP2011160727A (ja) 高温でセルロースからエタノールを生産する方法
Du Plessis Co-expression of cellulase genes in Saccharomyces cerevisiae for cellulose degradation

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 8A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2343 DE 01-12-2015 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.