BR0111680B1 - Processos de construção de um banco combinatório de expressão funcional, de produção de proteínas mosaico funcionais ativas, de análise do referido banco, de determinação de ligações entre assinaturas de sequencias e assinaturas funcionais de uma proteína, de predição de estruturas com uma determinada função, de obtenção de uma proteína possuindo propriedades melhoradas, bem como de determinação de uma estrutura de uma proteína - Google Patents

Processos de construção de um banco combinatório de expressão funcional, de produção de proteínas mosaico funcionais ativas, de análise do referido banco, de determinação de ligações entre assinaturas de sequencias e assinaturas funcionais de uma proteína, de predição de estruturas com uma determinada função, de obtenção de uma proteína possuindo propriedades melhoradas, bem como de determinação de uma estrutura de uma proteína Download PDF

Info

Publication number
BR0111680B1
BR0111680B1 BRPI0111680-0A BR0111680A BR0111680B1 BR 0111680 B1 BR0111680 B1 BR 0111680B1 BR 0111680 A BR0111680 A BR 0111680A BR 0111680 B1 BR0111680 B1 BR 0111680B1
Authority
BR
Brazil
Prior art keywords
functional
bank
combinatorial
yeast
proteins
Prior art date
Application number
BRPI0111680-0A
Other languages
English (en)
Other versions
BR0111680A (pt
Inventor
Gilles Truan
Valerie Abecassis
Denis Pompon
Original Assignee
Aventis Pharma Sa
Centre Nat Rech Scient
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aventis Pharma Sa, Centre Nat Rech Scient filed Critical Aventis Pharma Sa
Publication of BR0111680A publication Critical patent/BR0111680A/pt
Publication of BR0111680B1 publication Critical patent/BR0111680B1/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1027Mutagenizing nucleic acids by DNA shuffling, e.g. RSR, STEP, RPR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1072Differential gene expression library synthesis, e.g. subtracted libraries, differential screening
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1079Screening libraries by altering the phenotype or phenotypic trait of the host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • C12N9/0038Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12N9/0042NADPH-cytochrome P450 reductase (1.6.2.4)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Ecology (AREA)
  • Virology (AREA)
  • Cell Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
  • Soy Sauces And Products Related Thereto (AREA)

Description

Relatório Descritivo da Patente de Invenção para "PROCESSOS
DE CONSTRUÇÃO DE UM BANCO COMBINATÓRIO DE EXPRESSÃO
FUNCIONAL, DE PRODUÇÃO DE PROTEÍNAS MOSAICO FUNCIONAIS
ATIVAS, DE ANÁLISE DO REFERIDO BANCO, DE DETERMINAÇÃO DE
LIGAÇÕES ENTRE ASSINATURAS DE SEQUÊNCIAS E ASSINATURAS
FUNCIONAIS DE UMA PROTEÍNA, DE PREDIÇÃO DE ESTRUTURAS COM UMA DETERMINADA FUNÇÃO, DE OBTENÇÃO DE UMA PROTEÍ- NA POSSUINDO PROPRIEDADES MELHORADAS, BEM COMO DE DE- TERMINAÇÃO DE UMA ESTRUTURA DE UMA PROTEÍNA". A presente invenção refere-se a um processo de fabricação de bancos combinatórios de expressão funcional, a partir de um banco combi- natório de ácidos nucleicos pertencentes a uma mesma família gênica, com- preendendo uma etapa de clonagem por recombinação na levedura. A in- venção refere-se também a um processo de produção de proteínas mosai- cos funcionais, e de análise de um banco combinatório de expressão funcio- nal, por determinação de uma impressão sequencial para cada uma das pro- teínas mosaicos do banco. A diversidade das funções das proteínas pode ser vista como o resultado da evolução dos genes por acontecimentos de mutação, recombi- nação e seleção (1, 2). Diferentes técnicas foram desenvolvidas para tentar reproduzir, na escala do laboratório, as diferentes etapas dos processos de evolução natural. As abordagens clássicas de evolução molecular utilizam etapas de mutação aleatória e recombinação por amplificação em cadeia por polimerase (PCR) (2-5). A evolução molecular é uma abordagem que foi uti- lizada com sucesso em biotecnologia para a modificação de funções protei- cas (5-12) e para permitir melhor compreensão dos mecanismos de identifi- cação de substratos (13). A evolução molecular constitui uma abordagem eficaz para a compreensão do papel das zonas altamente conservadas, quando a estrutura tridimensional não é conhecida ou quando nenhuma in- formação proveniente de técnicas de modelização está disponível (29). A fim de proceder às experiências de evolução molecular ou mistura recombinatória de ADN (DNA-shuffling), parte-se de um banco de genes que pode ser gerada por mutagênese de uma sequência única (14) ou que pode ser constituída de um grupo pertencente a uma mesma família ou subfamília de genes (15). A técnica dita da mistura recombinatória de fa- mília (family-suffling) foi descrita como um meio de acelerar os processos de evolução (16), que permite a emergência de atividades ou de atividades ou de propriedades inesperadas nas novas proteínas geradas (14). Essa técnica permitiu assim a criação de enzimas que apresentam uma associação de propriedades parenterais de interesses (17, 18), com uma estabilidade térmica aumentada (14) ou apresentando novas especificidades de substrato (19).
Todavia, mesmo se a mistura recombinatória de genes de uma mesma família (family-shuffling) permitir conseguir melhorias que imitam in vitro os processos de evolução, a construção de bancos aleatórios de estru- turas mosaicos, desprovidas de desvios inversos, para a reunião de uma maioria de estruturas parenterais será sempre um ponto crítico.
As dificuldades para se obter um banco homogêneo por “family- shuffling” aumentam muito, quando as similaridades entre as seqüências de partida utilizadas diminuem (30, 31). Assim, um número relativamente pe- queno (da ordem de 10 %) de quimeras foi freqüentemente descrito (Kikuchi descreve 1 % de estruturas quiméricas para 2 genes com 84 % de identida- de ao nível protéico, aplicando técnicas clássicas de DNA-shuffling (32)).
Diferentes técnicas foram desenvolvidas para diminuir a taxa de estruturas parenterais, cuja utilização de ADN simples filamento como ponto de partida para a mistura recombinatória (dando 14 % de estruturas quiméricas para 2 genes com 84 % de identidade ao nível protéico (33) ou fragmenta- ções enzimáticas limitadas (32,34) dando taxas de quimeras muito mais consideráveis. Todavia, esse último método apresenta o inconveniente de os fragmentos gerados de forma enzimática não serem fragmentos aleatórios, o que induz uma limitação no número de novas estruturas gênicas que podem assim ser produzidas.
Outros grupos utilizaram a recombinação in vivo em sistemas procariotes para serem obtidas quimeras (30, 35, 36). Esses métodos apre- sentam, todavia, o inconveniente de a expressão funcional de proteínas em E. coli nem sempre ser a mais adaptada, quando se trata de proteínas euca- riotes, em particular os complexos multiprotéicos, as proteínas membranári- as, ou qualquer proteína que necessite da maquinaria celular eucariote para sua atividade. Em particular, certas proteínas eucariotes apresentam modifi- cações pós-traducionais (glicosilação...) que não podem ser efetuada nos hospedeiros procariotes.
Portanto, é um objeto da presente invenção fornecer um proces- so de construção de bancos combinatórios de expressão funcional, a partir de ácidos nucléicos pertencentes a uma mesma família gênica, que permite obter bancos que apresentam a complexidade necessária, isto é, que apre- sentam uma grande parte das estruturas quiméricas possíveis e com uma taxa de presença de estruturas parentais relativamente pequena. Por outro lado, o processo da presente invenção permite obter bancos que permitem uma melhor expressão de proteínas eucariotes. A presente invenção divulga igualmente um processo de análise das seqüências gênicas de um banco combinatório, em particular obtido pelo processo, de acordo com a invenção, que permite associar uma “impressão” a cada variante de seqüência presente nesse banco. Esse processo de aná- lise permite, em combinação com um processo de análise das funções e/ou atividades das proteínas desse banco, de poder ligar essas estruturas se- qüenciais e essas estruturas funcionais. Assim, a combinação desses dois processos pode ser utilizada para “comandar” a mistura de informações ge- néticas, a fim de se obterem proteínas de interesse de modo dirigido, mais controla, mais rapidamente e a um custo menor.
Assim, a presente invenção se refere a um processo de constru- ção de um banco combinatório de expressão funcional, a partir de um banco de ácidos nucléicos pertencentes a uma mesma família gênica, caracteriza- do pelo fato de comportar as etapas que consistem em: a. introduzir esse banco de ácidos nucléicos em uma levedura, simultaneamente com um vetor de expressão; b. obter esse banco de expressão funcional por recombinação desse banco combinatório de ácidos nucléicos com esse vetor de expressão nessa levedura.
Um banco combinatório de expressão funcional obtido por esse processo, de acordo com a invenção, é igualmente um objeto da invenção.
De preferência, o vetor de expressão com o qual é efetuada a recombinação na levedura é linearizado no local de clonagem normal do ADNc, e possui seqüências promotoras e terminais de transcri- ção, a recombinação efetuando-se ao nível dessas seqüências.
Os fragmentos de ácidos nucléicos, pertencentes à banca intro- duzida na levedura na etapa a., podem ser fragmentados ou não. Quando esses fragmentos são fragmentados, isto permite aumentar a eficácia de recombinação in vivo, o que aumenta a diversidade do banco, à medida que uma ocorrência de recombinação é obrigatória antes da clonagem no vetor de expressão. Esses pontos serão discutidos mais adiante.
As ocorrências de recombinação que se efetuam na levedura podem ser de recombinação homóloga (entre seqüências idênticas) ou home- óloga (entre seqüências que apresentam um nível de identidade suficiente). O processo, de acordo com a invenção, é igualmente muito inte- ressante pelo fato de não necessitar de etapa de passagem em um procari- ote, para a obtenção do banco combinatório.
Assim, o processo, de acordo com a presente invenção, permite a obtenção de um banco combinatório de expressão diretamente em um hospedeiro eucariote, o que apresenta uma vantagem certa para a expres- são de proteínas eucariotes, em particular as proteínas membranárias, ou pertencentes a complexos multiprotéicos. O processo, de acordo com a presente invenção se refere, portan- to, a um método de produção de bancos combinatórios melhoradas, por re- combinação em uma levedura (CLERY, Para Combinational Library Enhanced by Recombination in Yeast). A levedura (que pode ser modificada no nível genômico) é tam- bém vantajosamente utilizada como instrumento de expressão (39) dos ge- nes quiméricos, permitindo melhorar a expressão funcional das novas pro- teínas eucariotes obtidas por esse método (em particular, os complexos multiprotéicos ou as proteínas membranárias). Por outro lado, a modificação genômica da cepa de levedura utilizada pode permitir criar o meio ambiente natural de funcionamento (e, portanto, a otimização das possibilidades de crivação), por produção de outras proteínas eucariotes essenciais para a atividade das novas proteínas criadas, em particular nos casos de comple- xos multiprotéicos. O processo, de acordo com a invenção, permite a obtenção final de um banco combinatório de expressão funcional devido a duas etapas di- ferentes: - a clonagem do banco de ácidos nucléicos no vetor de expres- são introduzido simultaneamente na levedura, por recombinação homóloga in vivo, permite obter um banco de expressão funcional; - a recombinação homóloga ou homeóloga (entre as seqüências semelhantes mas não idênticas), podendo se produzir in vivo na levedura, entre os diferentes ácidos nucléicos do banco combinatório introduzido nes- sa levedura, permite aumentar a complexidade e a diversidade do banco combinatório de expressão funcional obtida.
Assim, quando os fragmentos de ácidos nucléicos do banco combinatório introduzido nessa levedura são fragmentados e não possuem as duas extremidades recombinógenas, permitindo a clonagem no vetor de expressão, é essencial que um acontecimento de recombinação entre dois fragmentos adequados tenha ocorrido previamente a essa clonagem.
Da mesma forma, em um caso particular de aplicação do pro- cesso, de acordo com a invenção, observa-se a realização de pelo menos um acontecimento de recombinação homeóloga no banco obtido, notada- mente devido ao fato de pertencer a uma mesma família gênica dos ácidos nucléicos do banco inicialmente introduzido na levedura.
Por “ácidos nucléicos pertencentes a uma mesma família gêni- ca”, entendem-se, no sentido da invenção, ácidos nucléicos que possuem no mínimo 35 % de identidade, de maneira preferida 40 %, de maneira mais preferida 50 %, ou ainda 70 %. Esses ácidos nucléicos serão ditos perten- centes à mesma família gênica, caso apresentam as percentagens de iden- tidades acima, e podem codificar para proteínas que apresentam atividades e/ou funções diferentes. Esses ácidos aminados podem codificar para pro- teínas encontradas naturalmente, ou ser ácidos nucléicos “artificiais”, isto é, codificando para proteínas que não são encontradas na natureza. Em parti- cular, esses ácidos nucléicos “artificiais” englobam proteínas de fusão, ou proteínas já obtidas por métodos de mistura recombinatória de ADN.
Por “percentagem de identidade” entre duas seqüências de áci- dos nucléicos ou de ácidos aminados no sentido da presente invenção, en- tende-se designar uma percentagem de nucleotídeos ou de resíduos de áci- dos aminados idênticos entre as duas seqüências a serem comparadas, ob- tido após o melhor alinhamento, essa percentagem sendo puramente esta- tística e as diferenças entre as duas seqüências sendo repartidas ao acaso e sobre toda a sua extensão. Entende-se designar por “melhor alinhamento” ou “alinhamento ótimo”, o alinhamento para o qual a percentagem de identi- dade determinada como a seguir é o mais elevado. As comparações de se- qüências entre duas seqüências de ácidos nucléicos ou de ácidos aminados são tradicionalmente realizadas, comparando essas seqüências, após tê-las alinhadas, de maneira ótima, essa comparação sendo realizada por segmento ou por “janela de comparação” para identificar e comparar as regiões locais de similaridade de seqüência. O alinhamento ótimo das seqüências para a comparação pode ser realizado, além disso manualmente, por meio do algo- ritmo de homologia local de Smith e Waterman (49), por meio do algoritmo de homologia local de Neddleman e Wunsch (50), por meio do método de pesquisa de similaridade de Pearson e Lipman (51), por meio de softwares informáticos, utilizando esses algoritmos (GAP, BESTFIT, BLAST P, BLAST N, FASTA e TFASTA na Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wl). A fim de se conseguir o alinhamento ótimo, utiliza-se, de preferência, o programa BLAST, com a matriz BLOSUM 62. Podem-se igualmente utilizar as matrizes PAM ou PAM250. A presente invenção permite assim obter, com um rendimento elevado, bancos recombinatórios a partir de ácidos nucléicos que apresen- tam uma identidade muito inferior à identidade atualmente requerida no es- tado da técnica (geralmente superior a 70 %). O banco de ácidos nucléicos introduzido na levedura na etapa a do processo, de acordo com a invenção, é, de preferência, ela mesma um banco combinatório de ácidos nucléicos.
Esse banco de ácidos nucléicos é, de preferência, uma mistura de produtos de PCR obtido por amplificação de um banco combinatório de fases abertas de leitura, utilizando um binário de atrações situadas em regi- ões que tocam essas fases abertas de leitura. Esse banco combinatório de fases abertas de leitura é obtido a partir de ADN variantes de seqüências, diferindo por uma ou várias mutações, e pertencentes a uma mistura família gênica no sentido da invenção.
Utiliza-se, de preferência, um só binário de atração para efetuar a reação de PCR, tal como descrita no parágrafo precedente, mas o técnico poderia igualmente utilizar binários de atrações diferentes. Todavia é mais prático utilizar um único binário de atrações.
Em particular, utiliza-se um binário de atrações situado em regi- ões promotoras e terminais da tradução na levedura, regiões permitindo a expressão de fases abertas de leituras nesse organismo. Assim, é provável que essas regiões, que estarão presentes sobre todos os fragmentos de ADN do banco de ácidos nucléicos introduzida na levedura, sejam as se- qüências nucléicas implicadas na recombinação com as seqüências homó- logas do vetor de expressão co-introduzido, que permitirão a clonagem das fases abertas de leitura nesse vetor, e a formação do banco de expressão funcional.
Assim, conforme precisado antes, o banco de ácidos nucléicos introduzido na levedura é, de preferência, ele mesmo um banco combinató- rio de ácidos nucléicos, pertencentes a uma mesma família gênica no senti- do da invenção. Pode-se conseguir esse banco combinatório por métodos clássicos de fragmentação de ADN de reunião por extensão por atração (“primer extension”). A etapa de fragmentação do ADN é feita por métodos conheci- dos do técnico, conforme, por exemplo, a digestão por enzimas de restrição, ou a nebulização. Prefere-se, todavia, fragmentar o ADN por digestão parcial com uma DNase, de preferência a DNasel, que permite obter, de maneira mais controlada, fragmentos de um tamanho desejado. Por outro lado, isto permite obter efetivamente fragmentos aleatórios, o que nem sempre é o caso com as outras técnicos de fragmentação enzimática. Na prática, e a fim de conseguir um banco combinatório que apresenta uma grande variedade de combinação e um maior número de proteínas mosaicos diferentes, bus- ca-se obter fragmentos de tamanho compreendido entre 15 e 700 pares de bases (pb), de preferência de 40 a 500 pb, de forma mais preferida de 100 a 300 pb.
Os fragmentos são reunidos entre si por uma técnica de exten- são por atrações (“primer extension”). No princípio, os fragmentos obtidos podem se hibridar, e o acréscimo de uma ADN polimerase permite obter uma extensão dos fragmentos hibridados, e reconstituição de genes funcio- nais, por vários ciclos de extensão.
Assim, a presente invenção tem igualmente por objeto um pro- cesso de construção de um banco combinatório de expressão funcional a partir de um banco combinatório de ácidos nucléicos pertencentes a uma mesma família gênica, comportando as etapas que consistem em: a. introduzir esse banco combinatório de ácidos nucléicos em uma levedura, simultaneamente com um vetor de expressão; b. conseguir esse banco de expressão funcional por recombina- ção desse banco combinatório de ácidos nucléicos com esse vetor de ex- pressão nessa levedura; esse banco combinatório de ácidos nucléicos sendo uma mistura de produtos de PCR obtida por amplificação de um banco combinatório de fases abertas de leitura, utilizando um binário de atrações situadas em regi- ões que tocam essas fases abertas de leitura, esse banco combinatório sen- do obtido a partir de ADN homólogos ou variantes de seqüência que diferem por uma ou várias mutações, e esse banco combinatório de fases abertas de leitura é obtido por reunião por “primer extension” de produtos de fragmenta- ção de pelo menos duas fases abertas de leituras codificando para proteínas funcionais, essas fases abertas de leituras codificando para proteínas funci- onais, essas fases abertas de leituras apresentando entre si uma identidade de seqüência superior a 40 %. O técnico conhece outras técnicas que permitem a recombina- ção entre fragmentos de ADN e sua mistura (DNA shuffling). Assim, um método alternativo é o método de óligo-ligadura, que pode eventualmente ser aplicado com ligantes termostáveis. Outros métodos adequados podem ser escolhidos pelo técnico para a mistura dos ácidos nucléicos. A fim de realizar a reunião dos fragmentos, utiliza-se, de prefe- rência, uma reação de amplificação por polimerase (PCR). As diferentes etapas dessa reação devem ser controladas, a fim de poder obter uma taxa considerável de genes mosaicos. Assim, a etapa de hibridação é uma etapa muito importante para assegurar a possibilidade de se obter uma recombi- nação entre fragmentos que apresentam uma identidade de seqüência rela- tivamente pequena, em particular para os valores baixos dos genes perten- centes a uma mesma família gênica (35 ou 40 %). Assim, a reação de PCR utilizada de forma preferida, quando da etapa de reunião, é caracterizada pelo fato de cada um de seus ciclos apresentar pelo menos dois patamares de hibridação, de preferência pelo menos quatro patamares, por temperatu- ras decrescentes regularmente espaçadas. É igualmente importante que o conjunto das etapas de hibridação tenha uma duração total de mais de qua- tro minutos. Um modo particular de utilização da reação de PCR é tal que cada ciclo apresenta pelo menos quatro patamares de hibridação de mais de 60 segundos, por temperaturas decrescentes regularmente espaçadas.
Os inventores mostraram, com efeito, que essas condições de reunião permitem a obtenção de fragmentos de um tamanho superior aos ácidos nucléicos de partida. Em particular, quando os ácidos nucléicos de partida são vetores de expressão que portam os genes da mesma família gênica, as etapas de fragmentação e de reunião podem permitir obter frag- mentos de ADN transformadores na levedura, isto é, portanto, ao mesmo tempo, genes mosaicos e os elementos do vetor que permitem sua réplica e sua manutenção na levedura. Isto assegura que o método de reunião, segundo o presente processo, é extremamente eficaz (ver também os exemplos). A fim de se conseguir um banco de expressão funcional na leve- dura, o processo, segundo a presente invenção, propõe a co-introdução de um vetor de expressão e de um banco de ácidos nucléicos pertencentes a uma mesma família gênica, obtida por “family shuffling”, assim conforme descrito nos parágrafos precedentes. A fim de se conseguir esse banco de ácidos nucléicos, é interes- sante partir de ácidos nucléicos pertencentes a uma mesma família gênica já clonados em um vetor de expressão, de preferência, esses ácidos nucléicos são todos clonados no mesmo vetor de expressão, e utiliza-se esse vetor para a co-introdução na levedura.
Assim, após a etapa de reunião descrita anteriormente, e à me- dida que as condições utilizadas permitem obter longos fragmentos, em par- ticular de tamanho igual ou superior ao tamanho do vetor de partida (isto é, mais longos do que aos ácidos nucléicos pertencentes à mesma família gê- nica que se busca misturar), faz-se uma reação de PCR, utilizando-se um binário de atrações situadas nas regiões que tocam as fases abertas de lei- tura. Trata-se, de preferência, de atrações situadas no vetor de expressão, e escolhem-se, em particular, nas regiões promotora e terminal de transcrição desse vetor, assim conforme foi precisado anteriormente.
Como ADN de partida, pode-se assim utilizar qualquer vetor contendo os ácidos nucléicos pertencentes à mesma família gênica que se deseja recombinar. Pode-se escolher um vetor multicópia na levedura, ou um vetor monocópia na levedura, ou um vetor cujo caráter multi- ou mono- cópia seja indutível. Pode-se também escolher um vetor de expressão para uma levedura ou um vetor de expressão para uma célula eucariote, que seja navette para a levedura. Pode-se igualmente escolher um vetor que contém os elementos necessários para se replicar, de forma autônoma, no Escheri- chia coli. Pode-se naturalmente considerar um vetor que não possui quais- quer propriedades desenvolvidas acima, ou que apresenta uma combinação dessas propriedades.
De preferência, aplica-se o processo, de acordo com a invenção, escolhendo-se, como vetor de partida, o vetor de expressão co-introduzido na levedura como banco de ácidos nucléicos.
Esse vetor de expressão possui os elementos para se replica- rem, de forma autônoma na levedura, como vetor multicópia, ou vetor mono- cópia, ou vetor condicional. Pode igualmente possuir genes que permitem sua seleção sobre meios apropriados, em particular genes de resistência aos antibióticos ou de complementação de auxotrofia, caso a levedura utili- zada apresente essa propriedade. O vetor de expressão pode ser um vetor de expressão para a levedura. Nesse caso, ele possui elementos que permitem a transcrição e a tradução de maneira eficaz na levedura. Ele pode alternativamente ser um vetor de expressão em um outro hospedeiro, procariote ou eucariote, isto é, possuir os elementos (origens de réplica) que lhe permitem se replicarem, de forma autônoma nesse outro hospedeiro. Escolhe-se, de preferência, um vetor que permite a expressão em um hospedeiro eucariote superior, em particular uma célula de mamífero. Esse vetor associa, uma caixa de ex- pressão de eucariote superior, uma origem de replicação e um marcador de seleção para a levedura. O vetor comporta, de preferência, um promotor, sinais de inicia- ção e de término da tradução, assim como regiões apropriadas de regula- gem da transcrição. Pode eventualmente possuir sinais particulares que es- pecificam a secreção da proteína traduzida. Os vetores que podem ser utili- zados são bem conhecidos do técnico.
Utiliza-se, de preferência, como vetor que porta os ácidos nu- cléicos pertencentes a uma mesma família gênica que se deseja fragmentar, um vetor que apresenta um tamanho, incluindo as fases abertas de leitura, superior a 7 quilobases (kb). Pode-se utilizar o mesmo vetor para a co- introdução na levedura, para a etapa de recombinação na levedura. A recombinação é feita na levedura, de preferência uma levedu- ra do gênero Saccharomyces, de forma mais preferida S.cerevisiae. Pode- se, todavia, utilizar outros tipos de leveduras, dentre as quais Candida, Yar- rovia, Kluyveromyces, Schizosaccharomyces, Toruíopsis, Pichia, Hansenula. O técnico escolherá a levedura apropriada em função de suas competências e seus conhecimentos e do objetivo buscado. Essa levedura pode ser modi- ficada ao nível genômico para expressar proteínas exógenas, permitindo complementar as proteínas mosaicos que se procura gerar. O processo, segundo a presente invenção, possui várias vanta- gens, que serão em particular visíveis com base nos exemplos. Todavia, podem-se resumir algumas: - o processo não necessita de passagem em um hospedeiro procariote para a obtenção do banco, o que simplifica as manipulações a serem feitas; - o processo, de acordo com a invenção, permite, em uma etapa, proceder à clonagem no vetor de expressão do banco de ácidos nucléicos introduzida na levedura, e aumentar a diversidade por recombinação homó- loga ou homeóloga entre os diferentes ácidos nucléicos do banco combina- tório introduzido na levedura; - quando o vetor de expressão é multicópia, obtém-se uma mis- tura de produtos na levedura, consistindo em várias cópias desse vetor, pos- suindo, cada uma, um gene mosaico diferente. Cada clone de levedura obti- do contém, portanto, individualmente um banco de genes mosaicos, e isto permite testar as atividades das diferentes proteínas, de forma mais rápida e eficaz; - quando o vetor de expressão pode igualmente se replicar no E. coli, pode-se então efetuar a segregação dos diferentes plasmídeos, prepa- rando o ADN plasmídico de pelo menos um clone de levedura obtido, trans- formando E.coli com esse ADN plasmídico extraído, e selecionando os clo- nes transformados sobre o meio apropriado para se obter uma discriminação dos elementos do banco combinatório de expressão funcional.
Assim, o técnico desejando melhorar as propriedades funcionais de uma proteína poderá preparar, pelo processo, de acordo com a invenção, um banco combinatório de expressão funcional na levedura, a partir de áci- dos nucléicos de interesse pertencentes a uma mesma família gênica. Ele poderá em seguida testar os clones de leveduras para selecionar aqueles para os quais a propriedade buscada é aparente, e conseguir as seqüências realmente interessantes, efetuando a discriminação por passagem em um hospedeiro procariote. O processo, de acordo com a invenção, permite assim produzir proteínas funcionais mosaicos ativas, elas próprias objeto da invenção. As- sim, um processo de produção de proteínas funcionais mosaicos ativas, ca- racterizado pelo fato de se construir um banco combinatório de expressão funcional por um processo, de acordo com a invenção, de se expressarem as proteínas mosaicos, e de se selecionarem as proteínas funcionais mosaicos ativas pelo estudo de sua atividade, é igualmente um objeto da invenção.
De preferência, as proteínas mosaicos que se buscam gerar são enzimas que possuem atividades melhoradas (termoestabilidade, função nova, modificação de função, aumento de atividade, modificação da especi- ficidade de substrato, modificação da atividade em um ambiente preciso, tal como um solvente, um pH...). A utilização do processo, de acordo com a in- venção, para gerar novas enzimas apresenta muitas vantagens, já que as atividades das novas proteínas geradas podem, então, ser testadas direta- mente na levedura. Utilizam-se então, de preferência, como ácidos nucléicos de partida, os nucléicos pertencentes a uma mesma família gênica, que co- dificam para enzimas. As proteínas mosaicos ativas obtidas são então de- nominadas derivadas de enzimas.
Os exemplos da presente invenção mostram a aplicação do pro- cesso à geração de novas proteínas derivadas de citocromos P450s. Os ci- tocromos P450s (P450s) podem identificar uma ampla variedade de subs- tratos e catalisar um número ainda maior de reações. Essas enzimas foram colocadas em evidência em praticamente todos os organismos vivos (20).
Nos mamíferos, os P450s são implicados na formação de hormônios este- róides, mas têm igualmente um papel predominante no metabolismo dos medicamentos e dos poluentes que podem, as vezes, levar a processos de toxicidade e de carcinogêneses químicas (20-22). Os P450s 1A1 e 1A2 hu- manos têm da ordem de 70 % de identidade de seqüência e possuem certas especificidades de substratos diferentes. Ele estão dentre os P450s os mais ativos no metabolismo dos carcinogenes químicos (23) e são implicados, no homem, no câncer pulmonar para o CYP1A1 (24-26), na ativação de pro- mutagenes contidos na alimentação (27) ou nos cânceres do fígado induzi- dos pela aflatoxina B1 para o CYP1A2. O conjunto das propriedades dos P450s de mamíferos na realidade, com efeito, tem excelentes candidatos para a aplicação dessas técnicas de evolução molecular (28).
Um caso particular da presente invenção se refere, portanto, ao processo de acordo com a invenção, caracterizado pelo fato de, além disso, o vetor de expressão eucariote utilizado para a mistura recombinatória con- ter uma fase aberta de leitura codificando para uma enzima membranária eucariote. De preferência, essa enzima eucariote é escolhida no grupo cons- tituído dos citocromos P450 eucariotes, enzimas de conjugação eucariotes (de fase II), membros da família dos transportadores ABC eucariotes.
Nesse caso, pode ser interessante utilizar uma cepa de levedura que apresenta uma modificação genética que permite a superexpressão de pelo menos uma proteína escolhida no grupo constituído em uma P450 re- ductase engógena ou exógena, uma adrenodoxina, uma adrenodoxina re- ductase, um citocromo b5 heterólogo, uma enzima de fase II (em particular um epóxido hidrolase). Essas cepas são descritas na patente EP 595 948.
Essas cepas permitem, em particular, recriar o meio ambiente natural de funcionamento dos P450s eucariotes (40, 41). A utilização de cepas de leveduras geneticamente modificadas permite, além disso, recriar complexos protéicos, com vários elementos fixos (expressos de forma constitutiva pela levedura), e um elemento variável (o produto dos genes mosaicos obtidos pelo processo, de acordo com a inven- ção). O processo, de acordo com a presente invenção pode também ser aplicado a outras proteínas. Por exemplo, pode ser interessante gerar receptores, o que permite determinar as seqüências implicadas na identifica- ção e na associação do ligante, ou proteínas quimeras baseadas nas proteí- nas alvos dos antibióticos, que permitem determinar os graus de resistência em função das mutações.
De forma habitual, é necessário efetuar numerosos ciclos de “DNA-shuffling”, antes de se obter uma proteína que apresenta as caracte- rísticas e/ou propriedades desejadas. No caso presente, após seleção dos clones de levedura que expressam proteínas com uma atividade próxima da atividade buscada, é possível efetuar uma simples reação de PCR direta- mente sobre esses clones, utilizando atrações apropriadas que tocam as fases abertas de leitura, e de proceder a uma nova mistura recombinatória, repetindo as etapas do processo, de acordo com a invenção.
Todavia, é desejável poder melhorar a rapidez de obtenção das propriedades desejadas, efetuando uma relação entre as estruturas seqüen- ciais das proteínas mosaicos obtidas, e as estruturas funcionais dessas proteínas. Isto permite então ligar facilmente as seqüências de ADN do ge- ne, ou as ligações entre as seqüências, com uma função enzimática ou outra (ligação de um substrato, termofilia...). A presente invenção se refere, portanto, igualmente a um pro- cesso de análise de um banco combinatório de expressão funcional, caracte- rizado pelo fato de compreender as seguintes etapas: a. transformação de uma cepa de Escherichia coli como ADN plasmídico extraído da cepa de levedura ou de um pool de leveduras; b. hibridação do ADN plasmídico contido em cada um dos clones individuais de Escherichia coli obtidos no final da etapa a com uma ou várias sonda(s) específica(s) de uma seqüência parenteral.
Esse processo, melhorado das etapas que serão descritos pos- teriormente, pode ser aplicado sobre qualquer banco combinatório, a partir do momento em que os diferentes ácidos nucléicos que formam o banco foram discriminados. A hibridação é feita sobre uma macro- ou uma microrrede de ADN, essa rede sendo constituída seja do ADN plasmídico contido em cada um dos clones individuais de Escherichia coli obtidos no final da etapa a, ou de um produto de PCR deste, seja dessas sondas específicas, ligadas(s) sobre um suporte sólido, cada um dos ácidos nucléicos sendo marcado por sua posição nessa rede.
No primeiro caso, fixa-se o ADN plasmídico contido em cada um dos clones individuais de Escherichia coli obtidos no final da etapa a, ou um produto de PCR deste sobre um suporte sólido (vidro, silício, membrana apropriada (nylon, nitrocelulose)...). Os métodos de fixação do ADN são co- nhecidos do técnico, e o ADN pode ser fixado, de maneira mais ou menos sólida sobre o suporte utilizado. Nem sempre é necessário extrair o ADN plasmídico dos clones de E. coli obtidos, podendo estes ser diretamente li- sados sobre o suporte sólido utilizado, ou a PCR permitindo a amplificação dos fragmentos correspondentes aos genes mosaicos podendo ser feita di- retamente sobre os clones bacterianos, sem extração prévia de ADN.
No segundo caso, fixam-se as sondas sobre o suporte sólido.
Existem vários métodos para preparar um suporte que porta sondas. Po- dem-se sintetizar as sondas, depois fixá-las sobre o suporte (o endereça- mento podendo ocorrer mecanicamente, eletronicamente, por jato de tinta...) ou sintetizar as sondas diretamente sobre o suporte (por endereçamento fotoquímico ou por jato de tinta, por exemplo). O técnico escolherá o método o mais apropriado para o resultado buscado.
Em função do número de sondas utilizadas, obtém-se uma im- pressão de hibridação mais ou menos fina, para cada um dos clones testa- dos. Quanto mais elevado for o número de sondas, mais fina será a impres- são obtida. Podem-se escolher sondas que ficam situadas de forma homo- gênea sobre toda a extensão do gene. Alternativamente, pode ser proveitoso utilizar sondas que são alvos em um conjunto de zonas de seqüências as quais se sabe que codifica, para regiões importantes para a função e/ou a atividade da proteína. Assim, pode-se conseguir uma impressão seqüencial alvejada.
Por outro lado, as condições de hibridação das sondas variam em função do°C de especificidade dessas sondas para cada estrutura pa- renteral. Assim, quando duas estruturas parenterais diferem de uma simples base sobre o fragmento correspondente à sonda, é necessário aplicar condi- ções de estringência mais elevadas do que se as estruturas parenterais fos- sem muito diferentes. O técnico sabe determinar as melhores condições de hibridação, em particular seguindo o ensinamento de Sambrook et al. É igualmente importante notar que certos genes mosaicos podem apresentar uma intensidade de hibridação com uma sonda determinada menor que ou- tros genes. Com efeito, a eficácia da transferência do ADN sobre o suporte sólido pode ser feita de maneira mais ou menos eficaz, ou a região do genes sobre a qual a sonda deve se hibridar é ela mesma mosaico e constituída de fragmentos provenientes de genes “parentes” diferentes.
Pode-se então proceder a uma análise estatística das intensida- des de hibridação, com o auxílio de um programa informático apropriado. O programa converte inicialmente os sinais de hibridações em dados de um tipo parenteral por um sistema de máscaras com uma função buleana XOR, antes da análise estatística propriamente dita. A análise do banco combinatório pode ser feita da seguinte forma: - um código é atribuído a cada seqüência nucléica gerada, em função da capacidade das sondas utilizadas para hibridar essa seqüência.
Pode ser vantajoso utilizar uma codificação binária (0, caso o local sondado corresponda a um certo tipo parenteral, 1, caso corresponde ao outro tipo parenteral), mas outros tipos de codificações podem também ser utilizados.
Assim, cada seqüência gerada no banco possui uma “assinatura” individual.
No caso de 6 sondas ser em utilizadas e se utilizar uma codificação binária, 26 possibilidades são consideradas (de 000000 a 111111); - a freqüência de cada uma das assinaturas assim obtidas será, então, comparada com a freqüência esperada, caso a mistura recombinató- ria de ADN ocorresse completamente ao acaso (no caso de 6 sondas, a fre- qüência teórica de cada padrão é então de 1/26). Essa análise permite definir um “parente preferencial” para cada uma das posições sondadas (certas correções devem, às vezes, ser feitas, em particular quando as proporções de ácidos nucléicos parenterais de partida não são iguais). - o estudo das assinaturas permite igualmente precisar as rela- ções que podem existir no meio de um mesmo mosaico, em particular as associações entre tipos parenterais que podem ser encontradas entre cada segmento. Por exemplo, é importante poder facilmente determinar a neces- sidade de uma correlação entre dois segmentos nucléicos não necessaria- mente adjacentes para a obtenção de uma função biológica; - a análise pode igualmente ser purificada, a fim de se obter re- sultados que podem fornecer várias informações. Os exemplos ilustram essa etapa, divulgando um método em que cada assinatura do banco é convertida em um número decimal, e no qual uma curva, comportando na abscissa esse número decimal e a freqüência acumulada na ordenada, é desenhada. A análise dessa curva e sua modelização por simulação permite igualmente obter informações interessantes sobre a probabilidade de se obter um certo tipo de estrutura parenteral em um determinado lugar, e as correlações existentes entre diferentes fragmentos.
As análises estatísticas assim descritas são facilitadas, graças à utilização de equipamentos de informática, cujo desenvolvimento não traz problemas para o técnico.
As simulações de correlações entre diversos segmentos podem ser efetuadas gerando grades/chaves mais ou menos aleatórias, de acordo com as correlações desejadas. Por exemplo, uma grade pode ser gerada para a qual um segmento em uma probabilidade superior a 50 % de ser do mesmo tipo parental que o segmento vizinho. O número de grades que po- dem assim ser geradas é extremamente importante, e pode permitir assim definir uma aproximação dos resultados observados.
Quando se observam correlações entre diferentes segmentos, é provável que a aplicação de uma seleção funcional sobre a população de clones (que reduz assim a população de seqüências que passam o crivo) levará a um aumento do número de correlações, e a uma evolução (conver- gência) dos resultados estatísticos obtidos. Dever-se-ia, portanto, obter o aparecimento de um padrão característico da seleção aplicada, o que dá uma assinatura seqüencial que depende da seleção funcional aplicada sobre o sistema.
Em resumo, a presente invenção se refere igualmente a um pro- cesso de análise das impressões de hibridação que podem ser obtidas pelo processo de análise do banco combinatório descrito acima, caracterizado pelo fato de compreender as etapas que consistem em: a. calcular a freqüência de aparecimento de cada uma das com- binações possíveis; b. definir uma assinatura da repartição estatística das combina- ções, por um tratamento matemático e estatístico adequado.
Assim, a presente invenção fornece um meio de produzir de forma muito eficaz dos bancos combinatórios de expressão funcional a partir de ácidos nucléicos pertencentes a uma mesma família gênica no sentido da invenção, que podem possuir um °C de identidade relativamente pequena.
Por outro lado, a presente invenção apresenta a vantagem de poder efetuar o teste das atividades das proteínas mosaicos produzidas, di- retamente sobre os clones de leveduras obtidas, sem etapa prévia de purifi- cação. A presente invenção fornece igualmente um processo de análise de bancos combinatório, baseado em uma hibridação e uma análise estatís- tica das impressões de hibridações obtidas. A presente invenção fornece, portanto, instrumentos que podem ser utilizados para a determinação das ligações que podem existir entre as estruturas seqüenciais e as estruturas funcionais das proteínas. Assim, a presente invenção se refere igualmente a um processo de determinação de ligações entre assinaturas seqüenciais e assinaturas funcionais de uma proteí- na, caracterizado pelo fato de compreender as etapas que consistem em: a) preparar um banco combinatório de expressão funcional por um processo, de acordo com a invenção; b) produzir as proteínas funcionais mosaicos ativas; c) analisar as diferenças funcionais e/ou de atividade entre es- sas proteínas mosaicos; d) analisar os ácidos nucléicos correspondentes a essas proteí- nas mosaicos por um processo de análise por hibridação, de acordo com a invenção, seguido de forma opcional por uma análise estatística por um pro- cesso, de acordo com a invenção; e) ligar as diferenças de estrutura seqüencial observadas na etapa d. com as diferenças funcionais e/ou de atividade observadas na eta- pa c. A aplicação desse processo, para identificar as zonas de se- quências importantes ou as ligações entre zonas de seqüências ligadas a uma função de interesse permite pré-dizer as estruturas que têm essa função, por dedução da estrutura buscada, em função da relação estrutura-função obtida pelo processo descrito acima.
Assim, torna-se possível obter proteínas que possuem proprie- dades melhoradas, tais como descritas anteriormente, ou proteínas que identificam um grande número de substrato (enzimas “genéricas11), coman- dando as misturas de informações genéticas, a fim de serem obtidas as proteínas de interesse mais rapidamente, e de forma mais eficaz.
Os diferentes processos descritos no estado da técnica permiti- am conseguir as proteínas de interesse por uma repetição das misturas re- combinatórias de ADN, submetendo-se as proteínas obtidas a crivos cada vez mais finos. A presente invenção, permitindo ligar as estruturas e as fun- ções das proteínas mosaicos obtidas, permite proceder a novas misturas recombinatórias utilizando, como ácidos nucléicos de partida, apenas os áci- dos nucléicos que foram identificados como portando as estruturas ou orga- nizações de estruturas de interesse.
Assim, a presente invenção se refere a um processo de obten- ção de uma proteína que possui propriedades melhoradas, caracterizado pelo fato de compreender as etapas que consistem em: a. construir um banco combinatório de expressão funcional por um processo, de acordo com a invenção; b. analisar esse banco combinatório de expressão funcional; c. analisar as impressões de hibridação obtidas na etapa b. por um processo, de acordo com a invenção; d. determinar as ligações entre as estruturas seqüenciais e as estruturas funcionais das proteínas por comparação dessas impressões de hibridação com as propriedades das proteínas mosaicos correspondentes; e. pré-dizer as estruturas de interesse ou as organizações de estruturas nas proteínas mosaicos; f. repetir as etapas a. a e., utilizando, como ácidos nucléicos de partida para a geração do banco combinatório de expressão funcional, os ácidos nucléicos que portam as estruturas de interesse ou as organizações de estruturas identificadas na etapa e., um número suficiente de vez para se obter a proteína possuindo propriedades melhoradas buscadas. A etapa f. consiste em repetir as etapas precedentes até que uma proteína que apresenta as propriedades desejadas tenha podido ser identificada. A presente invenção deveria permitir diminuir o número de ci- clos de fabricação de banco combinatório - análise das proteínas em relação aos métodos da técnica anterior.
As proteínas obtidas pelo processo descrito são igualmente um objeto da invenção. A invenção se refere igualmente a um processo de determinação de uma estrutura de um proteína importante em resposta a uma pressão de seleção a partir de um banco combinatório de expressão funcional obtida por um processo, de acordo com a invenção, para os elementos da qual uma assinatura foi obtida, compreendendo as etapas de: - normalizar esse banco, pela homogeneização das assinaturas, por exemplo por tri, com o auxílio de um aparelho robótico apropriado. Essa etapa permite assegurar que cada impressão se encontra com a mesma probabilidade no banco normalizado; - aplicar uma pressão de seleção; - analisar o banco de expressão resultante, aplicando os proces- sos de análise de assinatura de seqüência, de acordo com a invenção; - estudar as mudanças de assinaturas de seqüência induzidas pela pressão de seleção sobre o banco normalizado inicial e deduzir daí as estruturas selecionadas ou contra selecionadas em resposta à pressão de seleção.
Deve ser observado que o fato de normalizar o banco antes de aplicar a pressão de seleção permite, na realidade, atingir uma diversidade mais considerável, alvejando o mesmo número de clones do que se não se normalizasse. Com efeito, pode-se observar que certas estruturas (tais como analisadas pelas impressões) estão presentes com probabilidades superio- res ao que seria esperado em caso de mistura aleatória. A normalização permite, portanto, diminuir a influência desse problema.
Os exemplos que se seguem são limitados à produção de novos citocromas P450s, para ilustrar a invenção. Todavia, eles não devem ser considerados como limitando a invenção, e, em particular, o tipo de proteínas e de ácidos nucléicos que podem ser utilizados nos processos descritos na pre- sente invenção. O técnico pode assim facilmente aplicar os processos da invenção, substituindo outros genes pelos genes de citocromas P450 des- critos nos exemplos.
Descrição das Figuras Figura 1: princípio da construção dos bancos. A: linha 1, marca- dor ADN (ADN de λ digerido por Pst I); as linhas 2, 3, 4 e 5, 6, 7 correspon- dem, respectivamente, aos plasmídeos p1A1/V60 e p1A2/V60 digeridos à DNAse I. As linhas 2 e 5 correspondem à fragmentação com 0.0112 unida- des, as linhas 3 e 6 com 0.0056 unidades e as linhas 4 e 7 a 0.0028 unida- des de Dnase I por μς de ADN. B: reação de reunião. Linha 1, marcador ADN; as linhas 2, 3 e 4 correspondem às reações de reunião entre frag- mentos de p1A1/V60 e p1A2/V60, misturando, respectivamente, as reações das linhas 2 e 5, 3 e 6, 4 e 7. C: reação de amplificação. Linha 1, marcador de ADN; as linhas 2, 3 e 4 correspondem, respectivamente, à amplificação com os plasmídeos PYeDP60, p1A1/V60 e p1A2A/60; as linhas 5, 6 e 7 cor- respondem à amplificação com o ADN previamente reunida utilizada como matriz (linhas B2, B3 e B4). A faixa apresentada na linha 6, panei C foi purifi- cada e utilizada como tal para co-transformar S. cerevisiae com plasmídeo pY eDP60 previamente linearizado. Observa-se a existência de aconteci- mentos de recombinação entre os diferentes ácidos nucléicos do banco in- troduzido na levedura.
Figura 2: posições respectivas e seqüências das seis sondas utilizadas para realizar as matrizes de caracterizações do banco. Os núme- ros no alto ou embaixo correspondem à posição 5’ de alinhamento de cada sonda sobre as seqüências. As sondas no alto e embaixo hibridam, respecti- vamente, as seqüências do P450 1A1 ou do P450) 1A2. As barras verticais no retângulo central representam todas as posições de colocação em empa- relhamento entre a seqüência do P4501A1 e do P4501A2.
Figura 3: os resultados de hibridação foram tratados em Microsft Excel, gerando uma grade de 384 pontos com o seguinte código de cor: os quadrados escuros representam estruturas semelhantes a estruturas de ti- pos parenterais (1A1 ou 1A2) para as zonas de seqüências correspondentes às seis sondas e os quadrados claros representam estruturas mosaicos.
Figura 4: freqüências acumuladas experimentais e teóricas para a observação dos 64 tipos de estruturas mosaicos possíveis. O eixo hori- zontal corresponde a uma codificação das estruturas mosaicos, utilizando N = P1 + 2*P2 + 4*P3 + 8*P4 + 16*P5 + 32*P6, na qual P1 a P6 têm os valo- res de 0 ou 1 que dependem, respectivamente, da hibridação com as se- qüência 1A1 ou 1A2. Os círculos abertos representam as curvas experi- mentais deduzidas dos estados de hibridação da grade de 384 clones com as seis sondas oligonucleotídeos. A curva contínua corresponde a curvas teóricas, considerando-se uma proporção homogênea de 0,56:0,44 para as seqüências parenterais 1A2 e 1A1 parenteral seqüências e uma mistura perfeita (ausência de correlação cruzada). A curva em pontilhados repre- senta a mesma curva para uma proporção de 50:50 para as seqüências pa- renterais 1A1 e 1A2. Os círculos escuros representam a curva teórica obtida por simulações, considerando-se uma proporção homogênea de 0.56:0.44 para as seqüências parenterais 1A2 e 1A1 , mas uma probabilidade de liga- ções parentais de 0,1:0,6:0,85:0,1:0,1 entre os segmentos sondados 1-2, 2-3, 3-4, 4-5 e 5-6, respectivamente. A ligação é definida conforme a seguir: 0 corresponde à independência e 1 a uma ligação total.
Figura 5: representação das freqüências parenterais e recombi- nantes para a associação entre duas sondas. A freqüência de cada associa- ção foi determinada por uma macro gerada em Microsoft Excel. A soma das quatro diferentes freqüências (parenterais e recombinantes) é sempre 1. A: associação entre duas sondas adjacentes; B: associação entre sondas sepa- radas por uma sonda; C: associação entre sondas distantes (separadas por duas ou três sondas). Os histogramas pretos e cinzas escuros representam as associações parenterais enquanto que o cinza claro e o cinza semi- escuro representam as associações recombinantes.
Figura 6: detecção colorimétrica de estruturas mosaicos funcio- nalmente competentes para a oxidação do naftaleno. A bioconversão é feita em 1 ml de cultura de leveduras em presença de 1,6 mM naftaleno. A extra- ção em fase sólida e o desenvolvimento da coloração é inteiramente realiza- da em placas com microtitulação conforme descrito nos Exemplos. A colora- ção escura indica os clones positivos.
Figura 7: representação esquemática das seqüências de 10 es- truturas mosaicos selecionadas ao acaso: A na população total; B na subpo- pulação de clones ativos. Para cada estrutura um alinhamento nucleotídico foi realizado com as duas seqüências parenterais. Esses alinhamentos fo- ram utilizados como dados de partida para um programa de análise de se- qüências e um programa de visualização que gerou a figura. As zonas cin- zas e pretas correspondem, respectivamente a seqüências pertencentes aos P450 parenterais 1A1 ou 1A2. Os traços verticais finos inferiores ou superio- res indicam as zonas de emparelhamento nucleotídicas com a segunda es- trutura parenteral. As marcas que atravessam as seqüências indicam as po- sições de seqüências que não se emparelham com nenhuma das duas se- qüências parenterais e que devem, portanto, corresponder a mutações. As partes horizontais transparentes correspondem a segmentos de seqüências para as quais a pertença a um ou outro dos tipos parentais não pôde ser determinada pela análise de seqüências.
Exemplos Exemplo 1: métodos 1A: Cepas, plasmídeos e biologia molecular Duas cepas de S.cerevisiae foram utilizadas: W303-1B, igual- mente denominada W(N) (Mat a; ade2-1; his3, Ieu2, ura3, trp1, canR, Cyr+) e W(R) que deriva de W(N) pela inserção do promotor indutível GAL10-CYC1 a montante da P450 redutase endógena (YRED) de levedura. Essa cepa foi anteriormente descrita porTruan e outros (40) e na patente EP 595 948, in- corporados no caso por referência. A cepa de E.coli utilizada foi DH5-1 (F, recA1, gyrA96, thi-1, hisR17, supE44, λ). Os vetores de expressão utilizados foram p1A1/V60 (42) e p1 A2/V60 (43, incorporado no caso por referência); esses dois vetores foram construídos por inserção de ORFs dos CYP1A1 e CYP1A2 humano entre os locais de restrições BamHI/Kpnl e BamHI/EcoRI de pYeDP60, res- pectivamente. Esses dois vetores de expressão contêm igualmente URA3 e ADE2 como marcador de seleção e coloca as fases abertas de leitura (ORFs) sob o controle do promotor GAL10-CYC1 e do terminador PGK (39, incorporado no caso por referência). Todos os meios utilizados foram des- critos anteriormente em documentos incorporados no caso por referência (40, 42).
As bactérias DH5-1 foram tornadas eletrocompetentes, segundo 0 protocolo descrito por Sambrook et al. (44) incorporado no caso por refe- rência, e as células transformadas seguindo as recomendações do constru- tor do eletroporador (Biorad). As células foram selecionadas em meios LB sólidos contendo 50 ug/ml de ampicilina.
Transformação de levedura Após uma pré-cultura de 12 horas em 5 ml de meio YPGA (para a cepa W(N)) ou YPLA (para a cepa W(R)), as células foram diluídas em 50 ml de meio YPGA para se obter uma densidade final de 2.106 células/ml. Seis horas mais tarde, as células foram lavadas duas vezes com a água estéril e uma vez como tampão TE-lítio acetato (10mM Tris-HCI pH 7,5, 1mM EDTA, 100 mM lítio acetato). As células são em seguida suspensas novamente em 1 ml de tampão TE-lítio acetato. O ADN transformador foi em seguida acrescentado a 50 μΙ da solução de células anteriormente obtida, assim como 50 μg de ADN de es- perma de salmão (previamente sonicado e desnaturado a 95°C), e 350 μΙ de uma solução de PEG 4000 a 40 % (W/v). Essa solução foi em seguida incu- bada a 30°C, durante 30 minutos e submetida a um choque térmica a 42°C durante 45 minutos. Após centrifugação, o que flutuou foi eliminado e as cé- lulas suspensas novamente em 200 μΙ de uma solução a 0,1 M NaCI. As células são em seguida selecionadas sobre um meio SWA6 sólido (39, 42, incorporados no caso por referência).
Extração do ADN plasmídico de levedura As colônias são suspensas de novo em 1 ml de tampão A que contém 2 % (v/v) de triton X-100, 50 mM de Tris-HCi pH 8,0, 50 mM de EDTA e 200 mM de NaCI. Depois, 1 volume de esferas de vidro (Braun Sci- entifics, diâmetro 0,45 mm) foi acrescentado e a solução vigorosamente vortexada durante 2 min com 300 μΙ de uma mistura fenol/clorofórmio/álcool isoamílico (50:49:1, em vol.). Após recuperação da fase aquosa, o ADN foi precipitado no etanol e suspenso de novo em 50 μΙ de água.
Seqüências Cinco clones bacterianos provenientes do banco inicial e cinco clones funcionais foram aleatoriamente selecionados e seqüenciados. As seqüências foram realizadas seja por ESGS (ESGS, grupo Cybergene, Evry France) ou utilizando o kit ABI e o seqüenciador ABI seguindo os protocolos do construtor (Perkin Elmer). 1 .B: Mistura recombinatória de ADN baseada na PCR modificada A técnica utilizada é derivada daquela descrita por Stemmer (2, 3, 15), incorporados no caso por referência. A fragmentação aleatória com a Dnase I (grau II, Sigma-Aldrich) em presença de Mn2+ e realizado com as modificações descritas por Lorimer e Pastan (45) e Zhao (46), incorporados no caso por referência. 2,5 pg de cada ADN plasmídico (p1A1/V60 e p1A2/V60) foram suspensos novamente separadamente em um tampão contendo 50 mM de Tris-HCI pH 7,4, 10 mM de MnCI2 para volume final de 40 μΙ. A DNase I foi acrescentada a três diferentes concentrações (0,0112 U/pg de ADN, 0,056 U/pg de ADN e 0,0028 U/pg de ADN. A digestão foi realizada a 20°C, durante 10 min e a DNase I inativada, aquecendo-se a 90°C, durante 10 min. Os fragmentos obtidos foram purificados sobre uma coluna Centrisep (Princepton Spearati- on Inc., Philadelphia, NJ).
Durante a reação de reunião, os fragmentos purificados (10 μΙ de cada plasmídeo fragmentado) foram amplificados por uma reação de PCR em 40 μΙ, utilizando 2,5 de Taq-polimerase (Stratagene). O programa de PCR utilizado consistia em : 1 ciclo de desnatu- ração a 96°C, durante 1.5 min; 35 ciclos de (30s de desnaturação a 94°C, 9 diferentes etapas de hibridação separadas de 3°C indo de 65°C a 41 °C e de 1,5 min cada uma e uma etapa de elongação de 1.5 min a 72°C) e final- mente 7 min a 72°C. A segunda reação de amplificação foi realizada com um primer 5’ localizado no promotor GAL10-CYC1 (SEQ ID N° 1) e um primer 3’ locali- zado no terminador PGK (SEQ ID N° 2). I .C: Construção e caracterização do banco Os produtos de amplificação por PCR foram separados por gel de eletroforese, depois purificado. Os ADNs foram inseridos em PYeDP60, utilizando a recombinação in vivo (gap-repair) na levedura (37, 38, 43, 47, 48). A co-transformação da cepa W303-1B com 1/20e do produto de PCR (enxerto) e 0,025 μg de pYeDP60 previamente linearizado, utilizando as en- zimas de restrição EcoRI e BamHI foi realizada. O ADN extraído da levedura foi utilizado para transformar a cepa de E.coli DH5-1, utilizando a resistência à ampicilina fornecida pelo plasmí- deo. 378 poços de uma placa com microtrituração 384 poços foram inocula- dos com colônias bacterianas independentes escolhidas ao acaso no banco, 3 poços com bactérias DH5-1 previamente transformado com p1 A1/V60 e os 3 poços restantes com DH5-1 transformadas por p1A2/V60. Após 24 horas de aumento no meio TB (44), contendo 100 pg/ml ampicilina, os 384 poços foram sem seguida replicados sobre seis membranas de Nylon N+ (Amer- sham). Cada filtro foi colocado sobre um meio LB sólido contendo 100 pg/ml de ampicilina. Após 12 horas de aumento, a lise das colônias bacterianas, a fixação e a desnaturação do ADN, a pré-hibridação dos filtros foram realiza- dos, segundo o protocolo preconizado pelo fabricante (Amersham). II pmoles de oligonucleotídeos foram acrescentados a 3,3 pmoles de γ-ΑΤΡ marcados no 32P, a 2 μΙ de polinucleotídeo quinase e 18 μΙ de tampão (New England Biolabs). O conjunto foi incubado 2 horas à temperatura am- biente. A pré-hibridação dos filtros foi realizada segundo o protocolo preconi- zado pelo fabricante. A sonda marcada foi acrescentada em um tubo de hi- bridação contendo um dos filtros e o conjunto foi incubado durante 12 horas a 42°C. Os filtros foram em seguida lavados em uma solução de SSPE 2x/0,1 % de SDS durante 10 minutos. Os filtros foram analisados por auto- radiografia, segundo um protocolo conhecido.
Cada sonda foi marcada uma segunda vez e hibridada em um filtro diferente para se assegurar da reprodutibilidade dos resultados. 1 .D: Seleção dos clones contendo dos P450s funcionais As colônias bacterianas cresceram durante 24 horas em placas de microtitulação 96 poços. A extração de ADN foi realizada, utilizando-se o protocolo do aparelho Multiscreen de minipreparo de ADN por filtração em microplacas 96-poços (Millipore). Cada ADN purificado foi utilizado para transformar a cepa de levedura W(R) em placa de microtitulação 96 poços e as células foram selecionadas sobre meios SWA6 sólidos.
Após 3 dias de crescimento a 30°C, 1 ml de meio líquido SWA5 foi inseminado com uma alíquota de cada colônia em uma microplaca 96 poços Deepwell (ABGene), durante 15 horas. O meio foi em seguida elimi- nado e substituído por 1 ml de meio YPLA, contendo 1,6 MM de naftaleno (Merck).
Para cada cultura, o meio de cultura foi em seguida colocado nos poços correspondentes de uma microplaca 96 poços Multiscreen (MABV N12, Millipore), contendo 90 μΙ de resina C18 sílica-gel octadecila funcionali- zada (Aldrich). Após uma filtragem sob vácuo do meio de cultura, o substrato e os produtos da reação são ligados à sílica. A resina foi em seguida lavada 2 vezes com água e os metabólitos misturados com 50 μΙ de isopropanol.
Após adição de 20 μΙ de uma solução de Diazo-Blue-B com 2 mg/ml (Fluka) a reação colorida gerada pelo acoplamento entre os precursores de diazo e os fenóis extraídos do meio de cultura foi observada. I.E: Análises estatísticas Para cada sonda, uma grade que representa as intensidades de hibridações dos 384 clones foi construída. As intensidades de hibridações foram analisadas visualmente, considerando-se o ruído de fundo do meio ambiente. Os pontos que excederam muito amplamente o ruído de fundo local dos pontos negativos foram considerados como positivos, mesmo se fossem menos intensos que os pontos os mais positivos. Essas respostas intermediárias que podem ser devido a um emparelhamento parcial da sonda (consecutivo das etapas de PCR) ou então a uma eficácia de transferência menos importante de certos pontos sobre o filtro. As ambigüidades foram destacadas pela realização de hibridação de um outro filtro pela mesma sonda.
As seis grades de 384 poços foram colocadas nos tabuladores Microsft Excel e uma análise estatística foi feita com macros Excel escritos em Microsoft Visual Basic, e retomando as etapas de análise tais como des- critas na descrição. O programa converte inicialmente os sinais de hibrida- ções em dados de um tipo parenteral por um sistema de máscaras com uma função buleana XOR, antes da análise estatística. As análises estatísticas foram feitas seguindo as etapas enumeradas na descrição.
Simulações numéricas foram feitas, utilizando-se um gerador de números aleatórios e rotinas de cálculos de probabilidade. O programa pode ser ajustado para simular todos os desvios possíveis na probabilidade de encontrar um ou outro dos tipos parenterais para as zonas de seqüências correspondentes a cada uma das sondas, assim como todas as “ligações” possíveis entre segmentos adjacentes ou distantes. Um primeiro jogo de parâmetros permitiu modularas probabilidades relativas de encontrar um ou outros dos tipos parenterais para cada zona de seqüência sondada. Um se- gundo jogo de parâmetros permitiu introduzir de uma ligação genética (ou várias ligações genéticas) entre dois fragmentos (ou mais) de seqüência (correspondente(s) a duas ou várias sondas).
Os programas de simulações e de análises estatísticas foram utilizados para gerar grades que correspondem a diferentes situações de ligações entre fragmentos. Em todos os testes, os resultados das análises estatísticas estavam de acordo com os parâmetros que entraram no progra- ma de simulações. O método de associação dessas técnicas de simulação e de análises foi igualmente aplicado para determinar as flutuações estatísti- cas sobre os dados, realizando análises de 10 ciclos repetidos de simula- ções e de análises para cada jogo de parâmetros. O gerador de números aleatórios foi reinicializado entre cada simulação para fazer daí aconteci- mentos independentes.
Exemplo 2: construção de um banco de expressão por mistura recombinató- ria de ADN de uma mesma família. O princípio da estratégia utilizada foi descrito na figura 1: ele as- socia uma etapa de mistura recombinatória de ADN in vitro por PCR modifi- cada a uma segunda etapa de mistura recombinatória in vivo por recombina- ção na levedura. Esta etapa foi igualmente utilizada como um instrumento de clonagem eficaz. Isto constitui uma estratégia de permuta completa permi- tindo a expressão em uma célula eucariote e a seleção funcional sem ter necessidade de etapa de clonagem intermediária em E. coli. A primeira etapa (figura 1) consiste em uma fragmentação duplo filamento do plasmídeo inteiro à DNAse I, conduzindo a fragmentos de ADN de pequenos tamanhos (figura A).
Os resultados da fragmentação dos plasmídeos p1A1/V60 e p1A2/V60 (figura 1A, linhas 2 e 5; 3 e 6; 4 e 7) foram misturados em propor- ção equimolar e submetidos a um programa de PCR original de “hibridações progressivas”(ver exemplo 1), implicando 9 etapas de hibridação que vão de 61 a 41 °C para forçar a recombinação entre fragmentos com um pouco de homologias. Conforme mostrado na figura 1B, nessas condições, um amplo traço (smear) de ADN de elevado peso molecular foi formado independen- temente dos fragmentos considerados na partida.
Embora esse material seja julgado ter propriedades de transfor- mação direta da levedura devido a uma recombinação entre fragmentos in vivo e à reconstituição de vetores de levedura completos e funcionais (11 kb) (Resultados não mostrados), uma nova etapa de PCR, utilizando atrações situadas sobre as seqüências de ADNc que tocam a iniciação da transcrição CYC1 e as seqüências de término da transcrição PGK foi necessária para se obter um banco de tamanho razoável (Figura 1C, linhas 5, 6 e 7). Esta última etapa resultou em uma amplificação de faixa de ADN bem definida de apro- ximadamente 1,9 kb, compreendendo o ADNc “misturado-recombinado” e as regiões que tocam o vetor. O produto de PCR mostrado na figura 1C, linha 6, foi utilizado para co-transformar a levedura com pYeDP60 linearizado no local de ex- pressão para utilizar as propriedades de recombinação homólogas (gap-repa/)) da levedura. A co-transformação do banco do ADNc de bom tamanho na le- vedura e do vetor linearizado levou a uma série de acontecimentos de re- combinação já observado, quando de experiências precedentes de recombi- nação homeólogos ou reparo de falhas (37, 38, 43). A seleção foi baseada somente sobre a recircularização do vetor após um ou vários acontecimentos de recombinação. As experiências deram aproximadamente 10.000 clones. A maior parte dos clones de levedura eram transformados por vários plasmídeos. Com efeito, uma população heterogênea de plasmídeos foi observada, após extração de ADN de uma única colônia de levedura, a transformação de E. coli e a segregação dos clones.
Isto permite avaliar a complexidade do banco inicial a entre 25000 e 100000 estruturas mosaicos para uma única experiência de trans- formação de levedura. O banco é utilizável como tal para a seleção funcional.
Experiências similares utilizando fragmentos ADN de mais bai- xos pesos moleculares (menos de 100 pb) conforme descrito na figura 1A, linhas 1 e 5, levaram também a um banco explorável, mas com uma eficácia inferior. Os ADNs de mais alto peso molecular (Figura 1A, linhas 4 e 7) não foram utilizados para a construção de um banco por causa das possibilida- des de uma elevada taxa de contaminação por estruturas parenterais.
Exemplo 3: análise estatística de uma subpopulação do banco O ADN plasmídeo foi preparado a partir do banco de levedura e utilizado para transformar E.co/i, utilizando-se o marcador de resistência à ampicilina presente sobre o plasmídeo de levedura. Essa etapa permitiu a segregação de plasmídeos individuais que estavam inicialmente presentes como uma população heterogênea em cada coluna de levedura. Uma matriz foi construída a partir de uma placa de microtitulação de 384-poços contendo 378 clones de E.coli escolhidos ao acaso para análises de estruturas, utilizando 6 sondas repartidas ao longo da sequência dos P450 parenterais descritas na figura 2 (SEQ ID N° 3 à SEQ ID N° 8). Os poços restantes foram insemina- dos com bactérias previamente transformadas com plasmídeos controles contendo um ou outra das seqüências parenterais (P450 1A1 ou 1A2).
As seis ondas (22-36 bases) foram escolhidas para hibridar al- ternativamente sobre as duas seqüências parenterais em regiões de poucas similaridades de seqüências entre os dois P450 parenterais: 3 sondas per- tenciam a p1 A1/V60 e 3 no P1A2/V60. Cada sonda foi marcada no 32P e uti- lizada para hibridar as réplicas sobre filtros (em condições que favorecem as hibridações específicas). As experiências foram repetidas utilizando-se dife- rentes associações de filtros e de sondas para eliminar eventuais artefatos. A análise das intensidades de hibridação foi realizada manualmente. Os ní- veis intermediários de intensidade de hibridação (da ordem de 15 % dos pontos) foram considerados como respostas positivas. Essas respostas de- vem corresponder a emparelhamentos de um par de base devido a muta- ções induzidas pelas diferentes etapas de PCR (isto sendo confirmado pelos dados de seqüenciação (ver depois) ou então pelas diferenças de eficácia de transferência de ADN. A figura 3 apresenta o padrão global de hibridação para as seis sondas. A freqüência de estruturas apresenta um padrão de hibridação se- melhante a um dos parentes (aqui denominados “parentais”) para todas as sondas calculadas no banco (figura 3A, quadrados escuros) é de 11,4 % para estruturas que correspondem ao P450 1A2 e de 2.4% para estruturas que correspondem ao P450 1A1. A soma dessas duas freqüências (13,8 %) é superior ao valor teórico de 3,1 % ((0,5)6+(0,5)6) correspondendo a uma reassociação totalmente aleatória dos fragmentos de seqüências parente- rais. Uma ilustração em “falsas cores” das diferentes estruturas mosaicos (não mostrada) ilustra bem o excesso de clones parenterais de tipo 1A2 ou de tipo 1A1, mas sugere uma repartição geral bastante homogênea dos dife- rentes tipos de estruturas mosaicos.
Com a finalidade de ir mais longe na caracterização da popula- ção, uma análise estatística foi feita, utilizando-se um programa baseado em tabuladores Excelll e rotinas em Visual Basic. A probabilidade de presença de cada seqüência parenteral a cada uma das 6 posições sondadas foi cal- culada (Tabela 1). Essa freqüência foi bastante homogênea (0,56 ± 0,02 para os fragmentos de tipo 1A2) para o conjunto dos segmentos analisados. O pequeno excesso na freqüência para os segmentos de tipo 1A2 reflete provavelmente o erro na avaliação das taxas de ADN parenterais, quando da mistura dos fragmentos de ADN parenterais. A proporção teórica das se- qüências parenterais foi recalculada com os novos valores de freqüência: 3,7 % (0,586 + 0,426). Esse último valor nem sempre corresponde à proporção de parenterais observadas (13,8 %).
Tabela 1: freqüência das partes de seqüências mosaicos perten- centes a cada tipo parental, nas posições sondadas. As sondas P1 a P6 co- meçam nas posições respectivas das seqüências de P450 1A1 ou 1A2, se- gundo a sonda considerada: 3, 612, 683, 879, 1377 e 1513 (ver a figura 2).
Para cada sonda, o número de sinais de hibridação relativo a 1A1 ou a 1A2 foi calculado e dividido pelo número total de clones testados (378).
Para caracterizar mais detalhadamente a população, a curva das freqüências acumuladas para probabilidade de observação das 64 classes detectáveis de quimeras foi calculada (figura 5). Um código binário associa arbitrariamente um valor de 0 ou 1, segundo a natureza de cada segmento 1A1 ou 1A2, para os segmentos 1 a 6, para cada estrutura mosaica foi utili- zado. As seqüências parentais 1A1 e 1A2 correspondem respectivamente aos códigos 0 e 63. A curva experimental (figura 5, círculos vazios) tem um aspecto irregular que compreende cinco patamares. O aparecimento desses mancais era completamente inesperada, e imprevisível, pois não correspon- dendo ao que teria sido esperado no caso de uma independência de recom- binação entre os diferentes fragmentos.
Três curvas teóricas foram então calculados conforme descrito no Exemplo 1, utilizando abordagens de tipo Monte Cario (simulações numé- ricas), utilizando diferentes hipóteses: (I) uma probabilidade igual de encontra os diferentes tipos parentais nas zonas de seqüências correspondentes às diferentes sondas e uma independência total da natureza de cada segmento de seqüência; (II) hipótese (I), mas com uma probabilidade de encontrar fragmentos de tipo 1A2 nas zonas de seqüências corres- pondentes às diferentes sondas de 55,8 %; (III) hipótese (II), mas a probabilidade de mistura recombinató- ria entre os diferentes segmentos de seqüência não é mais infinita (mistura imperfeita), mas com ligações variáveis en- tre a natureza de segmentos consecutivos. A curva de freqüência acumulada (figura 5) correspondente à hipótese (I) é linear, enquanto que no caso correspondente à hipótese (II), a curva é arredondada, mas continua regular. Essa curva (refletindo a real percentagem de fragmentos parentais) reproduz efetivamente bem o cami- nhar geral da curva calculada a partir de resultados experimentais, mas ela não apresenta os patamares observados.
Numerosas curvas correspondentes à hipótese (III) foram gera- das com diferentes tipos de ligações entre segmentos e uma curva corres- pondente à curva experimental foi encontrada (círculos cheios). A adição de ligações genéticas apropriadas entre as seqüências sondadas permite de- terminar uma curva correspondente que segue a curva experimental. Certa- mente, várias soluções devem no caso ser possíveis, mas uma probabilida- de de ligação entre fragmentos parentais de 0,1; 0,6; 0,85; 0,1; 0,1 entre os segmentos sondados 1-2, 2-3, 3-4, 4-5 e 5-6, respectivamente, dá um re- sultado satisfatório. Esses resultados sugerem que, mesmo se a proporção de cada tipo parental ao longo da seqüência for homogênea, a probabilidade de mistura recombinatória dependerá do segmento de seqüência considera- do. Assim, os patamares da curva de resultados obtida correspondem a uma correlação entre diferentes segmentos de seqüência. O cálculo das freqüências de cada tipo parental na população foi simulado, após incorporação das probabilidades de ligações no modelo. Os resultados médios oriundos de 10 simulações informáticas dão uma freqüência de estruturas de tipo parental de 13,9 + 1,3 % (dos quais 9,8 ± 1,4 % para o 1A2 e 4,1 + 1,09 para 1A1), o que corresponde bastante aos valores expe- rimentais de 13,8 %; (11,4 % para ο 1A2 e 2,4 % para ο 1A1). A heteroge- neidade da probabilidade de mistura recombinatória ao longo da seqüência pode, portanto perfeitamente ser responsável pelo excesso aparente de es- truturas de tipo parental na população. A fim de verificar a existência de ligações entre fragmentos, as associações entre as diferentes sondas foram analisadas. A figura 6 apre- senta as freqüências das associações de zonas de seqüência de mesmo tipo parental e de tipo parental diferentes para cada uma das associações de sondas possíveis.
Na figura 6.A, é possível ver as probabilidades de associações próximas (entre zonas adjacentes). Isto coloca claramente em evidência que as associações P1-P2, P4-P5 e P5-P6 mostram uma independência com- pleta à diferença das associações P2-P3 e P3-P4 que mostram uma dimi- nuição da freqüência de associação entre fragmentos de tipo parental dife- rentes. A figura 6.B mostra a associação entre duas sondas espaçadas de uma sonda. De novo, pode-se observar uma associação que mostra uma ligação quase completa entre P2 e P4. As outras associações apresentam independências completas entre sondas.
Isto é igualmente verdadeiro para associações entre sondas mais afastadas (figura 6.C). Outras associações a longas distâncias (P1-P5; P2-P6 e P1-P6) foram calculadas, revelam as mesmas características que aquelas da figura 6.C e não são mostradas aqui.
Esses resultados confirmam bem o modelo preditivo, mesmo se o número de ligações no modelo e de somente 2. De maneira surpreendente os valores obtidos para esses dados não correspondem a um modelo gené- tico. Com efeito, a distância (entre os segmentos ligados) parece mais im- portante no caso de P2-P4 comparado a P2-P3 ou P3-P4. Uma explicação possível desse fenômeno pode estar ligada ao número possível de recombi- nação cruzada ("Crossing-over") nesse intervalo (P2-P4). A existência de patamares correspondentes a uma correlação entre fragmentos, quando se utiliza a análise descrita mais acima permite tirar uma conclusão importante. Com efeito, quando uma pressão de seleção funcional é exercida sobre os clones, é provável que introduz um desvio mais importante de correlações entre diferentes regiões de genes estuda- dos. Assim, pode ser possível definir padrões de associação entre várias regiões do gene, que são ligados a atividades e/ou propriedades funcionais.
Isto deve permitir acelerar o processo de definição de proteínas que apre- sentam funções e/ou propriedades melhoradas, escolhendo-se as seqüên- cias a serem associadas.
Exemplo 4: seleção de clones funcionais Uma vantagem maior da estratégia de mistura recombinatória (shuffling) desenvolvida na presente invenção é que o banco é, pela primeira vez, diretamente construída em um microorganismo eucariote (a levedura).
Além disso, é possível utilizar cepas de levedura, cujo genoma foi modifica- do, a fim de permitir reconstituir sistemas protéicos (enzimáticos) complexos.
Nas experiências da presente invenção, cepas de leveduras possuindo um genoma modificado foram utilizados, para permitir a reconsti- tuição de um sistema membranário com acoplamento dos diferentes parcei- ros. Os clones de levedura transformados resultantes das etapas de permuta podem então ser utilizados como tais para um alvo funcional da atividade das proteínas mosaicos construídas. A utilização do banco primário oferece além disso a vantagem de ser constituída de clones contendo de múltiplos plasmídeos mosaicos, o que melhora consideravelmente a complexidade do banco, e permite atingir as atividades de várias proteínas mosaicos, testando a atividade exatamente sobre um clone de levedura.
Todavia, é claro que os clones selecionados para sua funcionali- dade necessitam de uma etapa de segregação suplementar para um estudo bioquímico mais detalhado. Essa segregação pode ser realizada por subclo- nagens repetidas ou por extrações de ADN dos clones positivos, seguidos de uma transferência em E.coli e de uma retransformação da levedura.
As experiências seguintes demonstram a maneira de fazer de uma seleção funcional direta in vivo em placas de microtitulação. O método é baseado em uma técnica universal de detecção por coloração dos fenóis aromáticos formados por bioconversão in vivo direta dos hidrocarbonetos policíclicos aromáticos em culturas em microplacas 96- poços (ver Exemplo 1).
Os derivados fenólicos foram em seguida extraídos por fixações hidrófobas (sobre resinas de C18) diretamente sobre microplacas e revela- dos por colorimetria consecutiva ao acoplamento com precursores de co- rantes diazo (figura 7). O alvo do banco mosaico 1A1/1A2 foi realizado, utilizando o naftaleno que é um bom substrato das duas enzimas parentais. Com a fina- lidade de determinar a real proporção de estruturas funcionais o banco pri- mário na levedura foi transferido em E. coli e 96 clones independente (e, portanto, contendo apenas um tipo de plasmídeo) foram utilizados para re- transformar a levedura em placas de mitrotitulação. A freqüência de clones funcionais nessas condições (12 % para a livraria construída com a Taq DNA polimerase) foi reconfirmada por métodos clássicos que utilizam análi- ses dos produtos extraídos por HPLC.
Esses controles permitiram ver que a detecção colorimétrica é confiável e tem uma sensibilidade suficiente para detectar clones com uma atividade naftaleno hidroxilase representando somente 10 % da atividade parental (essas diferenças de quantidades de metabólitos produzidos po- dendo ser devido a diferenças de atividades, mas igualmente de expressão das enzimas mosaicos). O Método de detecção aplicado se revelou igualmente ser eficaz para a detecção de metabólitos provenientes do metabolismo do fenantreno ou outros hidrocarbonetos policíclicos aromáticos.
Exemplo 5: análises de seqüências do banco Cinco clones selecionados ao acaso independentemente de cri- térios funcionais e os cinco clones escolhidos na subpopulação de clones funcionais (ver depois para a seleção) foram seqüenciados. Essas estruturas se mostram ser mosaicos contendo, além disso, mutações adicionais.
As estruturas mosaicos são descritas na figura 7. A figura é ba- seada em um alinhamento entre as estruturas mosaicos e as duas seqüên- cias parenterais e foi realizada com o auxílio de um soft apropriado: para cada estrutura, um alinhamento nucleotídico foi realizado com as duas se- qüências parentais. Esses alinhamentos foram utilizados como dados de partida para um programa de visualização que gerou a figura, desenhando em cinza ou em preto as partes de seqüências pertencentes, respectiva- mente, aos P450 parentais 1A1 ou 1A2, e acrescentando traços verticais finos inferiores ou superiores para indicar as zonas de emparelhamento nu- cleotídicas com a segunda estrutura parental. Por outro lado, traços que atravessam as seqüências indicam as posições de seqüências que não se emparelham com nenhuma das duas seqüências parentais e que devem, portanto, corresponder a mutações. O soft desenha igualmente partes hori- zontais transparentes, que correspondem a segmentos de seqüências para as quais a pertença a um ou a outro dos tipos parentais não pôde ser deter- minada pela análise de seqüências. A análise dessas 10 seqüências selecionadas ao acaso confirma a presença de estruturas mosaicos para cada seqüência. Analisando o con- junto dessas estruturas pode-se notar um número médio de fragmentos dife- rentes de 5,4 ± 2,2. A distribuição de tamanho desses fragmentos é homo- gênea. Para os 54 fragmentos considerados, 32 têm tamanhos compreendi- dos entre 0 e 200 bp, 12 entre 200 e 500 bp e 10 entre 500 e 1000 bp. Além disso, aproximadamente 60 % dos fragmentos são de tamanho inferior a 200 bp, o tamanho do menor fragmento trocas do sendo aproximadamente de 20 bp.
Esses resultados estão em acordo como tamanho médio dos fragmentos de partida oriundos da fragmentação à Dnase I (200-300 bp, ver a figura 1A). A análise da atividade naftaleno hidroxilase dos 5 clones consi- derados ao acaso mostrou que só um era ativo (clone A1). Pela seqüência foi considerado como um clone ativo, ao mesmo título que os 5 escolhidos em critérios de atividade. A taxa média de mutações por seqüência foi cal- culada para os clones ativos e inativos. Para os clones inativos (A2, A3, A4, A5), o número médio de mutações é de 14,0 (+4,2), para os clones ativos é inferior (8,3 ± 3,2). Isto não é surpreendente por causa do modo de seleção (atividade). Com efeito, as seqüências dos clones inativos podem conter as interrupções precoces dos códns.
Finalmente, os diferentes resultados observados, quando das análises estatísticas, foram confirmados pelos dados de seqüências. Além disso, mesmo se o número de clones seqüenciados for pequeno (10, os da- dos obtidos fornecem uma vista detalhada de algumas estruturas mosaicos. A ligação entre fragmentos observada (entre as sondas 2, 3 e 4), quando das análises estatísticas é igualmente observada nessas seqüências. Com efeito, não se observa troca de fragmentos na parte central correspondente a essas sondas. A taxa elevada de mutações está em acordo com uma propor- ção relativamente pequenas de estruturas funcionais (15 %) na população.
Todavia, experiências similares de mistura recombinatória realizadas utili- zando-se enzimas mais fiéis do que a Taq DNA polimerase, tais como a Pfu e Dinazima EXT DNA polimerase deram uma proporção mais forte (80-90 %) de estruturas funcionais. A taxa de mutações pode assim ser adaptada se- gundo os desiderata.
Os exemplos acima ilustram um aspecto da invenção e o técnico sabe fazer os ajustes necessários para generalizar os ensinamentos, sem se afastar do espírito da invenção.
REFERÊNCIAS 1. vau der Meer et al. (1992) Microbiological Reviews, 56(4), 677-94. 2. Stemmer, W. P. (1994) Nature, 370(6488), 389-91. 3. Stemmer, W. P. (1994) Proc. Natl. Acad. Sei. USA, 91(22), 10747-51. 4. Crameri et al. (1997) Nature Biotechnology, 15(5), 436-8. 5. Zhang et al. (1997) Proc. Nalt. Acad. Sei. USA, 94(9), 4504-9. 6. · Crameri et al (1996) Nature Biotechnology, 14(3), 315-9. 7. Crameri et al (1996) Nature Medicine, 2(1), 100-2. 8. Giver et Amold (1998) Current Opinion in Chemical Biology, 2(3), 335-8. 9. Giver et al (1998) Proc. Natl. Acad. Sei. USA, 95(22), 12809-13. 10. Kumamaru et al (1998) Nature Biotechnology, 16(7), 663-6. 11. Moore et al (1997) J Mol. Biol, 272(3), 336-47. 12. Moore et Amold (1996) Nature Biotechnology, 14(4), 458-67. 13. Yano et al (1998) Proc. Natl. Acad. Sei. USA, 95(10), 5511-5. 14. Harayama, S. (1998) Trends In Biotechnology, 16(2), 76-82. 15. Crameri et al (1998) Nature, 391(6664), 288-91. 16. Nixon et al (1998) Trends In Biotechnology, 16(6), 258-64. 17. Kimura et al (1997) Journal ofBacteriology, 179(12), 3936-43. 18. Back, K. et Chappell, J. (1996) Proc. Natl. Acad Sei. USA, 93, 6841-5. 19. Campbell et al (1997) Nat Biotechnol, 15(5), 439-43. 20. Nelson et al. (1987) In Guenguerich, F. P. (ed.), Mammalian cytochrome P- 450. CRC Press, Boca Raton and Florida.s, pp. pp 19-79. 21. Harris, C. C. (1989) Carcinogenesis, 10(9), 1563-6. 22. Kadlubar et al. In Guenguerich, F. P. (ed.), Mammalian cytochrome P-450. CRC Press : Boca Raton and Florida.s., 1987, pp. 81-130. 23. Buters et al. (1999) Drug Metab Rev, 31(2), 437-47. 24. Kawajiri et al. (1990) Princess Takamatsu Symposia, 21, 55-61. 25. Kawajiri et al (1990) FEBS Letters, 263(1), 131-3. 26. Kawajiri et al. (1993) Criticai Reviews in Oncology-Hematology, 14, 77-87. 27. Mace et al. (1994) Molecular Carcinogenesis, 11(2), 65-73. 28. Joo et al. (1999) Chemistry & Biology, 6(10), 699-706. 29. Shao et Amold (1996) Current Opinion in Structural Biology, 6(4), 513-8. 30. Arnold, F. H. (1998) Nature Biotechnology, 16(7), 617-8. 31. Michnick, S. W. et Amold, F. H. (1999) Nat Biotechnol, 17(12), 1159-60. 32. Kikuchi et al (1999) Gene, 236(1), 159-67. 33. Kikuchi et al (2000) Gene, 243(1-2), 133-7. 34. Ostermeier et al (1999) Nat Biotechnol, 17(12), 1205-9. 35. Volkov et al (1999) NucleicAcidsR.es, 27(18), el8. 36. Okuta et al (1998) Gene, 212(2), 221-8. 37. Pompon, D. et Nicolas, A. (1989) Gene, 83(1), 15-24. 38. Mezard, C., Pompon, D. et Nicolas, A. (1992) Cell, 70(4), 659-70. 39. Cullin, C. et Pompon, D. (1988) Gene, 65(2), 203-17. 40. Truan et al (1993) Gene, 125(1), 49-55. 41. Pompon et al. (1997) JHepatol, 26 Suppl 2, 81-5. 42. Urban et al. (1990) Biochimie, 72(6-7), 463-72. 43. Bellamine et al. (1994) Eur J Biochem, 225(3), 1005-13. 44. Sambrook et al (1989) Molecular cloning : a laboratory manual. 2nd Ed.

Claims (21)

1. Processo de construção de um banco combinatório de ex- pressão funcional a partir de um banco combinatório de ácidos nucleicos pertencentes a uma mesma família gênica, caracterizado pelo fato de com- preender as etapas que consistem em: a. introduzir esse banco combinatório de ácidos nucléicos em uma levedura, simultaneamente com um vetor de expressão; b. obter esse banco de expressão funcional por: - recombinação homóloga desse banco combinatório de ácidos nucléicos com esse vetor de expressão nessa levedura; e - recombinação homóloga ou homeóloga (entre sequências se- melhantes, mas não idênticas), entre os diferentes ácidos nucleicos do ban- co combinatório introduzido na referida levedura, a fim de aumentar a com- plexidade e a diversidade do banco combinatório de expressão funcional obtido; sendo que o referido banco combinatório de ácidos nucleicos é uma mistura de produtos de PCR obtido por amplificação de um banco com- binatório de fases abertas de leitura, as referidas fases abertas de leitura apresentando entre elas uma identidade de sequência superior a 40 %, utili- zando um par de iniciadores situados em regiões que flanqueiam as referi- das fases abertas de leitura, o referido banco combinatório sendo obtido a partir de ADNs homólogos ou variantes de sequência que diferem por uma ou mais mutações, o referido banco combinatório de fases abertas de leitura é obtido por reconstituição por “extensão por iniciador” de produtos de frag- mentação de pelo menos duas fases abertas de leitura codificando proteínas funcionais, e a referida etapa de reconstituição por “extensão por iniciador” é realizada por PCR, sendo que cada ciclo da referida etapa de reconstituição por PCR possui pelo menos dois estágios de hibridização.
2. Processo de acordo com a reivindicação 1, caracterizado pelo fato de que as referidas regiões que flangueiam as fases abertas de leitura são regiões promotoras e terminadoras que permitem expressão em levedu- ra.
3. Processo de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de cada ciclo dessa etapa de reunião por PCR apresentar pelo me- nos quatro estágios de hibridação de mais de 60 segundos, por temperatu- ras decrescentes regularmente espaçadas.
4. Processo de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que os referidos produtos de fragmentação são obtidos a partir de um vetor de expressão em levedura autônomo de tama- nho total superior a 7 kb (incluindo as fases abertas de leitura).
5. Processo de acordo com a reivindicação 4, caracterizado pelo fato de que o referido vetor de expressão, incluindo as fases abertas de leitu- ra, é um vetor de expressão para uma célula eucarionte, e um vetor "shuttle” para levedura.
6. Processo de acordo a reivindicação 4 ou 5, caracterizado pelo fato de que esse vetor de expressão, incluindo as fases abertas de leitura, contém também os elementos necessários para se replicar de forma autô- noma em Escherichia coli.
7. Processo de acordo com qualquer uma das reivindicações 4 a 6, caracterizado pelo fato de que o referido vetor de expressão, incluindo as fases abertas de leitura, contém uma fase aberta de leitura, codificando uma enzima eucarionte de membrana.
8. Processo de acordo com a reivindicação 7, caracterizado pelo fato de que a referida enzima eucarionte é escolhida do grupo constituído de citocromo P450 eucarionte, enzimas de conjugação eucariontes (de fase II), membros da família dos transportadores ABC eucariontes.
9. Processo de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que o referido vetor de expressão com o qual é feita a recombinação na levedura é linearizado no local de clonagem normal do cDNA e possui sequências promotoras e de terminação de transcrição, a recombinação efetuando-se ao nível dessas sequências.
10. Processo de acordo com uma das reivindicações 1 a 9, ca- racterizado pelo fato de que o referido vetor de expressão possui também a capacidade de se replicar de forma autônoma em células eucariontes e/ou em Escherichia coli.
11. Processo de acordo com qualquer uma das reivindicações 1 a 10, caracterizado pelo fato de que a cepa de levedura utilizada apresenta uma modificação genética que permite a superexpressão de pelo menos uma proteína escolhida no grupo constituído de uma P450 redutase endó- gena ou exógena, uma adrenodoxina, uma adrenodoxina reductase, um ci- tocromo b5 heterólogo, uma enzima de fase II (em particular uma epóxido hidrolase).
12. Processo de acordo com qualquer uma das reivindicações 1 a 11, caracterizado pelo fato de que a etapa b é seguida das etapas que consistem em: a. extrair o ADN plasmidial de pelo menos um clone de levedura; b. transformar uma cepa de Escherichia coli com esse ADN plasmidial extraído, e selecionar os clones transformados em meio apropria- do para se obter uma discriminação dos elementos do banco combinatório de expressão funcional.
13. Processo de produção de proteínas mosaico funcionais ati- vas, caracterizado pelo fato de compreender construir um banco combinató- rio de expressão funcional por um processo de acordo com qualquer uma das reivindicações 1 a 12, em que as proteínas mosaico funcionais ativas são expressas e em que as proteínas mosaico funcionais ativas são selecio- nadas por estudo de sua atividade.
14. Processo de acordo com a reivindicação 13, caracterizado pelo fato de que as referidas proteínas funcionais mosaico ativas são deriva- das de enzimas.
15. Processo de acordo com a reivindicação 14, caracterizado pelo fato de que as referidas proteínas funcionais mosaico ativas são deriva- das de citocromos P450.
16. Processo de análise de um banco de expressão funcional combinatório como definido em qualquer uma das reivindicações 1 a 12, ca- racterizado pelo fato de compreender as seguintes etapas: a. transformação de uma cepa de Escherichia coli com o ADN plasmidial extraído da cepa de levedura ou de um pool de leveduras; b. hibridação do ADN plasmidial contido em cada um dos clones individuais de Escherichia coli obtidos no final da etapa a. com uma sonda específica ou várias de uma sequência parental.
17. Processo de acordo com a reivindicação 16, caracterizado pelo fato de que a referida hibridação é feita sobre um macro- ou uma mi- croarray de ADN, esse array sendo constituída seja pelo ADN plasmidial contido em cada dos clones individuais de Escherichia coli obtidos no final da etapa a., ou de um produto de PCR do mesmo, ou das referidas sondas específicas, ligadoas sobre um suporte sólido, cada um dos ácidos nucleicos sendo marcado por sua posição no referido array.
18. Processo de determinação de ligações entre assinaturas de sequências e assinaturas funcionais de uma proteína, caracterizado pelo fato de compreender as etapas que consistem em: a. preparar um banco de expressão funcional combinatório por um processo como definido em qualquer uma das reivindicações 1 a 12; b. produzir as proteínas funcionais mosaicos ativas por um pro- cesso como definido em qualquer uma das reivindicações 13 a 15; c. analisar as diferenças funcionais e/ou de atividade entre essas proteínas mosaico; d. analisar os ácidos nucleicos correspondentes a essas proteí- nas mosaicos por um processo como definido na reivindicação 16 ou 17, seguido de forma opcional por um processo de análise de uma impressão de hibridação, compreendendo as etapas que consistem em: i. calcular a frequência de aparecimento de cada uma das com- binações possíveis; ii. realizar uma análise estatística das combinações, por um tra- tamento matemático e estatístico adequado; e. determinar as ligações que podem existir entre as estruturas sequenciais observadas nas etapa d. com as diferenças funcionais e/ou de atividade observadas na etapa c.
19. Processo de predição de estruturas com uma determinada função, caracterizado pelo fato de se aplicar o processo como definido na reivindicação 18, para identificar as regiões de sequências, ou as ligações entre as regiões de sequências, ligadas a essa função, em que a estrutura buscada é deduzida a partir daí.
20. Processo de obtenção de uma proteína possuindo proprie- dades melhoradas, caracterizado pelo fato de que compreende as etapas que consistem em: a. construir um banco combinatório de expressão funcional por um processo como definido em qualquer uma das reivindicações 1 a 12; b. analisar o referido banco combinatório de expressão funcional por um processo como definido em qualquer uma das reivindicações 16 ou 17; c. analisar as impressões de hibridação obtidas na etapa b, por um processo de análise de impressão de hibridação, compreendendo as etapas que consistem em: i. calcular a frequência de aparecimento de cada uma das com- binações possíveis; ii. definir uma assinatura da repartição estatística das combina- ções, por um tratamento matemático e estatístico adequado; d. determinar as ligações entre as estruturas sequenciais e as estruturas funcionais das proteínas por comparação dessas impressões de hibridação com as propriedades das proteínas mosaicos correspondentes, por um processo de acordo com a reivindicação 23; e. predizer as estruturas de interesse ou as organizações de es- truturas nas proteínas mosaicos por um processo como definido na reivindi- cação 18; f. repetir as etapas a. a e., utilizando, como ácidos nucleicos de partida para a geração do banco combinatório de expressão funcional, os ácidos nucleicos portando as estruturas de interesse ou as organizações de estruturas identificadas na etapa e., um número suficiente de vezes para se obter a proteína que possui propriedades melhoradas buscadas.
21. Processo de determinação de uma estrutura de uma proteí- na que é importante em resposta a uma pressão de seleção, usando-se um banco combinatório de expressão funcional que foi obtido por um processo como definido em qualquer uma das reivindicações 1 a 12, para os elemen- tos da qual uma assinatura foi obtida, caracterizado pelo fato de compreen- der as etapas de: - normalização do referido banco garantindo que cada assinatura esteja presente com a mesma probabilidade no banco normalizado; - aplicação de uma pressão de seleção; - realizar uma análise estatística do novo banco assim obtido, em comparação com aqueles obtidos no banco normalizado de partida; - estudo da mudança na frequência de aparecimento da assina- tura de sequência do novo banco obtido em comparação com o banco de partida normalizado, deduzindo assim as estruturas presentes ou ausentesem resposta à pressão de seleção.
BRPI0111680-0A 2000-06-14 2001-06-13 Processos de construção de um banco combinatório de expressão funcional, de produção de proteínas mosaico funcionais ativas, de análise do referido banco, de determinação de ligações entre assinaturas de sequencias e assinaturas funcionais de uma proteína, de predição de estruturas com uma determinada função, de obtenção de uma proteína possuindo propriedades melhoradas, bem como de determinação de uma estrutura de uma proteína BR0111680B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0007555A FR2810339B1 (fr) 2000-06-14 2000-06-14 Banques combinatoires ameliorees par recombinaison dans la levure et procede d'analyse
FR00/07555 2000-06-14
PCT/FR2001/001831 WO2001096555A1 (fr) 2000-06-14 2001-06-13 Banques combinatoires ameliorees par recombinaison dans la levure et procede d'analyse

Publications (2)

Publication Number Publication Date
BR0111680A BR0111680A (pt) 2003-07-01
BR0111680B1 true BR0111680B1 (pt) 2014-03-18

Family

ID=8851235

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0111680-0A BR0111680B1 (pt) 2000-06-14 2001-06-13 Processos de construção de um banco combinatório de expressão funcional, de produção de proteínas mosaico funcionais ativas, de análise do referido banco, de determinação de ligações entre assinaturas de sequencias e assinaturas funcionais de uma proteína, de predição de estruturas com uma determinada função, de obtenção de uma proteína possuindo propriedades melhoradas, bem como de determinação de uma estrutura de uma proteína

Country Status (18)

Country Link
US (1) US20020160380A1 (pt)
EP (1) EP1299532B1 (pt)
JP (1) JP5116931B2 (pt)
KR (1) KR20030027899A (pt)
AT (1) ATE391776T1 (pt)
AU (2) AU6763901A (pt)
BR (1) BR0111680B1 (pt)
CA (1) CA2411740C (pt)
DE (1) DE60133556T2 (pt)
DK (1) DK1299532T3 (pt)
ES (1) ES2301553T3 (pt)
FR (1) FR2810339B1 (pt)
IL (2) IL153345A0 (pt)
MX (1) MXPA02012214A (pt)
NO (1) NO331201B1 (pt)
NZ (1) NZ523222A (pt)
WO (1) WO2001096555A1 (pt)
ZA (1) ZA200209604B (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030124601A1 (en) * 2000-06-01 2003-07-03 Masuhiro Nishimura Method of detecting and quantifying human p450 molecular species and probe and kit for this method
KR100475133B1 (ko) * 2002-09-13 2005-03-10 한국생명공학연구원 효모 표면 발현 벡터를 이용하여 변이 리파제를스크리닝하는 방법 및 신규 변이 리파제
US7833703B2 (en) * 2003-04-11 2010-11-16 ESBATech, an Alcon Biomedical Research Unit, LLC Method for the construction of randomized gene sequence libraries in cells
ES2705694T3 (es) * 2008-06-13 2019-03-26 Codexis Inc Método de síntesis de variantes de polinucleótidos
EP2406377B1 (en) * 2009-03-12 2016-01-06 Bigtec Private Limited A polynucleotide and polypeptide sequence and methods thereof

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5605793A (en) * 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
FR2738840B1 (fr) * 1995-09-19 1997-10-31 Rhone Poulenc Rorer Sa Souches de levures genetiquement modifiees
US6479258B1 (en) * 1995-12-07 2002-11-12 Diversa Corporation Non-stochastic generation of genetic vaccines
WO1999040208A1 (en) * 1998-02-05 1999-08-12 The General Hospital Corporation In vivo construction of dna libraries
US6902918B1 (en) * 1998-05-21 2005-06-07 California Institute Of Technology Oxygenase enzymes and screening method
CA2273616A1 (en) * 1998-06-08 1999-12-08 The Board Of Trustees Of The Leland Stanford Junior University Method for parallel screening of allelic variation
MXPA01000224A (es) * 1998-07-28 2002-10-17 California Inst Of Techn Expresion de proteinas eucarioticas funcionales.
US20030153042A1 (en) * 1998-07-28 2003-08-14 California Institute Of Technology Expression of functional eukaryotic proteins
DE60044223D1 (de) * 1999-01-19 2010-06-02 Maxygen Inc Durch oligonukleotide-vermittelte nukleinsäuren-rekombination

Also Published As

Publication number Publication date
AU2001267639B2 (en) 2006-02-02
KR20030027899A (ko) 2003-04-07
JP2004506416A (ja) 2004-03-04
DK1299532T3 (da) 2008-06-16
NO331201B1 (no) 2011-10-31
FR2810339A1 (fr) 2001-12-21
FR2810339B1 (fr) 2004-12-10
IL153345A0 (en) 2003-07-06
ATE391776T1 (de) 2008-04-15
ZA200209604B (en) 2003-11-26
US20020160380A1 (en) 2002-10-31
NZ523222A (en) 2005-08-26
DE60133556D1 (de) 2008-05-21
MXPA02012214A (es) 2003-09-10
NO20025962D0 (no) 2002-12-12
CA2411740C (fr) 2013-05-28
DE60133556T2 (de) 2009-04-30
EP1299532A1 (fr) 2003-04-09
ES2301553T3 (es) 2008-07-01
IL153345A (en) 2010-04-29
NO20025962L (no) 2003-02-04
JP5116931B2 (ja) 2013-01-09
CA2411740A1 (fr) 2001-12-20
WO2001096555A1 (fr) 2001-12-20
BR0111680A (pt) 2003-07-01
EP1299532B1 (fr) 2008-04-09
AU6763901A (en) 2001-12-24

Similar Documents

Publication Publication Date Title
CN107922931B (zh) 热稳定的Cas9核酸酶
CN110352241B (zh) 热稳定的Cas9核酸酶
Baker et al. Expansion of the mammalian 3β-hydroxysteroid dehydrogenase/plant dihydroflavonol reductase superfamily to include a bacterial cholesterol dehydrogenase, a bacterial UDP-galactose-4-epimerase, and open reading frames in vaccinia virus and fish lymphocystis disease virus
CN109688820A (zh) 用于生成条形码化组合文库的方法
Storici et al. The delitto perfetto approach to in vivo site‐directed mutagenesis and chromosome rearrangements with synthetic oligonucleotides in yeast
O'Maille et al. Structure-based combinatorial protein engineering (SCOPE)
JP2721666B2 (ja) 酵母におけるdnaの部位特異的組換え
CN106103699A (zh) 体细胞单倍体人类细胞系
ES2353700T3 (es) Generación de genes recombinantes en saccharomyces cerevisiae.
JP2002536978A5 (pt)
Crellin et al. The resolvase/invertase domain of the site-specific recombinase TnpX is functional and recognizes a target sequence that resembles the junction of the circular form of the Clostridium perfringens transposon Tn4451
CN106754811A (zh) 一种突变型Tn5转座酶及其制备方法和应用
Wang et al. Divergent evolution profiles of DD37D and DD39D families of Tc1/mariner transposons in eukaryotes
CN112481309B (zh) Ago蛋白的用途及组合物和基因编辑方法
US7670809B2 (en) Use of mutagenic DNA polymerase for producing random mutations
BR0111680B1 (pt) Processos de construção de um banco combinatório de expressão funcional, de produção de proteínas mosaico funcionais ativas, de análise do referido banco, de determinação de ligações entre assinaturas de sequencias e assinaturas funcionais de uma proteína, de predição de estruturas com uma determinada função, de obtenção de uma proteína possuindo propriedades melhoradas, bem como de determinação de uma estrutura de uma proteína
WO2001040477A1 (fr) Transposase et procede de modification de genes
PT2478100E (pt) Método de geração de mosaicos de genes
Lal et al. Helitrons: enigmatic abductors and mobilizers of host genome sequences
Blaese Optimism regarding the use of RNA/DNA hybrids to repair genes at high efficiency
Chetverin Recombination in Bacteriophage Qβ and Its Satellite RNAs: Thein Vivoandin VitroStudies
Song et al. Phage tyrosine integrase-mediated multi-sites genome engineering in Lacticaseibacillus casei
Haber et al. Function and evolution of HO and VDE endonucleases in fungi
US20030092023A1 (en) Method of shuffling polynucleotides using templates
CN107043410A (zh) 一种水稻胚乳粉质相关基因OsmtSSB及其编码蛋白质和应用

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 18/03/2014, OBSERVADAS AS CONDICOES LEGAIS.

B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time

Free format text: REFERENTE A 16A ANUIDADE.

B24J Lapse because of non-payment of annual fees (definitively: art 78 iv lpi, resolution 113/2013 art. 12)