PT1600510E - Sequências de adn com actividade anti-repressora. - Google Patents

Sequências de adn com actividade anti-repressora. Download PDF

Info

Publication number
PT1600510E
PT1600510E PT05076209T PT05076209T PT1600510E PT 1600510 E PT1600510 E PT 1600510E PT 05076209 T PT05076209 T PT 05076209T PT 05076209 T PT05076209 T PT 05076209T PT 1600510 E PT1600510 E PT 1600510E
Authority
PT
Portugal
Prior art keywords
dna
sequence
star
expression
cell
Prior art date
Application number
PT05076209T
Other languages
English (en)
Inventor
Arie Pieter Otte
Arthur Leo Kruckeberg
Original Assignee
Chromagenics Bv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP01202581A external-priority patent/EP1273666A1/en
Application filed by Chromagenics Bv filed Critical Chromagenics Bv
Publication of PT1600510E publication Critical patent/PT1600510E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/635Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6897Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters

Description

ΕΡ 1 600 510 /PT
DESCRIÇÃO "Sequências de ADN com actividade anti-repressora" A invenção refere-se aos campos da medicina e da biologia celular. A invenção em particular refere-se a meios e métodos para a regulação da transcrição génica. A invenção refere-se ainda a meios e métodos para determinar se uma sequência de ADN compreende uma qualidade moduladora da transcrição génica e/ou uma qualidade repressora da transcrição génica.
Com a progressão dos vários projectos genómicos, têm-se tornado disponíveis as sequências de genomas de organismos inteiros. A enxurrada de dados tem aumentado o interesse de muitos investigadores. Uma das descobertas mais notáveis foi a observação de que o genoma humano não codifica significativamente mais genes do que o genoma de organismos simples como a mosca da fruta. O foco de muitos investigadores está agora a desviar-se para a identificação de genes para a determinação da expressão de genes e da função de genes. Os exemplos de tais tecnologias são micro-séries de ADN, aplicações em genómica funcional e proteómica. Estas tecnologias têm em comum que são centralizadas em torno da função e expressão de sequências codificadoras. No entanto, embora o nosso conhecimento de genes aumente dramaticamente, o entendimento de como a expressão dos genes é regulada é que limita a capacidade para aplicar este conhecimento rapidamente crescente. Este é, por exemplo, o caso na geração de plantas e animais transgénicos e na terapia génica humana. Nestas aplicações o ácido nucleico estranho é tipicamente introduzido em células para se obter a expressão de sequências codificadoras. Frequentemente a integração do ácido nucleico estranho no genoma da célula é necessária para uma função prolongada das sequências introduzidas. Contudo, a integração de sequências no genoma leva à imprevisibilidade da expressão porque o ADN circundante influencia a transcrição das sequências integradas. Esta imprevisibilidade é em parte devido ao facto de que as sequências introduzidas não podem ser fornecidas ainda com informação genética suficiente para isolar funcionalmente as sequências integradas dos efeitos que influenciam a transcrição do ADN circundante. Noutra parte isto é devido ao facto de que não é conhecido o suficiente 2 ΕΡ 1 600 510 /PT acerca dos efeitos que influenciam a transcrição do ADN circundante. A presente invenção refere-se a sequências de ADN que compreendem uma capacidade para influenciar a transcrição génica in cis. Tipicamente, embora não necessariamente, as sequências investigadas não codificam por si só uma proteína funcional. Vários elementos de sequências com a capacidade para afectar a transcrição génica in cis, foram identificados. Estes elementos variam desde promotores, intensificadores e silenciadores até elementos limítrofes e regiões de ligação a matrizes. O facto de terem sido identificados tantos tipos diferentes de sequências reguladoras dá a impressão de que é muito fácil planejar cassetes de expressão eficazes. Contudo, verifica-se exactamente o contrário. O planejamento de cassetes de expressão é ainda frequentemente conduzido por tentativa e erro. É muito frequentemente possível obter-se algum tipo de expressão de um gene estranho numa célula alvo ou na sua progénie. Contudo, muito frequentemente é difícil prever com algum grau de precisão o nível de expressão ou a persistência de expressão que uma cassete de expressão pode demonstrar numa célula alvo. A presente invenção proporciona, entre outros, meios e métodos para detectar e isolar novos elementos reguladores de transcrição. É proporcionado um método para detectar e opcionalmente seleccionar, uma sequência de ADN com uma qualidade moduladora da transcrição génica, que compreende proporcionar um sistema de transcrição com uma variedade de vectores que compreendem fragmentos, os ditos vectores compreendendo i) um elemento com uma qualidade repressora da transcrição génica e ii) um promotor que dirige a transcrição de um gene repórter, o método compreendendo ainda realizar uma etapa de selecção no dito sistema de transcrição de modo a identificar a dita sequência de ADN com a dita qualidade moduladora da transcrição génica. Numa concretização preferida os ditos fragmentos estão localizados entre i) o dito elemento com uma qualidade repressora da transcrição génica e ii) o dito promotor que dirige a transcrição do dito gene repórter. A ARN-polimerase inicia o processo de transcrição depois da ligação a uma sequência específica, chamada o promotor, que 3 ΕΡ 1 600 510 /PT sinaliza onde a síntese de ARN deve começar. Uma qualidade moduladora pode aumentar a transcrição pelo dito promotor in cis, numa dado tipo de célula e/ou um dado promotor. A mesma sequência de adn pode compreender uma qualidade intensificadora num tipo de célula ou com um tipo de promotor, ao passo que pode compreender uma outra ou nenhuma qualidade moduladora da transcrição génica noutra célula ou com um outro tipo de promotor. A transcrição pode ser influenciada através de um efeito directo do elemento regulador (ou da(s) proteína(s) que se lhe ligam) na transcrição de um promotor particular. A transcrição contudo, também pode ser influenciada por um efeito indirecto, por exemplo, porque o elemento regulador afecta a função de um ou mais outros elementos reguladores. Uma qualidade moduladora da transcrição génica também pode compreender uma qualidade de transcrição génica estável. Por estável entende-se que o nível de transcrição observado não é significativamente alterado durante pelo menos 30 divisões celulares. Uma qualidade estável é útil em situações em que as características de expressão devem ser previsíveis ao longo de muitas divisões celulares. Os exemplos típicos são linhas celulares transfectadas com genes estranhos. Outros exemplos são animais e plantas transgénicos e terapias génicas. Muito frequentemente, as cassetes de expressão introduzidas funcionam diferentemente depois de aumentarem os números de divisões celulares ou gerações da planta ou do animal. Numa concretização preferida uma qualidade estável compreende uma capacidade para manter a transcrição génica em gerações subsequentes de uma planta ou um animal transgénicos. Naturalmente, no caso em que a expressão é indutível, a dita qualidade compreende a qualidade de manter a indutibilidade da expressão em gerações subsequentes de uma planta ou um animal transgénicos. Frequentemente, os níveis de expressão caem dramaticamente com o aumento do número de divisões celulares. Com um método da invenção é possível detectar e opcionalmente seleccionar uma sequência de ADN que seja capaz de, pelo menos em parte, prevenir a queda dramática nos níveis de transcrição com o aumento do número de divisões celulares. Assim, numa concretização preferida, a dita qualidade moduladora da transcrição génica compreende uma qualidade de transcrição génica estável. Surpreendentemente, os fragmentos que constituem uma sequência de ADN com a dita qualidade de 4
ΕΡ 1 600 510 /PT transcrição génica estável podem ser detectados e opcionalmente seleccionados com um método da invenção, a despeito do facto de o dito método não medir necessariamente a estabilidade a longo prazo da transcrição. Numa concretização preferida da invenção a dita qualidade moduladora da transcrição génica compreende uma qualidade intensificadora da transcrição génica estável. Foi observado que a incorporação de uma sequência de ADN com uma qualidade moduladora da transcrição génica num vector de expressão com um gene de interesse, resulta num nivel mais elevado de transcrição do dito gene de interesse, por integração do vector de expressão no genoma de uma célula e além disso que o dito nivel de expressão mais elevado do gene é também mais estável do que na ausência da dita sequência de ADN com uma qualidade moduladora da transcrição génica.
Nas experiências planejadas para introduzir um gene de interesse no genoma de uma célula e para obter a expressão do dito gene de interesse, foi observado o seguinte. Se juntamente com o dito gene de interesse foi também introduzida uma sequência de ADN com uma qualidade moduladora da transcrição génica, podem ser detectados mais clones que expressaram mais do que uma certa quantidade de produto génico do dito gene de interesse, do que quando a dita sequência de ADN não foi introduzida juntamente com o dito gene de interesse. Assim, a presente invenção também proporciona um método para aumentar o número de células que expressam mais do que um certo nivel de um produto génico de um gene de interesse após proporcionar o dito gene de interesse ao genoma das ditas células, que compreende proporcionar à dita célula uma sequência de ADN que compreende uma qualidade moduladora da transcrição génica juntamente com o dito gene de interesse.
As possibilidades de detectar um fragmento com uma qualidade moduladora da transcrição génica variam com a fonte da qual os fragmentos são derivados. Tipicamente, não existe nenhum conhecimento anterior da presença ou ausência de fragmentos com a dita qualidade. Nestas situações muitos fragmentos não compreenderão uma sequência de ADN com uma qualidade moduladora da transcrição génica. Numa destas situações é introduzida uma etapa de selecção formal para sequências de ADN com a dita qualidade. Isto é feito através de vectores de selecção compreendendo a dita sequência com 5 ΕΡ 1 600 510 /PT base numa característica de um produto do dito gene repórter, que pode ser seleccionada. Por exemplo, o dito produto génico pode induzir fluorescência ou um depósito de cor (por exemplo, proteína verde fluorescente e derivados, luciferase ou fosfatase alcalina) ou conferir resistência a antibióticos ou induzir apoptose e morte celular.
Um método da invenção é particularmente adaptado para detectar e opcionalmente seleccionar uma sequência de ADN que compreende uma qualidade intensificadora da transcrição génica. Foi observado que pelo menos algumas das sequências de ADN seleccionadas, quando incorporadas num vector de expressão que compreende um gene de interesse, podem aumentar dramaticamente a transcrição génica do dito gene de interesse numa célula hospedeira mesmo quando o vector não compreende um elemento com uma qualidade repressora da transcrição génica. Esta qualidade intensificadora da transcrição génica é muito útil em linhas celulares transfectadas com genes estranhos ou em animais e plantas transgénicos.
Para a presente invenção o dito sistema de transcrição compreende célula hospedeiras. O uso de células hospedeiras garante que os fragmentos sejam detectados e opcionalmente seleccionados com actividade em células.
Um elemento com uma qualidade repressora da transcrição génica, num método da invenção, reprimirá a transcrição a partir de um promotor no sistema de transcrição usado. A dita repressão não tem que levar a níveis de expressão indetectáveis. importante é que a diferença nos níveis de expressão na ausência ou na presença de repressão seja detectável e opcionalmente seleccionável. Numa concretização preferida a repressão na transcrição génica nos ditos vectores resulta em cromatina que reprime a transcrição génica. Nesta concretização preferida podem ser detectadas e opcionalmente seleccionadas sequências de ADN que são capazes de, pelo menos em parte, contrariar a formação de cromatina que reprime a transcrição génica. Num aspecto uma sequência de ADN capaz de, pelo menos em parte, contrariar a formação da cromatina que reprime a transcrição génica, compreende uma qualidade de transcrição génica estável. Numa concretização preferida a sequência de ADN envolvida na repressão da transcrição génica é uma sequência de ADN que é reconhecida por um complexo de 6
ΕΡ 1 600 510 /PT proteína e em que o dito sistema de transcrição compreende o dito complexo. Preferivelmente o dito complexo compreende uma proteína de ligação a heterocromatina compreendendo HP1, uma proteína do grupo Policomb (Pc-G), uma actividade de histona-desacetilase ou MeCP2 (proteína de ligação a metil-CpG). Muitos organismos compreendem uma ou mais destas proteínas. Estas proteínas frequentemente também exibem actividade em outras espécies. O dito complexo pode assim compreender também proteínas de duas ou mais espécies. O conjunto mencionado de complexos de proteínas associadas a cromatina conhecidos são capazes de transmitir repressão de gama larga ao longo de muitos pares de bases. Os complexos também estão envolvidos na transferência estável da situação reprimida dos genes para as células filhas na divisão celular. As sequências seleccionadas deste modo são capazes de transmitir anti-repressão de gama larga ao longo de muitos pares de bases (van der Vlag et al.r 2000) . O vector usado pode ser qualquer vector que seja adequado para clonar ADN e que possa ser usado num sistema de transcrição. Quando são usadas células hospedeiras prefere-se que o vector seja um vector que replique epissomicamente. Deste modo, são evitados os efeitos devidos a diferentes locais de integração do vector. Os elementos de ADN que flanqueiam o vector no local de integração podem ter efeitos sobre o nível de transcrição do promotor e desse modo imitar os efeitos de fragmentos que compreendem sequências de ADN com uma qualidade moduladora da transcrição génica. Numa concretização preferida o dito vector compreende uma origem de replicação do vírus de Epstein-Barr (EBV), OriP, e um antigénio nuclear (EBNA-1). Tais vectores são capazes de replicar em muitos tipos de células eucarióticas e se montar na cromatina sob condições apropriadas.
Num outro aspecto a invenção proporciona uma sequência de ADN que compreende i) uma sequência de ADN isolada de uma planta ou um vertebrado, ou seus derivados, ou ii) uma sequência de ADN sintética ou uma construída por engenharia genética, sequência de ADN esta que é uma sequência inibidora de repressão que, pelo método de acordo com a presente invenção pode ser detectada, seleccionada e opcionalmente clonada. Num outro aspecto a invenção proporciona uma sequência de ADN que compreende i) uma sequência de ADN 7 ΕΡ 1 600 510 /PT isolada de uma planta ou um vertebrado ou seus derivados, ou ii) uma sequência de ADN sintética ou uma construída por meios de engenharia genética, sequência de ADN esta que é detectada, seleccionada e opcionalmente clonada por meio do método da invenção. Preferivelmente a dita sequência de ADN compreende uma sequência como representada na Tabela 4 ou um seu homólogo funcional. Um homólogo funcional de uma sequência como representada na Tabela 4 é uma sequência derivada com a informação dada na Tabela 4. Por exemplo, uma sequência que pode ser derivada de uma sequência na Tabela 4 suprimindo, modificando e/ou inserindo bases em, ou de, uma sequência listada na Tabela 4, em que a dita sequência derivada compreende a mesma actividade em tipo, não necessariamente em quantidade, de uma sequência como representada na Tabela 4. Um homólogo funcional é ainda uma sequência que compreende uma parte de duas ou mais sequências representadas na Tabela 4. Uma sequência de ADN sintética é uma sequência que não é derivada directa ou indirectamente de uma sequência presente num organismo. Por exemplo uma sequência compreendendo uma sequência scs ou scs' de drosófila não é uma sequência sintética, mesmo quando as sequências scs ou scs' foram geradas artificialmente.
Num aspecto, a invenção refere-se ao aumento do conhecimento da regulação de genes de ordem superior e a meios e métodos para utilizar este conhecimento. Embora tenham sido caracterizados elementos, tais como promotores e intensificadores clássicos, que dirigem e regulam a transcrição de genes únicos, elementos reguladores de ordem superior que controlam as capacidades de transcrição génica de regiões cromossómicas inteiras têm até agora recebido pouca atenção. Muito do nosso conhecimento com respeito a tais elementos de ordem superior vem do estudo da embriogénese. Durante a embriogénese as células ficam comprometidas com diferentes caminhos de desenvolvimento. Uma vez comprometidas, as células raramente mudam seus destinos, mesmo depois de muitas divisões celulares.
Tem-se tornado cada vez mais claro que a transmissão estável dos padrões de transcrição génica específicos do tipo de célula não é dependente do contexto de um promotor, mas é ao invés disso mediada pelas mudanças na estrutura do ADN e proteínas associadas, denominadas cromatina. A regulação de 8
ΕΡ 1 600 510 /PT genes ao nível cromossómico envolve modificações de ADN (e.g. metilação), histonas, (e.g. acetilação e/ou metilação) e interacções de gama larga entre elementos cromossómicos distantes. O molde de cromatina é um complexo altamente condensado de ADN, proteínas histonas e não histonas, que é capaz de empacotar o genoma inteiro no núcleo e simultaneamente permite a transcrição apropriada de genes específicos. O cromossoma eucariótico não é um molde uniforme para a activação da transcrição génica. Podem ser distinguidos tipos diferentes de cromatina e regiões de cromatina, que afectam diferencialmente a transcrição génica. As chamadas regiões de heterocromatina identificam estruturas de cromatina 'fechadas' ao passo que a eucromatina está associada a uma estrutura de cromatina mais difusa e 'aberta'. A região de eucromatina pode ser submetida a alterações estruturais, que resultam em estruturas mais ou menos condensadas, aludidas como heterocromatina e eucromatina facultativas. Acredita-se que a formação de eucromatina ou heterocromatina facultativas represente o mecanismo subjacente à regulação de genes mediada pela cromatina, mantendo os genes num estado activo ou reprimido, de uma maneira específica do tipo de célula.
Em todos os eucariotas foram identificados diversos complexos de proteína associada a cromatina que estão envolvidos na manutenção da especificidade do tipo de célula, um dos quais é o complexo do grupo Policomb (PcG). O complexo PcG está envolvido na repressão estável de genes, em que se crê que as alterações na estrutura da cromatina desempenham um papel importante. Similarmente, foi identificada uma segunda classe de proteínas, denominadas o grupo tritorax (TrG), que contrariam a acção das proteínas PcG. As proteínas TrG estão envolvidas na manutenção da transcrição génica. Com base nos seus respectivos modos de acção, as proteínas PcG e TrG representam portanto um sistema de memória celular que é importante para a transmissão hereditária dos padrões de transcrição génica.
O modo como os complexos de PcG e TrG estão associados aos seus genes alvo é ainda incerto. Estudos genéticos têm caracterizado sequências reguladoras que atuam em cis que mantêm estados transcricionalmente inactivos de genes. O 9 ΕΡ 1 600 510 /PT silenciamento mediado por estas sequências reguladoras que atuam em eis é dependente da presença de proteínas PcG funcionais e por este motivo estas sequências foram denominadas elementos de resposta a PcG (PRE). Foram identificadas sequências que estão envolvidas na repressão mediada por PcG de cromatina. Até agora contudo, (tanto em vertebrados como em plantas) não foram identificados PRE completos que compreendam toda a informação de sequência requerida para mediar a repressão da cromatina.
Um elemento de resposta do grupo Policomb é um elemento que é capaz de reprimir a transcrição a partir de um promotor em resposta à interaeção directa e/ou indirecta de uma ou mais proteínas do grupo Policomb com o dito elemento. Um elemento de resposta do tipo do grupo policomb é um elemento de resposta do grupo Policomb ou alternativamente é um elemento capaz de reprimir a transcrição de um promotor por interaeção directa e/ou indirecta de uma ou mais proteínas com o dito elemento, em que as ditas uma ou mais proteínas não pertencem ao grupo Policomb, mas em que, como resultado da dita interaeção, a cromatina que reprime a transcrição génica é formada. Os exemplos de tais proteínas são proteínas associadas à cromatina tais como proteína 1 de heterocromatina (HPl) (Eisenberg et al., 1990). Uma outra proteína associada à cromatina que reprime a actividade de genes é uma proteína de ligação a metil-CpG, MeCP2 (Nan et al., 1997). Num concretização preferida um elemento responsivo do tipo do grupo policomb da invenção compreende a capacidade para reprimir a transcrição de um promotor ao longo de grandes distâncias, preferivelmente mais do que 2000 pares de bases (van der Vlag et al., 2000).
Um gene repórter é um gene que codifica um produto de expressão cuja presença pode ser detectada directa ou indirectamente numa célula.
Os exemplos de sequências de ADN com uma qualidade moduladora da transcrição génica são os denominados elementos STAR listados nas Tabelas 1 e 2.
Os métodos da invenção resultam na clonagem e identificação de vários elementos que compreendem uma qualidade de modulação da transcrição génica. Um tal elemento 10
ΕΡ 1 600 510 /PT pode conter ácido nucleico irrelevante que não é útil no desempenho da dita qualidade, por exemplo, que não está envolvido na formação da cromatina que reprime a transcrição génica. As sequências funcionais em tais elementos podem ser delineadas por vários métodos conhecidos na especialidade. Numa concretização as deleções e/ou substituições são feitas numa sequência de ADN com uma qualidade de modulação da transcrição génica. O ADN que é deste modo modificado é testado quanto à actividade num método da invenção. Isto pode ser feito usando um único ácido nucleico modificado ou gerando uma colecção de ácidos nucleicos de teste compreendendo o dito ácido nucleico modificado. A elucidação de sequências funcionais dentro de sequências de ADN da invenção permite a elucidação de sequências de consenso para elementos com uma qualidade moduladora da transcrição génica. Espera encontrar-se mais do que um tipo de sequência de consenso para um elemento que compreende uma qualidade moduladora da transcrição génica. A invenção assim proporciona ainda uma biblioteca de ácidos nucleicos isolados e/ou recombinantes que compreende qualidades moduladoras da transcrição génica e/ou repressoras da transcrição génica tais como elementos de resposta do tipo do grupo policomb. Numa concretização a dita biblioteca compreende ácidos nucleicos isolados e/ou recombinantes compreendendo a mesma sequência de consenso. Numa concretização preferida a dita biblioteca compreende mais do que um tipo de sequência de consenso. A dita biblioteca pode ser usada por exemplo para determinar se uma dada molécula de ADN compreende uma qualidade moduladora de ADN. Numa concretização preferida a dita biblioteca compreende essencialmente todos os elementos com uma função intensificadora da transcrição génica, elementos que compreendem uma qualidade de transcrição génica estável e/ou elementos com uma qualidade repressora da transcrição génica tais como os elementos de resposta do tipo do grupo policomb, de um cromossoma. Juntamente com o conhecimento sobre a localização destes elementos num cromossoma, isto permite que um perito na especialidade gere uma previsão para a regulação de ordem superior da expressão de gene de genes naturalmente presentes no dito cromossoma e para genes (ácido nucleico estranho) introduzidos no dito cromossoma por meios recombinantes. Esta previsão pode ser usada por exemplo para seleccionar uma localização candidata adequada no dito 11
ΕΡ 1 600 510 /PT cromossoma para a inserção de ADN estranho. Uma localização adequada pode ser uma localização que se espera ser especificamente expressa numa determinada célula, tipo de célula e/ou tecido. Preferivelmente, o dito cromossoma compreende o cromossoma 21 ou o cromossoma 22. Numa concretização particularmente preferida todas as sequências de ADN que compreendem uma qualidade de modulação da transcrição génica ou uma qualidade repressora da transcrição génica numa célula, estão na biblioteca. Nesta concretização o genoma inteiro pode ser usado para a previsão de uma localização candidata adequada. Numa concretização a dita biblioteca foi gerada em linhas celulares diferentes de espécies que variam desde plantas a seres humanos. Em linhas celulares e/ou espécies diferentes, serão expressas diferentes proteínas (ou complexos de proteínas) capazes de interagir com as sequências de ADN com uma qualidade repressora da transcrição génica, resultando em elementos de ADN diferentes com uma qualidade repressora da transcrição génica. Similarmente, serão expressas proteínas diferentes que interagem directa ou indirectamente com as sequências de ADN que compreendem uma qualidade moduladora da transcrição génica. Portanto, a composição da biblioteca é dependente do tipo de célula e dependente da presença das proteínas relevantes. Este é também o caso com elementos de resposta do tipo do grupo policomb. Se for expresso HP1 no tipo celular um, os elementos que dependem de HPl serão detectados pelo método da invenção. Se HPl não for expresso no tipo celular dois, o método da invenção não detectará o elemento que foi recuperado do tipo celular um.
Num aspecto da invenção a dita biblioteca compreende pelo menos um elemento capaz de contrariar, pelo menos em parte, a formação da cromatina que reprime a transcrição génica. Juntamente com o conhecimento da localização de sequências de ADN com uma qualidade repressora da transcrição génica num cromossoma ou num genoma, o conhecimento da localização destes elementos contra-actuantes permite uma previsão mais precisa da regulação de ordem superior da transcrição génica de genes (inseridos) no dito cromossoma ou genoma. Preferivelmente, a dita biblioteca compreende ainda outros elementos reguladores da transcrição tais como intensificadores e silenciadores. Embora estas sequências tenham uma influência limitada sobre a regulação génica de ordem superior, a informação sobre a localização destas outras sequências aumenta ainda mais a 12 ΕΡ 1 600 510 /PT precisão da previsão em localizações adequadas no genoma para a expressão de sequências estranhas nele introduzidas. Preferivelmente, a dita biblioteca compreende essencialmente todas as sequências de ADN que compreendem uma qualidade moduladora da transcrição génica e/ou todas as outras sequências reguladoras de um cromossoma.
Considerando que um cromossoma tipicamente já consiste em várias dezenas de milhões de bases, é preferido que a informação que a biblioteca possa dar sobre a regulação génica de ordem superior seja incorporada num sistema pelo menos parcialmente automatizado.
Um outro uso de uma biblioteca da invenção é a geração de uma previsão sobre a transcrição génica após modificação direccionada de sequências num cromossoma de modo a que sequências reguladoras de "ordem superior" sejam mutadas. Por exemplo, podem ser mutados um ou mais elementos responsivos do tipo do grupo policomb da invenção e/ou outros elementos reguladores no dito cromossoma. Espera-se que isto altere os niveis de transcrição dos genes que estão na vizinhança dos elementos responsivos do tipo do grupo policomb e/ou outros elementos moduladores da expressão.
Ainda outro uso de uma biblioteca ou um sistema da invenção consiste na previsão da expressão génica que resulta de mutações no genoma. Nos casos onde uma mutação resulta na transcrição génica alterada, a detecção de tal transcrição génica alterada pode indicar a presença da dita mutação que ocorre naturalmente. Esta abordagem é útil, por exemplo, para limitação do número de sequências ou proteínas a testar num ensaio de diagnóstico. Isto é particularmente importante em abordagens de micro-séries porque nestas abordagens o número de sequências expressas a testar é limitado pelo número de sequências que uma série pode maximamente manter. Com meios e métodos da invenção é possível limitar o número de sequências a testar em abordagens de micro-séries.
Ainda um outro uso de um sistema ou biblioteca da invenção é a identificação de alvos de fármacos. Os elementos reguladores, sejam eles elementos de "ordem superior" ou não, funcionam por causa da proteína (complexos) que podem ligar-se a eles. Um sistema da invenção pode ser usado para determinar 13 ΕΡ 1 600 510 /PT se o direccionamento de fármacos para interferir com a ligação ou a função de uma proteína (complexo) particular se mantém promissor para alteração da expressão de um gene particular. É também possivel proporcionar uma construção de ADN com uma sequência de ADN da invenção ou modificar essa sequência de ADN. Numa concretização preferida, proporciona-se uma construção de ADN que compreende um promotor operativamente ligado a um ácido nucleico de interesse. Preferivelmente, a quantidade de actividade de uma qualidade da dita sequência de ADN com uma qualidade de modulação da transcrição génica, é dependente da orientação da dita sequência de ADN na dita construção, comparativamente com o dito promotor. Preferivelmente a dita qualidade de modulação da transcrição génica é dependente da presença de um sinal. Preferivelmente, o dito sinal compreende uma proteína de ligação a ADN. Preferivelmente, o dito sinal compreende uma proteína TAT do vírus da imunodeficiência humana.
Um dos usos de uma sequência de ADN que compreende uma qualidade moduladora da transcrição génica é, evidentemente, a regulação da transcrição de um gene de interesse. A transcrição de um gene de interesse pode ser alterada por alteração de sequências na vizinhança do dito gene de modo a que seja proporcionada ou removida uma sequência de ADN com a dita qualidade. Podem ser planejadas características de expressão específicas combinando (partes de) sequências de ADN com uma qualidade de modulação da transcrição génica. Por exemplo, a duplicação de uma sequência com uma qualidade de transcrição génica estável num vector de expressão levará a uma estabilidade melhorada da expressão numa célula alvo ou progénie por introdução do dito vector na dita célula alvo. Combinando sequências de ADN com qualidades de modulação da transcrição génica, podem ser geradas qualidades de modulação da transcrição génica alteradas, em tipo ou quantidade, ou ambos.
Também é possível desenhar sequências de ADN com uma qualidade moduladora da transcrição génica desejada. As proteínas de ligação a ADN juntamente com outras proteínas e sequências de ADN, determinam as qualidades da sequência de ADN. É possível inserir uma ou mais outras sequências de ADN de ligação a proteínas numa sequência de ADN com uma 14 ΕΡ 1 600 510 /PT qualidade. Permitindo a ligação da(s) proteína(s) de ligação é possível interferir com, ou direccionar, a qualidade, permitindo assim a geração de sequências de ADN com qualidades desenhadas. Também é evidentemente possível remover locais de ligação a proteínas de uma sequência de ADN com uma modulação da transcrição génica particular, alterando desse modo a qualidade das sequências de ADN resultantes. A combinação de adição e remoção também é possível. As qualidades modulação de transcrição génica particulares podem ser seleccionada sintonizando os métodos de detecção descritos na presente invenção. É possível, por exemplo, sintetizar sequências de ADN com qualidades de modulação de transcrição génica indutível. Existem proteínas de ligação a ADN disponíveis que apenas se ligam à sua sequência alvo na ausência ou presença de um sinal. Exemplos não limitantes de tais proteínas são o repressor TET e as suas várias mutações, o repressor lac, os receptores de hormonas esteróides, o receptor de ácido retinóico e derivados. É possível, por exemplo, desenhar uma sequência de ADN com uma qualidade moduladora da transcrição génica específica do tipo de célula. A sequência de ADN pode ser tornada específica para um complexo de proteína que é expressa de uma maneira específica do tipo de célula.
As construções de expressão compreendendo uma sequência de ADN que compreende uma qualidade moduladora da transcrição génica são adequadas para se obter a expressão da dita construção em células que compreendem mais do que uma cópia da dita construção de expressão. Também quando a construção de expressão está presente no genoma da dita célula e, também quando a cassete de expressão está presente em mais do que uma cópia na dita célula. Além disso, funcionam até quando integradas na mesma posição em mais do que uma cópia.
Numa concretização preferida da invenção a dita sequência de ADN com uma qualidade moduladora da transcrição génica compreendendo uma denominada sequência STAR (Estabilização de Anti-Repressão). Uma sequência STAR como aqui usado refere-se a uma sequência de ADN que compreende uma ou mais das qualidades de modulação da transcrição génica mencionadas. São aqui diversos métodos apresentados para determinar se uma sequência compreende actividade STAR. A actividade STAR é confirmada se a sequência for capaz de realizar pelo menos uma 15 ΕΡ 1 600 510 /PT das seguintes funções: (i) pelo menos em parte, inibir o efeito da sequência que compreende um elemento de repressão da transcrição génica da invenção, (ii) pelo menos em parte, bloquear a repressão associada a cromatina, (iii) pelo menos em parte, bloquear a actividade de um intensificador, (iv) conferir num ácido nucleico operativamente ligado que codifica uma unidade de transcrição em comparação com o mesmo ácido nucleico sozinho (iv-a) uma maior previsibilidade da transcrição, (iv-b) uma transcrição mais elevada e/ou (iv-c) uma maior estabilidade da transcrição ao longo do tempo. O grande número de sequências que compreendem actividade STAR identificadas na presente invenção abre uma ampla variedade de possibilidades de gerar e identificar sequências que compreendem a mesma actividade, em tipo e não necessariamente em quantidade. Por exemplo, está bem dentro da capacidade de um perito na especialidade alterar as sequências identificadas na presente invenção e testar as sequências alteradas quanto a actividade STAR. Estas sequências alteradas fazem portanto também parte da presente invenção. A alteração pode incluir deleção, inserção e mutação de uma ou mais bases nas sequências.
As sequências que compreendem actividade STAR foram identificadas em trechos de 400 bases. Contudo, é esperado que nem todas destas 400 bases sejam necessárias para retenção da actividade STAR. Métodos para delimitar as sequências que conferem uma certa propriedade a um fragmento dentre 400 e 5000 bases são bem conhecidos. O comprimento de sequência mínimo de um fragmento que compreende actividade STAR é estimado em cerca de 50 bases. A actividade STAR é uma característica partilhada pelas sequências listadas na Figura 20.
Num outro aspecto a invenção proporciona uma sequência de ácido nucleico isolada e/ou recombinante que compreende uma sequência STAR obtenível por um método da invenção.
Como mencionado acima, uma sequência STAR pode exercer a sua actividade de uma maneira direccional, isto é, mais a um lado do fragmento que a contém do que ao outro. Além disso, a actividade STAR pode ser amplificada em quantidade 16 ΕΡ 1 600 510 /PT multiplicando o número de elementos STAR. Isto último sugere que um elemento STAR pode compreender um ou mais elementos compreendendo actividade STAR. O termo "qualidade" em relação a uma sequência refere-se a uma actividade da dita sequência. Os termos STAR, sequência STAR ou elemento STAR, como aqui usados, referem-se a uma sequência de ADN que compreende uma ou mais das qualidades moduladoras da transcrição génica mencionadas. O termo "sequência de ADN" como aqui usado, a menos que de outro modo especificado, não se refere a uma listagem de ordem especifica de bases mas antes uma porção física de ADN. Uma qualidade de transcrição com referência a uma sequência de ADN refere-se a um efeito que a dita sequência de ADN tem sobre a transcrição de um gene de interesse. "Qualidade" como aqui se usa, refere-se a propriedades ou atributos detectáveis de um ácido nucleico ou de uma proteína num sistema de transcrição.
EXEMPLOS
Exemplo 1. Métodos para isolar elementos STAR Materiais e métodos
Plasmídeos e estirpes. O vector de selecção para elementos STAR, pSelect-SV40-zeo ("pSelect", Figura 1) é construído como segue: o vector pREP4 (Invitrogen V004-50) é usado como a esqueleto plasmídico. Proporciona a origem de replicação oriP de Epstein-Barr e o antigénio nuclear EBNA-1 para replicação epissómica de elevado número de cópias em linhas celulares de primata; o gene de resistência à higromicina com o promotor da timidina-quinase e o local de poliadenilação, para selecção em células de mamífero; e o gene de resistência à ampicilina e a origem de replicação colEl para a manutenção em Escherichia coli. O vector contém quatro locais operadores LexA consecutivos entre os locais de restrição Xbal e NheI (Bunker e Kingston, 1994) . Embutido entre os operadores LexA e o local NheI está um poliligante que consiste nos seguintes locais de restrição: ífíndlll-Ascl-Bamtil-Ascl-Hindlll. Entre o local Nhel e um local Sall está o gene de resistência à zeocina com o promotor de SV40 e o local de poliadenilação, derivados de pSV40/Zeo (Invitrogen V502-20); este é o marcador seleccionável para a triagem 17 ΕΡ 1 600 510 /PT de star. O vector pSDH (Figura 2) é construído como segue: O gene repórter de luciferase de pGL3-Control (Promega E1741) é amplificado por PCR e inserido no pUHDlO-3 digerido com Sacll/BamHI (Gossen e Bujard, 1992). Isto coloca o luciferase sob o controlo do promotor Tet-Off e a montante do sinal de poliadenilação de SV40. Locais de clonagem múltiplos são introduzidos por PCR, a montante do promotor Tet-Off (MCSI, Xhol-NotI-EcoRI-SalI) e a jusante do sinal de poliadenilação (MCSH, WãeI-BglII-£coRV-iíindIII) . As bibliotecas de genes são construídas por digestão com Sau3AI de ADN genómico humano, purificado a partir de placenta (Clontech 6550-1) ou transportado em cromossomas artificiais bacterianos/Pl (BAC/PAC). Os clones BAC/PAC contêm ADN genómico da região citogenética lql2 (clones RP1154H19 e RP3328E19) ou do cacho HOX de genes homeóticos (clones RP1167F23, RP1170019 e RP11387A1). Os ADN são fraccionados por tamanhos e a fracção de tamanhos 0,5 a 2 kb é ligada no vector pSelect digerido com BamRI, por técnicas padrão (Sambrook et al., 1989).
Foi descrita a construção das estirpes hospedeiras (van der Vlag et al., 2000). Em resumo, são baseadas na linha celular de osteossarcoma humano U-2 OS (American Type Culture Colection HTB-96). A U-2 OS é estavelmente transfectada com o plasmídeo pTet-Off (Clontech K1620-A), que codifica uma quimera proteica que consiste no domínio de ligação a ADN do repressor Tet e no domínio de transactivação de VP16. A linha celular é subsequentemente transfectada de modo estável com os genes da proteína de fusão contendo o domínio de ligação a ADN de LexA e as regiões codificadoras de HP1 ou HPC2 (duas proteínas do grupo Policomb de Drosófila que reprimem a expressão génica quando amarrado ao ADN). Os genes repressores LexA estão sob o controlo do sistema regulador da transcrição Tet-Off (Gossen e Bujard, 1992).
Triagem de bibliotecas e caracterização de elementos STAR. As bibliotecas de genes no pSelect são transfectadas na linha celular U-2 OS/Tet-Off/repressor LexA, por precipitação com fosfato de cálcio (Graham e van der Eb, 1973; Wigler et al., 1978) como recomendado pelo fornecedor do regente de transfecção (Life Technologies). As Células transfectadas são cultivadas sob selecção com higromicina (25 μg/ml) e repressão 18 ΕΡ 1 600 510 /PT com tetraciclina (doxiciclina, 10 ng/ml) durante 1 semana (50% de confluência). Depois a concentração de doxiciclina é reduzida para 0,1 ng/ml para induzir os genes repressores LexA e depois de 2 dias é adicionada zeocina a 250 μρ/ιηΐ. As células são cultivadas durante um adicional de 4 a 5 semanas, até que as culturas de controlo (transfectadas com pSelect vazio) sejam mortas pela zeocina.
As colónias resistentes à zeocina da transfecção da biblioteca são propagadas e o ADN plasmidico é isolado e resgatado em E. coli por técnicas padrão (Sambrook et al., 1989) . Os elementos STAR candidatos no ADN resgatado são analisados por mapeamento de endonucleases de restrição (Sambrook et al., 1989), análise da sequência de ADN (Sanger et al., 1977) e quanto a actividade STAR (resistência à zeocina) depois de nova transfecção para U-2 OS/Tet-Off/repressor LexA e diminuição da concentração de doxiciclina.
Os elementos STAR candidatos que têm uma sequência de ADN que corresponde à sequência conhecida no genoma humano são identificados por pesquisas blast (Altschul et al., 1990) da base de dados do genoma humano (http://www.ncbi.nlm.nih.gov/genoma/seq/HsBlast.html 20 de Junho de 2001). As localizações cromossómicas dos elementos são registradas, juntamente com a proporção de ADN repetitivo e a identidade de genes adjacentes.
Os candidatos que apresentam actividade STAR após a nova transfecção são caracterizados adicionalmente por subclonagem do fragmento STAR no plasmídeo pSDH e integração estável no ADN cromossómico de U-2 OS. Os plasmídeos pSDH são co-transfectados em células U-2 OS com pBABE-puro (Morgenstern e Land, 1990) e seleccionados quanto a resistência à puromicina. Por elemento STAR, são isoladas e cultivadas populações de aproximadamente 30 clones individuais. Os clones são periodicamente ensaiados quanto a actividade de luciferase de acordo com as instruções do fabricante (Roche 1669893) .
Resultados
Caracterização funcional de elementos STAR. As triagens de ADN genómico humano e dos locl HOX e lql2 produziram 19
ΕΡ 1 600 510 /PT 17 elementos STAR bona fide. Os critérios são de que (1) os elementos apresentaram actividade STAR após nova transfecção dos clones à base de pSelect na linha celular hospedeira de osteossarcoma humano U-2 OS (indicando que a actividade anti-repressora expressa na triagem inicial é especifica do plasmideo e não devida a alterações artefactuais nas células hospedeiras); (2) os elementos contêm a sequência de ADN que corresponde à sequência na base de dados de sequências do genoma humano (indicando que o clone não contém sequência de ADN contaminante, e.g. de fontes bacterianas ou de vectores).
Os elementos STAR são subclonados no plasmideo pSDH e integrados no genoma da célula hospedeira. A expressão dos genes repórteres é ensaiada em populações de transfectantes estáveis para demonstrar a capacidade dos elementos STAR para proteger genes repórteres do silenciamento depois da integração aleatória no genoma. Isto proporciona informação sobre (1) a proporção de clones que apresentam elevada expressão e (2) o grau de super-expressão eliciada pelos elementos STAR. A expressão do gene repórter de luciferase por um clone é considerada significativa se estiver duas vezes acima do nível médio para os plasmídeos que não contêm elementos STAR (o nível de referência). Para todos os plasmídeos, é observada uma distribuição no nível de expressão entre os clones: desde nenhuma expressão até expressão significativamente acima do nível de referência, e de poucos super-expressores até muitos super-expressores. A actividade STAR superior é manifestada pelos plasmídeos que resultam em muitos clones super-expressores, incluindo alguns clones altamente super-expressores.
Os resultados de uma experiência representativa estão mostrados na Tabela 1 e nas Figuras 3-5:
Os resultados indicam que os elementos STAR humanos que são testados produzem uma proporção muito mais elevada de clones super-expressores do que o gene repórter não protegido ou o gene repórter protegido pelo elemento SCS de Drosófila (Kellum e Schedl, 1992). Além disso, o grau de super-expressão por estes plasmídeos é muito maior a partir do gene repórter protegido por STAR do que do repórter não protegido ou 20 ΕΡ 1 600 510 /PT protegido por SCS.
Dados sobre a sequência e posição qenómica dos elementos ST AR. A Tabela 2 lista as localizações cromossómicas de cada um dos 17 elementos STAR, assim como a identidade de genes vizinhos e o teor de ADN repetitivo dos elementos. Os elementos STAR estão distribuídos em vários cromossomas. São diversos na sua sequência de ADN real e no teor de ADN repetitivo e apresentam vários graus de associação com genes vizinhos.
Exemplo 2. Características de expressão do transgene que são devidas a STAR.
Fundamentos: é usada recombinação específica do local para remover com precisão os ADN heterólogos das suas localizações cromossómicas. isto é rotineiramente realizado por um de dois sistemas: os alvos de recombinase cre e loxP do bacteriófago Pl (Feng et ai., 1999) ou a recombinase FLP e FRT (alvo de recombinase FLP) de levedura (Wigley et ai., 1994). Nestes sistemas, uma região de ADN (usualmente contendo um gene repórter e/ou um marcador seleccionável) é flanqueada no cromossoma pelos alvos loxP ou FRT. A actividade da recombinase depois catalisa a excisão precisa da região de ADN do cromossoma. A recombinase resolve as suas duas sequências de reconhecimento num único local, eliminando a sequência entre elas. Assim, uma extensão de ADN deve ser flanqueada pelos locais alvo a eliminar subsequentemente in vivo após introdução ou activação da recombinase (Schwenk et ai., 1995; Dymecki, 1996). As recombinases Cre e Flp catalisam a recombinação entre duas repetições invertidas de 13 pares de bases, separadas por um espaçador com um mínimo de 6 (loxP) ou 8 (FRI) pares de bases (Senecoff et al., 1985). A sequência de loxP é ATAACTTCGTATA e a sequência de FRT é GAAGTTCCTATAC.
Protocolo: Usando clonagem de ADN convencional (Sambrook et al., 1989), é construído um gene repórter (que codifica uma proteína repórter, por exemplo a proteína verde fluorescente (GFP) (Bierhuizen et al., 1997) ou luciferase (Himes e Shannon, 2000) que é flanqueado num plasmídeo por um par de elementos STAR. Em cada caso, os elementos são eles próprios flanqueados pelos locais alvo de recombinase. Um elemento é flanqueado por um par de locais loxP e o outro é flanqueado 21 ΕΡ 1 600 510 /PT por um par de locais FRT (Figura 1) . Após transfecção o plasmídeo integra-se no cromossoma hospedeiro numa percentagem pequena de células e os integrantes são seleccionados pela resistência ao antibiótico.
Usando técnicas convencionais, ("SuperFect Transfection Reagent Handbook," Qiagen, Novembro, 1997) estes plasmideos são transfectados na linha celular de osteossarcoma humano U-2 OS e seleccionados quanto a resistência à higromicina. Os isolados resistentes à higromicina têm o plasmídeo estavelmente integrado no genoma da linha celular. Os isolados individuais são propagados em meio de cultura celular e a expressão do gene repórter transgénico é ensaiada, por exemplo pela citometria de fluxo (Stull et al., 2000).
Depois, usando técnicas convencionais (transfecção ou estímulo com hormonas), os isolados estáveis anteriores são tratados de modo a introduzir ou activar a actividade de recombinase. Isto é feito sequencialmente, de modo a que, por exemplo, a actividade de recombinase cre catalise a excisão de STAR1 e subsequentemente a actividade de recombinase FLP catalise a excisão de STAR2. O nível de expressão do gene repórter nestas células é ensaiado e o valor é comparado com o valor de referência do isolado progenitor, contendo STAR.
Exemplo 3. Análise da sequência de STAR; determinação da sequência essencial mínima para a função do elemento; conservação de sequências entre elementos; e propriedades de elementos em tandem e múltiplos
Fundamentos: Fragmentos de ADN contendo elementos STAR são isolados por selecção genética usando o plasmídeo pSelect (Figura 1). Esta secção descreve a abordagem para caracterizar as sequências de ADN dentro dos fragmentos que têm actividade STAR.
Protocolos:
Sequência de ADN: Os oligonucleótidos são desenhados com base na sequência do plasmídeo pSelect para a sequenciação dos fragmentos de ADN. Os fragmentos são sequenciados usando a técnica de terminação de cadeias com didesoxi (Sanger et al., 1977). As sequências de ADN são depois localizadas na posição 22 ΕΡ 1 600 510 /PT cromossómica usando a base de dados publica da sequência do genoma humano (http://www.ncbi.nlm.nih.gov:80/cgi-bin/Entrez/hum_ srch?chr=hum_chr.inf&query). Os genes e a densidade génica na vizinhança da sequência do fragmento são registrados a partir da anotação da sequência do genoma. A actividade de transcrição destes genes é determinada a partir de bases de dados públicas de micro-séries de ADN (http://arrays.rockefeller.edu/xenopus/linki3.html) e dados da SAGE ("Serial Analysis of Gene Expression"; http://bioinfo.amc.uva.nl/HTM-bin/index.cgi). Uma vez compilada a informação posicionai sobre as sequências STAR, os dados são analisados em termos de sequências de consenso subjacentes. As sequências de consenso ou tendências (entendido como as áreas locais ricas em combinações de nucleótidos particulares, por exemplo ricas em bases C e G) são detectadas usando os algoritmos de pesquisa de similaridade tais como clustalw (Higgins et al., 1996) e pontuação de similaridade blosum (Altschul e Gish, 1996) . Quaisquer consensos ou tendências subjacentes encontrados são depois usados para identificar outros STAR potenciais numa escala genómica realizando pesquisas BLAST (Altschul et al., 1990). Investigação prévia identificou proteínas reguladoras da transcrição que se ligam a elementos isoladores e limítrofes conhecidos (Gaszner et al., 1999; Gerasimova e Corces, 1998). Nos exemplos descritos, os locais de ligação a proteínas coincidem com locais hiper-sensíveis a ADNase I que são essenciais para a função isoladora ou limítrofe. A hipótese de que os elementos STAR também estão ligados por proteínas reguladoras conhecidas é examinada pesquisando a base de dados TRANSFAC de factores de transcrição (http://transfac.gbf.de/TRANSFAC/) quanto a motivos de sequência que ocorrem nos elementos STAR. Os motivos de sequência que são comuns entre os membros das colecções STAR são indicadores de que o factor de transcrição correspondente se liga àquele elemento.
Sequência essencial mínima: Usando este conhecimento da sequência, os elementos STAR são truncados e testados quanto à funcionalidade. Isto é feito usando a reacção em cadeia com polimerase (PCR) para clonar sub-fragmentos dos fragmentos contendo STAR no pSelect, por técnicas padrão (Sambrook et al., 1989). Os plasmídeos contendo os sub-fragmentos são transfectados em células U-2 OS e testados quanto à 23 ΕΡ 1 600 510 /PT funcionalidade ensaiando a resistência a antibiótico.
Direccionalidade: Os elementos STAR são testados quanto à sua direccionalidade usando o plasmideo pSelect. Por exemplo, a direcção dos elementos STAR isolados pela triagem com pSelect é aludida como orientação 5'3'. A orientação do elemento é invertida pelas técnicas de ADN recombinante convencionais (Sambrook et al., 1989). Os plasmideos resultantes são transfectados na linha celular u-2 OS e a expressão do gene repórter é ensaiada (Bierhuizen et al., 1997; Himes e Shannon, 2000). O nivel de expressão a partir do plasmideo com o elemento em orientação inversa é comparado com o da orientação 5'3'. Se o plasmideo de orientação inversa tem niveis de expressão similares, então o elemento STAR não demonstra direccionalidade.
Combinações e múltiplos de elementos: Para determinar se os elementos STAR são capazes de funcionar em pares mistos, elementos diferentes são combinados e testados. A análise é realizada no plasmideo pSDH inserindo um elemento STAR em MCSI e um STAR diferente em MCSII pelas técnicas de ADN recombinante (Sambrook et ai., 1989). Os plasmideos resultantes são transfectados e a expressão do gene repórter é ensaiada (Bierhuizen et al., 1997; Himes e Shannon, 2000); os resultados são comparados com a expressão de plasmideos contendo o mesmo elemento em MCSI e MCSII; se a expressão é similar para os dois tipos de plasmideos, então é concluído que elementos STAR diferentes não interferem entre si. A força de elementos STAR únicos é comparada com repetições em tandem de elementos. Isto é feito por concatamerização dos elementos STAR de interesse com ADN-ligase e inserção do produto da ligação no plasmideo pSDH pelas técnicas de ADN recombinante (Sambrook et al., 1989). Os plasmideos resultantes são transfectados em células U-2 OS e a expressão do gene repórter é ensaiada (Bierhuizen et al., 1997; Himes e Shannon, 2000); os resultados são comparados com a expressão a partir de plasmideos contendo elementos STAR únicos.
Exemplo 4. Determinação da distância em que um STAR funciona.
Fundamentos: utilizam-se elementos STAR para optimizar a expressão de transgenes únicos e múltiplos. Para determinar se um único par de elementos STAR pode proteger transgenes 24 ΕΡ 1 600 510 /PT grandes ou múltiplos do silenciamento é necessário determinar a gama em que os elementos STAR atuam.
Protocolo: os elementos STAR são testados quanto à sua funcionalidade em relação à distância usando plasmideos derivados com base no pSelect, como segue. Uma biblioteca de fragmentos de ADN aleatórios de 500 pb a 10 kb é montada pelas técnicas de clonagem de ADN padrão (Sambrook et al.r 1989). Seleccionam-se desta biblioteca fragmentos que não possuem actividade STAR, testando nos plasmideos pSelect como descrito acima. Para os elementos STAR, estes fragmentos são inseridos entre o local de clonagem e o promotor do gene repórter no plasmideo pSelect apropriado (Figura 1) . Este conjunto de plasmideos é transfectado na linha celular u-2 OS e a expressão é medida como descrito acima. A força da expressão do gene repórter está correlacionada com o comprimento do fragmento de ADN aleatório que separa o elemento STAR do promotor.
Exemplo 5. Determinação do comprimento máximo de elementos STAR
Fundamentos: Os elementos STAR são clonados como fragmentos de ADN recuperados usando o plasmideo pSelect, que é feito com fragmentos de ADN genómico de menos do que 2 kb. Contudo, estes poderiam ser porções de um elemento STAR mais prolongado. A actividade STAR prolongada é examinada pelas seguintes experiências.
Protocolo: Os elementos STAR clonados no pSelect são mapeados na sequência do genoma humano. De modo a determinar se são porções de um elemento STAR mais prolongado, as regiões de 4 kb que abrangem os clones são amplificadas por PCR e clonadas no plasmideo pSelect e/ou pSDH por técnicas de ADN recombinante padrão (Sambrook et al., 1989). Os plasmideos resultantes são transfectados em células U-2 OS e ensaiados quanto a expressão de gene repórter como descrito acima; os plasmideos contendo o elemento STAR de 2 kb original são incluídos como controlo. Três resultados possíveis podem ser esperados: (1) expressão similar pelo controlo e isolados STAR prolongados, demonstrando que o elemento STAR está confinado ao fragmento de 2 kb original; (2) expressão mais baixa pelos isolados STAR prolongados, sugerindo que o elemento STAR está 25 ΕΡ 1 600 510 /PT contido dentro do fragmento de 2 kb e não atua eficazmente a uma distância ou que o fragmento prolongado contém um elemento com uma qualidade repressora da transcrição génica; (3) expressão mais elevada pelos isolados STAR prolongados, sugerindo que a região prolongada contém um elemento STAR mais completo. No caso do resultado (3), o exercício é reiterado com um fragmento de PCR maior, de 6 kb.
Um elemento STAR também pode ser um compósito de locais aos quais várias proteínas se ligam. Portanto, fragmentos de ADN grandes com actividade STAR podem ser divisíveis em fragmentos menores com actividade STAR (ver o exemplo 3) . Os elementos que são maiores do que 2 kb são reconhecidos como elementos STAR se ainda apresentarem actividade STAR depois de truncagem para menos do que 2 kb (incluindo por deleção interna).
Exemplo 6. Estados de metilação e acetilação de histona de elementos STAR e dos transgenes adjacentes.
Fundamentos: As propriedades reguladoras de elementos STAR estão associadas com a estrutura da cromatina local, que é determinada pelo próprio ADN e por proteínas associadas ao ADN. Alterações na estrutura da cromatina que estão associadas com alterações na expressão génica são frequentemente produzidas por modificações secundárias das macromoléculas, especialmente metilação de ADN ou acetilação de proteínas de histona. A identificação das modificações secundárias que ocorrem nos elementos STAR e nos transgenes adjacentes proporciona cunhos distintivos para estes elementos.
Protocolo:
Metilação de ADN: Elementos STAR são clonados no plasmídeo pSelect pelas técnicas padrão (Sambrook et al., 1989). Células U-2 OS são transfectadas de modo estável com estes plasmídeos e com pSelect sem elemento STAR como controlo para determinar a metilação de ADN basal no gene repórter. As células são colhidas e a cromatina é purificada por procedimentos padrão (Thomas, 1998) . O ADN é digerido com as endonucleases de restrição Hpall e MspI em reacções separadas (Sambrook et al., 1989). Ambas destas enzimas de restrição são capazes de cortar a sequência CCGG não metilada. Quando a C 26 ΕΡ 1 600 510 /PT externa está metilada, nem a Mspl nem a Hpa II conseguem clivar. Contudo, ao contrário da Hpall, a Mspl pode clivar a sequência quando a C interna está metilada. O ADN é submetido a Southern blotting e a transferência é analisada pela marcação indirecta de extremidades (Pazin e Kadonaga, 1998) . Como controlo, o plasmideo pSelect correspondente, na forma de ADN nu, não metilado, também é cortado com as enzimas descritas e submetido a Southern blotting. A comparação dos diferentes tamanhos dos fragmentos de ADN revela se o ADN é metilado in vivo ou não.
Acetilação de histona: As mesmas linhas celulares transfectadas usadas para a análise da metilação de ADN são usadas para estas experiências. O método descrito abaixo produz um mapa de alta resolução do padrão de acetilação de histona nos elementos STAR e no gene repórter (Litt et al., 2001). Digeridos por nuclease microcócica de núcleos são fraccionados em gradientes de sacarose e os monómeros e os dimeros de nucleossomas purificados são enriquecidos em histonas acetiladas pela imunoprecipitação com anticorpos anti-acetil-histona. A fracção de nucleossomas e imunoprecipitados são submetidos a análise, por exemplo por PCR em tempo real (Jung et al., 2000) usando iniciadores e uma sonda Taqman que hibridam com o gene repórter ou com o elemento STAR para produzir produtos de 0,2 kb, com uma janela de movimento de 0,1 kb. A taxa de aumento do sinal fluorescente da sonda Taqman durante a PCR (que é proporcional à abundância do ADN molde na amostra) é depois medida. A relação entre a abundância do ADN molde na fracção de nucleossoma e os imunoprecipitados proporciona um mapa fino do padrão de acetilação de histonas para cada 0,1 kb no gene repórter e no elemento STAR (ou no gene repórter na ausência de um elemento).
Exemplo 7. Posicionamento de nucleossomas in vivo e locais hiper-sensíveis a ADNase I
Fundamentos: A cromatina é constituída por ADN, histonas e proteínas que não de histona. As histonas formam uma partícula de núcleo que é envolvida por -150 pb de ADN para compor um nucleossoma. Os nucleossomas são separados por 50-75 pb de ADN ligante. Os nucleossomas estavelmente posicionados no ADN cromossómico reprimem a expressão génica e 27 ΕΡ 1 600 510 /PT os factores que excluem os nucleossomas ou de outro modo remodelam a cromatina podem ultrapassar esta repressão. O posicionamento de nucleossomas numa região cromossómica é analisada pelo ensaio com nuclease microcócica (MNase); a MNase corta a cromatina preferencialmente no ADN ligante. Similarmente, algumas áreas de ADN são constitutivamente expostas a proteínas que não de histona e estas são frequentemente regiões reguladoras, isto é, locais onde se ligam factores reguladores que atuam em eis. Experimentalmente, estes locais são hiper-sensíveis à digestão pela enzima ADNase I.
Protocolo: Para determinar a posição de nucleossomas no gene repórter e nos elementos STAR, é usada MNase (Saluz e Jost, 1993). Os núcleos são purificados a partir de células U-2 OS cultivadas e digeridos com MNase como descrito acima (acetilação de histona). Para a procura de locais hiper-sensíveis à ADNase I nos elementos STAR ou no gene repórter, os núcleos purificados são tratados com ADNase I numa concentração apropriada (e.g. 100 μρ/ιηΐ de ADN genómico e 20 a 100 U/ml de ADNasel), como descrito (Wallrath et al., 1998). O ADN nu é digerido com ADNase I como controlo. Para ambas as técnicas, o gene repórter e os elementos STAR são mapeados finamente usando extensão de iniciadores ou marcação indirecta de extremidades e Southern blotting, como descrito (Tanaka et al., 1996; van der Vlag et al., 2000). O ensaio com MNase revela uma escada de bandas discretas num autorradiograma que correspondem às posições de nucleossomas nos elementos STAR ou no gene repórter. Os locais hiper-sensíveis à ADNase I manifestam-se como bandas discretas no autorradiograma resultante que estão ausentes ou são menos proeminentes no controlo de ADN nu.
Exemplo 8. Dependência relativamente ao tipo de célula, ao tecido e dependência relativamente ao promotor, de elementos STAR.
Fundamentos: Foi relatado que alguns elementos isoladores ou limítrofes podem apresentar especificidade relativamente ao tecido (Takada et al., 2000). Os elementos STAR têm muitas características em comum com elementos isoladores e limítrofes. Os elementos STAR, tanto promíscuos como específicos de tecidos, têm valor biotecnológico em aplicações 28 ΕΡ 1 600 510 /PT transgénicas. O ensaio que se descreve abaixo é realizado para avaliar a dependência relativamente ao tipo de célula. A especificidade relativamente à célula e ao tecido dos elementos é adicionalmente examinada examinando a expressão de genes na vizinhança dos elementos no genoma humano, usando bases de dados públicas de micro-séries de ADN (http://arrays.rockefeller.edu/xenopus6inks.html) e dados da SAGE (Serial Analysis of Gene Expression; http: //bioinfo.ame.uva.nl/HTM-bin/index.egi).
Protocolo: Os elementos STAR são testados no plasmideo pSDH. Três linhas celulares são transfectadas usando protocolos padrão: a linha celular U-2 0S de osteossarcoma humano (Heldin et al., 1986), a linha celular Vero de rim do macaco verde africano (Simizu et al., 1967) e a linha celular CHO de ovário de hamster chinês (Kao e Puck, 1968). Os elementos capazes de funcionar em todos os três tipos de célula são categorizados como promíscuos. Aqueles que apenas apresentam actividade numa ou duas das linhas celulares são categorizadas como restritas na sua funcionalidade ao tipo de célula.
Especificidade do promotor: Os elementos STAR são correntemente seleccionados e testados no contexto da função com dois promotores, o promotor de citomegalovírus (CMV) inteiro ou o Elemento de Resposta à Tetraciclina e o promotor de CMV mínimo (em combinação com o activador da transcrição tTA). Para avaliar a especificidade do promotor, a função STAR é testada com outros promotores virais habitualmente usados, a saber os promotores precoce e tardio do vírus símio tipo 40 (SV40), os promotores EIA adenoviral e tardio principal, e a repetição terminal longa do vírus do sarcoma de Rous (RSV) (Doll et al., 1996; Smith et al., 2000; Weaver e Kadan, 2000; Xu et al., 1995). Cada um destes promotores são clonados separadamente no plasmideo pSelect por técnicas padrão (Sambrook et al., 1989) juntamente com elementos STAR. Os plasmídeos resultantes são transfectados na linha celular U-2 OS e ensaiados quanto a expressão de gene repórter, como descrito acima. A capacidade dos elementos STAR para proteger contra o silenciamento, é determinada por comparação com os plasmídeos que não possuem os elementos STAR. 29
ΕΡ 1 600 510 /PT
Exemplo 9. Métodos para melhoria dos elementos STAR
Fundamentos: São desenvolvidos elementos STAR melhorados. As melhorias produzem força aumentada de actividade anti-repressora e elementos com actividade indutivel e especifica do tecido. Estas melhorias são feitas através de uma combinação de técnicas.
Protocolos
Evolução forçada: utiliza-se PCR propensa a erros (Cherry et al., 1999; Henke e Bornscheuer, 1999) para introduzir uma média de uma a duas mutações pontuais por elemento. Os elementos mutados são triados usando plasmideos pSelect contendo proteínas de fusão marcadoras seleccionáveis por repórteres, por exemplo, classificação de células activada por fluorescência e resistência a antibiótico (Bennett et al., 1998). Realizam-se subsequentes ciclos de PCR propensa a erros e selecção para derivar elementos com outras melhorias na actividade.
Combinações em tandem e heterólogas: Como descrito acima, as combinações em tandem e heterólogas de elementos são testadas quanto à actividade em comparação com os elementos individuais (exemplo 3). A dominância relativa de elementos STAR é testada numa base de caso por caso. É usada para testar a força de um elemento; por exemplo, se um novo elemento STAR é dominante para um elemento com uma qualidade repressora da transcrição génica forte, conhecido, então o STAR é classificado como muito forte. A possibilidade de a relação de dominância entre um STAR e um com uma qualidade repressora da transcrição génica ser específica do tipo de célula, do tecido ou do promotor, também é considerada (exemplo 8). O teste de dominância utiliza o plasmídeo pSelect, com um elemento com uma qualidade repressora da transcrição génica individual colocado a montante de elementos STAR individuais, por técnicas de ADN recombinante padrão (Sambrook et al., 1989). Os plasmideos são transfectados em células U-2 OS e a expressão do gene repórter é ensaiada. A dominância STAR é manifestada por expressão mais elevada do que a do plasmídeo com apenas um elemento com uma qualidade repressora da 30 ΕΡ 1 600 510 /PT transcrição génica.
Introdução de locais de ligação para outras proteínas de ligação a adn nos elementos STAR para adicionar novas características (e.g. indutibilidade, especificidade do tecido)
Fundamentos: Elementos STAR reguláveis são criados combinando-os com locais de ligação para proteínas de ligação a ADN dependentes de sinal. Num exemplo isto pode envolver a justaposição de um STAR e um elemento de resposta a glucocorticóides (GRE). Na ausência de estímulo de glucocorticóides o elemento STAR funcionará como descrito. Por estímulo, o receptor de glucocorticóide que ocorre naturalmente liga-se ao GRE e interfere com a função STAR.
Protocolo: Usando a clonagem de ADN convencional (Sambrook et al., 1989), um GRE é introduzido no vector pSelect adjacente aos elementos STAR. O plasmídeo é transfectado em células U-2 OS como descrito acima. As células são divididas em duas culturas; uma é tratada com glucocorticóide (10 μΜ). A expressão do gene repórter é medida e comparada entre as duas culturas. As diferenças na expressão demonstram a capacidade para regular a função STAR por acção de uma proteína de ligação a ADN dependente de sinal.
Elementos STAR promíscuos: Testar ou realçar estas características envolve a cultura em diferentes linhas celulares e cultura de longa duração sem selecção com antibiótico (exemplos 8 e 10).
Exemplo 10. Os elementos STAR obviam a necessidade de selecção contínua para a manutenção do transgene.
Fundamentos: Na transgénese, a dependência de marcadores de selecção tem duas desvantagens: o agente de selecção é usualmente caro e acarreta um custo metabólico para as células e existem objecções reguladoras e éticas à inclusão de marcadores seleccionáveis em aplicações transgénicas, especialmente se o próprio transgene está no produto (e.g. plantas de safra, vectores de terapia génica). Os elementos STAR reduzem ou eliminam a necessidade de manter a selecção depois de estabelecer o isolado transgénico. Consequentemente, 31 ΕΡ 1 600 510 /PT ο gene de resistência pode ser removido do genoma transgénico por recombinação especifica do local com perda diminuída da expressão de transgene.
Protocolo: Linhas celulares U-2 OS estavelmente transfectadas, contendo elementos STAR cromossomicamente integrados que flanqueiam genes repórteres são produzidas por co-transfecção do plasmídeo pSDH com um plasmídeo de resistência a antibiótico que actua em trans como descrito acima. A experiência envolve testar a estabilidade do nível de expressão de gene repórter nestas linhas celulares durante o cultivo prolongado (3 a 6 meses) na ausência de selecção. Isto é testado com elementos STAR que flanqueiam os genes repórteres de luciferase ou GFP em plasmídeos pSDH. O gene de resistência a antibiótico é removido construindo um plasmídeo de expressão (à base do pSDH) no qual o marcador de selecção por antibiótico é flanqueado pelos locais alvo de recombinase. 0 marcador seleccionável é subsequentemente excisado pela actividade de recombinase, como descrito acima (exemplo 2).
Exemplo 11 A previsibilidade e o rendimento são melhorados pela aplicação de elementos STAR em sistemas de expressão
Ao elementos STAR funcionam para bloquear o efeito de influências de repressão da transcrição sobre unidades de expressão de transgene. Estas influências de repressão podem ser devidas a heterocromatina ("efeitos de posição", (Boivin & Dura, 1998)) ou às cópias adjacentes do transgene ("silenciamento de genes induzido por repetições", (Garrick et al., 1998)). Dois dos benefícios dos elementos STAR para a produção de proteína heteróloga são a previsibilidade aumentada de encontrar célula hospedeiras recombinantes primárias de alta expressão e rendimento aumentado durante os ciclos de produção. Estes benefícios são ilustrados neste exemplo.
Materiais e Métodos
Construção dos vectores pSDH e derivados contendo STAR: O vector pSDH-Tet foi construído por amplificação por reacção de cadeia com polimerase (PCR) do quadro de leitura aberto da 32 ΕΡ 1 600 510 /PT luciferase do plasmídeo pREP4-HSF-Luc (van der Vlag et al., 2000) usando os iniciadores C67 e C68 (todos os iniciadores de PCR e oligonucleótidos mutagénicos estão listados na Tabela 5) e a inserção do fragmento Sacll/BamHl no pUHDlO-3 digerido com SacII/BamHI (Gossen & Bujard, 1992) . A unidade de expressão de luciferase foi re-amplifiçada com os iniciadores C65 e C66 e re-inserida no pUHDlO-3 de modo a flanqueá-la com dois locais de clonagem múltipla (MCSI e MCSII). Um local Asei foi depois introduzido em MCSI por digestão com EcoRi e inserção de um ligante (constituído pelos oligonucleótidos D93 e D94 hibridados). O promotor CMV foi amplificado a partir do plasmídeo pCMV-Bsd (Invitrogen K510-01) com os iniciadores D90 e D91 e usado para substituir o promotor Tet-Off em pSDH-Tet por digestão com Sall/Sacll e ligação para criar o vector pSDH-CMV. 0 quadro de leitura aberta da luciferase neste vector foi substituído por SEAP (Fosfatase Alcalina Segregada) como segue: o vector pSDH-CMY foi digerido com Sacll e Bamttl e tornado de extremidades lisas; o quadro de leitura aberto de SEAP foi isolado de pSEAP-basic (Clontech 6037-1) por digestão com EcoRI/SalI, tornado de extremidades lisas e ligado ao pSDH-CMV para criar o vector pSDH-CS. O gene de resistência à puromicina sob o controlo do promotor SV40 foi isolado do plasmídeo pBabe-Puro (Morgenstern & Land, 1990) por PCR, usando os iniciadores C81 e C82. Este foi ligado ao vector pGL3-control (removido o local BamRI) (Promega E1741) digerido com Ncol/Xbal, para criar pGL3-puro. O pGL3-puro foi digerido com Bglli/Sall para isolar o gene de resistência a SV40-puro, que foi tornado de extremidades lisas e ligado ao pSDH-CS digerido com NheI, com extremidades lisas. O vector resultante, pSDH-CSP, é mostrado na FIG. 6. Todas as etapas de clonagem foram realizadas seguindo as instruções fornecidas pelos fabricantes dos reagentes, de acordo com métodos conhecidos na especialidade (Sambrook et al., 1989).
Os elementos STAR foram inseridos em MCSI e MCSII em duas etapas, por digestão do elemento STAR e do vector pSDH-CSP com uma enzima de restrição apropriada, seguida por ligação. A orientação dos elementos STAR em vectores pSDH recombinantes foi determinada por mapeamento de restrição. A identidade e a orientação das inserções foram verificadas por análise da sequência de ADN. A sequenciação foi realizada pelo método do didesoxi (Sanger et al., 1977) usando um sequenciador de ADN automático Beckman CEQ2000, de acordo com as instruções do 33 ΕΡ 1 600 510 /PT fabricante. Em resumo, o ADN foi purificado a partir de E. coli usando os Kits QIAprep Spin Miniprep e Plasmid Midi (QIAGEN 27106 e 12145, respectivamente). A sequenciação por ciclos foi realizada usando os oligonucleótidos C85, E25 e E42 (Tabela 5) feitos de encomenda, na presença de terminadores corantes (Dye Terminator Cycle Sequencing Kit CEQ Dye Terminator, Beckman 608000) .
Transfecção e cultura de células CHO com plasmídeos pSDH: A linha celular de ovário de hamster chinês CHO-Kl (ATCC CCL-61) foi cultivada em meio HAMS-F12 + 10% de Soro de Bezerro Fetal contendo glutamina 2 mM, 100 U/ml de penicilina e 100 microgramas/ml de estreptomicina, a 37°C/5% de C02. As células foram transfectadas com o vector pSDH-CSP e seus derivados contendo STAR6 ou STAR49 em MCSI e MCSII, usando SuperFect (QIAGEN) como descrito pelo fabricante. Em resumo, as células foram semeadas em vasos de cultura e crescidas durante a noite até 70-90% de confluência. O reagente SuperFect foi combinado com ADN plasmidico (linearizado neste exemplo por digestão com Pvul) a uma razão de 6 microlitros por micrograma (e.g. para uma placa de Petri de 10 cm, 20 microgramas de ADN e 120 microlitros de SuperFect) e foi adicionado às células. Depois de incubação durante a noite, a mistura de transfecção foi substituída por meio fresco e as células transfectadas foram adicionalmente incubadas. Depois da cultura durante a noite, adicionaram-se 5 microgramas/ml de puromicina. A selecção com puromicina foi completada em 2 semanas, tempo depois do qual se isolaram clones CHO/pSDH-CSP resistentes à puromicina individuais aleatoriamente e se cultivaram adicionalmente.
Ensaio da Fosfatase Alcalina Segregada (SEAP): A actividade de SEAP (Berger et al., 1988, Henthorn et al., 1988, Kain, 1997, Yang et al., 1997) no meio de cultura de clones CHO/pSDH-CSP foi determinada como descrito pelo fabricante (kit Great EscAPe da Clontech, #X2041). Em resumo, uma alíquota de meio foi inactivada pelo calor a 65°C, depois foi combinada com tampão de ensaio e substrato quimioluminescente CSPD e incubou-se à temperatura ambiente durante 10 minutos. A taxa de conversão de substrato foi depois determinada num luminómetro (Turner 20/20TD). A densidade celular foi determinada por contagem de células tripsinizadas num contador de células Coulter ACT10. 34
ΕΡ 1 600 510 /PT
Transfecção e cultura de células U-2 OS com plasmideos pSDH: A linha celular U-2 OS de osteossarcoma humano (ATCC #HTB-96) foi cultivada em Meio de Eagle Modificado por Dulbecco + 10% de Soro de Bezerro Fetal contendo glutamina, penicilina e estreptomicina (supra) a 37°C/5% de C02. As células foram co-transfectadas com o vector pSDH-CMV e seus derivados contendo STAR6 ou STAR8 em MCSI e MCSII, (juntamente com o plasmideo pBabe-Puro) usando SuperFect (supra). A selecção com puromicina foi completada em 2 semanas, tempo depois do qual se isolaram clones U-2 OS/pSDH-CMV resistentes à puromicina individuais aleatoriamente e cultivaram-se adicionalmente.
Ensaio de Luciferase: A actividade de luciferase (Himes & Shannon, 2000) foi ensaiada em células ressuspensas de acordo com as instruções do fabricante do kit de ensaio (Roche 1669893), usando um luminómetro (Turner 20/20TD) . A concentração de proteína celular total foi determinada pelo método do ácido bicinchonínico de acordo com as instruções do fabricante (Sigma B-9643) e usou-se para normalizar os dados da luciferase.
Resultados
Os clones de células CHO recombinantes contendo o vector pSDH-CSP ou os plasmideos pSDH-CSP contendo STAR6 ou STAR49 (Tabela 6), foram cultivados durante 3 semanas. A actividade SE AP nos sobrenadantes de cultura foi depois determinada e é expressa com base no número de células (FIG. 7). Como pode ser observado, foram isolados clones com elementos STAR nas unidades de expressão, que expressam actividade SEAP 2 a 3 vezes mais elevadas do que os clones cujas unidades de expressão não incluem elementos STAR. Além disso, o número de clones contendo STAR que expressam a actividade SEAP igual ou superior à actividade máxima dos clones sem STAR é bastante elevada: 25% a 40% das populações de clones STAR excederam a expressão SEAP mais elevada dos clones pSDH-CSP.
Clones de células U-2 OS recombinante contendo o vector pSDH-CMV ou plasmideos pSDH-CMV contendo STAR6 ou STAR8 (Tabela 6), foram cultivados durante 3 semanas. A actividade de luciferase nas célula hospedeiras foi depois determinada e é expressa como unidades relativas de luciferase (FIG. 8), 35 ΕΡ 1 600 510 /PT normalizadas para a proteína celular total. Os clones U-2 OS recombinantes com elementos STAR que flanqueiam as unidades de expressão tiveram rendimentos mais elevados do que os clones sem STAR: a expressão mais elevada observada de clones STAR8 foi 2 a 3 vezes mais elevada do que a expressão de clones sem STAR. Os clones STAR6 tiveram níveis máximos de expressão 5 vezes mais elevados do que os clones sem STAR. Os elementos STAR conferiram também maior previsibilidade: para ambos os elementos STAR, 15 a 20% dos clones demonstraram expressão de luciferase em níveis comparáveis ou superiores aos do clone sem STAR com o nível de expressão mais elevado.
Estes resultados demonstram que, quando usados com o promotor forte de CMV, os elementos STAR aumentam o rendimento de proteínas heterólogas (luciferase e SEAP). Todos os três dos elementos STAR introduzidos neste exemplo proporcionam rendimentos elevados. A previsibilidade aumentada conferida pelos elementos STAR é manifestada pela grande proporção dos clones com rendimentos iguais ou superiores aos rendimentos mais elevados apresentados pelos clones sem STAR.
Exemplo 12
Os elementos STAR melhoram a estabilidade da expressão de transgenes
Durante o cultivo de células hospedeiras recombinantes, é prática comum manter a selecção antibiótica. Isto destina-se a impedir o silenciamento transcricional do transgene ou a perda do transgene pelo genoma por processos tais como a recombinação. Contudo, é indesejável para a produção de proteínas heterólogas, por várias razões. Primeiro, os antibióticos que são usados são bastante dispendiosos e contribuem significativamente para o custo unitário do produto. Segundo, para uso biofarmacêutico, a proteína deve ser demonstravelmente pura, sem nenhum traço do antibiótico no produto. Uma vantagem dos elementos STAR para a produção de proteína heteróloga é que conferem uma expressão estável aos transgenes durante o cultivo prolongado, mesmo na ausência de selecção antibiótica; esta propriedade é demonstrada neste exemplo. 36
ΕΡ 1 600 510 /PT
Materiais e Métodos A linha celular U-2 OS foi transfectada com o plasmídeo pSDH-Tet-STAR6 e cultivada como descrito no Exemplo 11. os clones resistentes à puromicina individuais foram isolados e adicionalmente cultivados na ausência de doxiciclina. Em intervalos semanais as células foram transferidas para vasos de cultura novos a uma diluição de 1:20. A actividade de luciferase foi medida em intervalos periódicos como descrito no Exemplo 11. Depois de 15 semanas as culturas foram divididas em duas réplicas; uma réplica continuou a receber puromicina, enquanto a outra réplica não recebeu nenhum antibiótico durante o resto da experiência (25 semanas no total).
Resultados A Tabela 7 apresenta os dados da expressão de luciferase por uma unidade de expressão flanqueada com STAR6 durante o cultivo prolongado com ou sem antibiótico. Como pode ser observado, a expressão do transgene repórter, luciferase, permanece estável nas células hospedeiras U-2 OS toda a duração da experiência. Depois das culturas serem divididas em dois tratamentos (acrescido de antibiótico e sem antibiótico) a expressão da luciferase foi essencialmente estável na ausência da selecção antibiótica. Isto demonstra a capacidade de elementos STAR para proteger transgenes do silenciamento ou perda durante o cultivo prolongado. Isto também demonstra que esta propriedade é independente da selecção por antibiótico. Portanto, a produção de proteínas heterólogas é possível sem incorrer nos custos do antibiótico ou de dificuldade de processamento a jusante.
Exemplo 13
Sequências essenciais mínimas de elementos STAR
Elementos STAR são isolados da triagem genética descrita no Exemplo 1. A triagem usa bibliotecas construídas com ADN genómico humano que foi fraccionado por tamanhos até aproximadamente 0,5 a 2 quilobases (supra). Os elementos STAR variam de 500 a 2361 pares de bases (Tabela 6) . É provável que, para muitos dos elementos STAR que foram isolados, a 37 ΕΡ 1 600 510 /PT actividade STAR seja conferida por um fragmento de ADN menor do que o clone inicialmente isolado. É útil determinar estes tamanhos de fragmento minimos que são essenciais para a actividade STAR, por duas razões. Primeiro, elementos STAR funcionais menores seriam vantajosos no desenho de vectores de expressão compactos, visto que vectores menores transfectam células hospedeiras com maior eficiência. Segundo, a determinação das sequências STAR essenciais minimas permite a modificação dessas sequências quanto a funcionalidade melhorada. Dois elementos STAR foram finamente mapeados para determinar as suas sequências essenciais minimas.
Materiais e Métodos: STAR10 (1167 pares de bases) e STAR27 (1520 pares de bases) foram finamente mapeados. Foram amplificados por PCR para produzir sub-fragmentos de comprimento aproximadamente igual (legenda da FIG. 9). Para o teste inicial, estes foram clonados no vector pSelect no local Bamhl e transfectados em células U-2 OS/Tet-Off/LexA-HPl como descrito no Exemplo 1. Depois da selecção quanto a resistência à higromicina, introduziu-se LexA-HPl diminuindo a concentração de doxiciclina. As células transfectadas foram depois incubadas com zeocina para testar a capacidade dos fragmentos STAR para proteger a unidade de expressão SV40-Zeo da repressão devida à ligação de LexA-HPl.
Resultados
Nesta experiência STAR10 e STAR27 conferem boa protecção contra o silenciamento de genes, como esperado (FIG. 9). Isto é manifestado pelo crescimento robusto na presença de zeocina.
Dos 3 sub-f ragmentos de STAR10, ο 10A (-400 pares de bases) confere às células transfectadas crescimento vigoroso na presença de zeocina, excedendo o do elemento STAR de comprimento completo. As células transfectadas com construções pSelect contendo os outros 2 sub-fragmentos não crescem na presença de zeocina. Estes resultados identificam o fragmento 10A de -400 pares de bases como abrangendo a sequência de ADN responsável pela actividade anti-repressão de STAR10. 38
ΕΡ 1 600 510 /PT STAR27 confere crescimento moderado em zeocina às células transfectadas nesta experiência (FIG. 9). Um dos sub-fragmentos deste STAR, 27B (~500 pares de bases), permite o crescimento fraco das células hospedeiras em meio contendo zeocina. Isto sugere que a actividade anti-repressão deste STAR está parcialmente localizada no sub-fragmento 27B, mas a actividade completa requer também sequências de 27A e/ou 27C (cada uma de -500 pares de bases).
Exemplo 14
Elementos STAR funcionam em diversas estirpes de células de mamífero cultivadas A escolha da linha celular hospedeira para a expressão de proteína heteróloga é um parâmetro crítico para a qualidade, rendimento e custo por unidade da proteína. Considerações tais como modificações pós-tradução, capacidade de vias secretoras e imortalidade da linha celular, impõe a linha celular apropriada para um sistema de produção biofarmacêutico particular. Por esta razão, as vantagens proporcionadas pelos elementos STAR em termos de rendimento, previsibilidade e estabilidade devem ser obteníveis em diversas linhas celulares. Isto foi testado comparando a função de STAR6 na linha celular U-2 OS humana na qual foi originalmente clonado e a linha celular CHO que é amplamente aplicada na biotecnologia.
Materiais e Métodos:
Refira-se às experiências do Exemplo 11.
Resultados A expressão do gene repórter SEAP em células CHO é apresentada na FIG. 7; a expressão do gene repórter de luciferase em células U-2 OS é apresentada na FIG. 8. Por comparação dos resultados destas duas experiências, é evidente que o elemento STAR6 é funcional em ambas as linhas celulares: a expressão do gene repórter foi mais previsível em ambas e os clones de cada linha celular apresentaram rendimentos mais elevados, quando o gene repórter foi protegido dos efeitos de posição pelo STAR6. Estas duas linhas celulares são derivadas 39 ΕΡ 1 600 510 /PT de espécies diferentes (humana e de hamster) e de tipos de tecidos diferentes (osso e ovário), reflectindo a ampla gama de células hospedeiras nas quais este elemento STAR pode ser utilizado para melhorar a expressão de proteína heteróloga.
Exemplo 15
Os elementos STAR funcionam no contexto de vários promotores transcricionais A transcrição de transgenes é conseguida colocando o quadro de leitura aberto do transgene sob o controlo de um promotor exógeno. A escolha do promotor é influenciada pela natureza da proteína heteróloga e pelo sistema de produção. Na maioria dos casos, os promotores constitutivos fortes são preferidos por causa dos elevados rendimentos que podem proporcionar. Alguns promotores virais têm estas propriedades; o promotor/intensificador do gene precoce imediato de citomegalovírus ("promotor de CMV") é no geral considerado como o promotor mais forte em uso biotecnológico comum (Boshart et al., 1985, Doll et al., 1996, Foecking & Hofstetter, 1986). O promotor do vírus símio SV40 também é moderadamente forte (Boshart et al., 1985, Foecking & Hofstetter, 1986) e é frequentemente usado para a expressão ectópica em vectores de células de mamífero. O promotor Tet-Off é indutível: o promotor é reprimido na presença de tetraciclina ou antibióticos relacionados (a doxiciclina é habitualmente usada) em linhas celulares que expressam o plasmídeo tTA (Clontech K1620-A) e a remoção do antibiótico resulta na indução da transcrição (Deuschle et al., 1996, Gossen & Bujard, 1992, Izumi & Gilbert, 1999, Umana et al., 1999) .
Materiais e Métodos: A construção dos vectores pSDH-Tet e pSDH-CMV é descrita no Exemplo 11. O pSDH-SV40 foi construído por amplificação por PCR do promotor SV40 (iniciadores D41 e D42) a partir do plasmídeo pSelect-SV40-Zeo (Exemplo 1), seguida por digestão do produto da PCR com Sacll e Sall. O vector pSDH-CMV foi digerido com Sacll e Sall para remover o promotor de CMV e o vector e o fragmento de SV40 foram ligados juntos para criar o pSDH-SV40. O STAR6 foi clonado em MCSI e MCSII como descrito 40 ΕΡ 1 600 510 /PT no Exemplo 11. Os plasmídeos pSDH-Tet, pSDH-Tet-STAR6, pSDH-Tet-STAR7, pSDH-SV40 e pSDH-SV40-STAR6 foram co-transfectados com pBabe-Puro em U-2 OS usando SuperFect como descrito pelo fabricante. O cultivo das células, a selecção com puromicina e os ensaios de luciferase foram realizados como descrito no Exemplo 11.
Resultados
As FIG. 8, 10 e 11 comparam a expressão do gene repórter de luciferase a partir de 3 promotores diferentes: dois promotores virais fortes e constitutivos (CMV e SV40) e o promotor indutivel Tet-Off. Todos os três promotores foram testados no contexto do elemento STAR6 em células U-2 OS. Os resultados demonstram que o rendimento e a previsibilidade de todos os 3 promotores são aumentados pelo STAR6. Como descrito nos Exemplos 11 e 14, o STAR6 é benéfico no contexto do promotor de CMV (FIG. 8) . Melhorias similares são observadas no contexto do promotor SV40 (FIG. 10): o rendimento do clone STAR6 de expressão mais elevada é 2 a 3 vezes maior do que os melhores clones pSDH-SV40 e 6 clones STAR (20% da população) têm rendimentos mais elevados do que os melhores clones sem STAR. No contexto do promotor Tet-Off sob concentrações indutoras (baixo teor de doxiciclina), o STAR6 também melhora o rendimento e a previsibilidade da expressão do transgene (FIG. 11): o clone STAR6 de expressão mais elevada tem um rendimento 20 vezes mais elevado do que o melhor clone pSDH-Tet e 9 clones STAR6 (35% da população) têm rendimentos mais elevados do que o melhor clone sem STAR. Conclui-se que este elemento STAR é versátil nas suas propriedades protectoras de transgenes, visto que funciona no contexto de vários promotores da transcrição biotecnologicamente úteis.
Exemplo 16 Ά função do elemento STAR pode ser direcclonal
Embora as sequências de ácido nucleico curtas possam ser simétricas (por exemplo palindrómicas), sequências mais longas, que ocorrem naturalmente, são tipicamente assimétricas. Como um resultado, o teor de informação de sequências de ácido nucleico é direccional e as próprias sequências podem ser descritas em relação às suas 41
ΕΡ 1 600 510 /PT extremidades 5' e 3'. A direccionalidade da informação da sequência de ácido nucleico afecta o arranjo no qual as moléculas de ADN recombinante são montadas usando técnicas de clonagem padrão conhecidas na especialidade (Sambrook et al., 1989) . Os elementos STAR são sequências de ADN longas, assimétricas, e têm uma direccionalidade baseada na orientação na qual foram originalmente clonadas no vector pSelect. Nos exemplos dados acima, usando dois elementos STAR em vectores pSDH, esta direccionalidade foi preservada. Esta orientação é descrita como a orientação nativa ou 5'-3', em relação ao gene de resistência à zeocina (ver a FIG. 12) . Neste exemplo, a importância da direccionalidade para a função STAR é testada no vector pSDH-Tet. Visto que os genes repórteres nos vectores pSDH são flanqueados de ambos os lados por cópias do elemento STAR de interesse, a orientação de cada cópia STAR tem que ser considerada. Este exemplo compara a orientação nativa com a orientação oposta (FIG. 12).
Materiais e Métodos: O elemento STAR66 foi clonado no pSDH-Tet como descrito no Exemplo 11. As células u-2 OS foram co-transfectadas com plasmideos pSDH-Tet-STAR66-native e pSDH-Tet-STAR66-opposite e foram cultivadas como descrito no Exemplo 11. Clones individuais foram isolados e cultivados; o nivel de expressão de luciferase foi determinado como descrito (supra).
Resultados
Os resultados da comparação de actividade STAR66 na orientação nativa e na orientação oposta são mostrados na FIG. 13. Quando o STAR66 está na orientação oposta, o rendimento de apenas um clone é razoavelmente elevado (60 unidades de luciferase). Ao contrário, o rendimento do clone de expressão mais elevada quando o STAR66 está na orientação nativa é consideravelmente mais elevado (100 unidades de luciferase) e a previsibilidade é também muito mais elevada: 7 clones da população de orientação nativa (30%) expressam a luciferase acima do nivel do clone de expressão mais elevada da população de orientação oposta e 15 dos clones na população de orientação nativa (60%) expressam a luciferase acima de 10 unidades relativas de luciferase. Portanto é demonstrado que a função de STAR66 é 42 ΕΡ 1 600 510 /PT direccional.
Exemplo 17 A expressão do transgene no contexto de elementos STAR é dependente do numero de cópias
As unidades de expressão de transgene para expressão de proteína heteróloga são geralmente integradas no genoma da célula hospedeira para garantir a retenção estável durante a divisão celular. A integração pode resultar num cópia ou em múltiplas cópias da unidade de expressão que é inserida no genoma; as múltiplas cópias podem ou não estar presentes em séries em tandem. O rendimento aumentado demonstrado para os transgenes protegidos por elementos STAR (supra) sugere que os elementos STAR são capazes de permitir que a expressão de unidades de transgene funcione independentemente de influências na transcrição associadas com o local de integração no genoma (independência de efeitos de posição (Boivin & Dura, 1998)). Isto sugere ainda que os elementos STAR permitem que cada unidade de expressão funcione independentemente de cópias vizinhas da unidade de expressão quando são integradas como uma série em tandem (independência de silenciamento de genes induzido por repetições (Garrick et ai., 1998)). A dependência do número de cópias é determinada a partir da relação entre os níveis de expressão de transgenes e o número de cópias, como descrito nos exemplos abaixo.
Materiais e Métodos: Células U-2 OS foram co-transfectadas com pSDH-Tet-STARlO e cultivadas sob selecção com puromicina como descrito (supra). Oito clones individuais foram isolados e adicionalmente cultivados. Depois as células foram colhidas e uma porção foi ensaiada quanto a actividade de luciferase como descrito (supra). As células remanescentes foram lisadas e o ADN genómico foi purificado usando o kit DNeasy Tissue (QIAGEN 69504) como descrito pelo fabricante. As amostras de ADN foram quantificadas por espectrofotometria de UV. Três microgramas de cada amostra de ADN genómico foram digeridos com Pvull e Xhol durante a noite como descrito pelo fabricante (New England Biolabs) e resolvidos por electroforese em gel de agarose. Os fragmentos de ADN foram transferidos para uma 43 ΕΡ 1 600 510 /PT membrana de nylon como descrito (Sambrook et al., 1989) e hibridados com uma sonda radioactivamente marcada com o gene de luciferase (isolado de pSDH-Tet digerido com BamHI/SacII). A transferência foi lavada como descrito (Sambrook et al., 1989) e exposta a um ecrã de um aparelho de produção de fosforimagem (Personal FIX, BioRad). O autorradiograma resultante (FIG. 14) foi analisado por densitometria para determinar a força relativa das bandas de ADN de luciferase, que representa o número de cópias do transgene.
Resultados
As actividades enzimáticas e os números de cópias (intensidades das bandas de ADN) da luciferase nos clones da população do clone pSDH-Tet-STARlO, são mostrados na FIG. 15. O número de cópias do transgene está altamente correlacionado com o nivel de expressão de luciferase nestes clones pSDH-Tet-STARlO (r = 0,86). Isto sugere que o STAR10 confere dependência do número de cópias às unidades expressão do transgene, tornando a expressão do transgene independente de outras cópias do transgene em séries em tandem e independente das influências de silenciamento de genes no local de integração.
Exemplo 18
Elementos STAR funcionam como bloqueadores de intensificadores mas não como intensificadores
Os promotores de genes são submetidos tanto a influências positivas como negativas na sua capacidade para iniciar a transcrição. Uma classe importante de elementos que exercem influências positivas são os intensificadores. Os intensificadores são caracteristicamente capazes de afectar promotores mesmo quando estão localizados longe (muitos quilo(pares de bases)) do promotor. As influências negativas que actuam pela formação de heterocromatina (e.g. proteínas do grupo Policomb) foram descritas acima e estas são o alvo de actividade STAR. As bases bioquímicas para a função intensificadora e para a formação de heterocromatina são fundamentalmente similares, visto que ambas envolvem ambas a ligação de proteínas ao ADN. Portanto, é importante determinar se os elementos STAR são capazes de bloquear as influências 44 ΕΡ 1 600 510 /PT positivas assim como as influências negativas, por outras palavras, de proteger os transgenes de intensificadores genómicos na vizinhança do local de integração. A capacidade para proteger transgenes da actividade intensificadora garante o desempenho estável e previsível de transgenes em aplicações biotecnológicas. Este exemplo examina o desempenho de elementos STAR num ensaio de bloqueio de intensificadores.
Uma outra característica da actividade STAR que é importante para a sua função é o rendimento aumentado que confere aos transgenes (Exemplo 11) . Os STAR são isolados com base na sua capacidade para manter elevados níveis de expressão de zeocina quando as proteínas que formam heterocromatina estão ligadas adjacentes aos elementos STAR candidatos. Prevê-se a ocorrência de elevada expressão porque se prevê que os STAR bloqueiem a disseminação de heterocromatina na unidade de expressão de zeocina. Contudo, um segundo cenário é que os fragmentos de ADN em clones resistentes à zeocina contêm intensificadores. Demonstrou-se que os intensificadores têm a capacidade de superar os efeitos repressivos das proteínas do grupo Policomb tais como os usados no método da triagem de STAR (Zink & Paro, 1996). Os intensificadores isolados por este fenómeno seriam considerados falsos positivos, visto que os intensificadores não têm as propriedades aqui reivindicadas para os STAR. De modo a demonstrar que os elementos STAR não são intensificadores, foram testados num ensaio aos intensificadores. O ensaio de bloqueio de intensificadores e o ensaio aos intensificadores são metodológica e conceptualmente similares, os ensaios são mostrados esquematicamente na FIG. 16. A capacidade dos elementos STAR para bloquear intensificadores é desempenhada usando o sistema intensificador E47/E-box. A proteína E47 é capaz de activar a transcrição pelos promotores quando está ligada a uma sequência de ADN E-box localizada na vizinhança destes promotores (Quong et al., 2002). A E47 está normalmente envolvida na regulação da diferenciação de linfócitos B e T (Quong et al., 2002), mas é capaz de funcionar em diversos tipos de células quando ectopicamente expressa (Petersson et al., 2002). A E-box é uma sequência de ADN palindrómica, CANNTG (Knofler et al., 2002). No ensaio de bloqueio de intensificadores, uma E-box é colocada a montante 45
ΕΡ 1 600 510 /PT de um gene repórter de luciferase (incluindo um promotor mínimo) num vector de expressão. Um local de clonagem para os elementos STAR é colocado entre a E-box e o promotor. A proteína E47 é codificada num segundo plasmídeo. O ensaio é realizado transfectando tanto o plasmídeo E47 quanto como o vector de expressão de luciferase em células; a proteína E47 é expressa e liga-se à E-box e o complexo E47/E-box é capaz de actuar como intensificador. Quando o vector de expressão de luciferase não contém um elemento STAR, o complexo E47/E-box intensifica a expressão de luciferase (FIG. 16A, situação 1) . Quando elementos STAR são inseridos entre a E-box e o promotor, a sua capacidade para bloquear o intensificador é demonstrada pela expressão reduzida da actividade de luciferase (FIG. 16A, situação 2); se os STAR não puderem bloquear os intensificadores, a expressão de luciferase é activada (FIG. 16A, situação 3). A capacidade dos elementos STAR para actuarem como intensificadores utiliza o mesmo vector de expressão de luciferase. Na ausência de E47, a E-box por si só não afecta a transcrição. Ao invés disso, o comportamento intensificador dos elementos STAR resultará na activação da transcrição de luciferase. O ensaio é realizado transfectando o vector de expressão de luciferase sem o plasmídeo E47. Quando o vector de expressão não contém elementos STAR, a expressão de luciferase é baixa (FIG. 16B, situação 1) . Se os elementos STAR não têm propriedades intensificadoras, a expressão de luciferase é baixa quando um elemento STAR está presente no vector (FIG. 16B, situação 2). Se os elementos STAR têm propriedades intensificadoras, a expressão de luciferase será activada nos vectores contendo STAR (FIG. 16B, situação 3) .
Materiais e Métodos: O vector de expressão de luciferase foi construído inserindo a E-box e um promotor mínimo da fosfatase alcalina humano do plasmídeo mu-E5+E2x6cat(x) (Ruezinsky et al., 1991) a montante do gene da luciferase no plasmídeo pGL3-basic (Promega E1751), para criar o pGL3-E-box-luciferase (oferta de W. Romanow). O plasmídeo de expressão de E47 contém o quadro de leitura aberto de E47 sob o controlo de um promotor de beta-actina no plasmídeo pHBAPr-l-neo; a E47 é constitutivamente expressa a partir deste plasmídeo (oferta de 46
ΕΡ 1 600 510 /PT W. Romanow) . Os elementos STAR 1, 2, 3, 6, 10, 11, 18 e 27 foram clonados no vector de expressão de luciferase. Os clones contendo o elemento scs de drosófila e o elemento de núcleo da beta-globina HS4-6x de galinha ("HS4") foram incluídos como controlos positivos (sabe-se que bloqueiam intensificadores e que não têm propriedades intensificadoras intrínsecas (Chung et al., 1993, Kellum & Schedl, 1992)) e o vector de expressão de luciferase vazio foi incluído como controlo negativo. Todos os ensaios foram realizados usando a linha celular u-2 OS. No ensaio de bloqueio de intensificadores, o plasmídeo E47 foi co-transfectado com os vectores de expressão de luciferase (vector vazio ou contendo STAR ou elementos de controlo positivo). No ensaio aos intensificadores, o plasmídeo E47 foi co-transfectado com o vector de expressão de luciferase sem STAR como um controlo positivo para a actividade intensificadora; todas as outras amostras receberam um plasmídeo simulado durante a co-transfecção. As células transientemente transfectadas foram ensaiadas quanto a actividade de luciferase 48 horas depois da transfecção do plasmídeo (supra). A actividade de luciferase expressa a partir de um plasmídeo não contendo E-box nem elementos STAR/controlo foi subtraída e as actividades de luciferase foram normalizadas para o teor de proteína como descrito (supra).
Resultados. A FIG. 17 mostra os resultados do ensaio de bloqueio de intensificadores. Na ausência de elementos STAR (ou dos elementos bloqueadores de intensificadores conhecidos, scs e HS4), o complexo intensificador E47/E-box activa a expressão de luciferase ("vector"); este nível aumentado de expressão foi normalizado para 100. A actividade intensificadora é bloqueada por todos os elementos STAR testados. A actividade intensificadora também é bloqueada pelos elementos HS4 e scs, como esperado (Bell et al., 2001, Gerasimova & Corces, 2001). Estes resultados demonstram que além da sua capacidade para bloquear a disseminação do silenciamento transcricional (influências negativas), os elementos STAR são capazes de bloquear a acção de intensificadores (influências positivas). A FIG. 18 mostra os resultados do ensaio aos intensificadores. O nível de expressão de luciferase devido a 47 ΕΡ 1 600 510 /PT intensificação pelo complexo E47/E-box é ajustado para 100 ("E4 7") . Por comparação, nenhum dos elementos STAR realiza activação significativa da expressão de luciferase. Como esperado, os elementos scs e HS4 também não realizam a activação do gene repórter. Portanto, conclui-se que pelo menos os elementos STAR testados não possuem propriedades intensificadoras.
Exemplo 20
Os elementos STAR são conservados entre ratinho e ser humano
A análise BLAT da sequência de ADN de STAR contra a base de dados do genoma humano (http://genoma.ucsc.edu/ cgi-bin/hgGateway) revela que algumas destas sequências têm alta conservação de sequência com outras regiões do genoma humano. Estas regiões duplicadas são elementos STAR candidatos; se apresentam actividade STAR, podem ser consideradas parálogos dos STAR clonados (dois genes ou elementos genéticos são ditos parálogos se são derivados de um evento de duplicação (Li, 1997)). A análise BLAST dos STAR humanos contra o genoma de ratinho (http://www.ensembl.org/Mus_musculus/blastview) também revela regiões de alta conservação de sequência entre o
ratinho e o ser humano. Esta conservação de sequência foi mostrada para os fragmentos de 15 dos 65 elementos STAR humanos. A conservação vai de 64% a 89%, ao longo de comprimentos de 141 pares de bases a 909 pares de bases (Tabela 8). Estes graus de conservação de sequência são extraordinários e sugerem que estas sequências de ADN podem conferir actividade STAR também dentro do genoma de ratinho. Algumas das sequências dos genomas de ratinho e de ser humano na Tabela 8 podem ser estritamente definidas como ortólogas (dois genes ou elementos genéticos são ditos ortólogos se são derivados de um evento de evolução de espécies (Li, 1997) ) . Por exemplo, o STAR6 está entre os genes SLC8A1 e HAAO tanto no genoma de ratinho como no humano. Em outros casos, um STAR humano clonado tem um parálogo dentro do genoma humano e o seu ortólogo foi identificado no genoma de ratinho. Por exemplo, o STAR3a é um fragmento da região 15qll.2 do cromossoma 15 humano. Esta região é 96,9% idêntica (paráloga) com um fragmento de ADN em 5q33.3 no cromossoma 5 humano, que está próximo ao gene da interleucina IL12B. Estes ADN humanos partilham aproximadamente 80% de identidade com um fragmento 48
ΕΡ 1 600 510 /PT da região 11B2 no cromossoma 11 de ratinho. O fragmento 11B2 também está próximo do gene da interleucina IL12B (ratinho). Portanto o STAR3a e o fragmento 11B2 de ratinho podem ser estritamente definidos como parálogos. De modo a testar a hipótese de que a actividade STAR é compartilhada entre regiões de alta conservação de sequência no genoma de ratinho e humano, um dos STAR humanos com uma sequência conservada em ratinho, STAR18, foi analisado com maiores detalhes. A conservação de sequência no genoma de ratinho detectada com o clone STAR18 original estende-se para a esquerda do cromossoma 2 humano por cerca de 500 pares de bases (FIG. 19; esquerda e direita referem-se à descrição padrão dos braços do cromossoma 2). Neste exemplo examinámos se a região de conservação de sequência define um elemento STAR "que ocorre naturalmente" no ser humano que é mais extenso em comprimento do que o clone original. Também examinámos se a função STAR deste elemento STAR é conservada entre ratinho e ser humano.
Materiais e Métodos A região de conservação de sequência de ratinho/humana em torno de STAR18 foi recuperada do clone BAC humano RP11-387A1 por amplificação por PCR, em três fragmentos: a região inteira (iniciadores E93 e E94), a metade à esquerda (iniciadores E93 e E92) e a metade à direita (iniciadores E57 e E94) . Os fragmentos correspondentes da região de ratinho homóloga foram recuperados do clone BAC RP23-400H17 da mesma maneira (iniciadores E95 e E98, E95 e E96 e E97 e E98, respectivamente). Todos os fragmentos foram clonados no vector pSelect e transfectados numa linha celular U-2 OS/Tet-Off/LexA-HPl (supra). Após a transfecção, realizou-se selecção com higromicina para seleccionar as células transfectadas. A proteína LexA-HPl foi induzida diminuindo da concentração de doxiciclina, e a capacidade das células transfectadas para suportar o antibiótico zeocina (uma medida da actividade STAR) foi avaliada pela monitoração do crescimento celular.
Resultados O clone STAR18 original foi isolado de ADN humano digerido com Sau3AI ligado no vector pSelect com base na sua capacidade para impedir o silenciamento de um gene de resistência à zeocina. O alinhamento do clone STAR18 humano (497 pares de bases) com o genoma de ratinho revelou elevada similaridade de sequência (72%) entre as regiões STAR18 49 ΕΡ 1 600 510 /PT ortólogas humana e de ratinho. Isto também revelou elevada similaridade (73%) na região que se estende por 488 pares de bases imediatamente à esquerda do local Sau3AI que define a extremidade esquerda da região clonada (FIG. 19). Fora destas regiões a similaridade de sequência entre o ADN humano e o de ratinho cai abaixo dos 60%.
Como indicado na FIG. 19, tanto os elementos STAR18 humanos como os de ratinho conferem sobrevivência em zeocina às células hospedeiras que expressam a proteína repressora lexA-HPl. O clone STAR18 de 497 pares de bases original e seu ortólogo de ratinho conferem ambos a capacidade para crescer (FIG. 19, a e d) . As regiões de 488 pares de bases adjacentes de elevada similaridade de ambos os genomas também conferem a capacidade para crescer, e de facto o seu fenótipo de crescimento é mais vigoroso do que o do clone STAR18 original (FIG. 19, b e e) . Quando a região inteira de similaridade de sequência foi testada, estes ADN tanto de ratinho como de ser humano conferem crescimento e o fenótipo de crescimento é mais vigoroso do que os dois sub-fragmentos (FIG. 19, c e f). Estes resultados demonstram que a actividade STAR do STAR18 humano é conservada no seu ortólogo de ratinho. A alta conservação de sequência entre estas regiões ortólogas é particularmente digna de nota porque não se trata de sequências codificadoras de proteínas, levando à conclusão de que estas têm alguma função reguladora impediu a sua divergência evolucionária ao longo da mutação.
Esta análise demonstra que os elementos STAR clonados identificados pelo programa de triagem original podem em alguns casos representar elementos STAR parciais e que a análise do ADN genómico no qual são embutidos pode identificar sequências com actividade STAR mais forte.
Exemplo 21
Materiais e Métodos
Usando a triagem genética descrita no pedido de patente original, sessenta e seis (66) elementos STAR foram inicialmente isolados de ADN genómico humano e caracterizados em detalhe (Tabela 6). A triagem foi realizada em bibliotecas de genes construídas por digestão com Sau3Al de ADN genómico 50 ΕΡ 1 600 510 /PT humano, purificado a partir de placenta (Clontech 6550-1) ou transportado em cromossomas artificiais bacterianos/Pl (BAC/PAC). Os clones BAC/PAC contêm ADN genómico de regiões do cromossoma 1 (clones RP1154H19 e RP3328E19), do cacho HOX de genes homeóticos (clones RP1167F23, RP1170019 e RP11387A1) ou do cromossoma 22 humano (Research Genetics 96010-22) . Os ADN foram fraccionados por tamanho e a fracção de tamanhos de 0,5-2 kb foi ligada no vector pSelect digerido com Bamtil, por técnicas padrão (Sambrook et al.r 1989). Os plasmideos pSelect contendo ADN genómico humano que conferiram resistência à zeocina em baixas concentrações de doxiciclina foram isolados e propagados na Escherichia coli. As triagens que produziram os elementos STAR da Tabela 6 ensaiaram aproximadamente 1-2% do genoma humano.
As inserções de ADN genómico humano nestes 66 plasmideos foram sequenciadas pelo método de didesoxi (Sanger et al., 1977) usando um sequenciador de ADN automático Beckman CEQ2000, usando as instruções do fabricante. Em resumo, o ADN foi purificado a partir da E. coli usando os kits QIAprep Spin Miniprep e Plasmid Midi (QIAGEN 27106 e 12145, respectivamente). A sequenciação por ciclos foi realizada usando oligonucleótidos de encomenda correspondendo ao vector pSelect (iniciadores D89 e D95, Tabela 5), na presença de terminadores de corante (kit de Sequenciação por Ciclos CEQ Dye Terminator Cycle Sequencing, Beckman 608000) . As sequências de ADN de STAR montadas foram localizadas no genoma humano (construções de base de dados de Agosto e Dezembro de 2001) usando BLAT (Basic Local Alignment Tool (Kent, 2002); http://genoma.ucsc.edu/cgi-bin/hgGateway; Tabela 6). Em resumo, as sequências STAR combinadas compreendem 85,6 quilo(pares de bases), com um comprimento médio de 1,3 quilopares de bases.
Descrição Resumida dos Desenhos
Figura 1. A família pSelect de plasmideos para seleccionar e caracterizar elementos STAR. Um marcador de resistência (zeocina ou puromicina) ou gene repórter (GFP ou luciferase) sob o controlo do promotor de SV40 promíscuo está adjacente a um local de clonagem BamHI flanqueado pelos locais As cl e BindlII. A montante do local de clonagem estão os operadores lexA aos quais a proteína lexA se pode ligar. A 51 ΕΡ 1 600 510 /PT ligação de proteínas quiméricas lexA-grupo Policomb aos operadores causa a repressão do gene marcador ou repórter. Os fragmentos de ADN inseridos no local de clonagem que bloqueiam a repressão são identificados pela expressão persistente do gene marcador ou repórter. O plasmídeo replica epissomicamente em células de mamífero cultivadas devido à sequência oriP.
Figura 2. A família pSDH de plasmídeos para testar elementos STAR. Dois locais de clonagem múltipla (MCSI e MCSII) flanqueiam um gene repórter (GFP ou luciferase) cuja expressão é conduzida por um promotor a montante (CMV, Tet-off ou SV40) . Os elementos STAR a testar são inseridos em MCSI e MCSII. Estes contêm locais de restrição únicos (MCSI: Xhol, NotI, EcoRI e Sall; MCSII: tfindlll, EcoRV, Bglll e NheI). O plasmídeo replica depois da integração aleatória no genoma de células de mamífero.
Figura 3. Proporção de clones super-expressores de luciferase. Células de osteossarcoma humano U-2 OS foram transfectadas de modo estável com plasmídeos pSDH (contendo o gene repórter de luciferase sob o controlo do promotor tet-off) e clones transfectados individuais, foram isolados e cultivados. A expressão de luciferase foi medida enzimaticamente. A expressão de luciferase média pelos clones contendo o pSDH sem STAR ("nível de referência") foi determinada. Clones dos conjuntos para todos os plasmídeos foram classificados como "super-expressores" se a sua actividade de luciferase era mais do que 2 vezes superior ao nível de referência. Está representada a percentagem de clones super-expressores em cada conjunto de plasmídeos.
Figura 4. Número de vezes de super-expressão pelos clones super-expressores. A gama de super-expressão nos plasmídeos pSDH contendo STAR integrados no ADN genómico foi determinado dividindo as actividades de luciferase de cada clone pelo nível de referência. Para aqueles que apresentam expressão significativa (mais do que 2 vezes acima do nível de referência), o número de vezes de aumento real foi anotado; os valores mínimo e médio destes dados estão representados para cada plasmídeo.
Figura 5. Número de vezes de super-expressão pelos clones super-expressores. A gama de super-expressão em plasmídeos 52 ΕΡ 1 600 510 /PT pSDH contendo STAR integrados no ADN genómico foi determinado dividindo as actividades de luciferase de cada clone pelo nivel de referência. Para aqueles que apresentam expressão significativa (mais do que 2 vezes acima do nivel de referência), o número de vezes de aumento real foi anotado; os valores máximos destes dados estão representados para cada plasmideo. FIG. 6. O plasmideo pSDH-CSP usado para testar a actividade STAR. O gene repórter da Fosfatase Alcalina Segregada (SEAP) está sob o controlo do promotor de CMV e o marcador seleccionável de resistência à puromicina (puro) está sob o controlo do promotor de SV40. Flanqueando estes dois genes estão os locais de clonagem múltipla nos quais os elementos STAR podem ser clonados. O plasmideo também têm uma origem de replicação (ori) e um gene de resistência à ampicilina (ampR) para a propagação em Escherichia coli. FIG. 7. STAR6 e STAR49 melhoram a previsibilidade e o rendimento da expressão de transgenes. Foi determinada a expressão de SEAP a partir do promotor de CMV pelas células CHO transfectadas com pSDH-CSP, pSDH-CSP-STAR6 ou pSDH-CSP-STAR49. As construções contendo STAR conferem maior previsibilidade e rendimentos elevados em relação à construção pSDH-CSP sozinha. FIG. 8. STAR6 e STAR8 melhoram a previsibilidade e o rendimento da expressão de transgenes. Foi determinada a expressão de luciferase a partir do promotor CMV pelas células U-2 OS transfectadas com pSDH-CMV, pSDH-CMV-STAR6 ou pSDH-CMV-STAR8. As construções contendo STAR conferem maior previsibilidade e rendimento elevado em relação à construção pSDH-CMV sozinha. FIG. 9. Sequências essenciais mínimas de STAR10 e STAR27. Porções dos elementos STAR foram amplificadas por PCR: o STAR10 foi amplificado com os iniciadores E23 e E12 para produzir o fragmento 10A, E13 e E14 para produzir o fragmento 10B e E15 e E16 para produzir o fragmento 10C. o STAR27 foi amplificado com os iniciadores E17 e E18 para produzir o fragmento 27A, E19 e E20 para produzir o fragmento 27B e E21 e E22 para produzir o fragmento 27C. Estes sub-fragmentos foram clonados no vector pSelect. Depois da transfecção nas células 53
ΕΡ 1 600 510 /PT U-2 OS/Tet-Off/LexA-HPl, o crescimento das culturas na presença de zeocina foi monitorado. As taxas de crescimento variaram de vigoroso (+++) até fraco (+/-), enquanto algumas culturas não sobreviveram ao tratamento com zeocina (-) devido à ausência de actividade STAR no fragmento de ADN testado. FIG. 10. O elemento STAR funciona no contexto do promotor de SV40. pSDHSV40 e pSDH-SV40-STAR6 foram transfectados na linha celular U-2 OS de osteossarcoma humano e a expressão de luciferase foi ensaiada com ou sem a protecção contra o silenciamento do gene pelo STAR6 em clones resistentes à puromicina. FIG. 11. O elemento STAR funciona no contexto do promotor Tet-Off. pSDH-Tet e pSDH-Tet-STAR6 foram transfectados na linha celular U-2 OS de osteossarcoma humano e a expressão de luciferase foi ensaiada com ou sem a protecção contra o silenciamento de genes pelo STAR6 em clones resistentes à puromicina. FIG. 12. Diagrama esquemático da orientação dos elementos STAR conforme são clonados no vector pSelect (painel A), conforme são clonados nos vectores pSDH para preservar a sua orientação nativa (painel B) e conforme são clonados no vector pSDH na orientação oposta (painel C). FIG. 13. Direccionalidade da função STAR66. O elemento STAR66 foi clonado no pSDH-Tet na orientação nativa (STAR66 nativo) ou na orientação oposta (STAR66 oposto) e transfectaram-se em células U-2 OS. A actividade de luciferase foi ensaiada em clones resistentes à puromicina. FIG. 14. Dependência do número de cópias da função STAR. Southern blot de unidades de expressão de luciferase em pSDH-Tet-STARlO, integrado no ADN genómico de U-2 OS. A sonda de ADN de luciferase radioactiva foi usada para detectar a quantidade de ADN transgénico no genoma de cada clone, que foi depois quantificado com um aparelho produtor de fosforimagem. FIG. 15. Dependência do número de cópias da função STAR. O número de cópias de unidades de expressão pSDH-Tet-STARl0 em cada clone foi determinado pela produção de fosforimagem e comparado com a actividade da enzima repórter luciferase 54 ΕΡ 1 600 510 /PT expressa por cada clone. FIG. 16. Ensaios de bloqueio de intensificadores e a intensificadores. Os vectores de expressão de luciferase usados para testar STAR quanto a actividade bloqueadora de intensificadores e intensificadora são mostrados esquematicamente. O local de ligação E-box para a proteína intensificadora E47 está a montante de um local de clonagem para os elementos STAR. A jusante do local de clonagem de STAR está o gene da luciferase sob o controlo de um promotor minimo da fosfatase alcalina humana (mp). Os histogramas indicam os resultados esperados para as três situações experimentais possíveis (ver o texto). Painel A: Ensaio de bloqueio de intensificadores. Painel B: Ensaio de intensificadores. FIG. 17. Ensaio de bloqueio de intensificadores. A expressão de luciferase a partir de um promotor minimo é activada pelo intensificador E47/E-box no vector vazio (vector). A inserção de bloqueadores de intensificadores (scs, HS4) ou elementos STAR (elementos STAR 1, 2, 3, 6, 10, 11, 18 e 27) bloqueiam a activação da luciferase pelo intensificador E47/E-box. FIG. 18. Ensaio de intensificadores. A expressão de luciferase a partir de um promotor minimo é activada pelo intensificador E47/E-box no vector vazio (E47) . A inserção dos elementos scs e HS4 ou vários elementos STAR (STAR 1, 2, 3, 6, 10, 11, 18 e 27) não activa a transcrição do gene repórter. FIG. 19. Conservação da sequência de STAR18 entre ratinho e ser humano. É mostrada a região do genoma humano contendo o STAR18 de 497 pares de bases (caixas pretas); o elemento ocorre entre os genes de homeocaixa HOXD8 e HOXD4 no cromossoma 2 humano. Está alinhada com uma região no cromossoma 2 de ratinho que partilha 72% de identidade de sequência. A região do cromossoma 2 humano imediatamente à esquerda de STAR18 também é altamente conservada relativamente ao cromossoma 2 de ratinho (73% de identidade; caixas cinza); para além desta região, a identidade cai abaixo de 60%. A capacidade destas regiões de ser humano e de ratinho, separadamente ou em combinação, para conferir crescimento em zeocina é indicado: -, sem crescimento; +, crescimento moderado; ++, crescimento vigoroso; +++, crescimento rápido. 55
ΕΡ 1 600 510 /PT FIGURA 20
Sequências que compreendem STAR6 - STAR65 (SEQ ID: 1 - 65) Referências
Altschul, S.F. e Gish, W. (1996) Local alignment statistics. Methods Enzymol, 266, 460-480.
Altschul, S.F., Gish, W., Miller, W., Myers, E.W. e Lipman, D.J. (1990) Basic local alignment search tool. J Mol Biol, 215, 403-410.
Bell, AC, West, AG, e Felsenfeld, G. (2001) Insulators and boundaries: versatile regulatory elements in the eukaryotic genome Science 291, 447-50.
Bennett, R.P., Cox, C.A. e Hoeffler, J.P. (1998) Fusion of green fluorescent protein with the Zeocin-resistance marker allows visual screening and drug selection of transfected eukaryotic cells. Biotechniques, 24,478-482.
Berger, J, Hauber, j, Hauber, R, Geiger, R, e Cullen, BR. (1988) Secreted placental alkaline phosphatase: a powerful new quantitative indicator of gene expression in eukaryotic cells Gene 66, 1-10.
Bierhuizen, M.F., Westerman, Y., Visser, T.P., Wognum, A.W. e Wagemaker, G. (1997) Green fluorescent protein variants as markers of retroviral-mediated gene transfer in primary hematopoietic cells and cell lines. Biochem Biophys Res Commun, 234, 371-375.
Boivin, A, e Dura, JM. (1998) In vivo chromatin accessibility correlates with gene silencing in Drosophila Genetics 150, 1539-49.
Boshart, M, Weber, F, Jahn, G, Dorsch-Hasler, K, Fleckenstein, B, e Schaffner, W. (1985) A very strong enhancer is located upstream of an immediate early gene of human cytomegalovirus Cell 41, 521-30.
Bunker, C.A. e Kingston, R.E. (1994) Transcriptional repression by Drosophila and mammalian Polycomb group proteins in transfected mammalian cells. Mol Cell Biol, 14, 1721-1732. 56
ΕΡ 1 600 510 /PT
Cherry, J.R., Lamsa, M.H., Schneider, P., Vind, J., Svendsen, A., Jones, A. e Pedersen, A.H. (1999) Directed evolution of a fungai peroxidase. Nat Biotechnol, 17, 379-384.
Chung, JH, Whiteley, M, e Felsenfeld, G. (1993) A 5' element of the chicken beta-globin domain serves as an insulator in human erythroid cells and protects against position effect in Drosophila Cell 74, 505-14.
Deuschle, U, Meyer, WK, e Thiesen, HJ. (1995) Tetracycline-reversible silencing of eukaryotic promoters Mol Cell Biol 15, 1907-14.
Doll, R.F., Crandall, J.E., Dyer, C.A., Aucoin, J.M. e Smith, F.I. (1996) Comparison of promoter strengths on gene delivery into mammalian brain cells using AAV vectors. Gene Ther, 3, 437-447.
Feng, Y.Q., Seibler, j., Alami, R., Eisen, A., Westerman, K.A., Leboulch, P., Fiering, S. e Bouhassira, E.E. (1999) Site-specific chromosomal integration in mammalian cells: highly efficient CRE recombinase-mediated cassette exchange. J Mol Biol, 292, 779-785.
Foecking, MK, e Hofstetter, H. (1986) Powerful and versatile enhancer-promoter unit for mammalian expression vectors Gene 45, 101-5.
Garrick, D, Fiering, S, Martin, Dl, e Whitelaw, E. (1998) Repeat-induced gene silencing in mammals Nat Genet 18, 56-9.
Gaszner, M., Vazquez, J. e Schedl, P. (1999) The Zw5 protein, a component of the scs chromatin domain boundary, is able to block enhancer-promoter interaction. Genes Dev, 13, 2098-2107.
Gerasimova, T.l. e Corces, V.G. (1998) Polycomb and trithorax group proteins mediate the function of a chromatin insulator. Cell, 92, 511-521.
Gerasimova, TI, e Corces, VG. (2001) Chromatin insulators and boundaries: effects on transcription and nuclear organization Annu Rev Genet 35, 193-208. 57
ΕΡ 1 600 510 /PT
Gossen, M. e Bujard, H. (1992) Tight control of gene expression in mammalian cells by tetracycline-responsive promoters. Proc Natl Acad Sei USA, 89, 5547-5551.
Graham, F.L. e van der Eb, A.J. (1973) Transformation of rat cells by DNA of human adenovirus 5. Virology, 54, 536-539.
Heldin, C.H., Johnsson, A., Wennergren, S., Wernstedt, C., Betsholtz, C. e Westermark, B. (1986) A human osteosarcoma cell line secretes a growth factor structurally related to a homodimer of PDGF A-chairis. Nature, 319, 511-514.
Henke, E. e Bornscheuer, U.T. (1999) Directed evolution of an esterase from Pseudomonas fluorescens. Random mutagenesis by error-prone PCR or a mutator strain and Identification of mutants showing enhanced enantioselectivity by a resorufin-based fluorescence assay. Biol Chem, 380, 1029-1033.
Henthorn, P, Zervos, P, Raducha, M, Harris, H, e Kadesch, T. (1988) Expression of a human placental alkaline phosphatase gene in transfected cells: use as a repórter for studies of gene expression Proc Natl Acad Sei USA 85, 6342-6.
Higgins, D.G., Thompson, J.D. e Gibson, T.J. (1996) Using CLUSTAL for multiple sequence alignments. Methods Enzymol, 266, 383-402.
Himes, S.R. e Shannon, M.F. (2000) Assays for transcriptional activity based on the luciferase repórter gene. Methods Mol Biol, 130, 165-174.
Izumi, M, e Gilbert, DM. (1999) Homogeneous tetracycline-regulatable gene expression in mammalian fibroblasts J Cell Biochem 76, 280-9.
Jung, R., Soondrum, K. e Neumaier, M. (2000) Quantitative PCR. Clin Chem Lab Med, 38, 833-836.
Kain, SR. (1997) Use of secreted alkaline phosphatase as a repórter of gene expression in mammalian cells Methods Mol Biol 63, 49-60.
Kao, F.T. e Puck, T.T. (1968) Genetics of somatic mammalian cells, VII. Induction and isolation of nutritional 58 ΕΡ 1 600 510 /PT mutants in Chinese hamster cells. Proc Natl Acad Sei USA, 60, 1275-81.
Kellum, R. e Schedl, P. (1992) A group of ses elements function as domain boundaries in an enhancer-blocking assay. Mol Cell Biol, 12, 2424-2431.
Kent, WJ. (2002) BLAT—the BLAST-like alignment tool Genome Res 12,656-64.
Knofler, M, Meinhardt, G, Bauer, S, Loregger, T, Vasicek, R, Bloor, DJ, Kimber, SJ, e Husslein, P. (2002) Human Handl basic helix-loop-helix (bHLH) protein: extra-embryonic expression pattern, interaction partners and Identification of its transcriptional repressor domains Biochem J 361, 641-51.
Li, W-H (1997) Molecular Evolution, Sinauer Associates, Sunderland MA., Meinke, DW, Cherry, JM, Dean, C, Rounsley, SD, e Koornneef, M. (1998) Arabidopsis thaliana: a model plant for genome analysis Science 282, 662, 679-82.
Litt, M.D., Simpson, M., Recillas-Targa, F., Prioleau, M.N. e Felsenfeld, G. (2001) Transitions in histone acetylation reveal boundaries of three separately regulated neighboring loci. EMBO J, 20, 2224-2235.
Morgenstern, J.P. e Land, H. (1990) Advanced mammalian gene transfer: high titre retroviral vectors with multiple drug selection markers and a complementary helper-free packaging cell line. Nucleic Acids Res, 18, 3587-3596.
Nan, X., Javier Campoy, F., e Bird A. (1997) MeCP2 is a transcriptional repressor with abundant binding sites in genomic chromatin. Cell 88, 471-481.
Petersson, K, Ivars, F, e Sigvardsson, M. (2002) The pT alpha promoter and enhancer are direct targets for transactivation by E box-binding proteins Eur J Immunol 32, 911-20.
Pazin, M.J. e Kadonaga, J.T. (1998) Transcriptional and structural analysis of chromatin assembled in vitro. In Gould, H. (ed.) Chromatin: A Practical Approach. Oxford University Press, Oxford, pp. 172-194. 59
ΕΡ 1 600 510 /PT
Quong, MW, Romanow, WJ, e Murre, C. (2002) E protein function in lymphocyte development Annu Rev Immunol 20, 301-22.
Ruezinsky, D, Beckmann, H, e Kadesch, T. (1991) Modulation of the IgH enhancer's cell type specificity through a genetic switch Genes Dev 5, 29-37.
Saluz, H.P. e Jost, J.P. (1993) Approaches to characterize protein-DNA interactions in vivo. Crit Rev Eukaryot Gene Expr, 3, 1-29.
Sambrook, j., Fritsch, E.F. e Maniatis, T. (1989) Molecular Cloning: A Laboratory Manual. Cold Spring Harbor Laboratory Press, Plainview NY.
Sanger, F., Nicklen, S. e Coulson, A.R. (1977) DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sei USA, 74, 5463-5467.
Simizu, B., Rhim, J.S. e Wiebenga, N.H. (1967) Characterization of the Tacaribe group of arboviruses. I. Propagation and plaque assay of Tacaribe virus in a line of African green monkey kidney cells (Vero). Proc Soc Exp Biol Med, 125, 119-123.
Smith, R.L., Traul, D.L., Schaack, J., Clayton, G.H., Staley, K.J. e wilcox, C.L. (2000) Characterization of promoter function and cell-type-specific expression from virai vectors in the nervous System. J Virol, 74, 11254-11261.
Stull, R.A., Hyun, W.C. e Pallavicini, M.G. (2000) Simultaneous flow cytometric analyses of enhanced green and yellow fluorescent proteins and cell surface antigens in doubly transduced immature hematopoietic cell populations. Cytometry, 40, 126-134.
Takada, T., lida, K., Akasaka, K., Yasue, H., Torii, R., Tsujimoto, G., Taira, M. e Kimura, H. (2000) Evaluation of heterologous insulator function with regard to chromosomal position effect in the mouse blastocyst and fetus. Mol Reprod Dev, 57, 232-237.
Tanaka, S., Livingstone-Zatchej, M. e Thoma, F. (1996) Chromatin structure of the yeast URA3 gene at high resolution 60 ΕΡ 1 600 510 /PT provides insight into structure and positioning of nucleosomes in the chromosomal context. J Mol Biol, 257, 919-934.
Thomas, J.O. (1998) Isolation and fractionation of chromatin and linker histones. In Gould, H. (ed.) Chromatin: A Practical Approach. Oxford University Press, Oxford, pp. 1-34.
Umana, P, Jean-Mairet, J, e Bailey, JE. (1999) Tetracycline-regulated overexpression of glycosyltransferases in Chinese hamster ovary cells Biotechnol Bioeng 65, 542-9. van der Vlag, J., den Blaauwen, J.L., Sewalt, R.G., van Driel, R. e Otte, A.P. (2000) Transcriptional repression mediated by polycomb group proteins and other chromatin-associated repressors is selectively blocked by insulators. J Biol Chem, 275, 697-704.
Wallrath, L.L., Swede, M.J. e Elgin, S.C.R. (1998) Mapping chromatin structure in Drosophila. In Gould, H. (ed.) Chromatin: A Practical Approach. Oxford University Press, Oxford, pp. 59-77.
Weaver, L.S. e Kadan, M.J. (2000) Evaluation of adenoviral vectors by flow cytometry. Methods, 21, 297-312.
Wigler, M, Pellicer, A., Silverstein, S. e Axel, R. (1978) . Biochemical transfer of single-copy eukaryotic genes using total cellular DNA as donor. Cell 14, 725-731.
Wigley, P., Becker, C., Beltrame, J., Blake, T., Crocker, L., Harrison, S., Lyons, I., McKenzie, Z., Tearle, R., Crawford, R. e et al. (1994) Site-specific transgene insertion: an approach. Reprod Fértil Dev, 6, 585-588.
Xu, Z.Z., Krougliak, V., Prevec, L., Graham, F.L. e Both, G.W. (1995) Investigation of promoter function in human and animal cells infected with human recombinant adenovirus expressing rotavirus antigen VP7sc. J Gen Virol, 76, 1971-1980 .
Yang, TT, Sinai, P, Kitts, PA, e Kain, SR. (1997) Quantification of gene expression with a secreted alkaline phosphatase repórter system Biotechniques 23, 1110-4. 61
ΕΡ 1 600 510 /PT
Zink, D, e Paro, R. (1995) Drosophila Polycomb-group regulated chromatin inhibits the accessibility of a trans-activator to its target DNA Embo J 14, 5660-71.
Tabela 1. Os elementos STAR melhoram a expressão transgénica. Plasmídeo Clones Super-expressores, % Números de vezes de super-expressão (gama) Número de clones Vazio 12 3-11 25 SCS (controlo positivo) 24 3-160 21 STAR-6 62 2-200 26 STAR-3 39 5-820 23 STAR-8 63 7-315 19 STAR-4 31 25-1500 13 STAR-1 57 5-80 23 A expressão do gene repórter da luciferase é medida em linhas celulares contendo plasmídeos pSDH integrados, sem ("vazio," o controlo negativo) ou contendo elementos STAR (incluindo o elemento de controlo positivo, SCS de Drosófila) . O nível de expressão médio do controlo negativo é definido como o nível de referência e clones são considerados super-expressores se seu nível de expressão é >2 vezes acima do nível de referência. A percentagem de clones super-expressores para cada plasmídeo e o número de vezes de super-expressão são relatados, juntamente com o número de clones analisados para cada plasmídeo. 62
ΕΡ 1 600 510 /PT
Tabela 2. Elemento STAR clonado.
Clone Localização Cromossómica1 Genes Adjacentes2 Sequência de repetição STAR-1 N.d. STAR-2 N.d. STAR-3 Para 5q33.3 Rev 10g22.2 Parte ChrlO em Histona. Gene da acetiltransferase STAR-4 Para lp31.1 Rev 14g24.1 Nenhum gene no intrão de 10 kb do Regulador da sinalização da proteína G 83% repetitivo LINE2 & LTR ERV_Classel STAR-5 Para 3ql3.1 Rev 10q22.11 STAR-6 2p21 L5 kb guinase putativa desconhecida R 20 kb Proteína associada a microtúbulos 19% SINE (MIR) 29% LINE STAR-7 lq32.2 12% Alu 4% MIR (SINE) LINE1 2,5% L31CRI 11,5% MER1 7% complexo baixo 2% STAR-8 9q32 ZFP KRAB box contendo Proteína de dedo de zinco 35% ERV_ClasseI (LTR) 2% repetição simples STAR-9 Ver STAR4 STAR-10 N.d. STAR-11 2p25.1 R 15 kb Inibidor da proteína de ligação a ADN desconhecido (tipo Myc) 12% Alu (SINE) 26% MalRs (LINE) STAR-12 5g35.3 Metaloproteinase da família ADAM TS2 desconhecido de R 15 kb 3% de complexidade baixa STAR-13 Ver STAR4 e 9 STAR-14 F N.d. R 20ql3.33 STAR-15 lp36.36 L 6 kb Subunidade do canal K Voltage-gated R 4 kb desconhecido 14% LTR (MaLR) STAR-16 F 8p23.1 R 8p22 etc. Nenhuma repetição nas partes sequenciadas STAR-17 2g31.1 L 6 kb factor de transcrição BTEB1 R 40 kb HNRNP 10% de complexidade simples e baixa 1 A localização cromossómica é determinada por pesquisa BLAST de dados de sequências de ADN a partir de clones STAR contra a base de dados do genoma humano. A localização é dada de acordo com a nomenclatura padrão que se refere ao ideograma citogenético de cada cromossoma; e.g. Ip2.3 é a terceira sub-banda citogenética da segunda banda citogenética do braço curto do cromossoma 1 (http://www.ncbi.nlm.nih.gov/Class/MLACourse/ Genetics/chrombanding.html). F, resultado de reacção de seguenciamento directa; R, resultado de reacção de sequenciamento inversa. N.d., ainda não determinado. 2Com base em Human Genome Map View Build 22 (http://www.ncbi.nlm.nih.gov/cgi-bin/Entrez/hum_srch?chr=hum_chr.inf&query Abril 2001) . L, esquerda; R, direita. 1Posição ambígua, diversos acertos 63
ΕΡ 1 600 510 /PT
Tabela 4: Sequência de vários elementos STAR numa cadeia (directo) ou na cadeia oposta (inverso). STAR3 directo acgtnctaagnaâaccattattatcatgacattaacctataamatacígcgta tcacoaggccctttcgtcttcactcgagcggccagcttggatctcgagtactga
AAtAGGAGTAAATCTGAAGAGCAAATAAGATGAGCCAGAAAACCATGAAAAG aacagggactaccagttgattccacaaggacattcccaaggtgagaaggccat
ATACCTCCACTACCTGAACCAATTCTCTGTATGCAGATTrAGCAAGGlTATAAG gtagcaaaagattagacccaagaaaatagagaacttccaatccagtaaaaat catagcaaatttattgatgataacaattgtctccaaaggaaccaggcagagtc gtgctagcagaggaagcacgtgagctgaaaacagccaaatctgctttgttttc
ATGACACAGGAGCAi-AAAGTACACACCACCAACTGACCTATTAAGGCTGTGGT aaaccgattcatagagagaggttctaaatacattggtccctcataggcâaacc
GCAGTTCACTCCGâACGTAGTCCCTGGAAATTTGATGTCCAGNATAGAAAAGC
AMAGGAGNCNNNNNNTATANATNNNGNTGANCC.ANATGN1'HNCTGNKC STAR3 inverso GAGCTAGCGGCGCGCCAAGCTTGGATCCCGCCCCGCCCCCTCCGCCCTCGAGC CCCGGCC CTT GCCCTAG AG GCCCTGCCGAGOGOC C O G G CCTGTCCCTCCTCCC CTTTCCCCCGCCCCCT ACC GíCACGCT C AGGGGC A G CCTGACCCCGAGCGGCC ccgcggtgacccicccgcagaggcctgtgggaggggcgtcgcaagcccctgaa tccccccccgtctgttcccccctcccgcccagtctcctccccotgggaacgcgc
GGGGTGGGIGACAGACCTGGCTGCGCGCCACCGCCACCGCGCCTGCCGGGGGC GCTGCCGCrGCCTGAGAAACTGCGGCTGCCGCCT€3GAGGAG0TGCCGTCGCCT CCGCCACCGCTOCCGCCGCCGCCAGGGGTAGGAGCTAAGCCGCCGCCATTTrG TGTCCCCCTGTTGlTGTCG'rrGACÂTGAATCCGÂCATGACACTGA'rTACAGCCC A ATGGAGT CTC ATT AA AC CC G AGT CG CGGTCCCGCCCCGCCGCrGCT CC ATT G GAGGAG ACC A A A G AC A .CTT AAGGC C.A.CCCGT'Í'GGC CTACGGGT CT GT CT GT CA cccactcactaaccactctgcagcccattggggcaggttcctgccggtcatntc gcttccaataaacacaccccttcgaccccainattcccccccttcgggaaccac ccccgggggaggggtccactggncaataccaattnaanagaaccgctngggt ccgcctntttncgggcnccctattgggtt 64
ΕΡ 1 600 510 /PT STAR4 directo
GGGGAGGATTCmTGGCTGCTGAGTTGAGÀTTAGGTrGAGGGTAGTGAAGGT aaaggcagtgagaccacgtaggggtcattgcagtaatccaggctggagatgat GGTGGTTCAGTTGGAATAGCAGTGCATGTGeTGTAACAACCTCAGCTGGGAAÔ
CAGTATATGTGGCGTTATGACCTCAGCTGGAACAGCAATGCATGTGGTGGTGT aatgaccccagctgggtagggtgcatgtgatggaacaacctcagctgggtagc
A GT GTACTT GAT AAAAT GTT GG C AT ACTCT ACATTT GTT ATG AGGGT AGTG CC A
TTAAATÍTCTCCACAAATTGGTTGTCACGTATGAGTGAAAAGAGGAAGTGATG
GAAGACTTCAGTGCíTfTGGCCIGAATAAATAGAAGACGTCAmTCAGTAATG GAGACAGGGAAGACTAANGNAGGGTGGATTCAGTAGAGCAGGIGTTCAGTlTr
GAATATGATGAACTCTGAGAGAGGAAAAACTrnTCTACCTCrrAGTTrrTGNG
N CTGG ACTTAΑΝ ATT AAAGGACAT ANG ACN G AG ANC AG AC C ΑΑΑΓΝΠΓGGG AN
GTTJTTAT ATTTT ACTT GCNGAGGGAATTTNC AAGAAAAAGãAGACCCAAN AN
CCATTGGTCA.AAACTA1KTGCCTTTTAAHAAAAAGANAATTACAATGGANANA
NAAGTGTTGNCTNGGCAAAAATTGGG STAR4 inverso
GGATTNGAGCTAGCGGCGCGCCAAGCTXGGATCTTAGAAGGACAGAGTGGGG
CATGGAAATGCACCACCAGGGCAGTGCAGCTTGGTCACTGCCAGCTCCNCTCA
TGGGCAGAGGGCTGGCCTCTrGCAGCCGACCAGGCACTGAGCGCCATCCCAGG gccctcgccagccctcagcagggccaggacacacaagcctttgacttcctcct
GTCACTGCrGCTGCCATTCCTGTTTTGTGGTCATCACTCCTTCCCTGTCCtCAGA ctgcccagcactcaaggatgtcctgtggtggcatcagaccatatgcccctgaa
NAGGAGTGAGTTGGTGil"mTGCCGCGCCCANAGAGCTGCTGTCCCCrGAAA
GATGCAAGTGGGAATGATGATGNTCACCATCNTCTGACACCAAGCCCTrrGGA
TAGAGGCCCCAÀCAGTGAGGATGGGGCTGÇACTGCATTGCCAAGGCAACTCTQ tnntgactgctacangacantcccacgacctgngaagnnctaianatntgatg
CNAGGCACCT 65
ΕΡ 1 600 510 /PT STAR6 directo
CCaCC A C AGàCATCCCCT CT GGCCT CCT G AGI GOlTT CTT CAGCACAG CTTCC A
G AGCCAAATTAAACGTTCACTCTAT GTCT ATAG ACAAAAAGGGTTTTG ACT AA
A CT CT GT GTTTT AG AGAGGG AGTTAAATGCT GTí AACTTTTTAGGGGTGG GCGA
GAGGAATGACAAATAACAACTTGTCTGAATGTTTFACATTTCTCCCCACTGCCT
CAAGAAGGrrCACAACGAGGTCATCCATGATAAGGAGTAAGACCTCCCAGCCG
GACTGTCCCTCGGCCCCCAGAGGACACTCCACAGAGATATGCTAACTGGACTT
GGAGACTGGCTCACACTCCAGAGAAAAGCATGGAGCACGAGCGCACAGAGCA
NGGGCCAAGGTCCCAGGGACNGAATGTCTAGGAGGGAGATTGGGGTGAGGGT antctgatgcaattactgngcagctcaacattcaagggaggggaagaaaoaa
ACNGTCCCTGTAAGTAAGTrGTNCANCAGAGATGGTAAGCTCCAAATTTNAAC tttggctgctggaaagtttnngggccnananaanaaacanaaanatttgaggt ttanacccactaacccntâtnantanttattaatacccctaattanaccttgga
TANCCTTAAAATAT^TNTNAAACGGAA€CCTCNTTCC€NT1TN>,TAAATNNÍ^A
AAGGCCATTNNGNKGNAGTAAAAATCTNNNTTAAGNNNTGGGCCCNAACAAA
CNTNTTCCMAGACACNTTTTTTNTCCNGGNATTFNTAATTrATTTCTAANCC STAR6 inverso
ATCGTGTCCTTTCCAGGGACATGGATGAAGCTGGAAGCCATCATCCTCAGCAA
ACTAACACAGGAACAGAAAACCAAATACCACATGTTCTCACTCATAAGTGGGA
gctgaacagtgagaacacatggacacagggaggggaacatcacacaccaagg cctgtctggtgtggggaggggagggagagcatcaggacaaatagctaatgca tgtggggcttaaacctagatgacgggttgataggtgcagcaatccactatgga C AC ΑΤΑΤ ACCT ATGTAAC AACCCN ACCTTNTTG AC AT GT ÁT CCC AGAACTT AAA ggaaaataaaaattaaaaaaaattnccctggaataaaaaagagtgtggactt tggtgagatn 66
ΕΡ 1 600 510 /PT STAR8 directo
GGATCACCTCGAAGAGAGTCTAACGTCCGTAGGAACGCTCTCGGGTTCACAAG
GATTGACCGAACCCCAGGATACGTCGCTCTCCATCTGAGGCTTGNTCCAAATG
GCCCTCCACTATTCCAGGCACGTGGGTGTCTCCCCTAACTCTCCCTGCTCTCCT
GAGCCCATGCTGCCTAICACCCATCGGTGCAGGTCCTTTCTGAANAGCTCGGGT
GGATrCTCTCCATCCCACTTCCTTTCCCAAGAAAGAAGCCACCGTTCCAAGACA cccaatgggacattcccnttccacctccttntcnaaagtthgcccaggtgttcn
TAACAGGTOGGGAGAGAANCCCCCAGGTTTHAGTTNCAAGGCATAGGACGCT
GGCT1GAACACACACACACNCTC STAR8 inverso
GGATCCCGACTCTGCACCGCAAACTCTACGGCGCCCTGCAGGACGGCGGCCTC
CTGCCGCTTGGACGCCAGNCAGGAGCTCCCCGGCAGCAGCAGAGCAGAAAGA
AGGATGGCCCCGCCCCACTTCGCCTCCCGGCGGTCTCCCTCCCGCCGGCTCACG
GACATAGATGGCTGCCTAGCTCCGGAAGCCTAGCTCTTGTTCCGGGCATCCTA
AGGAAGACACGGTTTTTCCTCCCGGGGCCTCACCACATCTGGGACTTTGACGA
CTCGGACCTCrCTCCATTGAATGGTTGCGCGTTCTCTGGGAAAG STAR18 directo
TGGATCCTGCCGCTCGCGTCTTAGTGTTTCTCCCTCAAGACTTTCCTTCIGTTrT
GTTGTCTTGTGCAGTATnTACAGCCCCTCTTGTGTTTTTCTTTATrTCTCGTAC
ACACACGCAGTmAAGGGTGATGTGTGTATAATTAAAAGGACCCTTGGCCCA
TACTTTCCTAATTCTTT ÁGGGACT GGGATTGGGTTTG ACTGAAAT ÀTGTTTTGG
TGGGGATGGGACGGTGGACTrCCATTCTCCCTAAACTGGAGITTTGGICGGTAA
TCAAAACTAAAAGAAACCTCTGGGAGACTGGAAACCTGATTGGAGCACTGAG gaacaagggaatgaaaaggcagactctctgaacgtttgatgaaatggactctt
GTGAAAATTAACAGTGAATATTCACTGTTGCACTGTACGAAGTCTCTGAAATGT
AATTAAAAGTTTTTÀTIGÁGCCCCCGAGCTTTGGCTTGCGCGTATnTTCCGGT
CGCGGACATCCCACCGCGCAGAGCCICGCCTCCCCGCTGNCCTCAGCTCCGAT
GACTTCCCCGCCCCCGCCCTGCTCGGTGACAGACGTTCTACTGCTTCCAATCGG
AGGCACCCTTCGCGG 67
ΕΡ 1 600 510 /PT STAR18 inverso
TGGATCCTGCCGCTCGCGTdTAGTGTTTCTCCCTCAAGACTTTCCTTCTGTTTT
GTTGTCTTGTGCAGTATTTTACAGCCCCTCTTGTGTTTTTCrrTATrTCTCGTAC
GTGAAAATTAACAGTGAATATTCACTGTTGCACTGTACGAAGTCTCTGAAATGT AATTAAAAGTTTTT ATTG AGCCCCCGAGCTTTGGC
Tabela 5. Oligonucleótidos usados para as reacções em cadeia
com polimerase (iniciadores de PCR) ou mutagénese de ADN
Número Sequência C65 AACAAGCTTGATATCAGATCTGCTAGCTTGGTCGAGCTGATACTTCCC C66 AAACTCGAGCGGCCGCGAATTCGTCGACTTTACCACTCCCTATCAGTGATAGAG C67 AAACCGCGGCATGGAAGACGCCAAAAACATAAAGAAAGG C68 TATGGATCCTAGAATTACACGGCGATCTTTCC C81 AAACCATGGCCGAGTACAAGCCCACGGTGCGCC C82 AAATCTAGATCAGGCACCGGGCTTGCGGGTCATGC C85 CATTTCCCCGAAAAGTGCCACC D30 TCACTGCTAGCGAGTGGTAAACTC D41 GAAGTCGACGAGGCAGGCAGAAGTATGC D42 GAGCCGCGGTTTAGTTCCTCACCTTGTCG D51 TCTGGAAGCTTTGCTGAAGAAAC D89 GGGCAAGATGTCGTAGTCAGG D90 AGGCCCATGGTCACCTCCATCGCTACTGTG D91 CTAATCACTCACTGTGTAAT D93 AATTACAGGCGCGCC D94 AATTGGCGCGCCTGT D95 TGCTTTGCATACTTCTGCCTGCCTC E12 TAGGGGGGATCCAAATGTTC E13 C C TAAAAGAAGATC T T TAG C E14 AAGTGTTGGATCCACTTTGG E15 T T T GAAGATC TAC CAAAT G G E16 GTTCGGGATCCACCTGGCCG 68
ΕΡ 1 600 510 /PT
Número Sequência E17 TAGGCAAGATCTTGGCCCTC E18 CCTCTCTAGGGATCCGACCC E19 C TAGAGAGATC T T C CAGTAT E20 AGAGTTCCGGATCCGCCTGG E21 CCAGGCAGACTCGGAACTCT E22 TGGTGAAACCGGATCCCTAC E23 AGGTCAGGAGATCTAGACCA E25 CCATTTTCGCTTCCTTAGCTCC E42 CGATGTAACCCACTCGTGCACC E57 AGAGATCTAG GATAAT T T C G E92 AGGCGCTAGCACGCGTTCTACTCTTTTCCTACTCTG E93 GATCAAGCTTACGCGTCTAAAGGCATTTTATATAG E94 AGGCGCTAGCACGCGTTCAGAGTTAGTGATCCAGG E95 GATCAAGCTTACGCGTCAGTAAAGGTTTCGTATGG E96 AGGCGCTAGCACGCGTTCTACTCTTTCATTACTCTG E97 CGAGGAAGCTGGAGAAGGAGAAGCTG E98 CAAGGGCCGCAGCTTACACATGTTC D58 CCAAGTTGACCAGTGCC D80 GTTCGTGGACACGACCTCCG D70 TACAAGCCAACCACGGCCT D71 CGGAAGTGCTTGACATTGGG
Tabela 6: Elementos STAR da invenção, incluindo a localização genómica e comprimento STAR Localização1 Comprimento2 1 2q31.1 750 2 7pl5.2 916 33 15qll.2 e 10q22.2 2132 4 1ρ31.1 e 14q24.1 1625 54 20ql3.32 1571 6 2p21 1173 7 lq34 2101 8 9q32 1839 94 10pl5.3 1936 10 Xpll.3 1167 69
ΕΡ 1 600 510 /PT ST AR Localização1 Comprimento2 11 2p25.1 1377 12 5q35.3 1051 134 9q34.3 1291 144 22qll.22 732 15 lp36.31 1881 16 lp21.2 1282 17 2q31.1 793 18 2q31.3 497 19 6p22.1 1840 20 8pl3.3 780 21 6q24.2 620 22 2ql2.2 1380 23 6p22.1 1246 24 lq21.2 948 255 lq21.3 1067 26 lq21.1 540 27 lq23.1 1520 28 22qll.23 961 29 2ql3.31 2253 30 22ql2.3 1851 31 9q34.11 e 22qll.21 1165 32 21q22.2 771 33 21q22.2 1368 34 9q34.14 755 35 7q22.3 1211 36 21q22.2 1712 37 22qll.23 1331 38 22qll.1 e 22qll.l -1000 39 22q 12.3 2331 40 22q 11.21 1071 41 22qll.21 1144 42 22q 11.1 735 43 14q24.3 1231 44 22qll.1 1591 45 22qll.21 1991 46 22qll.23 1871 47 22qll.21 1082 70
ΕΡ 1 600 510 /PT STAR Localização1 Comprimento2 48 22qll.22 1242 49 Clone aleatório Chr 12, e 3q26.32 1015 50 6p21.31 2361 51 5q21.3 2289 52 7pl5.2 1200 53 Xpll.3 1431 54 4q21.1 981 55 15ql3.1 501 56 inclui 3p25.3 741 57 4q35.2 1371 58 21qll.2 1401 59 Clone aleatório 17 872 60 4pl6.1 e 6q27 2068 61 7pl4.3 e llq25 1482 62 14q24.3 1011 63 22ql3.3 1421 64 17qll.2 1414 65 7q21.11=28.4 1310 6 6 20ql3.33 e 6ql4.1 -2800 :Α localização cromossómica é determinada por pesquisa BLAST de dados de sequências de ADN dos elementos STAR contra a base de dados do genoma humano. A localização é dada de acordo com a nomenclatura padrão com referência ao ideograma citogenético de cada cromossoma; e.g. Ip2.3 é a terceira sub-banda citogenética da segunda banda citogenética do braço curto do cromossoma 1 (http:// www.ncbi.nlm.nih.gov/Class/MLACourse/Genetics/ chrombanding.html). Nos casos onde as reacções de sequenciação directa e inversa identificaram ADN de diferentes loci genéticos, ambos os loci são mostrados. 20s comprimentos precisos são determinados por análise da sequência de ADN; os comprimentos aproximados são determinados por mapeamento de restrição. 3A sequência e a localização de STAR3 foram refinadas desde a montagem das Tabelas 2 e 4. 40s STAR com estes números nas Tabelas 2 e 4 foram rejeitados (a seguir referidos como "oldSTAR5", etc.) e os seus números designados aos elementos STAR mostrados no anexo de sequências de ADN. No caso de oldSTAR5, oldSTARl4 e oldSTAR16, os ADN clonados eram quimeras de mais do que duas localizações cromossómicas; no caso de oldSTAR9 e oldSTAR13, os ADN clonados eram idênticos a STAR4. 5Idêntico a "STAR18" da Tabela 4. 71
ΕΡ 1 600 510 /PT
Tabela 7. Elementos STAR conferem estabilidade ao longo do tempo na expressão de transgenes1
Divisões Expressão de Celulares1 Luciferase2 STAR6 com 42 18 000 puromicina 60 23 000 84 20 000 108 16 000 STAR6 sem 84 12 000 puromicina3 108 15 000 144 12 000 1 0 plasmideo pSDH-Tet-STAR6 foi transfectado em células U-2 OS e os clones foram isolados e cultivados em meio sem doxiciclina como descrito no Exemplo 1. As células foram transferidas para vasos de cultura novos semanalmente a uma diluição de 1:20. 20 número de divisões celulares baseia-se na estimativa de que numa semana a cultura atinge a confluência das células, o que representa ~6 divisões celulares. 2 A luciferase foi ensaiada como descrito no Exemplo 1. 3
Depois de 60 divisões celulares as células foram transferidas a dois vasos de cultura; a um foi fornecido meio de cultura meio que continha puromicina, como nas primeiras 60 divisões celulares e ao segundo foi fornecido meio de cultura sem antibiótico. 72
ΕΡ 1 600 510 /PT
Tabela 8. Elementos STAR Humanos e seus ortólogos e parálogos de ratinho putativos SEQ:ID STAR Humano1 Ratinho2 Similaridade1 1 1 2q31.1 2D 600 pb 69% 2 2 7ql5.2 6B3 909 pb 89% 3 3a 5q33.3 11B2 248 pb 83% 4 3b 10q22.2 14B 1363 pb 89% 2163 pb 86% 5 6 2p21 17E4 437 pb 78% 6 12 5q35.3 llbl.3 796 pb 66% 7 13 9q34.3 2A3 753 pb 77% 8 18 2q31.3 2E1 497 pb 72% 9 36 21q22.2 16C4 166 pb 79% 10 40 22qll.1 6F1 1270 pb 75% 2309 pb 70% 11 50 6p21.31 17B1 1451 pb 72% 2188 pb 80% 3142 pb 64% 12 52 7pl5.2 6B3 1846 pb 74% 2195 pb 71% 13 53 Xpll.3 XA2 364 pb 64% 14 54 4q21.1 5E3 1174 pb 80% 2240 pb 73% 3141 pb 67% 4144 pb 68% 15 61a 7 14.3 6B3 188 pb 68% localização citogenética do elemento STAR no genoma humano. 2Localização citogenética do elemento STAR ortólogo no genoma de ratinho. 1
Comprimento de região(ões) que apresenta(m) elevada similaridade de sequência e percentagem de similaridade. Em alguns casos ocorre mais do que um bloco de elevada similaridade; nestes casos, cada bloco é descrito separadamente. Similaridade <60% não é considerada significativa. 73
ΕΡ 1 600 510 /PT
Listagem de Sequências 0103 EP 01 DIV
LISTAGEM DE SEQUÊNCIAS <110> Chromagenics B.V.
Otte, Arie P.
Arthur, Kruckeberg L. <120> Sequências de ADN possuindo actividade anti-repressora
<130> 0103 EP 01 DIV <150> EP 01202581.3 <151> 2001-07-04 <150> US 60/303,199 <151> 2001-07-05 <160> 1079 <170> Patentln versão 3.1 <210> 1 <211> 749
<212> ADN <213> Sequência Artificial <220> <223> sequência de STAR1 <400> 1 atgcggtggg ggcgcgccag agactcgtgg gatccttggc ttggatgttt ggatctttct 60 gagttgcctg tgccgcgaaa gacaggtaca tttctgatta ggcctgtgaa gcctcctgga 120 ggaccatctc attaagacga tggtattgga gggagagtca cagaaagaac tgtggcccct 180 ccctcactgc aaaacggaag tgattttatt ttaatgggag ttggaatatg tgagggctgc 240 aggaaccagt ctccctcctt cttggttgga aaagctgggg ctggcctcag agacaggttt 300 tttggccccg ctgggctggg cagtctagtc gaccctttgt agactgtgca cacccctaga 360 agagcaacta cccctataca ccaggctggc tcaagtgaaa ggggctctgg gctccagtct 420 ggaaaatctg gtgtcctggg gacctctggt cttgcttctc tcctcccctg cactggctct 480 gggtgcttat ctctgcagaa gcttctcgct agcaaaccca cattcagcgc cctgtagctg 540 aacacagcac aaaaagccct agagatcaaa agcattagta tgggcagttg agcgggaggt 600 gaatatttaa cgcttttgtt catcaataac tcgttggctt tgacctgtct gaacaagtcg 660 agcaataagg tgaaatgcag gtcacagcgt ctaacaaata tgaaaatgtg tatattcacc 720 ccggtctcca gccggcgcgc caggctccc 749 <210> 2 < 211 > 883
< 212 > ADN <213> Sequência Artificial
ΕΡ 1 600 510 /PT <220> <223> sequência de STAR2 < 4 0 0 > 2 gggtgcttcc tgaattcttc cctgagaagg 74 atggtggccg gtaaggtccg tgtaggtggg gtgcggctcc ccaggccccg gcccgtggtg gtggccgctg cccagcggcc cggcaccccc atagtccatg gcgcccgagg cagcgtgggg gaggtgagtt agaccaaaga gggctggccc ggagttgctc atgggctcca catagctgcc ccccacgaag acggggcttc cctgtatgtg tggggtccca tagctgccgt tgccctgcag gccatgagcg tgcgggtcat agtcgggggt gccccctgcg cccgcccctg ccgccgtgta gcgcttctgt gggggtggcg ggggtgcgca gctgggcagg gacgcagggt aggaggcggg gggcagcccg taggtaccct gggggggctt ggagaagggc gggggcgact ggggctcata cgggacgctg ttgaccagcg aatgcataga gttcagatag ccaccggctc cggggggcac ggggctgcga cttggagact ggccccccga tgacgttagc atgcccttgc ccttctgatc ctttttgtac ttcatgcggc gattctggaa ccagatcttg atctggcgct cagtgaggtt cagcagattg gccatctcca cccggcgcgg ccggcacagg tagcggttga agtggaactc tttctccagc tccaccagct gcgcgctcgt gtaggccgtg cgcgcgcgct tggacgaagc ctgccccggc gggctcttgt cgccagcgca gctttcgcct gcgaggacag agagaggaag agcggcgtca ggggctgccg cggccccgcc cagcccctga cccagcccgg cccctccttc caccaggccc caa <210> 3 <211> 2126 < 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR3 <400> 3 atctcgagta ctgaaatagg agtaaatctg aagagcaaat aagatgagcc agaaaaccat gaaaagaaca gggactacca gttgattcca caaggacatt cccaaggtga gaaggccata tacctccact acctgaacca attctctgta tgcagattta gcaaggttat aaggtagcaa aagattagac ccaagaaaat agagaacttc caatccagta aaaatcatag caaatttatt gatgataaca attgtctcca aaggaacaag gcagagtcgt gctagcagag gaagcacgtg agctgaaaac agccaaatct gctttgtttt catgacacag gagcataaag tacacaccac caactgacct attaaggctg tggtaaaccg attcatagag agaggttcta aatacattgg tccctcacag gcaaactgca gttcgctccg aacgtagtcc ctggaaattt gatgtccagt atagaaaagc agagcagtca aaaaatatag ataaagctga accagatgtt gcctgggcaa 540 75
ΕΡ 1 600 510 /PT tgttagcagc accacactta agatataacc tcaggctgtg gactccctcc ctggggagcg 600 gtgctgccgg cggcgggcgg gctccgcaac tccccggctc tctcgcccgc cctcccgttc 660 tcctcgggcg gcggcggggg ccgggactgc gccgctcaca gcggcggctc ttctgcgccc 720 ggcctcggag gcagtggcgg tggcggccat ggcctcctgc gttcgccgat gtcagcattt 780 cgaactgagg gtcatctcct tgggactggt tagacagtgg gtgcagccca cggagggcga 840 gttgaagcag ggtggggtgt cacctccccc aggaagtcca gtgggtcagg gaactccctc 900 ccctagccaa gggaggccgt gagggactgt gcccggtgag agactgtgcc ctgaggaaag 960 gtgcactctg gcccagatac tacacttttc ccacggtctt caaaacccgc agaccaggag 1020 attccctcgg gttcctacac caccaggacc ctgggtttca accacaaaac cgggccattt 1080 gggcagacac ccagctagct gcaagagttg tttttttttt tatactcctg tggcacctgg 1140 aacgccagcg agagagcacc tttcactccc ctggaaaggg ggctgaaggc agggaccttt 1200 agctgcgggc tagggggttt ggggttgagt gggggagggg agagggaaaa ggcctcgtca 1260 ttggcgtcgt ctgcagccaa taaggctacg ctcctctgct gcgagtagac ccaatccttt 1320 cctagaggtg gagggggcgg gtaggtggaa gtagaggtgg cgcggtatct aggagagaga 1380 aaaagggctg gaccaatagg tgcccggaag aggcggaccc agcggtctgt tgattggtat 1440 tggcagtgga ccctcccccg gggtggtgcc ggaggggggg atgatgggtc gaggggtgtg 1500 tttatgtgga agcgagatga ccggcaggaa cctgccccaa tgggctgcag agtggttagt 1560 gagtgggtga cagacagacc cgtaggccaa cgggtggcct taagtgtctt tggtctcctc 1620 caatggagca gcggcggggc gggaccgcga ctcgggttta atgagactcc attgggctgt 1680 aatcagtgtc atgtcggatt catgtcaacg acaacaacag ggggacacaa aatggcggcg 1740 gcttagtcct acccctggcg gcggcggcag cggtggcgga ggcgacggca ctcctccagg 1800 cggcagccgc agtttctcag gcagcggcag cgcccccggc aggcgcggtg gcggtggcgc 1860 gcagccaggt ctgtcaccca ccccgcgcgt tcccaggggg aggagactgg gcgggagggg 1920 ggaacagacg gggggggatt caggggcttg cgacgcccct cccacaggcc tctgcgcgag 1980 ggtcaccgcg gggccgctcg gggtcaggct gcccctgagc gtgacggtag ggggcggggg 2040 aaaggggagg agggacaggc cccgcccctc ggcagggcct ctagggcaag ggggcggggc 2100 tcgaggagcg gaggggggcg gggcgg 2126 <210> 4 <211> 1625
< 212 > ADN <213> Sequência Artificial 76
ΕΡ 1 600 510 /PT <220> <223> sequência de STAR4 <400> 4 gatctgagtc atgttttaag gggaggattc ttttggctgc tgagttgaga ttaggttgag 60 ggtagtgaag gtaaaggcag tgagaccacg taggggtcat tgcagtaatc caggctggag 120 atgatggtgg ttcagttgga atagcagtgc atgtgctgta acaacctcag ctgggaagca 180 gtatatgtgg cgttatgacc tcagctggaa cagcaatgca tgtggtggtg taatgacccc 240 agctgggtag ggtgcatgtg gtgtaacgac ctcagctggg tagcagtgtg tgtgatgtaa 300 caacctcagc tgggtagcag tgtacttgat aaaatgttgg catactctag atttgttatg 360 agggtagtgc cattaaattt ctccacaaat tggttgtcac gtatgagtga aaagaggaag 420 tgatggaaga cttcagtgct tttggcctga ataaatagaa gacgtcattt ccagttaatg 480 gagacaggga agactaaagg tagggtggga ttcagtagag caggtgttca gttttgaata 540 tgatgaactc tgagagagga aaaacttttt ctacctctta gtttttgtga ctggacttaa 600 gaattaaagt gacataagac agagtaacaa gacaaaaata tgcgaggtta tttaatattt 660 ttacttgcag aggggaatct tcaaaagaaa aatgaagacc caaagaagcc attagggtca 720 aaagctcata tgccttttta agtagaaaat gataaatttt aacaatgtga gaagacaaag 780 gtgtttgagc tgagggcaat aaattgtggg acagtgatta agaaatatat gggggaaatg 840 aaatgataag ttattttagt agatttattc ttcatatcta ttttggcttc aacttccagt 900 ctctagtgat aagaatgttc ttctcttcct ggtacagaga gagcaccttt ctcatgggaa 960 attttatgac cttgctgtaa gtagaaaggg gaagatcgat ctcctgtttc ccagcatcag 1020 gatgcaaaca tttccctcca ttccagttct caaccccatg gctgggcctc atggcattcc 1080 agcatcgcta tgagtgcacc tttcctgcag gctgcctcgg gtagctggtg cactgctagg 1140 tcagtctatg tgaccaggag ctgggcctct gggcaatgcc agttggcagc ccccatccct 1200 ccactgctgg gggcctccta tccagaaggg cttggtgtgc agaacgatgg tgcaccatca 1260 tcattcccca cttgccatct ttcaggggac agccagctgc tttgggcgcg gcaaaaaaca 1320 cccaactcac tcctcttcag gggcctctgg tctgatgcca ccacaggaca tccttgagtg 1380 ctgggcagtc tgaggacagg gaaggagtga tgaccacaaa acaggaatgg cagcagcagt 1440 gacaggagga agtcaaaggc ttgtgtgtcc tggccctgct gagggctggc gagggccctg 1500 ggatggcgct cagtgcctgg tcggctgcaa gaggccagcc ctctgcccat gaggggagct 1560 ggcagtgacc aagctgcact gccctggtgg tgcatttcct gccccactct ttccttctaa 1620 gatcc 1625 77
ΕΡ 1 600 510 /PT <210 > 5 <211> 1571
< 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR5 < 4 0 0 > 5 agcagagatc ttatttcccg tattcccttg tggcacagca cctcccacgc caaagcaaac caaagcaaag gagcccttga tgaggagggg ccttccccca acctggtctc ccacaggtcc tacatacgta cccaccccag acacacagag ctgcttcctg ctctcacacc agactgagct gtgcccagac atttccccta gcactaacca actctttcaa aaatacattt ttctctaaaa agaacaagtt taaacaaagt tgactcattt taagaactgt ttagaagata accttgtgtt tattaattat gtatttgcag aaattggagg cagaaggtta ccaacattgc ctggtgtcca gccaggaggt agagcgtggt ggcatccaga accttcctcc aactcctgcc tggcgtggtt tttattcatc tttgtattcc caagaaactt ctcagtgtct caggagtgtt aggcactcag tacgtgtttg gtagttacat gaatgaatgc ataatgacta agtgagttaa tggatgaagc taattgtctc tcccttttgc ttttccagag ctttccaagg tgaaagtgtt ggacactctt tcttcatctc agatttaatc aactaagaat gctgcaaatt gaacaccagt ccacaaaact caggaataca tgaaaagcat tgtgccttat ttttaactaa ctcaaattct atgtcagtct cccttttatg ctggatgttg gcgctaaatc tcagtgggtt cctcattctg ccagacctgt gtccagtttg ggggcttcac atagagccac cccatcacag gagagggaag ggtcttgctc ttggttgcca tcactccacc ctcttgtctt ccgagctttg atgttcactt tccttttcac cactcggaag cttcctgcca tgatacattg agacctcaat gttaatgcca attggggttt ggggttctca taaactcaga agtccaggaa aatcgcctgc tgcctcccac aacactctga gggcattctg gaatcctacc acttacctgg agcctgctgg cctcaactgt tttgaagtct gtgtctgggc catgcaggta aatgggagga tgttctgtgg ccataaaaat acccgaagtc ccacctaaag ttgatgcagg gtcttctgca tttcattgca aaattgttct atcatttcta tagttttcag cctacagtca ggggccagga ctttgcaccc ttggtaaacc tcaatctctt ctccttcctg gcttctactc ctttctccct caatcccaaa tcaaggccct tgattgtctg gaggtaggaa agcctggttc tggctcatga tatagtctac atcatagcct ttgtcatctc atggattcac tcaacaaccg tgtgtggatg gggccaccca atatgtgcca ggagttgagg acacgcaggg ttatgatgat gaaatagata aggggcccac actcacggac cctgcaggac agtggagctg tggacccagc atgcgagtaa agacccagtg agctcaccag acagatcatt 1560 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 78
ΕΡ 1 600 510 /PT taaatcaggt g 1571 < 210 > 6 <211> 1173
< 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR6 <400> 6 tgacccacca cagacatccc ctctggcctc ctgagtggtt tcttcagcac agcttccaga 60 gccaaattaa acgttcactc tatgtctata gacaaaaagg gttttgacta aactctgtgt 120 tttagagagg gagttaaatg ctgttaactt tttaggggtg ggcgagaggg atgacaaata 180 acaacttgtc tgaatgtttt acatttctcc ccactgcctc aagaaggttc acaacgaggt 240 catccatgat aaggagtaag acctcccagc cggactgtcc ctcggccccc agaggacact 300 ccacagagat atgctaactg gacttggaga ctggctcaca ctccagagaa aagcatggag 360 cacgagcgca cagagcaggg ccaaggtccc agggacagaa tgtctaggag ggagattggg 420 gtgagggtaa tctgatgcaa ttactgtggc agctcaacat tcaagggagg gggaagaaag 480 aaacagtccc tgtcaagtaa gttgtgcagc agagatggta agctccaaaa tttgaaactt 540 tggctgctgg aaagttttag ggggcagaga taagaagaca taagagactt tgagggttta 600 ctacacacta gacgctctat gcatttattt atttattatc tcttatttat tactttgtat 660 aactcttata ataatcttat gaaaacggaa accctcatat acccatttta cagatgagaa 720 aagtgacaat tttgagagca tagctaagaa tagctagtaa gtaaaggagc tgggacctaa 780 accaaaccct atctcaccag agtacacact cttttttttt ttccagtgta atttttttta 840 atttttattt tactttaagt tctgggatac atgtgcagaa ggtatggttt gttacatagg 900 tatatgtgtg ccatagtgga ttgctgcacc tatcaacccg tcatctaggt ttaagcccca 960 catgcattag ctatttgtcc tgatgctctc cctcccctcc ccacaccaga caggccttgg 1020 tgtgtgatgt tcccctccct gtgtccatgt gttctcactg ttcagctccc acttatgagt 1080 gagaacgtgt ggtatttggt tttctgttcc tgtgttagtt tgctgaggat gatggcttcc 1140 agcttcatcc atgtccctgc aaaggacacg ate 1173 <210> 7 <211> 2101
< 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR7 79
ΕΡ 1 600 510 /PT <400> 7 atcatgccag cttaggcgac agagtgagac tggacataat aacaataata ataaaaataa 60 ataaataaaa caattatctg agaggaaaaa tttgattcat aataaagaga ataaaggttt 120 ttggcgtgtt tgttttgttt tcacctaaga acagctgttc ccctcattgg gttagtttta 180 tttgcaagca gaaatcatct ccgcatgatt tccagggtga tggaaaactg aatatgaatc 240 caccttctgc catctattca cttgtcacat ttaataagac actcatgcct attttagcat 300 gttttcttcc ctaccaaatg agttagtaac atcaagagat taaaataaca caaataagaa 360 cattgaaggt attcaaatgt tacatacaaa tattaaacac aatattatta taattattcc 420 tggaaatgac attgcctcta ctctcaaggt aaaggtcatt tttcttgatt taaacttttt 480 tctcaagttt gaaatctcta agtttcaacc cgtaatctat ttgcaagttt gtgcaaattt 540 tagggattga atccatagta attagtgatt tattgtggtg tagggagaca agtcaaaaga 600 atcaggactg ctaggtagat gactaaggaa aggatggttc acgaggtgac ataaagcact 660 cagaagaaaa aggtcaggaa acggaggaca gaaaaaaacc taagttctgc tgggtgatgc 720 tgaatttgtc atcacaaaat ctgcattgtg gaagctttag ctattgagga gattgctcaa 780 gtgtagaact gagaacaata ggcagtgaac ccgagagaac atcaagagac tgagagaaaa 840 tgaaccagac ttccaggtgc tccatgttcc aaccaacatt ttgtattgtc agaaggaatt 900 gagaggcaaa aggaaaccca ataaaaaata aaacaggaaa gggcatacat gattaccacc 960 ccttttctca ccagctgctc atggaccagc tttctcctag tgctattttc ttggtcactg 1020 catcactctg ctaacatagt ttccccacta gctctgaggc tgtcccagag gggaagccag 1080 ctgtcatctc cttcttccac actctgttgg aggaacctgt cattagcagc tccctactaa 1140 acgcatttat gacaaacagg caggagataa ttaactagaa agtgaacaaa ctcaaacttc 1200 agagcctctc atttgtatga atgcccttgt aaggtcttgg gcctatttta atatttataa 1260 atgtgttatt ttcttctaaa gaaaaccacc aaattgtata agctacagaa tctgcaaaac 1320 tgaggtccat ccatgcactc aggatacatt catagcatct ctgagctgga aaatatctta 1380 aaggtcatat atgtcctcca acactgcaag aatctctctg gcagcattct tttaaaatca 1440 tcatctaaaa gagggaaatc cccagctgtg tttggatttt gctctgtcac ttgtccagtt 1500 tccccatcca taaaagggca acaatatgaa tttcctgata aggtagttgt taatataaat 1560 acaaagtgcg tagccacttc cctaagaaaa atatggggtt tctgcttcac agtctaggga 1620 gaggaaaaaa aaggggggtc agaagtgatt attattatca ttctatattg gaatgttttc 1680 agacataaaa agctcaccac gtcttaggcc agacagatgc attatgaaag ttaagctaag 1740 1800 tcttcctcat catgagctgc acctatatcc ccattacttc ttctagaact gcataattta 80
ΕΡ 1 600 510 /PT tttattcttt cttcaaaagt ttgagagagc cattcttgtc ctctaagatt tttttttttt 1 tttttggaga cagagtctcc gtctgttgcc caggctggag tgcaatggca ctatctcagc 1 tcactgcaac ctctgcctcc cagattcaag tgattctcct gcctcagcct cccgagtagc 1 tgggattaca agcacgcacc accacaacca gctaattttt cgtatttttt agtagagacg 2 aggttttacc atgttggcca ggctggtctt gaactcctga cctcgggtga tccacccacc 2 t 2
<210> 8 <211> 1821 <212> ADN <213> Sequência Artificial <220> <223> sequência de STAR8 <400> 8 gagatcacct cgaagagagt ctaacgtccg taggaacgct ctcgggttca caaggattga ccgaacccca ggatacgtcg ctctccatct gaggcttgct ccaaatggcc ctccactatt ccaggcacgt gggtgtctcc cctaactctc cctgctctcc tgagcccatg ctgcctatca cccatcggtg caggtccttt ctgaagagct cgggtggatt ctctccatcc cacttccttt cccaagaaag aagccaccgt tccaagacac ccaatgggac attccccttc cacctccttc tccaaagttg cccaggtgtt catcacaggt tagggagaga agcccccagg tttcagttac aaggcatagg acgctggcat gaacacacac acacacacac acacacacac acacacacac acacgactcg aagaggtagc cacaagggtc attaaacact tgacgactgt tttccaaaaa cgtggatgca gttcatccac gccaaagcca agggtgcaaa gcaaacacgg aatggtggag agattccaga ggctcaccaa accctctcag gaatattttc ctgaccctgg gggcagaggt tggaaacatt gaggacattt cttgggacac acggagaagc tgaccgacca ggcattttcc tttccactgc aaatgaccta tggcgggggc atttcacttt cccctgcaaa tcacctatgg cgaggtacct ccccaagccc ccacccccac ttccgcgaat cggcatggct cggcctctat ccgggtgtca ctccaggtag gcttctcaac gctctcggct caaagaagga caatcacagg tccaagccca aagcccacac ctcttccttt tgttataccc acagaagtta gagaaaacgc cacactttga gacaaattaa gagtccttta tttaagccgg cggccaaaga gatggctaac gctcaaaatt ctctgggccc cgaggaaggg gcttgactaa cttctatacc ttggtttagg aaggggaggg gaactcaaat gcggtaattc tacagaagta aaaacatgca ggaatcaaaa gaagcaaatg gttatagaga gataaacagt tttaaaaggc aaatggttac aaaaggcaac ggtaccaggt gcggggctct aaatccttca tgacacttag atataggtgc tatgctggac 1200 81
ΕΡ 1 600 510 /PT acgaactcaa ggctttatgt tgttatctct tcgagaaaaa tcctgggaac ttcatgcact 1 gtttgtgcca gtatcttatc agttgattgg gctcccttga aatgctgagt atctgcttac 1 acaggtcaac tccttgcgga agggggttgg gtaaggagcc cttcgtgtct cgtaaattaa 1 ggggtcgatt ggagtttgtc cagcattccc agctacagag agccttattt acatgagaag 1 caaggctagg tgattaaaga gaccaacagg gaagattcaa agtagcgact tagagtaaaa 1 acaaggttag gcatttcact ttcccagaga acgcgcaaac attcaatggg agagaggtcc 1 cgagtcgtca aagtcccaga tgtggcgagc ccccgggagg aaaaaccgtg tcttccttag 1 gatgcccgga acaagagcta ggcttccgga gctaggcagc catctatgtc cgtgagccgg 1 cgggagggag accgccggga ggcgaagtgg ggcggggcca tccttctttc tgctctgctg 1 ctgccgggga gctcctggct ggcgtccaag cggcaggagg ccgccgtcct gcagggcgcc 1 gtagagtttg cggtgcagag t 1 < 210 > 9 <211> 1929 <212> ADN <213> Sequência Artificial <220> <223> sequência de STAR9 < 4 0 0 > 9 atgagccccc aaaaatgatc ctctggctta tgacaacctg atgcagccca ggaaatgcct gcaacatgcc cactagcagc tgggaacccc tctgtgagga agagaacgtt ttacattaag aaaccctttg ttttgcagca gagactattc aggtcacaca tgtgtggcct ctcagttctt tgagccattt gaagttctct atccttgctg ggaggctgag ctctccatgg aaacctggtc cgatagtgag aggagcagac cctctggaaa caccttttta cacctgacca aagcagccag tcatgggcca gtgatgcaac aaggtcaacc ggtgcattct ggcccctcag aaaagcagcc cccgggaagg tcaggaggag gctgctgact ccctcttccc ctgcagccgc cccaagcaca cccaggagcc ctgcaggttt gggttcacca ggtgccagca ggtcccacga tgctgcattt cttacgagct cctggaggat gcagatggtc ctggtcagag gctgcattct gagtatcagg agccatgggg caacgtttct gcgattgagg aaggggcatt tctggggtgg gcagaacaaa ggtctttggc tgagctggag catccgcctc catcagtgtt ttccggcaac tgtactatcc atcgtcttcc cttcccacag ctgaccatgg ctttggaaaa tgctctgaaa ctttcttttc agaagagttg actcccaact ccacacttag gggaagtcaa gcctacttct cagaattcag agaaggcata aaaaagaatt catttctaaa ggccctttag aagtaacttc aggtctgaca 840 82
ΕΡ 1 600 510 /PT gcggccagct aatttctggt cgccttccag gaatcttctg actgcaaaaa aaaagcattt 900 accacctgaa cacaaaccca gttacagata gaaaaacata gtcatttaaa tagaatataa 960 gcatctggcc tctgcccatc ataatggagt aacacaaaaa tctattttca aaaggaaact 1020 aaatattatt gaccaaaaca tgaatgggga gacctcaggg tgatacagct cttgcctgga 1080 tggaatttgt aatcaagagg atgagacagg attgtaactt gtgccaatgt gaaagggttt 1140 gctcaggtat cattcatttt gcttaaatgc atgggtaatt tccaaagttc tttggagctg 1200 aatttcacaa tttagtgcag gtcctggtga gcccaccttg acttatctca cagtacaatg 1260 cagtggcgtg gctacaatgc tgggcaagag aagccaatgt caacagccca ggagtggctg 1320 ggtccttacc aggctcccag gcatgcttca tggtgggccc tgggctggga ggaacagcac 1380 ctttgcctgg tccatgagta tctgggtcaa actctcctgt ggacacagaa ggccatggcg 1440 acaggcattc ccaggaaaag aaaagggcag cagctgaaat cgtcaggtgg agaaggcagt 1500 catccttgct cagtcaactc taatccggct gcctcctcct cagcttcagg gtgaacctct 1560 cctaagctgt gtctttggta tctgatgggc attaggtgct ggtgaaaaag ctggagggtc 1620 ctttgggata ttacagaagc ccaatctagc cttgtattca atatctaggc actctcaccc 1680 ctgaagttct acgtttccag atttctgaaa acatgggaaa gcatgtgtgt gatgtctgag 1740 gtccccctca gcctctggtg tagggttagg agggctctaa agggtggcag ctccagtgtc 1800 ccagtggggc ctgaagttgg tcccttccct tcccagctcc catccatggt ttagcccaat 1860 cccttccgta cctaagagta ctgcacatgg atgctccacg cagagcctct gctccactcc 1920 caggaagtg <210> 10 <211> 1167 <212> ADN <213> Sequência Artificial <220> <223> sequência de STAR10 <220> <221> misc_feature <222> (452)..(1143) <223> "N" representa qualquer ácido nucleico em várias posições 1929 <400> 10 aggtcaggag ttcaagacca gcctggccaa catggtgaaa ccctgtccct acaaaaaata 60 caaaaattag ccgggcgtgg tggggggcgc ctataatccc agctactcag gatgctgaga 120 caggagaatt gtttgaaccc gggaggtgga ggttgcagtg aactgagatc gcgccactgc 180 actccagcct ggtgacagag agagactccg tctcaacaac agacaaacaa acaaacaaac 240 83
ΕΡ 1 600 510 /PT aacaacaaaa atgtttactg acagctttat tgagataaaa ttcacatgcc ataaaggtca 300 ccttctacag tatacaattc agtggattta gtatgttcac aaagttgtac gttgttcacc 360 atctactcca gaacatttac atcaccccta aaagaagctc tttagcagtc acttctcatt 420 ctccccagcc cctgccaacc acgaatctac tntctgtctc tattctgaat atttcatata 480 aaggagtcct atcatatggg ccttttacgt ctaccttctt tcacttagca tcatgttttt 540 aagattcatc cacagtgtag cacgtgtcag ttaattcatt tcatcttatg gctggataat 600 gctctattgt atgcatatcc ctcactttgc ttatccattc atcaactgat tgacatttgg 660 gttatttcta ctttttgact attatgagta atgctgctat gaacattcct gtaccaatcg 720 ttacgtggac atatgctttc aattctcctg agtatgtaac tagggttgga gttgctgggt 780 catatgttaa ctcagtgttt catttttttg aagaactacc aaatggtttt ccaaagtgga 840 tgcaacactt tacattccca ccagcaagat atgaaggttc caatgtctct acatttttgc 900 caacacttgt gattttcttt tatttattta tttatttatt tatttttgag atggagtctc 960 actctgtcac ccaggctgga gtgcagtggc acaatttcag ctcactgcaa tctccacctc 1020 tcgggctcaa gcgatactcc tgcctcaacc tcccgagtaa ctgggattac aggcgcccac 1080 caccacacca agctaatttt ttgtattttt agtagagacg gggtttcatc atgtcggcca 1140 ggntgtactc gaactctgac ctcaagt 1167 < 210 > 11 <211> 1377
< 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR11 <400> 11 gattctgggt gggtttgatg atctgagagt cccttgaata aaaagaattc tagaaaagct 60 gtgaaacttc acctttcccc tattcttaac cttacttgcc tttgggaggc tgaggcagga 120 ggatgactta aggccaggag tttgagaatg tagtgagcta tgaccacacc ggttacactc 180 aagcctgggc gagaccacaa caaaaacctt acctgccaac tgctccatgc tggaaattta 240 tttcgtttct tggattgtgg aaagaactgg cttactgaaa accacacttc tctaaaaccc 300 ttcttccagt taggtgttaa gattttaaca gcctttccta tctgaataaa aactgcacac 360 aaagtaaact taagagatgt caacaactca tctgtttgtt acaagatgag tctccatgct 420 tcatcgcctg tggggaatcc tcatcagcgt ctagtggcaa agactcctgt gtgctcaccg 480 aaacgctccc cttcctccag ggcacacagt cacatggatt tcccatgcac cctggcagct 540
600 84 ΕΡ 1 600 510 /PT cagcaggagt ccatgactta agaaggccaa tggactgtgg gtgaagtctg tggacgggga agccacatgc gtcacttcca ggcctgggcg tgtgcatcct ccactctctt cccctgtggg tgcagaaggc ggggcagagg gccctgaaac cttggaggtc ggtggagccc aaaatgaagg agcgtgggcc tctgggtctt catgtaaatt taggtaacac tgaactgtca ggtgaacaag aaataaacgt caaatgtatt cagtcgatta gatttggtga tggttgttac agcggttacc ctccctcaac ataataaatt ttcaaacaac tcataatggc tcactcatgt ataaaatatt ccatatgaaa tcccgggata acatgcttat tctagctcaa gcttaatcag agtagtccat ctgagggagg agatagtaga gggcagcaag gggttgtcac tgaagataac tagccttgct aaaagaatgg ttgaagaagt gagctacaga tagggtaaat ccacatctca gacattctgt gatggtcctg atattatcct aaagtaaaat gtagagttga accattttaa ttagattcta gaattctatt aatttataag atgggcattt ccacaaagga ctaaacaaag tacaagagga ttaaataatc atccacatgg gaggcaccgc cttgcacttt aaaatgatgg agcttatcaa gactggctgt ggatatctgt ccctgggagg gttttttccc ccattttttt cctttttgag acatgttctc gctatgttgc ccaggctggt cttgaactcc tgggctcaag tgatcct 660 720 780 840 900 9601020 1080 11401200 1260 1320 1377 < 210 > 12 <211> 1051
<212> ADN <213> Sequência Artificial <220> <223> sequência de STAR12 < 4 0 0 > 12 atcctgcttc tgggaagaga gtggcctccc ttgtgcaggt gactttggca ggaccagcag aaacccaggt ttcctgtcag gaggaagtgc tcagcttatc tctgtgaagg gtcgtgataa ggcacgagga ggcaggggct tgccaggatg ttgcctttct gtgccatatg ggacatctca gcttacgttg ttaagaaata tttggcaaga agatgcacac agaatttctg taacgaatag gatggagttt taagggttac tacgaaaaaa agaaaactac tggagaagag ggaagccaaa caccaccaag tttgaaatcg attttattgg acgaatgtct cactttaaat ttaaatggag tccaacttcc ttttctcacc cagacgtcga gaaggtggca ttcaaaatgt ttacacttgt ttcatctgcc tttttgctaa gtcctggtcc cctacctcct ttccctcact tcacatttgt cgtttcatcg cacacatatg ctcatcttta tatttacata tatataattt ttatatatgg cttgtgaaat atgccagacg agggatgaaa tagtcctgaa aacagctgga aaattatgca acagtgggga gattgggcac atgtacattc tgtactgcaa agttgcacaa cagaccaagt ttgttataag tgaggctggg tggtttttat tttttctcta ggacaacagc ttgcctggtg 60 120 180 240 300 360 420 480 540 600 660 720 85 ΕΡ 1 600 510 /PT gagtaggcct cctgcagaag gcattttctt aggagcctca acttccccaa gaagaggaga 780 gggcgagact ggagttgtgc tggcagcaca gagacaaggg ggcacggcag gactgcagcc 840 tgcagagggg ctggagaagc ggaggctggc acccagtggc cagcgaggcc caggtccaag 900 tccagcgagg tcgaggtcta gagtacagca aggccaaggt ccaaggtcag tgagtctaag 960 gtccatggtc agtgaggctg agacccaggg tccaatgagg ccaaggtcca gagtccagta 1020 aggccgagat ccagggtcca gggaggtcaa g 1051 <210> 13 <211> 1291
<212> ADN <213> Sequência Artificial <220> <223> sequência de STAR13 <400> 13 ctgccctgat cccttaatgc ttttggccca gagcaccccg ctaagtccaa ccccagaggg 60 gcctcatccg caaagcctcg ggaagaggac agtgacggag gcggctgccc tgtgagctgc 120 acggggcaga atgtcctttt ggcgtcatgt tggatgtcca cacatccata tggggtcagt 180 tctattagga ttccttcggg aagaggtaga gggtaggagg ggttaagcca cgagacgagg 240 catgcagagg ggtggcctgg atgggtctgc actgctgtcc atgcacacgg ggagcgttgc 300 aaattgtgct tcccagccca tagtgccccc acagaggagc ccgggagtcc ctggtgggcg 360 tctgtgttcc tgcaaggagc cagtggagat ggccccgtga actctcatcc cccttgcctt 420 ggtggggtct ctggcaggtt tatggagccg tacatctttg ggagccgcct ggaccacgac 480 atcatcgacc tggaacagac agccacgcac ctccagctgg ccttgaactt caccgcccac 540 atggcctacc gcaagggcat catcttgttt ataagccgca accggcagtt ctcgtacctg 600 attgagaaca tggcccgtga ctgtggcgag tacgcccaca ctcgctactt caggggcggc 660 atgctgacca acgcgcgcct cctctttggc cccacggtcc gcctgccgga cctcatcatc 720 ttcctgcaca cgctcaacaa catctttgag ccacacgtgg ccgtgagaga cgcagccaag 780 atgaacatcc ccacagtggg catcgtggac accaactgca acccctgcct catcacctac 840 cctgtacccg gcaatgacga ctctccgctg gctgtgcacc tctactgcag gctcttccag 900 acggccatca cccgggccaa ggagaagcgg cagcaggttg aggctctcta tcgcctgcag 960 ggccagaagg agcccgggga ccaggggcca gcccaccctc ctggggctga catgagccat 1020 tccctgtgat gttcactctc ctcccaaagc aaaccacagc caagcctgtc tgagctggga 1080 gtccccttcc ccagccctgg gtcagcggca tcctcagtcg ttgttactta ctcagctgat 1140 86
ΕΡ 1 600 510 /PT gtcacagtgc agacatccac cgttccacca cagaaccagt ggctgagcgg accaacgttg 1200 ccatgtgcgt ttgctctgtg gggaacagag cacagagggt gagcgacatg tgcagaacgg 1260 ccccttggct gcagttagga cctcagtggc t 1291 <210> 14 <211> 711 < 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR14 <400> 14 agcaaggacc agggctctgc ctccccagtc agcatgagca gagcagactc ctttgagcag 60 agcatcaggg cagaaataga acagtttctg aatgagaaaa gacagcatga gacccaaaaa 120 tgtgatgggt cagtggagaa gaaaccagac acacatgaaa attcggcgaa gtcactctcg 180 aaatcccacc aagagccggc tacaaaggtg gtgcaccggc agggcctgat gggcgtccag 240 aaggagttcg ccttctgcag acctcccccg gttagcaaag acaaacgtgc agcccagaag 300 cctcaggtcc aaggtcacga ccacgaccac gcaggagaag gagggcagca caaagccagc 360 aacccccacc gcccttcaga agcagtacag aataaaagtg ggattaaaag gaacgccagc 420 accgcaagga ggggaaagcg agtcacgagc gccgtacagg cgcccgaggc gtccgactcc 480 agcagcgacg acggcattga ggaggccatc cagctgtacc aggtgcagaa aacacacaag 540 gaggccgacg gggacccgcc ccagagggtc cagctccaag aggaaagagc acctgcccct 600 cccgcacaca gcacaagcag cgccacaaaa agtgccttgc cagagaccca caggaaaaca 660 cccagcaaga agaagccagt gcccaccaag accacggacc ctggtccagg g 711 <210> 15 <211> 1876 <212> ADN <213> Sequência Artificial <220> <223> sequência de STAR16 <400> 15 cagtacatgc agaactgagt ccaaacgaga cggacagcaa acccggcagt gggctcccag 60 acattcctgg gggaaaggga tcctaaccac aggcagttaa agtcatctcc tccaaccctc 120 tatgacacag gctgtgcgct gtcatttaaa agctgagtga aatttaaccc ttttcccatt 180 tagaaaaaca aagcgcagct ggctgccagc actcatttaa ttttacataa acgtgctctt 240 tgaggctgaa gcaaatctga ctgattttca atgtgaaaat aaaatgtaaa aactgttctt 300 ggaattattt ctaaacagaa catcagaatc gtctgaatca tcagaatcgg ctattttgga 360 87
ΕΡ 1 600 510 /PT aaaatcggat tcatcaaacg aatcttcggc caacaactgt tagagaacga tgttaacacc 420 acgcatagga atgttacatt ttctagaatt tgacattttc attgacggaa aattactgta 480 tcttgtatat ggaaatacca ctactaaaaa cataatgcta taaatagaat gatgtctttt 540 gtttccaaag tcaatatact cgagcaatgc aaaaataata ataaaagtga gatacttcat 600 ggcaaagctg ccgcaggata aacattgcag ccacaagtgc ccccagtatt ctcggggcaa 660 actggaaaag ggctaacagg caacattttc atgttattct actgagtgca gtaattattt 720 ttaaaaatat acatgaataa tgaaaaaact gtggtatggt tttaaagaaa tttccataac 780 ctggtgaaac tcttcacaca gggtaatagg ttcataaagc cttggtcctc tgcaaaacaa 840 gcatcaactt gacaatgact aaaagaagca acagcaaaac tgtcacgcat ttggagccat 900 ggcctgggtt gggccggtgt aaagctctcc gccctctgga gcaagtctgg gccccagcgg 960 ctggcatgtg ggcactgcag ggcctgggtt gggcaggtgt gcagctctcc gtcatctgag 1020 cctagtctga ggcctggtgg ctggcacgtg ggccctgcag ggcctctact tctcacccca 1080 gctccacttc cctccctgcc ctcactgggt ctcacagagc caatgaacac tggggtcaga 1140 ttcagggccc agcatccact gcagtgggca ctgcccttcc acaaggcctg gctccaggaa 1200 gcaaccccca cctcagccac acagtagggc aacaggaaat cccattcccc catgccagtg 1260 actacaccag ggaaggggct cacgtgaggc tggccccagg cctgctgtga gaccgcgttg 1320 tctatgagct tggatttaag gaacttggga gcaagaagct ttctttcatt acgggccacc 1380 agcagggaaa aaagttagcc caacgcagtt gacagtcaca cccccaccag gaccccaggg 1440 cacagaagga gggaagagga caacagagga tgaggtgggg ccagcagagg gacagagaag 1500 agctgcctgc cctggaacag gcagaaagca tcccacgtgc aagaaaaagt aggccagcta 1560 gacttaaaat cagaactacc gctcatcaaa agatagtgta acatttgggg tgctataatt 1620 ttaacatgtc ccccaaaagg catgtgttgg aaatttaatc cccaacaaac cagggctggg 1680 aggtggagcc tcatgagagg tggtgaggcc atgagggtgg agtgaatgga tgaatgccat 1740 tgtctcggga atgggcctct tctacaagga cgagttcagc ccccctttct cttgctcacc 1800 ctctctttgc cctttcgcta gggagtgacg taacaagaag gccctcacaa gatgctggca 1860 ccttgatctt ggactc 1876
< 210 > 16 <211> 1282 <212> ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR17 88
ΕΡ 1 600 510 /PT <400> 16 cgcccacctc ggctttccaa agtgctggga ttacaggcat gagtcactgc gcccatcctg 60 attccaagtc tttagataat aacttaactt tttcgaccaa ttgccaatca ggcaatcttt 120 gaatctgcct atgacctagg acatccctct ccctacaagt tgccccgcgt ttccagacca 180 aaccaatgta catcttacat gtattgattg aagttttaca tctccctaaa acatataaaa 240 ccaagctata gtctgaccac ctcaggcacg tgttctcagg acctccctgg ggctatggca 300 tgggtcctgg tcctcagatt tggctcagaa taaatctctt caaatatttt ccagaatttt 360 actcttttca tcaccattac ctatcaccca taagtcagag ttttccacaa ccccttcctc 420 agattcagta atttgctaga atggccacca aactcaggaa agtattttac ttacaattac 480 caatttatta tgaagaactc aaatcaggaa tagccaaatg gaagaggcat agggaaaggt 540 atggaggaag gggcacaaag cttccatgcc ctgtgtgcac accaccctct cagcatcttc 600 atgtgttcac caactcagaa gctcttcaaa ctttgtcatt taggggtttt tatggcagtt 660 ccactatgta ggcatggttg ataaatcact ggtcatcggt gatagaactc tgtctccagc 720 tcctctctct ctcctcccca gaagtcctga ggtggggctg aaagtttcac aaggttagtt 780 gctctgacaa ccagccccta tcctgaagct attgaggggt cccccaaaag ttaccttagt 840 atggttggaa gaggcttatt atgaataaca aaagatgctc ctatttttac cactagggag 900 catatccaag tcttgcggga acaaagcatg ttactggtag caaattcata caggtagata 960 gcaatctcaa ttcttgcctt ctcagaagaa agaatttgac caagggggca taaggcagag 1020 tgagggacca agataagttt tagagcagga gtgaaagttt attaaaaagt tttaggcagg 1080 aatgaaagaa agtaaagtac atttggaaga gggccaagtg ggcgacatga gagagtcaaa 1140 caccatgccc tgtttgatgt ttggcttggg gtcttatatg atgacatgct tctgagggtt 1200 gcatccttct cccctgattc ttcccttggg gtgggctgtc cgcatgcaca atggcctgcc 1260 agcagtaggg aggggccgca tg 1282 < 210 > 17 <211> 793
< 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR17 <400> 17 atccgagggg aggaggagaa gaggaaggcg agcagggcgc cggagcccga ggtgtctgcg 60 agaactgttt taaatggttg gcttgaaaat gtcactagtg ctaagtggct tttcggattg 120 tcttatttat tactttgtca ggtttcctta aggagagggt gtgttggggg tgggggagga 180 89
ΕΡ 1 600 510 /PT ggtggactgg ggaaacctct gcgtttctcc tcctcggctg cacagggtga gtaggaaacg cctcgctgcc acttaacaat ccctctatta gtaaatctac gcggagactc tatgggaagc cgagaaccag tgtcttcttc cagggcagaa gtcacctgtt gggaacggcc cccgggtccc cctgctgggc tttccggctc ttctaggcgg cctgatttct cctcagccct ccacccagcg tccctcaggg acttttcaca cctccccacc cccatttcca ctacagtctc ccagggcaca gcacttcatt gacagccaca cgagccttct cgttctcttc tcctctgttc cttctctttc tcttctcctc tgttccttct ctttctctgt cataatttcc ttggtgcttt cgccacctta aacaaaaaag agaaaaaaat aaaataaaaa aaacccattc tgagccaaag tattttaaga tgaatccaag aaagcgaccc acatagccct ccccacccac ggagtgcgcc aagacgcacc caggctccat cacagggccg agagcagcgc cactctggtc gtacttttgg gtcaagagat cttgcaaaag agg < 210 > 18 <211> 492
< 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR18 < 4 0 0 > 18 atctttttgc tctctaaatg tattgatggg ttgtgttttt tttcccacct gctaataaat attacattgc aacattcttc cctcaacttc aaaactgctg aactgaaaca atatgcataa aagaaaatcc tttgcagaag aaaaaaagct attttctccc actgattttg aatggcactt gcggatgcag ttcgcaaatc ctattgccta ttccctcatg aacattgtga aatgaaacct ttggacagtc tgccgcattg cgcatgagac tgcctgcgca aggcaagggt atggttccca aagcacccag tggtaaatcc taacttatta ttcccttaaa attccaatgt aacaacgtgg gccataaaag agtttctgaa caaaacatgt catctttgtg gaaaggtgtt tttcgtaatt aatgatggaa tcatgctcat ttcaaaatgg aggtccacga tttgtggcca gctgatgcct gcaaattatc ct <210> 19 <211> 1840
< 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR19 90
ΕΡ 1 600 510 /PT < 4 0 0 > 19 tcacttcctg atattttaca ttcaaggcta gctttatgca tatgcaacct gtgcagttgc 60 acagggcttt gtgttcagaa agactagctc ttggtttaat actctgttgt tgccatcttg 120 agattcatta taatataatt tttgaatttg tgttttgaac gtgatgtcca atgggacaat 180 ggaacattca cataacagag gagacaggtc aggtggcagc ctcaattcct tgccaccctt 240 ttcacataca gcattggcaa tgccccatga gcacaaaatt tgggggaacc atgatgctaa 300 gactcaaagc acatataaac atgttacctc tgtgactaaa agaagtggag gtgctgacag 360 cccccagagg ccacagttta tgttcaaacc aaaacttgct tagggtgcag aaagaaggca 420 atggcagggt ctaagaaaca gcccatcata tccttgttta ttcatgttac gtccctgcat 480 gaactaatca cttacactga aaatattgac agaggaggaa atggaaagat agggcaaccc 540 atagttcttt ttccttttag tctttcctta tcagtaaacc aaagatagta ttggtaaaat 600 gtgtgtgagt taattaatga gttagtttta ggcagtgttt ccactgttgg ggtaagaaca 660 aaatatatag gcttgtattg agctattaaa tgtaaattgt ggaatgtcag tgattccaag 720 tatgaattaa atatccttgt atttgcattt aaaattggca ctgaacaaca aagattaaca 780 gtaaaattaa taatgtaaaa gtttaatttt tacttagaat gacattaaat agcaaataaa 840 agcaccatga taaatcaaga gagagactgt ggaaagaagg aaaacgtttt tattttagta 900 tatttaatgg gactttcttc ctgatgtttt gttttgtttt gagagagagg gatgtggggg 960 cagggaggtc tcattttgtt gcccaggctg gacttgaact cctgggctcc agctatcctg 1020 ccttagcttc ttgagtagct gggactacag gcacacacca cagtgtctga cattttctgg 1080 attttttttt tttttttatt ttttttgtga gacaggttct ggctctgtta ctcaggttgc 1140 agtgcagtgg catgatagcg gctcactgca gcctcaacct cctcagctta agctactctc 1200 ccacttcagc ctcctgagta gccaggacta cagttgtgtg ccaccacacc tgtggctaat 1260 ttttgtagag atggggtctc tccacgttgc cgaggctggt ctccaactcc tggtctcaag 1320 cgaacctcct gacttggcct cccgaagtgc tgggattaca ggcttgagcc actgcatcca 1380 gcctgtcctc tgtgttaaac ctactccaat ttgtctttca tctctacata aacggctctt 1440 ttcaaagttc ccatagacct cactgttgct aatctaataa taaattatct gccttttctt 1500 acatggttca tcagtagcag cattagattg ggctgctcaa ttcttcttgg tatattttct 1560 tcatttggct tctggggcat cacactctct ttgagttact cattcctcat tgatagcttc 1620 ttcctagtct tctttactgg ttcttcctct tctccctgac tccttaatat tgtttttctc 1680 cccaggcttt agttcttagt cctcttctgt tatctattta cacccaattc tttcagagtc 1740 1800 tcatccagag tcatgaactt aaacctgttt ctgtgcagat aattcacatt attatatctc 91
ΕΡ 1 600 510 /PT cagcccagac tctcccgcaa actgcagact gatcctactg 1840 < 210 > 20 <211> 780
< 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR20 <400> 20 gatctcaagt ttcaatatca tgttttggca aaacattcga tgctcccaca tccttaccta 60 aagctaccag aaaggctttg ggaactgtca acagagctac agaaaagtca gtaaagacca 120 atggacccct caaacaaaaa cagccaagct tttctgccaa aaagatgact gagaagactg 180 ttaaagcaaa aaactctgtt cctgcctcag atgatggcta tccagaaata gaaaaattat 240 ttcccttcaa tcctctaggc ttcgagagtt ttgacctgcc tgaagagcac cagattgcac 300 atctcccctt gagtgaagtg cctctcatga tacttgatga ggagagagag cttgaaaagc 360 tgtttcagct gggcccccct tcacctttga agatgccctc tccaccatgg aaatccaatc 420 tgttgcagtc tcctttaagc attctgttga ccctggatgt tgaattgcca cctgtttgct 480 ctgacataga tatttaaatt tcttagtgct ttagagtttg tgtatatttc tattaataaa 540 gcattatttg tttaacagaa aaaaagatat atacttaaat cctaaaataa aataaccatt 600 aaaaggaaaa acaggagtta taactaataa gggaacaaag gacataaaat gggataataa 660 tgcttaatcc aaaataaagc agaaaatgaa gaaaaatgaa atgaagaaca gataaataga 720 aaacaaatag caatatgaaa gacaaacttg accgggtgtg gtggctgatg cctgtaatcc 780 < 210 > 21 <211> 607
< 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR21 < 4 0 0 > 21 gatcaataat ttgtaatagt cagtgaatac aaaggggtat atactaaatg ctacagaaat 60 tccattcctg ggtataaatc ctagacatat ttatgcatat gtacaccaag atatatctgc 120 aagaatgttc acagcaaatc tctttgtagt agcaaaaggc caaaaggtct atcaacaaga 180 aaattaatac attgtggcac ataatggcat ccttatgcca ataaaaatgg atgaaattat 240 agttaggttc aaaaggcaag cctccagata atttatatca tataattcca tgtacaacat 300 tcaacaacaa gcaaaactaa acatatacaa atgtcaggga aaatgatgaa caaggttaga 360 420 aaatgattaa tataaaaata ctgcacagtg ataacattta atgagaaaaa aagaaggaag 480 92
ΕΡ 1 600 510 /PT ggcttaggga gggacctaca gggaactcca aaagcactca aaatagaaaa tattttagta acaaggtcta ggccaggcac ggtggctcac ggcgggt < 210 > 22 <211> 1380
< 212 > ADN <213> Sequência Artificial 540 600 607 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 < 2 2 0 > <223> sequência de STAR22 <400> 22 cccttgtgat ccacccgcct tggcctccca cgcccggcca ccctccctgt atattatttc aaaatattga tttaatgaat tcccagaaac taaaaataaa aatcaacaat aaatatatgg gtgaaaaaaa taaacaacac tcctgtcaaa tgaaaattta gaaacatcct tctaaagaag catagttttg gtcattggtt ctgtttatgt tgaacttatc tcaatagatg cagacaaggc ttgaaaactc tcaatagact aggtattgat tatgataaac ccatagccaa tatcatactg aaaactggca caagacaagg atgccctctc gttctggcca gagcaatcag gcaggagaaa tcaaattgtc tctgtttgca gtaaacatga cctaaaaact ccttaagctg ataaacaact tgcaaaaatc acaagcattc ctatacaccg tgaagtccca ttcacaattg cttcaaagaa ggacatgaag gacattttca aggacaacta cacaaagaaa tggaaaaaca ttccatgctc tactgcccaa agtaatttat agattcaatg tcacagaact agaaaaaaac tattttaaaa ccaagacaat cctaagcata aagaacaaag aagttcatgg taagtactaa atacataatc atgttttagc tagttaatat cttacttaaa acctgtaatc ccagcacttt gggaggctga aagtgctggg attacaggcg tgagtcacta taagtatact attatgttaa aaaaagttta taggatttta catgtcacgt tttcttatta taaaagtaaa aagaaaaaca aaaacaaaaa aaacaacagt tgtgataaaa cttaagtgcc ttctgaataa aataaggaat aaaataatca gatggattat gtttattgat ttgtgtatgt cttgataaaa gtttttaaca ccttttcatg gaaacatatc tcaaaataat agaagctatt agtgggcaaa agctggaagc attccctttg tcaccactcc tattaaatgt agtattggaa gaaaaggtat taaaatagga agagaggaag ttgtatattt agaaaacccc attgtctcat tcagcaaagt ctcaggatac aaaatcaatg ataatagaca gcagagagcc aaatcatgag aataaaatac ttaggaatac aactttcacg aaaaccactg ctcaaggaaa tgagagagga atggaagaat caatatcatg aaaatggcca ctaaccccat caagccacca ttgactttct ctcatatgta gtcaaaaaga gtcggtatag ctggatgcat cacgctgact tcaaaccata 1260 93
ΕΡ 1 600 510 /PT ctacaaggct acagtaacca aaacagcatg gtactggtac caaaacagat agatagaccg 1320 atagaacaga acagaggcct cggaaataac accacacatc tacaaccctt tgatcttcaa 1380 <210> 23 <211> 1246 <212> ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR23 <400> 23 atcccctcat ccttcagggc agctgagcag ggcctcgagc agctggggga gcctcactta 60 atgctcctgg gagggcagcc agggagcatg gggtctgcag gcatggtcca gggtcctgca 120 ggcggcacgc accatgtgca gccgccccca cctgttgctc tgcctccgcc acctggccat 180 gggcttcagc agccagccac aaagtctgca gctgctgtac atggacaaga agcccacaag 240 cagctagagg accttgtgtt ccacgtgccc agggagcatg gcccacagcc caaagaccag 300 tcaggagcag gcaggggctt ctggcaggcc cagctctacc tctgtcttca cacagatggg 360 agatttctgt tgtgattttg agtgatgtgc ccctttggtg acatccaaga tagttgctga 420 agcaccgctc taacaatgtg tgtgtattct gaaaacgaga acttctttat tctgaaataa 480 ttgatgcaaa ataaattagt ttggatttga aattctattc atgtaggcat gcacacaaaa 540 gtccaacatt gcatatgaca caaagaaaag aaaaagcttg cattccttaa atacaaatat 600 ctgttaacta tatttgcaaa tatatttgaa tacacttcta ttatgttaca tataatatta 660 tatgtatatg tatatataat atacatatat atgttacata taatatactt ctattatgtt 720 acatataata tttatctata agtaaataca taaatataaa gatttgagta gctgtagaac 780 attgtcttat gtgttatcag ctactactac aaaaatatct cttccactta tgccagtttg 840 ccatataaat atgatcttct cattgatggc ccagggcaag agtgcagtgg gtacttattc 900 tctgtgagga gggaggagaa aagggaacaa ggagaaagtc acaaagggaa aactctggtg 960 ttgccaaaat gtcaagtttc acatattccg agacggaaaa tgacatgtcc cacagaagga 1020 ccctgcccag ctaatgtgtc acagatatct caggaagctt aaatgatttt tttaaaagaa 1080 aagagatggc attgtcactt gtttcttgta gctgaggctg tgggatgatg cagatttctg 1140 gaaggcaaag agctcctgct ttttccacac cgagggactt tcaggaatga ggccagggtg 1200 ctgagcacta caccaggaaa tccctggaga gtgtttttct tactta 1246 <210> 24 <211> 939
<212> ADN <213> Sequência Artificial 94
ΕΡ 1 600 510 /PT <220> <223> sequência de STAR24 <400> 24 acgaggtcac gagttcgaga ccagcctggc caagatggtg aagccctgtc tctactaaaa 60 atacaacaag tagccgggcg cggtgacggg cgcctgtaat cccagctact caggaggctg 120 aagcaggaga atctctagaa cccaggaggc ggaggtgcag tgagctgaga ctgccccgct 180 gcactctagc ctgggcaaca cagcaagact ctgtctcaaa taaataaata aataaataaa 240 taaataaata aataaataaa tagaaaggga gagttggaag tagatgaaag agaagaaaag 300 aaatcctaga tttcctatct gaaggcacca tgaagatgaa ggccacctct tctgggccag 360 gtcctcccgt tgcaggtgaa ccgagttctg gcctccattg gagaccaaag gagatgactt 420 tggcctggct cctagtgagg aagccatgcc tagtcctgtt ctgtttgggc ttgatcctgt 480 atcacttgat tgtctctcct ggactttcca tggattccag ggatgcaact gagaagttta 540 tttttaatgc acttacttga agtaagagtt attttaaaac attttagcaa aggaaatgaa 600 ttctgacagg ttttgcactg aagacattca catgtgagga aaacaggaaa accactatgc 660 tagaaaaagc aaatgctgtt gagattgtct cacaaacaca aattgcgtgc cagcaggtag 720 gtttgagcct caggttgggc acattttacc ttaagcgcac tgttggtgga acttaaggtg 780 actgtaggac ttatatatac atacatacat ataatatata tacatattta tgtgtatata 840 cacacacaca cacacacaca cacacagggt cttgctatct tgcccagggt ggtctccaac 900 tctgggtctc aagcgatcct ctgcctcccc ttcccaaag 939 <210> 25 <211> 1067
<212> ADN <213> Sequência Artificial <220> <223> sequência de STAR25 <400> 25 ataaaaaaat aaaaaaccct gctctaattt gcaaaggctc tatctttcct cccaaccacc 60 tgaaatttta gtgaaaacgg ggcttcctgt aggaaggagt agctagctat cccggtccgc 120 tacaggttat cagtgcgtga ataccctgac tcctaaggct caggatttga ctgggtcgcc 180 tcgtccgact gccccgcccc caacgcggac ccacgtcacc gcgcgccagc ctgcggccgt 240 cctgacctcg cgggatttga gcttcggtgc caacaaacac tcccaccgcg gctgcgtcca 300 ctttacctgc cggcggcgac cagcttctga agaaaagtgt ccaccatggt gtcgaggagc 360 ttcaccctcg aaatggtagt gccgggtggc acagattccg aagacgaccc ctcatgcctt 420 480 ttttcctcac agccgctgcc tagattggcg ctacttgctt cggccatgtt gaagttgaac 95
ΕΡ 1 600 510 /PT ctccaaatct aactggcccg gcctccccgc ctgccggagc tcccgattgg ccgctcccgc 540 gaagggtgcc tccgattgga agcagtagaa cgtctgtcac cgagcagggc gggggcgggg 600 aagtcatcgg aggctgaggg cagcggggag gcgaggctct gcgcggtggg atgtccgcga 660 ccggaaaaat acgcgcaagc caaagctcgg gggctcaata aaaactttta attacatttc 720 agagacttcg tacagtgcaa cagtgaatat tcactgttaa ttttcacaag agtccatttc 780 atcaaacgtt cagagagtct gccttttcat tcccttgttc ctcagtgctc caatcaggtt 840 tccagtctcc cagaggtttc ttttagtttt gattaccgac caaaactcca gtttagggag 900 aatggaagtc caccgtccca tccccaccaa aacatatttc agtcaaaccc aatcccagtc 960 cctaaagaat taggaaagta tgggccaagg gtccttttaa ttatacacac atcaccctta 1020 aaactgcgtg tgtgtacgag aaataaagaa aaacacaaga ggggctg 1067 < 210 > 26 <211> 540
< 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR26 <400> 26 ccccctgaca agccccagtg tgtgatgttc cccactctgt gtccatgcat tctcattgtt 60 caactcccat ctgtgagtga gaacatgcag tgtttggttt tctgtccttg agatagtttg 120 ctgagaatga tggtttccag cttcatccat gtccttgcaa aggaagtgaa cttatccttt 180 tttatggctt catagtattc catggcacat atgtgccaca tttttttaat ccagtctatc 240 attgatggac atttgggttg gttccaagtc tttgctattg tgaatagcac cacaattaac 300 atatgtgtgc atgtatacat ctttatagta gcatgattta taatccttcg ggtatatacc 360 ctgtaatggg atcgctgggt caaatggtat ttctagttct agatccttga ggaatcacca 420 cactgctttc cacaatggtt gaactaattt acgctcccac cagcagtgta aaagcattcc 480 tatttctcca cgtcctctcc agtatctgtt gtttcctgac tttttaatga tcatcattct 540 <210> 27 <211> 1520
<212> ADN <213> Sequência Artificial <220> <223> sequência de STAR27 <400> 27 cttggccctc acaaagcctg tggccaggga acaattagcg agctgcttat tttgctttgt 60 120 atccccaatg ctgggcataa tgcctgccat tatgagtaat gccggtagaa gtatgtgttc 96
ΕΡ 1 600 510 /PT aaggaccaaa gttgataaat accaaagaat ccagagaagg gagagaacat tgagtagagg 180 atagtgacag aagagatggg aacttctgac aagagttgtg aagatgtact aggcaggggg 240 aacagcttaa ggagagtcac acaggaccga gctcttgtca agccggctgc catggaggct 300 gggtggggcc atggtagctt tcccttcctt ctcaggttca gagtgtcagc cttgaacttc 360 taattcccag aggcatttat tcaatgtttt cttctagggg catacctgcc ctgctgtgga 420 agactttctt ccctgtgggt cgccccagtc cccagatgag acggtttggg tcagggccag 480 gtgcaccgtt gggtgtgtgc ttatgtctga tgacagttag ttactcagtc attagtcatt 540 gagggaggtg tggtaaagat ggagatgctg ggtcacatcc ctagagaggt gttccagtat 600 gggcacatgg gagggctgga aggataggtt actgctagac gtagagaagc cacatccttt 660 aacaccctgg cttttcccac tgccaagatc cagaaagtcc ttgtggtttc gctgctttct 720 cctttttttt tttttttttt tttctgagat ggagtctggc tctgtcgccc aggctggagt 780 gcagtggcac gatttcggct cactgcaagt tccgcctcct aggttcatac cattctccca 840 cctcagcctc ccgagtagct gggactacag gcgccaccac acccagctaa ttttttgtat 900 ttttagtaga gacggcgttt caccatgtta gccaggatgg tcttgatccg cctgcctcag 960 cctcccaaag tgctgggatt acaggcgtga gccaccgcgc ccggcctgct ttcttctttc 1020 atgaagcatt cagctggtga aaaagctcag ccaggctggt ctggaactct tgacctcaag 1080 tgatctgcct gcctcagcct cccaaagtgc tgagattaca ggcatgagcc agtccgaatg 1140 tggctttttt tgttttgttt tgaaacaagg tctcactgtt gcccaggctg cagtgcagtg 1200 gcatacctca gctccactgc agcctcgacc tcctgggctc aagcaatcct cccaactgag 1260 cctccccagt agctggggct acaagcgcat gccaccacgc ctggctattt tttttttttt 1320 tttttttttt gagaaggagt ttcattcttg ttgcccaggc tggagtgcaa tggcacagtc 1380 tcagctcact gcagcctccg cctcctgggt tcaagcgatt ctcctgcctc agcctcccga 1440 gtagctggga ttataggcac ctgccaccat gcctggctaa tttttttgta tttttagtag 1500 ggatggggtt tcaccatgtt 1520 <210 > 28 <211> 961
<212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR28 <400> 28 aggaggttat tcctgagcaa atggccagcc tagtgaactg gataaatgcc catgtaagat 60 120 ctgtttaccc tgagaagggc atttcctaac tctccctata aaatgccaag tggagcaccc 97
ΕΡ 1 600 510 /PT cagatgaaat agctgatatg ctttctatac aagccatcta ggactggctt tatcatgacc aggatattca cccactgaat atggctatta cccaagttat ggtaaatgct gtagttaagg gggtcccttc cacatggaca ccccaggtta taaccagaaa gggttcccaa tctagactcc aagagagggt tcttagacct catgcaagaa agaacttggg gcaagtacat aaagtgaaag caagtttatt aagaaagtaa agaaacaaaa aaatggctac tccataagca aagttatttc tcacttatat gattaataag agatggatta ttcatgagtt ttctgggaaa ggggtgggca attcctggaa ctgagggttc ctcccacttt tagaccatat agggtatctt cctgatattg ccatggcatt tgtaaactgt catggcactg atgggagtgt cttttagcat tctaatgcat tataattagc atataatgag cagtgaggat gaccagaggt cacttctgtt gccatattgg tttcagtggg gtttggttgg cttttttttt tttttaacca caacctgttt tttatttatt tatttattta tttatttatt tatatttttt attttttttt agatggagtc ttgctctgtc acccaggtta gagtgcagtg gcaccatctc ggctcactgc aagctctgcc tccttggttc acgccattct gctgcctcag cctcccgagt agctgggact acaggtgcct gccaccatac ccggctaatt ttttctattt ttcagtagag acggggtttc accgtgttag ccaggatggt c <210> 29 <211> 2233
<212> ADN <213> Sequência Artificial <220> <223> sequência de STAR29 <400> 29 agcttggaca cttgctgatg ccactttgga tgttgaaggg ccgccctctc ccacaccgct ggccactttt aaatatgtcc cctctgccca gaagggcccc agaggagggg ctggtgaggg tgacaggagt tgactgctct cacagcaggg ggttccggag ggaccttttc tccccattgg gcagcataga aggacctaga agggccccct ccaagcccag ctgggcgtgc agggccagcg attcgatgcc ttcccctgac tcaggtggcg ctgtcctaaa ggtgtgtgtg ttttctgttc gccagggggt ggcggataca gtggagcatc gtgcccgaag tgtctgagcc cgtggtaagt ccctggaggg tgcacggtct cctccgactg tctccatcac gtcaggcctc acagcctgta ggcaccgctc ggggaagcct ctggatgagg ccatgtggtc atccccctgg agtcctggcc tggcctgaag aggaggggag gaggaggcca gcccctccct agccccaagg cctgcgaggc tgcaagcccg gccccacatt ctagtccagg cttggctgtg caagaagcag attgcctggc 600 98
ΕΡ 1 600 510 /PT cctggccagg cttcccagct aggatgtggt atggcagggg tgggggacat tgaggggctg 660 ctgtagcccc cacaacctcc ccaggtaggg tggtgaacag taggctggac aagtggacct 720 gttcccatct gagattcaag agcccacctc tcggaggttg cagtgagccg agatccctcc 780 actgcactcc agcctgggca acagagcaag actctgtctc aaaaaaacag aacaacgaca 840 acaaaaaacc cacctctggc ccactgccta actttgtaaa taaagtttta ttggcacata 900 gacacaccca ttcatttaca tactgctgcg gctgcttttg cattaccctt gagtagacga 960 cagaccacgt ggccatggaa gccaaaaata tttactgtct ggccctttac agaagtctgc 1020 tctagaggga gaccccggcc catggggcag gaccactggg cgtgggcaga agggaggcct 1080 cggtgcctcc acgggcctag ttgggtatct cagtgcctgt ttcttgcatg gagcaccagg 1140 ggtcagggca agtacctgga ggaggcaggc tgttgcccgc ccagcactgg gacccaggag 1200 accttgagag gctcttaacg aatgggagac aagcaggacc agggctccca ttggctgggc 1260 ctcagtttcc ctgcctgtaa gtgagggagg gcagctgtga aggtgaactg tgaggcagag 1320 cctctgctca gccattgcag gggcggctct gccccactcc tgttgtgcac ccagagtgag 1380 gggcacgggg tgagatgtca ccatcagccc ataggggtgt cctcctggtg ccaggtcccc 1440 aagggatgtc ccatcccccc tggctgtgtg gggacagcag agtccctggg gctgggaggg 1500 ctccacactg ttttgtcagt ggtttttctg aactgttaaa tttcagtgga aaattctctt 1560 tcccctttta ctgaaggaac ctccaaagga agacctgact gtgtctgaga agttccagct 1620 ggtgctggac gtcgcccaga aagcccaggt actgccacgg gcgccggcca ggggtgtgtc 1680 tgcgccagcc atgggcacca gccaggggtg tgtctacgcc ggccaggggt aggtctccgc 1740 cggcctccgc tgctgcctgg ggagggccgt gcctgacact gcaggcccgg tttgtccgcg 1800 gtcagctgac ttgtagtcac cctgcccttg gatggtcgtt acagcaactc tggtggttgg 1860 ggaaggggcc tcctgattca gcctctgcgg acggtgcgcg agggtggagc tcccctccct 1920 ccccaccgcc cctggccagg gttgaacgcc cctgggaagg actcaggccc gggtctgctg 1980 ttgctgtgag cgtggccacc tctgccctag accagagctg ggccttcccc ggcctaggag 2040 cagccgggca ggaccacagg gctccgagtg acctcagggc tgcccgacct ggaggccctc 2100 ctggcgtcgc ggtgtgactg acagcccagg agcgggggct gttgtaattg ctgtttctcc 2160 ttcacacaga accttttcgg gaagatggct gacatcctgg agaagatcaa gaagtaagtc 2220 ccgcccccca ccc 2233 < 210 > 30 <211> 1851
< 212 > ADN <213> Sequência Artificial 99 ΕΡ 1 600 510 /PT <220> <223> sequência de STAR30 <400> 30 cctcccctgg agccttcaga aggagcatgg cataggagtc ttgatttcag acgtctggtc 60 cccagaatga tgggagaatg aatttctgtt atttaagcca cccaacctgt ggtgctttgt 120 tatagcagcc tcaggaaact aacacactgc acgtgcccac tattcccttt tccagtatct 180 ttcaggactt gctggcttcc tttgttctgg cgtacaccca tgcatggccc cattccccac 240 ttcctaaaac aacaaccctg acttagtctg tttgggctgc tagaacaaaa tactatagac 300 tgggtgactt ataaacaaca gaaattcatt tctcacattc tggaggctgg gaagtccaat 360 atcgaggcac catcacattt ggtctctgct gaggccccct tcctagctcc tcactgtgtc 420 cttacatggc agaaggggca aggcagctct ctggggtccc ttttcaaggc cacaaatccc 480 attcattagg gctgatgact tcatgactta atcacctcct aatggcccca cctcctaatc 540 gcattgggcg ttaggattca acataaattt tggggggaca cacatattca gaccatagca 600 aaccccaaca ataaaaaacc ttcactttaa ggttccaaat ggactggcag ttaaatcatg 660 ttcatattta cataaaagaa ggagtaagtc aacaaattga taaacgcgtg gagatttgtt 720 cggatggatg ttcaccaaaa tgctggcctt aaagagtgag atgggaaatg ggaactatta 780 cattcttctt catacttttt ggtactgcct gcattgttaa aaaaaaaaaa aaagagcaca 840 gagcattttt acaatcagga aaaaaacaat gaggttatct tcattctgga aaaaaatgga 900 aaatgaaaca gtggagtcac atcatggaaa atgcttatgg tacaatttca tgtgacataa 960 aacaatagaa tagaggacct gttttatgac taaagcactg taaaaatgac aggcctggaa 1020 ggagagatga aaaccactca tttgttaagg tagtcaggtg gcaggtgatt tctcttcttt 1080 tgaaaatttc cattttcatt atatcgcagt ttgtgcattt actaaaactt tcggttggta 1140 cacatgcata aatagataga taaataagta gatagatgat agataaatag acggtaggta 1200 gatagataga tagatatgag aaataagtcc cctgtacttg gccttgcagc cataactagt 1260 cattcccctt cctctgtcca ttgctatgcc tgatggacaa ggcagtctgt gccctctggc 1320 cccaattcca atgtgccctc tgctcctggc tgttagtccc tttccacccc aatacaattg 1380 ctccgaggtc acttctaagt gtgaagcccc cagatcagat ggcttcttct gtgtccttac 1440 cttacccaat ttctaattat aactaaaaca caatgaggct ctagtaaaat accatgagac 1500 ttcaggccct ctgtataact tcactcattt aaacctaaca aggaaaacct accatgaatc 1560 cgaggcacag agcagctaag gaactcacca aggtcacgca gctattggtg atggaaccat 1620 1680 gagtcaagct tcacagcctg ttggctctag aatagggttt cccaacctca gcactgtgga 100
ΕΡ 1 600 510 /PT cattttcagg ctggataatt ctctgttgtg ggagcatctc tggcctctac ccactagacg caagcaatgt ctcccaccat tgccaagtgt <210> 31 <211> 1701
< 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR31 < 2 2 0 > <221> misc_feature < 2 2 2 > (159)..(1696) <223> "N" representa qualquer á <400> 31 cacccgcctt ggccccccag agtgctggga atttaatttt ttaaaaaata aagagaagta actgggacag gggcaggaca ggggtgaggc cccaggactg tgtgtcacat tctccaataa ctgcagtgga gggtagaggg ccgtgggcag cttcatgaca atcggcccag ctgctgtcat ggcttgccca cagtcaccca gccggcaagt tcctgcccag gggtccagct gagaatcagg tgggactcca gtagctgtag tgcatggagg tcacactggc tgtccctgtg ggcaggccat tcccagacaa tgacaatggg gtggaatcct ctacctgagg aaggcagggg catggtggaa aacttgcaca tggtcagccc tgccttctcc ggacattgaa ccagcaccca aagaattttg cctccttttt aaaatttaat taattaatta tgtgtggccc aggctgtagt gcagtggcac cacctcagcc tctggattag ctgagactac ttttattttt gtagagagag ggtttcacca ctcaagtgat cccgcccagg tctgaaagcc catgcagcca cccgagggcg cccccaagcc gggggctgtt ctgtgccttg taggatatta cagcagcact cccatgccca gttgtgacaa cccctgggtg gaaatgcacc c eido nucleico em várias posições 1740 1800 1851 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 ttacaagtgt aaaccaccat tcctggctag ggaatagttc attttaggga gagcccctta ttcccttant tcaagctcac ctcaaaccca aggaaaggtt gctgcccccg cctgtgagtg agtgcttcat ggactgctca tcaagaaagg cccacattct acttccagct aggagaaggc gtcacccctg ggttggaccc agagctatga cccacgttct aggcagaggg gctcacctac catcatggct gcagcagcct ggacctggtc cctcaatgcc aggtcaggcc caagcatgta ctcttgtccc agaagccact cctcactgtt tcctgaagcc tgctgtgagg gtctccagcg tccctgaact agattgagcg agagcaagaa gggaacggcc tctcatccag gtcaggctca attaattttt ttttagagac agagtcttac aatcatagtt cactgcagcc tcaaactccc aggtgcacca ccaccacacc cagctaatat tcttgcccag gctggtctca aactcctggg cccaggctgg cctcagactg tggggttttc agttcatctc ggagtccagg cctggccctg 1200 101
ΕΡ 1 600 510 /PT ggagacagag tgaaaccagt ggtttttatg aacttaactt agagtttaaa agatttctac 1 tcgatcactt gtcaagatgc gccctctctg gggagaaggg aacgtgactg gattccctca 1 ctgttgtatc ttgaataaac gctgctgctt catcctgtgg gggccgtggc cctgtccctg 1 tgtgggtggg gcctcttcca tttccctgac ttagaaacca cagtccacct agaacagggt 1 ttgagaggct tagtcagcac tgggtagcgt tttgactcca ttctcggctt tcttcttttt 1 ctttccagga tttttgtgca gaaatggttc ttttgttgcc gtgttagtcc tccttggaag 1 gcagctcaga aggcccgtga aatgtcgggg gacaggaccc ccagggaggg aaccccaggc 1 tacgcacttt agggttcgtt ctccagggag ggcgacctga cccccgnatc cgtcggngcg 1 cgnngnnacn aannnnttcc c 1 <210> 32 <211> 771 < 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR32 <400> 32 gatcacacag cttgtatgtg ggagctagga ttggaacccc agaagtctgg ccccaggttc atgctctcac ccactgcata caatggcctc tcataaatca atccagtata aaacattaga atctgcttta aaaccataga attagtagcg taagtaataa atgcagagac catgcagtga atggcattcc tggaaaaagc ccccagaagg aattttaaat cagctttcgt ctaatcttga gcagctagtt agcaaatatg agaatacagt tgttcccaga taatgcttta tgtctgacca tcttaaactg gcgctgtttt tcaaaaactt aaaaacaaaa tccatgactc ttttaattat aaaagtgata catgtctact tgggaggctg aggtggtggg aggatggctt gagtttgagg ctgcagtatg ctactatcat gcctataaat agccgctgca ttccagcttg ggcaacatac ccaggcccta tctcaaaaaa ataaaaagta atacatctac attgaagaaa attaatttta ttgggttttt ttgcattttt attatacaca gcacacacag cacatatgaa aaaatgggta tgaactcagg cattcaactg gaagaacagt actaaatcaa tgtccatgta gtcagcgtga ctgaggttgg tttgtttttt cttttttctt ctcttctctt ctcttttctt tttttttgag acggagcttt gctctttttg cccaggcttg attgcaatgg cgtgatctca g <210> 33 <211> 1368 <212> ADN <213> Sequência Artificial 102
ΕΡ 1 600 510 /PT <220> <223> sequência de STAR33 < 4 0 0 > 33 gcttttatcc tccattcaca gctagcctgg cccccagagt acccaattct ccctaaaaaa 60 cggtcatgct gtatagatgt gtgtggcttg gtagtgctaa agtggccaca tacagagctc 120 tgacaccaaa cctcaggacc atgttcatgc cttctcactg agttctggct tgttcgtgac 180 acattatgac attatgatta tgatgacttg tgagagcctc agtcttctat agcactttta 240 gaatgcttta taaaaaccat ggggatgtca ttatattcta acctgttagc acttctgttc 300 gtattaccca tcacatccca acatcaattc tcatatatgc aggtacctct tgtcacgcgc 360 gtccatgtaa ggagaccaca aaacaggctt tgtttgagca acaaggtttt tatttcacct 420 gggtgcaggt gggctgagtc tgaaaagaga gtcagtgaag ggagacaggg gtgggtccac 480 tttataagat ttgggtaggt agtggaaaat tacaatcaaa gggggttgtt ctctggctgg 540 ccagggtggg ggtcacaagg tgctcagtgg gagagccttt gagccaggat gagccagaag 600 gaatttcaca aggtaatgtc atcagttaag gcagggactg gccattttca cttcttttgt 660 ggtggaatgt catcagttaa ggcaggaacc ggccattttc acttcttttg tgattcttca 720 cttgcttcag gccatctgga cgtataggtg caggtcacag tcacagggga taagatggca 780 atggcatagc ttgggctcag aggcctgaca cctctgagaa actaaagatt ataaaaatga 840 tggtcgcttc tattgcaaat ctgtgtttat tgtcaagagg cacttatttg tcaattaaga 900 acccagtggt agaatcgaat gtccgaatgt aaaacaaaat acaaaacctc tgtgtgtgtg 960 tgtgtgtgag tgtgtgtgta tgtgtgtgtg tgtgtattag agaggaaaag cctgtatttg 1020 gaggtgtgat tcttagattc taggttcttt cctgcccacc ccatatgcac ccaccccaca 1080 aaagaacaaa caacaaatcc caggacatct tagcgcaaca tttcagtttg catattttac 1140 atatttactt ttcttacata ttaaaaaact gaaaatttta tgaacacgct aagttagatt 1200 ttaaattaag tttgttttta cactgaaaat aatttaatat ttgtgaagaa tactaataca 1260 ttggtatatt tcattttctt aaaattctga acccctcttc ccttatttcc ttttgacccg 1320 attggtgtat tggtcatgtg actcatggat ttgccttaag gcaggagg 1368 < 210 > 34 <211> 755
< 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR34 <400> 34 actgggcacc ctcctaggca ggggaatgtg agaactgccg ctgctctggg gctgggcgcc 60 120 atgtcacagc aggagggagg acggtgttac accacgtggg aaggactcag ggtggtcagc 180 ΕΡ 1 600 510 /PT cacaaagctg ctggtgatga ccaggggctt 103 gtgtcttcac tctgcagccc taacacccag gctgggttcg ctaggctcca tcctgggggt gcagaccctg agagtgatgc cagtgggagc ctcccgcccc tccccttcct cgaaggccca ggggtcaaac agtgtagact cagaggcctg agggcacatg tttatttagc agacaaggtg gggctccatc agcggggtgg cctggggagc agctgcatgg gtggcactgt ggggagggtc tcccagctcc ctcaatggtg ttcgggctgg tgcggcagct ggcggcaccc tggacagagg tggatatgag ggtgatgggt ggggaaatgg gaggcacccg agatggggac agcagaataa agacagcagc agtgctgggg ggcaggggga tgagcaaagg caggcccaag acccccagcc cactgcaccc tggcctccca caagccccct cgcagccgcc cagccacact cactgtgcac tcagccgtcg atacactggt ctgttaggga gaaagtccgt cagaacaggc agctgtgtgt gtgtgtgcgt gtatgagtgt gtgtgtgtga tccctgactg ccaggtcctc tgcactgccc ctggg 240 300 360 420 480 540 600 660 720 755 <220> <221> misc_feature <222> (312)..(1191) <223> "N" representa <400> 35 cgacttggtg atgcgggctc ttctgtgaag aaagtcattg gggcagtatg gccattttca ccattagttt gtatcctctt gtccttcaca tcccttgtaa tgaatgggag tncactcacg ngtgatnttn gtacattgat < 210 > 35 <211> 1193
< 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR35 <220> <221> misc_feature <222> (355)..(1191) <223> "N" representa qualquer ácido nucleico em várias posições qualquer ácido nucleico em várias posições ttttttggtt ccatatgaac tttaaagtag tcttttccaa gtaggttgat ggggatggca ttgaatctgt aaattacctt caatgttgat tcttcctatc catgatgatg gaatgttctt ttatttcctt gagcagtggt ttgtagttct ccttgaagag gttggattcc taggtatttt attctctttg aagcaaattg atttggctct ctgtttgtct gctgggtgta taaanaatgt ttngtatccn tgagacttng ctgaatttgc ttnatcngct tnngggaacc ttttgggctg aaacnatggg attttctaaa tatacaatca tgtcgtctgc 60 120 180 240 300 360 420 480 104
ΕΡ 1 600 510 /PT aaacagggaa caatttgact tcctcttttc ctaattgaat acactttatc tccttctcct 540 gcctaattgc cctgggcaaa acttccaaca ctatgntngn aataggagnt ggtgagagag 600 ggcatccctg ttcttgttgc cagnttttca aagggaatgc ttccagtttt ggcccattca 660 gtatgatatg ggctgtgggt ngtgtcataa atagctctta tnattttgaa atgtgtccca 720 tcaataccta atttattgaa agtttttagc atgaangcat ngttgaattt ggtcaaaggc 780 tttttctgca tctatggaaa taatcatgtg gtttttgtct ttggctcntg tttatatgct 840 ggatnacatt tattgatttg tgtatatnga acccagcctn ncatcccagg gatgaagccc 900 acttgatcca agcttggcgc gcngnctagc tcgaggcagg caaaagtatg caaagcatgc 960 atctcaatta gtcagcaccc atagtccgcc cctacctccg cccatccgcc cctaactcng 1020 nccgttcgcc cattctcgcc catggctgac taatnttttt annatccaag cggngccgcc 1080 ctgcttganc attcagagtn nagagnnttg gaggccnagc cttgcaaaac tccggacngn 1140 ttctnnggat tgaccccnnt taaatatttg gttttttgtn ttttcanngg nga 1193 < 210 > 36 <211> 1712
< 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR36 <400> 36 gatcccatcc ttagcctcat cgatacctcc tgctcacctg tcagtgcctc tggagtgtgt 60 gtctagccca ggcccatccc ctggaactca ggggactcag gactagtggg catgtacact 120 tggcctcagg ggactcagga ttagtgagcc ccacatgtac acttggcctc agtggactca 180 ggactagtga gccccacatg tacacttggc ctcaggggac tcaggattag tgagccccca 240 catgtacact tggcctcagg ggactcagga ttagtgagcc ccacatgtac acttggcctc 300 aggggactca ggactagtga gccccacatg tacacttggc ctcaggggac tcagaactag 360 tgagccccac atgtacactt ggcttcaggg gactcaggat tagtgagccc cacatgtaca 420 cttggacacg tgaaccacat cgatgtgctg cagagctcag ccctctgcag atgaaatgtg 480 gtcatggcat tccttcacag tggcacccct cgttccctcc ccacctcatc tcccattctt 540 gtctgtcttc agcacctgcc atgtccagcc ggcagattcc accgcagcat cttctgcagc 600 acccccgacc acacacctcc ccagcgcctg cttggccctc cagcccagct cccgcctttc 660 ttccttgggg aagctccctg gacagacacc ccctcctccc agccatggct ttttcctgct 720 ctgccccacg cgggaccctg ccctggatgt gctacaatag acacatcaga tacagtcctt 780 cctcagcagc cggcagaccc agggtggact gctcggggcc tgcctgtgag gtcacacagg 840 105
ΕΡ 1 600 510 /PT tgtcgttaac ttgccatctc agcaactagt gaatatgggc agatgctacc ttccttccgg 900 ttccctggtg agaggtactg gtggatgtcc tgtgttgccg gccacctttt gtccctggat 960 gccatttatt tttttccaca aatatttccc aggtctcttc tgtgtgcaag gtattagggc 1020 tgcagcgggg gccaggccac agatctctgt cctgagaaga cttggattct agtgcaggag 1080 actgaagtgt atcacaccaa tcagtgtaaa ttgttaactg ccacaaggag aaaggccagg 1140 aaggagtggg gcatggtggt gttctagtgt tacaagaaga agccagggag ggcttcctgg 1200 atgaagtggc atctgacctg ggatctggag gaggagaaaa atgtcccaaa agagcagaga 1260 gcccacccta ggctctgcac caggaggcaa cttgctgggc ttatggaatt cagagggcaa 1320 gtgataagca gaaagtcctt gggggccaca attaggattt ctgtcttcta aagggcctct 1380 gccctctgct gtgtgacctt gggcaagtta cttcacctct agtgctttgg ttgcctcatc 1440 tgtaaagtgg tgaggataat gctatcacac tggttgagaa ttgaagtaat tattgctgca 1500 aagggcttat aagggtgtct aatactagta ctagtaggta cttcatgtgt cttgacaatt 1560 ttaatcatta ttattttgtc atcaccgtca ctcttccagg ggactaatgt ccctgctgtt 1620 ctgtccaaat taaacattgt ttatccctgt gggcatctgg cgaggtggct aggaaagcct 1680 ggagctgttt cctgttgacg tgccagacta gt 1712 < 210 > 37 <211> 1321
< 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR37 <400> 37 atctctctct gccaaagcaa cagcggtccc tgccccaacc agactacccc actcagtggg 60 gttacggatg ctgctccagc atcctaacac tgcccagctg gtgcctgcct gtgctcaccc 120 acaaccccca ggccggcctt ccctgcagcc tgggcttggc caccttggcc tgattgagca 180 ctgaggcctc ctgggcaccc agccccatca ctgcacctgc tgcttccagc cccaccccac 240 cggctcaggg gttcttccca gcggcgctga tcatgaagtc aacatgcacg caagtcgtct 300 caggaaactt tttaatgaaa gtgtcggcca cggtggtgtg taggtggctg agctcagatt 360 gcagctgcta agacaccagc cacttaccaa gagaaagcca ggctgcttca aacccagggc 420 cggaggcaaa aaagcatcac ttccagccgg ggagtctgga agccacgcct tgtgggaggt 480 cacactggca tctaggcctt cgcctgcact gcagaaggag agccgggtcc ccctcctgga 540 gaacgctgcg ttccccagcc ccacaccggc tttgccacca cacaggctgt tgaggcagga 600 106
ΕΡ 1 600 510 /PT ggcgggtaag acgtagctgt agacccaaag caaccaccag ccctgggacc ctgcgggaga 660 ggagcacttt tagaacatgg aaaaatgtgg tcatcccatc attagacagc acacatccta 720 cataaataaa aagtcgtatg gggaaggagg ttggggaggg aataaaaaat tggcacagac 780 attgatagac tggtttccag tttcaaggta acagatgcac atcatgagac cagaggaggc 840 agagacaagg gctgaatttg gcttttctaa gcaacatgtg ttcctgcgca gggctgaatg 900 gtcgctgaga cagagatgga agccaggaca agggagccca ccgggcccag ataggtacag 960 agagcagagg ctcctgttct gtcctcgcca cccatgaggg tgacactgct tgtaaatggt 1020 ggctgtgctc tcccagcaag aaaaaagcac aactaaatcc acactgcaca cagacgcaga 1080 cagaaagcct tcaagtggct ctgttttctg ctccctgcct tgccaggtcc acaagcagag 1140 aggagtgtca ggcacatggc cccgctgtca ggctccccag tgagctgtag gctcagcagg 1200 agctgcccac tgacacacag gggacaccca ctcctgccac cttgggagcg gttgccagac 1260 agagccgcac tgggtgctgg tgtcatccag ggaccccaca cacttcctta aatgtgatcc 1320 t <210> 38 <211> 1445 < 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR38 < 2 2 0 > < 2 21> misc_feature <222> (348)..(949) <223> "N" representa qualquer ácido nucleico em várias posições 1321 <400> 38 gatctatggg agtagcttcc ttagtgagct ttcccttcaa atactttgca accaggtaga 60 gaattttgga gtgaaggttt tgttcttcgt ttcttcacaa tatggatatg catcttcttt 120 tgaaaatgtt aaagtaaatt acctctcttt tcagatactg tcttcatgcg aacttggtat 180 cctgtttcca tcccagcctt ctataaccca gtaacatctt ttttgaaacc agtgggtgag 240 aaagacacct ggtcaggaac gcggaccaca ggacaactca ggctcaccca cggcatcaga 300 ctaaaggcaa acaaggactc tgtataaagt accggtggca tgtgtatnag tggagatgca 360 gcctgtgctc tgcagacagg gagtcacaca gacacttttc tataatttct taagtgcttt 420 gaatgttcaa gtagaaagtc taacattaaa tttgattgaa caattgtata ttcatggaat 480 attttggaac ggaataccaa aaaatggcaa tagtggttct ttctggatgg aagacaaact 540 tttcttgttt aaaataaatt ttattttata tatttgaggt tgaccacatg accttaagga 600
660 107 ΕΡ 1 600 510 /PT tacatataga cagtaaactg gttactacag tgaagcaaat taacatatct accatcgtac atagttacat ttttttgtgt gacaggaaca gctaaaatct acgtatttaa caaaaatcct aaagacaata catttttatt aactatagcc ctcatgatgt acattagatc gtgtggttgt ttcttccgtc cccgccacgc cttcctcctg ggatggggat tcattcccta gcaggtgtcg gagaactggc gcccttgcag ggtaggtgcc ccggagcctg aggcgggnac tttaanatca gacgcttggg ggccggctgg gaaaaactgg cggaaaatat tataactgna ctctcaatgc cagctgttgt agaagctcct gggacaagcc gtggaagtcc cctcaggagg cttccgcgat gtcctaggtg gctgctccgc ccgccacggt catttccatt gactcacacg cgccgcctgg aggaggaggc tgcgctggac acgccggtgg cgcctttgcc tgggggagcg cagcctggag ctctggcggc agcgctggga gcggggcctc ggaggctggg cctggggacc caaggttggg cggggcgcag gaggtgggct cagggttctc cagagaatcc ccatgagctg acccgcaggg cggccgggcc agtaggcacc gggcccccgc ggtgacctgc ggacccgaag ctggagcagc cactgcaaat gctgcgctga ccccaaatgc tgtgtccttt aaatgtttta attaagaata attaataggt ccgggtgtgg aggctcaagc cttaatcccc agcacctggc gaggccgagg aggga <210> 39 <211> 2331 <212> ADN <213> Sequência Artificial <220> <223> sequência de STAR39 <400> 39 tcactgcaac ctccacctcc caggttcaag tgattctcct gcctcggcct cccgagtagc tgggactaca ggtgcatgac accgcacctg gctagttttt gtatttttag tagagacagg gtttcactat gttggccagg ttggtctcga actcctgacc ttgtgatccg cccacctcgg cctcccaaag tgctgggatt acagagtgag ccactgcgcc tggcctgcac cccttactat tatatgcttt gcattttctt ttagatttga agaacctcat tataaactct agcactaatc ttatgtcagt taaatgcata gcaaatatct cctgacgtgg gagaatatat atttgcaagt cttcttgtga acatatgttt tcagttctag ggagccagac gcctatgagt gaaaagccta gtcatcgtgg agaagtgcat tcaactttgt aagaaactgc caaaccttta ttcataatgg ttgtataaat tttacattac caccaataat gtatgagagt tccagttgct tcacatcctc accagcattt tgttttgtct gtcttttttc ctttggttat tctagtgggc ataagatata 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1445 60 120 180 240 300 360 420 480 540 600 108 ΕΡ 1 600 510 /PT atagtatccc ttgtggttta atgtaaattc cactgaagac taataacatt tgcatatttc 660 taattaataa gcctttttaa gtgacttttc aagtctttgc tcatttttat tagatatttg 720 ccttcttatt attgatttga aagaattata tttatatgct tatattctgg ttataagccc 780 tttgtcatta ttttccaaaa caatatttgg ttgtttctgt actactttcc ttgctccttt 840 gaattgactt ggtgccttgg ccaaaaatca attgaccaca tacatgtggg tgcatctcca 900 gactaccaca ttccgtttat ctatttgtct ctccttgtgt caataacact ctgtcttgat 960 aatggtaagt tttgagatca ggttgtgtaa gtcctcctaa tttttcctgg gttttcaata 1020 ttgctttgct ttttaaaaat tttgtatttt catttacatt ttaaaataaa cttgttagtg 1080 ggattttgat tggcattgca ctgaactcgt ggatcaattt ggggagattg gacattctta 1140 tatatggatc ccgtggtcat caactttaag aactctttct catccattag taactcaatc 1200 taggttcaga tgctactcgt tttctgctca gtctgtgtct gagcccctta tgctcttcat 1260 tttgtcatcc aattaacctc agctttgcat caatactatt tcttgctttg gtgcctgtta 1320 cctctcctct aatcaccaat ccacaactta cctccaaatt cagggcttgt ctcattcttc 1380 ccaggaggag tgctgctcag tctatctact tagtattata atttctctgg cttggtatca 1440 aggcactccc atttccggct tccatgagat gtctcagagg gcatgctgcc cggtgtagct 1500 gcatggtcaa gcttcttcat atctcttgcc tcatcactta aactcactat tttgtactcc 1560 2331 tgcttcagct atagggagct actgttagtt tcttgaagac atatgctctc tctctctctc 1620 acatctggac ctgagcacat cctgttactg ctgcttgaaa caatgtgatc cccaggcaca 1680 caccattagc ttagaagcct cccctgattc ttcaaggctg gttgagtccc ttctctgtgc 1740 tctcatgaca acagttggca attcctcgtt gcagcaccta gcccatgatg ctctttggag 1800 gcagagactg agtctttctc actattgaat ttccagcatt catcacagag cctggcatat 1860 ataaagccct ccatcatatg tattaagtga atggataaat gaaaaaaagt tatatatatg 1920 tacatatatg tgtatatatg tatatgtata tatgtgtata tatgtgtgta tatgtgtgtg 1980 tatatatgta catatatatg tatctatgta catatatgta tatatgtata tatatgtgtg 2040 tgtatatgtg tgtgtgtatg tatatatatt acaatgaaat actattcagc cttaaaaagg 2100 cagggaatcc tgtcatttaa cacaatatgg ataaacctag aggactctaa aggcaaatac 2160 cacatgttct cactcacaaa atctaaacaa gttgaactcc tacaagtaga gagtaggatg 2220 atggttacca agggctgggg gacgggagag gatggggaaa gcatagctgt ccatcaaagg 2280 gtagaaagtt tcatttagac aagaggaatc agctttagtg atctatttca c
ΕΡ 1 600 510 /PT < 210 > 40 <211> 1071 < 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR40 <400> 40 gctgtgattc aaactgtcag cgagataagg cagcagatca agaaagcact ccgggctcca gaaggagcct tccaggccag ctttgagcat aagctgctga tgagcagtga gtgtcttgag tagtgttcag ggcagcatgt taccattcat gcttgacttc tagccagtgt gacgagaggc tggagtcagg tctctagaga gttgagcagc tccagcctta gatctcccag tcttatgcgg tgtgcccatt cgctttgtgt ctgcagtccc ctggccacac ccagtaacag ttctgggatc tatgggagta gcttccttag tgagctttcc cttcaaatac tttgcaacca ggtagagaat tttggagtga aggttttgtt cttcgtttct tcacaatatg gatatgcatc ttcttttgaa aatgttaaag taaattacct ctcttttcag atactgtctt catgcgaact tggtatcctg tttccatccc agccttctat aacccagtaa catctttttt gaaaccagtg ggtgagaaag acacctggtc aggaacgcgg accacaggac aactcaggct cacccacggc atcagactaa aggcaaacaa ggactctgta taaagtaccg gtggcatgtg tattagtgga gatgcagcct gtgctctgca gacagggagt cacacagaca cttttctata atttcttaag tgctttgaat gttcaagtag aaagtctaac attaaatttg attgaacaat tgtatattca tggaatattt tggaacggaa taccaaaaaa tggcaatagt ggttctttct ggatggaaga caaacttttc ttgtttaaaa taaattttat tttatatatt tgaggttgac cacatgacct taaggataca tatagacagt aaactggtta ctacagtgaa gcaaattaac atatctacca tcgtacatag ttacattttt ttgtgtgaca ggaacagcta aaatctacgt atttaacaaa aatcctaaag acaatacatt tttattaact atagccctca tgatgtacat tagatctcta a <210> 41 <211> 1135 <212> ADN <213> Sequência Artificial <220> <223> sequência de STAR41 <400> 41 tgctcttgtt gcccaggctg cagtgcaatg gcgctgtctc ggctcatcgc aacctccgcc tcccagattc aagtgattct cctgcctcac cctcccaagt agctgggatt accagtatgc agcaacacgc ccggctaatt ttgtatttgt aatagagacg gggtttcttc atgttggtca 180 110
ΕΡ 1 600 510 /PT ggctggtctc aaattcctgc cctcaggtga tctgcccacc ttggcctccc aaagtgctgg gattacaggc atgagccact gtgcccggcc tgggctgggg cttttaaggg gactggaggg tgaggggctg gaaaattggg agagttgatt ggtggggcaa gggggatgta atcatcaggg tgtacaaact gcactcttgg tttagtcagc tcctcgtggg gtccttcgga gcagctcagt cagtagctcc atcagtatac aggacccaaa ggaatatctc aaagggaaaa cagcatttcc taaggttcaa gttgtgatct acggagcagt taggggaact acaatcttgt gacagggtct acatgcttct gaggcaatga gacaccaagc agctacgagg aagcagtcag agagcacgcc gacctagtga ctgatgctga tgtgctgcga gctgggttca ttttcatttc tcccctcccc ctgccctcat taattttgta aagtttatag ggaacatttc acccactctg ctgtggatcc ctgtcactta cggagtctgt catcttggct gtatgggctg tggcctctgc ggtgcccatt ctcaggaggt gtgagaccca tgaggaccgg aggtggacaa ggctagagac cacacccccc cgctccatcc aatcatgttt tcctgggtgc ttggtttcta tgcaggctgc atgtccttag tccctgcatg ggaacagctc ctgtggtgag caggcccctg aggaaggcct tgagcgggaa tggagcctag gcttaggctg cctggtaaga gctggaggga accagccgag gcttgtgcta cttttttttc cagaatgaaa tacgtgactg atgttggtgt cctgcagcgc cacgtttccc gccacaacca ccggaacgag gatgaggaga acacactctc cgtggactgc acacg < 210 > 42 <211> 735
<212> ADN <213> Sequência Artificial <220> <223> sequência de STAR42 <400> 42 aagggtgaga tcactaggga gggaggaagg agctataaaa gaaagaggtc actcatcaca tcttacacac tttttaaaac cttggttttt taatgtccgt gttcctcatt agcagtaagc cctgtggaag caggagtctt tctcattgac caccatgaca agaccctatt tatgaaacat aatagacaca caaatgttta tcggatattt attgaaatat aggaattttt cccctcacac ctcatgacca cattctggta cattgtatga atgaatatac cataatttta cctatggctg tatatttagg tcttttcgtg caggctataa aaatatgtat gggccggtca cagtgactta cgcccgtagt cccagaactt tgggaggccg aggcgggtgg atcacctgag gtcgggagtt caaaaccagc ctgaccaaca tggagaaacc ccgtctctgc taaaaataca aaaattaact ggacacggtg gcgtatgcct gtaatcccag ctactcggga agctgaggca ggagaactgc ttgaacccag gaggcggagg ttgtggtgag tcgagattgc gccattgcac tccagcctgg 600 111
ΕΡ 1 600 510 /PT gcaacaagag cgaaattcca tctcaaaaaa aagaaaaaag tatgactgta tttagagtag 660 tatgtggatt tgaaaaatta ataagtgttg ccaacttacc ttagggttta taccatttat 720 gagggtgtcg gtttc 735 <210> 43 <211> 1227 < 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR43 <400> 43 caaatagatc tacacaaaac aagataatgt ctgcccattt ttccaaagat aatgtggtga 60 agtgggtaga gagaaatgca tccattctcc ccacccaacc tctgctaaat tgtccatgtc 120 acagtactga gaccaggggg cttattccca gcgggcagaa tgtgcaccaa gcacctcttg 180 tctcaatttg cagtctaggc cctgctattt gatggtgtga aggcttgcac ctggcatgga 240 aggtccgttt tgtacttctt gctttagcag ttcaaagagc agggagagct gcgagggcct 300 ctgcagcttc agatggatgt ggtcagcttg ttggaggcgc cttctgtggt ccattatctc 360 cagcccccct gcggtgttgc tgtttgcttg gcttgtctgg ctctccatgc cttgttggct 420 ccaaaatgtc atcatgctgc accccaggaa gaatgtgcag gcccatctct tttatgtgct 480 ttgggctatt ttgattcccc gttgggtata ttccctaggt aagacccaga agacacagga 540 ggtagttgct ttgggagagt ttggacctat gggtatgagg taatagacac agtatcttct 600 ctttcatttg gtgagactgt tagctctggc cgcggactga attccacaca gctcacttgg 660 gaaaacttta ttccaaaaca tagtcacatt gaacattgtg gagaatgagg gacagagaag 720 aggccctaga tttgtacatc tgggtgttat gtctataaat agaatgcttt ggtggtcaac 780 tagacttgtt catgttgaca tttagtcttg ccttttcggt ggtgatttaa aaattatgta 840 tatcttgttt ggaatatagt ggagctatgg tgtggcattt tcatctggct ttttgtttag 900 ctcagcccgt cctgttatgg gcagccttga agctcagtag ctaatgaaga ggtatcctca 960 ctccctccag agagcggtcc cctcacggct cattgagagt ttgtcagcac cttgaaatga 1020 gtttaaactt gtttattttt aaaacattct tggttatgaa tgtgcctata ttgaattact 1080 gaacaacctt atggttgtga agaattgatt tggtgctaag gtgtataaat ttcaggacca 1140 gtgtctctga agagttcatt tagcatgaag tcagcctgtg gcaggttggg tggagccagg 1200 gaacaatgga gaagctttca tgggtgg 1227
ΕΡ 1 600 510 /PT 112 < 210 > 44 <211> 1586
< 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR44 < 4 0 0 > 44 tgagttgggg tcctaagcca gaagttaact atgctttcat atattcttgc aagtagaagt 60 acagtgttgg tgtaaattcc ccttagatgg atagctaagc ccagaggaaa taatggtaat 120 tggaaccata tgaccgtatg caattcatgt gcatatttat atcaagaaaa gaacattata 180 ggtcgggtga gaccctattt tgttctgaca atgtcatctg tatttacatg tctgtttcgg 240 gagtttggat gtcaagggat tctgtgctgg attgtaaagc atgtgcttct gcttgatgta 300 gctactcaat tttgtattct tgactaataa agtcataaac ataattcaac ctctgtgtgc 360 gtgctctcct tccattaatt tatactttag caaaaagtat tgaatgtgtg tgttatgtaa 420 caatttccta taaattatat taaatgattt attagcttta ttcaataaag ttttaagtgt 480 tttcttctat gactacatta tttgttaaca agaaatttct ttaactgaaa acttcaagga 540 agactatctg ggtaactctt tcaaaaagaa ttgtccctgt attttgggat tgaatatatt 600 aatttcttgt actgttttaa cagcacataa ttttacaaga caagccactt tttcaaagcc 660 tgcttctcct cccattttcc ctatctctgt gattgacacc tccaacccct gtagcctgcc 720 tctgctctct cttaaccagt cctactgata ctacttccta agtatttttc agccctgtcc 780 ttcctctcca tcatgatgga ttcacttcca gttgaaatcc ttatggtacc ctccctggat 840 tatggcagta atcagagagc tggtctcctt aactcaggat tcacttcttc tcatctgttg 900 ttcacagtga catcagaaag atattttaaa atgatgaact agaattaatt atataaaaca 960 cacatacaca cataaataat acttaaattt ttcaatgatg ttccaattat gtaaaatata 1020 atataggagg cactttatgt tctggcctca atctttcaat tcaaacttat ctcctgccac 1080 tatctccttt gaacattgta ttccagctac tttagaataa taataataca taatattcat 1140 agagcccttc ctgggttcct atcaccgtac aaaatacttc acatataaca tttaatcttt 1200 gacaacttta ttaggcatgc acaattatta tctatctata tatctatatc tatatatata 1260 aaatctatat tttatagata agaaaataga gggtaaaaac ttgccaaaat tacaaagctt 1320 agaagtgtag cagttgggat ttgaatctag gcatcctgcc tctatagtct acagtggctt 1380 tcttgtgcca aaagccttgc agttccctag acttaacatt tctcaaaatc tgtgtctttc 1440 acatgctctt ccaattgtct ggaaaatctt tcccaacctc agtctaactg tggtactcat 1500 1560 gttcacccca caagaattga ctccatctgt cccctctcca tgaaaatttc tttgaatctc 113
ΕΡ 1 600 510 /PT 1586 agcactttgg gaggctgagg caggtg <210> 45 <211> 1981
<212> ADN <213> Sequência Artificial <220> <223> sequência de STAR45 <400> 45 cacgccccag cgtgccctgg actactgctc cgcaggactc ctgttctgct gcaccctgga ctacggcacc agaggaccca gctcccgccg gcctgagcta tggcaccaga ggacccagct cccggcagcc tggactatgg caccagagga cccagccccc cgcttcctgg gctaaggcac agtaggaccc tgcctcatcg tgtactcctg ctcaggagga ccctcgcagg gcggcgcact ggactaagct actgaaggag ccccacccct gcctaaccct ggactaaggc actggagaac tcttgctccg cagagccacg gactcttgca caagagaacc tcagcccagc cgtgccctgg actgtggcac agtagggccc acaccacgcc atggactcct gtattggagg aagagtagtg ataaatgtcc aggtttacaa cttgaaaagt agcaatcaat gtgccacaat agatggatgt gatgtaaaat tataaatgat gaaaacatta tgtgtaattg cctagccaga acagttacac aagacaaaga cgtaaaagaa atccacatag ggaaggaaga ggtaagattg tttctgtttt ttgaaaatat aatcttaaga tagagaaaat cttaaagatt ccaccaaaat aaatggttat agctgatgaa gaaattcaat aaagttaata gttacaaaat caacatacaa atatcattat tgtttctatt aactaatgac aaactattac ctgaaaaata aaggcaattc aatttataat agaatcaaaa cagatatata aatatataaa agacaggagt aaatttaatc aaaaccataa aagatttaca tactgaaaac tatagcacat tgatgaaaaa aattaaaatg gcataaataa atggagaaac atccttcatt gatggattca aaaattagta ttgtaaaagt gtcaatgcta cccaaagcaa tctacagatt aaatgcaacc actatcaaat tccaatgtca ttcttcacag aaatagaaaa attactgcta aaatttgtat ggaaccacaa aagacctgga ccaaccaaag caatcttgaa caaaaagaac aaagctggag gcatcagact acctgactcc aaactctatt acaaagctat aggaattaaa acagcatagc aatggcataa aaacagacat gtaaaacagt acaaagggat atagaacctg taaataaatc cgtgtgtctg tggtcaattg attttttgat aaaataacta aaaatacaca gtgaagaaag aaaattattt tcaataaatg gtgtagacaa aactgactat ccacatacag aagaataaaa tttgactttt attttgctct ttatacaagc atcaaatcaa aattaaagtt taaatgtaaa actactacaa ggaaatatag aaggagactg tatgacattg gcctgagcta tgattttctg tagattattc caaaaggcaa caaaagcaaa 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 114
ΕΡ 1 600 510 /PT acacacaaat gagactgcat aaaacttaaa acttttccac aggaaaagaa gcaatgatag 1560 aattaagaga acccacaaat gggataatat ttttaaacca tacatcaggt aaggggctca 1620 tataataata tataagcaac tcaacctact caaaaataag aaaaaaacta tgcttattaa 1680 aaaataagca aagaatcaga atagacattt cctacatcat acaaaaggcc aaccaggtac 1740 atgaaaaaat cataaacatt cctaattatc agagaagtgc aaatcaatgc cacaatgaga 1800 tatcacctca cacattttac tagggctatt ataaaaaaag atggaagata agtgttggtg 1860 aggatgtgga gaaaaagaaa ccctgtacac tgttggtagg aatggaaatt agtacagcca 1920 tcttggaaaa cagtacgaag ctttctcaag aaattataaa tttatttacc ctatgatcca 1980 t 1981 <210> 46 <211> 1859
<212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR46 < 4 0 0 > 46 attgtttttc ggtttgcttc atttttatga ggcccctggc cttatcttcc ttattcctca ttatggagat gtttttggta caatacctca ggctctgggc tgtaaatggc tatcaaggtc tatactttat gcgtttttgc cctctacaaa tgaattgctg tcgcccttct gtctccccca tttatgctca tttggattat tctcccagtc ttatccatgt ataattcaca tattcacaaa aaaagaagtc agtcactgat atcatacaac tgtccctgtt ttgtccatca cactttgggc tttttgtgtg ggtcgtgtag gcattttctg ttacaaacta tttctttgta tgttttggtc tccggtaccc attcatttgc taccttaaaa gttatgcatt tgtactcatt ctttgtgtct atgtgacctt gtagcatgta gttgttcatg tattaagaat gacatatcct tagctatgtt caaattctgt cttactgggt cacttcgtct ttttattttt tatcaccaag aaataagcgt ttcaggcttt gatcaccacc agtagtcatt ctatggattt ttgtttggct ttagcacttc ctttatttgt aatgctactg ttcagttctc aaacactttg tgaatcattg ttttcaaccc tgctccatct tgtcttcttc gttgtcatta atattaacaa taaagtgtac atctgattcc tcacattcac gcctagtcta tttttcattt atttcttata ccatcagttg tgaacaagtg tcaggtgtat agaaactgct cagttactta tagttccctc cccaactcat tacctcaaca acctttcata aatcacaggt ctttcatgtg ataacatgtt cactccctct ggtattttta agcaaaatgt tgctgaatga atgaacattt tgtacaagtt atctgggaat ataatgttct 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 115
ΕΡ 1 600 510 /PT ccagagctgt accattttaa attctgtgta tgaggattcc acgttctcca cttcctcacc 1020 agtgtatgga tttgggggta tactttttaa aaagtgggat taggctgggc acagtggctc 1080 acacctgtaa tcccaacact tcaggaagct gaggtgggag gatcacttga gcctagtagt 1140 ttgagaccag cctgggcaac atagggagac cctgtctcta caaaaaataa tttaaaataa 1200 attagctggg cgttgtggca cacacctgta gtcccagcta catgggaggc tgaggtggaa 1260 ggattccctg agcccagaag tttgaggttg cagtgagcca tgatggcagc actatactgt 1320 agcctgggtg tcagagcaag actccgtttc agggaagaaa aaaaaaagtg ggatgatatt 1380 tttgacactt ttcttcttgt tttcttaatt tcatacttct ggaaattcca ttaaattagc 1440 tggtaccact ctaactcatt gtgtttcatg gctgcatagt aatattgcat aatataaata 1500 taccattcat tcatcaaagt tagcagatat tgactgttag gtgccaggca ctgctctaag 1560 cgttaaagaa aaacacacaa aaacttttgc attcttagag tttattttcc aatggagggg 1620 gtggagggag gtaagaattt aggaaataaa ttaattacat atatagcata gggtttcacc 1680 agtgagtgca gcttgaatcg ttggcagctt tcttagtagt ataaatacag tactaaagat 1740 gaaattactc taaatggtgt tacttaaatt actggaatag gtattactat tagtcacttt 1800 gcaggtgaaa gtggaaacac catcgtaaaa tgtaaaatag gaaacagctg gttaatgtt 1859 < 210 > 47 <211> 1082
< 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR47 <400> 47 atcattagtc attagggaaa tgcaaatgaa aaacacaagc agccaccaat atacacctac taggatgatt taaaggaaaa taagtgtgaa gaaggacgta aagaaattgt aaccctgata cattgatggt agaaatggat aaagttgcag ccactgtgaa aaacagtctg cagtggctca gaaggttaaa tatagaaccc ctgttggacc caggaactct actcttaggc accccaaaga atagagaaca gaaatcaaac agatgtttgt atactaatgt ttgtagcatc acttttcaca ggagccaaaa ggtggaaata atccaaccat cagtgaacaa atgaatgtaa taaaagcaag gtggtctgca tgcaatgcta catcatccat ctgtaaaaaa cgaacatcat tttgatagat gatacaacat gggtggacat tgagaacatt atgcttagtg aaataagcca gacacaaaag gaatatattg tataattgta attacatgaa gtgcctagaa tagtcaaatt catacaagag aaagtgggat aggaatcacc atgggctgga aataggggga aggtgctata ctgcttattg tggacaaggt ttcgtaagaa atcatcaaaa ttgtgggtgt agatagtggt gttggttatg 60 120 180 240 300 360 420 480 540 600 660
720 116 ΕΡ 1 600 510 /PT caaccctgtg aatatattga atgccatgga gtgcacactt tggttaaaag gttcaaatga taaatattgt gttatatata tttccccacg atagaaaaca cgcacagcca agcccacatg ccagtcttgt tagctgcctt cctttacctt caagagtggg ctgaagcttg tccaatcttt caaggttgct gaagactgta tgatggaagt catctgcatt gggaaagaaa ttaatggaga gaggagaaaa cttgagaatc cacactactc accctgcagg gccaagaact ctgtctccca tgctttgctg tcctgtctca gtatttcctg tgaccacctc ctttttcaac tgaagacttt gtacctgaag gggttcccag gtttttcacc tcggcccttg tcaggactga tcctctcaac ta <210> 48 <211> 1242 <212> ADN <213> Sequência Artificial <220> <223> sequência de STAR48 <400> 48 atcatgtatt tgttttctga attaattctt agatacatta atgttttatg ttaccatgaa tgtgatatta taatataata tttttaattg gttgctactg tttataagaa tttcattttc tgtttacttt gccttcatat ctgaaaacct tgctgatttg attagtgcat ccacaaattt tcttggattt tctatgggta attacaaatc tccacacaat gaggttgcag tgagccaaga tcacaccact gtactccagc ctgggcgaca gagtgagaca ccatctcaca aaaacacata aacaaacaaa cagaaactcc acacaatgac aacgtatgtg ctttcttttt ttcttcctct ttctataata tttctttgtc ctatcttaac tgaactggcc agaaacccca ggacaatgat aaatacgagc agtgtcaaca gacatctcat tccctttcct agcttttata aaaataacga ttatgcttca acattacata tggtggtgtc gatggttttg ttatagataa gcttatcagg ttaagaaatt tgtctgcgtt tcctagtttg gtataaagat tttaatataa atgaatgttg tattttatca tcttattttt ttcctacatc tgctaaggta atcctgtgtt ttcccctttt caatctccta atgtggtgaa tgacattaaa ataccttcta ttgttaaaat attcttgcaa cgctgtatag aaccaatgcc tttattctgt attgctgatg gatttttgaa aaatatgtag gtggacttag ttttctaagg ggaatagaat ttctaatata tttaaaatat tttgcatgta tgttctgaag gacattggtg tgtcatttct ataccatctg gctactagag gagccgactg aaagtcacac tgccggagga ggggagaggt gctcttccgt ttctggtgtc tgtagccatc tccagtggta gctgcagtga taataatgct gcagtgccga cagttctgga aggagcaaca 780 840 900 960 1020 1080 1082 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 117
ΕΡ 1 600 510 /PT acagtgattt cagcagcagc agtattgcgg gatccccacg atggagcaag ggaaataatt 1080 ctggaagcaa tgacaatatc agctgtggct atagcagctg agatgtgagt tctcacggtg 1140 gcagcttcaa ggacagtagt gatggtccaa tggcgcccag acctagaaat gcacatttcc 1200 tcagcaccgg ctccagatgc tgagcttgga cagctgacgc ct 1242 < 210 > 49 <211> 1015
< 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR49 < 4 0 0 > 49 aaaccagaaa cccaaaacaa tgggagtgac atgctaaaac cagaaaccca aaacaatggg 60 agggtcctgc taaaccagaa acccaaaaca atgggagtga agtgctaaaa ccagaaaccc 120 aaaacaatgg gagtgtcctg ctacaccaga aacccaaaac gatgggagtg acgtgataaa 180 accagacacc caaaacaatg ggagtgacgt gctaaaccag aaacccaaaa caatgggagt 240 gacgtgctaa aacctggaaa cctaaaacaa tgcgagtgag gtgctaacac cagaatccat 300 aacaatgtga gtgacgtgct aaaccagaac ccaaaacaat gggagtgacg tgctaaaaca 360 ggaacccaaa acaatgagag tgacgtgcta aaccagaaac ccaaaacaat gggaatgacg 420 tgctaaaacc ggaacccaaa acaatgggag tgatgtgcta aaccagaaac ccaaaacaat 480 gggaatgaca tgctaaaact ggaacccaaa acaatggtaa ctaagagtga tgctaaggcc 540 ctacattttg gtcacactct caactaagtg agaacttgac tgaaaaggag gatttttttt 600 tctaagacag agttttggtc tgtcccccag agtggagtgc agtggcatga tctcggctca 660 ctgcaagctc tgcctcccgg gttcaggcca ttctcctgcc tcagcctcct gagtagctgg 720 gaatacaggc acccgccacc acacttggct aattttttgt atttttagta gagatggggt 780 ttcaccatat tagcaaggat ggtctcaatc tcctgacctc gtgatctgcc cacctcaggc 840 tcccaaagtg ctgggattac aggtgtgagc caccacaccc agcaaaaagg aggaattttt 900 aaagcaaaat tatgggaggc cattgttttg aactaagctc atgcaatagg tcccaacaga 960 ccaaaccaaa ccaaaccaaa atggagtcac tcatgctaaa tgtagcataa tcaaa 1015 <210> 50 <211> 2355
< 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR50 118
ΕΡ 1 600 510 /PT < 4 0 0 > 50 caaccatcgt tccgcaagag cggcttgttt attaaacatg aaatgaggga aaagcctagt 60 agctccattg gattgggaag aatggcaaag agagacaggc gtcattttct agaaagcaat 120 cttcacacct gttggtcctc acccattgaa tgtcctcacc caatctccaa cacagaaatg 180 agtgactgtg tgtgcacatg cgtgtgcatg tgtgaaagta tgagtgtgaa tgtgtctata 240 tgggaacata tatgtgattg tatgtgtgta actatgtgtg actggcagcg tggggagtgc 300 tggttggagt gtggtgtgat gtgagtatgc atgagtggct gtgtgtatga ctgtggcggg 360 aggcggaagg ggagaagcag caggctcagg tgtcgccaga gaggctggga ggaaactata 420 aacctgggca atttcctcct catcagcgag cctttcttgg gcaatagggg cagagctcaa 480 agttcacaga gatagtgcct gggaggcatg aggcaaggcg gaagtactgc gaggaggggc 540 agagggtctg acacttgagg ggttctaatg ggaaaggaaa gacccacact gaattccact 600 tagccccaga ccctgggccc agcggtgccg gcttccaacc ataccaacca tttccaagtg 660 ttgccggcag aagttaacct ctcttagcct cagtttcccc acctgtaaaa tggcagaagt 720 aaccaagctt accttcccgg cagtgtgtga ggatgaaaag agctatgtac gtgatgcact 780 tagaagaagg tctagggtgt gagtggtact cgtctggtgg gtgtggagaa gacattctag 840 gcaatgagga ctggggagag cctggcccat ggcttccact cagcaaggtc agtctcttgt 900 cctctgcact cccagccttc cagagaggac cttcccaacc agcactcccc acgctgccag 960 tcacacatag ttacacacat acaatcacat atatgttccc atatagacac attcacactc 1020 ataccttcac acatgcacac gcatgtgcac acacagtcac tcatttctgt gttggagatt 1080 gggtgaggac attcaatggg tgaggaccaa caggtgtgaa gattgctttc tagaaaatga 1140 ctcctgtctc tctttgccat tcttcccaat ccgatggagc tactaggctt ttccctcatt 1200 tcatgtttaa taaaccttcc caatggcgaa atgggctttc tcaagaagtg gtgagtgtcc 1260 catccctgcg gtggggacag gggtggcagc ggacaagcct gcctggaggg aactgtcagg 1320 ctgattccca gtccaactcc agcttccaac acctcatcct ccaggcagtc ttcattcttg 1380 gctctaattt cgctcttgtt ttctttttta tttttatcga gaactgggtg gagagctttt 1440 ggtgtcattg gggattgctt tgaaaccctt ctctgcctca cactgggagc tggcttgagt 1500 caactggtct ccatggaatt tcttttttta gtgtgtaaac agctaagttt taggcagctg 1560 ttgtgccgtc cagggtggaa agcagcctgt tgatgtggaa ctgcttggct cagatttctt 1620 gggcaaacag atgccgtgtc tctcaactca ccaattaaga agcccagaaa atgtggcttg 1680 gagaccacat gtctggttat gtctagtaat tcagatggct tcacctggga agccctttct 1740 gaatgtcaaa gccatgagat aaaggacata tatatagtag ctagggtggt ccacttctta 1800 119 ΕΡ 1 600 510 /PT ggggccatct ccggaggtgg tgagcactaa gtgccaggaa gagaggaaac tctgttttgg 1860 agccaaagca taaaaaaacc ttagccacaa accactgaac atttgttttg tgcaggttct 1920 gagtccaggg agggcttctg aggagagggg cagctggagc tggtaggagt tatgtgagat 1980 ggagcaaggg ccctttaaga ggtgggagca gcatgagcaa aggcagagag gtggtaatgt 2040 ataaggtatg tcatgggaaa gagtttggct ggaacagagt ttacagaata gaaaaattca 2100 acactattaa ttgagcctct actacgtgct cgacattgtt ctagtcactg agataggttt 2160 ggtatacaaa acaaaatcca tcctctatgg acattttagt gactaacaac aatataaata 2220 ataaaagtga acaaaagctc aaaacatgcc aggcactatt atttatttat ttatttattt 2280 atttatttat tttttgaaac agagtctcgc tctgttgccc aggctggagt gtagtggtgc 2340 gatctcggct cactg 2355 <210> 51 <211> 2289
< 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR51 < 4 0 0 > 51 tcacaggtga caccaatccc ctgaccacgc tttgagaagc actgtactag attgactttc 60 taatgtcagt cttcattttc tagctctgtt acagccatgg tctccatatt atctagtaca 120 acacacatac aaatatgtgt gatacagtat gaatataata taaaaatatg tgttataata 180 taaatataat attaaaatat gtctttatac tagataataa tacttaataa cgttgagtgt 240 ttaactgctc taagcacttt acctgcagga aacagttttt tttttatttt ggtgaaatac 300 aactaacata aatttattta caattttaag catttttaag tgtatagttt agtggagtta 360 atatattcaa aatgttgtgc agccgtcacc atcatcagtc ttcataactc ttttcatatt 420 gtaaaattaa aagtttatgc tcatttaaaa atgactccca atttcccccc tcctcaacct 480 ctggaaacta ccattctatt ttctgcctcc gtagttttgc ccactctaag tacctcacat 540 aagtggaatt tgtcttattt gcctgtttgt gaccggctga tttcatttag tataatgtcc 600 tcaagtttta ttcacgttat atagcatatg tcataatttt cttcactttt aagcttgagt 660 aatatttcat cgtatgtatc tcacattttg cttatccatt catctctcag tggacacttg 720 agttgcttct acattttagc tgttgtgaat actgctgcta tgaacatggg tgtataaata 780 tctcaagacc tttttatcag ttttttaaaa tatatactca gtagtagttt agctggatta 840 tatggtaatt ttatttttaa tttttgagga actgtcctac ccttttattc aatagtagct 900 ataccaattg acaattggca ttcctaccaa cagggcataa gggttctcaa ttctccacat 960 120
ΕΡ 1 600 510 /PT attccctgat acttgttatt ttcaggtgtt tttttttttt tttttttttt atgggagcca 1020 tgttaatggg tgtaaggtga tatttcatta tagttttgat ttgcatttcc ctaatgatta 1080 gtgatgttaa gcatctcttc atgtgcctat tggccatttg tatatcttct ttaaaaatat 1140 atatatactc attcctttgc ccatttttga attatgttta ttttttgtta ttgagtttca 1200 atacttttct atataaccta ggtattaatc ctttatcaga cttaagattt gcaaatattc 1260 tctttcattc cacaggttgc taattctctc tgttggtaat atcttttgat gctgttgtgt 1320 ccagaattga ttcattcctg tgggttcttg gtctcactga cttcaagaat aaagctgcgg 1380 accctagtgg tgagtgttac acttcttata gatggtgttt ccggagtttg ttccttcaga 1440 tgtgtccaga gtttcttcct tccaatgggt tcatggtctt gctgacttca ggaatgaagc 1500 cgcagacctt cgcagtgagg tttacagctc ttaaaggtgg cgtgtccaga gttgtttgtt 1560 ccccctggtg ggttcgtggt cttgctgact tcaggaatga agccgcagac cctcgcagtg 1620 agtgttacag ctcataaagg tagtgcggac acagagtgag ctgcagcaag atttactgtg 1680 aagagcaaaa gaacaaagct tccacagcat agaaggacac cccagcgggt tcctgctgct 1740 ggctcaggtg gccagttatt attcccttat ttgccctgcc cacatcctgc tgattggtcc 1800 attttacaga gtactgattg gtccatttta cagagtgctg attggtgcat ttacaatcct 1860 ttagctagac acagagtgct gattgctgca ttcttacaga gtgctgattg gtgcatttac 1920 agtcctttag ctagatacag aacgctgatt gctgcgtttt ttacagagtg ctgattggtg 1980 catttacaat cctttagcta gacacagtgc tgattggtgg gtttttacag agtgctgatt 2040 ggtgcgtctt tacagagtgc tgattggtgc atttacaatc ctttagctag acacagagtg 2100 ctgattggtg cgtttataat cctctagcta gacagaaaag ttttccaagt ccccacctga 2160 ccgagaagcc ccactggctt cacctctcac tgttatactt tggacatttg tccccccaaa 2220 atctcatgtt gaaatgtaac ccctaatgtt ggaactgagg ccagactgga tgtggctggg 2280 ccatgggga 2289 <210> 52 <211> 1184
<212> ADN <213> Sequência Artificial <220> <223> sequência de STAR52 <400> 52 cttatgccat ctggcggtgc catgtggaac ttcgctgaag aagctaaatt tactgaccat 60 120 ctgtgcctag agcgggtttc tccaaggaaa ggctctgtaa atctcgtcct tttgaaatct 121
ΕΡ 1 600 510 /PT aggggaaaac agcctccttc actgaggatt aatttaaaga aagggggaaa taggaaaatt 180 ccatgcgttg gaagtccatt tagatttcta catgaaccat catatatgtg cactacataa 240 ttcttatttt tttattttta aaaaagggat aatttatatt ccagtgacaa gtttgggaaa 300 ggccaaggca agcaattgag ttgaacatta tgtagcgttt atatagacct tgcagacgtc 360 tgtgcaatat ccaccactga acacgtgagg tcgtactcaa gtctctctgg cccctggtaa 420 tgtgactccc ttcctttatt tgcatgaatc gcctggattg ggtgtcaggt ttttaaaacg 480 tcaaggttta cgcctattgt tgtcaaccaa tcagcatcct actttgacgt gattggcttc 540 tactgtaggt gtcaatcatc caaaatttgc atactactcc tcaggccgcc gggagcctgt 600 cagtcggctg tggcagctgg aagagaagga atcggacgga gaagaatgaa aaatcacttt 660 gctttcgcaa agcgaaagaa aagtattctt ttcctcatta tttttaaata aatttgattg 720 tatatttacc taataaaata aacattcaat taaacaaaaa taagcaacta tcaaagattt 780 gtttactaat tttcgtaatg tttactgttt caataagtag ccaaaggaat attaaaacac 840 aaaaatatga atgctgataa ttttatgtca taaagaccat tttaaaacta aaagtgaaca 900 tggggtttct aaataaaatt accgtggtag cgtaaaaaca ctgctttcaa tacttgggca 960 tgctgaaagt gctgcatcct aagataaaaa atacaccaag ggggggattt caaagaacat 1020 tattttgctt ttaataatcc tgtatttctg tcactttgcc ctttttattt atttaccgtg 1080 aactcacaga cagaatatta cttggagttt ctgaaatact tgtgtttgta catttctcat 1140 cttacacgta cccacacacc ccaaaataaa aaaacaaaga agag 1184 < 210 > 53 <211> 1431
<212> ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR53 <400> 53 ccctgaggaa gatgacgagt aactccgtaa gagaaccttc cactcatccc ccacatccct 60 gcagacgtgc tattctgtta tgatactggt atcccatctg tcacttgctc cccaaatcat 120 tcccttctta caattttcta ctgtacagca ttgaggctga acgatgagag atttcccatg 180 ctctttctac tccctgccct gtatatatcc ggggatcctc cctacccagg atgctgtggg 240 gtcccaaacc ccaagtaagc cctgatatgc gggccacacc tttctctagc ctaggaattg 300 ataacccagg cgaggaagtc actgtggcat gaacagatgg ttcacttcga ggaaccgtgg 360 aaggcgtgtg caggtcctga gatagggcag aatcggagtg tgcagggtct gcaggtcagg 420 aggagttgag attgcgttgc cacgtggtgg gaactcactg ccacttattt ccttctctct 480 122
ΕΡ 1 600 510 /PT tcttgcctca gcctcaggga tacgacacat gcccatgatg agaagcagaa cgtggtgacc 540 tttcacgaac atgggcatgg ctgcggaccc ctcgtcatca ggtgcatagc aagtgaaagc 600 aagtgttcac aacagtgaaa agttgagcgt catttttctt agtgtgccaa gagttcgatg 660 ttagcgttta cgttgtattt tcttacactg tgtcattctg ttagatacta acattttcat 720 tgatgagcaa gacatactta atgcatattt tggtttgtgt atccatgcac ctaccttaga 780 aaacaagtat tgtcggttac ctctgcatgg aacagcatta ccctcctctc tccccagatg 840 tgactactga gggcagttct gagtgtttaa tttcagattt tttcctctgc atttacacac 900 acacgcacac aaaccacacc acacacacac acacacacac acacacacac acacacacac 960 acacaccaag taccagtata agcatctgcc atctgctttt cccattgcca tgcgtcctgg 1020 tcaagctccc ctcactctgt ttcctggtca gcatgtactc ccctcatccg attcccctgt 1080 agcagtcact gacagttaat aaacctttgc aaacgttccc cagttgtttg ctcgtgccat 1140 tattgtgcac acagctctgt gcacgtgtgt gcatatttct ttaggaaaga ttcttagaag 1200 tggaattgct gtgtcaaagg agtcatttat tcaacaaaac actaatgagt gcgtcctcgt 1260 gctgagcgct gttctaggtg ctggagcgac gtcagggaac aaggcagaca ggagttcctg 1320 acccccgttc tagaggagga tgtttccagt tgttgggttt tgtttgtttg tttcttctag 1380 agatggtggt cttgctctgt ccaggctaga gtgcagtggc atgatcatag c 1431 < 210 > 54 <211> 975
< 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR54 < 4 0 0 > 54 ccataaaagt gtttctaaac tgcagaaaaa tccccctaca gtcttacagt tcaagaattt 60 tcagcatgaa atgcctggta gattacctga ctttttttgc caaaaataag gcacagcagc 120 tctctcctga ctctgacttt ctatagtcct tactgaatta tagtccttac tgaattcatt 180 cttcagtgtt gcagtctgaa ggacacccac attttctctt tgtctttgtc aattctttgt 240 gttgtaaggg caggatgttt aaaagttgaa gtcattgact tgcaaaatga gaaatttcag 300 agggcatttt gttctctaga ccatgtagct tagagcagtg ttcacactga ggttgctgct 360 aatgtttctg cagttcttac caatagtatc atttacccag caacaggata tgatagagga 420 cttcgaaaac cccagaaaat gttttgccat atatccaaag ccctttggga aatggaaagg 480 aattgcgggc tcccattttt atatatggat agatagagac caagaaagac caaggcaact 540 123 ΕΡ 1 600 510 /PT ccatgtgctt tacattaata aagtacaaaa tgttaacatg taggaagtct aggcgaagtt 600 tatgtgagaa ttctttacac taattttgca acattttaat gcaagtctga aattatgtca 660 aaataagtaa aaatttttac aagttaagca gagaataaca atgattagtc agagaaataa 720 gtagcaaaat cttcttctca gtattgactt ggttgctttt caatctctga ggacacagca 780 gtcttcgctt ccaaatccac aagtcacatc agtgaggaga ctcagctgag actttggcta 840 atgttggggg gtccctcctg tgtctcccca ggcgcagtga gcctgcaggc cgacctcact 900 cgtggcacac aactaaatct ggggagaagc aacccgatgc cagcatgatg cagatatctc 960 agggtatgat cggcc 975 < 210 > 55 <211> 501
< 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR55 <400> 55 cctgaactca tgatccgccc acctcagcct cctgaagtgc tgggattaca ggtgtgagcc 60 accacaccca gccgcaacac actcttgagc aaccaatgtg tcataaaaga aataaaatgg 120 aaatcagaaa gtatcttgag acagacaaaa atggaaacac aacataccaa aatttatggg 180 acacagcaaa agcagtttta ggagggaagt ttatagtgat gaatacctac ctcaaaatca 240 ttagcctgat tggatgacac tacagtgtat aaatgaattg aaaaccacat tgtgccccat 300 acatatatac aatttttatt tgttaattaa aaataaaata aaactttaaa aaagaagaaa 360 gagctcaaat aaacaaccta actttatacc tcaaggaaat agaagagcca gctaagccca 420 aagttgacag aaggaaaaaa atattggcag aaagaaatga aacagagact agaaagacaa 480 ttgaagagat cagcaaaact a 501 <210> 56 <211> 741
< 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR56 <400> 56 acacaggaaa agatcgcaat tgttcagcag agctttgaac cggggatgac ggtctccctc 60 gttgcccggc aacatggtgt agcagccagc cagttatttc tctggcgtaa gcaataccag 120 gaaggaagtc ttactgctgt cgccgccgga gaacaggttg ttcctgcctc tgaacttgct 180 240 gccgccatga agcagattaa agaactccag cgcctgctcg gcaagaaaac gatggaaaat 124
ΕΡ 1 600 510 /PT gaactcctca aagaagccgt tgaatatgga cgggcaaaaa agtggatagc gcacgcgccc ttattgcccg gggatgggga gtaagcttag tcagccgttg tctccgggtg tcgcgtgcgc agttgcacgt cattctcaga cgaaccgatg actggatgga tggccgccgc agtcgtcaca ctgatgatac ggatgtgctt ctccgtatac accatgttat cggagagctg ccaacgtatg gttatcgtcg ggtatgggcg ctgcttcgca gacaggcaga acttgatggt atgcctgcga tcaatgccaa acgtgtttac cggatcatgc gccagaatgc gctgttgctt gagcgaaaac ctgctgtacc gccatcgaaa cgggcacata caggcagagt ggccgtgaaa gaaagcaatc agcgatggtg ctctgacggg ttcgagttct gctgtgataa cggagagaga ctgcgtgtca cgttcgcgct ggactgctgt g <210> 57 <211> 1365 <212> ADN <213> Sequência Artificial <220> <223> sequência de STAR57 <400> 57 tccttctgta aataggcaaa atgtatttta gtttccacca cacatgttct tttctgtagg gcttgtatgt tggaaatttt atccaattat tcaattaaca ctataccaac aatctgctaa ttctggagat gtggcagtga ataaaaaagt tatagtttct gattttgtgg agcttggact ttaatgatgg acaaaacaac acattcttaa atatatattt catcaaaatt atagtgggtg aattatttat atgtgcattt acatgtgtat gtatacataa atgggcggtt actggctgca ctgagaatgt acacgtggcg cgaacgaggc tgggcggtca gagaaggcct cccaaggagg tggctttgaa gctgagtggt gcttccacgt gaaaaggctg gaaagggcat tccaagaaaa ggctgaggcc agcgggaaag aggttccagt gcgctctggg aacggaaagc gcacctgcct gaaacgaaaa tgagtgtgct gaaataggac gctagaaagg gaggcagagg ctggcaaaag cgaccgagga ggagctcaaa ggagcgagcg gggaaggccg ctgtggagcc tggaggaagc acttcggaag cgcttctgag cgggtaaggc cgctgggagc atgaactgct gagcaggtgt gtccagaatt cgtgggttct tggtctcact gacttcaaga atgaagaggg accgcggacc ctcgcggtga gtgttacagc tcttaaggtg gcgcgtctgg agtttgttcc ttctgatgtt cggatgtgtt cagagtttct tccttctggt gggttcgtgg tctcgctggc tcaggagtga agctgcagac cttcgcggtg agtgttacag ctcataaaag cagggtggac tcaaagagtg agcagcagca agatttattg caaagaatga aagaacaaag cttccacact gtggaagggg 960
1020 125 ΕΡ 1 600 510 /PT accccagcgg gttgccactg ctggctccgc agcctgcttt tattctctta tctggcccca cccacatcct gctgattggt agagccgaat ggtctgtttt gacggcgctg attggtgcgt ttacaatccc tgcgctagat acaaaggttc tccacgtccc caccagatta gctagataga gtctccacac aaaggttctc caaggcccca ccagagtagc tagatacaga gtgttgattg gtgcattcac aaaccctgag ctagacacag ggtgatgact ggtgtgttta caaaccttgc ggtagataca gagtatcaat tggcgtattt acaatcactg agctaggcat aaaggttctc caggtcccca ccagactcag gagcccagct ggcttcaccc agtgg 1080 1140 1200 1260 1320 1365 < 210 > 58 <211> 1401
< 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR58 <400> 58 aagtttacct tagccctaaa ttatttcatt gtgattggca ttttaggaaa tatgtattaa ggaatgtctc ttaggagata aggataacat atgtctaaga aaattatatt gaaatattat tacatgaact aaaatgttag aactgaaaaa aaattattgt aactccttcc agcgtaggca ggagtatcta gataccaact ttaacaactc aactttaaca acttcgaacc aaccagatgg ctaggagatt cacctattta gcatgatatc ttttattgat aaaaaaatat aaaacttcca ttaaattttt aagctactac aatcctatta aattttaact taccagtgtt ctcaatgcta cataatttaa aatcattgaa atcttctgat tttaactcct cagtcttgaa atctacttat ttttagttac atatatatcc aatctactgc cgctagtaga agaagcttgg aatttgagaa aaaaatcaga cgttttgtat attctcatat tcactaattt attttttaaa tgagtttctg caatgcatca agcagtggca aaacaggaga aaaattaaaa ttggttgaaa agatatgtgt gccaaacaat cccttgaaat ttgatgaagt gactaatcct gagttattgt ttcaaatgtg tacctgttta tacaagggta tcacctttga aatctcaaca ttaaatgaaa ttttataagc aatttgttgt aacatgatta ttataaaatt ctgatataac attttttatt acctgtttag agtttaaaga gagaaaagga gttaagaata attacatttt cattagcatt gtccgggtgc aaaaacttct aacactatct tcaaatcttt ttctccattg ccttctgaac atacccactt gggtatctca ttagcactgc aaattcaaca ttttcgattg ctaatttttc tccctaaata tttatttgtt ttctcagctt tagccaatgt ttcactattg accatttgct caagtatagt gacgcttcaa tgaccttcag agagctgttt cagtccttcc tggactactt gcatgcttcc aacaaaatga agcactcttg atgtcagtca ctcaaataaa tggaaatggg cccatttact 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 126
ΕΡ 1 600 510 /PT aggaatgtta acagaataaa aagatagacg tgacaccagt tgcttcagtc catctccatt tacttgctta aggcctggcc atatttctca cagttgatat ggcgcagggc acatgtttaa atggctgttc ttgtaggatg gtttgactgt tggattcctc atcttccctc tccttaggaa ggaaggttac agtagtactg ttggctcctg gaatatagat tcataaagaa ctaatggagt atcatctccc actgctcttg t <210> 59 <211> 866 < 212 > ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR59 <400> 59 gagatcacgc cactgcactc cagcctgggg gacagagcaa gactccatct cagaaacaaa caaacacaca aagccagtca aggtgtttaa ttcgacggtg tcaggctcag gtctcttgac aggatacatc cagcacccgg gggaaacgtc gatgggtggg gtggaatcta ttttgtggcc tcaagggagg gtttgagagg tagtcccgca agcggtgatg gcctaaggaa gcccctccgc ccaagaagcg atattcattt ctagcctgta gccacccaag agggagaatc gggctcgcca cagaccccac aacccccaac ccaccccacc cccacccctc ccacctcgtg aaatgggctc tcgctccgtc aggctctagt cacaccgtgt ggttttggaa cctccagcgt gtgtgcgtgg gttgcgtggt ggggtggggc cggctgtgga cagaggaggg gataaagcgg cggtgtcccg cgggtgcccg ggacgtgggg cgtggggcgt gggtggggtg gccagagcct tgggaactcg tcgcctgtcg ggacgtctcc cctcctggtc ccctctctga cctacgctcc acatcttcgc cgttcagtgg ggaccttgtg ggtggaagtc accatccctt tggactttag ccgacgaagg ccgggctccc aagagtctcc ccggaggcgg ggccttgggc aggctcacaa ggatgctgac ggtgacggtt ggtgacggtg atgtacttcg gaggcctcgg gccaatgcag aggtatccat ttgacctcgg tgggacaggt cagctttgcg gagtcccgtg cgtccttcca gagactcatc cagcgctagc aagcatggtc ccgagg <210> 60 <211> 2067
<212> ADN <213> Sequência Artificial <220> <223> sequência de STAR60 127
ΕΡ 1 600 510 /PT < 2 2 0 > < 2 21> misc_feature < 2 2 2 > (92)..(1777) < 2 2 3 > Todos os "N" nas várias posições representam qualquer ácido nucleico < 4 0 0 > 6 0 agcagtgcag aactggggaa gaagaagagt ccctacacca cttaatactc aaaagtactc 60 gcaaaaaata acacccctca ccaggtggca tnattactct ccttcattga gaaaattagg 120 aaactggact tcgtagaagc taattgcttt atccagagcc acctgcatac aaacctgcag 180 cgccacctgc atacaaacct gtcagccgac cccaaagccc tcagtcgcac caagcctctg 240 ctgcacaccc tcgtgccttc acactggccg ttccccaagc ctggggcata ctncccagct 300 ctgagaaatg tattcatcct tcaaagccct gctcatgtgt cctnntcaac aggaaaatct 360 cccatgagat gctctgctat ccccatctct cctgccccat agcttaggca nacttctgtg 420 gtggtgagtc ctgggctgtg ctgtgatgtg ttcgcctgcn atgtntgttc ttccccacaa 480 tgatgggccc ctgaattctc tatctctagc acctgtgctc agtaaaggct tgggaaacca 540 ggctcaaagc ctggcccaga tgccaccttt tccagggtgc ttccgggggc caccaaccag 600 agtgcagcct tctcctccac caggaactct tgcagcccca cccctgagca cctgcacccc 660 attacccatc tttgtttctc cgtgtgatcg tattattaca gaattatata ctgtattctt 720 aatacagtat ataattgtat aattattctt aatacagtat ataattatac aaatacaaaa 780 tatgtgttaa tggaccgttt atgttactgg taaagcttta agtcaacagt gggacattag 840 ttaggttttt ggcgaagtca aaagttatat gtgcattttc aacttcttga ggggtcggta 900 cntctnaccc ccatgttgtt caanggtcaa ctgtctacac atatcatagc taattcacta 960 cagaaatgtt agcttgtgtc actagtatct ccccttctca taagcttaat acacatacct 1020 tgagagagct cttggccatc tctactaatg actgaagttt ttatttatta tagatgtcat 1080 aataggcata aaactacatt acatcattcg agtgccaatt ttgccacctt gaccctcttt 1140 tgcaaaacac caacgtcagt acacatatga agaggaaact gcccgagaac tgaagttcct 1200 gagaccagga gctgcaggcg ttagatagaa tatggtgacg agagttacga ggatgacgag 1260 agtaaatact tcatactcag tacgtgccaa gcactgctat aagcgctctg tatgtgtgaa 1320 gtcatttaat cctcacagca tcccacggtg taattatttt cattatcccc atgagggaac 1380 agaaactcag aacggttcaa cacatatgcg agaagtcgca gccggtcagt gagagagcag 1440 gttcccgtcc aagcagtcag accccgagtg cacactctcg acccctgtcc agcagactca 1500 ctcgtcataa ggcggggagt gntctgtttc agccagatgc tttatgcatc tcagagtacc 1560 caaaccatga aagaatgagg cagtattcan gagcagatgg ngctgggcag taaggctggg 1620 128
ΕΡ 1 600 510 /PT cttcagaata gctggaaagc tcaagtnatg ggacctgcaa gaaaaatcca ttgtttngat 1680 aaatagccaa agtccctagg ctgtaagggg aaggtgtgcc aggtgcaagt ggagctctaa 1740 tgtaaaatcg cacctgagtc tcctggtctt atgagtnctg ggtgtacccc agtgaaaggt 1800 cctgctgcca ccaagtgggc catggttcag ctgtgtaagt gctgagcggc agccggaccg 1860 cttcctctaa cttcacctcc aaaggcacag tgcacctggt tcctccagca ctcagctgcg 1920 aggcccctag ccagggtccc ggcccccggc ccccggcagc tgctccagct tccttcccca 1980 cagcattcag gatggtctgc gttcatgtag acctttgttt tcagtctgtg ctccgaggtc 2040 actggcagca ctagccccgg ctcctgt 2067 <210> 61 <211> 1470
<212> ADN <213> Sequência Artificial <220> <223> sequência de STAR61 < 2 2 0 > < 2 21> misc_feature < 2 2 2 > (130)..(976) <223> "N" representa qualquer ácido nucleico em várias posições <400> 61 cagcccccac atgcccagcc ctgtgctcag ctctgcagcg gggcatggtg ggcagagaca 60 cagaggccaa ggccctgctt cggggacggt gggcctggga tgagcatggc cttggccttc 120 gccgagagtn ctcttgtgaa ggaggggtca ggaggggctg ctgcagctgg ggaggagggc 180 gatggcactg tggcangaag tgaantagtg tgggtgcctn gcaccccagg cacggccagc 240 ctggggtatg gacccggggc cntctgttct agagcaggaa ggtatggtga ggacctcaaa 300 aggacagcca ctggagagct ccaggcagag gnacttgaga ggccctgggg ccatcctgtc 360 tcttttctgg gtctgtgtgc tctgggcctg ggcccttcct ctgctccccc gggcttggag 420 agggctggcc ttgcctcgtg caaaggacca ctctagactg gtaccaagtc tggcccatgg 480 cctcctgtgg gtgcaggcct gtgcgggtga cctgagagcc agggctggca ggtcagagtc 540 aggagaggga tggcagtgga tgccctgtgc aggatctgcc taatcatggt gaggctggag 600 gaatccaaag tgggcatgca ctctgcactc atttctttat tcatgtgtgc ccatcccaac 660 aagcagggag cctggccagg agggcccctg ggagaaggca ctgatgggct gtgttccatt 720 taggaaggat ggacggttgt gagacgggta agtcagaacg ggctgcccac ctcggccgag 780 840 agggccccgt ggtgggttgg caccatctgg gcctggagag ctgctcagga ggctctctag 129
ΕΡ 1 600 510 /PT ggctgggtga ccaggnctgg ggtacagtag ccatgggagc aggtgcttac ctggggctgt 900 ccctgagcag gggctgcatt gggtgctctg tgagcacaca cttctctatt cacctgagtc 960 ccnctgagtg atgagnacac ccttgttttg cagatgaatc tgagcatgga gatgttaagt 1020 ggcttgcctg agccacacag cagatggatg gtgtagctgg gacctgaggg caggcagtcc 1080 cagcccgagg acttcccaag gttgtggcaa actctgacag catgacccca gggaacaccc 1140 atctcagctc tggtcagaca ctgcggagtt gtgttgtaac ccacacagct ggagacagcc 1200 accctagccc cacccttatc ctctcccaaa ggaacctgcc ctttcccttc attttcctct 1260 tactgcattg agggaccaca cagtgtggca gaaggaacat gggttcagga cccagatgga 1320 cttgcttcac agtgcagccc tcctgtcctc ttgcagagtg cgtcttccac tgtgaagttg 1380 ggacagtcac accaactcaa tactgctggg cccgtcacac ggtgggcagg caacggatgg 1440 cagtcactgg ctgtgggtct gcagaggtgg 1470
< 210 > 62 <211> 1011 < 212 > ADN <213> Sequência Artificial <220> <223> sequência de STAR62 <400> 62 agtgtcaaat agatctacac aaaacaagat aatgtctgcc catttttcca aagataatgt 60 ggtgaagtgg gtagagagaa atgcatccat tctccccacc caacctctgc taaattgtcc 120 atgtcacagt actgagacca gggggcttat tcccagcggg cagaatgtgc accaagcacc 180 tcttgtctca atttgcagtc taggccctgc tatttgatgg tgtgaaggct tgcacctggc 240 atggaaggtc cgttttgtac ttcttgcttt agcagttcaa agagcaggga gagctgcgag 300 ggcctctgca gcttcagatg gatgtggtca gcttgttgga ggcgccttct gtggtccatt 360 atctccagcc cccctgcggt gttgctgttt gcttggcttg tctggctctc catgccttgt 420 tggctccaaa atgtcatcat gctgcacccc aggaagaatg tgcaggccca tctcttttat 480 gtgctttggg ctattttgat tccccgttgg gtatattccc taggtaagac ccagaagaca 540 caggaggtag ttgctttggg agagtttgga cctatgggta tgaggtaata gacacagtat 600 cttctctttc atttggtgag actgttagct ctggccgcgg actgaattcc acacagctca 660 cttgggaaaa ctttattcca aaacatagtc acattgaaca ttgtggagaa tgagggacag 720 agaagaggcc ctagatttgt acatctgggt gttatgtcta taaatagaat gctttggtgg 780 tcaactagac ttgttcatgt tgacatttag tcttgccttt tcggtggtga tttaaaaatt 840 atgtatatct tgtttggaat atagtggagc tatggtgtgg cattttcatc tggctttttg 900
960 130 ΕΡ 1 600 510 /PT tttagctcag cccgtcctgt tatgggcagc cttgaagctc agtagctaat gaagaggtat cctcactccc tccagagagc ggtcccctca cggctcattg agagtttgtc a <210> 63 <211> 1410 <212> ADN <213> Sequência Artificial <220> <223> sequência de STAR63 <400> 63 gcgtctgagc cgctgggaac ccatgagccc cgtccatgga gttgaggaag ggggttcgcc ccacggggtg ggcgccctct acacagcgcg cttcctcttc tctcgttagc gccgcgggac cagcctctgg ttctgcacct cgcgctctgg gagcagcgcc cggctttggc gagcgcttcc ccggggctgc ccagcctctg ctccgctcgc cccgccaggc ccggctccgc gaagccccca gggtccagtc caaggccccg attccccaag gccagggccc cggggcagca ttggaacagg gcgcggacgc cagtcctccg agcatggagt aactgcagct tttgagaaaa gaaagcggac cccaccccat cgagaacgcg gcgccttgtt tagggacgtt cctgggccgt cacggagtgt cgccggctcc tcggcccctc cctcctccaa gcccccaccc ccgacagcgg cctccctggg gacctcccct cgggctgcgc tttcagccca aacacaggga ggtcttccag gagcctgccc agtccccaca gcagcccaga gacccccact cccacctgta cctgccaagc cttcagagag ggcggcctgg acatgccccg cacgggagga gccccgcctc agcacccctg caagtggcag caacccagaa cacccgtgag aggcctctga gcagcccagg aagtggctgg aagacgcata ggcagctcac tcctctgtaa gagcaaggac cggagaacac atgctgaccc ctgcttttgc agaggggcga tgcttcagga caggcgcgct cagcaggtgt ccatcttatt tcacaccttt gtgtttatat catcttattt tgcattttat gtctaattaa caatatgcag ctggccaggc gcagtggctc aagcctctaa tcccagcact ttgggaggcc gaggcaggtg tatcacttga gggcaggagt tcgggaccgg cctgggcaac atagcaaaac cccattgcta ataaaaatac aaaaattagc cagccatggt ggcgggcacc tgcagtccca gctactccgg aagctgaagc aggagaatca cttgaaccca ggaggcggag gtggcagtga gctatcaagc cattacactc cagcctgggc aacagagaaa gactgtctca aaaaaaaatt aatacgcagc agaatattat gtggtcagcc caagcagtcc cccccactca gccctctgtc cctacagctc caggcactcc cccagcccct cccctggaca agaggtaatg cccagagggt gaaaatccac caaggttaag ccagaaacaa aaagctcaaa gcttcggcat ctccctccgc tcagaccctt agagcagatt 1011 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 131
ΕΡ 1 600 510 /PT cctctcatcg acagcacgat caggctgtgg 1410 <210> 64 <211> 1414
<212> ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de STAR64 < 4 0 0 > 6 4 agagatcttt taagggctca aaagaccctg cggctcccct gccaatagct ctgccatcgt 60 ccccagagct ttcgaggacc ctccaccatc ggcgccaacc ccagctgagc tgggtgctcg 120 tctgcaggcc tctgctccat ctcagcctga gcatgaggct ctgctgtgct gcttccagca 180 gcagggacag ggctgatgag cctggccctt gcaagcatct tcctgtgccg aatacaattc 240 cacagacaga ggatttaaaa tccaagtgga ggtgacagga aagaaaggaa aacctccagg 300 tatcagaaga aaggaggggg tgtgaagaca gtatgggagg aaggtcaggc tggggctcag 360 ctctgggaag tgccagcctg aacaggagtc acgcccgggt ccacatgcaa gggaatgagg 420 accgaggccc tgcatgtggc agggccttcc gcaggctgcc ccgtctgtga acaggacacc 480 agaagaagtc tgccttccag cctggcaaag tggcaaggaa cctctgggtg ggaaaacaaa 540 tcaacaaaca aattgtcagt aaaaaacaga aacctcacac tttcctttct cttgacctct 600 tgaaaaaagc aaatccactg cagctcacca aaggcaaaga gaaaacctta agaataccca 660 gagagaaaag acacgttact tgcaaaagaa catctaatgc agggagataa tgaaaataca 720 gactcttcaa agggctgaag gaaaaaaacc gtccacctag aattctatcc ccaaactgtc 780 atctgagagc aagggcaaaa caaacgcttt ctcagacagg ctggacgagg tcgctcacgc 840 ctgtaatcct agcactttgg gaggccaagg tgggaggacc gctttaagcc agaagtttga 900 gaccagtgtg ggtaacataa tgagacccca tctctaagaa aaagaaatta aataagacaa 960 gactttttca gacaacaagt gctctgagag ctggcctatc ttggctgtct tgtaaagaat 1020 tgctgcgaga cacctcatta ggaaagagac tgaatctaga aggaaagagc agagcatgag 1080 gtacaatgag gagcaaataa acaggtcacc atataagcaa acccaaatac acattcacta 1140 tacgaaacaa taaaaatgac tcatttgggg ggttaaaaca ctgttgaact aaaatcctgg 1200 ataacagcag catgaaaggt ggggtggtgg tcccaggaaa gcattcaaag gtccatgtct 1260 catttgggag gagggtaggg agactcatga acttgaggct cccttcaggc aagcacagtg 1320 caaaaaaatt ataataatgg gaaacagata cagtagactg tgatgtacaa ctctcagagc 1380 agtagaaggg agggtataaa acaaatctga tcca 1414 132
ΕΡ 1 600 510 /PT <210 > 65 <211> 1310
<212> ADN <213> Sequência Artificial <220> <223> sequência de STAR65 <400> 65 tcgagaccag cctggccaac atggtgaaac attgtctcta ttacaaatac aaaaattagc 60 caggtgtagt ggtgcatgcc tgcagtccca gccatttggg aggctgaagt tggagaatcg 120 cttaaacctg ggaggtggag gttgcattga gccgagaagc actccagcct ggatgacgga 180 gcaagactgt ctcaaaaaga aaaaaaaaag aagcagcagc aaatatccct gtcctgatgg 240 aggctatata acaaccaaac aagtgaatgc ataagacaat ttcaaggtta tggtagatac 300 cataagtggg agatgaacaa tgagaacaca tggacacagg gaggagaaca tcacacactg 360 gggcctctcg gggggtgggg aaataggggg tgatagcatt aggagaaata cctaatgtcg 420 ataacaggtt agtgggtgca gcaaaccacc atggcacgtg tatatctatg taacacacct 480 gcacgttctg cacatgtatc ccagaactta aagtataata aaaaaagaca ttaaaaaatt 540 atgatataaa atcccaattc aagttgtttt aaaaagagaa aacaattatc tttatataat 600 agcggaaaat atagatggcg gaattaaagc ctcgtcatat tttctaacag aactttctga 660 taaacttgat taaataaaaa ttttaaatat cactaaacac atagaagaaa taaatttaaa 720 ccttcacaaa aaataaagta caatgaatga agacaaggtg tacttgaaaa aagaactgaa 780 taaatattct acatataaaa aaaatctgat gatattgtgg tgattcttta ctttgctact 840 agtttctctt tttttcttct gaaaaatttc ttgggatgta tttggtttca ttagtaaaat 900 tctaagtttc tttgcaatct gaacattgga gcttcatcca tagccagtat gccctaacat 960 tatctttgga caactgtaaa attagaacac tgccagacat atttaatgta tgatgtatat 1020 caacactggg acacatttta tactatcttt attccaaaat caaatgattc actgtggttt 1080 ataaatgtac atggatatat ctctacctaa gcagatagtt aggagagtta gtaaaaatga 1140 ggtggaaaat aggagtcact gtcccttcac agggagagaa ttctgctttt ctcctaatat 1200 accctttgct tgaacagact ccaacccctc atcttttgtc ctttaaatga ccacatttat 1260 tttaactttg ataaacaaca cagaaagata tttgatccat caacattcac 1310 < 210 > 66 <211> 2500
<212> ADN <213> Sequência Artificial < 2 2 0 > <223> sequência de T2F (STAR66F) 133
ΕΡ 1 600 510 /PT <400> 66 gcaggttgga tggtgctgac ccctcctcgg gttggcttcc tgtctccagg tggacgtcct 60 gtactccagg gtctgcaagc ctaaaaggag ggacccagga cccaccacag acccgctgga 120 ccccaagggc cagggagcga ttctggccct ggcgggtgac ctggcctacc agaccctccc 180 gctcagggcc ctggatgtgg acagcggccc cctggaaaac gtgtatgaga gcatccggga 240 gctgggggac cctgctggca ggagcagcac gtgcggggct gggacgcccc ctgcttccag 300 ctgccccagc ctagggaggg gctggagacc cctccctgcc tccctgccct gaacactcaa 360 ggacctgtgc tccttcctcc agagtgaggc ccgtcccccg ccccgccccg cctcacagct 420 gacagcgcca gtcccaggtc cccgggctgc cagcccgtga ggtccgtgag gtcctggccg 480 ctctgacagc cgcggcctcc ccgggctcca gagaaggccc gcgtctaaat aaagcgccag 540 cgcaggatga aagcggccag cctcgcagcc tgctcttctt gaaagctggg cgggttgggg 600 cggggggctt ctctggaagg cttggagctg tcccctctgg ccttggggga ctggctgccc 660 ccggggcgcc cgggcctagc cgaggcggtg ctcctgccgg ccagactctc ggtcagtgcg 720 ggcacggggt cccagccact cctagggggc agcgcagccg gcagggtggc cgcccccggg 780 tgggacttgg accctggact ccacgggagg gctccgccac ccagcctggt gttacataag 840 gggtggtgga ggtgggcagt cgagcgttaa agagtaacct gctgccggga agcccgccaa 900 gcaatcgcgg ccccttcccc ggctctggca gctctgcgag cgcgcccgtg gggaacgggc 960 cctccccggc ggggcgcgcg ggcgcgcgag gtgggcggag gcctcggagc tgtgccgggc 1020 cgggcctccc tccctaggcc agcgcgggag cgacccggag ggggcgggcc cggggcgggg 1080 cctcgaagcg ctggccggcg ggagcgcggc cggccgggcc cgcccgcctg cggtgtggac 1140 gccgcgcggc caatgcgcgc gccgggacgg gacgggacgg ggcggggcgg ggcgggacga 1200 gacggggcgg ggcggggcgg gccgggcagc ctccgggcgg cgcggcgcgg gcggcggccg 1260 gatccagggc gggggtcggc ggcccggcca gcccggcccg gcccggggcc gcgtcctgag 1320 agtcagccct cgccgctgca gcctcggcgc ccggccggcc ggccatggag cgccccccgc 1380 cccgcgccgc cggccgggac cccagtgcgc tgcgggccga ggcgccgtgg ctgcgcgcgg 1440 agggtccggg gccgcgcgcc gcgcccgtga cggtgcccac gccgccgcag gtaccgggcg 1500 ccggtgggcg ggggcgccga ccaagtttct ctcgctgcaa agatggcgtc agtgctgccc 1560 aaacttcggg cccccggggg cggggcagcg gggagggcgg ccgcgtcggt ccgcgcgtgt 1620 ccgtgggtcc cgccggggct gcgccgggcg gccggggagc ccttcccgcc gcgccgggct 1680 99999c9999 ccgggggcgg ggccgcgccg tccacaccgg ccgcagccgg ttttcgaggc 1740 1800 gggcgccgag cggatccgcg gcggaggttg agggaccccc ctcccccggc caccgcctcc
134 ΕΡ 1 600 510 /PT gctgagtctg ccccctcccc atccgcaggg ctcttccgtg ggcggcggct tcgcgggctt ggagttcgcg cggccgcagg agtcggagcc gcgggcctcg gacctggggg ccccccggac gtggacgggg gcggcggcgg ggccccggac tccgtcggcg cacatccccg tcccagcgca gaggtgagcg ggaggcccgg tgcctcggga ctcggtgtgc gcaggggcgg tgggtggggt gcggagacac cggccccgac ggaggccagg tcagggcccc aggtttgtaa ttaccagcca cccccaagct cttcagccct ggaggagctg agcagaaatg atcgatgact gggagtccct acacctccct ccaccgcagt tcctcggggc tagagctcag aacccggagc gggtggctgt gcgtctctgt gcagaagagg ctgcgcggtc ggcatggggc gactgtccag gaatccctgg ggctcctgac cgccacctcc caacccctgc caggccggac acctcggtct ggctgccagg gcaggggcgg gccctggcct ggctcgctgg ggcctgggga gctgcccgtg cttccagccc agtctccccc tggctgctgc cggctgctgg ccactcccac ctcccaggcc tggcgtgagg cccacagctg ctgttgcaca accctggtta atgtgtgatg <210> 67 < 211> 2500 < 212 > ADN <213> Sequência Artificial <220> <223> sequência de T2R (STAR66R) <400> 67 gtttggggta gagagaacat actgattatg ggactttgct ttgcagctta gtgctgtcct gtcagtggga agcaacaggg ggcagaactc agcttgtgcc catagaggga atgtttatac taggcctgtc cagaggcaaa tcatccatcc tagcaattgg aacctgactt ttggcaagtc ctgccaccat gggctaaagt gttctggggt tctaaataaa catgaaaggc aacctagacc acaaggactg caattcctgc acaagtcctg gtgctgtgtt gggcttggag ccagggaact tggagtgcat ggaacctagt gagataccag ctgagacaac caaggaagtg cttgtgtcac ccctccacca accccaggca gtacagattg tacctccaag accccttcca tctgcttgag gaaggtggag gggaagagga ctttgttttg caacttggat tccagcccat ccacagtaga ataaggcaac gggcagactc ctaaggcccc catcccagac cctagctcct ggatgacatt tctaaacaca ccatgggcca gaagggaacc cattgccttg aagggaaggg cccagtcctg gcagaattta tcatgtgctg aataaacagc ccttgggccc tgaataatta gtattggtag ccaggcagta tttaccacag gccttgggtg agacccagag ccatgttggc ttcaggtgtg acccagcaca ttcccagctg tggtaacttt ggggagagac cacttctgct tgagaaaagg 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2500 60 120 180 240 300 360 420 480 540 600 660 720 780 135
ΕΡ 1 600 510 /PT agacagaaga gtaaaggggt ctttatcttg cagcctggta ccagcttggc cgcagtgggg 840 tagagcacca agagagcacc tgggataaac aaaatcaaaa aacctttagc tagactaaga 900 gtaaagagag aagacccaag taaatataat caaagacaaa aaaggagaga cattacaacc 960 aatacctcag aaattcaaag tatcattagc agctactttg aacaactata tgccagtaaa 1020 ttggaaaacc tagaagaatt atataaattc ctaacatata caacctacca agattgaacc 1080 atgaagaaat ttaaagcctg aataggccaa taacaagcaa tgagattgga gccctaatac 1140 aaagtttaca atgagaaaca ttgctcaaac aaatcataga tgacacaaac aaatggaaaa 1200 catccaatgc tcatggacag gaaaaaatat ttaaatttct atactgccca aagcagttta 1260 tacattcaat gctattcctg tcaaaatacc aatcttattc ttcacaaaaa aaaaattaaa 1320 aattacacag aaccaaaaaa gagcccaaat acccaaggca attttaagca aaaagaacaa 1380 agctggaggc atcacgttac ctgtgatcca cactataggg ctacagtaaa tgaaacagca 1440 aggtgctggt atacaaacag acacataaac caatggaata gaataaagag cttagaaata 1500 atgctccaca cctccagcca tccgatgttt gagaaagtag acataaacaa gcaatgagga 1560 gaggactccc tattcattaa atcaactcaa gacggaccaa aaacctaaat gtaaaacaaa 1620 caaacaaaaa aaataactgc taaaaccctg ggagatgacc taggaaatac cattctggac 1680 agtacctggt gaaaatttca tgctgaagac accaaaaaca attgcagcaa aagaaaaaat 1740 tgacatatgg gatcaaatta aactttagag cttttgcaca gcaaaataaa ctatcaacag 1800 agtaaatagg caccctacag gaagggagaa aatattttca atctgtgctc tgacaaagtc 1860 ctaatatcca gagcctataa ggaacttaaa caaatttaca aacaaaaaac aaacaacact 1920 attacgagtt ggaaaaggac atgaatcgac acttttcaaa agaagacata catgtggcta 1980 acaagcatat gaaaaaaatg ctcaacatta ctaatcatta gagaaatgca aatcaaaacc 2040 acaatgagat accatctcaa ccagtctgaa tggctgttat taaaaaaatc agaaaaaaac 2100 agatgctggc aaggttgtgg agaaaaggaa acacttatac attgttgggg ggagtgtaaa 2160 ttaattcagc cattgtggaa agtattgtgg tgattttcta aagaactaaa aaggaattac 2220 tattttacct ggaaatttca ttattgggta tatacccaaa gaaatatgaa ttattttact 2280 ataaagacag atgcatgcat gtgttcattg tagcactatt cacagtagca aagacatgtt 2340 atcaacctaa atgcccatta acagtaaact ggataaggaa aatatggtac atatacactg 2400 tggaatacta tgcagtcata aaaagaatga gataatgttc attgcagcaa catggatgga 2460 actggagacc attatccttg ggaaactaac aaagcaacag 2500
ΕΡ 1 600 510 /PT 136 <210> 68 <211> 13
<212> ADN <213> Sequência Artificial <220> <223> sequência de ΙοχΡ <400> 68 ataacttcgt ata <210> 69 <211> 13
<212> ADN <213> Sequência Artificial <220>
<223> sequência de FRT < 4 0 0 > 69 gaagttccta tac <210> 70 < 211 > 631
<212> ADN <213> Sequência Artificial <220> <223> elementos STAR em STAR3 directo < 2 2 0 > < 2 21> misc_feature < 2 2 2 > (5)..(630) <223> "N" representa qualquer ácido nucleico em várias posições <400> 70 acgtnctaag naaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt cttcactcga gcggccagct tggatctcga gtactgaaat aggagtaaat ctgaagagca aataagatga gccagaaaac catgaaaaga acagggacta ccagttgatt ccacaaggac attcccaagg tgagaaggcc atatacctcc actacctgaa ccaattctct gtatgcagat ttagcaaggt tataaggtag caaaagatta gacccaagaa aatagagaac ttccaatcca gtaaaaatca tagcaaattt attgatgata acaattgtct ccaaaggaac caggcagagt cgtgctagca gaggaagcac gtgagctgaa aacagccaaa tctgctttgt tttcatgaca caggagcata aagtacacac caccaactga cctattaagg ctgtggtaaa ccgattcata gagagaggtt ctaaatacat tggtccctca taggcaaacc gcagttcact ccgaacgtag tccctggaaa tttgatgtcc agnatagaaa agcanagcag ncnnnnnnta tanatnnngn tganccanat gntnnctgnn c 137
ΕΡ 1 600 510 /PT <210> 71 <211> 774
< 212 > ADN <213> Sequência Artificial <220> <223> elementos STAR em STAR3 inverso <220> <221> misc_feature < 2 2 2 > (637)..(762) <223> "N" representa qualquer ácido nucleico em várias posições <400> 71 gagctagcgg cgcgccaagc ttggatcccg ccccgccccc tccgccctcg agccccgccc cttgccctag aggccctgcc gaggggcggg gcctgtccct cctccccttt cccccgcccc ctaccgtcac gctcaggggc agcctgaccc cgagcggccc cgcggtgacc ctcgcgcaga ggcctgtggg aggggcgtcg caagcccctg aatccccccc cgtctgttcc cccctcccgc ccagtctcct ccccctggga acgcgcgggg tgggtgacag acctggctgc gcgccaccgc caccgcgcct gccgggggcg ctgccgctgc ctgagaaact gcggctgccg cctggaggag gtgccgtcgc ctccgccacc gctgccgccg ccgccagggg taggagctaa gccgccgcca ttttgtgtcc ccctgttgtt gtcgttgaca tgaatccgac atgacactga ttacagccca atggagtctc attaaacccg agtcgcggtc ccgccccgcc gctgctccat tggaggagac caaagacact taaggccacc cgttggccta cgggtctgtc tgtcacccac tcactaacca ctctgcagcc cattggggca ggttcctgcc ggtcatntcg cttccaataa acacacccct tcgaccccat nattcccccc cttcgggaac cacccccggg ggaggggtcc actggncaat accaattnaa nagaaccgct ngggtccgcc tntttncggg cnccctattg ggtt <210> 72 <211> 717
<212> ADN <213> Sequência Artificial <220> <223> elementos STAR em STAR4 directo <220> <221> misc_feature <222> (444)..(704) <223> "N" representa qualquer ácido nucleico em várias posições <400> 72 qqggaggatt cttttggctg ctgagttgag attaggttga gggtagtgaa ggtaaaggca gtgagaccac gtaggggtca ttgcagtaat ccaggctgga gatgatggtg gttcagttgg 138 ΕΡ 1 600 510 /PT aatagcagtg catgtgctgt aacaacctca gctgggaagc agtatatgtg gcgttatgac 180 ctcagctgga acagcaatgc atgtggtggt gtaatgaccc cagctgggta gggtgcatgt 240 gatggaacaa cctcagctgg gtagcagtgt acttgataaa atgttggcat actctacatt 300 tgttatgagg gtagtgccat taaatttctc cacaaattgg ttgtcacgta tgagtgaaaa 360 gaggaagtga tggaagactt cagtgctttt ggcctgaata aatagaagac gtcattttca 420 gtaatggaga cagggaagac taangnaggg tggattcagt agagcaggtg ttcagttttg 480 aatatgatga actctgagag aggaaaaact ttttctacct cttagttttt gngnctggac 540 ttaanattaa aggacatang acngaganca gaccaaatnt gcgangtttt tatattttac 600 ttgcngaggg aatttncaag aaaaagaaga cccaanancc attggtcaaa actatntgcc 660 ttttaanaaa aaganaatta caatgganan anaagtgttg nctnggcaaa aattggg 717 <210> 73 <211> 541
< 212 > ADN <213> Sequência Artificial <220> <223> elementos STAR em STAR4 inverso < 2 2 0 > < 2 21> misc_feature <222> (6) .. (533) <223> "N" representa qualquer ácido nucleico em várias posições <400> 73 ggattngagc tagcggcgcg ccaagcttgg atcttagaag gacagagtgg ggcatggaaa 60 tgcaccacca gggcagtgca gcttggtcac tgccagctcc nctcatgggc agagggctgg 120 cctcttgcag ccgaccaggc actgagcgcc atcccagggc cctcgccagc cctcagcagg 180 gccaggacac acaagccttt gacttcctcc tgtcactgct gctgccattc ctgttttgtg 240 gtcatcactc cttccctgtc ctcagactgc ccagcactca aggatgtcct gtggtggcat 300 cagaccatat gcccctgaan aggagtgagt tggtgttttt tgccgcgccc anagagctgc 360 tgtcccctga aagatgcaag tgggaatgat gatgntcacc atcntctgac accaagccct 420 ttggatagag gccccaacag tgaggatggg gctgcactgc attgccaagg caactctgtn 480 ntgactgcta cangacantc ccaggacctg ngaagnncta tanatntgat gcnaggcacc 540 t 541 <210> 74 <211> 794
<212> ADN <213> Sequência Artificial 139
ΕΡ 1 600 510 /PT <220> < 2 2 3 > elementos STAR em STAR6 directo <220> < 2 21 > misc_feature <222> (374) . . (792) <223> "N" representa qualquer ácido nucleico <400> 74 ccaccacaga catcccctct ggcctcctga gtggtttctt cagcacagct tccagagcca aattaaacgt tcactctatg tctatagaca aaaagggttt tgactaaact ctgtgtttta gagagggagt taaatgctgt taacttttta ggggtgggcg agaggaatga caaataacaa cttgtctgaa tgttttacat ttctccccac tgcctcaaga aggttcacaa cgaggtcatc catgataagg agtaagacct cccagccgga ctgtccctcg gcccccagag gacactccac agagatatgc taactggact tggagactgg ctcacactcc agagaaaagc atggagcacg agcgcacaga gcangggcca aggtcccagg gacngaatgt ctaggaggga gattggggtg agggtantct gatgcaatta ctgngcagct caacattcaa gggaggggaa gaaagaaacn gtccctgtaa gtaagttgtn cancagagat ggtaagctcc aaatttnaac tttggctgct ggaaagtttn ngggccnana naanaaacan aaanatttga ggtttanacc cactaacccn tatnantant tattaatacc cctaattana ccttggatan ccttaaaata tcntntnaaa cggaaccctc nttcccnttt nnaaatnnna aaggccattn ngnncnagta aaaatctnnn ttaagnnntg ggcccnaaca aacntnttcc nagacacntt ttttntccng gnatttntaa tttatttcta ancc <210 > 75 <211> 379
<212> ADN <213> Sequência Artificial <220> <223> elementos STAR em STAR6 inverso <220> <221> misc_feature <222> (287)..(379) <223> "N" representa qualquer ácido nucleico em várias posições <400> 75 atcgtgtcct ttccagggac atggatgaag ctggaagcca tcatcctcag caaactaaca caggaacaga aaaccaaata ccacatgttc tcactcataa gtgggagctg aacagtgaga acacatggac acagggaggg gaacatcaca caccaaggcc tgtctggtgt ggggagggga 140
ΕΡ 1 600 510 /PT gggagagcat caggacaaat agctaatgca tgtggggctt aaacctagat gacgggttga 240 taggtgcagc aatccactat ggacacatat acctatgtaa caacccnacc ttnttgacat 300 gtatcccaga acttaaagga aaataaaaat taaaaaaaat tnccctggaa taaaaaagag 360 tgtggacttt ggtgagatn 379 <210 > 76 <211> 398
<212> ADN <213> Sequência Artificial <220> <223> elementos STAR em STAR8 directo < 2 2 0 > < 2 21> misc_feature < 2 2 2 > (98)..(395) <223> "N" representa qualquer ácido nucleico em várias posições <400> 76 ggatcacctc gaagagagtc taacgtccgt aggaacgctc tcgggttcac aaggattgac 60 cgaaccccag gatacgtcgc tctccatctg aggcttgntc caaatggccc tccactattc 120 caggcacgtg ggtgtctccc ctaactctcc ctgctctcct gagcccatgc tgcctatcac 180 ccatcggtgc aggtcctttc tgaanagctc gggtggattc tctccatccc acttcctttc 240 ccaagaaaga agccaccgtt ccaagacacc caatgggaca ttcccnttcc acctccttnt 300 cnaaagttng cccaggtgtt cntaacaggt tagggagaga ancccccagg tttnagttnc 360 aaggcatagg acgctggctt gaacacacac acacnctc 398 <210> 77 <211> 309
<212> ADN <213> Sequência Artificial <220> <223> elementos STAR em STAR8 inverso <220> <221> misc_feature <222> (72)..(72) <223> "N" representa qualquer ácido nucleico <400> 77 ggatcccgac tctgcaccgc aaactctacg gcgccctgca ggacggcggc ctcctgccgc 60 ttggacgcca gncaggagct ccccggcagc agcagagcag aaagaaggat ggccccgccc 120 cacttcgcct cccggcggtc tccctcccgc cggctcacgg acatagatgg ctgcctagct 180 240 ccggaagcct agctcttgtt ccgggcatcc taaggaagac acggtttttc ctcccggggc 300 141
ΕΡ 1 600 510 /PT 309 ctcaccacat ctgggacttt gacgactcgg acctctctcc attgaatggt tgcgcgttct ctgggaaag <210> 78 <211> 606
< 212 > ADN <213> Sequência Artificial <220> <223> elementos STAR em STAR18 directo <220> < 2 21> misc_feature <222> (524)..(524) <223> "N" representa qualquer ácido nucleico <400> 78 tggatcctgc cgctcgcgtc ttagtgtttc tccctcaaga ctttccttct gttttgttgt cttgtgcagt attttacagc ccctcttgtg tttttcttta tttctcgtac acacacgcag ttttaagggt gatgtgtgta taattaaaag gacccttggc ccatactttc ctaattcttt agggactggg attgggtttg actgaaatat gttttggtgg ggatgggacg gtggacttcc attctcccta aactggagtt ttggtcggta atcaaaacta aaagaaacct ctgggagact ggaaacctga ttggagcact gaggaacaag ggaatgaaaa ggcagactct ctgaacgttt gatgaaatgg actcttgtga aaattaacag tgaatattca ctgttgcact gtacgaagtc tctgaaatgt aattaaaagt ttttattgag cccccgagct ttggcttgcg cgtatttttc cggtcgcgga catcccaccg cgcagagcct cgcctccccg ctgncctcag ctccgatgac ttccccgccc ccgccctgct cggtgacaga cgttctactg cttccaatcg gaggcaccct tcgcgg <210> 79 <211> 465 <212> ADN <213> Sequência Artificial < 2 2 0 > <223> elementos STAR em STAR18 inverso <400> 79 tggatcctgc cgctcgcgtc ttagtgtttc tccctcaaga ctttccttct gttttgttgt cttgtgcagt attttacagc ccctcttgtg tttttcttta tttctcgtac acacacgcag ttttaagggt gatgtgtgta taattaaaag gacccttggc ccatactttc ctaattcttt agggactggg attgggtttg actgaaatat gttttggtgg ggatgggacg gtggacttcc 60 120 180 240 300 360 420 480 540 600 606 60 120 180 240 142
ΕΡ 1 600 510 /PT attctcccta aactggagtt ttggtcggta atcaaaacta aaagaaacct ctgggagact 300 ggaaacctga ttggagcact gaggaacaag ggaatgaaaa ggcagactct ctgaacgttt 360 gatgaaatgg actcttgtga aaattaacag tgaatattca ctgttgcact gtacgaagtc 420 tctgaaatgt aattaaaagt ttttattgag cccccgagct ttggc 465 < 210 > 80 <211> 48
< 212 > ADN <213> Sequência Artificial <220> <223> oligonucleótido C65 <400> 80 aacaagcttg atatcagatc tgctagcttg gtcgagctga tacttccc 48 <210> 81 <211> 54 <212> ADN < 213 > Sequência Artificial <220> < 2 2 3 > oligonucleótido C66 < 4 0 0 > 81 aaactcgagc ggccgcgaat tcgtcgactt taccactccc tatcagtgat agag 54 <210> 82 <211> 39 < 212 > ADN <213> Sequência Artificial <220> < 2 2 3 > oligonucleótido C67 <400> 82 aaaccgcggc atggaagacg ccaaaaacat aaagaaagg 39 <210> 83 <211> 32
< 212 > ADN <213> Sequência Artificial <220> <223> oligonucleótido C68 <400> 83 tatggatcct agaattacac ggcgatcttt cc <210> 84 <211> 33
< 212 > ADN <213> Sequência Artificial 32 143
ΕΡ 1 600 510 /PT <220> <223> oligonucleótido C81 <400> 84 aaaccatggc cgagtacaag cccacggtgc gcc 33 <210> <211> 85 35 < 212 > <213> ADN Sequência Artificial <220> <223> oligonucleótido C82 <400> 85 aaatctagat caggcaccgg gcttgcgggt catgc 35 <210> <211> 86 22 <212> <213> ADN Sequência Artificial <220> <223> oligonucleótido C85 <400> 86 catttccccg aaaagtgcca cc 22 <210> <211> 87 24 <212> < 213 > ADN Sequência Artificial <220> <223> oligonucleótido D30 <400> 87 tcactgctag cgagtggtaa actc 24 <210> <211> 88 28 < 212 > < 213 > ADN Sequência Artificial <220> <223> oligonucleótido D41 <400> 88 gaagtcgacg aggcaggcag aagtatgc 28 <210> <211> 89 29 <212> < 213 > ADN Sequência Artificial 144
ΕΡ 1 600 510 /PT <220> <223> oligonucleótido D42 <400> 89 gagccgcggt ttagttcctc accttgtcg 29 <210> <211 > <212> < 213 > 90 23 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido D51 <400> 90 tctggaagct ttgctgaaga aac 23 <210> <211 > <212> <213> 91 21 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido D89 <400> 91 gggcaagatg tcgtagtcag g 21 <210> <211 > <212> <213> 92 30 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido D90 <400> 92 aggcccatgg tcacctccat cgctactgtg 30 <210> <211 > 93 20 <212> < 213 > ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido D91 <400> 93 ctaatcactc actgtgtaat 20 <210> <211> <212> <213> 94 15 ADN Sequência Artificial 145
ΕΡ 1 600 510 /PT <220> <223> oligonucleótido D93 <400> 94 aattacaggc gcgcc 15 <210> <211 > <212> < 213 > 95 15 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido D94 <400> 95 aattggcgcg cctgt 15 <210> <211 > <212> <213> 96 25 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido D95 <400> 96 tgctttgcat acttctgcct gcctc 25 <210> <211 > <212> <213> 97 20 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E12 <400> 97 taggggggat ccaaatgttc 20 <210> <211 > 98 20 <212> < 213 > ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E13 <400> 98 cctaaaagaa gatctttagc 20 <210> <211> <212> <213> 99 20 ADN Sequência Artificial 146
ΕΡ 1 600 510 /PT <220> <223> oligonucleótido E14 <400> 99 aagtgttgga tccactttgg 20 <210> <211 > <212> < 213 > 100 20 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E15 <400> 100 tttgaagatc taccaaatgg 20 <210> <211 > <212> <213> 101 20 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E16 <400> 101 gttcgggatc cacctggccg 20 <210> <211 > <212> <213> 102 20 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E17 <400> 102 taggcaagat cttggccctc 20 <210> <211 > 103 20 <212> < 213 > ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E18 <400> 103 cctctctagg gatccgaccc 20 <210> <211> <212> <213> 104 20 ADN Sequência Artificial 147
ΕΡ 1 600 510 /PT <220> <223> oligonucleótido E19 <400> 104 ctagagagat cttccagtat 20 <210> <211 > <212> < 213 > 105 20 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E20 <400> 105 agagttccgg atccgcctgg 20 <210> <211 > <212> <213> 106 20 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E21 <400> 106 ccaggcagac tcggaactct 20 <210> <211 > <212> <213> 107 20 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E22 <400> 107 tggtgaaacc ggatccctac 20 <210> <211 > 108 20 <212> < 213 > ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E23 <400> 108 aggtcaggag atctagacca 20 <210> <211> <212> <213> 109 22 ADN Sequência Artificial 148
ΕΡ 1 600 510 /PT <220> <223> oligonucleótido E25 <400> 109 ccattttcgc ttccttagct cc 22 <210> <211 > <212> < 213 > 110 22 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E42 <400> 110 cgatgtaacc cactcgtgca cc 22 <210> <211 > <212> <213> 111 20 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E57 <400> 111 agagatctag gataatttcg 20 <210> <211 > <212> <213> 112 36 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E92 <400> 112 aggcgctagc acgcgttcta ctcttttcct actctg 36 <210> <211 > 113 35 <212> < 213 > ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E93 <400> 113 gatcaagctt acgcgtctaa aggcatttta tatag 35 <210> <211> <212> <213> 114 35 ADN Sequência Artificial 149
ΕΡ 1 600 510 /PT <220> <223> oligonucleótido E94 <400> 114 aggcgctagc acgcgttcag agttagtgat ccagg 35 <210> <211 > <212> < 213 > 115 35 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E95 <400> 115 gatcaagctt acgcgtcagt aaaggtttcg tatgg 35 <210> <211 > <212> <213> 116 36 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E96 <400> 116 aggcgctagc acgcgttcta ctctttcatt actctg 36 <210> <211 > <212> <213> 117 26 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E97 <400> 117 cgaggaagct ggagaaggag aagctg 26 <210> <211 > 118 25 <212> < 213 > ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido E98 <400> 118 caagggccgc agcttacaca tgttc 25 <210> <211> <212> <213> 119 17 ADN Sequência Artificial 150
ΕΡ 1 600 510 /PT <220> <223> oligonucleótido D58 <400> 119 ccaagttgac cagtgcc 17 <210> <211 > <212> < 213 > 120 20 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido D80 <400> 120 gttcgtggac acgacctccg 20 <210> <211 > <212> <213> 121 19 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido D70 <400> 121 tacaagccaa ccacggcct 19 <210> <211 > <212> <213> 122 20 ADN Sequência Artificial <220> < 2 2 3 > oligonucleótido D71 <400> 122 cggaagtgct tgacattggg 20
Lisboa

Claims (17)

  1. ΕΡ 1 600 510 /PT 1/3 REIVINDICAÇÕES 1. Sequência de ADN isolada e/ou recombinante possuindo actividade anti-repressora, sendo a referida sequência seleccionada do grupo que consiste em: (a) SEQ. ID:7 na Figura 20; (b) um fragmento de SEQ. ID:7 na Figura 20; (c) um homólogo funcional ou derivado de SEQ. ID:7 na Figura 20, em que a actividade anti-repressora da referida sequência confere a uma célula de osteossarcoma humano U-2 OS a capacidade de crescer após 4-5 semanas de cultura na presença de 250 pg/ml de zeocina e 0,1 ng/ml de doxiciclina, quando a referida célula compreende uma proteína de fusão LexA-repressor contendo o domínio de ligação ao ADN de LexA e uma região de codificação de HP1 ou HPC2 sob o controlo do sistema regulador da transcrição Tet-Off, quando a referida sequência de ADN isolada e/ou recombinante é clonada numa sequência poliligante num plasmídeo, estando o referido poliligante posicionado entre quatro locais de operador LexA e o promotor de SV40 que controla o gene de resistência a zeocina, quando o plasmídeo está presente na referida célula.
  2. 2. Construção de ADN recombinante proporcionada com uma sequência de ADN de acordo com a reivindicação 1.
  3. 3. Construção de ADN de acordo com a reivindicação 2, compreendendo ainda um promotor operativamente ligado a uma sequência de ácido nucleico de interesse.
  4. 4. Construção de ADN de acordo com a reivindicação 3, em que a referida sequência de ácido nucleico de interesse é um quadro de leitura aberto transgénico.
  5. 5. Construção de ADN de acordo com a reivindicação 4, em que o referido promotor é um promotor exógeno.
  6. 6. Construção de ADN de acordo com qualquer uma das reivindicações 3-5, em que o referido promotor é um promotor constitutivo forte, preferivelmente um promotor virai, ou um promotor indutível. ΕΡ 1 600 510 /PT 2/3
  7. 7. Construção de ADN de acordo com qualquer uma das reivindicações 3-6, em que o referido promotor é um promotor de CMV, um promotor de SV40 ou um promotor Tet-Off.
  8. 8. Construção de ADN de acordo com qualquer uma das reivindicações 3-7, compreendendo, pela ordem seguinte: (i) uma sequência de ADN de acordo com a reivindicação 1, (ii) o promotor operativamente ligado à sequência de ácido nucleico de interesse, e (iii) uma sequência de ADN de acordo com a reivindicação 1, preferivelmente na orientação oposta a (i).
  9. 9. Método para obtenção de uma célula hospedeira, compreendendo o passo de transfecção da célula hospedeira com uma construção de ADN de acordo com qualquer uma das reivindicações 3-8.
  10. 10. Célula compreendendo uma construção de ADN de acordo com qualquer uma das reivindicações 3-8.
  11. 11. Célula de acordo com a reivindicação 10, compreendendo múltiplas cópias da referida construção de ADN.
  12. 12. Célula de acordo com a reivindicação 10 ou 11, que é uma célula CHO.
  13. 13. Método para a produção de um produto génico numa célula compreendendo proporcionar uma cassete de expressão compreendendo: i) um transgene que codifica o referido produto génico, e ii) uma sequência de ADN de acordo com a reivindicação 1, e permitir a transcrição da referida cassete de expressão numa célula.
  14. 14. Método de acordo com a reivindicação 13, em que a referida célula é uma célula CHO.
  15. 15. Método de acordo com a reivindicação 13 ou 14, em que a cassete de expressão compreende, pela seguinte ordem: (i) uma sequência de ADN de acordo com a reivindicação 1, (ii) o transgene compreendendo um promotor operativamente ΕΡ 1 600 510 /PT 3/3 ligado a um quadro de leitura aberto que codifica o referido produto génico, e (iii) uma sequência de ADN de acordo com a reivindicação 1, preferivelmente na orientação oposta a (i).
  16. 16. Método de acordo com qualquer uma das reivindicações 13-15, em que são proporcionadas múltiplas das referidas cassetes de expressão e a sua transcrição é permitida na referida célula, e a expressão do referido transgene é dependente do número de cópias.
  17. 17. Utilização de uma sequência de ADN de acordo com a reivindicação 1 para a regulação da transcrição de um ácido nucleico de interesse. Lisboa,
PT05076209T 2001-07-04 2002-06-14 Sequências de adn com actividade anti-repressora. PT1600510E (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP01202581A EP1273666A1 (en) 2001-07-04 2001-07-04 Method of selecting a DNA sequence with transcription modulating activity using a vector comprising an element with a gene transcription repressing activity
US30319901P 2001-07-05 2001-07-05
US10/190,312 US7192741B2 (en) 2001-07-04 2002-07-05 DNA sequences comprising gene transcription regulatory qualities and methods for detecting and using such DNA sequences

Publications (1)

Publication Number Publication Date
PT1600510E true PT1600510E (pt) 2007-06-25

Family

ID=47915807

Family Applications (1)

Application Number Title Priority Date Filing Date
PT05076209T PT1600510E (pt) 2001-07-04 2002-06-14 Sequências de adn com actividade anti-repressora.

Country Status (22)

Country Link
US (9) US7192741B2 (pt)
EP (8) EP1600510B1 (pt)
JP (3) JP4500044B2 (pt)
KR (2) KR100942117B1 (pt)
CN (1) CN1266282C (pt)
AT (8) ATE466943T1 (pt)
AU (3) AU2002314629B2 (pt)
BR (1) BRPI0210771B8 (pt)
CA (2) CA2450020C (pt)
CY (1) CY1107678T1 (pt)
DE (8) DE60236331D1 (pt)
DK (8) DK1829971T3 (pt)
ES (8) ES2285630T3 (pt)
HK (1) HK1068652A1 (pt)
IL (4) IL159674A0 (pt)
MX (1) MXPA03011801A (pt)
NO (1) NO338477B1 (pt)
NZ (1) NZ530218A (pt)
PT (1) PT1600510E (pt)
SG (1) SG143066A1 (pt)
WO (1) WO2003004704A2 (pt)
ZA (1) ZA200309599B (pt)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60236331D1 (de) 2001-07-04 2010-06-17 Chromagenics Bv DNS-Sequenzen mit Anti-Repressor-Aktivität
CA2723500C (en) 2002-06-14 2014-10-28 Chromagenics B.V. A method for simultaneous production of multiple proteins; vectors and cells for use therein
WO2003106674A2 (en) * 2002-06-14 2003-12-24 Chromagenics B.V. Means and methods for regulating gene expression
ES2368733T3 (es) 2002-07-18 2011-11-21 Merus B.V. Producción recombinante de mezclas de anticuerpos.
USRE47770E1 (en) 2002-07-18 2019-12-17 Merus N.V. Recombinant production of mixtures of antibodies
NZ540471A (en) 2002-12-18 2008-07-31 Chromagenics Bv A method for improving protein production
AU2003290453A1 (en) 2002-12-20 2004-07-14 Chromagenics B.V. Means and methods for producing a protein through chromatin openers that are capable of rendering chromatin more accessible to transcription factors
US20100069614A1 (en) 2008-06-27 2010-03-18 Merus B.V. Antibody producing non-human mammals
CA2527694C (en) 2003-05-30 2015-07-14 Hendricus Renerus Jacobus Mattheus Hoogenboom Fab library for the preparation of anti vegf and anti rabies virus fabs
DK1670925T3 (da) 2003-10-02 2013-07-08 Crucell Holland Bv Pakningsceller til rekombinat adenovirus
WO2005059149A2 (en) * 2003-12-12 2005-06-30 Chromagenics B.V. Improved protein production
EP1737971B1 (en) 2004-01-20 2017-08-16 Merus N.V. Mixtures of binding proteins
PT1763586E (pt) * 2004-07-08 2008-02-25 Chromagenics Bv Nova sequência para melhorar a expressão de ácido nucleico
EP1786908B1 (en) * 2004-08-18 2010-03-03 Bayer CropScience AG Plants with increased plastidic activity of r3 starch-phosphorylating enzyme
SI1809750T1 (sl) * 2004-11-08 2012-08-31 Chromagenics Bv Izbira gostiteljskih celic, ki imajo visok nivo izraĹľanja proteina
US20100136616A1 (en) * 2004-11-08 2010-06-03 Chromagenics B.V. Selection of Host Cells Expressing Protein at High Levels
CA2581422C (en) 2004-11-08 2012-05-22 Chromagenics B.V. Selection of host cells expressing protein at high levels
US8999667B2 (en) 2004-11-08 2015-04-07 Chromagenics B.V. Selection of host cells expressing protein at high levels
US8039230B2 (en) 2004-11-08 2011-10-18 Chromagenics B.V. Selection of host cells expressing protein at high levels
US20060195935A1 (en) * 2004-11-08 2006-08-31 Chromagenics B.V. Selection of host cells expressing protein at high levels
CA2587712C (en) * 2004-11-18 2013-02-12 National University Of Corporation Hiroshima University Method and kit for expressing protein under regulation of the expression from repeated sequence formed by gene amplification and transformant
US7968700B2 (en) 2006-03-20 2011-06-28 Chromagenics B.V. Expression augmenting DNA fragments, use thereof, and methods for finding thereof
US20080124760A1 (en) 2006-07-26 2008-05-29 Barbara Enenkel Regulatory Nucleic Acid Elements
US20090142805A1 (en) * 2007-01-08 2009-06-04 Millipore Corporation High expression cell line that eliminates gene amplification
DK2443239T3 (en) 2009-06-15 2016-02-15 Cellagenics B V New stringent selection markers
US8566596B2 (en) 2010-08-24 2013-10-22 Cisco Technology, Inc. Pre-association mechanism to provide detailed description of wireless services
DK2611915T3 (da) 2010-09-01 2015-06-22 Cellagenics B V Nukleinsyrefragmenter fra en ribosomal proteinpromoter til forstærkning af genekspression
MX360109B (es) 2012-04-20 2018-10-23 Merus Nv Metodos y medios para la produccion de moleculas de tipo ig.
US11180572B2 (en) 2012-07-06 2021-11-23 Genmab B.V. Dimeric protein with triple mutations
SI2900694T1 (sl) 2012-09-27 2018-12-31 Merus N.V. Bispecifična IGG protitelesa kot vključitelji T-celic
US10417380B1 (en) 2013-12-31 2019-09-17 Mckesson Corporation Systems and methods for determining and communicating a prescription benefit coverage denial to a prescriber
US10489552B2 (en) 2014-02-14 2019-11-26 Mckesson Corporation Systems and methods for determining and communicating patient incentive information to a prescriber
NZ724013A (en) 2014-02-28 2019-11-29 Merus Nv Antibodies that bind egfr and erbb3
IL301147A (en) 2014-02-28 2023-05-01 Merus Nv An antibody that binds to ErbB-2 and ErbB-3
US10157262B1 (en) 2015-03-10 2018-12-18 Mckesson Corporation Systems and methods for determining patient financial responsibility for multiple prescription products
CN108026174B (zh) 2015-07-10 2023-02-17 美勒斯公司 人cd3结合抗体
AU2016340764B2 (en) 2015-10-23 2023-06-01 Fundació lnstitut de Recerca Biomèdica (IRB Barcelona) Binding molecules that inhibit cancer growth
US11514137B1 (en) 2016-03-30 2022-11-29 Mckesson Corporation Alternative therapy identification system
US10999224B1 (en) 2017-02-01 2021-05-04 Mckesson Corporation Method and apparatus for parsing an electronic message and constructing multiple differently prioritized messages therefrom
EP3600413A1 (en) 2017-03-31 2020-02-05 Merus N.V. Erbb-2 and erbb3 binding bispecific antibodies for use in the treatment f cells that have an nrg1 fusion gene
MX2020001432A (es) 2017-08-09 2020-03-20 Merus Nv Anticuerpos que se unen al receptor del factor de crecimiento epidermico (egfr) y tirosina-proteina cinasa met (cmet).
US10862832B1 (en) 2018-07-24 2020-12-08 Mckesson Corporation Computing system and method for automatically reversing an action indicated by an electronic message
US11043437B2 (en) 2019-01-07 2021-06-22 Applied Materials, Inc. Transparent substrate with light blocking edge exclusion zone
US11562437B1 (en) 2019-06-26 2023-01-24 Mckesson Corporation Method, apparatus, and computer program product for providing estimated prescription costs
US11636548B1 (en) 2019-06-26 2023-04-25 Mckesson Corporation Method, apparatus, and computer program product for providing estimated prescription costs
EP3772518A1 (en) 2019-08-07 2021-02-10 Merus N.V. Modified human variable domains
WO2021155369A1 (en) * 2020-01-31 2021-08-05 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods to identify genetic silencers and applications thereof
US11610240B1 (en) 2020-02-17 2023-03-21 Mckesson Corporation Method, apparatus, and computer program product for partitioning prescription transaction costs in an electronic prescription transaction
IL298394A (en) 2020-05-21 2023-01-01 Merus Nv Methods and means for producing ig-like molecules
US11587657B2 (en) 2020-09-04 2023-02-21 Mckesson Corporation Method, apparatus, and computer program product for performing an alternative evaluation procedure in response to an electronic message

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US719271A (en) * 1902-01-13 1903-01-27 Solomon P Smith Furnace.
US5610053A (en) 1993-04-07 1997-03-11 The United States Of America As Represented By The Department Of Health And Human Services DNA sequence which acts as a chromatin insulator element to protect expressed genes from cis-acting regulatory sequences in mammalian cells
US5972605A (en) * 1994-07-07 1999-10-26 Geron Corporation Assays for regulators of mammalian telomerase expression
EP0818536A4 (en) * 1995-03-24 2000-09-06 Shionogi & Co DNA MOLECULE DRAWN ON THE SUPPRESSION OF THE GENE EXPRESSION AND CORRESPONDING PROTEIN
DE19539493A1 (de) * 1995-10-24 1997-04-30 Thomae Gmbh Dr K Starker homologer Promotor aus Hamster
US5773695A (en) 1996-01-26 1998-06-30 North Carolina State University Plant nuclear scaffold attachment region and method for increasing gene expression in transgenic cells
US6037525A (en) * 1996-08-01 2000-03-14 North Carolina State University Method for reducing expression variability of transgenes in plant cells
US5888809A (en) 1997-05-01 1999-03-30 Icos Corporation Hamster EF-1α transcriptional regulatory DNA
WO2000005393A2 (en) 1998-07-21 2000-02-03 Cobra Therapeutics Limited A polynucleotide comprising a ubiquitous chromatin opening element (ucoe)
ATE370247T1 (de) * 1998-08-14 2007-09-15 Chromagenics Bv Dns sequenz, verfahren für dessen nachweis und herstellung und ihre benutzung
US6521419B1 (en) 1998-09-22 2003-02-18 Kanakaraju Koduri Expression vectors containing hot spot for increased recombinant protein expression in transfected cells
US6800457B2 (en) 1998-09-22 2004-10-05 Bristol-Myers Squibb Company Expression vectors containing hot spot for increased recombinant protein expression in transfected cells
AU1128400A (en) 1998-10-22 2000-05-08 Medical College Of Georgia Institute, Inc. Long terminal repeat, enhancer, and insulator sequences for use in recombinant vectors
AU784506B2 (en) * 1999-08-25 2006-04-13 Immunex Corporation Compositions and methods for improved cell culture
US20030166042A1 (en) 2000-02-11 2003-09-04 Millennium Pharmaceuticals, Inc. Novel seven-transmembrane proteins/G-protein coupled receptors
US6586205B1 (en) 2000-02-11 2003-07-01 Millennium Pharmaceuticals, Inc. 43239 a novel GPCR-like molecule and uses thereof
EP1430124B1 (en) 2000-09-20 2013-11-06 EMD Millipore Corporation Artificial ubiquitous chromatin opening elements (ucoe)
DE60236331D1 (de) 2001-07-04 2010-06-17 Chromagenics Bv DNS-Sequenzen mit Anti-Repressor-Aktivität
EP1273666A1 (en) 2001-07-04 2003-01-08 Chromagenics B.V. Method of selecting a DNA sequence with transcription modulating activity using a vector comprising an element with a gene transcription repressing activity
CA2723500C (en) * 2002-06-14 2014-10-28 Chromagenics B.V. A method for simultaneous production of multiple proteins; vectors and cells for use therein
WO2003106674A2 (en) 2002-06-14 2003-12-24 Chromagenics B.V. Means and methods for regulating gene expression
NZ540471A (en) 2002-12-18 2008-07-31 Chromagenics Bv A method for improving protein production
AU2003290453A1 (en) 2002-12-20 2004-07-14 Chromagenics B.V. Means and methods for producing a protein through chromatin openers that are capable of rendering chromatin more accessible to transcription factors

Also Published As

Publication number Publication date
US20070037256A1 (en) 2007-02-15
AU2002314629B2 (en) 2007-08-30
AU2007234619A1 (en) 2007-12-13
EP1600510B1 (en) 2007-03-28
US7192741B2 (en) 2007-03-20
EP1829972B1 (en) 2010-05-12
EP1829971A3 (en) 2008-06-04
US20070031934A1 (en) 2007-02-08
EP1806407B1 (en) 2010-05-05
EP1829971A1 (en) 2007-09-05
ATE474053T1 (de) 2010-07-15
KR20090037485A (ko) 2009-04-15
DK1808488T3 (da) 2010-10-18
JP4500044B2 (ja) 2010-07-14
NO338477B1 (no) 2016-08-22
CY1107678T1 (el) 2013-04-18
ES2285630T3 (es) 2007-11-16
DK1842919T3 (da) 2010-08-16
EP1842919B1 (en) 2010-05-05
DE60237048D1 (de) 2010-08-26
DE60215502T2 (de) 2007-08-30
ATE466941T1 (de) 2010-05-15
EP1404872B1 (en) 2006-10-18
KR100942117B1 (ko) 2010-02-12
ES2274045T3 (es) 2007-05-16
US20070031936A1 (en) 2007-02-08
JP2010131024A (ja) 2010-06-17
ATE467682T1 (de) 2010-05-15
JP2004533262A (ja) 2004-11-04
NZ530218A (en) 2005-09-30
EP1808488A3 (en) 2007-11-14
CA2450020C (en) 2013-08-13
EP1829972A2 (en) 2007-09-05
HK1068652A1 (en) 2005-04-29
KR100942116B1 (ko) 2010-02-12
US7662591B2 (en) 2010-02-16
DK1845162T3 (da) 2010-08-16
ATE466942T1 (de) 2010-05-15
DE60236334D1 (de) 2010-06-17
US7659094B2 (en) 2010-02-09
AU2011202193B2 (en) 2011-09-29
DE60236333D1 (de) 2010-06-17
BR0210771A (pt) 2004-07-13
MXPA03011801A (es) 2005-03-07
ES2344074T3 (es) 2010-08-17
DK1404872T3 (da) 2007-02-19
BRPI0210771B1 (pt) 2015-12-22
ZA200309599B (en) 2006-05-31
EP1845162B1 (en) 2010-05-05
EP1808488A2 (en) 2007-07-18
US20070128717A1 (en) 2007-06-07
US20030199468A1 (en) 2003-10-23
ES2344072T3 (es) 2010-08-17
IL193373A (en) 2010-12-30
NO20040011L (no) 2004-03-03
DK1806407T3 (da) 2010-08-16
EP1829972A3 (en) 2007-10-24
ATE466943T1 (de) 2010-05-15
US7749733B2 (en) 2010-07-06
CA2812799C (en) 2016-01-26
EP1808488B1 (en) 2010-07-14
IL159674A0 (en) 2004-06-20
CN1524128A (zh) 2004-08-25
EP1600510A3 (en) 2006-02-22
JP5014443B2 (ja) 2012-08-29
US7736870B2 (en) 2010-06-15
ES2348174T3 (es) 2010-11-30
EP1842919A1 (en) 2007-10-10
DE60219221T2 (de) 2008-01-03
EP1404872A2 (en) 2004-04-07
EP1600510A2 (en) 2005-11-30
KR20090037960A (ko) 2009-04-16
DE60236379D1 (de) 2010-06-24
US20070026499A1 (en) 2007-02-01
JP5014444B2 (ja) 2012-08-29
US7736868B2 (en) 2010-06-15
US20070026498A1 (en) 2007-02-01
AU2011202193A1 (en) 2011-06-02
WO2003004704A2 (en) 2003-01-16
ES2344073T3 (es) 2010-08-17
IL159674A (en) 2009-02-11
US7655441B2 (en) 2010-02-02
US20070031935A1 (en) 2007-02-08
ES2344071T3 (es) 2010-08-17
CA2450020A1 (en) 2003-01-16
ATE343004T1 (de) 2006-11-15
EP1845162A1 (en) 2007-10-17
EP1806407A3 (en) 2008-06-04
DE60215502D1 (de) 2006-11-30
ATE358183T1 (de) 2007-04-15
SG143066A1 (en) 2008-06-27
US7736869B2 (en) 2010-06-15
EP1829971B1 (en) 2010-05-05
JP2010131025A (ja) 2010-06-17
IL193374A (en) 2010-12-30
DK1600510T3 (da) 2007-06-25
ATE466944T1 (de) 2010-05-15
US7951586B2 (en) 2011-05-31
ES2344070T3 (es) 2010-08-17
DE60236331D1 (de) 2010-06-17
US20070031933A1 (en) 2007-02-08
CA2812799A1 (en) 2003-01-16
DK1829972T3 (da) 2010-09-13
DE60219221D1 (de) 2007-05-10
CN1266282C (zh) 2006-07-26
EP1806407A2 (en) 2007-07-11
DE60236332D1 (de) 2010-06-17
WO2003004704A3 (en) 2003-10-16
AU2007234619B2 (en) 2011-06-02
DK1829971T3 (da) 2010-08-16
BRPI0210771B8 (pt) 2021-05-25

Similar Documents

Publication Publication Date Title
PT1600510E (pt) Sequências de adn com actividade anti-repressora.
KR101271884B1 (ko) 고수준으로 단백질을 발현하는 숙주세포의 선택
KR101328300B1 (ko) 고수준으로 단백질을 발현하는 숙주세포의 선택
KR101188013B1 (ko) 핵산 발현의 개선을 위한 신규한 서열
NZ553700A (en) Selection of host cells expressing protein at high levels using a selectable marker with a non-optimal start codon
KR100951759B1 (ko) 유전자 전사 조절 성질을 포함하는 디엔에이 서열 및이러한 디엔에이 서열을 탐지하고 이용하는 방법
TW202309274A (zh) 產生成熟角膜內皮細胞之方法