ITMI20131142A1 - Ceppi batterici ricombinanti per la produzione di nucleosidi naturali e analoghi modificati. - Google Patents

Ceppi batterici ricombinanti per la produzione di nucleosidi naturali e analoghi modificati.

Info

Publication number
ITMI20131142A1
ITMI20131142A1 IT001142A ITMI20131142A ITMI20131142A1 IT MI20131142 A1 ITMI20131142 A1 IT MI20131142A1 IT 001142 A IT001142 A IT 001142A IT MI20131142 A ITMI20131142 A IT MI20131142A IT MI20131142 A1 ITMI20131142 A1 IT MI20131142A1
Authority
IT
Italy
Prior art keywords
sequence
plasmid vector
udp
cut
vector according
Prior art date
Application number
IT001142A
Other languages
English (en)
Inventor
Francesca Forti
Daniela Erica Ghisotti
Original Assignee
Frau Pharma S R L
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Frau Pharma S R L filed Critical Frau Pharma S R L
Priority to IT001142A priority Critical patent/ITMI20131142A1/it
Publication of ITMI20131142A1 publication Critical patent/ITMI20131142A1/it

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1077Pentosyltransferases (2.4.2)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Description

CEPPI BATTERICI RICOMBINANTI PER LA PRODUZIONE DI NUCLEOSIDI NATURALI E ANALOGHI MODIFICATI.
DESCRIZIONE
Campo dell ’invenzione.
La presente invenzione riguarda nuovi ceppi batterici geneticamente modificati, capaci di esprimere polipeptidi aventi l'attività enzimatica degli enzimi (TP) e/o (TP UdP) e/o (TP+PNP) e/o (TP UdP PNP); i ceppi in questione possono essere usati per catalizzare reazioni di transglicosilazione tra un nucleoside donatore ed una base accettore.
Nucleosidi naturali o loro analoghi modificati hanno importanti applicazioni, sia direttamente sia come intermedi, nel campo di farmaci ad azione anti -virale e anti-tumorale , ed anche nella preparazione di oligonucleotidi per uso diagnostico e terapeutico.
I nucleosidi possono essere preparati con metodi di sintesi chimica che normalmente richiedono un gran numero di passaggi per la protezione e deprotezione dei gruppi labili e l'uso di reagenti e condizioni di funzionamento che, a livello industriale, possono essere di difficile applicazione ed economicamente svantaggiosi.
Un approccio alternativo per la preparazione di nucleosidi ed analoghi modificati si basa invece sull<1>interconversione fra un nucleoside zuccherodonatore ed una base accettore per mezzo di enzimi che catalizzano reazioni reversibili generali, come ad es. la pirimidina fosforilasi (detta anche uridina fosforilasi, "UdP"; gene udp; EC 2.4.2.3), vedi reazioni (1) e (2) nello schema 1 sotto, o la purina fosforilasi (detta anche purina nucleoside fosforilasi, "PNP" ; gene deoD; EC 2.4.2.1), vedi reazione (3) nello schema 1 sotto (Hutchinson, Trends Biotecnologia. 8,348-353,1990):
Schema 1
(1) pirimidina- β-(desossì) ribonucleoside fosfato organico O pirimidina base a-(desossi)ribosio-1 -fosfato;
oppure
(2) uridina fosfato organico <=> uracile α-Dribosio 1-fosfato
(3) purina -β- (desossi}ribonucleoside fosfato organico <Φ purina base a- (desossi)ribosio -1-fosfato .
Ad esempio, PNP metabolizza adenosina in adenina, inosina in ipoxantina e guanosina in guanina.
Benché la uridina fosforilasi (UdP) sia anche in grado di processare la timidina secondo la reazione (4) di schema 2 sotto, la rispettiva attività è bassa:
Schema 2
(4) timidina fosfato organico <=> timina 2-desossi-of-D-ribosio 1-fosfato.
La reazione (4) viene invece conseguita con maggiore attività dalla timidina fosforilasi ("TP", gene deoA, EC 2.4.2.4).
Gli enzimi UdP, TP e PNP possono essere utilizzati singolarmente per catalizzare reazioni di transglicosilazione tra un nucleoside pirimidinico donatore ed una base accettore pirimidinica o tra un nucleoside purinico donatore ed una base accettore purinica, rispettivamente. Inoltre, quando gli enzimi sono utilizzati in combinazione, è possibile trasferire lo zucchero da un nucleoside donatore pirimidinico ad una base accettore purinica o pirimidinica come pure da un nucleoside purinico donatore ad una base accettore pirimidinica o purinica, a seconda dei materiali di partenza utilizzati.
In questo contesto, WO 00/39307 a nome Keryos SpA, insegna ceppi batterici di E. coli geneticamente modificati che contengono, su un vettore di espressione plasmidico ricombinante, a) le sequenze geniche di un batterio mesofilo che codificano per polipeptìdi aventi l'attività enzimatica degli enzimi uridina fosforilasi (UdP) e/o purina nucleoside fosforilasi (PNP), sia separatamente che insieme, e b) almeno una sequenza genica codificante per resistenza contro tetraciclina, kanamicina e/o ampicillina; i quali ceppi batterici come sopra esibiscono (a seconda del ceppo concreto utilizzato) attività enzimatiche UdP che sono ca. 340-1040 volte più elevate delle attività di cellule E. coli corrispondenti non trasformate e/o attività enzimatiche PNP che sono (sempre a seconda del ceppo concreto utilizzato) ca . 120-200 volte più elevate delle attività di cellule E. coli corrispondenti non trasformate.
Tuttavia, mentre i ceppi con attività UdP secondo WO 00/39307 sono in grado di processare timidina, la rispettiva attività non è ottimale. Inoltre, lo spettro di diverse attività enzimatiche ottenibile miscelando i ceppi di WO 00/39307 in varie proporzioni tra di loro rimane sostanzialmente limitato .
Uno scopo della presente invenzione è dunque la messa a disposizione dì nuovi ceppi batterici ricombinanti la cui facoltà di processare la timidina sia migliorata. Questo perché il nucleoside timidina è facilmente disponibile da fonti commerciali e costituisce un materiale di partenza di elevato interesse per effettuare le seguenti reazione di trans-glicosilazione, mediante dall'enzima timidina fosforilasi (TP):
(4) timidina fosfato organico <4> timina a-(desossi) ribosio-l-fosfato
(1) pirimidina-3-ribonucleoside fosfato organico <4> pirimidina base a-D-ribosio-lfosfato
Per quanto riguarda il clonaggio del gene deoA che codifica per la timidina fosforilasi, nella letteratura recente si trovano i seguenti lavori dove il gene deoA è stato clonato da solo oppure in combinazione con il gene deoD:
Esipov et al. in Protein Expression and Purification 24: 56-60, 2002 hanno clonato i geni udp, deoD e deoA di E. coli separatamente in un plasmide pET, sotto il controllo di un promotore inducibile con IPTG, nel ceppo BL21(DE3) di E. coli . Gli autori riferiscono sovrapproduzione di tutti e tre gli enzimi in seguito a induzione con IPTG e riportano l'ottenimento di elevati livelli di attività fosforilasica, ma l'incremento di attività non è riportato e non risulta calcolabile in mancanza dell'espressione dei rispettivi ceppi di controllo.
- Ge et al. in Appi. Biochem. Biotechnol . 159: 168-177, 2009 hanno clonato combinazioni binarie degli enzimi (PNP UdP) e (PNP TP) nel medesimo microrganismo per allargare lo spettro dell'applicabilità industriale rispetto a propri lavori antecedenti e rispetto al lavoro di Esipov et al. Per clonare i due geni da E. coli K12 nel ceppo BL21(DE3) di E. coli, Ge et al. hanno usato due strategie diverse. La prima strategia (i) impiegava un sistema con due plasmidi distinti e resistenze ad antibiotici diverse (un derivato di pETlla, che porta la resistenza all' ampicillina, in cui è clonato PNP, accoppiato ad un derivato di pET28a, che porta la resistenza alla kanamicina, in cui è clonato UdP o TP; ottenendo DUD = (PNP UdP) e DAD = (PNP TP), rispettivamente); invece la seconda strategia (ii) impiegava un plasmide, derivato da pET28a, che portava la combinazione di geni desiderata in tandem (pDU (PNP UdP) oppure pDA = (PNP TP)). Gli autori riferiscono nel caso (i) il manifestarsi di tendenziale perdita dei plasmidi anche in presenza di antibiotico (probabilmente perché i due plasmidi non sono compatibili), mentre osservano miglioramento nel caso (ii) in cui mantengono con successo il plasmide con clonati i due geni in tandem. Gli autori osservano comunque che l'induzione con IPTG risulta necessaria in entrambi casi (i) ed (ii) per avere espressione apprezzabile delle proteine.
Gli autori osservano anche che l'espressione enzimatica ottenuta nei ceppi con due plasmidi distinti risulta superiore a quella dei ceppi portanti un plasmide con i due geni clonati in tandem. Dai dati pubblicati in tabella 4 di Ge et al. è stato possibile calcolare gli incrementi di attività ottenuti dopo induzione, riportati qui sotto :
Attività DAD-PNP/TP DUD=PNP/UDP TDU-PNP+TP TDA=PNP+UDP Dinq et al. in Nucleosides , Nucleotides and Nucleic Acids 30: 360-368, 2011 hanno clonato ed espresso TP di E. coli nel ceppo BL21(DE3) di E. coli (plasmidi utilizzati pMD-18T e pET-lla) sotto il controllo di un promotore inducibile e dimostrano che il lattosio come induttore può costituire una valida alternativa ad IPTG nel sistema studiato. L'incremento massimo di attività ottenuto da Ding et al. mediante induzione è di 12,6 come si vede dai loro dati pubblicati.
Dalle pubblicazioni di cui sopra emerge dunque che mentre la clonazione del gene deoA è stata eseguita da distinti gruppi di ricercatori, l'incremento massimo di attività ottenuto non è prevedibile e comunque dipende fortemente dalla combinazione di ceppo e plasmidi utilizzati e/o dalle condizioni di coltura, e richiede induzione per ottenere la sovraespressione . Gli incrementi dell'espressione del gene deoA rispetto al ceppo selvatico, ove dichiarati dagli autori, rimangono comunque modesti e non superano il fattore di ca.
40 volte. Inoltre, laddove il gene deoA viene clonato in tandem con un altro gene, come ad esempio il gene deoD, per venire incontro a specifici fabbisogni industriali, questo riduce sensibilmente l'incremento ottenuto per deoA.
Questo risulta insoddisfacente in quanto la messa a disposizione di singoli ceppi clonati monofunzionali, ossia che sovraesprimono ciascuno un solo enzima, pone problemi logistici nella loro applicazione industriale (che richiede la facoltà di condurre un ampio spettro di reazioni diverse nel minimo tempo e/o nel minimo numero di reattori possibile} che risulterebbe dunque teoricamente più efficiente con ceppi multifunzionali. Dal lato pratico comunque, la resa della clonazione - in termini dell'incremento ottenuto rispetto al ceppo selvatico - si abbassa notoriamente con il numero di geni clonati nel medesimo plasmide, limitando la razionalità dell'impiego di ceppi bi - o addirittura plurif unzionali .
In questo contesto, la presente invenzione si pone il problema tecnico della messa a disposizione di nuovi ceppi batterici ricombinanti bi- e trifunzionali che portino specifiche combinazioni di geni clonati e che esibiscano un'incremento dell'attività enzimatica rispetto al substrato timidina che sia più elevata rispetto a quello ottenibile con i ceppi bifunzionali noti da WO 00/39307 e da Ge et al.
□n ulteriore problema tecnico risolto dalla presente invenzione è la messa a disposizione di ulteriori ceppi ricombinanti che usati soli, in miscela tra di loro, oppure in miscela con ceppi noti allarghino lo spettro delle proporzioni di attività enzimatiche ottenuto come da WO 00/39307 e da Ge et al.
Descrizione delle Figure.
In Fig. 1 sono riportati gli schemi dei clonaggi effettuati per ottenere i diversi plasmidi qui descritti (maggiori dettagli sono riportati nell'esempio 2) .
Figura la riguarda il plasmide pGM973, derivato di pUCl8 in cui la resistenza all'ampicillina è stata sostituita con la cassetta di resistenza al d oramienicolo . Il gene cat è stato amplificato per PCR da pGZH 9, derivato di pKF3 (Lessi et al.
1992. J. Bacteriol . 174:2493-2500) con gli oligonucleotidi 2824 e 2825, digerito Ndel EcoRV e ligato a pUC18 digerito Ndel Seal.
Figura lb riguarda il plasmide pGM974, derivato di pUCl8, in cui è stato clonato il gene deoD di E. coli e la resistenza al cloramfenicolo . Il gene deoD di E. coli è stato amplificato per PCR con gli oligonucleotidi 304 e 305, digerito EcoRI Sali e ligato a pUC18 digerito EcoRI Sali, ottenendo pGMF970 (descritto nell'esempio 2); il gene cat, amplificato da pGZ119 con gli oligonucleotidi 2824 e 2825, è stato digerito Ndel EcoRV e ligato a pGMF970 digerito Ndel Seal. Figura le riguarda il plasmide pGM975, derivato di pUC18, in cui è stato clonato il gene udp di E. coli e la resistenza al cloramf enicolo . Il gene udp di E. coli è stato amplificato per PCR con gli oligonucleotidi 306 e 307, digerito Kpnl Sali e ligato a pUC18 digerito Kpnl Sali, ottenendo pGMF971 (descritto nell'esempio 2); il gene cat è stato amplificato per PCR da pGZ119 con gli oligonucleotidi 2824 e 2825, digerito Ndel EcoRV e ligato a pGMF971 digerito Ndel Seal.
Figura ld riguarda il plasmide pGM976, derivato di pUCl8, in cui sono clonati i geni udp e deoD di E. coli e la resistenza al d oramienicolo. Il gene deoD di E. coli è stato amplificato per PCR con gli oligonucleotidi xxl e yyl, digerito Sali Sphl e ligato a pGMF972 (descritto nell'esempio 2) , digerito Sali Sphl; il gene cat è stato amplificato per PCR da pGZH 9 con gli oligonucleotidi 2824 e 2825, digerito Ndel EcoRV e ligato a pGMF972 digerito Ndel Seal.
Figura le riguarda il plasmide pGM977, derivato di pUCl8, in cui è clonato il gene deoA di E. coli. Il gene deoA di E. coli è stato amplificato per PCR con gli oligonucleotidi 2826 e 2827, digerito EcoRI Sali e ligato a pUC18 digerito EcoRI Sali.
Figura lf riguarda il plasmide pGM986, derivato di pUC18, in cui sono clonati i geni udp e deoA di E. coli. Il gene deoA di E. coli, è stato amplificato per PCR con gli oligonucleotìdi 2863 e 2864, digerito Sphl e clonato in pGM975 digerito Sphl. I geni udp e deoA sono nello stesso orientamento, in tandem.
Figura lg riguarda il plasmide pGM987, in cui sono clonati i geni udp, deoD e deoA di E. coli. Il gene deoA di E. coli, è stato amplificato per PCR con gli oligonucleotìdi 2863 e 2864, digerito Sphl e ligato in pGM976 digerito Sphl. I geni udp, deoD e deoA sono nello stesso orientamento.
In Figura 2 è riportata la sovraespressione delle proteine espresse dai ceppi E. coli DH10B trasformati con i diversi plasmidi, analizzata mediante elettroforesi dopo diversi tempi di crescita (Figura 2A e 2B). I pesi molecolari dei marcatori (M) corsi nel primo pozzetto di ciascun gel sono indicati sulla sinistra in kDa.
Figura 2A riguarda estrazioni fatte dopo 2 e 4 ore di crescita esponenziale ed in fase stazionaria (on) e le proteine separate per elettroforesi su gel di polìacrilammide al 10%, SDS 0,1%.
Figura 2B riguarda le estrazioni fatte nella fase stazionaria. Le proteine sono state separate per elettroforesi in gel di poliacrìlanunide al 15%, SDS 0,1%. Si noti che pGM973 corrisponde al plasmide di controllo, nel quale non è stato clonato alcun gene, se non la resistenza al cloramf enicolo . Per DHlOB/pGM986 e 987 sono stati analizzati due cloni indipendenti (cl.l e cl.2). Nella Figura 3 sono riportate le fusioni nei vari plasmidi, con la regione aggiunta al 5' del gene sottolineata. Inoltre sono riportate le sequenze dei linker posti tra il gene udp e deoD, nei costrutti che portano entrambi gli enzimi (pGM976 e pGM987) e quella a monte di deoA in pGM986 e pGM987. In questi casi, la sequenza di attacco dei ribosomi (RBS) è in grassetto.
Sommario dell<1>invenzione.
Un primo aspetto della presente invenzione riguarda la messa a disposizione di un nuovo vettore ricombinante di espressione plasmidico, basato sul plasmide pUC18, comprendente:
a) almeno una sequenza genica di un batterio mesofilo codificante per un polipeptide avente attività enzimatica di timidina fosforilasi; e
b) almeno una sequenza genica che codifica per la resistenza ad almeno un antibiotico. Nell'ambito della presente invenzione è preferita la resistenza contro il cloramfenicolo .
Secondo una prima forma di esecuzione preferita, il nuovo vettore plasmidico come sopra, può comprendere almeno una prima ulteriore sequenza genica di un batterio mesofilo codificante per un polipeptide avente attività enzimatica di pirimidina fosforilasi.
Secondo una seconda forma di esecuzione preferita, il nuovo vettore plasmidico qui descritto può comprendere, oltre alla prima ulteriore sequenza genica anzidetta, almeno una seconda ulteriore sequenza genica di un batterio mesofilo codificante per un polipeptide avente attività enzimatica di purina fosforilasi.
Secondo una terza forma di esecuzione preferita, il nuovo vettore plasmidico qui descritto può comprendere, oltre alla prima sequenza genica di un batterio mesofilo codificante per un polipeptide avente attività enzimatica di timidina fosforilasi, almeno una prima ulteriore sequenza genica di un batterio mesofrio codificante per un polipeptide avente attività enzimatica di purina fosforilasi .
Un secondo aspetto della presente invenzione riguarda la messa a disposizione di cellule ospiti procariotiche, preferibilmente del ceppo E. coli K12 DH10B, caratterizzate dal fatto di contenere almeno un vettore plasmidico secondo la presente invenzione .
Un ulteriore aspetto della presente invenzione riguarda l'uso delle cellule ospiti della presente invenzione o del corrispondente greggio o estratti purificati, separatamente o in combinazione, per la produzione di polipeptidi o loro miscele aventi attività enzimatica (TP) e/o (UdP TP) e/o (PNP TP) e/o (UdP PNP TP).
Un ulteriore aspetto della presente invenzione riguarda l'uso di cellule ospiti secondo la presente invenzione o del corrispondente greggio o estratti purificati, separatamente o in combinazione , come catalizzatori in reazioni di transglicosilazione tra un nucleoside donatore e una base accettore.
Un ulteriore aspetto della presente invenzione riguarda l'uso di cellule ospiti secondo la presente invenzione, separatamente o in combinazione, o del corrispondente greggio o estratti purificati, nella preparazione di analoghi nucleosidici contenenti basi timidiniche o puriniche o pirimidiniche o contenenti basi eterocicliche aromatiche o non aromatiche. Solo a scopo esemplificativo, ma non limitato a, tali basi eterocicliche possono essere costituite da uno o piu' anelli, a 5, 6, 7 atomi e possono contenere da uno a piu' atomi di azoto.
Un ulteriore aspetto della presente invenzione riguarda l'uso di cellule ospiti secondo la presente invenzione, separatamente o in combinazione, o del corrispondente greggio o estratti purificati, nella preparazione di zuccheri cx-pentosio-l-fosfatici tramite reazioni di fosforolisi.
Un ulteriore aspetto della presente invenzione riguarda l’uso di cellule ospiti secondo la presente invenzione, separatamente o in combinazione, o del grezzo corrispondente o estratti purificati, nella produzione di nucleosidi e loro analoghi modificati.
Descrizione dettagliata dell'invenzione.
Gli inventori della presente domanda hanno costruito plasmidi che sovraesprimono gli enzimi timidina fosforilasi (gene deoA) , pirimidina fosforilasi (gene udp) e purina fosforilasi (gene deoD } di Escherìchia coli. Tra i plasmidi costruiti dagli inventori della presente domanda, 7 plasmidi sono elencati in Tabella 1, di cui 6 plasmidi portano o un singolo gene o combinazioni di 2 o 3 geni insieme. I plasmidi che sono elencati nella Tabella 1 e le caratteristiche della loro costruzione, oltre che la costruzione dì ulteriori plasmidi, sono riportati negli esempi della presente domanda. In Tabella 1 è indicata anche la resistenza all'antibiotico portata da ciascun plasmide. Inoltre in Tabella 1 è riportato il plasmide di controllo (pGM973) in cui non è stata clonata nessuna attività fosforilasìca .
Tabella 1. Plasraidi ricombinanti che sovraesprimono le fosforilasi di Escherichia coli.
Nome Geni clonati* Attività Resistenza enzimatica portata dal espressa plasmide pGM973 Cat
pGM974 deoD PNP Cat
pGM975 udp UdP Cat
pGM976 udp deoD UdP PNP Cat
pGM977 deoA TP Amp
pGM986 udp deoA UdP TP Cat
pGM987 Udp deoD deoA UdP PNP TP Cat
*1/ ordine dei geni da sinistra a destra corrisponde alla loro posizione dopo il clonaggio nel plasmide, partendo da quello fuso a lacZ (vedi Figura 3) Gli inventori della presente domanda hanno comunque trovato che l'ordine concreto secondo il quale sono stati clonati i geni nel plasmide non incide sulle attività delle cellule ospite trasformate con i plasmidi.
Con i plasmidi cosi ottenuti è stato trasformato il ceppo di E. coli DH10B (vedi Tabella 2) ed è stata verificata la crescita in terreno completo LD con l'aggiunta dell'antibiotico per selezionare per il mantenimento del plasmide (d oramienicolo o ampicillina a seconda del plasmide). Il confronto delle curve di crescita tra i ceppi che portano il plasmide scarico e quelli che portano i plasmidi che esprimono uno o più proteine non ha mostrato rilevanti variazioni. I ceppi che esprimono più proteine hanno una crescita leggermente rallentata, ma raggiungono lo stesso titolo in fase stazionaria. In conclusione, la presenza dei plasmidi non causa particolari alterazioni nella vitalità dei ceppi.
Tabella 2. Ceppi di Escherìchia coli DH10B che portano i plasmidi ricombinanti che sovraesprimono le fosforilasi.
Ceppo batterico Gene clonato Gene fuso a lacZ
DH10B/pGM973 —
DH10B/pGM974 deoD deoD
DH10B/pGM975 udp udp
DH10B/pGM976 udp deoD udp
DH10B/pGM977 deoA deoA
DH10B/pGM986 udp deoA udp
DH10B/pGM987 udp deoD deoA udp
Ciascun ceppo che contiene un plasmìde ricombinante esprime in alta quantità una proteina che corrisponde per PM a quella prevista, vedi Figura 2 che riporta la separazione elettroforetica in gel di poliacrilammìde delle proteine estratte dai diversi ceppi. Come si può osservare, tutti i ceppi esprimono una elevata quantità della o delle proteine clonate, in particolare in fase stazionaria di crescita, crescita che e avvenuta senza aggiunta di induttore (IPTG o lattosio) .
Le attività fosf orilasiche (in U/mg di proteine estratte) espresse dalle proteine clonate sono state saggiate mediante test allo spettrofotometro (i protocolli utilizzati sono descritti negli esempi) . Sono state saggiate le attività di uridina fosforilasi, purina fosforilasi e timidina fosforilasi presenti negli estratti grezzi di colture in fase stazionaria di crescita. I risultati, nella Tabella 3, riportano, le attività misurate in colture su scala di laboratorio (5 mi ).
Tabella 3. Attività enzimatica espressa dai ceppi trasformati .
Ceppo Gene Uridina Purina Timidina batterico clonato fosforilasi fosforilasi fosforilasi
U/mg IncreU/mg IncreU/mg Increpro mento pro mento pro- mento teine teine teine§ DHlOB/pGM — 0,2 1 0,01 1 0,03 1 973
DHlOB/pGM deoD NT 1,6 160 NT
974
DHlOB/pGM udp 35,6 178 NT 1,9 63 975
DHlOB/pGM udp deoD 33,4 167 1,6 160 2,1 70 976
DHlOB/pGM deoA NT NT 6,9 230 977
DHlOB/pGM udp deoA 29,2 146 NT 5,6 186 986
DHlOB/pGM udp deoD 23,4 117 1,3 130 5,4 180 987 deoA
§La presenza di attività timidina fosf orilasica nei ceppi in cui è espresso udp è attesa in quanto questo enzima trasforma anche la timidina, NT = non testato
Per quanto riguarda le attività espresse dalle colture in laboratorio, tutte le attività fosforilasiche (U/mg proteina) sono incrementate . Da Tabella 3 appare che l'attività maggiormente aumentata è TP, che risulta più di 200 volte (in particolare 230 volte) quella del ceppo di controllo, quando espressa da sola, mentre Ding et al. e Ge et al. osservavano fattori di incremento di 12.6 e 36.7, rispettivamente. L'attività di TP resta comunque sempre molto elevata anche in combinazione con uno o altri due enzimi (almeno 180 volte il controllo) , corrispondente ad una perdita di ca. 22% dell'incremento quando si passa dalla clonazione singola alla clonazione binaria o ternaria. In questo contesto, è soprattutto degno di nota che l'ulteriore passaggio dalla clonazione binaria a quella ternaria non comporta riduzioni apprezzabili dell'incremento (che scende da 186 a 180) .
Per quanto riguarda l'espressione enzimatica in colture di scale up (volume di 5 1), è stata saggiata ad esempio l'espressione di TP nel ceppo DHlOB/pGM977 , che è risultata di 6,3 U/mg proteine, quindi con un incremento sìmile a quello rilevato in coltura di laboratorio (6,9 U/mg).
Come detto sopra, il nucleoside timidina è
facilmente disponibile da fonti commerciali e
costituisce un materiale di partenza interessante
per effettuare le seguenti reazione di trans-
glicosilazione , mediate dall'enzima timidina
fosforilasi (TP):
(4) timidina fosfato organico « timina a-(desossi) ribosio-l-fosfato
(1) pirimidina-p-ribonucleoside fosfato organico « pirimidina base a-D-ribosio-1-fostato
Se un ceppo che sovraesprime l'enzima timidina fosforilasi (TP) e' in grado di sovraesprimere pure l'enzima uridina fosforilasi (UdP) e/o l'enzima purina nucleoside fosforilasi (PNP) , allora divengono possibili anche le seguenti reazioni :
(2') uracile α-D-ribosio-l-fosf ato <=> uridina fosfato organico
(3') purina base a- (desossi)ribosio-l-fosfato <=> purina-β-(desossi )ribonucleoside fosfato organico
Combinando pertanto le reazioni (1), (2'), (3’) e (4), in tutte le permutazioni possibili, risulta che i nuovi ceppi oggetto della presente invenzione sono in grado di effettuare le seguenti reazioni di trans-glicosilazione, che non erano dominanti coi ceppi del brevetto Keryos WO 00/39307 :
Nucleoside Base A dare Nucleoside Base donatore accettore Prodotto Prodotto
Nucleoside
Timidina Pirìmidina A dare Timina pirimidinico
Nucleoside
Timidina Purina A dare Timina purinico
Pirimidina
Nucleoside a struttura Nucleoside
A dare Pirimidina pirimidinico timidinica timidinico modificata
Pirimidina
Nucleoside a struttura Nucleoside
A dare Purina purinico timidinica timidinico modificata
1/ importanza dei ceppi oggetto della presente
invenzione è da una parte evidente se si considera
che la timidina è materiale di partenza facilmente
disponibile interessante e i ceppi sono in grado
di trasformarlo in prodotti di interesse
farmaceutico ad alto valore aggiunto (ad es .
antivirali , antitumorali), per reazione con una opportuna base accettore purinica o pirimidinica naturale o di sintesi. Inoltre, l'importanza dei ceppi oggetto della presente invenzione risiede pure nella possibilità' di produrre nucleosidi che recano una base a struttura timidinica piu' o meno modificata (nucleoside timidinico) . Tali composti possono avere interesse farmaceutico come antivirali o antitumorali.
In questo contesto, le cellule ospite secondo la presente invenzione che sono caratterizzate dal fatto di comprendere almeno un vettore ricombinante di espressione plasmidico secondo la presente invenzione, il loro corrispondente greggio o estratti purificati possono essere impiegati, separatamente o in combinazione, come catalizzatori in reazioni di transglicosilazione tra un nucleoside donatore ed una base accettore.
Secondo una prima forma di esecuzione, la base accettore è una base eterociclica aromatica o non aromatica, preferibilmente una timidina o una pirimidina o una purina. Nell'ambito della prima forma di esecuzione, le basi eterocicliche aromatiche, preferibilmente le basi di timidina o pirimidina o purìna sono scelte tra timidina naturale o sostituita, pirimidina naturale o sostituita e basi puriniche naturali o sostituite; basi puriniche sostituite alle posizioni 1,2 e/o 6; basi pirimidiniche sostituite alle posizioni 3 e/o 5; purina, 2-azapurina, 8-azapurina e loro analoghi sostituiti, 1-deazapurina (imidazopiridina ), 3-deazapurina, 7 -deazapurina e loro analoghi sostituiti .
Secondo una seconda forma di esecuzione, le basi accettore sono costituiti da composti eterociclici contenenti almeno un atomo di azoto, come, ad esempio, imidazoli e loro analoghi sostituiti, triazoli e loro analoghi sostituiti e pirazoli e loro analoghi sostituiti, pirroli e loro analoghi modificati, tiazoli e benzotiazoli e loro analoghi modificati, oxazoli e benzoxazoli e loro analoghi modificati, isotiazoli e benzisotiazoli e loro analoghi modificati, isoxazoli e benzisoxazoli e loro analoghi modificati, indoli e loro analoghi modificati, benzimidazoli e loro analoghi modificati, indazoli e loro analoghi modificati, piridazine e loro analoghi modificati, pirazìne e loro analoghi modificati, piridine e loro analoghi modificati, tetrazoli e loro analoghi modificati, oxadiazoli e loro analoghi modificati, tiadiazoli e loro analoghi modificati, triazine e loro analoghi modificati, tetrazine e loro analoghi modificati, benzotriazoli e loro analoghi modificati .
Secondo una terza forma di esecuzione, le basi accettore sono costituite da eterocicli che recano un anello eterociclico a 5 fuso con un anello eterociclico a 6, preferibilmente scelte dal gruppo consistente delle imidazopiridine, imidazopirimidine, imidazopirazine, imidazopiridazìne, pirrolopiridine, pirrolopìrimidine, pirrolopirazine, pirrolopiridazine, pirazolopiridine, pirazolopirimidine, pirazolopirazine, pirazolopiridazine o loro analoghi sostituiti .
Secondo una quarta forma di esecuzione, il nucleoside donatore è scelto tra nucleosidi naturali e/o modificati contenenti D-ribosio, lixosio e 2'-deossiribosio o uno zucchero modificato, ossia uno zucchero prodotto per sintesi e che reca sull'anello diverse modificazioni e gruppi non presenti negli zuccheri naturali; nucleosidi contenenti il gruppo ribosio modificato nelle posizioni 2’, 3' e o 5', nucleosidi, in cui lo zucchero è β-D-arabinosio, α-L-xilosio, 3'-desossiribosio, 3 ',5'-didesossiribosio, 2 *,3*— didesossiribosio, 5 '-desossiribosio, 2',5'-didesossiribosio, 2 '-ammino-2 '-desossiribosio, 3'-ammino-3 '-desossiribosio, 2'-fluoro-2 '-desossiribosio.
Le cellule ospite secondo la presente invenzione che sono caratterizzate dal fatto di comprendere almeno un vettore rìcombinante di espressione plasmidico secondo la presente invenzione, il loro corrispondente greggio o estratti purificati possono essere impiegati, separatamente o in combinazione, nella preparazione di analoghi nucleosidici contenenti basì timidiniche o puriniche o pirimìdiniche o contenenti basi eterocicliche aromatiche o non aromatiche, preferibilmente tali basi eterocicliche possono essere costituite da uno o piu' anelli, a 5, 6, 7 atomi e possono contenere da uno a piu' atomi di azoto .
Le cellule ospite secondo la presente invenzione che sono caratterizzate dal fatto di comprendere almeno un vettore ricombinante di espressione plasmidico secondo la presente invenzione, il loro corrispondente greggio o estratti purificati possono anche essere impiegati, separatamente o in combinazione, nella preparazione di zuccheri apentosio-l-fosf atici tramite reazioni di fosforolisi .
Esempi .
Esempio 1: CLONAZIONI, TERRENI E SOLUZIONI.
Per i protocolli utilizzati per i clonaggi e le trasformazioni si rimanda al manuale Sambrook et al (Molecular Cloning. A Laboratory Manual, 2nd ed . Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989) nel quale sono descritte in dettaglio tutte le classiche metodologie di laboratorio. I terreni utilizzati sono LD brodo [composizione per litro: Bactotryptone (Difco) 10 g, Yeast extract (Difco) 5 g, NaCl 5 g] e LD agar (LD 10 g/1 agar), addizionati con cloramfenicolo (30 pg/ml) o ampicìllina (100 pg/ml), a seconda del plasmide presente.
Esempio 2: COSTRUZIONE DEI PLASMIDI RICOMBINANTI Frammenti di DNA di Escherichia coli K12 (ceppo MG1655; Blattner et al. 1997. The complete genome sequence of Escherichia coli K-12. Science 277:1453-1462) sono stati amplificati per PCR con oligonucleotidi adeguati (riportati in Tab. 5), digeriti con opportuni enzimi di restrizione e clonati nel plasmide pUC18 (Yanish-Perron et al.
1985. Gene 33:103-119; EMBL accession number L08752) . I geni udp, deoD e deoA amplificati in questa maniera sono identici alle relative sequenze depositate in EMBL data bank. I relativi numeri di accesso in EMBL data bank sono udp: CG01747, deoD: CG00327; deoA: CG00324. I codici EMBL relativi alle proteine sono invece udp : X15689, deoD: M60917; deoA: U14003.
Le sequenze dei geni sono identiche nei diversi ceppi di Escherichia coli K12 (e anche altri). Con le miscele di ligation è stato trasformato il ceppo di E. coli K12 DH10B (Grant, SG et al. 1990 Proc. Nati. Acad. Sci. U.S.A. 87 4645-9; CP00948), selezionando per il marcatore portato dal plasmide. Il DNA plasmidico portato dai cloni trasformanti è stato estratto, controllato su gel di agarosio e analizzato per la presenza dell'inserto. I plasmidi ricombinanti sono stati sequenziati per verificare la corretta inserzione del gene clonato.
Tabella 5. Oligonucleotidi utilizzati
OLIGO SEQUENZA 5' 3'
304 ACTGAATTCTTCCATGGCTACCCCACACATTAATGCAG
305 TCATGGTCGACTTACTCTTTATCGCCCAGCAGAACG
306 ATCGGTACCATCCATGTCCAAGTCTGATGTTTTTCATCTC
307 AGACGGTCGACAAGAGAATTACAGCAGACGACGC
xxl cagcTgatcgtcctccttaagaaggtaccgatggggt
yyi ATGCGCATGCCTGCAGGTCGACTTACTCTTTATCGCCCAG 2824 AGTCCATATGAAAT ACATTCAAATAT GTAT CCGCT
2825 AGCTGATATCTTTCTGCCATTCATCCGC
2826 GACCGAATTCCTTGTTTCTCGCACAAGAAA
2827 ACTGGTCGACTTATTCGCTGATACGGCG
2863 ACTGGCATGCAGGAGGTTCTCCTATGTTTCTCCACAAGAAATTA 2864 ACTGGCATGCATTATTCGCTGATACGGCGAT
Descrizione del clonacrgio :
- pGMF970: gene deoD di E. coli, amplificato con oligonucleotidi 304 e 305, digerito EcoRI Sali e ligato a pUC18 digerito EcoRI Sali [Coordinata 1 = coordinata 1 pUCl8: pUC18 da 1 a 417 (inizio sequenza - Sali tagliato), deoD da 418 a 1147 (Sali tagliato - EcoRI tagliato) pUCl8 da 1148 a 3383 (EcoRI tagliato - fine sequenza)] SEQ ID No. 1 pGMF971: gene udp di E. coli, amplificato con oligonucleotidi 306 e 307, digerito Kpnl Sali e ligato a pUC18 digerito Kpnl Sali [Coordinata 1 = coordinata 1 di pUCl8: pUC18 da 1 a 417 (inizio sequenza - Sali tagliato) udp da 418 a 1196 (Sali tagliato - Kpnl tagliato) pUC18 da 1197 a 3444 (Kpnl tagliato - fine sequenza)] SEQ ID No. 2
- pGMF972: gene deoD di E. coli amplificato con oligonucleotidi xxl e yyl, digerito Sali Sphl e ligato a pGMF971 digerito Sali Sphl [Coordinata 1 = coordinata 1 di pUCl8: pUC18 da 1 a 405 (inizio sequenza - Sphl tagliato) deoD da 406 a 1162 (Sphl tagliato - Sali tagliato) udp da 1163 a 1941 (Sali tagliato - Kpnl tagliato) pUCl8 da 1942 a 4189 (Kpnl tagliato - fine sequenza) SEQ ID No.
3
- pGM973: il gene cat è stato amplificato per PCR da pGZH 9, derivato di pKF3 (Lessi et al. 1992. J. Bacteriol. 174:2493-2500) con gli oligonucleotidi 2824 e 2825, digerito Ndel EcoRV e ligato a pUC18 digerito Ndel Seal. Il gene per la resistenza all'ampicillina è stato parzialmente deleto e sostituito con la resistenza al cloramf enicolo . [Coordinata 1 al sito Ndel tagliato di pUC18: pUC18 da 1 a 1995 (sito Seal tagliato) cat da 1996 a 2901 (sito EcoRV tagliato - Ndel tagliato)] SEQ ID No. 4
- pGM974: il gene cat, amplificato da pKF3 con gli oligonucleotidi 2824 e 2825, è stato digerito Ndel EcoRV e ligato a pGMF970 digerito Ndel Seal.
[Coordinata 1 al sito Ndel tagliato di pUC18: pUC18 da 1 a 233 (Ndel tagliato - Sali tagliato) deoD da 234 a 963 (Sali tagliato - EcoRI tagliato) pUC18 da 964 a 2692 (EcoRI tagliato - Seal tagliato) cat da 2693 a 3598 (EcoRV tagliato -Ndel tagliato)] SEQ ID No. 5
- pGM975: il gene cat è stato amplificato per PCR da pKF3 con gli oligonucleotidi 2824 e 2825, digerito Ndel EcoRV e ligato a pGMF971 digerito Ndel Seal. [Coordinata 1 al sito Ndel tagliato di pUC18: pUCl8 da 1 a 233 (Ndel tagliato - Sali tagliato) udp da 234 a 1016 (Sali tagliato - Kpnl tagliato) pUC18 da 1017 a 2753 (Kpnl tagliato Seal tagliato) cat da 2754 a 3659 (EcoRV tagliato - Ndel tagliato)] SEQ ID No. 6
- pGM976: il gene cat è stato amplificato per PCR da pKF3 con gli oligonucleotidi 2824 e 2825, digerito Ndel EcoRV e ligato a pGMF972 digerito Ndel Seal. [Coordinata 1 al sito Ndel tagliato di pUCl8: pUC18 da 1 a 231 (Ndel tagliato - Sphl tagliato deoD da 232 a 978 (Sphl tagliato - Sali tagliato) udp da 979 a 1757 (Sali tagliato - Kpnl tagliato) pUC18 da 1758 a 3498 (Kpnl tagliato -Seal tagliato) cat da 3499 a 4004 (EcoRV tagliato . Ndel tagliato] SEQ ID No. 7
- pGM977: il gene deoA di E. coli è stato amplificato per PCR con gli oligonucleotidi 2826 e 2827, digerito EcoRI Sali e ligato a pUC18 digerito EcoRI Sali. [Coordinata 1 = coordinata 1 di pUC18: pUC18 da 1 a 417 (inizio sequenza -Sali tagliato) deoA da 418 a 1748 (Sali tagliato -EcoRI tagliato) pUC18 da 1749 a 3983 (EcoRI tagliato a fine sequenza)] SEQ ID No. 8
pGM986amp: il gene deoA di E. coli è stato amplificato per PCR con gli oligonucleotidi 2863 e 2864, digerito Sphl e clonato in pGMF971 digerito Sphl . I geni udp e deoA sono nello stesso orientamento, in tandem. [Coordinata 1 = coordinata 1 di pUC18: pUC18 da 1 a 409 (inizio sequenza - Sphl tagliato) deoA da 410 a 1752 (Sphl tagliato - Sphl tagliato) pUC18 da 1753 a 1759 (Sphl tagliato a Sali tagliato) udp da 1760 a 2543 (Sali tagliato- Kpnl tagliato) pUC18 da 2544 a 4787 (Kpnl tagliato - fine sequenza)] SEQ ID No. 9
pGM986: il gene deoA di E. coli è stato amplificato per PCR con gli oligonucleotidi 2863 e 2864, digerito Sphl e clonato in pGM975 digerito Sphl. I geni udp e deoA sono nello stesso orientamento, in tandem. [Coordinata 1 al sito Ndel tagliato di pUCl8: pUC18 da 1 a 225 (Ndel tagliato - Sphl tagliato) deoA da 226 a 1568 (Sphl tagliato - Sphl tagliato) pUC18 da 1569 a 1576 (Sphl tagliato - Sali tagliato) udp da 1577 a 2359 (Sali tagliato - Kpnl tagliato) pUC18 da 2360 a 4096 (Kpnl tagliato - Seal tagliato) cat da 4097 a 5002 (EcoRV tagliato Ndel tagliato)] SEQ ID No.
10
pGM987: il gene deoA di E. coli, è stato amplificato per PCR con gli oligonucleotidi 2863 e 2864, digerito Sphl e ligato in pGM976 digerito Sphl . I geni udp, deoD e deoA sono nello stesso orientamento. [Coordinata 1 al sito Ndel tagliato di pUC18: pUC18 da 1 a 222 (Ndel tagliato - Sphl tagliato) deoA da 223 a 1564 (Sphl tagliato - Sphl tagliato) deoD da 1565 a 2919 (Sphl tagliato -Sali tagliato) udp da 2920 a 3702 (Sali tagliato -Kpnl tagliato) pUC18 da 3703 a 5439 (Kpnl tagliato - Seal tagliato)cat da 5440 a 6345 (EcoRV tagliato -Ndel tagliato)] ] SEQ ID No. 11
In Figura 1 è riassunta la costruzione dei plasmidi .
Esempio 3: FUSIONI CREATE PER CLONARE I DIVERSI GENI.
Si riportano le fusioni che si sono create tra il gene lacZ del vettore pUC18 ed il primo gene codificante per fosforilasi clonato a valle e, quando sono clonati più geni in sequenza, le sequenze della regione intergenica (linker).
Nella Fig. 3 sono riportate le fusioni nei vari plasmidi, con la regione aggiunta al 5' del gene sottolineata. Inoltre sono riportate le sequenze dei linker posti tra il gene udp e deoD, nei costrutti che portano entrambi gli enzimi (pGM976 e pGM987) e quella a monte di deoA in pGM986 e pGM987. In questi casi, la sequenza di attacco dei ribosomi (RBS) è in grassetto.
Esempio 4; ESPRESSIONE DELLE PROTEINE CLONATE
In Figura 2 è riportata la sovraespressione delle proteine espresse dai ceppi E. coli DH10B trasformati con i diversi plasmidi, analizzata mediante elettroforesi. I pesi molecolari dei marcatori (M) corsi nel primo pozzetto di ciascun gel sono indicati sulla sinistra in kDa.
Figura 2Δ riguarda estrazioni fatte dopo 2 e 4 ore di crescita esponenziale ed in fase stazionaria (on) e le proteine separate per elettroforesi su gel di poliacrilammide al 10%, SDS 0,1%.
Figura 2B riguarda le estrazioni fatte nella fase stazionaria. Le proteine sono state separate per elettroforesi in gel di poliacrilammide al 15%, SDS 0,1%. Si noti che pGM973 corrisponde al plasmide di controllo, nel quale non è stato clonato alcun gene, se non la resistenza al cloramf enicolo . Per DH10B/pGM986 e 987 sono stati analizzati due cloni indipendenti (cl.l e cl.2).
In Tabella 6 sono riportati i PM attesi per le diverse proteine clonate, tenendo conto della fusione che si è venuta a creare nel costrutto) .
Tabella 6. Pesi molecolari attesi per le proteine clonate
PROTEINA PM (kDa) ESPRESSA DAI PLASMIDI
CLONATA
Cat 25,00 pGM973 , pGM974, pGM975, pGM976, pGM986 , pGM987
lacZ -UdP 28,40 pGM975 , pGM976, pGM986, pGM987 Udp 27,16
lacZ-PNP 26,80 pGM974
PNP 25,95 pGM976 , pGM987
lacZ -TP 47,97 pGM977
TP 47,19 pGM986 , pGM987
Sono state saggiate sia condizioni di crescita esponenziale (2 e 4 ore dall'inoculo) sia la fase stazionaria di crescita (over night = on) per confrontare la quantità di proteine espresse. La quantità maggiore di proteina corrisponde alla fase stazionaria.
In conclusione, tutti i ceppi sovraesprimono la proteina o le proteine ricombinanti clonate.
Esempio 5: MISURA DELL'ATTIVITÀ' ENZIMATICA
Preparazione dell'estratto proteico:
Colture cresciute per una notte in 5 mi di brodo LD, addizionato con l'antibiotico opportuno, sono state centrifugate e risospese in 500 μΐ di tampone fosfato 0,1 M, EDTA ImM pH 7,5 raffreddato in ghiaccio, e sonicate per 25 sec x 2 volte a intervalli di 30 sec, centrifugate e il sovranatante conservato a -20°C. La quantità di proteine presente nell'estratto è stata valutata con il metodo Bradford (Bradford, M.M. 1976. Anal. Biochem.l2\ 248-54).
Misura dell 'attività purina fosforiiasica:
L'attività è stata saggiata allo spettrofotometro, misurando la diminuzione di assorbanza per fosforolisi del substrato inosina in ipoxantina. In 1 mi di tampone fosfato contenente 4 mM dì inosina è stata aggiunta una quantità di estratto tale da poter seguire la diminuzione dell' assorbanza (OD 251) nel tempo allo spettrofotometro. Le unità di enzima, espresse come pmol ipoxantina/min/mg proteine, sono state calcolate in base alla formula:
(Vtot x AA/min)/(1,50 x Vs)
dove: Vtot = volume totale della reazione; ΔΑ/min = variazione media dell'assorbanza ; 1,50 = coefficiente di estinzione dell 'inosina ; Vs = volume di estratto utilizzato.
Misura dell'attività pirimidina fosforiiasica:
L'attività è stata saggiata allo spettrofotometro, misurando la diminuzione di assorbanza per fosforolisi del substrato uridina in uracile. In 1 mi di tampone fosfato contenente 20 mM di uridina è stata aggiunta una quantità di estratto tale da poter seguire la diminuzione dell 'assorbanza (OD 282) nel tempo allo spettrofotometro. Le unità di enzima, espresse come micromol uracile/min/mg proteine, sono state calcolate in base alla formula :
(Vtot x ΔΑ/min)/(1,37 x Vs)
dove: Vtot = volume totale della reazione; ΔΑ/mìn = variazione media dell'assorbanza; 1,37 = coefficiente di estinzione dell 'uridina; Vs = volume di estratto utilizzato.
Attività timidina fosforilasica :
Per la determinazione della velocità di fosforolisi dei nucleosidi pirimidinici è stato ottimizzato un saggio riportato in letteratura (Yamada, E.W., Uridine Phosphorylase from Rat Liver, Methods in enzymology, 1978, 51, 423-431) che sfrutta la diversa assorbanza a 297 nm del nucleoside e della base libera a pH alcalino. Infatti in queste condizioni, viene rilevata soltanto la base libera e non il corrispondente nucleoside, permettendo così di quantificare le pinoli di base azotata liberata in seguito alla reazione di fosforolisi senza interferenze dovute al nucleoside di partenza. La reazione di fosforolisi è stata allestita in 1 mi di tampone fosfato pH 7,4, contenente timidina 5mM e diverse quantità di estratto proteico. Dopo 5 min a T ambiente, la reazione è fermata con l'aggiunta di 70 pi di NaOH 10 M. I campioni vengono quindi letti allo spettrofotometro a 297 nm. Le unità enzimatiche espresse come pmol timina/min/mg proteine sono state ottenute in base alla formula:
(Abs x 1000 x mi volume reazione)/ε (M-lcm-1) x min x mi enzima
dove Abs = valore dell 'assorbanza; ε =
-1 coefficiente di estinzione della timina = 3946 M SEQUENCE LISTING
<110> Frau Pharma srl.
<120> Recombinant bacterial strains for the production of naturai nucleosides and modified analogues
<130> B159265
<160> 11
<170> Patentln version 3.5
<210> 1
<211> 3383
<212> DNA
<213> Artificial Sequence
<220>
<223> pGMF970
<4 00> 1
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgccaa gcttgcatgc ctgcaggtcg 420
acttactctt tatcgcccag cagaacggat tccagtgcga ttttgatcat gtcgttgaag 480
gtagtctgac gctcagcggc agtggtctgc tcgtgagtgc ggatgtggtc agatacggtg 540
cagatggtca gggctttcgc gccaaattct gcagcgacgc cgtagatacc agccgcttcc 600
atttccacgc cgagaatgcc gtatttttcc atcacgtcga acatttcgcc gtccggagag 660
tagaacaggt cagcggagaa caggttaccc acgcgagcat caatacccag tgctttagct 720
gcatctactg cgttacgcac catgtcgaag tcagcgatag cggcaaagtc atggtcttta 780
aaacggatgc ggttaacttt ggaatcggtg caggcaccca taccgataac gacgtcgcgc 840
agttttacgt gcggcagaac tgcgccacag gaacccacgc ggataatttt cttcacgccg 900
aaatcggtga tcagttcttt ggtgtagatg gagcaggacg ggatacccat accgtgaccc 960
attacggaaa ttttgcggcc tttgtaagta ccggtgaagc ccagcatacc gcgaacgttg 1020
ttcacttcac gggcatcttc aaggaaagtt tcagcaatat acttcgcacg cagcgggtcg 1080
cctggcatca aaactacgtc agcgaaatcg cccatttctg cattaatgtg tggggtagcc 1140
atggaagaat tcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac 1200
aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt 1260
gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc 1320
gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg 1380
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 1440
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 1500
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 1560
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 1620
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 1680
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 1740
aagcgtggcg ctttctcaaa gctcacgctg taggtatctc agttcggtgt aggtcgttcg 1800
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 1860
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 1920
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 1980
gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 2040
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 2100
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 2160
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 2220
ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 2280
taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 2340
tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 2400
cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 2460
gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 2520
cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 2580
ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 2640
aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 2700
atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 2760
tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 2820
gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 2880
aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 2940
acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 3000
ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 3060
tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 3120
aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 3180
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 3240
atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 3300
aaaagtgcca cctgacgtct aagaaaccat tattatgatg acattaacct ataaaaatag 3360
gcgtatcacg aggccctttc gtc
3383
<210> 2
<211> 3444
<212> DNA
<213> Artificial Sequence
<220>
<223> pGMF97 1
<400> 2
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgccaa gcttgcatgc ctgcaggtcg 420
acaagagaat tacagcagac gacgcgccgc ttccaccacg attttcaccg catggctttc 480
ggtttgtttc atcgtctcag cattcgggat ctcttgctgg gtgcggttaa cgataacacc 540
cgctaccata ccggcacgca ggccctgact tgcacacatg gtcagcaggg ttgcagattc 600
catttcatag ttcattacgc ccatcgcctg ccactcttcc atagaacctt taaagtgacg 660
aactacgcga ccagagtaag tatcgtaacg ttcctgacct gggtagaagg tatcagaaga 720
agctgtcacg ccaacgtgag ttgtcgcgcc aatggatttc gcagcttcaa ccagcgcagt 780
cgtacattcg aaatcagcga cagccgggaa ttccagcggt gcgaagtgca ggctcgcgcc 840
atccagacgg acagacgccg tggtaaccag gacatcaccc acattaatat gcggctgaat 900
agcgcccgtt gtaccgatac gcaggaaggt gcgaatgccc agctgtgcca gctcttcaac 960
agcaatagag gtagacgggc cgccgatacc ggtagagcag acgataacag gtttaccatc 1020
cagctctgca cgccaggtag tgaattcgcg gtgagatgcc agcttaaccg gcttatccat 1080
cagcgcggcg atcttttcca cacgatccgg gtcgccaggg acgatggcaa gcgtagcccc 1140
ttgtaaatcg tttttagtga ggccgagatg aaaaacatca gacttggaca tggatggtac 1200
cgagctcgaa ttcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca 1260
caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag 1320
tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt 1380
cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 1440
gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 1500
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 1560
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 1620
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 1680
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 1740
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 1800
gaagcgtggc gctttctcaa agctcacgct gtaggtatct cagttcggtg taggtcgttc 1860
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 1920
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 1980
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 2040
ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 2100
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 2160
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 2220
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 2280
tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 2340
ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 2400
gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 2460
tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 2520
cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 2580
ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 2640
gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 2700
caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 2760
gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 2820
ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 2880
tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 2940
caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 3000
tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 3060
cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 3120
ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 3180
aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 3240
tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 3300
gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 3360
gaaaagtgcc acctgacgtc taagaaacca ttattatgat gacattaacc tataaaaata 3420
ggcgtatcac gaggcccttt cgtc
3444
<2 10> 3
<211> 4189
<212> DNA
<213> Artificial Sequence
<220>
<223> pGMF972
<400> 3
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgccaa gcttgcatgc ctgcaggtcg 420
acttactctt tatcgcccag cagaacggat tccagtgcga ttttgatcat gtcgttgaag 480
gtagtctgac gctcagcggc agtggtctgc tcgtgagtgc ggatgtggtc agatacggtg 540
cagatggtca gggctttcgc gccaaattct gcagcgacgc cgtagatacc agccgcttcc 600
atttccacgc cgagaatgcc gtatttttcc atcacgtcga acatttcgcc gtccggagag 660
tagaacaggt cagcggagaa caggttaccc acgcgagcat caatacccag tgctttagct 720
gcatctactg cgttacgcac catgtcgaag tcagcgatag cggcaaagtc atggtcttta 780
aaacggatgc ggttaacttt ggaatcggtg caggcaccca taccgataac gacgtcgcgc 840
agttttacgt gcggcagaac tgcgccacag gaacccacgc ggataatttt cttcacgccg 900
aaatcggtga tcagttcttt ggtgtagatg gagcaggacg ggatacccat accgtgaccc 960
attacggaaa ttttgcggcc tttgtaagta ccggtgaagc ccagcatacc gcgaacgttg 1020
ttcacttcac gggcatcttc aaggaaagtt tcagcaatat acttcgcacg cagcgggtcg 1080
cctggcatca aaactacgtc agcgaaatcg cccatttctg cattaatgtg tggggtagcc 1140
atggaagaat tcctcctgct agtcgacaag agaattacag cagacgacgc gccgcttcca 1200
ccacgatttt caccgcatgg ctttcggttt gtttcatcgt ctcagcattc gggatctctt 1260
gctgggtgcg gttaacgata acacccgcta ccataccggc acgcaggccc tgacttgcac 1320
acatggtcag cagggttgca gattccattt catagttcat tacgcccatc gcctgccact 1380
cttccataga acctttaaag tgacgaacta cgcgaccaga gtaagtatcg taacgttcct 1440
gacctgggta gaaggtatca gaagaagctg tcacgccaac gtgagttgtc gcgccaatgg 1500
atttcgcagc ttcaaccagc gcagtcgtac attcgaaatc agcgacagcc gggaattcca 1560
gcggtgcgaa gtgcaggctc gcgccatcca gacggacaga cgccgtggta accaggacat 1620
cacccacatt aatatgcggc tgaatagcgc ccgttgtacc gatacgcagg aaggtgcgaa 1680
tgcccagctg tgccagctct tcaacagcaa tagaggtaga cgggccgccg ataccggtag 1740
agcagacgat aacaggttta ccatccagct ctgcacgcca ggtagtgaat tcgcggtgag 1800
atgccagctt aaccggctta tccatcagcg cggcgatctt ttccacacga tccgggtcgc 1860
cagggac:gat ggcaagcgta gccccttgta aatcgttttt agtgaggccg agatgaaaaa 1920
catcagactt ggacatggat ggtaccgagc tcgaattcgt aatcatggtc atagctgttt 1980
cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag 2040
tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg 2100
cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg 2160
gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc 2220
tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 2280
acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 2340
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 2400
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 2460
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 2520
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcaaagctc acgctgtagg 2580
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 2640
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 2700
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 2760
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 2820
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 2880
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 2940
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 3000
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 3060
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 3120
tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 3180
tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 3240
tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca 3300
gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 3360
tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 3420
ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg 3480
gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc 3540
aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg 3600
ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga 3660
tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga 3720
ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta 3780
aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg 3840
ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact 3900
ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata 3960
agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt 4020
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 4080
ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt 4140
atgatgacat taacctataa aaataggcgt atcacgaggc cctttcgtc 4189
<21 0> 4
<21 1> 2901
<212> DNA
<213> Artificial Sequence
<220>
<223> pGM973
<400> 4
tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgccattc 60
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg<c>gggcctctt cgctattacg 120
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 180
ccagtcacga cgttgtaaaa cgacggccag tgccaagctt gcatgcctgc aggtcgactc 240
tagaggatcc ccgggtaccg agctcgaatt cgtaatcatg gtcatagctg tttcctgtgt 300
gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 360
cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 420
tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 480
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 540
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 600
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 660
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 720
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 780
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 840
ccgcctttct cccttcggga agcgtggcgc tttctcaaag ctcacgctgt aggtatctca 900
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 960
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 1020
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 1080
cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 1140
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 1200
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 1260
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 1320
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 1380
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 1440
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 1500
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 1560
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 1620
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 1680
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 1740
acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 1800
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 1860
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 1920
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 1980
ctgtgactgg tgagtatctt tctgccattc atccgcttat tatcacttat tcaggcgtag 2040
caccaggcgt ttaagggcac caataactgc cttaaaaaaa ttacgccccg ccctgccact 2100
catcgcagta ctgttgtaat tcattaagca ttctgccgac atggaagcca tcacagacgg 2160
catgatgaac ctgaatcgcc agcggcatca gcaccttgtc gccttgcgta taatatttgc 2220
ccatagtgaa aacgggggcg aagaagttgt ccatattagc cacgtttaaa tcaaaactgg 2280
tgaaactcac ccagggattg gctgagacga aaaacatatt ctcaataaac cctttaggga 2340
aataggccag gttttcaccg taacacgcca catcttgcga atatatgtgt agaaactgcc 2400
ggaaatcgtc gtggtattca ctccagagcg atgaaaacgt ttcagtttgc tcatggaaaa 2460
cggtgtaaca agggtgaaca ctatcccata tcaccagctc accgtctttc attgccatac 2520
gaaattccgt atgagcattc atcaggcggg caagaatgtg aataaaggcc ggataaaact 2580
tgtgcttatt tttctttacg gtctttaaaa aggccgtaat atccagatga acggtctggt 2640
tataggtaca ttgagcaact gactgaaatg cctcaaaatg ttctttacga tgccattggg 2700
atatatcaac ggtggtatat ccagtgattt ttttctccat tttagcttcc ttagctcctg 2760
aaaatctcga taactcaaaa aatacgcccg gtagtgatct tatttcatta tggtgaaagt 2820
tggaacctct tacgtgccga tcaacgtctc attttcgcca aaacttggcc ctagagcgga 2880
tacatatttg aatgtatttc a
2901
<2 10> 5
<21 1> 3598
<212> DNA
<213> Artificial
<220>
<223> pGM974
<400> 5
tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgccattc 60
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 120
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 180
ccagtcacga cgttgtaaaa cgacggccag tgccaagctt gcatgcctgc aggtcgactt 240
actctttatc gcccagcaga acggattcca gtgcgatttt gatcatgtcg ttgaaggtag 300
tctgacgctc agcggcagtg gtctgctcgt gagtgcggat gtggtcagat acggtgcaga 360
tggtcagggc tttcgcgcca aattctgcag cgacgccgta gataccagcc gcttccattt 420
ccacgccgag aatgccgtat ttttccatca cgtcgaacat ttcgccgtcc ggagagtaga 480
acaggtcagc ggagaacagg ttacccacgc gagcatcaat acccagtgct ttagctgcat 540
ctactgcgtt acgcaccatg tcgaagtcag cgatagcggc aaagtcatgg tctttaaaac 600
ggatgcggtt aactttggaa tcggtgcagg cacccatacc gataacgacg tcgcgcagtt 660
ttacgtgcgg cagaactgcg ccacaggaac ccacgcggat aattttcttc acgccgaaat 720
cggtgatcag ttctttggtg tagatggagc aggacgggat acccataccg tgacccatta 780
cggaaatttt gcggcctttg taagtaccgg tgaagcccag cataccgcga acgttgttca 840
cttcacgggc atcttcaagg aaagtttcag caatatactt cgcacgcagc gggtcgcctg 900
gcatcaaaac tacgtcagcg aaatcgccca tttctgcatt aatgtgtggg gtagccatgg 960
aagaattcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 1020
ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc 1080
taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 1140
cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct 1200
tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 1260
gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 1320
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 1380
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 1440
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 1500
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 1560
gtggcgcttt ctcaaagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 1620
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 1680
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 1740
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 1800
aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc 1860
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 1920
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 1980
atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 2040
atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 2100
tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 2160
gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 2220
tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 2280
gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 2340
cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 2400
gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc 2460
atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 2520
aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 2580
atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 2640
aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtatctttct 2700
gccattcatc cgcttattat cacttattca ggcgtagcac caggcgttta agggcaccaa 2760
taactgcctt aaaaaaatta cgccccgccc tgccactcat cgcagtactg ttgtaattca 2820
ttaagcattc tgccgacatg gaagccatca cagacggcat gatgaacctg aatcgccagc 2880
ggcatcagca ccttgtcgcc ttgcgtataa tatttgccca tagtgaaaac gggggcgaag 2940
aagttgtcca tattagccac gtttaaatca aaactggtga aactcaccca gggattggct 3000
gagacgaaaa acatattctc aataaaccct ttagggaaat aggccaggtt ttcaccgtaa 3060
cacgccacat cttgcgaata tatgtgtaga aactgccgga aatcgtcgtg gtattcactc 3120
cagagcgatg aaaacgtttc agtttgctca tggaaaacgg tgtaacaagg gtgaacacta 3180
tcccatatca ccagctcacc gtctttcatt gccatacgaa attccgtatg agcattcatc 3240
aggcgggcaa gaatgtgaat aaaggccgga taaaacttgt gcttattttt ctttacggtc 3300
tttaaaaagg ccgtaatatc cagatgaacg gtctggttat aggtacattg agcaactgac 3360
tgaaatgcct caaaatgttc tttacgatgc cattgggata tatcaacggt ggtatatcca 3420
gtgatttttt tctccatttt agcttcctta gctcctgaaa atctcgataa ctcaaaaaat 3480
acgcccggta gtgatcttat ttcattatgg tgaaagttgg aacctcttac gtgccgatca 3540
acgtctcatt ttcgccaaaa cttggcccta gagcggatac atatttgaat gtatttca 3598
<210> 6
<211> 3659
<212> DNA
<213> Artificial
<220>
<223> pGM975
<40 0> 6
tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgccattc 60
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 120
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 180
ccagtcacga cgttgtaaaa cgacggccag tgccaagctt gcatgcctgc aggtcgacaa 240
gagaattaca<'>gcagacgacg cgccgcttcc accacgattt tcaccgcatg gctttcggtt 300
tgtttcatcg tctcagcatt cgggatctct tgctgggtgc ggttaacgat aacacccgct 360
accataccgg cacgcaggcc ctgacttgca cacatggtca gcagggttgc agattccatt 420
tcatagttca ttacgcccat cgcctgccac tcttccatag aacctttaaa gtgacgaact 480
acgcgaccag agtaagtatc gtaacgttcc tgacctgggt agaaggtatc agaagaagct 540
gtcacgccaa cgtgagttgt cgcgccaatg gatttcgcag cttcaaccag cgcagtcgta 600
cattcgaaat cagcgacagc cgggaattcc agcggtgcga agtgcaggct cgcgccatcc 660
agacggacag acgccgtggt aaccaggaca tcacccacat taatatgcgg ctgaatagcg 720
cccgttgtac cgatacgcag gaaggtgcga atgcccagct gtgccagctc ttcaacagca 780
atagaggtag acgggccgcc gataccggta gagcagacga taacaggttt accatccagc 840
tctgcacgcc aggtagtgaa ttcgcggtga gatgccagct taaccggctt atccatcagc 900
gcggcgatct tttccacacg atccgggtcg ccagggacga tggcaagcgt agccccttgt 960
aaatcgtttt tagtgaggcc gagatgaaaa acatcagact tggacatgga tggtaccgag 1020
ctcgaattcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 1080
tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 1140
ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 1200
ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 1260
ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 1320
agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 1380
catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 1440
tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 1500
gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 1560
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 1620
cgtggcgctt tctcaaagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 1680
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 1740
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 1800
taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 1860
taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 1920
cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 1980
tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 2040
gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 2100
catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 2160
atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga 2220
ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt 2280
gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg 2340
agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga 2400
gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga 2460
agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg 2520
catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc 2580
aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc 2640
gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca 2700
taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg agtatctttc 2760
tgccattcat ccgcttatta tcacttattc aggcgtagca ccaggcgttt aagggcacca 2820
ataactgcct taaaaaaatt acgccccgcc ctgccactca tcgcagtact gttgtaattc 2880
attaagcatt ctgccgacat ggaagccatc acagacggca tgatgaacct gaatcgccag 2940
cggcatcagc accttgtcgc cttgcgtata atatttgccc atagtgaaaa cgggggcgaa 3000
gaagttgtcc atattagcca cgtttaaatc aaaactggtg aaactcaccc agggattggc 3060
tgagacgaaa aacatattct caataaaccc tttagggaaa taggccaggt tttcaccgta 3120
acacgccaca tcttgcgaat atatgtgtag aaactgccgg aaatcgtcgt ggtattcact 3180
ccagagcgat gaaaacgttt cagtttgctc atggaaaacg gtgtaacaag ggtgaacact 3240
atcccatatc accagctcac cgtctttcat tgccatacga aattccgtat gagcattcat 3300
caggcgggca agaatgtgaa taaaggccgg ataaaacttg tgcttatttt tctttacggt 3360
ctttaaaaag gccgtaatat ccagatgaac ggtctggtta taggtacatt gagcaactga 3420
ctgaaatgcc tcaaaatgtt ctttacgatg ccattgggat atatcaacgg tggtatatcc 3480
agtgattttt ttctccattt tagcttcctt agctcctgaa aatctcgata actcaaaaaa 3540
tacgcccggt agtgatctta tttcattatg gtgaaagttg gaacctctta cgtgccgatc 3600
aacgtctcat tttcgccaaa acttggccct agagcggata catatttgaa tgtatttca 3659
<210> 7
<211> 4404
<212> DNA
<213> Artificial Sequence
<220>
<223> pGM97 6
<4 00> 7
tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgccattc 60
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 120
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 180
ccagtcacga cgttgtaaaa cgacggccag tgccaagctt gcatgcctgc aggtcgactt 240
actctttatc gcccagcaga acggattcca gtgcgatttt gatcatgtcg ttgaaggtag 300
tctgacgctc agcggcagtg gtctgctcgt gagtgcggat gtggtcagat acggtgcaga 360
tggtcagggc tttcgcgcca aattctgcag cgacgccgta gataccagcc gcttccattt 420
ccacgccgag aatgccgtat ttttccatca cgtcgaacat ttcgccgtcc ggagagtaga 480
acaggtcagc ggagaacagg ttacccacgc gagcatcaat acccagtgct ttagctgcat 540
ctactgcgtt acgcaccatg tcgaagtcag cgatagcggc aaagtcatgg tctttaaaac 600
ggatgcggtt aactttggaa tcggtgcagg cacccatacc gataacgacg tcgcgcagtt 660
ttacgtgcgg cagaactgcg ccacaggaac ccacgcggat aattttcttc acgccgaaat 720
cggtgatcag ttctttggtg tagatggagc aggacgggat acccataccg tgacccatta 780
cggaaatttt gcggcctttg taagtaccgg tgaagcccag cataccgcga acgttgttca 840
cttcacgggc atcttcaagg aaagtttcag caatatactt cgcacgcagc gggtcgcctg 900
gcatcaaaac tacgtcagcg aaatcgccca tttctgcatt aatgtgtggg gtagccatgg 960
aagaattcct cctgctagtc gacaagagaa ttacagcaga cgacgcgccg cttccaccac 1020
gattttcacc gcatggcttt cggtttgttt catcgtctca gcattcggga tctcttgctg 1080
ggtgcggtta acgataacac ccgctaccat accggcacgc aggccctgac ttgcacacat 1140
ggtcagcagg gttgcagatt ccatttcata gttcattacg cccatcgcct gccactcttc 1200
catagaacct ttaaagtgac gaactacgcg accagagtaa gtatcgtaac gttcctgacc 1260
tgggtagaag gtatcagaag aagctgtcac gccaacgtga gttgtcgcgc caatggattt 1320
cgcagcttca accagcgcag tcgtacattc gaaatcagcg acagccggga attccagcgg 1380
tgcgaagtgc aggctcgcgc catccagacg gacagacgcc gtggtaa cca ggacatcacc 1440
cacattaata tgcggctgaa tagcgcccgt tgtaccgata cgcaggaagg tgcgaatgcc 1500
cagctgtgcc agctcttcaa cagcaataga ggtagacggg ccgccgatac cggtagagca 1560
gacgataaca ggtttaccat ccagctctgc acgccaggta gtgaattcgc ggtgagatgc 1620
cagcttaacc ggcttatcca tcagcgcggc gatcttttcc acacgatccg ggtcgccagg 1680
gacgatggca agcgtagccc cttgtaaatc gtttttagtg aggccgagat gaaaaacatc 1740
agacttggac atggatggta ccgagctcga attcgtaatc atggtcatag ctgtttcctg 1800
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 1860
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 1920
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 1980
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 2040
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 2100
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 2160
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 2220
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 2280
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 2340
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca aagctcacgc tgtaggtatc 2400
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 2460
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 2520
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 2580
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 2640
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 2700
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 2760
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 2820
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 2880
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 2940
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 3000
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 3060
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 3120
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 3180
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 3240
gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 3300
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 3360
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 3420
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 3480
tttctgtgac tggtgagtat ctttctgcca ttcatccgct tattatcact tattcaggcg 3540
tagcaccagg cgtttaaggg caccaataac tgccttaaaa aaattacgcc ccgccctgcc 3600
actcatcgca gtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacaga 3660
cggcatgatg aacctgaatc gccagcggca tcagcacctt gtcgccttgc gtataatatt 3720
tgcccatagt gaaaacgggg gcgaagaagt tgtccatatt agccacgttt aaatcaaaac 3780
tggtgaaact cacccaggga ttggctgaga cgaaaaacat attctcaata aaccctttag 3840
ggaaataggc caggttttca ccgtaacacg ccacatcttg cgaatatatg tgtagaaact 3900 gccggaaatc gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga 3960
aaacggtgta acaagggtga acactatccc atatcaccag ctcaccgtct ttcattgcca 4020
tacgaaattc cgtatgagca ttcatcaggc gggcaagaat gtgaataaag gccggataaa 4080
acttgtgctt atttttcttt acggtcttta aaaaggccgt aatatccaga tgaacggtct 4140
ggttataggt acattgagca actgactgaa atgcctcaaa atgttcttta cgatgccatt 4200
gggatatatc aacggtggta tatccagtga tttttttctc cattttagct tccttagctc 4260
ctgaaaatct cgataactca aaaaatacgc ccggtagtga tcttatttca ttatggtgaa 4320
agttggaacc tcttacgtgc cgatcaacgt ctcattttcg ccaaaagttg gcccatgagc 4380
ggatacatat ttgaatgtat ttca
4404
<210> 8
<21 1> 3983
<212> DNA
<213> Artificial Sequence
<220>
<223> pGM977
<400> 8
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgccaa gcttgcatgc ctgcaggtcg 420
acttattcgc tgatacggcg atagacagtt ggtgtgcttt ccggtgcttt atcggcaagt 480
ttaattgccg ctttcaccgc tttcgccgct tcctgccagt tgttttcgtc tttcgcgtgg 540
ataaccgcca gcggacgctg accgtctacc tggtcgccca gacgcgccat atcagtaaag 600
ccgacgctgt aatcgatggt gtcagatgcc tgacggcgtc cgccgcccat tgcaaccact 660
gccatcccca gcgcgcgggt atccatttca ctgacaaaac cttcggtatc agcatagact 720
gctttcgtca gcatcgctgt cggcagatac ttcgcgtagt tctcaacgaa gtcggtcggg 780
cctttttgtg ccgctaccat acgaccaaag acttctgccg ctttaccgtt gtccagcacc 840
gcctgcaatt tcgcgcgcgc ttcggcgtca tctttcgcca gtttgccgga gatcagcatc 900
tccacgcaca gcgccatcgt gacatcaaac agacgcgggt tacgatattc acccgtcagg 960
aactgcaccg cttcacgaac ttcaaccgcg ttacctgcac tggaggccag tacctgattc 1020
atgtcggtga gcagcgcggt ggtgcgcacg ccagcgccgt tagccacgcc aacaatcgct 1080
tcggcaaggg cttcagagag ttcgtaggtc ggcataaacg cgccgctacc cactttcacg 1140
tccatcacca gcgcgtccag accttccgca agtttcttcg ccagaataga ggcggtgatc 1200
agcgggatgg agtccacggt tgcggtaata tcacgggtcg cgtagaaacg tttatcagcc 1260
ggagccagtg aactggtctg accgataatc gccacgccga cgtctttaat aatttcgcgg 1320
aaacggttgt catccgggaa aatgtcgaag ccagggatgg attccagttt gtcgagcgta 1380
ccgccagtat gaccgaggcc gcgaccagag atcatcggaa tatagccgcc gcaggctgcg 1440
accatcggcc ccaacatcag cgaagtcaca tcgccgacgc caccggtgga gtgtttatca 1500
acaatcgggc cattcagatg caggcttttc cagtcgagaa cggttcctga atctcgcatc 1560
gccatggtca gcgagacacg ctcaggcatt gtcatatcgt ggaagaaaat ggtcatcgcg 1620
agggcggcaa tctgcccttc ggagatagtg ttgtcgcgaa taccgttgat aaagaaacga 1680
atttcttcat cgctcagcgc atgaccatca cgttttttac gaataatttc ttgtgcgaga 1740
aacaaggaat tcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac 1800
aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt 1860
gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc 1920
gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg 1980
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 2040
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 2100
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 2160
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 2220
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 2280
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 2340
aagcgtggcg ctttctcaaa gctcacgctg taggtatctc agttcggtgt aggtcgttcg 2400
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 2460
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 2520
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 2580
gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 2640
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 2700
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 2760
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 2820
ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 2880
taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 2940
tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 3000
cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 3060
gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 3120
cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 3180
ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 3240
aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 3300
atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 3360
tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 3420
gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 3480
aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 3540
acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 3600
ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 3660
tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 3720
aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 3780
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 3840
atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 3900
aaaagtgcca cctgacgtct aagaaaccat tattatgatg acattaacct ataaaaatag 3960
gcgtatcacg aggccctttc gtc
3983
<210> 9
<211> 4787
<212> DNA
<213> Artificial
<220>
<223> pGM986amp
<400> 9
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgccaa gcttgcatgc attattcgct 420
gatacggcga tagacagttg gtgtgctttc cggtgcttta tcggcaagtt taattgccgc 480
tttcaccgct ttcgccgctt cctgccagtt gttttcgtct ttcgcgtgga taaccgccag 540
cggacgctga ccgtctacct ggtcgcccag acgcgccata tcagtaaagc cgacgctgta 600
atcgatggtg tcagatgcct gacggcgtcc gccgcccatt gcaaccactg ccatccccag 660
cgcgcgggta tccatttcac tgacaaaacc ttcggtatca gcatagactg ctttcgtcag 720
catcgctgtc ggcagatact tcgcgtagtt ctcaacgaag tcggtcgggc ctttttgtgc 780
cgctaccata cgaccaaaga cttctgccgc tttaccgttg tccagcaccg cctgcaattt 840
cgcgcgcgct tcggcgtcat ctttcgccag tttgccggag atcagcatct ccacgcacag 900
cgccatcgtg acatcaaaca gacgcgggtt acgatattca cccgtcagga actgcaccgc 960
ttcacgaact tcaaccgcgt tacctgcact ggaggccagt acctgattca tgtcggtgag 1020
cagcgcggtg gtgcgcacgc cagcgccgtt agccacgcca acaatcgctt cggcaagggc 1080
ttcagagagt tcgtaggtcg gcataaacgc gccgctaccc actttcacgt ccatcaccag 1140
cgcgtccaga ccttccgcaa gtttcttcgc cagaatagag gcggtgatca gcgggatgga 1200
gtccacggtt gcggtaatat cacgggtcgc gtagaaacgt ttatcagccg gagccagtga 1260
actggtctga ccgataatcg ccacgccgac gtctttaata atttcgcgga aacggttgtc 1320
atccgggaaa atgtcgaagc cagggatgga ttccagtttg tcgagcgtac cgccagtatg 1380
accgaggccg cgaccagaga tcatcggaat atagccgccg caggctgcga ccatcggccc 1440
caacatcagc gaagtcacat cgccgacgcc accggtggag tgtttatcaa caatcgggcc 1500
attcagatgc aggcttttcc agtcgagaac ggttcctgaa tctcgcatcg ccatggtcag 1560
cgagacacgc tcaggcattg tcatatcgtg gaagaaaatg gtcatcgcga gggcggcaat 1620
ctgcccttcg gagatagtgt tgtcgcgaat accgttgata aagaaacgaa tttcttcatc 1680
gctcagcgca tgaccatcac gttttttacg aataatttct tgtgcgagaa acataggaga 1740
acctcctgca tgcctgcagg tcgacaagag aattacagca gacgacgcgc cgcttccacc 1800
acgattttca ccgcatggct ttcggtttgt ttcatcgtct cagcattcgg gatctcttgc 1860
tgggtgcggt taacgataac acccgctacc ataccggcac gcaggccctg acttgcacac 1920
atggtcagca gggttgcaga ttccatttca tagttcatta cgcccatcgc ctgccactct 1980
tccatagaac ctttaaagtg acgaactacg cgaccagagt aagtatcgta acgttcctga 2040
cctgggtaga aggtatcaga agaagctgtc acgccaacgt gagttgtcgc gccaatggat 2100
ttcgcagctt caaccagcgc agtcgtacat tcgaaatcag cgacagccgg gaattccagc 2160
ggtgcgaagt gcaggctcgc gccatccaga cggacagacg ccgtggtaac caggacatca 2220
cccacattaa tatgcggctg aatagcgccc gttgtaccga tacgcaggaa ggtgcgaatg 2280
cccagctgtg ccagctcttc aacagcaata gaggtagacg ggccgccgat accggtagag 2340
cagacgataa caggtttacc atccagctct gcacgccagg tagtgaattc gcggtgagat 2400
gccagcttaa ccggcttatc catcagcgcg gcgatctttt ccacacgatc cgggtcgcca 2460
gggacgatgg caagcgtagc cccttgtaaa tcgtttttag tgaggccgag atgaaaaaca 2520
tcagacttgg acatggatgg taccgagctc gaattcgtaa tcatggtcat agctgtttcc 2580
tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg 2640
taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc 2700
cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg 2760
gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 2820
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 2880
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 2940
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 3000
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 3060
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 3120
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct caaagctcac gctgtaggta 3180
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 3240
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 3300
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 3360
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 3420
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 3480
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 3540
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 3600
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 3660
ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 3720
tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 3780
atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc 3840
tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 3900
aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 3960
catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 4020
gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 4080
ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa 4140
aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 4200
atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 4260
cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 4320
gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 4380
agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 4440
gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 4500
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 4560
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 4620
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 4680
aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat 4740
gatgacatta acctataaaa ataggcgtat cacgaggccc tttcgtc 4787
<2 10> 10
<211> 5002
<212> DNA
<213> Artificial
<220>
<223> pGM986
<400> 10
tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgccattc 60
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 120
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 180
ccagtcacga cgttgtaaaa cgacggccag tgccaagctt gcatgcatta ttcgctgata 240
cggcgataga cagttggtgt gctttccggt gctttatcgg caagtttaat tgccgctttc 300
accgctttcg ccgcttcctg ccagttgttt tcgtctttcg cgtggataac cgccagcgga 360
cgctgaccgt ctacctggtc gcccagacgc gccatatcag taaagccgac gctgtaatcg 420
atggtgtcag atgcctgacg gcgtccgccg cccattgcaa ccactgccat ccccagcgcg 480
cgggtatcca tttcactgac aaaaccttcg gtatcagcat agactgcttt cgtcagcatc 540
gctgtcggca gatacttcgc gtagttctca acgaagtcgg tcgggccttt ttgtgccgct 600
accatacgac caaagacttc tgccgcttta ccgttgtcca gcaccgcctg caatttcgcg 660
cgcgcttcgg cgtcatcttt cgccagtttg ccggagatca gcatctccac gcacagcgcc 720
atcgtgacat caaacagacg cgggttacga tattcacccg tcaggaactg caccgcttca 780
cgaacttcaa ccgcgttacc tgcactggag gccagtacct gattcatgtc ggtgagcagc 840
gcggtggtgc gcacgccagc gccgttagcc acgccaacaa tcgcttcggc aagggcttca 900
gagagttcgt aggtcggcat aaacgcgccg ctacccactt tcacgtccat caccagcgcg 960
tccagacctt ccgcaagttt cttcgccaga atagaggcgg tgatcagcgg gatggagtcc 1020
acggttgcgg taatatcacg ggtcgcgtag aaacgtttat cagccggagc cagtgaactg 1080
gtctgaccga taatcgccac gccgacgtct ttaataattt cgcggaaacg gttgtcatcc 1140
gggaaaatgt cgaagccagg gatggattcc agtttgtcga gcgtaccgcc agtatgaccg 1200
aggccgcgac cagagatcat cggaatatag ccgccgcagg ctgcgaccat cggccccaac 1260
atcagcgaag tcacatcgcc gacgccaccg gtggagtgtt tatcaacaat<c>gggccattc 1320
agatgcaggc ttttccagtc gagaacggtt cctgaatctc gcatcgccat ggtcagcgag 1380
acacgctcag gcattgtcat atcgtggaag aaaatggtca tcgcgagggc ggcaatctgc 1440
ccttcggaga tagtgttgtc gcgaataccg ttgataaaga aacgaatttc ttcatcgctc 1500
agcgcatgac catcacgttt tttacgaata atttcttgtg cgagaaacat aggagaacct 1560
cctgcatgcc tgcaggtcga caagagaatt acagcagacg acgcgccgct tccaccacga 1620
ttttcaccgc atggctttcg gtttgtttca tcgtctcagc attcgggatc tcttgctggg 1680
tgcggttaac gataacaccc gctaccatac cggcacgcag gccctgactt gcacacatgg 1740
tcagcagggt tgcagattcc atttcatagt tcattacgcc catcgcctgc cactcttcca 1800
tagaaccttt aaagtgacga actacgcgac cagagtaagt atcgtaacgt tcctgacctg 1860
ggtagaaggt atcagaagaa gctgtcacgc caacgtgagt tgtcgcgcca atggatttcg 1920
cagcttcaac cagcgcagtc gtacattcga aatcagcgac agccgggaat tccagcggtg 1980
cgaagtgcag gctcgcgcca tccagacgga cagacgccgt ggtaaccagg acatcaccca 2040
cattaatatg cggctgaata gcgcccgttg taccgatacg caggaaggtg cgaatgccca 2100
gctgtgccag ctcttcaaca gcaatagagg tagacgggcc gccgataccg gtagagcaga 2160
cgataacagg tttaccatcc agctctgcac gccaggtagt gaattcgcgg tgagatgcca 2220
gcttaaccgg cttatccatc agcgcggcga tcttttccac acgatccggg tcgccaggga 2280
cgatggcaag cgtagcccct tgtaaatcgt ttttagtgag gccgagatga aaaacatcag 2340
acttggacat ggatggtacc gagctcgaat tcgtaatcat ggtcatagct gtttcctgtg 2400
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 2460
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 2520
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 2580
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 2640
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 2700
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 2760
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 2820
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 2880
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 2940
tccgcctttc tcccttcggg aagcgtggcg ctttctcaaa gctcacgctg taggtatctc 3000
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 3060
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 3120
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 3180
acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc 3240
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 3300
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 3360
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 3420
aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 3480
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 3540
agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 3600
atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 3660
cccagtgctg caatgatacc gcgaga ceca cgctcaccgg ctccagattt atcagcaata 3720
aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 3780
cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 3840
aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 3900
ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 3960
gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 4020
ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 4080
tctgtgactg gtgagtatct ttctgccatt catccgctta ttatcactta ttcaggcgta 4140
gcaccaggcg tttaagggca ccaataactg ccttaaaaaa attacg cccc gccctgccac 4200
tcatcgcagt actgttgtaa ttcattaagc attctgccga catggaagcc atcacagacg 4260
gcatgatgaa cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg 4320
cccatagtga aaacgggggc gaagaagttg tccatattag ccacgtttaa atcaaaactg 4380
gtgaaactca cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg 4440
aaataggcca ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc 4500
cggaaatcgt cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa 4560
acggtgtaac aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata 4620
cgaaattccg tatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac 4680
ttgtgcttat ttttctttac ggtctttaaa aaggccgtaa tatccagatg aacggtctgg 4740
ttataggtac attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg 4800
gatatatcaa cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct 4860
gaaaatctcg ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag 4920
ttggaacctc ttacgtgccg atcaacgtct cattttcgcc aaaacttggc cctagagcgg 4980
atacatattt gaatgtattt ca
5002
<210> 11
<211> 6345
<212> DNA
<213> Artificial Sequence
<220>
<223> pGM986
<400> 11
tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgccattc 60
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 120
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 180 ccagtcacga cgttgtaaaa cgacggccag tgccaagctt gcatgcatta ttcgctgata 240
cggcgataga cagttggtgt gctttccggt gctttatcgg caagtttaat tgccgctttc 300
accgctttcg ccgcttcctg ccagttgttt tcgtctttcg cgtggataac cgccagcgga 360
cgctgaccgt ctacctggtc gcccagacgc gccatatcag taaagccgac gctgtaatcg 420
atggtgtcag atgcctgacg gcgtccgccg cccattgcaa ccactgccat ccccagcgcg 480
cgggtatcca tttcactgac aaaaccttcg gtatcagcat agactgcttt cgtcagcatc 540
gctgtcggca gatacttcgc gtagttctca acgaagtcgg tcgggccttt ttgtgccgct 600
accatacgac caaagacttc tgccgcttta ccgttgtcca gcaccgcctg caatttcgcg 660
cgcgcttcgg cgtcatcttt cgccagtttg ccggagatca gcatctccac gcacagcgcc 720
atcgtgacat caaacagacg cgggttacga tattcacccg tcaggaactg caccgcttca 780
cgaacttcaa ccgcgttacc tgcactggag gccagtacct gattcatgtc ggtgagcagc 840
gcggtggtgc gcacgccagc gccgttagcc acgccaacaa tcgcttcggc aagggcttca 900
gagagttcgt aggtcggcat aaacgcgccg ctacccactt tcacgtccat caccagcgcg 960
tccagacctt ccgcaagttt cttcgccaga atagaggcgg tgatcagcgg gatggagtcc 1020
acggttgcgg taatatcacg ggtcgcgtag aaacgtttat cagccggagc cagtgaactg 1080
gtctgaccga taatcgccac gccgacgtct ttaataattt cgcggaaacg gttgtcatcc 1140
gggaaaatgt cgaagccagg gatggattcc agtttgtcga gcgtaccgcc agtatgaccg 1200
aggccgcgac cagagatcat cggaatatag ccgccgcagg ctgcgaccat cggccccaac 1260
atcagcgaag tcacatcgcc gacgccaccg gtggagtgtt tatcaacaat cgggccattc 1320
agatgcaggc ttttccagtc gagaacggtt cctgaatctc gcatcgccat ggtcagcgag 1380
acacgctcag gcattgtcat atcgtggaag aaaatggtca tcgcgagggc ggcaatctgc 1440
ccttcggaga tagtgttgtc gcgaataccg ttgataaaga aacgaatttc ttcatcgctc 1500
agcgcatgac catcacgttt tttacgaata atttcttgtg cgagaaacat aggagaacct 1560
cctgcatgca ttattcgctg atacggcgat agacagttgg tgtgctttcc ggtgctttat 1620
cggcaagttt aattgccgct ttcaccgctt tcgccgcttc ctgccagttg ttttcgtctt 1680
tcgcgtggat aaccgccagc ggacgctgac cgtctacctg gtcgcccaga cgcgccatat 1740
cagtaaagcc gacgctgtaa tcgatggtgt cagatgcctg acggcgtccg ccgcccattg 1800
caaccactgc catccccagc gcgcgggtat ccatttcact gacaaaacct tcggtatcag 1860
catagactgc tttcgtcagc atcgctgtcg gcagatactt cgcgtagttc tcaacgaagt 1920
cggtcgggcc tttttgtgcc gctaccatac gaccaaaga c ttctgccgct ttaccgttgt 1980
ccagcaccgc ctgcaatttc gcgcgcgctt cggcgtcatc tttcgccagt ttgccggaga 2040
tcagcatctc cacgcacagc gccatcgtga catcaaacag acgcgggtta cgatattcac 2100
ccgtcaggaa ctgcaccgct tcacgaactt caaccgcgtt acctgcactg gaggccagta 2160
cctgattcat gtcggtgagc agcgcggtgg tgcgcacgcc agcgccgtta gccacgccaa 2220
caatcgcttc ggcaagggct tcagagagtt cgtaggtcgg cataaacgcg ccgctaccca 2280
ctttcacgtc catcaccagc gcgtccagac cttccgcaag tttcttcgcc agaatagagg 2340
cggtgatcag cgggatggag tccacggttg cggtaatatc acgggtcgcg tagaaacgtt 2400
tatcagccgg agccagtgaa ctggtctgac cgataatcgc cacgccgacg tctttaataa 2460
tttcgcggaa acggttgtca tccgggaaaa tgtcgaagcc agggatggat tccagtttgt 2520
cgagcgtacc gccagtatga ccgaggccgc gaccagagat catcggaata tagccgccgc 2580
aggctgcgac catcggcccc aacatcagcg aagtcacatc gccgacgcca ccggtggagt 2640
gtttatcaac aatcgggcca ttcagatgca ggcttttcca gtcgagaacg gttcctgaat 2700
ctcgcatcgc catggtcagc gagacacgct caggcattgt catatcgtgg aagaaaatgg 2760
tcatcgcgag ggcggcaatc tgcccttcgg agatagtgtt gtcgcgaata ccgttgataa 2820
agaaacgaat ttcttcatcg ctcagcgcat gaccatcacg ttttttacga ataatttctt 2880
gtgcgagaaa cataggagaa cctcctgcat gcctgcaggt cgacaagaga attacagcag 2940
acgacgcgcc gcttccacca cgattttcac cgcatggctt tcggtttgtt tcatcgtctc 3000
agcattcggg atctcttgct gggtgcggtt aacgataaca cccgctacca taccggcacg 3060
caggccctga cttgcacaca tggtcagcag ggttgcagat tccatttcat agttcattac 3120
gcccatcgcc tgccactctt ccatagaacc tttaaagtga cgaactacgc gaccagagta 3180
agtatcgtaa cgttcctgac ctgggtagaa ggtatcagaa gaagctgtca cgccaacgtg 3240
agttgtcgcg ccaatggatt tcgcagcttc aaccagcgca gtcgtacatt cgaaatcagc 3300
gacagccggg aattccagcg gtgcgaagtg caggctcgcg ccatccagac ggacagacgc 3360
cgtggtaacc aggacatcac ccacattaat atgcggctga atagcgcccg ttgtaccgat 3420
acgcaggaag gtgcgaatgc ccagctgtgc cagctcttca acagcaatag aggtagacgg 3480
gccgccgata ccggtagagc agacgataac aggtttacca tccagctctg cacgccaggt 3540
agtgaattcg cggtgagatg ccagcttaac cggcttatcc atcagcgcgg cgatcttttc 3600
cacacgatcc gggtcgccag ggacgatggc aagcgtagcc ccttgtaaat cgtttttagt 3660
gaggccgaga tgaaaaacat cagacttgga catggatggt accgagctcg aattcgtaat 3720
catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 3780
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 3840
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 3900
gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 3960
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 4020
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 4080
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 4140 gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 4200
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 4260
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 4320
aaagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 4380
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 4440
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 4500
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 4560
ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 4620
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 4680
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 4740
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 4800
aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 4860
tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 4920
cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 4980
tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac 5040
cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 5100
ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaag<c>t agagtaagta 5160
gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 5220
gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 5280
gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 5340
gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 5400
tcatgccatc cgtaagatgc ttttctgtga ctggtgagta tctttctgcc attcatccgc 5460
ttattatcac ttattcaggc gtagcaccag gcgtttaagg gcaccaataa ctgccttaaa 5520
aaaattacgc cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc 5580
cgacatggaa gccatcacag acggcatgat gaacctgaat cgccagcggc atcagcacct 5640
tgtcgccttg cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat 5700
tagccacgtt taaatcaaaa ctggtgaaac tcacccaggg attggctgag acgaaaaaca 5760
tattctcaat aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt 5820
gcgaatatat gtgtagaaac tgccggaaat cgtcgtggta ttcactccag agcgatgaaa 5880
acgtttcagt ttgctcatgg aaaacggtgt aacaagggtg aacactatcc catatcacca 5940
gctcaccgtc tttcattgcc atacgaaatt ccgtatgagc
attcatcagg cgggcaagaa 6000
tgtgaataaa ggccggataa aacttgtgct tatttttctt
tacggtcttt aaaaaggccg 6060
taatatccag atgaacggtc tggttatagg tacattgagc
aactgactga aatgcctcaa 6120
aatgttcttt acgatgccat tgggatatat caacggtggt
atatccagtg atttttttct 6180
ccattttagc ttccttagct cctgaaaatc tcgataactc
aaaaaatacg cccggtagtg 6240
atcttatttc attatggtga aagttggaac ctcttacgtg
ccgatcaacg tctcattttc 6300
gccaaaactt ggccctagag cggatacata tttgaatgta tttca 6345

Claims (21)

  1. RIVENDICAZIONI 1. Un vettore ricombinante di espressione plasmidico, basato sul plasmide pUC18, comprendente : a) almeno una sequenza genica di un batterio mesofilo codificante per un polipeptide avente attività enzimatica di timidina fosforilasi; e b) almeno una sequenza genica che codifica per la resistenza ad almeno un antibiotico.
  2. 2. Vettore plasmidico secondo la rivendicazione 1, comprendente almeno una ulteriore sequenza genica di un batterio mesofilo codificante per un polipeptide avente attività enzimatica di pirimidina fosforilasi.
  3. 3. Vettore plasmidico secondo la rivendicazione 1 o 2, comprendente almeno una ulteriore sequenza genica di un batterio mesofilo codificante per un polipeptide avente attività enzimatica di purina fosforilasi.
  4. 4. Vettore plasmidico secondo la rivendicazione 1, 2 o 3, caratterizzato dal fatto che 1'almeno una sequenza codificante per la resistenza ad almeno un antibiotico è una sequenza codificante per la resistenza all ’ampicillina oppure per la resistenza al d oramienicolo, preferibilmente cloramfenicolo .
  5. 5. Vettore plasmidico secondo una o più delle rivendicazioni antecedenti, caratterizzato dal fatto che il batterio mesofrio è E. coli.
  6. 6. Vettore plasmidico secondo una o più delle rivendicazioni antecedenti, caratterizzato dal fatto che la sequenza codificante un polipeptide avente attività enzimatica di timidina fosforilasi è la sequenza deoA.
  7. 7. Vettore plasmidico secondo la rivendicazione 6, caratterizzato dal fatto che la sequenza deoA è la Sequenza (EMBL) CG00324, come contenuta in SEQ ID No. 8-11.
  8. 8. Vettore plasmidico secondo una o più delle rivendicazioni 2-5, caratterizzato dal fatto che la sequenza codificante un polipeptide avente attività enzimatica di pirimidina fosforilasi è la sequenza udp .
  9. 9 . Vettore plasmidico secondo la rivendicazione 9, caratterizzato dal fatto che la sequenza udp è la Sequenza (EMBL) CG01747, come contenuta in SEQ ID No. 6,7 e 9-11.
  10. 10. Vettore plasmidico secondo una o più delle rivendicazioni 3-6, caratterizzato dal fatto che la sequenza codificante un polipeptide avente attività enzimatica di purina fosforilasi è la sequenza deoD.
  11. 11. Vettore plasmidico secondo la rivendicazione 10, caratterizzato dal fatto che la sequenza deoD è la Sequenza (EMBL) CG00327, come contenuta in SEQ ID No. 5 e 11.
  12. 12 . Vettore plasmidico secondo una o più delle rivendicazioni antecedenti, caratterizzato dal fatto che la sequenza codificante per la resistenza al d oramienicolo è il gene cat da pKF3 (GenBank D14641) .
  13. 13. Vettore plasmidico scelto tra: pGM977 (SEQ ID No.8), pGM986amp (SEQ ID No.9) pGM986 (SEQ ID No.10), pGM987 (SEQ ID No.ll).
  14. 14. Vettore plasmidico secondo rivendicazione 13 scelto da pGM987 (SEQ ID No.11).
  15. 15. Cellule ospiti procariotiche, caratterizzate dal fatto di contenere almeno un vettore plasmidico secondo le rivendicazioni 1 a 14 .
  16. 16. Cellule ospiti secondo la rivendicazione 15, caratterizzato dal fatto che esse sono cellule di Escherichia coli.
  17. 17. Cellule ospite secondo la rivendicazione 16, caratterizzato dal fatto che sono cellule del ceppo K12, preferibilmente DH10B.
  18. 18. Uso di cellule ospiti secondo le rivendicazioni da 15-17, o del corrispondente greggio o estratti purificati, separatamente o in combinazione, per la produzione di polipeptidi o loro miscele aventi attività enzimatica (TP) e/o (UdP TP) e/o (PNP TP) e/o (UdP PNP TP).
  19. 19. Uso secondo la rivendicazione 18, in cui la crescita delle cellule rivolta alla produzione dei polipeptidi avviene senza aggiunta di induttore ai terreni di coltura, in particilare senza aggiunta di IPTG o lattosio.
  20. 20. Uso di cellule ospiti secondo le rivendicazioni 15-17, o del corrispondente greggio o estratti purificati, separatamente o in combinazione, come catalizzatori in reazioni di transglicosilazione tra un nucleoside donatore e una base accettore.
  21. 21. Uso di cellule ospiti secondo le rivendicazioni 15-17, separatamente o in combinazione, o del grezzo corrispondente o estratti purificati, nella produzione di nucleosidi e loro analoghi modificati.
IT001142A 2013-07-08 2013-07-08 Ceppi batterici ricombinanti per la produzione di nucleosidi naturali e analoghi modificati. ITMI20131142A1 (it)

Priority Applications (1)

Application Number Priority Date Filing Date Title
IT001142A ITMI20131142A1 (it) 2013-07-08 2013-07-08 Ceppi batterici ricombinanti per la produzione di nucleosidi naturali e analoghi modificati.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT001142A ITMI20131142A1 (it) 2013-07-08 2013-07-08 Ceppi batterici ricombinanti per la produzione di nucleosidi naturali e analoghi modificati.

Publications (1)

Publication Number Publication Date
ITMI20131142A1 true ITMI20131142A1 (it) 2015-01-09

Family

ID=49182352

Family Applications (1)

Application Number Title Priority Date Filing Date
IT001142A ITMI20131142A1 (it) 2013-07-08 2013-07-08 Ceppi batterici ricombinanti per la produzione di nucleosidi naturali e analoghi modificati.

Country Status (1)

Country Link
IT (1) ITMI20131142A1 (it)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1835035A1 (en) * 2006-03-15 2007-09-19 EXPLORA Laboratories SA A process for immobilizing cells on a resin

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1835035A1 (en) * 2006-03-15 2007-09-19 EXPLORA Laboratories SA A process for immobilizing cells on a resin

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHONGTAO GE ET AL: "Co-Expression of Recombinant Nucleoside Phosphorylase from Escherichia coli and its Application", APPLIED BIOCHEMISTRY AND BIOTECHNOLOGY, vol. 159, no. 1, 20 October 2009 (2009-10-20), pages 168 - 177, XP055108712, ISSN: 0273-2289, DOI: 10.1007/s12010-008-8429-3 *
DING Q ET AL: "Optimum induction of recombinant thymidine phosphorylase and its application", NUCLEOSIDES, NUCLEOTIDES AND NUCLEIC ACIDS 2011 TAYLOR AND FRANCIS INC. USA, vol. 30, no. 5, May 2011 (2011-05-01), pages 360 - 368, XP055108749, ISSN: 1525-7770 *
ESIPOV R S ET AL: "Overexpression of Escherichia coli genes encoding nucleoside phosphorylases in the pET/Bl21 (DE3) system yields active recombinant enzymes", PROTEIN EXPRESSION AND PURIFICATION, ACADEMIC PRESS, SAN DIEGO, CA, vol. 24, no. 1, 1 February 2002 (2002-02-01), pages 56 - 60, XP002239461, ISSN: 1046-5928, DOI: 10.1006/PREP.2001.1524 *
SPOLDI E ET AL: "RECOMBINANT BACTERIAL CELLS AS EFFICIENT BIOCATALYSTS FOR THE PRODUCTION OF NUCLEOSIDES", NUCLEOSIDES, NUCLEOTIDES AND NUCLEIC ACIDS, TAYLOR & FRANCIS, PHILADELPHIA, PA, USA, vol. 20, no. 4-07, 1 April 2001 (2001-04-01), pages 977 - 979, XP009009766, ISSN: 1525-7770, DOI: 10.1081/NCN-100002472 *

Similar Documents

Publication Publication Date Title
RU2763170C2 (ru) Производство олигосахаридов человеческого молока в микроорганизмах-хозяевах с модифицированным импортом/экспортом
KR102319845B1 (ko) 조류 숙주 세포에 대한 crispr-cas 시스템
AU2020264412B2 (en) Dna-binding protein using ppr motif, and use thereof
KR102274445B1 (ko) 게놈 삽입을 위한 방법
CA3109035A1 (en) Microorganisms engineered to use unconventional sources of nitrogen
CN101646766B (zh) △17去饱和酶及其用于制备多不饱和脂肪酸的用途
KR20200022486A (ko) 조작되고 완전-기능 맞춤 당단백질
CN101868241A (zh) 表达生物治疗分子的治疗基因开关构建物和生物反应器以及它们的应用
CN101842479A (zh) 用于改良宿主细胞内蛋白质生产的信号序列和共表达的分子伴侣
KR20210105382A (ko) 단백질을 코딩하는 rna
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
CN114126645A (zh) 冠状病毒刺突蛋白的修饰的s1亚基
CN115927299A (zh) 增加双链rna产生的方法和组合物
DK2935601T3 (en) RECOMBINANT MICROBELL CELLS PRODUCING AT LEAST 28% EICOSAPENTAIC ACID AS DRY WEIGHT
KR20230054840A (ko) rAAV 비리온의 유도 생산을 위한 안정화된 세포주
KR20220116485A (ko) 쌍을 형성한 닉카제를 이용하는 개선된 게놈 편집
KR20220116173A (ko) 밀의 게놈에의 dna 또는 돌연변이의 정확한 도입
ITMI20131142A1 (it) Ceppi batterici ricombinanti per la produzione di nucleosidi naturali e analoghi modificati.
KR20230159994A (ko) 하이브리드 신호서열을 포함하는 재조합 벡터 및 이를 이용한 인간 인슐린 유사 성장인자-1의 분비 생산방법
CN108753727A (zh) 一种gpcr靶向药物筛选系统及其构建和应用
AU2020327783A1 (en) Oncolytic vaccinia virus
RU2798786C2 (ru) Производство молочных олигосахаридов человека в микробных продуцентах с искусственным импортом/экспортом
KR20240023100A (ko) 유전자 발현을 조절하기 위한 조성물 및 방법
CA3226763A1 (en) Burden-addicted production strains
KR20230109353A (ko) 유전자 침묵문제를 극복한 신규 유전자 발현유도 스위치