NO338477B1 - DNA-sekvenser med gentranskripsjonsregulatoriske egenskaper samt fremgangsmåter ved påvisning og anvendelse av slike DNA-sekvenser - Google Patents

DNA-sekvenser med gentranskripsjonsregulatoriske egenskaper samt fremgangsmåter ved påvisning og anvendelse av slike DNA-sekvenser Download PDF

Info

Publication number
NO338477B1
NO338477B1 NO20040011A NO20040011A NO338477B1 NO 338477 B1 NO338477 B1 NO 338477B1 NO 20040011 A NO20040011 A NO 20040011A NO 20040011 A NO20040011 A NO 20040011A NO 338477 B1 NO338477 B1 NO 338477B1
Authority
NO
Norway
Prior art keywords
star
sequence
elements
dna
gene
Prior art date
Application number
NO20040011A
Other languages
English (en)
Other versions
NO20040011L (no
Inventor
Arie Peter Otte
Arthur Leo Kruckeberg
Original Assignee
Chromagenics Bv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP01202581A external-priority patent/EP1273666A1/en
Application filed by Chromagenics Bv filed Critical Chromagenics Bv
Publication of NO20040011L publication Critical patent/NO20040011L/no
Publication of NO338477B1 publication Critical patent/NO338477B1/no

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/635Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6897Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters

Description

Foreliggende oppfinnelse vedrører fremgangsmåter for regulering av gentranskripsjon ved å motvirke dannelsen av gentranskripsjonsundertrykkende kromatin, hvor fremgangsmåten utgjøres av de trekk som er angitt i krav 1.
Med fremskridningen av de forskjellige genomprosjekter, har sekvensene av fullstendige organisme-genomer blitt tilgjengelige. Strømmen av data har vekket in-teressen til mange forskere. Én av de mer bemerkelsesverdige oppdagelser var ob-servasjonen at det humane genom ikke koder for vesentlig flere gener enn genomet av enkle organismer så som bananflue. Mange forskeres oppmerksomhet be-veger seg nå fra identifikasjonen av gener til å bestemme genekspresjon og gen-funksjon. Eksempler på slike teknologier er DNA-mikrogrupperinger, funksjonelle genom-anvendelser og proteomikk. Disse teknologier har til felles at de konsentre-rer seg om funksjonen og ekspresjonen av kodende sekvenser. Selv om vår kunnskap om gener øker dramatisk, begrenser imidlertid vår forståelse om hvordan ge-nenes ekspresjon reguleres, vår evne til å anvende denne raskt voksende kunnskap. Dette er f.eks. tilfellet ved generering av transgene planter og dyr og innen human-genterapien. I disse anvendelser innføres vanligvis fremmed nukleinsyre inn i celler for å oppnå en ekspresjon av kodende sekvenser. Ofte er det nødvendig å integrere den fremmede nukleinsyre i cellens genom for å oppnå en vedvarende funksjon av de innførte sekvenser. Imidlertid fører integrasjonen av sekvenser i genomet til en uforutsigbar ekspresjon, ettersom det omliggende DNA påvirker transkripsjonen av de integrerte sekvenser. Denne uforutsigbarhet skyldes til dels at de innførte sekvenser ikke enda kan utstyres med tilstrekkelig genetisk informasjon for å funksjonelt isolere de integrerte sekvenser fra de transkripsjons-påvirkende virkninger av det omliggende DNA. Til dels skyldes dette også at man ikke vet tilstrekkelig om de transkripsjons-påvirkende virkninger av omliggende
DNA.
Foreliggende oppfinnelse vedrører fremgangsmåter for utvelgelse av DNA-sekvenser som motvirker dannelsen av gen-transkripsjonsundertrykkende kromatin. Forskjellige sekvenselementer med evnen til å påvirke gentranskripsjonen in cis er blitt identifisert. Disse elementer varierer fra promotere, forsterkere og dempere til grenseelementer og matriksfestende regioner.
Det faktum at det er blitt oppdaget såpass mange forskjellige typer regulatoriske sekvenser, gir inntrykk av at det det ville være meget enkelt å utvikle virksomme ekspresjonskassetter. Imidlertid er det omvendt. Utviklingen av ekspresjonskassetter drives fortsatt ofte av prøving og feiling. Det er ganske ofte mulig å oppnå en form for ekspresjon av et fremmed gen i en målcelle eller dennes avkom. Imidlertid er det meget ofte vanskelig å forutsi ekspresjonsnivået eller ekspresjonsvedvarig-heten som en ekspresjonskassett kan forevise i en målcelle, noenlunde nøyaktig.
Med stabil transkripsjon av et gen menes i det foreliggende at det observerte transkripsjonsnivå ikke endres vesentlig i løpet av minst 30 celledelinger. En stabil
egenskap er nyttig i situasjoner hvor ekspresjonsegenskapene bør være forutsigba-re i løpet av flere celledelinger. Typiske eksempler er cellelinjer som er blitt transfisert med fremmede gener. Andre eksempler er transgene dyr og planter og gente-rapier. Meget ofte fungerer innførte ekspresjonskassetter annerledes etter et hevet antall celledelinger eller plante- eller dyregenerasjoner. I en foretrukken utførelse
omfatter en stabil egenskap en evne til å bevare gentranskripsjon i påfølgende generasjoner av en transgen plante eller et dyr. Hvis ekspresjonen er induserbar, omfatter denne egenskap så klart evnen til å bevare induserbarheten av ekspresjonen i etterfølgende generasjoner av en transgen plante eller et dyr. Ofte faller ekspresjonsnivået drastisk med et økende antall celledelinger. Med en fremgangsmåte ifølge oppfinnelsen er det mulig å påvise og valgfritt selektere en DNA-sekvens som har evnen til å i det minste delvis forebygge det drastiske fall i transkripsjonsnivået med hevet antall celledelinger ved å selektere en DNA-sekvens som i det minste delvis motvirker dannelsen av gen-transkripsjonsundertrykkende kromatin som angitt i krav 1. I en foretrukken utførelse omfatter den gentranskripsjons-modulerende egenskap dermed utvelgelse av en stabil gentranskripsjonsegenskap. Det er slående at fragmenter som omfatter en DNA-sekvens som har denne stabile gentranskripsjonsegenskap, kan påvises og valgfritt selekteres med en fremgangsmåte ifølge oppfinnelsen, til tross for at fremgangsmåten ikke nødvendigvis måler den langsiktige stabilitet av transkripsjonen. I en foretrukken utførelse av oppfinnelsen omfatter den gentranskripsjons-modulerende egenskap en stabil gentranskripsjons-forsterkende egenskap. Man har observert at innlemmelse av en DNA-sekvens med en gentranskripsjons-modulerende egenskap i en ekspresjonsvektor med et aktuelt gen, fører til et høyere transkripsjonsnivå for det aktuelle gen, etter integrasjon av ekspresjonsvektoren i genomet av en celle, og dessuten at dette hevede genekspresjonsnivå også er mer stabilt enn i fravær av DNA-sekvensen som har en gentranskripsjons-modulerende egenskap.
I eksperimenter som ble utviklet for å innføre et aktuelt gen inn i genomet av en celle og å oppnå ekspresjon av det aktuelle gen, har man observert det følgende. Om man sammen med det aktuelle gen også innfører en DNA-sekvens som har en gentranskripsjons-modulerende egenskap, kunne man påvise flere kloner som ut trykte mer enn en bestemt mengde genprodukt av det aktuelle gen, enn hvis den nevnte DNA-sekvens ikke ble innført sammen med det aktuelle gen.
Sjansene for å påvise et fragment som har en gentranskripsjons-modulerende egenskap, varierer avhengig av hvilken kilde fragmentene er avledet fra. Vanligvis har man ingen forhåndskunnskaper om nærværet eller fraværet av fragmenter som har den nevnte egenskap. I slike situasjoner vil mange fragmenter ikke omfatte noen DNA-sekvens som har en gentranskripsjons-modulerende egenskap. I slike tilfeller innføres et formelt seleksjonstrinn for DNA-sekvenser som har denne egenskap. Dette utføres med seleksjonsvektorer som omfatter sekvensen, på grunnlag av et trekk av et produkt av reportergenet, som kan velges for eller imot. F.eks. kan genproduktet indusere fluorescens eller en fargeavleiring (f.eks. grønt fluorescerende protein og derivater, luciferase eller alkalifosfatase) eller formidle resistens mot antibiotika eller indusere apoptose og celledød.
Et element med en gentranskripsjons-undertrykkende egenskap vil i en fremgangsmåte ifølge oppfinnelsen være kromatin som undertrykker transkripsjonen fra en promoter i det brukte transkripsjonssystem. Denne undertrykkelse trenger ikke å føre til upåvisbare ekspresjonsnivåer. Det viktige er at det forskjellige ekspresjonsnivå i fravær eller nærvær av undertrykking, er påvisbart og valgfritt selekterbart. I en foretrukken utførelse fører gentranskripsjons-undertrykking i vektorene til gentranskripsjons-undertrykkende kromatin. I denne foretrukne utførelse kan DNA-sekvenser påvises og valgfritt selekteres som har evnen til å i det minste delvis motvirke dannelsen av gentranskripsjons-undertrykkende kromatin. I ett trekk har en DNA-sekvens som har evnen til å i det minste delvis motvirke dannelsen av gentranskripsjons-undertrykkende kromatin, en stabil gentranskripsjonsegenskap. I en foretrukken utførelse er DNA-sekvensen som er omfattet i gentranskripsjons-undertrykkingen, en DNA-sekvens som gjenkjennes av et proteinkompleks og hvor transkripsjonssystemet omfatter komplekset. Fortrinnsvis omfatter komplekset et heterokromatin-bindende protein omfattende HP1, et Polycomb-gruppe (Pc-G)-protein, en histondeacetylase-aktivitet eller MeCP2 (metyl-CpG-bindende protein). Mange organismer omfatter ett eller flere av disse proteiner. Disse proteiner oppviser ofte aktivitet også i andre arter. Komplekset kan dermed omfatte proteiner fra to eller flere arter. Det nevnte sett av kjente kromatin-assosierte proteinkomplek-ser har evnen til å tilveiebringe langtrekkende undertrykkelse over mange basepar. Kompleksene er også omfattet i å stabilt overføre den undertrykkede status av gener til datterceller etter celledeling. Sekvenser som selekteres på denne måte, har evnen til å tilveiebringe langtrekkende anti-represjon over mange basepar (van der Vlag et al., 2000).
Vektoren som brukes, kan være hvilken som helst vektor som er egnet for å klone DNA og som kan brukes i et transkripsjonssystem. Når vertceller brukes, foretrek-kes det at vektoren er en episomalt repliserende vektor. På denne måte unngår man virkninger som skyldes forskjellige integrasjonsseter av vektoren. DNA-elementer som flankerer vektoren på integrasjonssetet, kan ha virkninger på transkripsjonsnivået av promoteren, og dermed etterligne virkninger av fragmenter som omfatter DNA-sekvenser som har en gentranskripsjons-modulerende egenskap. I en foretrukken utførelse omfatter vektoren et replikasjonsopphav fra Epstein-Barr-virus (EBV), OriP og et nukleært antigen (EBNA-1). Slike vektorer har evnen til å replisere i mange typer eukaryotiske celler, og å sette seg sammen til kromatin under egnede betingelser.
Oppfinnelsen muliggjør økt kunnskap om genregulering på høyere nivå. Mens det er blittkarakterisertelementer så som klassiske promotere og forsterkere som styrer og regulerer transkripsjonen av enkelte gener, har regulatoriske elementer på høy-ere nivå som styrer gentranskripsjonsevnen av fullstendige kromosom regioner, hittil fått lite oppmerksomhet. Mye av våre kunnskaper om slike høyerestående elementer stammer fra undersøkelsen av embryogenese. Under embryogenese blir celler bundet til forskjellige utviklingsbaner. Når de vel er bundet, skifter cellene sjelden skjebne, selv etter flere celledelinger.
Det er blitt mer og mer klart at en stabil transmisjon av celletype-spesifikke gen-transkripsjonsmønstre ikke er avhengig av sammenhengen av en promoter, men heller medieres av endringer i strukturen av DNA og forbundne proteiner, benevnt kromatin. Genregulering på kromosomalt nivå omfatteren modifikasjon av DNA (f.eks. metylering), histoner (f.eks. acetylering og/eller metylering) og langtrekkende vekselvirkninger mellom kromosomale elementer som ligger langt unna hverandre.
Kromatin-elementet er et høyt kondensert kompleks av DNA, histoner og ikke-histon-proteiner som har evnen til å pakke hele genomet inn i kjernen og samtidig muliggjøre den passende transkripsjon av bestemte gener. Det eukaryotiske kromosom er ikke noe enhetlig element for aktivering av gentranskripsjon. Forskjellige typer kromatin og kromatin-regioner kan skjelnes, som påvirker gentranskripsjonen på forskjellige måter. De såkalte heterokromatin-regioner identifiserer "lukkede" kromatin-strukturer, mens eukromatin er forbundet med en mer diffus og "åpen" kromatinstruktur. Eukromatin-regionen kan underligge strukturelle forandringer, hvilket fører til mer eller mindre kondenserte strukturer, benevnt fakultativt heterokromatin og eukromatin. Dannelsen av fakultativt eukromatin eller heterokromatin antas å representerer den underliggende mekanisme av kromatin-mediert genregulering som holder gener i en aktiv eller undertrykket tilstand på celletype-spesifikk måte.
I alle eukaryoter har man identifisert forskjellige kromatin-assosierte proteinkom-plekser som er omfattet i vedlikeholdet av celletype-spesifisiteten, og ett av disse er Polycomb-gruppe (PcG)-kompleks. PcG-kompleks er omfattet i den stabile undertrykkelse av gener, hvor forandringer i kromatinstrukturen anses på spille en viktig rolle. På lignende måte har man identifisert en andre klasse proteiner, benevnt trithorax-gruppe (TrG), som motvirker virkningen av PcG-proteiner. TrG-proteiner er omfattet i vedlikeholdet av gen-gen-transkripsjon. På grunnlag av deres respektive virkningsmåter representerer PcG- og TrG-proteiner dermed et cellu-lært hukommelsessystem som er viktig for en arvbar overføring av gentranskrip-sjonsmønstre.
Hvordan PcG- og TrG-komplekser er forbundet med sine målgener, er fortsatt uklart. Genetiske undersøkelser harkarakterisertcis-virkende regulatoriske sekvenser som bevarer transkripsjonelt inaktive tilstander av gener. Forstumningen som medieres av disse cis-virkende regulatoriske sekvenser, er avhengig av nærværet av funksjonelle PcG-proteiner, og dermed har disse sekvenser blitt nevnt PcG-responselementer (PRFer). Man har identifisert sekvenser som er omfattet i PcG-mediert represjon av kromatin. Imidlertid har man hittil ikke funnet (hverken i virveldyr eller planter) fullstendige PRFer som omfatter hele sekvensinformasjonen som er nødvendig for å mediere represjon av kromatin.
I tillegg har det hittil ikke vært mulig å undersøke sekvenser med langtrekkende represjonsevner, på sammenhengende måte. Dette skyldes til stor del den mang-lende evne til å systematisk sile ut slike sekvenser med langtrekkende virkning. Oppfinnelsen gjør det mulig å systematisk påvise slike sekvenser i DNA og å identifisere en DNA-sekvens som haren gentranskripsjons-undertrykkende egenskap, omfattende å:
tilveiebringe en samling av test-nukleinsyrer,
generere en samling av ekspresjonsvektorer omfattende test-nukleinsyrer
og et første reportergen under transkripsjonen styring av en promoter, tilveiebringe celler med denne samling av ekspresjonsvektorer,
selektere en celle eller en vektor-holdig avkom derav, hvor transkripsjonen
av det første reportergen er undertrykket, og
identifisere test-nukleinsyren i denne celle.
Denne identifiserte test-nukleinsyre omfatter evnen til å undertrykke promoter-funksjonen, og omfatter dermed en gentranskripsjons-undertrykkende egenskap. Fortrinnsvis blir den identifiserte test-nukleinsyre også isolert og klonet. Denne egenskap omfatter i det minste til dels evnen til å senke transkripsjonsnivået fra promoteren når den er fysisk bundet til promoteren, sammenlignet med nivået i fravær av DNA-sekvensen som har denne egenskap. I en foretrukken utførelse omfatter denne gentranskripsjons-undertrykkende egenskap en gentranskripsjons-undertrykkende kromatin-egenskap, dvs. hvor reduksjonen av transkripsjonsnivået skyldes kromatin som haren gentranskripsjons-undertrykkende konfigurasjon. Denne konfigurasjon omfatter fortrinnsvis promoteren. Imidlertid er det også mulig at konfigurasjonen omfatter en forsterker eller lignende, hvorved den transkripsjons-forsterkende virkning av forsterkeren på promoteren inaktiveres i det minste delvis. I en spesielt foretrukken utførelse omfatter DNA-sekvensen som har en gen-transkripsjons-undertrykkende kromatin-egenskap, et Polycomb-gruppe-lignende-mottakelig element.
Ved bruk av den ovennevnte fremgangsmåte er det mulig å isolere flere nukleinsyresekvenser som har evnen til å nedsette transkripsjonsnivået fra en promoter, og dermed nukleinsyresekvenser som haren gentranskripsjons-undertrykkende egenskap. Sekvenser med analog funksjon kan sammenlignes med hverandre for sekvens-likheter så som at man kan avlede én eller flere konsens-sekvenser for elementer med en gentranskripsjons-undertrykkende egenskap, så som Polycomb-gruppe-lignende-mottakelige elementer. Videre, i betraktning av at det idag er kjent fullstendige sekvenser av organismers genomer, og at flere vil følge innen kort tid, er det mulig å sile gjennom disse genomer eller deler derav og å forutsi forekomsten av disse sekvenser i genomet. Kunnskapen om forekomsten og plasseringen av DNA-sekvenser som har gentranskripsjons-modulerende egenskaper og/eller gentranskripsjons-undertrykkende egenskaper, i genomet, vil heve vår kunnskap om reguleringen av gentranskripsjonen på høyt nivå i genomet, betraktelig.
Et Polycomb-gruppe-mottakelig element er et element som har evnen til å undertrykke transkripsjonen fra en promoter som respons på en direkte og/eller indirekte vekselvirkning av ett eller flere Polycomb-gruppe-proteiner med elementet. Et Polycomb-gruppe-lignende-mottakelig element er et Polycomb-gruppe-mottakelig element, eller alternativt er det et element som har evnen til å undertrykke transkripsjonen av en promoter etter direkte og/eller indirekte vekselvirkning mellom ett eller flere proteiner og elementet, hvor proteinet eller proteinene ikke tilhø-rer Polycomb-gruppen, men hvor det som et resultat at vekselvirkningen, dannes gentranskripsjons-undertrykkende kromatin. Eksempler på slike proteiner er kromatin-assosierte proteiner så som heterokromatin-protein 1 (HP1) (Eisenberg et al., 1990). Et annet kromatin-assosiert protein som undertrykker gen-aktiviteten, er metyl-CpG-bindende protein, MeCP2 (Nan et al., 1997). I en foretrukken utførel-se omfatter et Polycomb-gruppe-lignende-mottakelig element som kan anvendes i fremgangsmåten ifølge oppfinnelsen, evnen til å undertrykke transkripsjonen av et protein over lange avstander, fortrinnsvis over flere enn 2.000 basepar (van der Vlag et al., 2000).
En samling av test-nukleinsyrer kan genereres på mange forskjellige måter. Ved bruk av kunstige sekvenser som test-nukleinsyrer er det mulig å erholde en konsensus-sekvens for en gentranskripsjons-undertrykkende egenskap. Forskjellige egenskaper kan omfatte forskjellige konsensus-sekvenser. Fortrinnsvis genereres samlingen fra kromosomalt DNA. På denne måte finner man en gentranskripsjons-undertrykkende egenskap omfattende en sekvens som forekommer naturlig i kromosomet. Dette har den fordel at plasseringen av disse egenskaper i kromosomet kan bestemmes, hvorpå man kan bestemme deres innvirkning på gentranskripsjonen på høyere nivå på denne plassering.
Et reportergen er et gen som koder for et ekspresjonsprodukt hvis nærvær kan påvises direkte eller indirekte i en celle. I fremgangsmåter for påvisning av en gen-transkripsjons-undertrykkende egenskap, vil overføringen av en ekspresjonsvektor inn i en celle føre til ekspresjon av reportergenet. I tilfellet at test-nukleinsyren omfatter en gentranskripsjons-undertrykkende egenskap, så som et Polycomb-gruppe-lignende mottakelig element, vil imidlertid ekspresjonen undertrykkes i cellen og dermed føre til en i det minste delvis nedsatt ekspresjon av reportergenet. Nærværet eller fraværet av en nukleinsyre som har evnen til å undertrykke transkripsjonen av promoteren, kan dermed påvises ved å påvise ekspresjonsproduktet i cellen, hvorved en nedsatt påvisning eller ingen påvisning tyder på nærværet av en gentranskripsjons-undertrykkende egenskap. Et reportergen kan kode for et fluore scerende reporter-protein. En nedsatt ekspresjon kan dermed påvises på fluoro-metrisk måte, f.eks. i et strømningscytometer. Celler som oppviser ingen eller lav fluorescens, kan sorteres ved bruk av en fluorescens-aktivert cellesorterer, og ekspresjonsvektoren og/eller test-nukleinsyren kan isoleres, f.eks. ved hjelp av en amplifikasjonsreaksjon. Fortrinnsvis omfatter det første reportergen et selekterbart reportergen, hvis ekspresjon direkte eller indirekte tilveiebringer cellen med i det minste en svakere vekst enn celler som ikke uttrykker, eller som uttrykker lave nivåer av, det første reportergen. I tilfeller hvor man leter etter DNA-sekvenser med gentranskripsjons-undertrykkende egenskaper, er ekspresjonen av det første reportergen fortrinnsvis direkte eller indirekte toksisk for cellen. Ikke-begrensende eksempler på et slikt toksisk ekspresjonsprodukt er ricin eller toksiske varianter derav. I et annet eksempel koder det første reportergen for et apoptose-induserende genprodukt. Fortrinnsvis omfatter det apoptose-induserende genprodukt adenovirus 13S EIA eller en funksjonell ekvivalent derav (Breckenridge og Shore, 2000). I en annen utførelse omfatter det apoptose-induserende genprodukt apoptin eller en funksjonell ekvivalent derav (Pietersen og Noteborn, 2000).
Et annet eksempel er et gen som koder for et såkalt suicid-produkt, så som herpes simplex-virus-tymidin kinase (HSV-tk). Tilføring av gancyclovir til cellekulturer som uttrykker HSV-tk, vil føre til dannelsen av en toksisk substans i disse celler, og dermed drepe disse celler. I en spesielt foretrukken utførelse omfatter dette suicid-gen cytosin deaminase. Cytosin deaminase omdanner cytosin til uracil. Denne en-zymaktivitet forefinnes i prokaryoter og lavere eukaryoter, men mangler i høyere eukaryoter. Genet brukes som metabolsk suicid-gen i kombinasjon med prodrogen 5-fluorcytosin (5-FC). Cytosin deaminase har evnen til å omdanne det ikke-toksiske 5-FC til 5-fluoruracil, som dreper celler ved å forstyrre DNA-syntesen og dermed utløser apoptose (Mullen et al., 1992; Wei og Huber, 1996).
En promoter som styrer transkripsjonen av det første reportergen, kan være hvilken som helst promoter som er aktiv, eller som kan aktiveres, i cellene. Ved å velge en bestemt promoter, er det mulig å selektere en gentranskripsjons-undertrykkende egenskap så som et Polycomb-gruppe-lignende-mottakelig element som har evnen til å undertrykke transkripsjonen av den bestemte promoter. På denne måte er det mulig å velge egenskaper som spesifikt undertrykker promoterklassen som den bestemte promoter tilhører. I en foretrukken utførelse omfatter promoteren en promoter hvis aktivitet kan induseres ved å tilveiebringe et signal til cellen som inneholder promoteren. En slik induserbar promoter omfatter fortrinnsvis en tetracyklin-mottakelig promoter. Signalet her er tetracyklin, doksycyklin og like verdige forbindelser. Slike promotere kan også tilpasses for tetracyklin-mottakelighet i eukaryotiske celler (Yin et al., 1996). Det er tilgjengelig promotere og vekselvirkende molekyler som enten induserer eller undertrykker ekspresjonen av et gen ved tilføring av tetracyklin eller likeverdige forbindelser.
Celler som er blitt transfisert med en ekspresjonsvektor som forklart ovenfor, kan sjelden, og av grunner som ikke er forbundet med nærværet av en DNA-sekvens som haren gentranskripsjons-undertrykkende egenskap, ikke uttrykke påvisbare mengder av ekspresjonsprodukt av det første reportergen. Dette kan f.eks. skyldes en rekombinasjonshendelse som ødelegger den kodende sekvens av det første reportergen. Foretrukket omfatter samlingen av ekspresjonsvektorer dessuten et andre reportergen. Ekspresjonen av det andre reportergen styres fortrinnsvis av en andre promoter. Fremgangsmåter ved påvisning av ekspresjon av et ekspresjonsprodukt av det andre reportergen kan brukes til å bekrefte den ekspresjons-undertrykkende aktivitet av test-nukleinsyren, hvorved man i det minste delvis senker antallet celler som av falske grunner ikke uttrykker det første reportergen. I en foretrukken utførelse brukes det andre reportergen til å velge ut celler som omfatter en ekspresjonskassett. På denne måte kan man lett se bort ifra celler som ikke omfatter ekspresjonskassetten. Med dette formål omfatter ekspresjonsproduktet av det andre reportergen fortrinnsvis et positivt dominant selekterbart reportergen. Fortrinnsvis koder det positive dominante selekterbare reportergen for et ekspresjonsprodukt som har evnen til å formidle resistens mot en ellers toksisk forbindelse. Ikke-begrensende eksempler er G418-resistens og hygromycin-resistens.
I betraktning av at en gentranskripsjons-undertrykkende egenskap kan undertrykke transkripsjon, er det å foretrekke at en ekspresjonsvektor i denne utførelse dessuten omfatter minst én DNA-sekvens med en gentranskripsjons-modulerende egenskap som har evnen til å motvirke transkripsjons-undertrykkende virkninger av en DNA-sekvens som har en gentranskripsjons-undertrykkende egenskap. Plasseringen av det transkripsjons-motvirkende element i ekspresjonsvektoren er fortrinnsvis slik at den virksomt forstyrrer den svekkende virkning som den gentranskripsjons-undertrykkende egenskap kunne ha på transkripsjonsnivået av det andre reportergen. I en foretrukken utførelse adskiller DNA-sekvensen som har en gen-transkripsjons-modulerende egenskap, funksjonelt ekspresjonskassettene som omfatter det første og det andre reportergen. Fortrinnsvis flankeres det andre reportergen (og promoteren som styrer transkripsjonen av det andre reportergen) av DNA-sekvenser som haren gentranskripsjons-modulerende egenskap. Eksempler på DNA-sekvenser med en gentranskripsjons-modulerende egenskap er de såkalte STAR-elementer som er oppført i tabellene 1 og 2.
Fremgangsmåter ifølge oppfinnelsen kan føre til kloning og identifisering av et antall elementer som omfatteren gentranskripsjons-modulerende og/eller gentranskripsjons-undertrykkende egenskap. Funksjonelle sekvenser i slike elementer kan avbildes ved forskjellige metoder som er kjent innen faget. I én utførelse gjøres det delesjoner og/eller substitusjoner i en DNA-sekvens som har en gentranskripsjons-modulerende eller gentranskripsjons-undertrykkende egenskap. DNA som er modifisert på en slik måte, testes for aktivitet i en fremgangsmåte ifølge oppfinnelsen. Dette kan utføres ved bruk av én enkelt modifisert nukleinsyre, eller ved å generere en samling av test-nukleinsyrer som omfatter den modifiserte nukleinsyre. Kartlegging av de funksjonelle sekvenser innen slike DNA-sekvenser ifølge oppfinnelsen gjør det mulig å kartlegge konsens-sekvenser for elementer som har en gentranskripsjons-modulerende og/eller gentranskripsjons-undertrykkende egenskap. I betraktning av at det finnes flere Polycomb-gruppe-lignende komplekser som hver omfatter forskjellige funksjonaliteter og ekspresjonsmønstre, ser man for seg at man vil finne flere enn én type konsens-sekvens med en fremgangsmåte ifølge oppfinnelsen. Analogt tror man at man vil finne flere enn én type konsens-sekvens for et element som har en gentranskripsjons-modulerende egenskap.
I ett trekk av oppfinnelsen omfatter et bibliotek av isolerte og/eller rekombinante nukleinsyrer fremskaffet ved å utføre fremgangsmåten ifølge oppfinnelsen minst ett element som har evnen til å i det minste delvis motvirke dannelsen av det gentranskripsjons-undertrykkende kromatin. Sammen med kunnskapen om plasseringen av DNA-sekvenser som haren gentranskripsjons-undertrykkende egenskap, på et kromosom eller genom, muliggjør kunnskapen om plasseringen av slike motvirkende elementer en mer nøyaktig forutsigelse av høyerestående regulering av gentranskripsjonen av (innføyde) gener i kromosomet eller genomet. Fortrinnsvis omfatter samlingen dessuten andre transkripsjons-regulerende elementer så som forsterkere og dempere. Selv om slike sekvenser har en begrenset innvirkning på høyerestående genregulering, øker informasjon om plasseringen av slike andre sekvenser nøyaktigheten av forutsigelsen ytterligere for egnede plasseringer i genomet for ekspresjonen av fremmede sekvenser som innføres deri. Fortrinnsvis omfatter biblioteket i det vesentlige alle DNA-sekvenser som har en gentranskripsjons-modulerende egenskap og/eller alle øvrige regulatoriske sekvenser av et kromosom.
I betraktning av at allerede ett kromosom vanligvis består av flere titalls millioner baser, foretrekker man at informasjonen som biblioteket kan gi om høyerestående genregulering, innlemmes i et i det minste delvis automatisert system.
En annen bruk for et slikt bibliotek er generering av en forutsigelse av transkripsjonen av gener på målrettet modifikasjon av sekvenser på et kromosom slik at "høy-erestående" regulatoriske sekvenser muteres. F.eks. kan ett eller flere Polycomb-gruppe-lignende-mottakelige elementer og/eller andre regulatoriske elementer på kromosomet muteres. Dette forventes å forandre transkripsjonsnivået av genene som befinner seg i nærheten av de Polycomb-gruppe-lignende-mottakelige elementer og/eller andre ekspresjonsmodulerende elementer.
Enda en annen bruk av et slikt bibliotek eller system er å forutsi genekspresjonen som resulterer av mutasjoner i genomet. I tilfeller hvor en mutasjon fører til en endret gentranskripsjon, kan en påvisning av en slik endret gentranskripsjon tyde på nærværet av denne naturlig forekommende mutasjon. Denne fremgangsmåte er nyttig f.eks. for å begrense antallet sekvenser eller proteiner som skal testes i et diagnostisk assay. Dette er spesielt viktig i mikrogrupperingsfremgangsmåter fordi antallet uttrykte sekvenser som skal testes for i disse fremgangsmåter, begrenses av antallet sekvenser som en gruppering maksimalt kan inneholde. Med fremgangsmåten ifølge oppfinnelsen er det mulig å begrense antallet sekvenser som skal testes i mikrogrupperingsfremgangsmåter.
Enda en annen bruk for et system eller bibliotek som beskrevet ovenfor, er oppda-gelsen av legemiddelmål. Regulatoriske elementer, være seg de er "høyerestående" elementer eller ikke, fungerer på grunn av proteinene (kompleksene) som kan bindes til dem. Et system som beskrevet ovenfor, kan brukes til å bestemme målret-ting av legemidler for å forstyrre bindingen eller funksjonen av et bestemt protein (kompleks) og er lovende for å endre ekspresjonen av et bestemt gen.
Fremgangsmåten ifølge oppfinnelsen tilveiebringer dessuten en DNA-sekvens som haren gentranskripsjons-undertrykkende egenskap. I en foretrukken utførelse er DNA-sekvensen som omfatter en gentranskripsjons-undertrykkende egenskap, avledet fra et virveldyr eller en plante. Mer foretrukket er DNA-sekvensen som har en gentranskripsjons-undertrykkende egenskap, en sekvens i henhold til tabell 4B, eller en funksjonell homolog derav. I en foretrukken utførelse tilveiebringes en DNA-konstruksjon omfattende en promoter som er operativt bundet til en aktuell nukleinsyre. Fortrinnsvis er aktivitetsnivået av en egenskap av DNA-sekvensen som har en gentranskripsjons-modulerende og/eller -undertrykkende egenskap, avhengig av orienteringen av DNA-sekvensen i konstruksjonen i forhold til promoteren. Fortrinnsvis er den gentranskripsjons-modulerende og/eller -undertrykkende egenskap avhengig av at det foreligger et signal. Fortrinnsvis er dette signal et DNA-bindende protein. Fortrinnsvis er dette signal et humant immunsvikt-virus-TAT-protein.
Én av anvendelsene av en DNA-sekvens som har en gentranskripsjons-modulerende egenskap eller en gentranskripsjons-undertrykkende egenskap, er så klart reguleringen av transkripsjonen av et aktuelt gen. Transkripsjon av et aktuelt gen kan endres ved å endre sekvenser i nærheten av genet, så som at en DNA-sekvens med denne egenskap tilføres eller fjernes. Bestemte ekspresjonsegenskaper kan utformes ved å kombinere (deler av) DNA-sekvenser som har en gentranskripsjons-modulerende og/eller en gentranskripsjons-undertrykkende egenskap. F.eks. vil en duplisering av en sekvens som har en stabil gentranskripsjonsegenskap, i en ekspresjonsvektor, føre til en hevet stabilitet av ekspresjonen i en målcelle eller et avkom derav etter innføring av vektoren i målcellen. Ved å slå sammen DNA-sekvenser som har en gentranskripsjons-modulerende egenskap, kan det genereres endrede gentranskripsjons-modulerende egenskaper, enten med hensyn til type eller mengde eller begge deler.
Det er også mulig å utvikle DNA-sekvenser som har en ønsket gentranskripsjons-modulerende og/eller gentranskripsjons-undertrykkende egenskap. DNA-bindende proteiner sammen med andre proteiner og DNA-sekvenser bestemmer egenskapene av DNA-sekvensen. Det er mulig å innføre én eller flere protein-bindende DNA-sekvenser i en DNA-sekvens som har en bestemt egenskap. Ved å tillate binding av det eller de bindende proteiner, er det mulig å forstyrre, eller styre, egenskapen, hvilket dermed muliggjør generering av DNA-sekvenser som har skreddersydde egenskaper. Det er så klart også mulig å fjerne proteinbindingsseter fra en DNA-sekvens som haren bestemt gentranskripsjons-modulerende og/eller gentranskripsjons-undertrykkende egenskap, og dermed endre egenskapene av de dannede DNA-sekvenser. En kombinasjon av tilføyelse og fjerning er også mulig. Bestemte gentranskripsjons-modulerende og/eller gentranskripsjons-undertrykkende egenskaper kan selekteres for ved å avstemme påvisningsmetodene. Det er f.eks. mulig å syntetisere DNA-sekvenser som har induserbare gentranskripsjons-modulerende og/eller gentranskripsjons-undertrykkende egenskaper. Ved å f.eks. innlemme TAT-bindende elementer i en DNA-sekvens som omfatter en gentranskripsjons-undertrykkende egenskap, er det mulig å i det minste delvis inaktivere den gentranskripsjons-undertrykkende egenskap i en celle som omfatter TAT. På lignende måte er det tilgjengelig DNA-bindende proteiner som kun bindes til sine målsekvenser i fravær eller nærvær av et signal. Ikke-begrensende eksempler på slike proteiner er TET-repressoren og de forskjellige mutasjoner derav, lac-repressor, steroide hor-mon-receptorer, retinoinsyrereceptor og derivater. Det er f.eks. mulig å utvikle en DNA-sekvens som har en celletype-spesifikk gentranskripsjons-modulerende og/eller gentranskripsjons-undertrykkende egenskap. F.eks. i tilfellet av det ovennevnte eksempel TAT. Den nevnte DNA-sekvens kan gjøres spesifikk for HIV-infiserte celler som uttrykker TAT. Alternativt kan DNA-sekvensen gjøres spesifikk for et proteinkompleks som uttrykkes på celletype-spesifikk måte.
Ekspresjonskonstruksjoner som omfatter en DNA-sekvens som har en gentranskripsjons-modulerende og/eller gentranskripsjons-undertrykkende egenskap, er egnet for å oppnå ekspresjon fra konstruksjoner i celler som omfatter flere enn én kopi av ekspresjonskonstruksjonen, samt også når ekspresjonskonstruksjonen foreligger i genomet av cellen, og også når ekspresjonskassetten foreligger i flere enn én kopi i cellen. Videre fungerer de selv når flere enn én kopi derav er integrert inn i samme posisjon.
I en foretrukken utførelse omfatter DNA-sekvensen som har en gentranskripsjons-modulerende egenskap, en såkalt STAR-sekvens (STabilizing Anti-Repression). En STAR-sekvens slik uttrykket brukes heri, viser til en DNA-sekvens omfattende én eller flere av de nevnte gentranskripsjons-modulerende egenskaper.
Det er tilgjengelig flere metoder innen faget for å ekstrahere sekvens-identifiserere fra en familie av DNA-sekvenser som har et bestemt trekk til felles. Slike sekvens-identifiserere kan deretter brukes til å identifisere sekvenser som har én eller flere identifiserere til felles. Sekvenser som har én eller flere slike identifiserere til felles, er sannsynligvis elementer av samme sekvens-familie, dvs. at de sannsynligvis har den familiens felles trekk. Det ble benyttet et stort antall sekvenser som hadde STAR-aktivitet (såkalte STAR-sekvenser) for å erholde sekvensidentifiserere (mønstre) som var karakteristiske for sekvenser som hadde STAR-aktivitet. Disse mønstre kan brukes til å bestemme om det er sannsynlig at en testsekvens har STAR-aktivitet. Det er således mulig å påvise en STAR-sekvens i en nukelinsyre-sekvens omfattende ca. 50-5.000 basepar, omfattende å bestemme forekomsthyppigheten av minst ett sekvensmønster i sekvensen, og å bestemme at denne forekomsthyppighet er representativ for forekomsthyppigheten av det minst éne se-kvensmønster i minst én sekvens som har en STAR-sekvens. I prinsippet er hvilken som helst metode egnet for å bestemme om et sekvensmønster er representativt for en STAR-sekvens. Det er tilgjengelig mange forskjellige metoder innen faget. I en foretrukken utførelse innbefattes trinnet å bestemme hvorvidt forekomsten er representativ for forekomsthyppigheten av det minst éne sekvensmønster i minst én sekvens som har en STAR-sekvens, og å bestemme at forekomsthyppigheten av det minst éne sekvensmønster er vesentlig forskjellig i den minst éne STAR-sekvens og minst én kontrollsekvens. I prinsippet er hvilken som helst signifikant forskjell karakteristisk for nærværet av en STAR-sekvens. I en spesielt foretrukken utførelse er imidlertid forekomsthyppigheten av det minst éne sekvensmønster betraktelig høyere i den minst éne sekvens som omfatter en STAR-sekvens, sammenlignet med minst én kontrollsekvens.
Et betraktelig antall sekvenser omfattende en STAR-sekvens er blitt identifisert på denne måten. Det er mulig å bruke disse sekvenser til å teste hvor virkningsfullt et mønster kan skjelne mellom en kontrollsekvens og en sekvens som omfatter en STAR-sekvens. Ved bruk av såkalt diskriminansanalyse er det mulig å bestemme, på grunnlag av hvilken som helst gruppe STAR-sekvenser i en art, de mest optima-le karakteristiske sekvensmønstre eller kombinasjoner derav. Dermed velges fortrinnsvis minst ett av disse mønstre på grunnlag av en ønskelig, og fortrinnsvis optimal, skjelning mellom minst én sekvens som har en STAR-sekvens, og en kontrollsekvens. En ønskelig skjelning kan være en bestemt signifikansfaktor forbundet med mønstret ved bioinformatikk.
I en foretrukken utførelse sammenlignes forekomsthyppigheten av et sekvens-mønster i en test-nukleinsyre med forekomsthyppigheten i en sekvens som man vet at inneholder en STAR-sekvens. I dette tilfelle anses et mønster å være representativt for en sekvens som inneholder en STAR-sekvens, hvis forekomsthyppigheten er lignende. I en foretrukken utførelse brukes et annet kriterium. Forekomsthyppigheten for et mønster i en sekvens som omfatter en STAR-sekvens, sammenlignes med forekomsthyppigheten av mønstret i en kontrollsekvens. Ved å sammenligne de to hyppigheter, er det mulig å bestemme for hvert mønster som analyseres slik, om hyppigheten i sekvensen som omfatter STAR-sekvensen, er signifikant forskjellig fra hyppigheten i kontrollsekvensen. I denne utførelse anses et se-kvensmønster å være representativt for en sekvens som omfatter en STAR-sekvens, hvis forekomsthyppigheten for mønstret i minst én sekvens som omfatter en STAR-sekvens, er signifikant forskjellig fra forekomsthyppigheten av det samme mønster i en kontrollsekvens. Ved bruk av større antall sekvenser som omfatter en STAR-sekvens, heves antallet mønstre som man kan bestemme en statistisk forskjell for, hvilket hever antallet mønstre hvis forekomsthyppighet er representativ for en sekvens omfattende en STAR-sekvens. Fortrinnsvis er forekomsthyppigheten representativ for forekomsthyppigheten av det minst éne sekvensmønster i minst 2 sekvenser omfattende en STAR-sekvens, mer foretrukket i minst 5 sekvenser som omfatter en STAR-sekvens. Mer foretrukket i minst 10 sekvenser som omfatter en STAR-sekvens. Mer foretrukket er forekomsthyppigheten representativ for forekomsthyppigheten av det minst éne sekvensmønster i minst 20 sekvenser som omfatter en STAR-sekvens. I en spesielt foretrukken utførelse er forekomsthyppigheten representativ for forekomsthyppigheten av det minst éne sekvensmønster i minst 50 sekvenser som omfatter en STAR-sekvens.
Mønstrene som er karakteristiske for en sekvens som omfatter en STAR-sekvens, er også avhengig av hvilken type kontroll-nukleinsyre som brukes. Hvilken type kontrollsekvens som brukes, velges fortrinnsvis på grunnlag av sekvensen i hvilken man skal påvise nærværet av en STAR-sekvens. I en foretrukken utførelse omfatter kontrollsekvensen en tilfeldig sekvens som omfatter et lignede AT/CG-innhold som den minst éne sekvens som omfatter en STAR-sekvens. I en annen foretrukken ut-førelse er kontroll-sekvensen avledet fra samme art som sekvensen som omfatter STAR-sekvensen. F.eks. hvis en test-sekvens undersøkes for nærvær av en STAR-sekvens som er aktiv i en plantecelle, da er fortrinnsvis kontrollsekvensen også avledet fra en plantecelle. For å teste for STAR-aktivitet i en human celle, er på lignende måte kontroll-nukleinsyren fortrinnsvis også avledet fra et humant genom. I en foretrukken utførelse omfatter kontroll-sekvensen mellom 50% og 150% av antallet baser i den minst éne sekvens som omfatter en STAR-sekvens. I en spesielt foretrukken utførelse omfatter kontrollsekvensen mellom 90% og 110% av antallet baser i den minst éne sekvens som omfatter en STAR-sekvens. Mer foretrukket mellom 95% og 105%.
Et mønster kan omfatte hvilket som helst antall baser som er større enn 2. Fortrinnsvis omfatter minst ett sekvensmønster minst 5, mer foretrukket minst 6, baser. I en annen utførelse omfatter minst ett sekvensmønster minst 8 baser. I en foretrukken utførelse omfatter det minst éne sekvensmønster et mønster som er oppført i tabell 9 og/eller tabell 10. Et mønster kan bestå av en fortløpende liste over baser. Imidlertid kan mønstret også omfatte baser som er avbrutt én eller flere ganger av et antall baser som ikke er, eller bare delvis er, karakteristiske. En delvis karakteristisk base kan f.eks. være et purin.
Fortrinnsvis verifiseres nærværet av STAR-aktivitet ved bruk av et funksjonelt assay. Flere metoder presenteres heri for å bestemme om en sekvens omfatter STAR- aktivitet. STAR-aktivitet bekreftes hvis sekvensen har evnen til å utføre minst én av de følgende funksjoner: (i) i det minste delvis inhibere virkningen av sekvenser omfattende et gentranskripsjons-undertrykkende element, (ii) i det minste delvis blokkere kromatin-assosiert represjon, (iii) i det minste delvis blokkere aktiviteten av en forsterker, (iv) formidle følgende egenskap til en operabelt bundet nukleinsyre som koder for en transkripsjonsenhet, sammenlignet med samme nukleinsyre i og for seg: (iv-a) en større forutsigbarhet av transkripsjonen, (iv-b) en høyere transkripsjon og/eller (iv-c) en høyere stabilitet av transkripsjonen overtid.
Det store antall sekvenser som omfatter STAR-aktivitet som er blitt identifisert som forklart ovenfor, åpner opp for et bredt utvalg av muligheter for å generere og identifisere sekvenser som omfatter den samme aktivitet, med hensyn til type, ikke nødvendigvis mengde. F.eks. ligger det godt innen kunnskapsområdet til en fag-mann å endre sekvensene som identifiseres, og teste de endrede sekvenser for STAR-aktivitet. Endring kan omfatte slettelse, innføyelse og mutasjon av én eller flere baser i sekvensene.
Sekvenser som har STAR-aktivitet, ble identifisert i strekninger på 400 baser. Imidlertid forventer man ikke at alle disse 400 baser er nødvendige for å opprettholde STAR-aktiviteten. Fremgangsmåter for å avgrense sekvensene som formidleren bestemt egenskap til et fragment mellom 400 og 5.000 baser, er velkjent. Den minste sekvenslengde av et fragment som omfatter STAR-aktivitet, beregnes å være ca. 50 baser.
Tabell 9 og 10 viser mønstre på 6 baser som har vist seg å være over-representert
i nukleinsyremolekyler som har STAR-aktivitet. Denne over-representasjon anses å være representativ for en STAR-sekvens. Tabellene ble generert for en familie av 65 STAR-sekvenser. Lignende tabeller kan genereres utgående fra en forskjellig gruppe STAR-sekvenser, eller fra et mindre eller større antall STAR-sekvenser. Et mønster er representativt for en STAR-sekvens hvis det er over-representert i STAR-sekvensen sammenlignet med en sekvens som ikke omfatter noe STAR-element. Dette kan være en tilfeldig sekvens. For å utelukke et ikke-relevant avvik, sammenlignes imidlertid sekvensen som omfatter en STAR-sekvens, fortrinnsvis med et genom eller en betraktelig del derav. Fortrinnsvis et genom av et virveldyr eller en plante, mer foretrukket et humant genom. En betraktelig del av et genom er f.eks. et kromosom. Fortrinnsvis er sekvensen som omfatteren STAR-sekvens, og kontrollsekvensen avledet fra nukleinsyre fra én og samme art.
Jo flere STAR-sekvenser som brukes for å bestemme hyppigheten av forekomsten av sekvensmønstre, desto mer representative for STAR'ene er mønstrene som er over- eller underrepresentert. I betraktning av at mange av de funksjonelle trekk som kan uttrykkes av nukleinsyrer, medieres av proteinaktige molekyler som bindes til dem, er det å foretrekke at det representative mønster er over-representert i STAR-sekvensene. Slike over-representerte mønstre kan være en del av et bindingssete for et slikt proteinaktig molekyl. Fortrinnsvis er forekomsthyppigheten representativ for forekomsthyppigheten av det minst éne sekvensmønster i minst 2 sekvenser som omfatter en STAR-sekvens, mer foretrukket i minst 5 sekvenser som omfatter en STAR-sekvens. Mer foretrukket i minst 10 sekvenser som omfatter en STAR-sekvens. Mer foretrukket er forekomsthyppigheten representativ for forekomsthyppigheten av det minst éne sekvensmønster i minst 20 sekvenser som omfatter en STAR-sekvens. I en spesielt foretrukken utførelse er forekomsthyppigheten representativ for forekomsthyppigheten av det minst éne sekvensmønster i minst 50 sekvenser som omfatter en STAR. Fortrinnsvis omfatter sekvensene som omfatter en STAR-sekvens, minst én av sekvensene som er vist på fig. 26.
STAR-aktivitet er et trekk som sekvensene på fig. 26 har til felles. Imidlertid betyr dette ikke at alle må ha samme identifiserende sekvens til felles. Det er meget godt mulig at det finnes forskjellige identifiserere. Identifiserere kan formidle dette felles trekk til et fragment som inneholder den, men dette er ikke nødvendigvis tilfellet.
Ved bruk av flere sekvenser som omfatter STAR-aktivitet, for å bestemme forekomsthyppigheten av ett eller flere sekvensmønstre, er det mulig å velge mønstre som mangler eller foreligger oftere enn andre mønstre i en slik STAR-sekvens. På denne måte er det mulig å finne mønstre som meget ofte er over- eller underrepresentert i STAR-sekvenser. Hyppig over- eller underrepresenterte mønstre vil mer sannsynlig identifisere kandidat-STAR-sekvenser i testsett. En annen måte å bruke et sett av over- eller underrepresenterte mønstre er å bestemme hvilket mønster eller hvilken mønsterkombinasjon som er best egnet til å identifisere en STAR i en sekvens. Ved bruk av såkalt diskriminerende statistikk har vi identifisert et sett av mønstre som gir best resultat ved identifisering av en sekvens som omfatter et STAR-element. I en foretrukken utførelse omfatter minst ett av sekvensmønstrene for påvisning av en STAR-sekvens, sekvensmønstret GGACCC, CCCTGC, AAGCCC, CCCCCA og/eller AGCACC. I en annen utførelse omfatter minst ett av sekvens-mønstrene for påvisning av en STAR-sekvens, et sekvensmønster CCCN{16}AGC, GGCN{9}GAC, CACN{13}AGG, CTGN{4}GCC.
En liste over STAR-sekvenser kan også brukes til å bestemme én eller flere konsenssekvenser deri. Denne konsenssekvens kan så klart brukes til å identifisere kandidat-STAR-elementer i en testsekvens.
Videre, når en sekvens som omfatter et STAR-element er blitt identifisert i et virveldyr, kan det brukes ved hjelp av sekvenshomologi til å identifisere sekvenser som omfatter et STAR-element, i andre arter som tilhører virveldyr. Fortrinnsvis brukes en pattedyr-STAR-sekvens til å sikte ut STAR-sekvenser i andre pattedyrar-ter. På lignende måte, når en STAR-sekvens er blitt identifisert i en planteart, kan den brukes til å sikte ut homologe sekvenser med lignende funksjon i andre plante-arter. Videre kan det tilveiebringes en samling av STAR-sekvenser. Fortrinnsvis er STAR-sekvensen en STAR-sekvens fra et virveldyr eller en plante. Mer foretrukket er STAR-sekvensen en pattedyr-STAR-sekvens eller en angiosperm (monocot så som ris, eller dicot så som Arabidopsis). Mer foretrukket er STAR-sekvensen en STAR-sekvens fra en primat og/eller et menneske.
En liste over sekvenser som omfatter STAR-aktivitet, kan også brukes til å bestemme om en testsekvens omfatter et STAR-element. Slik det ble nevnt ovenfor, finnes det mange forskjellige måter å bruke en slik liste for dette formål. I en foretrukken utførelse kan det benyttes en fremgangsmåte for å bestemme om en nukleinsyre med ca. 50-5.000 basepar inneholderen STAR-sekvens, hvilken fremgangsmåte omfatter å generere en første tabell over sekvensmønstre omfattende forekomsthyppigheten for mønstrene i en samling av STAR-sekvenser, generere en andre tabell med mønstrene omfattende forekomsthyppigheten for mønstrene i minst én referansesekvens, velge minst ett mønster hvis forekomsthyppighet er forskjellig i de to tabeller, bestemme, i nukleinsyresekvensen med ca. 50-5.000 basepar, forekomsthyppigheten for minst ett av de valgte mønstre, og bestemme om forekomsten i test-nukleinsyren er representativ for forekomsten av mønstret i samlingen av STAR-sekvenser. Alternativt omfatter bestemmelsen å bestemme om forekomsthyppigheten i test-nukleinsyren er representativ for forekomsthyppigheten av det valgte mønster i samlingen av STAR-sekvenser. Fortrinnsvis omfatter fremgangsmåten dessuten å bestemme om kandidat-STAR'en omfatter en gentranskripsjons-modulerende egenskap. Fortrinnsvis omfatter samlingen av STAR'er en sekvens som er vist på fig. 26.
I et annet trekk tilveiebringes en isolert og/eller rekombinant nukleinsyresekvens omfattende en STAR-sekvens.
Slik det ble nevnt ovenfor, kan en STAR-sekvens utøve sin aktivitet på retningsstyrt måte, dvs. mer mot én side av fragmentet som inneholder den, enn mot den andre side. Videre kan STAR-aktivitetsmengden amplifiseres ved å mangedoble antallet STAR-elementer. Dette sistnevnte tyder på at et STAR-element kan omfatte ett eller flere elementer som har STAR-aktivitet. En annen måte å identifisere en sekvens som har evnen til å formidle STAR-aktivitet til et fragment som inneholder den, omfatter å velge, fra en virveldyr- eller plante-sekvens, en sekvens som omfatter STAR-aktivitet, og å identifisere om sekvenser som flankerer den valgte sekvens, er konservert i andre arter. Slike konserverte flankerende sekvenser er sannsynligvis funksjonelle sekvenser. I ett trekk kan det derfor identifiseres en sekvens omfattende et STAR-element, hvor det velges en sekvens med ca. 50 til 5.000 basepar fra en virveldyr- eller plante-art som omfatter et STAR-element, og hvor det identifiseres sekvenser som flankerer den valgte sekvens i arten, som er konservert i minst én annen art. Fortrinnsvis omfatter arten en plante- eller virveldyr-art, fortrinnsvis en pattedyr-art.
Det er viktig å påpeke at fremgangsmåtene for å påvise nærværet av en sekvens som omfatter en STAR-sekvens, ved bruk av bioinformatisk informasjon, er av ite-rativ natur. Jo flere sekvenser som omfatter en STAR-sekvens, desto flere mønstre viser seg å kunne brukes til å skjelne mellom en sekvens som omfatter en STAR-sekvens, og en kontrollsekvens. Ved bruk av disse nye oppdagede skjelnende mønstre kan man identifisere flere sekvenser som omfatter en STAR-sekvens, som i sin tur forstørrer settet av mønstre som kan skjelne, osv.
Begrepet kvalitet med hensyn til en sekvens viser til en aktivitet av sekvensen. Begrepet STAR, STAR-sekvens eller STAR-element viser, slik det brukes heri, til en DNA-sekvens som omfatter én eller flere av de nevnte gentranskripsjons-modulerende egenskaper. Begrepet SINC eller SINC-element som brukes i det føl-gende, viser til en DNA-sekvens som omfatter én eller flere av de nevnte gentranskripsjons-undertrykkende egenskaper. Begrepet "DNA-sekvens" viser, slik det brukes heri og hvis intet annet er nevnt, ikke til en opplisting av en bestemt rekke-følge av baser, men heller til et fysisk stykke DNA. En transkripsjonsegenskap under henvisning til en DNA-sekvens viser til en virkning som DNA-sekvensen har på transkripsjonen av et aktuelt gen. "Egenskap" viser, slik det brukes heri, til påvisbare egenskaper eller attributter av en nukleinsyre eller et protein i et transkripsjon ssystem.
Eksempler
Eksempel 1: Fremgangsmåter for å isolere STAR- og SINC- elementer
Materialer og metoder
Plasmider og stammer: Seleksjonsvektoren for STAR-elementer, pSelect-SV40-zeo ("pSelect", fig. 1) er konstruert som følger: pREP4-vektor (Invitrogen V004-50) brukes som plasmid-ryggrad. Den tilveiebringer Epstein-Barr-oriP-replikasjonsopphav og EBNA-l-kjerneantigen for høykopierings episomal replikasjon i pri-mate cellelinjer; hygromycin-resistensgen med tymidin kinase-promoter og polyadenylasjonssete, for utvalg i pattedyrceller; og ampicillin-resistensgen og colEl-replikasjonsopphav for vedlikehold i Escherichia coli. Vektoren inneholder fire suk-sessive LexA-operatorseter mellom Xbal- og /vfrel-restriksjonsseter (Bunker og Kingston, 1994). Integrert mellom LexA-operatorene og Nhel- setet er en polylinker bestående av de følgende restriksjonsseter: W/'ndIII-/4scI-BamHI-/4scI-W/77dIII. Mellom Nhel- setet og Sa/I-setet er zeocin-resistensgenet med SV40-promoter og polyadenylasjonssete, avledet fra pSV40/Zeo (Invitrogen V505-20); dette er den selekterbare markør for STAR-testen.
pSDH-vektor (fig. 2) konstrueres som følger: Luciferase-reportergen fra pGL3-kontroll (Promega E1741) amplifiseres ved PCR og innføyes i SacII/ÆamHI-spaltet pUHD10-3 (Gossen og Bujard, 1992). Dette plasserer luciferaset under styringen av Tet-Off-promoter, og oppstrøms for SV40-polyadenylasjonssignalet. Multiple kloningsseter innføres ved PCR, oppstrøms for Tet-Off-promoter (MCSI, Xhol- Notl-EcoRl- Sall) og nedstrøms for polyadenylasjonssignalet (MCSII, Nhel- Bglll- EcoRV-Hindlll). Gensamlinger konstrueres ved Sau3AI-spaltning av humant genomisk DNA, enten isolert fra placenta (Clontech 6550-1) eller båret i bakterielle/Pl (BAC/PAC) kunstige kromosomer. BAC/PAC-klonene inneholder genomisk DNA fra lql2-cytogenetisk region (klonene RP1154H19 og RP3328E19) eller fra HOX-klyngen av homeotiske gener (klonene RP1167F23, RP1170019 og RP11387A1). DNA'ene størrelsesfraksjoneres, og fraksjonen med størrelse 0,5-2 kb ligeres inn i BamHI-spaltet pSelect-vektor, ved standardteknikker (Sambrook et al., 1989).
Konstruksjonen av vertstammene er blitt beskrevet (van der Vlag et al., 2000). Kort sagt baserer de seg på U-2 OS human osteosarkoma-cellelinje (American Type Culture Collection HTB-96). U-2 OS transfiseres stabilt med pTet-Off-plasmidet (Clontech K1620-A), som koder for en proteinkimær bestående av Tet-repressor- DNA-bindende domene og VP16-transaktiveringsdomene. Cellelinjen transfiseres deretter stabilt med fusjonsproteingener inneholdende LexA-DNA-bindende domene, og den kodende region av enten HP1 eller HPC2 (to Drosophila- Po\ ycomb-gruppe-proteiner som undertrykker genekspresjon når de er forankret på DNA). LexA-repressorgenene styres av det Tet-Off-transkripsjonsregulerende system (Gossen og Bujard, 1992).
Bestemmelse av biblioteket oa STAR- element- karakteriserina: Genbibliotekene i pSelect transfiseres inn i U-2 OS/Tet-Off/LexA-repressor-cellelinjen ved kalsium-fosfatfelning (Graham og van der Eb, 1973; Vigler et al., 1978) slik leverandøren av transfeksjonsreagensmidlet (Life Technologies) anbefaler. Transfiserte celler dyrkes under hygromycin-seleksjon (25^g/ml) og tetracyklin-represjon (doxycyklin, 10 ng/ml) i 1 uke (50% konfluens). Deretter nedsettes doxocyklin-konsentrasjonen til 0,1 ng/ml for å indusere LexA-repressor-genene, og etter 2 dager tilføyes zeocin til konsentrasjonen 250 \ ig/ m\. Cellene dyrkes i ytterligere 4-5 uker, inntil kontrollkulturene (transfisert med tom pSelect) er blitt drept av zeocinet.
Zeocin-resistente kolonier fra bibliotekstransfeksjonen propageres, og plasmid-DNA isoleres og reddes inn i E. coil ved standardteknikker (Sambrook et al., 1989). Kandidat-STAR-elementene i det reddede DNA analyseres ved restriksjons-endonuklease-kartlegging (Sambrook et al., 1989), DNA-sekvensanalyse (Sanger et al., 1977) og for STAR-aktivitet (zeocin-resistens) etter gjentransfeksjon til U-2 OS/Tet-Off/LexA-repressor og senking av doxocyklin-konsentrasjonen.
Kandidat-STAR-elementer som har DNA-sekvenser som tilsvarer kjente sekvenser i det humane genom, identifiseres ved BLAST-søk (Altschul et al., 1990) i hu-mangenom-databasen (http://www.ncbi.nlm.nih.gov/genome/seq/HsBlast.html 20. juni 2001). De kromosomale plasseringer av elementene registreres, sammen med andelen repetitivt DNA og identiteten av hosliggende gener.
Kandidatene som oppviser STAR-aktivitet etter gjen-transfeksjon, karakteriseres ytterligere ved å delklone STAR-fragmentet inn i pSDH-plasmidet og stabil integrasjon i U-2 OS-kromosomalt DNA. pSDH-plasmider kotransfiseres inn i U-2 OS-celler med pBABE-puro (Morgenstern og Land, 1990) og selekteres for puromycin-resistens. Per STAR-element isoleres populasjoner på ca. 30 enkelte kloner og dyrkes. Klonene testes periodisk for luciferase-aktivitet i henhold til produsentens anvisninger (Roche 1669893).
Resultater
Funksjonell karakteriserin<g>av STAR- elementer: Siktingen gjennom det humane genomiske DNA og HOX- og lql2-loci gav 17 mulige STAR-elementer. Kriteriene er at (1) elementene oppviste STAR-aktivitet etter gjen-transfeksjon av de pSelect-baserte kloner inn i verten U-2 OS human osteosarkoma-cellelinje (hvilket tydet på at anti-repressor-aktiviteten som ble uttrykt i den opprinnelige test, er plasmid-spesifikk og ikke skyldes artefakt-endringer i vertcellene); (2) elementene inneholder en DNA-sekvens som stemmer overens med en sekvens i sekvens-databasen over det humane genom (hvilket tyder på at klonen ikke inneholder noen foruren-sende DNA-sekvens, f.eks. fra bakterie- eller vektor-kilder).
STAR-elementene delklones inn i pSDH-plasmid og integreres i vertens cellegenom. Ekspresjon av reportergenene testes i populasjoner av stabile transfektanter for å demonstrere evnen av STAR-elementene til å beskytte reportergener for forstumning etter tilfeldig integrasjon i genomet. Dette gir informasjon om (1) andelen kloner som oppviser høy ekspresjon, og (2) graden av over-ekspresjon som utløses av STAR-elementene.
Ekspresjon av luciferase-reportergenet i en klon anses å være signifikant hvis den er dobbelt så høy som det midlere nivå for plasmidene som ikke inneholder STAR-elementer (referansenivået). For alle plasmider observeres en fordeling av ekspresjonsnivået blant klonene; fra ingen ekspresjon til ekspresjon som er betraktelig høyere enn referanse-nivået, og fra få over-uttrykkende kloner til mange over-uttrykkende kloner. En overlegen STAR-aktivitet manifesteres av plasmider som fører til mange over-uttrykkende kloner, med enkelte høyt over-uttrykkende kloner.
Resultatene fra et representativt eksperiment vises i tabell 1, og på fig. 3-5: Resultatene tyder på at de humane STAR-elementer som testes, gir en meget høy-ere andel over-uttrykkende kloner enn det ubeskyttede reportergen eller reportergenet som er beskyttet av Drosop/7/7a-SCS-elementet (Kellum og Schedl, 1992). Videre er over-ekspresjonsgraden med disse plasmider meget høyere fra det STAR-beskyttede reportergen enn fra ubeskyttet eller SCS-beskyttet reporter.
STAR- element- sekvens og genomisk posisionell data: Tabell 2 viser den kromosomale plassering av de 17 STAR-elementer, samt identiteten av hosliggende gener og det repetitive DNA-innhold av elementene. STAR-elementene er fordelt over et antall kromosomer. De har forskjellig faktisk DNA-sekvens og repetitivt DNA-innhold, og oppviser forskjellig grad av forbindelse med nabo-gener.
Siktin<g>etter SINC- elementer
Materialer og metoder
Plasmidet for SINC-testen, pSINC-Select ("pSS", fig. 6), konstrueres som følger: pREP4-vektor (Invitrogen V004-50) brukes som plasmid-ryggrad. Det tilveiebringer Epstein-Barr-oriP-replikasjonsopphav og EBNA-l-nukleært antigen for høykopie-rings episomal replikasjon i primat-cellelinjer; hygromycin-resistens-gen med tymidin kinase-promoter og polyadenylasjonssete for seleksjon i pattedyrceller; og ampicillin-resistens-gen og colEl-replikasjonsopphav for vedlikehold i Escherichia coli. Vektoren inneholder en TetOff-promoter bestående av tandem-Tet-responsive elementer (TRE'er) fra plasmidet pUDH10-3 (Gossen og Bujard, 1992) for å reguleres av det Tet-Off-transkripsjonsregulatoriske system. TRE'ene regulerer ekspresjonen av codA: :upp-genet som koder for et fusjonsprotein (cytosin deaminase/ uracil fosforibosyltransferase; Invitrogen porf-codaupp). Dette er et såkalt "suicid-gen"; aktiviteten av codA: :upp-enzym omdanner prodrogen 5-fluorcytosin (5-FC) til et toksisk middel, nemlig 5-fluoruracil (5-FU), hvilket forårsaker apoptose og celle-død (Mullen et al., 1992; Tiraby et al., 1998; Wei og Huber, 1996). Oppstrøms for Tet-Off-promoter er et Bg/II-restriksjonssete for å klone Sau3AI-spaltet genomisk DNA for gjennomsikting. pREP4-DNA adskilles fra det genomiske DNA og suicid-genet med STAR-elementer for å forhindre at klonede SINC-elementer forstummer vesentlige plasmid-elementer i pREP4-komponenten. Genomisk DNA fra en samling av BAC-kloner omfattende humant kromosom 22 (Invitrogen/Research Genetics 96010-22) spaltes delvis med Sau3AI og ligeres inn i Bg/II-spaltet pSS (Sambrook et al., 1989). Samlingen av rekombinante plasmider transfiseres inn i U-2 OS/Tet-Off-cellelinjen ved kalsiumfosfat-felning (Graham og van der Eb, 1973; Wigler et al., 1978) slik leverandøren av transfeksjonsreagensmidlet (Life Technologies) anbefaler. Transfiserte celler dyrkes under hygromycin-seleksjon (25^g/ml) og tetracyklin-represjon (doxocyklin, 10 ng/ml) i 3 uker. Deretter tilføyes 5-FC til konsentrasjonen 1 ng/ml, og cellene dyrkes i ytterligere 3 uker for å velge ut SINC-elementer.
Kandidat-SINC-holdige kolonier samles og brukes i en polymerasekjedereaksjon med primerne PCR1 og PCR2 (fig. 6); PCR-produktene spaltes med Hindlll og X/70l-restriksjonsendonuklease og klones inn i pBluescript II SK(+) (Stratagene 212207) ved konvensjonelle teknikker (Sambrook etal., 1989). DNA-sekvensene av kandidat-SINC-elementene bestemmes (Sanger et al., 1977), og tilsvarende sekvenser i det humane genom identifiseres ved BLAST-søk (Altschul etal., 1990) gjennom databasen av det humane genom
(http://www.ncbi.nlm.nih.gov/genome/seq/HsBlast.html 20. juni 2001). De kromosomale plasseringer av elementene registreres sammen med andelen repetitivt DNA og identiteten av hosliggende gener.
Resultater
I slutten av seleksjonsperiodene er ingen kolonier synlige i kontrollkulturene (tomt pSS), og et antall kolonier er synlige i kulturene som inneholder pSS med genomisk DNA. Disse overlevende kloner inneholder kandidat-SINC-elementer. Elementene isoleres ved PCR og delklones inn i standard kloningsvektor, pBluescript. DNA-sekvensen av elementene bestemmes og sammenlignes med den humane genomsekvens (tabell 3). I alle tilfellene forelå de sekvensierte elementer på kromosom 22, slik som man forventet.
Eksempel 2: Ekspresionseqenskaper av transqenet som skyldes STAR, SINC eller kombinert STAR/ SINC
Bakgrunn: Sete-spesifikk rekombinasjon brukes til å nøyaktig fjerne heterologt DNA fra sin kromosomale plassering. Dette utføres rutinemessig ved bruk av ett av to systemer: cre-rekombinase og loxP-mål av bakteriofag Pl (Feng etal., 1999), eller FLP-rekombinase og FRT (FLP-rekombinase-mål) av gjær (Wigley etal., 1994). I disse systemer flankeres en DNA-region (som vanligvis inneholder et reportergen og/eller en selekterbar markør) i kromosomet av loxP- eller FRT-målet. Aktiviteten av rekombinaset katalyserer deretter en nøyaktig utskjæring av DNA-regionen fra kromosomet. Rekombinaset gjør om sine to gjenkjenningssekvenser til ett enkelt sete og sletter sekvensen mellom dem. Dermed må en DNA-strekning flankeres av målseter for å deretter slettes in vivo ved innføring eller aktivering av rekombinase (Schwenk et al., 1995; Dymecki, 1996). Cre- og Flp-rekombinasene katalyserer en rekombinasjon mellom to 13-basepars inverterte gjentakelser, adskilt av en av-standsholder med minst 6 (loxP) eller 8 (FRT) basepar (Senecoff et al., 1985). loxP-sekvensen er ATAACTTCGTATA, og FRT-sekvensen er GAAGTTCCTATAC.
Protokoll: Ved bruk av konvensjonell DNA-kloning (Sambrook etal., 1989), konstrueres et reportergen (som koder for et reporter-protein, f.eks. grønt fluoresceren de protein (GFP) (Bierhuizen etal., 1997) eller luciferase (Himes og Shannon, 2000), som flankeres i et plasmid av et par STAR-elementer, av et par SINC-elementer eller et par STAR/SINC-kombinasjonselementer. I hvert tilfelle flankeres elementene i og for seg av rekombinase-målseter. Ett element flankeres av et par loxP-seter, og det andre flankeres av et par FRT-seter (fig. 1). Etter transfeksjon integreres plasmidet inn i verts-kromosomet i en liten andel celler, og integrantene velges i henhold til sin antibiotiske resistens. Lignende konstruksjoner gjøres for hvert av de tre test-elementer (STAR, SINC, STAR/SINC).
Ved bruk av konvensjonelle teknikker ("SuperFect Transfection Reagent Handbook", Qiagen, november 1997), transfiseres disse plasmider inn i U-2 OS-human osteosarkoma-cellelinje og selekteres for hygromycin-resistens. Hygromycin-resistente isolater har plasmidet stabilt integrert i genomet av cellelinjen. Individuelle isolater propageres i cellekulturmedium, og ekspresjonen av det transgene reportergen testes, f.eks. ved strømningscytometri (Stull etal., 2000).
Ved bruk av konvensjonelle teknikker (transfeksjon eller hormonstimulering), behandles deretter de stabile isolater fra ovenfor for å innføre eller aktivere rekombinase-aktivitet. Dette utføres sekvensielt, slik at f.eks. cre-rekombinase-aktiviteten katalyserer en utskjæring av STARI, og deretter katalyserer FLP-rekombinase-aktiviteten en utskjæring av STAR2. Ekspresjonsnivået av reportergenet i disse celler testes,og verdien sammenlignes med referanseverdien for det STAR-holdige opphavs-isolat.
Eksempel 3: Sekvensanalvse av STAR' er; bestemmelse av den minste uunnværlige sekvens for elementets funksjon; sekvenskonservering blant elementer; og egenskaper av tandem- og multiple elementer
Bakgrunn: DNA-fragmenter som inneholder STAR- eller SINC-elementer, isoleres ved genetisk seleksjon ved bruk av henholdsvis pSelect-plasmid (fig. 1) eller pSS-plasmid (fig. 6). Dette avsnitt beskriver fremgangsmåten for å karakterisere DNA-sekvensene innen slike fragmenter som har STAR- eller SINC-aktivitet.
Protokoller:
DNA- sekvens: Oligonukleotider utvikles på grunnlag av sekvensene av pSelect- og pSS-seleksjonsplasmidene for sekvensiering av DNA-fragmentene. Fragmentene sekvensieres ved bruk av dideoksy-terminasjonsteknikken (Sanger et al., 1977).
DNA-sekvenser lokaliseres deretter til sin kromosom posisjon ved bruk av den ålment tilgjengelige sekvensdata base for det humane genom
(http://www.ncbi.nlm.nih.gov:80/cgi-bin/Entrez/hum_srch?chr=hum_chr.inf&query). Gener og gentettheten i området rundt fragmentsekvensen registreres fra genomsekvens-annoteringen. Den transkripsjonene aktivitet av disse gener bestemmes utfra data fra ålment tilgjengelige databaser over DNA-mikrogruppering
(http://arrays.rockefeller.edu/xenopus/links.html) og SAGE (Serial Analysis of Gene Expression; http://bioinfo.amc.uva.nl/HTM-bin/index.cgi). Når den posisjonelle informasjon om STAR- og SINC-sekvensene er satt sammen, analyseres dataen med hensyn til underliggende konsenssekvenser. Konsenssekvenser eller trender (hvormed man mener lokale områder som er rike på bestemte nukleotid-kombinasjoner, f.eks. rike på C- og G-baser) påvises ved bruk av likhetssøkalgo-ritmer så som clustalw (Higgins etal., 1996) og blosum-likhets-poengtall (Altschul og Gish, 1996). Eventuelle underliggende konsenser eller trender som ble funnet, brukes deretter til å identifisere andre potensielle STAR'er på genomisk skala ved å utføre BLAST-søk (Altschul etal., 1990). Tidligere forskning har identifisert transkripsjonsregulatoriske proteiner som bindes til kjente isolatorer og grenseelementer (Gaszner et al., 1999; Gerasimova og Corces, 1998). I de beskrevne eksempler sammenfaller proteinbindingssetene med DNase I-hypersensitive seter, som er vesentlige for isolator- eller grensefunksjon. Hypotesen at STAR-elementer også bindes av kjente regulatoriske proteiner, undersøkes ved å gjennomsøke TRANSFAC-databasen av transkripsjonsfaktorer (http://transfac.gbf.de/TRANSFAC/) for sekvensmotiver som forekommer i STAR-elementene. Sekvensmotiver som er vanlige blant medlemmene av STAR- eller SINC-samlinger, er indikatorer på at den tilsvarende transkripsjonsfaktor bindes til dette element.
Minste uunnværli<g>e sekvens: Ved bruk av denne sekvens-kunnskap trunkeres STAR-elementer (eller SINC-elementer) og testes for sin funksjonalitet. Dette utfø-res ved bruk av polymerasekjedereaksjon (PCR) for å klone delfragmenter av STAR- eller SINC-holdige fragmenter inn i pSelect eller pSS ved standardteknikker (Sambrook etal., 1989). Plasmidene som inneholder sub-fragmentene, transfiseres inn i U-2 OS-celler og testes for sin funksjonalitet ved å teste for antibiotisk resistens (STAR-elementer) eller prodroge-resistens (SINC-elementer).
Retnin<g>sbindin<g>: STAR- og SINC-elementene testes for sin retningsbinding ved bruk av henholdsvis pSelect- og pSS-plasmidet. Retningen av STAR-elementene som isoleres ved pSelect-testen, benevnes f.eks. 5'3'-retning. Retningen av ele mentet reverseres ved bruk av konvensjonelle rekombinante DNA-teknikker (Sambrook etal., 1989). De dannede plasmider transfiseres inn i U-2 OS-cellelinjen, og ekspresjonen av reportergenet bestemmes (Bierhuizen etal., 1997; Himes og Shannon, 2000). Ekspresjonsnivået fra plasmidet med omvendt rettet element sammenlignes med ekspresjonen fra plasmidet med 5'3'-retning. Hvis det omvendt rettede plasmid har lignende ekspresjonsnivå, da oppviser STAR-elementet ikke retningsbinding.
Kombinasjoner av flere elementer: For å bestemme om STAR-elementene har evnen til å fungere i blandede par, kombineres forskjellige elementer og testes. Analysen utføres i pSDH-plasmidet ved å innføye ett STAR-element i MCSI og et annet STAR-element i MCSII ved rekombinante DNA-teknikker (Sambrook etal., 1989). De dannede plasmider transfiseres, og ekspresjonen av reportergenet testes (Bierhuizen etal., 1997; Himes og Shannon, 2000); resultatene sammenlignes med ekspresjonen fra plasmider som inneholder samme element i MCSI og MCSII; hvis ekspresjonen er omtrent lik for de to typer plasmider, slutter man seg til at forskjellige STAR-elementer ikke forstyrrer hverandre.
Styrken av enkelte STAR- eller SINC-elementer sammenlignes med tandem-gjentakelser av elementer. Dette utføres ved å koble sammen de aktuelle STAR-eller SINC-elementer med DNA-ligase og innføre ligasjonsproduktet inn i pSDH- eller pSS-plasmid ved bruk av rekombinante DNA-teknikker (Sambrook etal., 1989). De dannede plasmider transfiseres inn i U-2 OS-celler, og ekspresjonen av reportergenet bestemmes (Bierhuizen etal., 1997; Himes og Shannon, 2000). Resultatene sammenlignes med ekspresjonen fra plasmider som inneholder ett enkelt STAR- eller SINC-element.
Eksempel 4: Bestemmelse av avstanden som et STAR- element, et SINC- element eller en kombinasjon derav fungerer over
Bakgrunn: STAR-elementer brukes til å optimere ekspresjonen av enkle og multiple transgener. For å bestemme om ett enkelt par STAR-elementer kan beskytte større eller multiple transgener mot forstumning, er det nødvendig å bestemme over hvilket område STAR-elementene virker. Lignende informasjon bestemmes for SINC-elementer og for STAR/SINC-kombinasjoner.
Protokoll: STAR- og SINC-elementer testes for sin funksjonalitet over avstand ved bruk av derivative plasmider basert på henholdsvis pSelect eller pSS, som følger. Et bibliotek av tilfeldige DNA-fragmenter fra 500 bp til 10 kb settes sammen ved bruk av standard DNA-kloningsteknikker (Sambrook etal., 1989). Man velger fragmenter fra dette bibliotek som ikke har STAR- eller SINC-aktivitet, ved å teste dem i pSelect- og pSS-plasmidet som beskrevet ovenfor. For STAR-elementer og STAR/SINC-kombinasjoner innføyes disse fragmenter mellom kloningssetet og promoteren av reportergenet i den egnede pSelect-plasmid (fig. 1). Dette sett av plasmider transfiseres inn i U-2 OS-cellelinjen, og ekspresjonen måles slik det ble beskrevet ovenfor. Styrken av reportergen-ekspresjonen korreleres med lengden av det tilfeldige DNA-fragment som skiller STAR-elementet fra promoteren. SINC-elementer bedømmes på analog måte: tilfeldige DNA-fragmenter innføyes mellom SINC-elementet og promoteren av det egnede pSS-plasmid, og graden av reportergen-undertrykkelsen korreleres med lengden av det tilfeldige DNA-fragment.
Eksempel 5 ( a)
Bruk av naturlig forekommende SINC- elementer i den genetiske seleksjon av STAR- elementer
Bakgrunn: Dagens tester for STAR-elementer benytter seg av kimære lexA-PcG-proteiner for å tilveiebringe undertrykkelse av den selekterbare markør i selek-sjonsplasmidet. Ved å gjenta seleksjonen ved bruk av naturlig forekommende SINC-elementer, identifiserer man STAR-elementer som er spesifikke for den undertrykkende aktivitet som skyldes disse naturlig forekommende SINC-elementer.
SINC-element-testen baserer seg på evnen av genetisk seleksjon til å identifisere tilfeldig genererte fragmenter av genomisk DNA som har evnen til å forstumme en "tet-off-promoter og blokkere ekspresjonen av codA: :upp-suicid-genet. SINC-elementene som ble isolert fra denne seleksjon, representerer en tilfelding testing av genomiske forstummende elementer, og forskjellige klasser av elementer isoleres. For denne protokoll brukes disse diverse SINC-elementer til å isolere forskjellige klasser av STAR-elementer enn dem som ble isolert i de ovennevnte lexA-PcG-baserte seleksjoner.
Protokoll: SINC-elementer fra den aktuelle seleksjon karakteriseres og sorteres i klasser på grunnlag av funksjonelle trekk og DNA-sekvensielle trekk (funksjonelle trekk omfatter styrke av undertrykkelsen; sekvensielle trekk omfatter identifiserba-re konserverte motiver; jfr. eksempel 3). Representative elementer fra hver klasse brukes til å erstatte lexA-bindingssetene i pSelect-plasmidet ved bruk av standard DNA-kloningsteknikker (Sambrook etal., 1989). En genbank fremstilles med hvert av disse nye plasmider, og brukes til å identifisere nye, SINC-spesifikke STAR-elementer slik det er blitt beskrevet (van der Vlag etal., 2000). Dette utføres med helt genomisk DNA og med DNA fra BAC-klonen, som også inneholder SINC-elementet som brukes.
Eksempel 5 fb)
Bestemmelse av den maksimale lengde av STAR- oa SINC- elementer
Bakgrunn: STAR-elementer klones som fragmenter av DNA isolert ved bruk av pSelect-plasmidet, hvilket utføres med genomiske DNA-fragmenter på mindre enn 2 kb. Imidlertid kan disse være partier av et lengre STAR-element. Forlenget STAR-aktivitet undersøkes ved hjelp av de følgende eksperimenter.
Protokoll: STAR-elementer som er blitt klonet i pSelect, kartlegges til den humane genomsekvens. For å bestemme om de er partier av et lengre STAR-element, amplifiseres regioner på 4 kb som omfatter klonen, ved PCR, og klones inn i pSelect-og/eller pSDH-plasmidet ved bruk av standard rekombinante DNA-teknikker (Sambrook etal., 1989). De dannede plasmider transfiseres inn i U-2 OS-celler og testes for reportergen-ekspresjon slik det ble beskrevet ovenfor; plasmider som inneholder det opprinnelige 2 kb STAR-element, tas med som kontroll. Tre mulige resultater kan forventes: (1) lignende ekspresjon i kontroll-isolatet og det forlengede STAR-isolat, hvilket demonstrerer at STAR-elementet er begrenset til det opprinnelige 2 kb element; (2) lavere ekspresjon i de forlengde STAR-isolater, hvilket tyder på at STAR-elementet foreligger innen 2 kb-fragmentet og ikke virker over avstand, eller at det forlengede fragment inneholder et SINC-element; (3) høyere ekspresjon i det forlengede STAR-isolat, hvilket tyder på at den forlengede region inneholder et mer fullstendig STAR-element. I tilfellet av resultat (3), gjentas utskjæringen med
et større PCR-fragment på 6 kb.
Et STAR-element kan også være sammensatt av seter som forskjellige proteiner bindes til. Derfor ville større DNA-fragmenter med STAR-aktivitet kunne deles opp i mindre fragmenter med STAR-aktivitet (jfr. eksempel 3). Elementer som er større enn 2 kb, anses å være STAR-elementer hvis de fortsatt oppviser STAR-aktivitet etter trunkering til mindre enn 2 kb (også ved intern slettelse).
Eksempel 6: Metvlasions- oa histonacetvlasions- tilstander av STAR- elementer, SINC- elementer eller kombinasjoner derav, oa av de hosliaaende trans<g>ener
Bakgrunn: De regulatoriske egenskaper av STAR- og SINC-elementer er forbundet med den lokale kromatin-struktur, som bestemmes av DNA'et i og for seg og av DNA-forbundne proteiner. Endringer i kromatin-strukturen som er forbundet med endringer i genekspresjonen, dannes ofte av sekundære modifikasjoner av makro-molekylene, spesielt metylasjon av DNA eller acetylasjon av histonproteiner. Identifikasjon av de sekundære modifikasjoner som forekommer ved STAR- og SINC-elementer og ved hosliggende transgener, gir karakteristiske kjennetegn for disse elementer.
Protokoll: DNA-metylasjon: STAR- eller SINC-elementer eller kombinasjoner derav klones inn i pSelect-plasmidet ved bruk av standardteknikker (Sambrook et al., 1989). U-2 OS-celler transfiseres stabilt med disse plasmider, og med pSelect som mangler et STAR- eller SINC-element, som kontroll for å bestemme grunn-DNA-metylasjonen ved reportergenet. Celler samles, og kromatinet isoleres ved bruk av standardprosedyrer (Thomas, 1998). DNA'et spaltes med Hpall- og Mspl-restriksjonsendonukleasene i adskilte reaksjoner (Sambrook etal., 1989). Begge disse restriksjonsenzymer har evnen til å spalte den ikke-metylerte sekvens CCGG. Når det eksterne C metyleres, kan hverken Mspl eller Hpall spalte. Til forskjell fra Hpall, kan Mspl imidlertid spalte sekvensen når det indre C er metylert. DNA'et underkastes Southern blotting, og blotten analyseres ved indirekte ende-merking (Pa-zin og Kadonaga, 1998). Som kontroll spaltes også det tilsvarende pSelect-plasmid, som nakent, umetylert DNA, med de beskrevne enzymer og underkastes Southern blotting. Sammenligning av de forskjellige størrelser av DNA-fragmentene viser om DNA'et metyleres in vivo eller ikke.
Histon- acetvlasion: De samme transfiserte cellelinjer som ble brukt for DNA-metylasjonsanalysen, brukes for disse eksperimenter. Metoden som beskrives i det følgende, gir et høyresolusjonskart over histon-acetylasjonsmønstret på STAR- og SINC-elementene og reportergenet (Litt etal., 2001). Mikrokokkale nuklease-spaltningsprodukter av kjernene fraksjoneres på sakkarose-gradienter, og isolerte nukleosim-monomerer og -dimerer anrikes for acetylerte histoner ved immunofel-ning med anti-acetylhiston-antistoffer. Nukleosom-fraksjonen og immunofelningene underkastes analyse, f.eks. ved sanntids-PCR (Jung et al., 2000) ved bruk av primere og en Taqman-probe som sammensmeltes med reportergenet eller STAR- eller SINC-elementet for å gi 0,2 kb produkter, med et bevegelig vindu på 0,1 kb.
Økningsraten av Taqman-probens fluorescerende signal under PCR'en (som er pro-porsjonal med overflodet av sjablone-DNA'et i prøven) måles deretter. Forholdet mellom overskuddet av sjablone-DNA'et i nukleosom-fraksjonen og immunofelningene gir en fin-kartlegging av mønstret av histon-acetyleringen for hvert 0,1 kb på reportergenet og STAR- eller SINC-elementet (eller på reportergenet i fravær av et element).
Eksempel 7: In wVo- nukleosomposisionering oa DNAse I- hvpersensitive seter
Bakgrunn: Kromatin består av DNA, histoner og ikke-histon-proteiner. Histonene danner en kjernepartikkel som er dekket av ca. 150 bp DNA for å danne et nukleosom. Nukleosomer adskilles av 50-75 bp linker-DNA. Stabilt posisjonerte nukleosomer på kromosomalt DNA undertrykker genekspresjon, og faktorer som uteluk-ker nukleosomer eller på annen måte omformer kromatinet, kan overvinne denne undertrykkelse. Posisjoneringen av nukleosomer i en kromosomal region analyseres ved mikrokokkal nuklease (MNase)-assay; MNase spalter kromatinet fortrinnsvis i linker-DNA'et. På lignende måte er enkelte områder av DNA'et konstitutivt utsatt for ikke-histon-proteiner, og disse er ofte regulatoriske regioner, dvs. seter hvor cis-virkende regulatoriske faktorer bindes. Eksperimentelt er disse seter hypersensitive for spaltning med enzymet DNase I.
Protokoll: For å bestemme posisjonen av nukleosomer på reportergenet og på enten STAR- eller SINC-elementer, brukes MNase (Saluz og Jost, 1993). Kjernene isoleres fra dyrkede U-2 OS-celler og spaltes med MNase slik det ble beskrevet ovenfor (histon-acetylasjon). For å søke etter DNase I-hypersensitive seter i STAR- eller SINC-elementene eller reportergenet, behandles rensede kjerner med DNase I i en egnet konsentrasjon (f.eks. 100 \ ig/ m\ genomisk DNA og 20-100 U/ml DNase I) slik det er blitt beskrevet (Wallrath eta/., 1998). Nakent DNA spaltes med DNase I som kontroll. For begge teknikker fin-kartlegges reportergenet og STAR- eller SINC-elementene ved bruk av primer-forlengelse eller indirekte ende-merking og Southern blotting, slik det er blitt beskrevet (Tanaka etal., 1996; van der Vlag et al., 2000). MNase-assayet viser en stige med adskilte bånd eller et autoradiogram som tilsvarer posisjonene av nukleosomer på STAR- eller SINC-elementene eller reportergenet. DNase I-hypersensitive seter manifesterer seg som adskilte bånd i det dannede autoradiogram som mangler eller er mindre påfallende i nakent-DNA-kontrollen.
Eksempel 8: Celletype- oa vevavhenaiahet oa promoter- avhenaiahet av STAR- oa SINC- elementer
Bakgrunn: Det er blitt beskrevet at enkelte isolatorer eller grenseelementer kan oppvise vevspesifisitet (Takada etal., 2000). STAR-elementer har mange trekk til felles med isolatorer og grenseelementer. Bade uspesifikke og vev-spesifikke STAR-og SINC-elementer har bioteknologisk verdi i transgene anvendelser. Assayet som beskrives i det følgende, utføres for å bedømme celltype-avhengigheten. Celle- og vev-spesifisiteten av elementene undersøkes nærmere ved å undersøke ekspresjonen av gener i nærheten av elementene i det humane genom, ved bruk av dataene i ålment tilgjengelige databaser over DNA-mikrogrupperinger (http://arrays.rockefeller.edu/xenopus/links.html) og SAGE (Serial Analysis of Gene Expression; http://bioinfo.amc.uva.nl/HTM-bin/index.cgi).
Protokoll: STAR-elementer testes i pSDH-plasmidet, og SINC-elementer i pSS-plasmidet. Tre cellelinjer transfiseres ved bruk av standardprotokoller: human U-2 OS-osteosarkoma-cellelinje (Helding etal., 1986), Vero-cellelinjen fra nyren av af-rikansk grønn ape (Simizu et al., 1967) og CHO-cellelinjen fra ovarie av kinesisk hamster (Kao og Puck, 1968). Elementer som har evnen til å fungere i alle tre celltyper, kategoriseres som uspesifikke. De som kun oppviser aktivitet i én eller to av cellelinjene, kategoriseres som begrenset i sin celletype-funksjonalitet.
Promoter- spesifisitet: STAR- og SINC-elementer velges og testes i dag i sammenheng med funksjonen med to promotere, nemlig fullstendig cytomegalovirus (CMV)-promoter eller tetracyklin-responselement, og minimal CMV-promoter (i kombinasjon med tTA-transkripsjonell aktivator). For å bedømme promoterens spesifisitet testes STAR- og SINC-funksjonen med andre allment kjente virale promoto-rer, nemlig apevirus type 40 (SV40) tidlig og sen promoter, adenoviral EIA og ho-ved sen promoter, og Rous sarkomavirus (RSV) lang terminal gjentakelse (Doll et al., 1996; Smith etal., 2000; Weaver og Kadan, 2000; Xu etal., 1995). Hver av disse promotere klones adskilt inn i pSelect- og pSS-plasmid ved bruk av standardteknikker (Sambrook et al., 1989) sammen med henholdsvis STAR- eller SINC-elementer. De dannede plasmider transfiseres inn i U-2 OS-cellelinjen og testes for ekspresjon av reportergen, slik det ble beskrevet ovenfor. Evnen av SINC-elementer til å forstumme disse promotere, eller av STAR-elementer til å beskytte mot forstumning, bestemmes ved å sammenligne med plasmider som mangler STAR- eller SINC-elementer.
Eksempel 9: Fremgangsmåter for å forbedre STAR- oa SINC- elementer
Bakgrunn: Forbedrede STAR- og SINC-elementer utvikles. Forbedringer gir hevet styrke av anti-repressiv eller repressiv aktivitet, og elementer med induserbar og vev-spesifikk aktivitet. Disse forbedringer gjøres ved en kombinasjon av teknikker.
Protokoller
Tvungen evolusjon: Feil-tilbøyelig PCR (Chery etal., 1999; Henke og Bornscheuer, 1999) brukes til å innføre gjennomsnittlig én til to punktmutasjoner per element. De mutageniserte elementer testes ved bruk av pSelect-plasmid (eller pSS-plasmid) som inneholder reporter-selekterbare markør-fusjonsproteiner, ved f.eks. fluorescens-aktivert cellesortering og antibiotisk resistens (Bennett etal., 1998). Påfølgende runder med feil-tilbøyelig PCR og seleksjon utføres for å avlede elementer som har ytterligere forbedret aktivitet.
Tandem- og heterologe kombinasjoner: Slik det ble beskrevet ovenfor, testes tandem- og heterologe kombinasjoner av elementer for aktivitet sammenlignet med hvert enkelt element (eksempel 3).
Den relative dominans av STAR- og SINC-elementer testes fra tilfelle til tilfelle. Den brukes til å teste styrken av et element; f.eks. hvis et nytt STAR-element er dominant over et kjent, sterkt SINC-element, klassifiseres STAR-elementet som å være meget sterkt. Muligheten for at dominans-forholdet mellom et STAR-element og et SINC-element er celletype-, vev- eller promoter-spesifikt, tas også i betraktning (eksempel 8). Dominanstesten benytter seg av pSelect-plasmidet, med forskjellige SINC-elementer plassert oppstrøms for forskjellige STAR-elementer ved standard rekombinante DNA-teknikker (Sambrook etal., 1989). Plasmidene transfiseres inn i U-2 OS-celler, og ekspresjonen av reportergen bedømmes. SINC-dominans manifesterer seg i en lavere ekspresjon enn i plasmidet med bare et STAR-element, mens STAR-dominans manifesterer seg i en høyere ekspresjon enn i plasmidet med bare et SINC-element.
Innføring av bindingsseter for andre DNA- bindende proteiner til STAR- og SINC-elementer for å tilføye nve egenskaper ( f. eks. induserbarhet, vevspesifisiteU
Bakgrunn: Regulerbare STAR- og SINC-elementer dannes ved å kombinere dem med bindingsseter for singalavhengige DNA-bindende proteiner. I ett eksempel ville dette omfatte å stille et STAR- eller SINC-element eller en STAR/SINC-kombinasjon ved siden av et glukokortikoid-responselement (GRE). I fravær av glukokortikoid stimulering ville STAR- eller SINC-elementet fungere slik det er blitt beskrevet. Etter stimulering bindes den naturlig forekommende glukokortikoid-receptor til GRE og forstyrrer STAR- eller SINC-funksjonen.
Protokoll: Ved brukav konvensjonell DNA-kloning (Sambrook etal., 1989) innføres et GRE i pSelect- eller pSS-vektor ved siden av henholdsvis STAR- eller SINC-elementer. Plasmidet transfiseres inn i U-2 OS-celler slik det ble beskrevet ovenfor. Cellene deles opp i to kulturer; den éne behandles med glukokortikoid (10^M). Ekspresjonen av reportergenet måles og sammenlignes for de to kulturer. Forskjel-ler i ekspresjonen demonstrerer evnen til å regulere STAR- og SINC-funksjonen ved innvirkningen av et signal-avhengig DNA-bindingsprotein.
Uspesifikke STAR- og SINC- elementer: Testing eller forsterkning av disse egenskaper omfatter dyrking i forskjellige cellelinjer og langvarig dyrking uten antibiotisk seleksjon (eksemplene 8 og 10).
Eksempel 10: STAR- og SINC- elementer fjerner behovet for kontinuerlig seleksjon for å vedlikeholde transgenet
Bakgrunn: I transgenese har avhengigheten av seleksjonsmarkører to ulemper: se-leksjonsmidlet er vanligvis dyrt og bærer en metabolsk kostnad til cellene, og det finnes regulatoriske og etiske innvendninger mot å innlemme selekterbare markø-rer i transgene anvendelser, spesielt hvis transgenet i og for seg befinner seg i produktet (f.eks. avlingsplanter, genterapivektorer). STAR- og SINC-elementer nedsetter eller fjerner behovet for å bevare seleksjon etter etablering av det transgene isolat. Dermed kan resistensgenet fjernes fra det transgene genom ved sete-spesifikk rekombinasjon, med et nedsatt tap av transgen-ekspresjon.
Protokoll: Stabilt transfiserte U-2 OS-cellelinjer som inneholder kromosomalt integrerte STAR-elementer som flankerer reportergener, produseres ved kotransfeksjon av pSDH-plasmidet med et trans-virkende antibiotisk resistensplasmid slik det ble beskrevet ovenfor. Eksperimentet omfatter å teste stabiliteten av reportergen ets ekspresjonsnivå i disse cellelinjer under forlenget (3-6 måneder) dyrking i fravær av seleksjon. Dette testes med STAR-elementer som flankerer luciferase- eller GFP-reportergener i pSDH-plasmider. Genet for antibiotisk resistens fjernes ved å konst-ruere et ekspresjonsplasmid (basert på pSDH) hvor den antibiotiske seleksjonsmar- kør flankeres av rekombinase-målseter. Den selekterbare markør skjæres deretter ut ved rekombinase-aktivitet, slik det ble beskrevet ovenfor (eksempel 2).
Eksempel 11: Forutsigbarhet oa utbytte forbedres ved anvendelse av STAR-elementer i ekspresjonssystemer
STAR-elementer fungerer slik at de blokkerer virkningene av transkripsjonene un-dertrykkelsesinnvirkninger på transgene ekspresjonsenheter. Disse represjons-innvirkninger kan skyldes heterokromatin ("posisjonsvirkninger", Biovin og Dura, 1998) eller hosliggende kopier av transgenet ("gjentakelses-indusert genforstum-ning", Garrick etal., 1998)). To av fordelene med STAR-elementer for heterolog proteinproduksjon er en hevet forutsigbarhet for å finne høyt uttrykkende primære rekombinante vertceller, og et hevet utbytte under produksjonssykluser. Disse fordeler illustreres i dette eksempel.
Materialer og metoder
Konstruksjon av pSDH- vektorene og de STAR- holdige derivater: pSDH-Tet-vektor ble konstruert ved polymerasekjedereaksjons-amplifikasjon (PCR) av luciferasets åpne leseramme fra plasmid pREP4-HSF-Luc (van der Vlag etal., 2000) ved bruk av primerne C67 og C68 (alle PCR-primere og mutagene oligonukleotider er oppført i tabell 5), og innføyelse av SacII/BamHI-fragment i SacII/BamHI-spaltet pUHD10-3 (Gossen og Bujard, 1992). Luciferase-ekspresjonsenheten ble gjen-amplifisert med primerne C65 og C66, og gjen-innføyd i pUHD10-3 for å flankere den med to multiple kloningsseter (MCSI og MCSII). Et Ascl-sete ble deretter inn-ført i MCSI ved spaltning med EcoRI og innføyelse av et bindeledd (omfattende kombinerte oligonukleotider D93 og D94). CMV-promoter ble amplifisert fra plasmid pCMV-Bsd (Invitrogen K510-01) med primerne D90 og D91, og brukt til å erstatte Tet-Off-promoter i pSDH-Tet ved Sall/SacII-spaltning og ligering for å danne vektoren pSDH-CMV. Luciferasens åpne leseramme i denne vektor ble erstattet med SEAP (Secreted Alkaline Phosphatase) som følger: Vektoren pSDH-CMV ble spaltet med SacII og BamHI og gjort butt; SEAP's åpne leseramme ble isolert fra pSEAP-basic (Clontech 6037-1) ved EcoRI/Sall-spaltning, gjort butt og ligert inn i pSDH-CMV for å danne vektoren pSDH-CS. Puromycin-resistensgenet under styringen av SV40-promoter ble isolert fra plasmidet pBabe-Puro (Morgenstern og Land, 1990) ved PCR, ved bruk av primerne C81 og C82. Dette ble ligert inn i vektoren pGL3-control (BamHI-setet fjernet) (Promega E1741) som var blitt spaltet med Ncol/Xbal, for å danne pGL3-puro. pGL3-puro ble spaltet med Bglll/Sall for å isole re SV40-puro-resistensgenet, som ble gjort butt og ligert inn i Nhel-spaltet, butt-endet pSDH-CS. Den dannede vektor, pSDH-CSP, vises på fig. 7. Alle kloningstrinn ble utført ved å følge anvisningene som gis av reagensmidlenes produsenter, i henhold til metoder som er kjent innen faget (Sambrook etal., 1989).
STAR-elementer ble innføyd i MCSI og MCSII i to trinn, ved spaltning av STAR-elementet og pSDH-CSP-vektor med et egnet restriksjonsenzym, fulgt av ligering. Retningen av STAR-elementene i de rekombinante pSDH-vektorer ble bestemt ved restriksjonskartlegging. Identiteten og retningen av innføyelsene ble verifisert ved DNA-sekvensanalyse. Sekvensiering ble utført ved dideoksy-metoden (Sanger et al., 1977) ved bruk av en Beckman CEQ2000 automatisert DNA-sekvensator, i henhold til produsentens anvisninger. Kort sagt ble DNA isolert fra E. coil ved bruk av QIAprep Spin Miniprep-settet og Plasmid Midi-settet (henholdsvis QIAGEN 27106 og 12145). Cyklus-sekvensiering ble utført ved bruk av skreddersydde oligonukleotider C85, E25 og E42 (tabell 5) i nærvær av farge-terminatorer (CEQ Dye Terminator Cycle Sequencing Kit, Beckman 608000).
Transfeksjon og dyrking av CHO- celler med pSDH- plasmider: Kinesisk hamster-ovariecellelinjen CHO-K1 (ATCC CCL-61) ble dyrket i Hams F12-medium + 10% føtalt kalveserum inneholdende 2 mM glutamin, 100 U/ml penicillin og 100 ng/ml streptomycin ved 37°C/5% C02. Cellene ble transfisert med pSDH-CSP-vektor, og dens derivater som inneholdt STAR6 eller STAR49 i MCSI og MCSII, ved bruk av SuperFect (QIAGEN) slik produsenten beskriver. Kort sagt ble celler poded i kultur-beholdere og dyrket over natten til 70-90% konfluens. SuperFect-reagensmiddel ble slått sammen med plasmid-DNA (linearisert i dette eksempel ved spaltning med Pvul) i forholdet 6 \ i\/\ ig (f.eks. 20 \ ig DNA og 120^1 SuperFect for en 10 cm Petri-skål) og tilført til cellene. Etter inkubasjon over natten ble transfeksjonsblandingen erstattet med ferskt medium, og de transfiserte celler ble ytterligere inkubert. Etter dyrking over natten tilsatte man 5ng/ml puromycin. Puromycin-seleksjonen var fullført etter 2 uker, hvoretter enkelte tilfeldig valgte puromycin-resistente CHO/pSDH-CSP-kloner ble isolert og dyrket videre.
Utsondret alkalifosfatase- assav ( Secreted Alkaline Phos<p>hatase, SEAP): SEAP-aktiviteten (Berger et al., 1988; Henthorn et al., 1988; Kain, 1997; Yang etal., 1997) i kulturmediet av CHO/pSDH-CSP-kloner ble bestemt slik produsenten beskriver (Clontech Great EscAPe kit nr. K2041). Kort sagt ble en alikvot medium var-me-inaktivert ved 65°C og deretter slått sammen med assaybuffer og CSPD-kjemiluminescent substrat og inkubert ved romtemperatur i 10 minutter. Raten av substrat-konversjon ble deretter bestemt i et luminometer (Turner 20/20TD). Celle-tettheten ble bestemt ved å telle trypsiniserte celler i en Coulter ACTlO-celleteller.
Transfeksjon oa dyrking av U- 2 OS- celler med pSDH- plasmider: Human osteosarkoma U-2 OS-cellelinje (ATCC nr. HTB-96) ble dyrket i Dulbeccos modifiserte Eagle-medium + 10% føtalt kalveserum som inneholdt glutamin, penicillin og streptomycin ( supra) ved 37°C/5% C02. Cellene ble ko-transfisert med pSDH-CMV-vektor, og dens derivater som inneholdt STAR6 eller STAR8 i MCSI og MCSII (sammen med plasmidet pBabe-Puro), ved bruk av SuperFect ( supra). Puromycin-seleksjonen var fullført etter 2 uker, hvoretter enkelte tilfeldig valgte puromycin-resistente U-2 OS/pSDH-CMV-kloner ble isolert og dyrket videre.
Luciferase- assav: Luciferase-aktiviteten (Himes og Shannon, 2000) ble testet i re-suspenderte celler i henhold til anvisningene fra produsenten av assay-settet (Roche 1669893), ved bruk av et luminometer (Turner 20/20TD). Den samlede cellulære proteinkonsentrasjon ble bestemt ved bicinchoninsyre-metoden i henhold til produsentens anvisninger (Sigma B-9643) og brukt til å normalisere luciferase-dataen.
Resultater
Rekombinante CHO-cellekloner som inneholdt pSDH-CSP-vektor, eller pSDH-CSP-plasmider som inneholdt STAR6 eller STAR49 (tabell 6), ble dyrket i 3 uker. SEAP-aktiviteten i kultur-supernatantene ble deretter bestemt, og uttrykkes på grunnlag av celleantallet (fig. 8). Slik det fremgår, isolerte man kloner med STAR-elementer i ekspresjonsenhetene som uttrykte en 2-3 ganger høyere SEAP-aktivitet enn kloner hvis ekspresjonsenhet ikke omfattet STAR-elementer. Videre var antallet STAR-holdige kloner som uttrykte SEAP-aktivitet ved eller over den maksimale aktivitet av STAR-løse kloner, nokså høyt: 25-40% av STAR-klon-populasjonene overskred den høyeste SEAP-ekspresjon av pSDH-CSP-klonene.
Rekombinante U-2 OS-celler som inneholdt pSDH-CMV-vektor, eller pSDH-CMV-plasmider som inneholdt STAR6 eller STAR8 (tabell 6), ble dyrket i 3 uker. Luciferase-aktiviteten i vertcellene ble deretter bestemt og uttrykt som relative luciferase-enheter (fig. 9), normalisert til samlet celleprotein. De rekombinante U-2 OS-kloner med STAR-elementer som flankerte ekspresjonsenhetene, hadde høyere utbytte enn de STAR-løse kloner: den høyeste ekspresjon som ble observert fra STAR8-kloner, var 2-3 ganger høyere enn ekspresjonen fra STAR-løse kloner. STAR6-klonene hadde et maksimalt ekspresjonsnivå som var 5 ganger høyere enn i de STAR-løse kloner. STAR-elementene formidlet også en større forutsigbarhet: for begge STAR-elementer oppviste 15 til 20% av klonene luciferaseekspresjon på et nivå som var sammenlignbart eller høyere enn for den STAR-løse klon med høyest ekspresjonsnivå.
Disse resultater demonstrerer at når de brukes sammen med den sterke CMV-promoter, hever STAR-elementene utbyttet av heterologt protein (luciferase og SEAP). Alle tre STAR-elementer som ble innført i dette eksempel, gir hevet utbytte. Den hevede forutsigbarhet som formidles av STAR-elementene, manifesterer seg i den store andel av kloner som har like høyt eller høyere utbytte enn det høyeste utbytte fra de STAR-løse kloner.
Eksempel 12: STAR- elementer forbedrer stabiliteten av transqen- ekspresionen
Under dyrking av rekombinante vertceller er det vanlig praksis å beholde antibiotisk seleksjon. Dette skal forhindre transkripsjonen forstumning av transgenet, eller tap av transgenet fra genomet ved prosesser så som rekombinasjon. Imidlertid er det uønskelig for produksjon av heterologe proteiner, av forskjellige grunner. For det første er antibiotikaene som brukes, nokså dyre og bidrar sterkt til enhetskostnaden for produktet. For det andre må proteinet, for biofarmasøytisk bruk, være de-monstrerbart rent, uten spor av antibiotikaen i produktet. Én fordel med STAR-elementer for heterolog proteinproduksjon er at de formidler en stabil ekspresjon av transgener under forlenget dyrking, selv i fravær av antibiotisk seleksjon, og denne egenskap demonstreres i dette eksempel.
Materialer og metoder
U-2 OS-cellelinjen ble transfisert med plasmidet pSDH-Tet-STAR6 og dyrket slik det ble beskrevet i eksempel 11. Individuelle puromycin-resistente kloner ble isolert og dyrket ytterligere i fravær av doxocyklin. I 1-ukes intervaller ble cellene overført til ferske kulturskåler i fortynningen 1:20. Luciferase-aktiviteten ble målt i periodiske intervaller slik det ble beskrevet i eksempel 11. Etter 15 uker ble kulturene delt opp i to replikater: ett replikat fikk fortsatt puromycin, mens det andre replikat ikke fikk noe antibiotika i resten av eksperimentet (tilsammen 25 uker).
Resultater
Tabell 7 presenterer data om luciferase-ekspresjonen av en ekspresjonsenhet som flankeres med STAR6, under forlenget vekst med eller uten antibiotika. Slik det fremgår, forblir ekspresjonen av reporter-transgenet, luciferase, stabil i US-2 OS-vertcellene over hele eksperimentets varighet. Etter at kulturene ble delt opp i to behandlingsgrupper (plus antibiotika og uten antibiotika), var ekspresjonen av luciferase i det vesentlige stabil i fravær av antibiotisk seleksjon. Dette demonstrerer STAR-elementets evne til å beskytte transgener mot forstumning eller tap under forlenget dyrking. Det demonstrerer også at denne egenskap er uavhengig av antibiotisk seleksjon. Dermed er det mulig å produsere heterologe proteiner uten å på-dra seg kostnadene for det antibiotiske middel, eller vanskelig nedstrøms pro-sessering.
Eksempel 13: Minste uunnværlige sekvens av STAR- elementer
STAR-elementer isoleres fra den genetiske test som ble beskrevet i eksempel 1. Testen benytter seg av biblioteker konstruert med humant genomisk DNA som ble størrelses-fraksjonert til ca. 0,5-2 kilobaser ( supra). STAR-elementene varierer fra 500 til 2.361 basepar (tabell 6). For mange av de isolerte STAR-elementer er det sannsynlig at STAR-aktiviteten formidles av et mindre DNA-fragment enn den opprinnelig isolerte klon. Det er nyttig å bestemme disse minste uunnværlige frag-mentstørrelser som er uunnværlige for STAR-aktiviteten, av to grunner. For det første ville mindre, funksjonelle STAR-elementer være fordelaktige ved utvikling av kompakte ekspresjonsvektorer, ettersom mindre vektorer transfiserer vertcellene mer virksomt. For det andre ville en bestemmelse av den minste uunnværlige STAR-sekvens muliggjøre en modifikasjon av disse sekvenser for å oppnå en for-sterket funksjon. To STAR-elementer er blitt fin-kartlagt for å bestemme deres minste uunnværlige sekvens.
Materialer og metoder
STAR10 (1.167 basepar) og STAR27 (1.520 basepar) er blitt fin-kartlagt. De er blitt amplifisert ved PCR for å gi delfragmenter med omtrent lik lengde (tegnforklaring,
fig. 10). Forden opprinnelige testing ble disse klonet inn i pSelect-vektor ved BamHI-setet, og transfisert inn i U-2 OS/Tet-Off/LexA-HPl-celler slik det ble beskrevet i eksempel 1. Etter seleksjon i henhold til hygromycin-resistensen, ble LexA-HPl inn-ført ved å senke doxocyklin-konsentrasjonen. Transfiserte celler ble deretter inku-
bert med zeocin for å teste evnen av STAR-f rag mentene til å beskytte SV40-Zeo-ekspresjonsenheten mot undertrykkelse som skyldtes LexA-HPl-binding.
Resultater
I dette eksperiment gir STAR10 og STAR27 god beskyttelse mot gen-forstumning, slik man forventet (fig. 10). Dette manifesterer seg i en robust vekst i nærvær av zeocin.
Av de 3 STARlO-delf rag menter, formidler 10A (ca. 400 basepar) en kraftig vekst av de transfiserte celler i nærvær av zeocin, som overskrider veksten av celler transfisert med hellengdes STAR-element. Celler som er blitt transfisert med pSelect - konstruksjoner som inneholder de andre 2 delfragmenter, vokser ikke nærvær av zeocin. Med disse resultater kunne man identifisere at de ca. 400 basepar som forelå i 10A-fragmentet, omfattet DNA-sekvensen som er ansvarlig for den anti-undertrykkende aktivitet av STAR10.
STAR27 gir moderat vekst i zeocin til transfiserte celler i dette eksperiment (fig. 10). Ett av delfragmentene av denne STAR, nemlig 27B (ca. 500 basepar), tillater en svak vekst av vertcellene i zeocin-holdig medium. Dette tyder på at den anti-undertrykkende aktivitet av denne STAR delvis er plassert på delfragment 27B, men at en fullstendig aktivitet krever sekvenser fra 27A og/eller 27C (hver ca. 500 basepar) også.
Eksempel 14: STAR- elementer fungerer i forskjellige stammer av dyrkede pattedyrceller
Valget av vertcellelinje for heterolog proteinekspresjon er en avgjørende parameter for kvaliteten, utbyttet og enhetskostnaden av proteinet. Betraktninger så som post-translasjonelle modifikasjoner, sekretorisk bane-kapasitet og cellelinjens udø-delighet bestemmer den egnede cellelinje for et bestemt biofarmasøytisk produk-sjonssystem. Av denne grunn skulle fordelene som tilveiebringes av STAR-elementene hva angår utbytte, forutsigbarhet og stabilitet, kunne oppnås i forskjellige cellelinjer. Dette ble testet ved å sammenligne funksjonen av STAR6 i humane U-2 OS-cellelinje, som den opprinnelig ble klonet i, og CHO-cellelinjen, som er omfattende brukt innen bioteknologien.
Materialer oa metoder
Det vises til eksperimentene i eksempel 11.
Resultater
Ekspresjonen av SEAP-reportergenet i CHO-celler presenteres på fig. 8; ekspresjonen av luciferase-reportergenet i U-2 OS-celler presenteres på fig. 9. Sammenligning av resultatene fra disse to eksperimenter viser at STAR6-elementet er funksjonelt i begge cellelinjer: reportergen-ekspresjonen var mer forutsigbar i begge cellelinjene, og kloner av begge cellelinjer oppviste et høyere utbytte når reportergenet var skjermet fra posisjonseffekter med STAR6. Disse to cellelinjer er avledet fra forskjellige arter (menneske og hamster) og forskjellige vevtyper (ben og ovarie), hvilket gjenspeiler det brede spekter av vertceller i hvilke dette STAR-element kan benyttes for å forbedre ekspresjonen av heterologt protein.
Eksempel 15: STAR- elementer fungerer i sammenheng med forskjellige transkripsjonene promotere
Transgen-transkripsjon oppnås ved å plassere transgenets åpne leseramme under styring av en eksogen promoter. Valget av promoter bestemmes av naturen av det heterologe protein og produksjonssystemet. I de fleste tilfeller anbefales sterke iboende promotere på grunn av at de kan tilveiebringe høye utbytter. Enkelte virale promotere har disse egenskaper: promoter/forsterker av cytomegalovirus' umid-delbare tidlige gen ("CMV-promoter") anses å være den sterkeste promoter for vanlig bioteknologisk bruk (Boshart etal., 1985; Doll etal., 1996; Foecking og Hofstetter, 1986). Ape-virus-SV40-promoter er også moderat sterk (Boshart et al.,
1985; Foecking og Hofstetter, 1986) og brukes ofte for ektopisk ekspresjon i pattedyr-cellevektorer. Tet-Off-promoter er induserbar: promoteren undertrykkes i nærvær av tetracyklin eller beslektede antibiotika (vanligvis brukes doxocyklin) i cellelinjer som uttrykker tTA-plasmid (Clontech K1620-A), og fjerning av det antibiotiske middel fører til induksjon av transkripsjon (Deuschle etal., 1995; Gossen og Bujard, 1992; Izumi og Gilbert, 1999; Umana etal., 1999).
Materialer og metoder
Konstruksjon av pSDH-Tet- og pSDH-CMV-vektor beskrives i eksempel 11. pSDH-SV40 ble konstruert ved PCR-amplifikasjon av SV40-promoter (primerne D41 og
D42) fra plasmidet pSelect-SV40-Zeo (eksempel 1), fulgt av spaltning av PCR-produktet med SacII og Sali. pSDH-CMV-vektor ble spaltet med SacII og Sali for å fjerne CMV-promoter, og vektoren og SV40-fragmentet ble ligert sammen for å danne pSDH-SV40. STAR6 ble klonet inn i MCSI og MCSII slik det ble beskrevet i eksempel 11. Plasmidene pSDH-Tet, pSDH-Tet-STAR6, pSDH-Tet-STAR7, pSDH-SV40 og pSDH-SV40-STAR6 ble ko-transfisert med pBabe-Puro inn i U-2 OS ved bruk av SuperFect, i henhold til produsentens anvisninger. Celledyrking, puromycin-seleksjon og luciferase-assayer ble utført slik det ble beskrevet i eksempel 11.
Resultater
Fig. 9, 11 og 12 sammenligner ekspresjonen av luciferase-reportergen fra 3 forskjellige promotere: to sterke og iboende virale promotere (CMV og SV40) og den induserbare Tet-Off-promoter. Alle tre promotere ble testet i sammenheng med
STAR6-elementet i U-2 OS-celler. Resultatene demonstrerer at utbyttet og forutsigbarheten fra alle 3 promotere heves av STAR6. Slik det ble beskrevet i eksemplene 11 og 14, er STAR6 fordelaktig i sammenheng med CMV-promoter (fig. 9). Lignende forbedringer observeres i sammenheng med SV40-promoter (fig. 11): utbyttet fra den høyest uttrykkende STAR6-klon er 2-3 ganger høyere enn for de beste pSDH-SV40-kloner, og 6 STAR-kloner (20% av populasjonen) har høyere utbytte enn de beste STAR-løse kloner. I sammenheng med Tet-Off-promoter under induserende (lavt doxocyklin-holdige) konsentrasjoner, forbedrer STAR6 også utbyttet og forutsigbarheten av transgen-ekspresjonen (fig. 12): den høyest uttrykkende STAR6-klon hadde et 20 ganger høyere utbytte enn den beste pSDH-Tet-klon, og 9 STAR6-kloner (35% av populasjonen) hadde høyere utbytte enn den beste STAR-løse klon. Det konkluderes med at dette STAR-element er mangesidig i sine transgen-beskyttende egenskaper, ettersom det fungerer i sammenheng med forskjellige bioteknologisk nyttige transkripsjonspromotere.
Eksempel 16: STAR- elementets funksjon kan være retninasavhenaia
Mens korte nukleinsyresekvenser kan være symmetriske (f.eks. "palindromic"), er lengre naturlig forekommende sekvenser vanligvis asymmetriske. Som et resultat er informasjonsinnholdet i nukleinsyresekvensen retningsavhengig, og sekvensene i og forseg kan beskrives med hensyn til deres 5'- og 3'-ende. Retningsavhengighe-ten av nukleinsyresekvensinformasjonen påvirker plasseringen som rekombinante DNA-molekyler settes sammen i ved bruk av standard kloningsteknikker som er kjent innen faget (Sambrook et al., 1989). STAR-elementer er lange, asymmetriske DNA-sekvenser og har en retningsavhengighet basert på i hvilken retning de opprinnelig ble klonet inn i pSelect-vektor. I eksemplene ovenfor som benyttet seg av to STAR-elementer i pSDH-vektorer, bevarte man denne retning. Denne retning beskrives som den native eller 5'-3'-retning, i forhold til zeocin-resistens-gen (se fig. 13). I dette eksempel testes betydningen av retningen for STAR-funksjonen i pSDH-Tet-vektor. Ettersom reportergenene i pSDH-vektorene flankeres på hver side av kopier av det aktuelle STAR-element, må retningen av hver STAR-kopi be-traktes. Dette eksempel sammenligner den native retning med motsatt retning (fig. 13).
Materialer og metoder
STAR66-elementet ble klonet inn i pSDH-Tet slik det ble beskrevet i eksempel 11. U-2 OS-celler ble ko-transfisert med plasmidene pSDH-Tet-STAR66-nativ og pSDH-Tet-STAR66-omvendt, og dyrket slik det ble beskrevet i eksempel 11. Enkelte kloner ble isolert og dyrket; nivået av luciferase-ekspresjonen ble bestemt slik det ble beskrevet ( jsupra).
Resultater
Resultatene av sammenligningen av STAR66-aktiviteten i den native retning og omvendt retning vises på fig. 14. Når STAR66 står i omvendt retning, er kun utbyttet fra én klon noenlunde høyt (60 luciferase-enheter). Derimot er utbyttet av den høyest uttrykkende klon betraktelig høyere når STAR66 står i nativ retning (100 luciferase-enheter), og forutsigbarheten er også meget bedre: 7 kloner av nativ-retning-populasjonen (30%) uttrykker et høyere nivå av luciferase enn den høyest uttrykkende klon fra den omvendt rettede populasjon, og 15 av klonene i nativ-retning-populasjonen (60%) uttrykker luciferase høyere enn 10 relative luciferase-enheter. Dermed er det demonstrert at STAR66-funksjonen er retningsavhengig.
Eksempel 17: Transgen- ekspresion i sammenheng med STAR- elementer er kopiantall- avhengig
Transgen-ekspresjonsenheter for heterolog proteinekspresjon integreres generelt inn i genomet av vertcellen for å sikre en stabil bevaring under celledelingen. Integrasjonen kan føre til at én eller flere kopier av ekspresjonsenheten innføyes i genomet; flere kopier kan, men behøver ikke, foreligge som tandem-grupperinger. Det hevede utbytte som ble demonstrert for transgener som var beskyttet med STAR-elementer ( supra), tyder på at STAR-elementer har evnen til å gjøre det mulig for transgen-ekspresjonsenhetene å fungere uavhengig av innflytelsen på transkripsjonen som forbindes med integrasjonssetet i genomet (uavhengighet av posisjonseffekter (Boivin og Dura, 1998)). Det tyder dessuten på at STAR-elementene tillater hver ekspresjonsenhet å fungere uavhengig av nabo-kopier av ekspresjonsenheten når de er integrert som en tandem-gruppering (uavhengig av gjentakelses-indusert gen-forstumning (Garrik et al., 1998)). Kopiantall-avhengighet bestemmes av forholdet mellom transgen-ekspresjonsnivået og kopi-antallet, slik det skal beskrives i det følgende eksempel.
Materialer og metoder
U-2 OS-celler ble ko-transfisert med pSDH-Tet-STAR10 og dyrket under puromycin-seleksjon slik det ble beskrevet ( jsupra). Åtte enkelte kloner ble isolert og dyrket ytterligere. Deretter ble cellene samlet, og én del ble testet for luciferase-aktivitet slik det ble beskrevet ( jsupra). De øvrige celler ble løst opp, og det genomiske DNA ble renset ved bruk av DNeasy Tissue Kit (QIAGEN 69504) i henhold til produsentens anvisninger. DNA-prøver ble kvantifisert ved UV-spektrofotometri. 3^g av hver genomiske DNA-prøve ble spaltet med PvuII og Xhol over natten i henhold til produsentens anvisninger (New England Biolabs), og adskilt ved agarosegel-elektroforese. DNA-fragmenter ble overført til en nylon-membran slik det er blitt beskrevet (Sambrook etal., 1989) og hybridisert med en radioaktivt merket probe på luciferase-genet (isolert fra BamHI/SacII-spaltet pSDH-Tet). Blotten ble vasket som beskrevet (Sambrook etal., 1989) og underkastet en fosfor-imager-test (Personal F/X, BioRad). Det resulterende autoradiogram (fig. 15) ble analysert ved densitometri for å bestemme den relative styrke av luciferase-DNA-bånd, som representerer transgen-kopiantallet.
Resultater
Enzymaktiviteten og kopi-antallet (DNA-bånd-intensiteten) av luciferase i klonene fra pSDH-Tet-STAR10-klon-populasjonen vises på fig. 16. Transgen-kopiantallet korrelerer sterkt med nivået av luciferase-ekspresjonen i disse pSDH-Tet-STAR10-kloner (r = 0,86). Dette tyder på at STAR10 formidler kopiantall-avhengighet til transgen-ekspresjonsenhetene og gjør transgen-ekspresjonen uavhengig av andre transgen-kopier i tandem-grupperinger, og uavhengig av gen-forstummende innvirkninger ved integrasjonssetet.
Eksempel 18: STAR- elementer fungerer som forsterkninas- blokkerere, men ikke forsterkere
Gen-promotere utsettes for både positive og negative innvirkninger på sin evne til å initiere transkripsjon. En viktig klasse av elementer som utøver positive innflytelser, er forsterkere. Forsterkere har en karakteristisk evne til å påvirke promotere selv når de er plassert langt unna (flere kilobase-par) promoteren. Negative innflytelser som virker ved heterokromatin-dannelse (f.eks. Polycomb-gruppe-proteiner) er blitt beskrevet ovenfor, og disse er målet for STAR-aktiviteten. Det biokjemiske grunnlag for forsterker-funksjonen og for heterokromatin-dannelse er fundamentalt like, ettersom de begge omfatter binding av proteiner til DNA. Det er derfor viktig å bestemme om STAR-elementer har evnen til å blokkere både positive innflytelser og negative innflytelser, med andre ord å skjerme transgener mot genomiske forsterkere i nærheten av integrasjonssetet. Evnen til å skjerme transgener mot forster-keraktivitet sikrer en stabil og forutsigbar ytelse av transgener i bioteknologiske anvendelser. Dette eksempel undersøker ytelsen av STAR-elementer i et forsterker-blokkerings-assay.
Et annet trekk av STAR-aktiviteten som er viktig for deres funksjon, er det hevede utbytte av transgener som de formidler (eksempel 11). STAR'ene isoleres på grunnlag av deres evne til å vedlikeholde høye nivåer av zeocin-ekspresjon når heterokromatin-dannende proteiner er bundet ved siden av kandidat-STAR-elementene. En høy ekspresjon forventes å finne sted fordi STAR-elementene forventes å blokkere spredningen av heterokromatin inn i zeocin-ekspresjonsenheten. Imidlertid er et annet scenarium at DNA-f rag mentene i zeocin-resistente kloner inneholder forsterkere. Forsterkere har vist seg å ha evnen til å overvinne de undertrykkende virkninger av Polycomb-gruppe-proteiner, så som dem som ble brukt i metoden for STAR-testen (Zink og Paro, 1995). Forsterkere som isoleres på grunnlag av dette fenomen, ville anses å være falske positiver, ettersom forsterkere ikke har egenskapene som det heri hevdes at STAR-elementer har. For å demonstrere at STAR-elementer ikke er forsterkere, er de blitt testet i et forsterker-assay.
Det forsterker-blokkerende assay og forsterker-assayet er lignende med hensyn til metode og konsept. Assayene vises skjematisk på fig. 17. Evnen av STAR-elementer til å blokkere forsterkere utføres ved bruk av E47/E-box-forsterker-systemet. E47-protein har evnen til å aktivere transkripsjon av promotere når det er bundet til en E-box-DNA-sekvens plassert i nærheten av disse promotere (Quong etal., 2002). E47 er normalt omfattet i reguleringen av B- og T-lymfocytt- differensieringen (Quong etal., 2002), men har evnen til å fungere i forskjellige celletyper når det uttrykkes ektopisk (Petersson etal., 2002). E-box er en pa-lindrom DNA-sekvens, CANNTG (Knofler etal., 2002). I forsterker-blokkerings-assayet plasseres en E-box oppstrøms for et luciferase-reportergen (omfattende en minimal promoter) i en ekspresjonsvektor. Et kloningssete for STAR-elementer plasseres mellom E-box og promoteren. E47-protein kodes for på et andre plasmid. Assayet utføres ved å transfisere både E47-plasmidet og luciferase-ekspresjonsvektoren inn i cellene; E47-protein uttrykkes og bindes til E-box, og E47/E-box-komplekset kan fungere som forsterker. Når luciferase-ekspresjonsvektoren ikke inneholder noe STAR-element, forsterker E47/E-box-komplekset luciferase-ekspresjonen (fig. 17A, situasjon 1). Når STAR-elementer innføyes mellom E-box og promoteren, demonstreres deres evne til å blokkere forsterkeren av en nedsatt ekspresjon av luciferase-aktivitet (fig. 17A, situasjon 2); hvis STAR ikke kan blokkere forsterkere, aktiveres luciferase-ekspresjonen (fig. 17A, situasjon 3).
Evnen av STAR-elementer til å fungere som forsterkere, benytter seg av den samme luciferase-ekspresjonsvektor. I fravær av E47, bevirker E-box i og for seg ingen transkripsjon. Istedenfor vil forsterker-oppførselen av STAR-elementene føre til en aktivering av luciferase-transkripsjon. Assayet utføres ved å transfisere luciferase-ekspresjonsvektoren uten E47-plasmidet. Når ekspresjonsvektoren ikke inneholder noen STAR-elementer, er luciferase-ekspresjonen lav (fig. 17B, situasjon 1). Hvis STAR-elementene ikke har noen forsterker-egenskaper, er luciferase-ekspresjonen lav når et STAR-element foreligger i vektoren (fig. 17B, situasjon 2). Hvis STAR-elementer har forsterker-egenskaper, vil luciferase-ekspresjonen være aktivert i de STAR-holdige vektorer (fig. 17B, situasjon 3).
Materialer oa metoder
Luciferase-ekspresjonsvektoren ble konstruert ved å innføye E-box og en human alkalifosfatase-minimal promoter fra plasmidet mu-E5+E2x6-cat(x) (Ruezinsky et al., 1991) oppstrøms for luciferase-genet i plasmidet pGL3-basic (Promega E1751), for å danne pGL3-E-box-luciferase (gave fra W. Romanow). E47-ekspresjonsplas-midet inneholder åpen leseramme fra E47, styrt av en beta-aktin-promoter i pHBAPr-l-neo-plasmidet; E47 uttrykkes konstitutivt fra dette plasmid (gave fra W. Romanow).
STAR-elementene 1, 2, 3, 6, 10, 11, 18 og 27 er blitt klonet inn i luciferase-ekspresjonsvektoren. Kloner som inneholdt Drosop/7/7a-scs-element og kylling-beta-globin-HS4-6x-kjerne ("HS4")-elementer, ble tatt med som positiv-kontroll (de er kjent for å blokkere forsterkere og å ikke ha noen iboende forsterker-egenskaper (Chung etal., 1993; Kellum og Schedl, 1992)), og den tomme luciferase-ekspresjonsvektor er blitt innlemmet som negativ-kontroll. Alle assayer ble utført ved bruk av U-2 OS-cellelinjen. I forsterker-blokkerings-assayet ble E47-plasmidet ko-transfisert med luciferase-ekspresjonsvektorene (tom vektor eller inneholdende STAR eller positiv-kontroll-elementer). I forsterker-assayet ble E47-plasmidet ko-transfisert med STAR-løs luciferase-ekspresjonsvektor som positivkontroll for for-sterkeraktivitet; alle øvrige prøver inneholdt et blindprøve-plasmid under kotrans-feksjonen. De forbigående transfiserte celler ble testet for sin luciferase-aktivitet 48 timer etter plasmid-transfeksjonen ( jsupra). Luciferase-aktiviteten som ble uttrykt fra et plasmid som ikke inneholdt noen E-box- eller STAR/kontroll-elementer, ble trukket fra, og luciferase-aktivitetene ble normalisert for protein-innholdet slik det ble beskrevet ( supra).
Resultater
Fig. 18 viser resultatene av forsterker-blokkerings-assayet. I fravær av STAR-elementer (eller de kjente forsterker-blokkerende elementer ses og HS4), aktiverer E47/E-box-forsterkerkompleks ekspresjonen av luciferase ("vektor"); dette forster-kede ekspresjonsnivå er blitt normalisert til 100. Forsterker-aktiviteten blokkeres av alle de testede STAR-elementer. Forsterker-aktiviteten blokkeres også av HS4-og scs-elementene, som ventet (Bell etal., 2001; Gerasimova og Corces, 2001). Disse resultater demonstrerer at i tillegg til deres evne til å blokkere spredningen av transkripsjonen forstumning (negative innflytelser), har STAR-elementer evnen til å blokkere virkningen av promotere (positive innflytelser). Fig. 19 viser resultatene av forsterker-assayet. Nivået av luciferase-ekspresjon som skyldes E47/E-box-kompleksets forsterkning, settes til 100 ("E47"). Sammenlignet med dette, tilveiebringer ingen av STAR-elementene noen vesentlig aktivering av luciferase-ekspresjonen. Som forventet, tilveiebringer heller ikke ses- eller HS4-elementene noen aktivering av reportergenet. Derfor konkluderer man med at i det minste de testede STAR-elementer ikke har noen forsterker-egenskaper.
Eksempel 19: Karakterisering av et forstumninas- induserende kromatin ( SINO-element
Materialer og metoder
De generelle trekk av SINC-testen ble beskrevet i eksempel 1, og enkelte trekk derav rekapituleres her. Én versjon av pSS-vektor som brukes for å teste SINC-elementer i genomisk DNA, er pSS-codA: :upp (fig. 20). Den består av suicid-gen-ekspresjonsenheten, flankert av to STAR6-elementer. Ekspresjonsenheten, bestående av codA: :upp-suicid-genet under styring av Tet-Off-promoter, er nedstrøms for et Bglll-restriksjonssete. En andre versjon av pSS-vektor, nemlig pSS-hrGFP (fig. 21), ble dannet ved å erstatte et STAR6-element med STAR8, og å erstatte suicid-genet med hrGFP-gen, som koder for grønt fluorescerende protein (Stratagene 240059). Humant genomisk DNA fra kromosom 22 (Research Genetics 96010-22) ble delvis spaltet med Sau3AI og størrelsesfraksjonert. Den 0,5 til 10 kilobasepar lange fraksjon ble ligert inn i Bglll-sete av pSS-codA::upp. Dette bibliotek representerte ca. 20.000 uavhengige kloner med en gjennomsnittlig innføyel-ses-størrelse på 1,2 kilobasepar. Biblioteket ble amplifisert i Escherichia coli. Det rensede DNA fra det amplifiserte bibliotek ble transfisert inn i U-2 OS/Tet-Off-celler (van der Vlag etal., 2000) ved standardteknikker (kalsiumfosfat; Life Technologies 18306-019). En kontroll-transfeksjon ble utført ved bruk av tom pSS-codA: :upp-vektor-DNA, hvilket gav 2.400 hygromycin-resistente kolonier. Transfiserte celler ble selektert på grunnlag av sin hygromycin-resistens (25 mg/ml) over et 3-ukers tidsrom med høy doxycyklin-konsentrasjon (10 ng/ml), og 1.800 hygromycin-resistente kolonier ble isolert fra bibliotek-transfeksjonen. Disse kolonier ble deretter inkubert med prodrogen 5-fluorcytosin (5-FC) i konsentrasjonen 1 mg/ml, med en tilføyelse av 5 mg/ml i 4 dager, ved doxocyklin-konsentrasjonen 10 ng/ml. Etter 3 uker hadde alle unntatt 3 svakt voksende kontroll-kolonier (transfisert med tom pSS-codA: :upp) dødd; 58 av de bibliotek-transfiserte kolonier overlevde. Disse kolonier fikk komme seg etter prodroge-behandlingen og ble dyrket ytterligere. De 5-FC-resistente isolater ble samlet, cellene ble løst opp og en andel av DNA'et ble underkastet PCR-amplifikasjon ved bruk av primerne D30 og D51 for å isolere SINC-elementene. PCR-produktene fra seks 5-FC-resistente kolonier ble klonet mellom Hindlll- og Xhol-sete av pBluescriptll SK(+)-plasmid (Stratagene 212207) med konvensjonelle metoder (Sambrook etal., 1989). DNA-sekvensene av kandidat-SINC-elementene ble bestemt slik det ble beskrevet ( jsupra) ved bruk av han-delstilgjengelige primere for pBluescript-vektor (Stratagene 300301 og 300302). Sekvensene av disse SINC-elementer presenteres i tabell 4B.
De 6 SINC-element-kandidater ble klonet inn i plasmidet pSS-hrGFP i sin native retning, og de dannede plasmider ble transfisert inn i U-2 OS/Tet-Off-celler. Etter seleksjon i henhold til hygromycin-resistensen, ble populasjonene av pSS-hrGFP-SINC-transfektanter dyrket ytterligere ved høy doxycyklin-konsentrasjon (10 ng/ml). Det samlede cellulære RNA ble ekstrahert ved bruk av RNeasy Mini Kit (QIAGEN 74104) i henhold til produsentens anvisninger. Northern blot-analyse av GFP-mRNA-overskuddet i disse populasjoner ble bedømt ved bruk av standardteknikker (Sambrook et al., 1989). GFP-proben var et BamHI-EcoRI-fragment som omfattet basepar 690 til 1419 i phrGFP-1. Blottene ble også testet for hygromycin-mRNA som kontroll for PSS-hrGFP-avledet plasmid-kopiantall, og for beta-aktin som kontroll for genomisk kodet mRNA-mengde. Hygromycin-proben var et Sful-Sall-fragment som strakk seg fra 8219-10144 i pREP4 (Invitrogen), og beta-aktin-proben var fra Clontech, nr. 9800-1. Etter hybridisering og vasking, ble blottene underkastet fosfor-imager-tester, og de radioaktive signaler ble synliggjort og kvantifisert ved bruk av en BioRad Personal F/X fosfor-imager.
Resultater
SINC-elementer som er klonet hosliggende GFP-reportergen, vil indusere forstumning av reportergen-transkripsjon, men vil ikke påvirke transkripsjonen av andre gener. En nøyaktig måling av SINC-aktiviteten drar nytte av dette faktum ved å bestemme ekspresjonen av GFP i forhold til ekspresjonen av to referanse-gener, istedenfor å helt enkelt måle den absolutte GFP-ekspresjon. Ett referanse-gen er hygromycin-resistensgen på pSS-hrGFP-plasmidet (utenfor domenet som defineres av STAR-elementene; fig. 21), og det andre er det genomiske beta-aktin-gen. SINC-aktiviteten kvantifiseres ved RNA-blot-analyse som et nedsatt forhold mellom GFP-signalet og hygromycin- og beta-aktin-signalene. Av kandidat-SINC-elementene som er blittkarakterisert, oppviser enkelte en betraktelig relativ nedsettelse av GFP-transkripsjonen, hvilket tyder på at disse DNA'er har evnen til å indusere dannelse av stumt kromatin. SINC35-elementet (benevnt PSINKS35 i tabell 4B) har den sterkeste aktivitet av disse kandidater. Det tilveiebringer ca. 69% nedsettelse av GFP/hygromycin-forholdet og 75% nedsettelse av GFP/beta-aktin-signalet. Styrken av SINC-aktiviteten i de øvrige 5 kandidater som ble beskrevet i den opprinnelige søknad, og av et antall andre SINC-elementer som er blitt isolert ogkarakterisertetter innlevering av den søknaden, er lavere. Derfor har SINC35 en overlegen ytelse som potent genetisk element for induksjon av stumt kromatin i forskjellige bioteknologiske anvendelser.
Eksempel 20: STAR- elementer er konservert mellom mus oa menneske
BLAT-analyse av STAR-DNA-sekvensen mot databasen over det humane genom (http://genome.ucsc.edu/gi-bin/hgGateway) viser at enkelte av disse sekvenser har en høy sekvenskonservering med andre regioner av det humane genom. Disse dupliserte regioner er STAR-element-kandidater; hvis de faktisk oppviser STAR-aktivitet, ville de anses å være paraloger av de klonede STAR'ene (to gener eller genetiske elementer sies å være paraloge hvis de er avledet fra en dupliserings-hendelse (Li, 1997)).
BLAST-analyse av de humane STAR'ene mot muse-genom
(http://www.ensembl.org/Mus_musculus/blastview) oppviser også regioner med høy sekvenskonservering mellom mus og menneske. Denne sekvens-konservering er blitt påvist for fragmenter av 15 av de 65 humane STAR-elementer. Konserveringen varierer fra 64% til 89%, over lengder fra 141 basepar til 909 basepar (tabell 8). Denne grad av sekvens-konservering er bemerkelsesverdig og tyder på at disse DNA-sekvenser kan formidle STAR-aktivitet også innen muse-genomet. Enkelte av sekvensene fra murint og humant genom i tabell 8 kan strengt tatt defineres som ortologer (to gener eller genetiske elementer sies å være ortologe hvis de er avledet fra en spesifiserings-hendelse (Li, 1997)). F.eks. ligger STAR6 mellom SLC8A1- og HAAO-gen både i humant og murint genom. I andre tilfeller har et klonet human STAR en paralog innen det humane genom, og dets ortolog er blitt identifisert i det murine genom. F.eks. er STAR3a et fragment av 15qll.2-region av humant kromosom 15. Denne region er 96,9% identisk (paralog) med et DNA-fragment ved 5q33.3 av humant kromosom 5, som er nær IL12B-interleukin-gen. Disse humane DNA'er har ca. 80% identitet til felles med et fragment av 11B2-region på murint kromosom 11. llB2-fragmentet er også nær (murint) IL12B-interleukin-gen. Derfor kan STAR3a og murint llB2-fragment strengt tatt defineres som paraloger. For å teste hypotesen at STAR-aktiviteten er felles mellom regioner med høy sekvens-konservering i det murine og humane genom, er én av de humane STAR'ene som har en konservert sekvens i mus, nemlig STAR18, blitt analysert i større detalj. Sekvens-konserveringen i det murine genom som ble påvist med den opprinnelige STAR18-klon, strekker seg mot venstre på humant kromosom 2 over ca. 500 basepar (fig. 22; venstre og høyre viser til standard-beskrivelsen av arme-ne av kromosom 2). I dette eksempel undersøker vi om området med sekvens-konservering avgrenser et "naturlig forekommende" STAR-element i mennesker som er noe lengre enn den opprinnelige klon. Vi undersøker også om STAR-funksjonen av dette STAR-element er konservert mellom mus og menneske.
Materialer oa metoder
Regionen med murin/human sekvenskonservering rundt STAR18 ble isolert fra human BAC-klon RP11-387A1 ved PCR-amplifikasjon, i tre fragmenter: hele regionen (primere E93 og E94), venstre halvdel (primere E93 og E92) og høyre halvdel (primere E57 og E94). De tilsvarende fragmenter fra den homologe murine region ble isolert fra BAC-klon RP23-400H17 på samme måte (henholdsvis primere E95 og E98, E95 og E96, og E97 og E98). Alle fragmenter ble klonet inn i pSelect-vektor og transfisert inn i U-2 OS/Tet-Off/LexA-HPl-cellelinje ( jsupra). Etter transfeksjonen utførte man hygromycin-seleksjon for å selektere de transfiserte celler. LexA-HPl-protein ble indusert ved å senke doxocyklin-konsentrasjonen, og evnen av de transfiserte celler til å motstå antibiotikaen zeocin (et mål for STAR-aktivitet) ble bedømt ved å overvåke celleveksten.
Resultater
Den opprinnelige STAR18-klon ble isolert fra Sau3AI-spaltet humant DNA ligert inn i pSelect-vektor, på grunnlag av dets evne til å forhindre forstumning av et zeocin-resistens-gen. Linjestilling av human STAR18-klon (497 basepar) med muse-genom oppviste en høy sekvenslikhet (72%) mellom ortolog human og murin STAR18-region. Den avdekket også en høy likhet (73%) i regionen som strakk seg over 488 basepar umiddelbart til venstre for Sau3AI-setet som avgrenser venstre ende av den klonede region (fig. 22). Utenfor disse regioner faller sekvenslikheten mellom humant og murint DNA under 60%.
Slik det fremgår fra fig. 22, formidler både det humane og det murine STAR18-element overlevelse på zeocin til vertceller som uttrykker lexA-HPl-repressor-protein. Både den opprinnelige 497 basepar lange STAR18-klon og dens murine ortolog formidler evnen til å vokse (fig. 22, a og d). Den hosliggende 488 basepar lange region med høy likhet fra begge genomer formidler også evnen til å vokse, og faktisk er deres vekst-fenotype sterkere enn for den opprinnelige STAR18-klon (fig. 22, b og e). Når hele regionen med sekvenslikhet ble testet, formidler disse DNA'er fra både mus og menneske vekst, og vekst-fenotypen er sterkere enn for de to delfragmenter (fig. 22, c og f). Disse resultater demonstrerer at STAR-aktiviteten av humant STAR18 er konservert i sin ortolog fra mus. Den høye sekvenskonservering mellom disse ortologe regioner er spesielt bemerkelsesverdig fordi de ikke er protein-kodende sekvenser, hvilket fører til konklusjonen at de har en form for regula-torisk funksjon som har forhindret en evolusjonær divergens ved mutasjon.
Denne analyse demonstrerer at klonede STAR-elementer som er blitt identifisert ved det opprinnelige testprogram, i enkelte tilfeller kan representere delvise STAR-elementer, og at en analyse av det genomiske DNA som de er innlemmet i, kan identifisere sekvenser med sterkere STAR-aktivitet.
Eksempel 21: STAR- elementer inneholder karakteristiske DNA- sekvens- motiver
STAR-elementer isoleres på grunnlag av deres anti-represjons-fenotype med hensyn til transgen-ekspresjon. Denne anti-represjons-fenotype gjenspeiler de underliggende biokjemiske prosesser som regulerer kromatin-dannelsen som forbindes med STAR-elementer. Disse prosesser er typisk sekvens-spesifikke og et resultat av proteinbinding eller DNA-strukturen. Dette tyder på at STAR-elementer vil ha en felles DNA-sekvens-likhet. Identifikasjon av sekvens-likhet mellom STAR-elementer vil tilveiebringe sekvens-motiver som er karakteristiske for elementene som allerede er blitt identifisert med funksjonelle utsiktinger og tester.
Andre fordeler med å identifisere sekvensmotiver som karakteriserer STAR-elementer, omfatter å: (1) tilveiebringe søke-motiver for å forutsi og identifisere nye STAR-elementer i genom-databaser, (2) tilveiebringe en logisk begrunnelse for modifikasjon av elementene, og (3) tilveiebringe informasjon for en funksjonell analyse av STAR-aktivitet. Ved bruk av bio-informatikk har man identifisert sekvens-likheter mellom STAR-elementer; resultatene presenteres i dette eksempel.
Bio- informatikk og statistisk bakgrunn. Regulatoriske DNA-elementer fungerer vanligvis ved en vekselvirkning med sekvens-spesifikke DNA-bindende proteiner. En bio-informatisk analyse av DNA-elementer så som STAR-elementer hvis regulatoriske egenskaper er blitt identifisert, men hvis vekselvirkende proteiner er ukjen-te, krever en statistisk fremgangsmåte for å identifisere sekvens-motiver. Dette kan oppnås ved en fremgangsmåte som påviser korte DNA-sekvensmønstre som er over-representert i et sett av regulatoriske DNA-elementer (f.eks. STAR-elementene) sammenlignet med en referanse-sekvens (f.eks. fullstendig humant genom). Fremgangsmåten bestemmer antallet observerte og forventede forekomster av mønstrene i hvert regulatoriske element. Antallet forventede forekomster beregnes utfra antallet observerte forekomster av hvert mønster i referanse-sekvensen.
DNA-sekvensmønstrene kan være oligonukleotider av en gitt lengde, f.eks. 6 basepar. I den enkleste analyse, for et 6 basepar langt oligonukleotid (heksamer) be stående av de fire nukleotider (A, C, G og T) finnes det 4<6>= 4.096 forskjellige oligonukleotider (alle kombinasjoner fra AAAAAA til TTTTTT). Hvis de regulatoriske
sekvenser og referanse-sekvensene var fullstendig tilfeldige og hadde et likt forhold mellom A-, C-, G- og T-nukleotid, ville den forventede hyppighet av hver heksamer være 1/4096 (ca. 0,00024). Imidlertid er den faktiske hyppighet av hver heksamer i referanse-sekvensen vanligvis forskjellig fra dette grunnet avvik i innholdet av
G:C-basepar osv. Derfor bestemmes hyppigheten av hvert oligonukleotid i referansesekvensen empirisk ved telling, for å danne en "frekvenstabell" for mønstrene.
Mønsterfrekvenstabellene for referansesekvensene brukes deretter til å beregne den forventede forekomsthyppighet for hvert mønster i settet av regulatoriske elementer. De forventede hyppigheter sammenlignes med mønstrenes observerte forekomsthyppighet. Mønstre som er "over-representert" i settet identifiseres; f.eks. hvis heksameren ACGTGA forventes å foreligge 5 ganger i 20 kilobasepar av sekvensen, men observeres å forekomme 15 ganger, er det 3 ganger over-representert. 10 av de 15 forekomster av dette heksamere sekvensmønster ville ikke forventes i de regulatoriske elementer hvis elementene hadde samme heksamer-sammensetning som hele genomet. Så snart man har identifisert over-representerte mønstre, anvendes en statistisk test for å bestemme om deres over-representasjon er signifikant eller kan skyldes tilfeldigheter. For dette beregnes en signifikans-indeks, "sig", for hvert mønster. Signifikans-indeksen avledes fra sannsynligheten for forekomsten av hvert mønster, som bedømmes i henhold til en bi-nomial fordeling. Sannsynligheten tar i betraktning antallet mulige mønstre (4.096 for heksamerer). De høyeste sig-verdier tilsvarer de mest over-representerte oligonukleotider (van Helden etal., 1998). I praksis anses oligonukleotider med sig > = 0 å være over-representert. Et mønster med sig >= 0 vil sannsynligvis være over-representert på grunn av tilfeldigheter én gang (= 10°) i settet av regulatoriske element-sekvenser. Ved sig >= 1, forventes imidlertid et mønster å være over-representert i én av ti (= 10<1>) sekvens-sett, sig >= 2 én gang av 100 (=10<2>) sekvens-sett osv. Mønstrene som er signifikant over-representert i det regulatoriske element-sett, brukes til å utvikle en modell for klassifisering og forutsigelse av regulatoriske element-sekvenser. Dette benytter seg av diskriminansanalyse, en såkalt "overvåket" metode for statistisk klassifisering som er kjent for fagmannen (Huberty, 1994). I diskriminansanalysen brukes sett av kjente eller klassifiserte gjenstander (f.eks. STAR-elementer) til å "trene opp" en modell til å gjenkjenne disse gjenstander på grunnlag av bestemte variabler (f.eks. sekvensmønstre så som heksamerer). Den trenede modell brukes deretter til å forutsi om andre gjenstander bør klassifiseres som å tilhøre settet av kjente gjenstander (f.eks. er en DNA-sekvens et STAR-element). I dette eksempel er de kjente gjenstander i trenings-settet STAR-elementer (positiv-treningssett). De sammenlignes med sekvenser som er tilfeldig valgt fra genomet (negativ-treningssett) som har samme lengde som STAR-elementene. Diskriminansanalyse etablerer kriterier for å skjelne mellom positiver og negativer på grunnlag av et sett av variabler som skiller ut positivene; i dette eksemplene er variablene de signifikant over-representerte mønstre (f.eks.
heksamerer).
Når antallet over-representerte mønstre er høyt sammenlignet med størrelsen på treningssettet, kan modellen bli tendensiøs grunnet over-trening. Over-trening om-gås ved å anvende en fremadrettet trinnvis seleksjon av variabler (Huberty, 1994). Målet med trinnvis diskriminansanalyse er å velge det minste antall variabler som tilveiebringer en maksimal skjelning mellom positivene og negativene. Modellen trenes ved å bedømme variablene hver for seg for sin evne til å klassifisere gjen-standene i positiv- og negativ-treningssettet riktig. Dette utføres inntil en tilføyelse av nye variabler til modellen ikke hever modellens forutsigende kraft vesentlig (dvs. inntil klassifikasjons-feilraten er minimert). Denne optimerte modell brukes deretter for testing, for å forutsi om "nye" gjenstander er positiver eller negativer (Huberty, 1994).
Innen klassifikasjonsstatistikken er det uunngåelig at for komplekse gjenstander så som DNA-sekvenser, vil enkelte elementer fra positiv-treningssettet klassifiseres som negativer (falske negativer), og enkelte elementer av negativ-treningssettet vil klassifiseres som positiver (falske positiver). Når en trent modell anvendes til å teste nye gjenstander, forventes de samme typer feilklassifiseringer å finne sted. I den bio-informatiske metode som beskrives heri, nedsetter mønsterfrekvens-analysen et stort sett av sekvensmønstre (f.eks. alle 4.096 heksamerer) til et mindre sett av signifikant over-representerte mønstre (f.eks. 100 heksamerer); i det andre trinn nedsetter en trinnvis diskriminansanalyse settet av over-representerte mønstre til et delsett av mønstre som har den maksimale skjelnende styrke (f.eks. 5-10 heksamerer). Derfor tilveiebringer denne fremgangsmåte enkle og robuste kriterier for å identifisere regulatoriske DNA-elementer så som STAR-elementer.
DNA-bindende proteiner kan skjelnes på grunnlag av hvilken type bindingssete de inntar. Enkelte gjenkjenner sammenhengende sekvenser; for denne type proteiner er mønstre som er 6 basepar lange oligonukleotider (heksamerer) fordelaktige for bio-informatiske analyser (van Helden etal., 1998). Andre proteiner bindes til sekvens-dyader: kontakt etableres mellom par av høyt konserverte trinukleotider som er adskilt av en ikke-konservert region med fast lengde (van Helden et al., 2000). For å identifisere sekvenser i STAR-elementer som kan bindes av dyade-bindende proteiner, ble en frekvensanalyse også utført for denne type mønster, hvor avstanden mellom de to trinukleotider ble variert fra 0 til 20 (dvs. XXXN{0-20}XXX hvor X'ene er bestemte nukleotider som utgjør trinukleotidene, og N'ene er tilfeldige nukleotider med 0 til 20 basepar lengde). Resultatene av dyade-frekvensanalysen brukes også for den lineære diskriminansanalyse som ble beskrevet ovenfor.
Materialer og metoder
Ved bruk av den genetiske test som ble beskrevet i den opprinnelige patentsøknad, ble sekstiseks (66) STAR-elementer opprinnelig isolert fra det humane genomiske DNA ogkarakteriserti detalj (tabell 6). Testen ble utført på gen-samlinger som var konstruert ved Sau3AI-spaltning av humant genomisk DNA, enten isolert fra placenta (Clontech 6550-1) eller båret i bakterielle/Pl (BAC/PAC) kunstige kromosomer. BAC/PAC-klonene inneholder genomisk DNA fra regioner av kromosom 1 (klonene RP1154H19 og RP3328E19), fra HOX-klyngen av homeotiske gener (klonene RP1167F23, RP1170019 og RP11387A1) eller fra humant kromosom 22 (Research Genetics 96010-22). DNA'et ble størrelsesfraksjonert, og den 0,5-2 kb lange fraksjon ble ligert inn i BamHI-spaltet pSelect-vektor, ved standardteknikker (Sambrook et al., 1989). pSelect-plasmider som inneholdt humant genomisk DNA som formidlet resistens mot zeocin ved lave doxocyklin-konsentrasjoner, ble isolert og formert i Escherichia coli. Testene som gav STAR-elementene fra tabell 6, har testet ca. 1-2% av det humane genom.
De humane genomiske DNA-innføyelser i disse 66 plasmider ble sekvensiert ved dideoksy-metoden (Sanger etal., 1977) ved bruk av en Beckman CEQ2000 automatisert DNA-sekvensieringsanordning, ved å følge produsentens anvisninger. Kort sagt ble DNA renset fra E. coli ved bruk av QIAprep Spin Miniprep og Plasmid Midi Kit (henholdsvis QIAGEN 27106 og 12145). Syklus-sekvensiering ble utført ved bruk av skreddersydde oligonukleotider som tilsvarte pSelect-vektor (primere D89 og D95, tabell 5), i nærvær av farge-terminatorer (DEQ Dye Terminator Cycle Sequencing Kit, Beckman 608000). Sammensatte STAR-DNA-sekvenser ble lokalisert i det humane genom (database-sammensetning august og desember 2001) ved bruk av BLAT (Basic Local Alignment Tool (Kent, 2002); http://genome.ucsc.edu/cgi-bin/hgGateway; tabell 6). Tilsammen omfatter de sammenslåtte STAR-sekvenser 86,5 kilobasepar, med en gjennomsnittlig lengde på 1,3 kilobasepar. Sekvensmotiver som skjelner STAR-elementer innen det humane genomiske DNA, ble identifisert ved bio-informatisk analyse ved bruk av en to-trinns prosedyre, som følger (se fig. 23 for et skjematisk diagram). Analysen har to inn-datasett: (1) DNA-sekvensene av STAR-elementene (STARI-STAR65 ble brukt; tabell 6); og (2) DNA-sekvensen av det humane genom (unntatt kromosom 1, som det ikke var gjennomførbart å innlemme grunnet dets store størrelse; for dyade-analysen brukte man et tilfeldig delsett av den humane genomiske DNA-sekvens (ca. 27 Mb)).
Mønsterfrekvensanalvse: Det første trinn i analysen benytter seg av RSA-Tools-programvare (Regulatory Sequence Analysis Tools;
http://www.ucmb.ulb.ac.be/bioinformatics/rsa-tools/; referanser (van Helden et al., 1998; van Helden etal., 2000; van Helden et al., 2000)) for å bestemme den følgende informasjon: (1) hyppigheten av alle dyader og heksamere olignukleotider i det humane genom; (2) hyppigheten av oligonukleotidene og dyadene i de 65 STAR-elementer; og (3) signifikansindeksen for oligonukleotidene og dyadene som er over-representert i STAR-elementene sammenlignet med genomet. En kontroll-analyse ble utført med 65 sekvenser som var tilfeldig valgt fra det humane genom (dvs. fra 2.689 x IO<3>kilobasepar) som hadde samme lengde som STAR-elementene i tabell 6.
Diskriminansanalyse: De over-representerte oligonukleotider og dyader ble brukt til å trene opp modeller for forutsigelse av STAR-elementer ved lineær diskriminansanalyse (Huberty, 1994). Et for-utvalg av variabler ble utført ved å velge ut 50 mønstre med den høyeste individuelle skjelnende styrke fra de over-representerte oligoer eller dyader fra frekvensanalysen. Disse for-utvalgte variabler ble deretter brukt til å trene opp modellen i en trinnvis lineær diskriminansanalyse for å velge den mest skjelnende kombinasjon av variabler (Huberty, 1994). Valget av variabler skjedde på grunnlag av å minimere feilklassifikasjons-hyppigheten (prosentdel falske negative klassifikasjoner). I tillegg beregnet man den forventede feilrate ved å anvende den samme diskriminerende fremgangsmåte på kontrollsettet av tilfeldige sekvenser (minimere prosentdelen falske positive klassifikasjoner).
De forutsigende modeller fra treningsfasen av diskriminansanalysen ble testet på to måter. Først klassifiserte man STAR-elementene og de tilfeldige sekvenser som ble brukt til å generere modellen (trenings-settene). Dernest klassifiserte man sekvensene i en samling av 19 STAR-element-kandidater (nylig klonede ved zeocin-seleksjon slik det ble beskrevet ovenfor). Disse STAR-element-kandidater er opp-ført i tabell 11 (SEKV ID 67-84).
Resultater
Mønsterfrekvensanalyse ble utført med RSA-Tools på 65 STAR-elementer, ved bruk av det humane genom som referansesekvens. Etthundreogseksiseks (166) heksamere oligonukleotider viste seg å være over-representert i settet av STAR-elementer (sig >= 0) sammenlignet med det fullstendige genom (tabell 9). Det mest betraktelig over-representerte oligonukletid, CCCCAC, forekommer 107 ganger blant de 65 STAR-elementer, men forventes å forekomme bare 49 ganger. Det har en signifikans-koeffisient på 8,76; med andre ord er sannsynligheten for at dens over-representasjon skyldes tilfeldigheter, 1/10<8,76>, dvs. mindre enn 1:500 millioner. 95 av oligonukleotidene har en signifikans-koeffisient over 1, og er dermed høyt over-representert i STAR-elementene. Blant de over-representerte oligonukleotider varierer deres observerte og forventede hyppighet fra henholdsvis 6 og 1 (for oligo 163, CGCGAA, sig = 0,02) til henholdsvis 133 og 95 (for oligo 120, CCCAGG, sig = 0,49). Forskjellene i de forventede forekomster gjenspeiler faktorer så som G:C-innholdet i det humane genom. Derfor er forskjellen mellom oligonukleotidene hva angår antallet forekomster, mindre viktig enn deres over-representasjon, f.eks. er oligo 2 (CAGCGG) 36/9 = 4 ganger over-representert, hvilket har en sannsynlighet for å skyldes tilfeldigheter, på 1:50 millioner (sig = 7,75).
Tabell 9 presenterer også antallet STAR-elementer hvor hvert over-representerte oligonukleotid finnes. F.eks. forekommer det mest signifikante oligonukleotid, nemlig oligo 1 (CCCCAC), 107 ganger, men foreligger i kun 51 STAR-elementer, dvs. forekommer det gjennomsnittlig som 2 kopier per STAR. Det minst hyppige oligonukleotid, nr. 166 (AATCGG), forekommer gjennomsnittlig i 1 kopi per STAR (13 forekomster på 11 STAR-elementer); enkelt-kopi-oligonukleotider forekommer hyppig, spesielt for de mindre hyppige oligoer. I det andre ekstrem forekommer oligo 4 (CAGCCC) gjennomsnittlig 3 ganger i de STAR-elementer hvor det forekommer (37 STAR-elementer). Det mest utbredte oligonukleotid er nr. 120 (CCCAGG), som forekommer på 58 STAR-elementer (gjennomsnittlig to ganger per STAR), og det minst utbredte oligonukleotid er nr. 114 (CGTCGC), som forekommer på kun 6 STAR-elementer (og gjennomsnittlig kun 1 gang per STAR).
Resultatene av dyade-frekvensanalysen oppgis i tabell 10. Syvhundretretti (730) dyader viste seg å være over-representert i settet av STAR-elementer (sig >= 0) sammenlignet med referansesekvensen. Den mest signifikant over-representerte dyade, CCCN{2}CGG, forekommer 36 ganger blant de 65 STAR-elementer, men forventes å forekomme kun 7 ganger. Den har en signifikanskoeffisient på 9,31; med andre ord er sannsynligheten for at dens over-representasjon skyldes tilfeldigheter, I/IO<9,31>, dvs. mindre enn ca. 1:2 milliarder.
Trehundrenittisyv av dyadene har en signifikanskoeffisient over 1, og er dermed høyt over-representert i STAR-elementene. Blant de over-representerte dyader varierer deres observerte og forventede forekomst fra henholdsvis 9 og 1 (for fem dyader (nr. 380, 435, 493, 640 og 665)) til henholdsvis 118 og 63 (for nr. 30 (AGGN{2}GGG), sig = 4,44).
Oligonukleotidene og dyadene som man ved mønsterfrekvensanalyse fant at var over-representert i STAR-elementene, ble testet for sin skjelnende styrke ved lineær diskriminansanalyse. Diskriminansmodeller ble trent opp ved trinnvis utvalg av den beste kombinasjon blant de 50 mest skjelnende oligonukleotidmønstre (tabell 9) eller dyade-mønstre (tabell 10). Modellene oppnådde en optimal feilrate etter innlemmelse av 4 (dyade) eller 5 variabler. Diskriminansvariablene fra oligo-analysen er nr. 11, 30, 94, 122 og 160 (tabell 9); diskriminansvariablene fra dyade-analysen er nr. 73, 194, 419 og 497 (tabell 10).
Diskriminansmodellene ble deretter brukt til å klassifisere de 65 STAR-elementer i
trenings-settet og deres forbundne tilfeldige sekvenser. Modellen som benytter seg av oligonukleotid-variablene, klassifiserer 46 av de 65 STAR-elementer som STAR-elementer (sanne positiver); dyade-modellen klassifiserer 49 av STAR-elementene som sanne positiver. Kombinert klassifiserer modellene 59 av de 65 STAR-elementer som STAR-elementer (91%; fig. 24). Raten av falske positiver (tilfeldige sekvenser som ble klassifisert som STAR-elementer) var 7 for dyade-modellen, 8 for oligonukleotid-modellen og 13 for de kombinerte forutsigelser av de to modeller (20%). STAR-elementene fra tabell 6 som ikke ble klassifisert som STAR-elementer ved LDA, er STAR'ene 7, 22, 35, 44, 46 og 65. Disse elementer oppviser stabili-serende anti-repressor-aktivitet i funksjonelle assayer, slik at det faktum at de ikke klassifiseres som STAR-elementer ved LDA, tyder på at de representerer en (eller flere) andre klasser av STAR-elementer.
Modellene ble deretter brukt til å klassifisere de 19 STAR-element-kandidater i test-settet som er oppført i tabell 11. Dyade-modellen klassifiserer 12 av disse STAR-kandidater som STAR-elementer, mens oligonukleotid-modellen klassifiserer 14 som STAR-elementer. Det samlede antall kandidater som klassifiseres som STAR- elementer, er 15 (79%). Dette er en lavere klassifikasjonsrate enn hva som oppnås med treningssettet bestående av 65 STAR-elementer, og dette var som ventet, av to grunner. For det første ble diskriminansmodellene trent opp med de 65 STAR-elementer fra tabell 6, og diskriminansvariabler basert på dette treningssett kan være mindre godt representert i test-settet. For det andre er STAR-sekvens-kandidatene i test-settet ikke enda fullstendigkarakterisertmed hensyn til in vivo-funksjonen, og kan omfatte elementer som kun har svake anti-represjonsegen-skaper. Denne analysen demonstrerer potensialet av en statistisk fremgangsmåte for en bio-informatisk klassifikasjon av STAR-elementer. STAR-sekvensene inneholder et antall dyade- og heksamer-oligonukleotid-mønstre som er signifikant over-representert sammenlignet med det humane genom som helhet. Disse mønstre kan representere bindingsseter for proteiner som formidler STAR-aktivitet; i hvert tilfelle utgjør de et sett av sekvensmotiver som kan brukes til å gjenkjenne STAR-element-sekvenser.
Ved bruk av disse mønstre for å gjenkjenne STAR-elementer ved diskriminansanalyse, klassifiseres en stor andel av elementene som ble erholdt ved den genetiske test ifølge oppfinnelsen, faktisk som STAR-elementer. Dette gjenspeiler underliggende sekvens- og funksjons-likheter blant disse elementer. Et viktig trekk av fremgangsmåten som beskrives heri (mønsterfrekvensanalyse fulgt av diskriminansanalyse) er at den kan gjentas; f.eks. kan man ved å innlemme de 19 STAR-element-kandidater fra tabell 11 med de 66 STAR-elementer fra tabell 6 inn i ett trenings-sett oppnå en forbedret diskriminansmodell. Denne forbedrede modell kan deretter brukes til å klassifisere andre kandidat-regulatoriske elementer som STAR-elementer. In wVo-utsikting av genomiske sekvenser i stor skala ved bruk av fremgangsmåten som er beskrevet ovenfor, sammen med gjentakelsen av den bio-informatiske analyse, vil tilveiebringe en måte å skjelne STAR-elementer, som asymptotisk nærmer seg 100% gjenkjennelse og forutsigelse av elementer idet genomet gjennomgås i sin helhet. Disse overbevisende og omfangsrike forutsigelser av STAR-funksjonen vil sikre at alle humane STAR-elementer gjenkjennes og er tilgjengelige for bruk ved forbedring av transgen-ekspresjonen.
Eksempel 22: Kloning oa karakterisering av STAR- elementer fra Arabidopsis tha - liana
Transgen-forstumning finner sted i transgene planter både på transkripsjonelt og post-transkripsjonelt nivå (Meyer, 2000; Vance og Vaucheret, 2001). I hvert tilfelle kan det ønskede resultat av transgen-ekspresjonen kompromitteres av forstum ningen; den lave ekspresjon og instabiliteten av transgenet fører til en dårlig ekspresjon av ønskelige trekk (f.eks. resistens mot skadedyr) eller lave utbytter av rekombinante proteiner. Det fører også til en dårlig forutsigbarhet: andelen av transgene planter som uttrykker transgenet i bioteknologisk nyttige mengder er lav, hvilket gjør det nødvendig med en møysommelig og dyr testing av transformerte individuer for å finne dem som har gunstige ekspresjonsegenskaper. Dette eksempel beskriver isolasjon av STAR-elementer fra genomet av en tofrøbladede plante Arabidopsis thaliana, for bruk for å forhindre en transkripsjonen transgen-forstumning i transgene planter. Arabidopsis ble valgt for dette eksempel fordi det er en grundig undersøkt modell-organisme: den har et kompakt genom, den er mottakelig for genetisk og rekombinant DNA-manipulasjon, og dens genom er blitt sekvensiert (Bevan et al., 2001; Initiative, 2000; Meinke etal., 1998).
Materialer og metoder
Genomisk DNA ble isolert fra Arabidopsis thaliana ekotype Columbia som beskrevet (Stam etal., 1998) og delvis spaltet med Mbol. Det spaltede DNA ble størrelses-fraksjonert til 0,5-2 kilobasepar ved agarosegel-elektroforese og rensing fra gelet (QIAquick Gel Extraction Kit, QIAGEN 28706), fulgt av ligering inn i pSelect-vektor ( jsupra). Transfeksjon inn i U-2 OS/Tet-Off/LexA-HPl-cellelinjen og seleksjon for zeocin-resistens ved lav doksycyklin-konsentrasjon ble utført som beskrevet ( supra). Plasmider ble isolert fra zeocin-resistente kolonier og gjentransfisert inn i U-2 OS/Tet-Off/LexA-HPl-cellelinjen.
Sekvensiering av yAra/j/dops/s-genomiske DNA-fragmenter som formidlet zeocin-resistens etter gjen-transfeksjon, ble utført som beskrevet ( supra). DNA-sekvensene ble sammenlignet med sekvensen av ^rab/dops/s-genomet ved BLAST-analyse ((Altschul etal., 1990); URL http://www.ncbi.nlm.nih.gov/blast/Blast).
STAR-aktiviteten ble testet ytterligere ved å måle mRNA-nivået for hygromycin- og zeocin-resistens-genene i rekombinante vertceller ved revers transkripsjon-PCR (RT-PCR). Celler av U-2 OS/Tet-Off/lexA-HPl-cellelinjen ble transfisert med pSelect-plasmider som inneholdt yAra/j/dops/s-STAR-elementer, Drosophila- scs-element eller som ikke inneholdt noen innføyelse ( supra). Disse ble dyrket på hygromycin i 2 uker ved høy doksycyklin-konsentrasjon, og deretter ble doksycyklin-konsentrasjonen senket til 0,1 ng/ml for å indusere lexA-HPl-repressor-protein. Etter 10 dager ble det samlede RNA isolert ved bruk av RNeasy mini kit (QIAGEN 74104) slik produsenten beskriver. Første-kjede-cDNA-syntese ble utført ved bruk av RevertAid First Strand cDNA Synthesis Kit (MBI Fermentas 1622) ved bruk av oligo(dT)18-primer slik produsenten beskriver. En alikvot av cDNA'et ble brukt som sjablone i en PCR-reaksjon ved bruk av primerne D58 og D80 (for zeocin-markøren) og D70 og D71 (for hygromycin-markøren) og Taq-DNA-polymerase (Promega M2661). Reaksjonsbetingelsene var 15-20 sykluser med 94°C i 1 minutt, 54°C i 1 minutt og 72°C i 90 sekunder. Disse betingelser fører til et lineært forhold mellom inn-RNA og PCR-produkt-DNA. PCR-produktene ble løst opp ved agarosegel-elektroforese, og zeocin- og hygromycin-båndene ble påvist ved Southern blotting som beskrevet (Sambrook et al., 1989), ved bruk av de ovenfor fremstilte PCR-produkter med renset pSelect-plasmid som sjablone. Forholdet mellom zeocin-og hygromycin-signalene tilsvarer det normaliserte ekspresjonsnivå av zeocin-genet.
Resultater
Biblioteket av/4ra£>/'dops/'s-genomisk DNA i pSelect-vektor omfattet 69.000 primære kloner i E. coli, hvorav 80% bar innføyelser. Den midlere innføyelsesstørrelse var ca. 1.000 basepar; biblioteket representerer dermed ca. 40% av genomet av Arabidopsis.
En del av dette bibliotek (som representerte ca. 16% av /4ra£>/'dops/s-genomet) ble transfisert inn i U-2 OS/Tet-Off/LexA-HPl-cellelinjen. Hygromycin-seleksjon ble ut-ført for å isolere transfektanter, hvilket førte til 27.000 overlevende kolonier. Disse ble deretter underkastet zeocin-seleksjon ved lav doksycyklin-konsentrasjon. De antatte STAR-holdige plasmider fra 56 zeocin-resistente kolonier ble reddet inn i E. coli og gjen-transfisert inn i U-2 OS/Tet-Off/LexA-HPl-celler. Førtifire av disse plasmider (79% av de testede plasmider) formidlet zeocin-resistens til vertcellene ved lave doksycyklin-konsentrasjoner, hvilket demonstrerte at plasmidene bar STAR-elementer. Dette tyder på at pSelect-testen i humane U-2 OS-celler er meget virksom for å påvise STAR-elementer fra planters genomiske DNA.
DNA-sekvensen av disse 44 STAR-element-kandidatene ble bestemt. Trettifem av dem ble identifisert som enkeltstående loci i databasen av Arabidopsis' kjerne-genomiske sekvens (tabell 12; SEKV ID 85-SEKV ID 119). Fire andre ble identifisert å stamme fra kloroplast-genomet, fire var kimærer av DNA-fragmenter fra to loci, og én ble ikke funnet i<y>4ra£>/'dops/'s-genomdatabasen.
Styrken av de klonede ^rafc/dops/s-STAR-elementer ble testet ved å bedømme deres evne til å forebygge en transkripsjonen represjon av zeocin-resistens-genet, ved bruk av et RT-PCR-assay. Som kontroll for inn-RNA i prøvene, bedømte man også transkripsjonsnivået av hygromycin-resistens-genet for hver STAR-transfeksjon. Denne analyse er blitt utført for 12 av ^rafc/dops/s-STAR-elementene. Resultatene (fig. 25) demonstrerer at ^rafc/dops/s-STAR-elementer er bedre enn £)rosop/7/7a-scs-element (positiv-kontroll) og den tomme vektor ("SV40", negativ-kontroll) i sin evne til å beskytte zeocin-resistens-gen mot transkripsjonen undertrykkelse. Spesielt muliggjør STAR-A28 og STAR-A30 et dobbelt så høyt nivå av zeocin-resistens-gen-ekspresjon enn scs-elementet (normalisert til intern-kontrollen av hygromycin-resistens-gen-mRNA) når lexA-HPl-repressor uttrykkes.
Disse resultater demonstrerer at fremgangsmåten ifølge oppfinnelsen kan brukes med fremgang til å isolere STAR-elementer fra genomet av andre arter enn mennesker. Dens fremgangsrike anvendelse på STAR-elementer fra et plante-genom er spesielt viktig idet det demonstrerer det brede taxonomiske område som fremgangsmåten ifølge oppfinnelsen kan anvendes på, og fordi planter er et viktig mål for bioteknologisk utvikling.
Kort beskrivelse av tegningene
Fig. 1: pSelect-plasmid-familien for seleksjon og karakterisering av STAR-elementer. En resistens-markør (zeocin eller puromycin) eller et reportergen (GFP eller luciferase) under styringen av den uspesifikke SV40-promoter er hosliggende et BamHI-kloningssete flankert av Ascl- og Hindlll-seter. Oppstrøms for kloningssetet er lexA-operatører som lexA-protein kan bindes til. Bindingen av kimære lexA-Polycomb-gruppe-proteiner til operatørene forårsaker en undertrykkelse av markør- eller reportergenet. DNA-fragmenter som er blitt innføyd i kloningssetet som blokkerer undertrykkelsen, identifiseres ved den fortsatte ekspresjon av mark-øren eller reportergenet. Plasmidet replikeres episomalt i dyrkede pattedyrceller grunnet oriP-sekvensen. Fig. 2: pSDH-plasmid-familien for testing av STAR-elementer. To multiple kloningsseter (MCSI og MCSII) flankerer et reportergen (GFP eller luciferase), hvis ekspresjon drives av en oppstrøms promoter (CMV, Tet-Off eller SV40). STAR-elementer som skal testes, innføyes ved MCSI og MCSII. Disse inneholder ensartede restriksjonsseter (MCSI: Xhol, Noti, EcoRI og Sali; MCSII: Hindlll, EcoRV, Bglll og Nhel). Plasmidet replikeres etter tilfeldig integrasjon i genomet av pattedyrceller. Fig. 3: Andel av kloner som over-uttrykker luciferase. U-2 OS humane osteosarko-maceller ble stabilt transfisert med pSDH-plasmider (som inneholdt luciferase-reportergen under styring av tet-off-promoter), og enkelte transfiserte kloner ble isolert og dyrket. Luciferase-ekspresjonen ble målt enzymatisk. Den midlere luciferase-ekspresjon av kloner som inneholdt STAR-løst pSDH ("referansenivå"), ble bestemt. Kloner fra settene for alle plasmider ble vurdert som å "over-uttrykke" hvis deres luciferase-aktivitet var mer enn dobbelt så høy som referansenivået. Prosentdelen av over-uttrykkende kloner i hvert plasmidsett ble plottet. Fig. 4: Flerdoblet overekspresjon av over-uttrykkende kloner. Området av overekspresjon i STAR-holdige pSDH-plasmider som var integrert inn i genomisk DNA, ble bestemt ved å dividere luciferase-aktiviteten av hver klon med referansenivået. For dem som oppviste en vesentlig ekspresjon (mer enn dobbelt så høy som referanse-nivået), noterte man den faktiske flerdobling; den minste og midlere verdi av disse data er plottet for hvert plasmid. Fig. 5: Flerdoblet overekspresjon av over-uttrykkende kloner. Området av overekspresjon i STAR-holdige pSDH-plasmider som var integrert inn i genomisk DNA, ble bestemt ved å dividere luciferase-aktiviteten av hver klon med referansenivået. For dem som oppviste en vesentlig ekspresjon (mer enn dobbelt så høy som referanse-nivået), noterte man den faktiske flerdobling; den maksimale verdi av disse data er plottet for hvert plasmid. Fig. 6: pSS (SINC-Selct)-plasmidet for utvalg og karakterisering av SINC-elementer. codA: :upp-suicid-genet koder for et protein som omdanner prodrogen 5-fluorcytosin til det toksiske legemiddel 5-fluoruracil. Etter induksjon av en nedsatt tetracyklin-konsentrasjon, blir vertcellene følsomme for prodrogen. Genomiske DNA-fragmenter som er innføyd ved kloningssetet (Bglll-Xhol) og som har forstummende aktivitet, vil forhindre en ekspresjon av suicid-genet og muliggjøre dannelse av prodroge-resistente kolonier. STAR-elementer flankerer seleksjonskomponentene for å forhindre spredningen av forstummet kromatin til de funksjonelle komponenter av plasmidet. Plasmidet replikeres episomalt i dyrkede pattedyrceller på grunn av oriP-sekvensen. Fig. 7: pSDH-CSP-plasmidet som ble brukt til å teste STAR-aktiviteten. Det utsond-rede alkalifosfatase (SEAP)-reportergen styres av CMV-promoter, og puromycin-resistens-selekterbar markør (puro) styres av SV40-promoter. Disse to gener flankeres av multiple kloningsseter, som STAR-elementer kan klones inn i. Plasmidet har også et replikasjonsopphav (ori) og ampicillin-resistensgen (ampR) for propa-gering i Eschehchia coli. Fig. 8: STAR6 og STAR49 forbedrer forutsigbarheten og utbyttet av transgeneks-presjon. Ekspresjon av SEAP fra CMV-promoter av CHO-celler som var blitt transfisert med pSDH-CSP, pSDH-CSP-STAR6 eller pSDH-CSP-STAR49, ble bestemt. De STAR-holdige konstruksjoner formidler en større forutsigbarhet og et høyere utbytte enn pSDH-CSP-konstruksjonen i og for seg. Fig. 9: STAR6 og STAR8 forbedrer forutsigbarheten og utbyttet av transgen-ekspresjon. Ekspresjon av luciferase fra CMV-promoter av U-2 OS-celler som var blitt transfisert med pSDH-CMV, pSDH-CMV-STAR6 eller pSDH-CMV-STAR8, ble bestemt. De STAR-holdige konstruksjoner formidler en større forutsigbarhet og et høyere utbytte enn pSDH-CMV-konstruksjonen i og for seg. Fig. 10: Minste uunnværlige sekvens av STAR10 og STAR27. Partier av STAR-elementene ble amplifisert ved PCR: STAR10 ble amplifisert med primerne E23 og E12 for å gi fragment 10A, E13 og E14 for å gi fragment 10B, og E15 og E16 for å gi fragment 10C. STAR27 ble amplifisert med primerne E17 og E18 for å gi fragment 27A, E19 og E20 for å gi fragment 27B, og E21 og E22 for å gi fragment 27C. Disse delfragmenter ble klonet inn i pSelect-vektor. Etter transfeksjon inn i U-2
OS/Tet-Off/LexA-HPl-celler, overvåket man veksten av kulturene i nærvær av zeocin. Vekstraten varierte fra kraftig (+++) til dårlig (+/-), mens enkelte kulturer ik-ke overlevde zeocin-behandlingen (-) grunnet fraværet av STAR-aktivitet i det testede DNA-fragment. Fig. 11: STAR-element-funksjon i sammenheng med SV40-promoter. pSDH-SV40 og pSDH-SV40-STAR6 ble transfisert inn i human osteosarkoma U-2 OS-cellelinje, og ekspresjonen av luciferase ble testet med eller uten STAR6-beskyttelse mot gen-forstumning i puromycin-resistente kloner. Fig. 12: STAR-element fungerer i sammenheng med Tet-Off-promoter. pSDH-Tet og pSDH-Tet-STAR6 ble transfisert inn i human osteosarkoma U-2 OS-cellelinje, og ekspresjonen av luciferase ble testet med eller uten STAR6-beskyttelse mot genfor-stumning i puromycin-resistente kloner. Fig. 13: Skjematisk diagram over retningen av STAR-elementer idet de klones inn i pSelect-vektor (rute A), idet de klones inn i pSDH-vektorer for å bevare deres native retning (rute B) og idet de klones inn i pSDH-vektor i omvendt retning (rute C). Fig. 14: Retningsavhengigfiet av STAR66-funksjonen. STAR66-elementet ble klonet inn i pSDH-Tet enten i nativ (STAR66 nativ) eller omvendt retning (STAR 66 motsatt), og transfisert inn i U-2 OS-celler. Luciferase-aktiviteten ble testet i puromycin-resistente kloner. Fig. 15 Kopiantall-avhengigfiet av STAR-funksjonen. Southern blot av luciferase-ekspresjonsenheter i pSDH-Tet-STAR10, integrert inn i U-2 OS-genomisk DNA. Ra-dioaktiv luciferase-DNA-probe ble brukt til å påvise mengden av transgen-DNA i genomet av hver klon, som deretter ble kvantifisert med en fosfor-imager-anordning. Fig. 16: Kopiantall-avhengighet av STAR-funksjonen. Kopiantallet av pSDH-Tet-STARlO-ekspresjonsenheter i hver klon ble bestemt ved fosfor-avbildning og sammenlignet med aktiviteten av luciferase-reporter-enzymet som uttrykkes av hver klon. Fig. 17: Forsterker-blokkering og forsterker-assayer. Luciferase-ekspresjonsvektorer som ble brukt for å teste STAR'ene for forsterker-blokkering og forsterker-aktivitet, vises skjematisk. E-box-bindingssetet for E47-forsterkerprotein er opp-strøms for et kloningssete for STAR-elementer. Nedstrøms for STAR-kloningssetet er luciferase-genet under styring av en human alkalifosfatase-minimal promoter (mp). Histogrammene oppgir de forventede utfall av de tre mulige eksperimentelle situasjoner (se tekst). Rute A: Forsterker-blokkerings-assay. Rute B: Forsterker-assay. Fig. 18: Forsterker-blokkerings-assay. Luciferase-ekspresjonen fra en minimal promoter aktiveres av E47/E-box-forsterkeren i den tomme vektor (vektor). Innføyelse av forsterker-blokkerere (ses, HS4) eller STAR-elementer (STAR-elementene 1, 2, 3, 6, 10, 11, 18 og 27) blokkerer E47/E-box' aktivering av luciferase. Fig. 19: Forsterker-assay. Luciferase-ekspresjonen fra en minimal promoter aktiveres av E47/E-box-forsterkeren i den tomme vektor (E47). Innføyelse av ses- og HS4-elementer eller forskjellige STAR-elementer (STAR'ene 1, 2, 3, 6, 10, 11, 18 og 27) aktiverer ingen transkripsjon av reportergenet. Fig. 20: pSS-codA: :upp-vektor brukt for isolasjon av SINC-elementer. codA::upp-suicid-gen koder for et protein som omvandler prodrogen 5-fluorcytosin til det toksiske middel 5-fluoruracil. Etter induksjon med en senket doksycyklin-konsentrasjon, blir vertcellene følsomme for prodrogen. Genomiske DNA-fragmenter inn-føyd i Bglll-kloningssetet som har forstummende aktivitet, vil forhindre en ekspresjon av suicid-genet og muliggjøre en dannelse av prodroge-resistente kolonier. STAR-elementer flankerer seleksjonskomponentene for å forhindre en spredning av forstummet kromatin til de funksjonelle komponenter av plasmidet. Plasmidet selekteres med hygromycin-resistens-genet etter transfeksjon inn i pattedyrceller, og med amplicillin-resistens-genet etter transformasjon inn i E. coli. Det replikeres episomalt i dyrkede pattedyrceller takket være oriP- og EBNA-l-sekvensene, og i E. coli takket være ori-sekvensen. Fig. 21: pSS-hrGFP-plasmidet er identisk med pSS-codA::upp-plasmidet, unntatt at suicid-genet er blitt erstattet med hrGFP (som koder for grønt fluorescerende protein) og at STAR6 er blitt erstattet med STAR8 nedstrøms for GFP-reportergen. Fig. 22: STAR18-sekvensens konservering mellom mus og menneske. Regionen av det humane genom som inneholder det 497 basepar lange STAR18, vises (sorte bokser); elementet forekommer mellom HOXD8- og HOXD4-homeobox-genene på humant kromosom 2. Det linjestilles med en region av muse-kromosom 2 som har 72% sekvensidentitet. Regionen av humant kromosom 2 som ligger umiddelbart til venstre for STAR18, er også høyt konservert med muse-kromosom 2 (73% identitet; grå bokser). Utenfor disse regioner faller identiteten til under 60%. Evnen av disse regioner fra menneske og mus, enten adskilt eller sammen, til å formidle vekst på zeocin, angis: -: ingen vekst, +: moderat vekst; ++: kraftig vekst; +++: hurtig vekst. Fig. 23: Skjematisk diagram over arbeidsflyten i en bio-informatisk analyse. Se beskrivelsen for detaljer. Fig. 24: Resultater av diskriminansanalyse på klassifikasjonen av trenings-settet med 65 STAR-elementer. STAR-elementer som er korrekt klassifisert som STAR-elementer ved trinnvis lineær diskriminansanalyse (LDA), vises i et Venn-diagram. Variablene for LDA ble valgt utfra resultatene av en hyppighetsanalyse for heksamere oligonukleotider ("oligoer") og for dyader. Diagrammet viser samsvaret mellom de to sett av variabler for å korrekt klassifisere STAR'ene. Fig. 25: U-2 OS/Tet-Off/lexA-HPl-celler ble transfisert med kand\ dat- Arabidopsis-STAR-elementer og dyrket ved lav doksycyklin-konsentrasjon. Det samlede RNA ble isolert og underkastet RT-PCR; båndene som tilsvarer zeocin- og hygromycin-resistens-mRNA'er, ble påvist ved Southern blotting og kvantifisert med en fosfor-imager-anordning. Forholdet mellom zeocin- og hygromycin-signalet vises for transfektanter som inneholdt zeocin-ekspresjonsenheter flankert av 12 forskjellige/4ra£/'c/ops/s-STAR-elementer, Drosop/7/7a-scs-element eller intet flankerende element.
Fig. 26:
Sekvenser omfattende STAR1-STAR65 (SEKV ID: 1-65)
Sekvenser omfattende STAR66 og test-sett (SEKV ID: 66-84)
Sekvenser omfattende Arabidopsis- STAR A1-A35 (SEKV ID: 85-119).
Utteraturhenvisiiiiiger
AltaehtiL S.F. and Giah, W. (1996) Local al%nment statietice, Methods
Enzyma}, 266, 460-480,
AitechttLS.F., Gisli, W., Milter, W., Myers, E.W. and Lipman, D.J (1990)
Basic kcal alignioeiit aearch tool. J Mol Biol, 216,, 403-410.
BbU, AC*West, AG, and Felsenfeld, Q. (3001) Inaulators and boundaries;
versatils regulatory elementa in the eukaryøtie B&uome Science 301,
447*60.
Bennett, B.P., Cox, CA. and Hbefflar, J,P. (199S) Fuaion of green fluora sceat protein wita the Zeocia-rMistance markar alløwe nieual screening and drug selfiCtioii of traasfected eujtaryotic cella, Biotechniquea, 24,478-4S3.
Berger, J, Haufcer, J, Hauber, R, Geiger, R, and Gullen, BH (1988) Secreted plaoentaJ alkaline phoephataae: a pawerful new quantitative indioatar of
gena expraaakin in ei&aryotic cella Gene 66,1-10.
Bevam, M, Mayer, K, White, O, Eisen, JA, Preuss, D, Bureau, T, Salxberg, SL,
and Mewes, HW, (2001) Sequence and analys» cf the Arabidopaia
genome Curr Opin Plant Biol 4,105-10.
Bierhuiseii, M.F., Wéateraan, Y., Visner, TJ?,, Wognum, A W, and Wageinaker, Q. (1997) Green fluorescent protein variants aa market* cif retroviral-mediated game transfer in primary hematøpoietic cella and
røll lines. Biochem Biophya Ses Coauuun»234, 311* 375.
Bdvin, A, and Dura, JM. (1998) ln vivo chromatia acceesibility correlatee with
gene aflenring in Droaophila Genetice 150,1639-49. Boshart, M, Weber, F, Jalm, G, Doraca-Haskr, K, Fleckenstein, B, and Scaaffher, W. ( 1985) A very strong enhaxtcer ia located upatream of an
unmediata eariy gane of human cytoffiefalorrinia Cell 41, 521-30. Sreckenridge, D O. andShora, G,C, (2000) Regulatkm of apoptoeia by EIA and Mye oncoproteinB, Crit Rev Eukaryot Qflna Expr 10, 273-280.
Bunker, CA and Kingston, R.E. (1994) Traaecriptional repwaafcmby Droaophila and mammaHan Polycomb gioup proteins in tranafected
«.amnnliflt. cella. Mol Cali Biol, 14,1721-1732.
Cherry, J.R,, Lamaa, MM,, Sdtaeidar, P., Vind, J„ Svendsen, A., Jones, A. and Pedereen, AH. (1999) Dixected evoktion of a fungal peroædaae, Nat
Bictechnfll. 17, 379-384,
Chung, JH, Wbiteky, M, and Felawnfeid, G. (1993) A 5' element of the draken beta-globut domain aerroe aa an raaulator in human erythroid cella and
protects against poeition efifect in Droaophila Cell 74, 50544. Deuschle, U, Mayer, WK, and Humen, HJ. (1996) Tetraxycbtø-raveraibl»
silencing of eukaryotic pKmurtera Mol Cell Biol 15,1907-14.
DoU, R.F. , Craadall, J.E., Dyer, C-A., Auooin, J.M. and Smith, (199»)
Compariaon of promoter strengths on gene delivery into mwmwli»»
btain cella using AAV vactora. Gena Ther, 3, 437-447.
Vissenberg, J.C., James TC, Foeter-Hartnett D M., Hartnett T., Ngan V., and Elgin S.C.R* (1990) Mutatioa in a lwtMwbjomaitn-spediic chromoeomal protein ia associated with «uppreaøion of po«ifciøn-*ffcc* variegatwn in
Drosophila melanogasUr. Proe Nati Acad Sei (USA) 87:9923-9927. Fan;, Y.Q-, Seibler, J., Alami R.,, Eisen, A, Weatermas. KA, Leboulch, P.,
Fiering, S, and Bouaaseira, B.E. (1999) Site-eperific chromosomal integratiou in manunalian cella: highly effident CRE recombia&se>
mediated caseette exchange. J Mol Biol, 292,779-785.
Fbedting, MK and Hofiatetter, H. (198€) Powerful and vereatiJe enhancer-prømoter unit for manunalian expreeekm vectora Gene 48, 101-5, Gajrick, D, Fiering, S, Martin, DI, and Wbitelaw, E. (1998) Repeat-indooed
gene silencing in mamiials Nat Ganet 19, 58-9.
Gaezner, M., Vazquaz, J. and Schedl, P. (1999) Tha Zw5 protein, a component of the sea chtomatin domain boiindary, is able to block enh&neer-promoter interattiøn. Genee Dev, 13,2098-2107.
Qer&eiraova, TJ, and Corces, V.G. (1998) Polycomb aud trithorax group pttÅtim mediete toe functian of a cbroniatin inaulator. Cell, 92, 511-521..
Geraaimova, TI, and Goroas, VG. (2001) Chxomatui insuktors and bounderias;
effecte on tranecription and nuclear organteationi Annu Rav Ganet 35, 193-208,
Gcfifien, M. and Bujard, H. (1992) Tight control of gane expreisiøii in jnammalian cella by tetratychne-arsponfiiiJ* promotera. Pioc Nati Acad Sei US A, 39, 6547-6551.
Gra Kam, P.L and van der Eb, AJ. (1973) Tfanaføm&idioit of rat oalla by DNA
of human adanovirus 5. Virology, 64, 636-539.
Hatdin, C.H., Johnsson, A., WannergTen, S., Wernstedt, C, Betabølte»C. and Weetennark, B, (1986) A human oeteoaaicoma «11 Boo aecretea a growth factor atruoturaBy related to a homodinter of PDGF A-dbaiiis.
Nature, 319, 611-514.
Honke, E, and Bornscheuer, U.T. (1999) Direeted erolutton of an esteraae from Pseudomonas fluorescens. Bandom mutagenaaia by ecror-pione POR or a uutator atrain and identi&atton of mutante ahowing enhanoed enantioælectiviry by a reaorufin-based fluorescence aeaay. Biol Cbem,
380,1029-1033.
Hesthorn, P, Zervoa, P, Raducfaa, M, HarriB, H, and Kadeeeh, T. (1988)
Expresaioa of a human placental alkalias phoaphataae gens in transfected cella; uae as a reporter fbi studies of gene earpresaton Proe
Nati Acad Sei U S A 85, 6842-6.
Higghu, D.G., Thompson, J.D. andGibaon, T.J. (1996) Uaing CLUSTALfcr
multiple sequence alignraenta. Methoda Ensymol, 266,333-402. Himes, S R. and Shannon, M.F. (2000) Aaaaya for tracscriptional activity
based on the luciferaa» reporter gana, Methoda Mol Biol, 130,166-174. Huberty, CJ (1994) Applied dismniinani analysis, Wiley and Sons, New York.
Ioitiative, AG {2000) Afialyais of the genom*<p>equence of the nowering plant
Arabidopaia thaliana Nature 408, 796-815.
Izurni, M, and Gilbert, DM. (1999} Homogsmeoua tetracydine-regulatable gene
expressjoD in mammalian Sbroblasts J Cell Biachera 76, 280-9.
Jung, R., Soondjfum, K. aad Neunuier, M. (2000) Quantitative PCR. Clin
Chem Lab Med, 38, 833-836,
Kain, SK (1997) Use of sscretod alialine phoBphatase as a reporter of gene
expreaaion in mammalian celle Methoda Mol Biol 68, 49-60.
Kao, F.T, and Puck, T.T. (1968) Genetica of aomatic mammalian cbIIb, VII.
Induction and i<g>olatioo of nutritkmal mutante in Chinese hamster cella.
Proe Nati Acad Sa U 3 A, 60, 1275-81.
Kftthim, R. and Schedl, P. (1992) A group of ses elementa function aa dotnain
boundarifls in an enhsncsr-bJocking assay. Mal CeJl Biol, 12, 2424-2431. Kent, WJ. (2002) BLAT -the BLAST-Mke alignment tool Genome Res 12,666-64.
KnofleT, M, Meinhardt, G, Bauer, S, Loregger, T, Vaaicek, R, Bloor, DJ,
KimbBi-, SJ, and Huasleia, P. (2002) Human Handl basic helix-kop-belix (bHLH) protein:ffirtra-embryonic expression pattern, interactioii partnere and identification of ite traoscriptional represaor damaina
Biochem J 361, 641-51.
Li, W-H (1997) Molecular Evolution, Sinauer AaaoeiateB, Sunderland MA,
Meinke, DW, Cherry, JM, Dean, C, Rounsley, SD, and Koornneef, M.
(1998) Arabidopsis thaliana: a model plant for genome emalyBia Science
282, 662,679-82.
Litt, M.D., Simpson, M., RecillaB-Targa, F„ Priolean, M.N. and Felaenfeld, G.
(2001) Transitions ia kiatoae acetylation reveal boundaries of three
separatdj regulated neighboring loci BMBO J, 20, 2224-2235.
Meyer, P (2000) Traoscriptional transgene silencing and chromatui componentfi Plant Mol Biol 43, 221-34.
Morgens tørn, J.P. and Land, H. (1990) Advanced mammalian gene tranafer: high titra retroviral vectora with multiple drug aelectiøn marken and a complemeatary beiper-frae packaging cell line, Nucleic Acida Bu, 18»
3587-3696.
Multen, CA, Kilatrup, M. and Blaeae, KM. (1992) Transfer of the baeterial gene far cy tOBina deaminase to mammalian ceUs confors Leth al eenaitmty to 5-fluorocytoaine: a negative seJectioDsystem. Proe Nati
Acad Sed U S A, 89, 33*37.
Nan, X., Javier Campoy, F.,, andi Bird A, (1997) MeCP2 ia a traoscriptional repraesor with abundaot binding aitea in genomic chromatin. Geil 88,
471-481.
Petonaon, K, Ivare, F, and Sigvardawn, M. (2002) The pT alpha promoter and enhaocer are direct targets for transactivation by E box-hnråtay
proteins Eur J Immunol 32, 911-20.
Pasån, MJ. and Kadonaga, J.T. (1998) Tranacriptional and structural analyats of chromatin assembled in vitro. In Qould, H. (ed.) Chronuttn: A
PractiGal Approach. Oxford University Preas, Oxford, pp. 172-194. PietBrsen, A. and HM. Noteborn. (2000) Apoptin. Adv Exp Mad Biol 465,153-lfiL
Qnong, MW, Romanow, WJ, and Mune, C. (2002) E protein function in
lymphocyte development Annu Rev Immunol 20, 301-22.
Rueonaky, D, Beckmann, H, and Kadeacb, T. (1991) Modulatiøn of the IgH
enhancerfe cell type specificity thiough a genette switch Genes Bev 5,
29*37.
Saluz, H.P. and Joet, J J. (1998) Approachea to chaiactarize protein-DNA
interacttona in vivø. Crit Rev Eukaryot Gene Expr, 3,1-29.
Sambrook, J., Fritech, E.F, and Mamatia, T. (1989) Molecular Cloning: A
Laboratory Manual. Cold Spring Harbor Laboratory Preas, Plainnew
NY.
Sanger, F„ Nidden, S. and Coulson, A.R. (1977) DNA asquencing with chain-tuininatiDg inhibitora. Proe Nati Acad Sei US A, 74, 6468-5467.
Sinusu, B,, Rhini, J.S. and Wisbanga, N.H. (1987) Charactariaation of tha Tacaribe group of azooviruaea. I. Propagation and plaqae aeeay of Tacarioe virus in a lina of African green mookey Idduey cella (Varo). Proe Boe Bsp Biol Med, 125,119-123.
Smith, R.L., Traul, D.L., Schaack, J., Claytøn, Q.H., Staley, Kj. and Wllooi, CL. (2000) Characterization of promoter runchøn and cell-type-spedfic expression from vira! vecton in the nervoue system. J Virol, 74,11254-11261.
Stant, M, Viterbo, A Mol, JN, and Kboter, JM. (1996) Position-dependent methylation and tranecriptianal ailancing of transgenee in iaverted T-DNA xepeate: implicationa for posttraascriptional cilendng of homologous hoet genes in plants Mol CeU Biol 18,6165-77.
Stull R A-, Hyun, W C. and Pallaviciiu, M.G. (2000) SimvutanBoae flow cytometric aaalyaea of enhanoed green and yellow fluorescert proteina and oell surfat» antigena in doubly tranaducsd inunature kamatopoietø cell populationa. Cytometry, 40,126-134.
Takada, T., lida, K, Akaaaka, K, Yaatie, H., Tbrii, R, Tsujunoto, Q., Tava, M.
and Kim ura, H. (2000) Evaluation of heterdbgoua inaulator ninction with re gard to chromosomal positron ef&ct in the mouaa blaatocyat and fetuB. Mol ReprodDev, 57, 232-237.
Tanaka, S.( Livingstone-Zatchej, M. and Thoma, F. (1996) Chromatra atructuré of the yeast URA3 gene at high reaolution pxovidea ineight into structure and pcaitiorung of nucleoaomes in the chromoeomal
coutext. J Mol Biol, 257,919-934.
Thomas, J.O. (1998) Isolation and fractionation of chromatui and linker uiatonefi. In GooJd, H. (ed.) Chromatui: A Practkal Approach. Oxford University Preas, Oxford, pp, 1-34.
Tiraby, M., Casaux, C, Baron, M., Brøcouit, D„ Beynes, JJ<*.>and Tiraby, G.
(1998) CorLComitant expreasion of E, coli cytoeine deaminaee and uracdl
pnoaphoruwayltraiia&rasa impravee the cytotoncity «f S-fliaoørytoai&a.
FEMS Microbiol Lett, 167,41-49.
Umana, P, Jean-Mairet, J, and Bailey, JE. (1999) Tetracycliue-rBgulated overexpreasion of grycoflyltranaféraaea in Chinese hamster ovary cella
Biotechnol Bioeng 66, B42-9.
van der Vlag, J., dan Rliaauwen, J.L., Sewalt, R.&, van Driel, R. and Otte, AJ<*>.
(2000) Tranecriptional repreaaion me diated by polycornb group proteina and other ^amatin-aeeociated represeore is selectivety blocked by insulators. J Biol Chem, 275, 697-704.
van Helden, J, Andre, B, and CoDado-Yides, J. (1998) Extracting regulatory aites from the upstrBam region of yeaat genea by computational anah/aia
of oligonudeotide frequsncieB J Mol Biol 281, 827-42.
van Helden, J, Andre, B, and CoHado-Videe, J. (2000) A web nite for the
coraputationai analysia of yeaat re gula tory sequences Yeast 16,177-87. van Helden, J, Rias, AF, and Cdlado-Videa, J. (2000) Diaccroiing ragtrfauwy elements in non-ccding sequences by anaJysis of apaoed dyadls Nudeic
Arids Raa 28,1808-18.
Van», V, and Vaucheret, H. (2001) RNA suencing in plants-defianse and
countardefenfie Science 292,2277-80.
Walfeath, L.L., Swede, M.J. and Elgin, S.C.H. (1998) Mapping chromatui structure in IJrosophua. In GoukL H. (ed.) Chromatin: A Fractical
Approach. Oxford University Preas, Oxford, pp. 59-77.
Weaver, L.S. and Kadan, M.J. (2000) Evaluation of adenoviral vectora by flow
cytometry. Methoda, 21,297-312.
Wei, EL and Huber, B.B. (1996) Cytoeine deaminase gana as a positive selection marker. J Biol Chem 271, 3812-3816.
Wigler, M, Pellicar, A., Sil vers te in, S «.md Axel, JL (1978). Biocibemical transfer of single-copy euksxyotic genes using total cellular DNA as donor. CaU
14, 725-73L
Wigley, P., Becker, C, Beltrame, J., Blaks, T., Crocker, L, Harrison, S„ Lyons,
I., McKsnxte, Z., Tearla, R,, Cra-wfhrd, R. and et al. (1994) Site-apedffc
transgene uisertLon: an approacL Reprod Fertil Dav, 6, 5&S-&88.
Xu, Z. Z., Krougliak, V„ Prevee, L., GraJiajn. F.L. and Both, G.W. (1995)
Inve&tigation of promoter function in human and animal cetts iufected with human reoombinant adlenovirus eipresaing rotaviiua antigen
VP7ac. J Gen VTid, 76, 1971-1980.
Tang, TT, Sinai, P, Kitte, PA, and Kain, SR, (1997) Quantincation of gena exprasaion with a aeorefced sJkaline phoaphatase reporter systera
Biotachniquea 23. 1110-4.
Yin, DX, Zhu, and Scbimke RT. (1996) Tetracydin-controlled gene expraesion ayatem achiavea high-level and o,«antitative contra! of gene
éipreasion. AnaJyt Biocham 235,195-201.
Zink, D, and Paro, R (1995) Droeophila Polycomb group reguJatad chromatin inbJhita the aoceeaibility of a trane-atfivator to ite target UNA Embo J 14, 5660-71.
Ekspresjon av luciferase-erportergenet måles i cellelinjer som inneholder integrerte pSDH-pla&mider, uten {"tom", negativ-kontrollen) eller som inneholder STAR-elementer (omfattende positiv-kontrollelementct, SCS faDrosophila). Det midlere ekspresjonsnivå av negativ-kontrollen defineres som referansenivået, og kloner auses å ovw-uttrykke hvis deres ekspresjonsnivå et > 2 ganger så høyt som referansenivået. Prosentdelen ovw-uttrykkende kloner for hvert plasmid og mangedoblingen av aver-ekspresjonen oppgis, sammen med antallet kloner som ble analysert for hvert plasmid.
Tabell 4 A: Sekvensen av forskjellige STAR-elementer i én kjede (fremad) eller motsatt kjede (revers)
Tabell 4 B: Sekvensen av forskjellige SINC-elementer
Tabell 5: OUgømuldeotider brukt til polymerase-kjedereaksjoner (PCR-primere) elkr DNA-mutagenes*
Tabell 10: Dyade-mønstre som er overrepresentert t STAR-elementer Mønstrene er rangert i henhold til signifikanskoeffisienten. Disse ble bestemt ved bruk av RSA-verktøy med den tilfeldige sekvens fra det humane genom som referanse. Mønstre som omfatter de mest skjelnende variabler i lineær diskriminansanalys*, er merket med en stjerne.

Claims (9)

1. Fremgangsmåte for utvelgelse av en DNA-sekvens som er i stand til i det minste delvis å motvirke dannelsen av gen-transkripsjonsundertrykkende kromatin, omfattende å fremskaffe et transkripsjonssystem omfattende vertsceller med en mengde fragment-omfattende vektorer, hvor nevnte vektorer omfatter fragmenter av humant genomisk DNA, hvor nevnte vektorer ytterligere omfatter i) et element med en gen-transkripsjons-undertrykkende kvalitet som resulterer i gen-transkripsjons-undertrykkende kromatin og ii) en promoter som dirigerer transkripsjon av et zeocin resistensgen, hvor transkripsjonen av dette zeocin resistensgen blir undertrykket av den gen-transkripsjonshemmende kvaliteten, hvor fremgangsmåten ytterligere omfatter å utføre et utvelgelsestrinn i nevnte transkripsjonssystem ved å dyrke vertscellene under zeocin-seleksjon ved en konsentrasjon og varighet hvorved kontrollkulturer blir drept av zeocinet for å identifisere vertsceller som overlever zeocin-seleksjonen, og hvor nevnte vertsceller omfatter en vektor med et fragment av humant genomisk DNA som omfatter nevnte DNA-sekvens som er i stand til i det minste delvis å motvirke dannelsen av gentranskripsjons-undertrykkende kromatin.
2. Fremgangsmåte ifølge krav 1, hvor nevnte genomiske humane DNA ble størrelses-fraksjonert til omkring 0,5 til 2 kilobaser.
3. Fremgangsmåte ifølge ethvert av de foregående krav, hvor konsentrasjonen av zeocin er 250 mikrogram per ml og varigheten er 5 uker.
4. Fremgangsmåte ifølge ethvert av de foregående krav, hvor elementet omfattende den gentranskripsjons-hemmende kvalitet er en DNA-sekvens som blir gjenkjent av et proteinkompleks og hvor nevnte transkripsjonssystem omfatter nevnte kompleks.
5. Fremgangsmåte ifølge krav 4, hvor nevnte4 kompleks omfatter et heterokromatin-bindende protein HP1, et Polycomb-gruppe (Pc-G)-protein, en histon-deacetylase-aktivitet eller MeCP2 (metyl-CpG-bindende) protein.
6. Fremgangsmåte ifølge ethvert av de foregående krav, hvor vektoren er en episomalt replikerende vektor.
7. Fremgangsmåte ifølge ethvert av de foregående krav, hvor vektoren omfatter en replikasjonsstart fra Epstein-Barr-viruset (EBV), OriP samt et kjerneantigen ((EBNA-1).
8. Fremgangsmåte ifølge ethvert av de foregående krav omfattende det ytterligere trinn å isolere DNA-fragmenter utvalgt til å være i stand til i det minste delvis å motvirke dannelsen av gen-transkripsjons-hemmende kromatin.
9. Fremgangsmåte ifølge krav 8, omfattende det ytterligere trinn å analysere et isolert DNA-fragment for å være i stand til i det minste delvis en av de følgende funksjoner: (i) i det minste delvis å blokkere kromatin-assosiert represjon, (ii) minst delvis å blokkere aktiviteten av en forsterker, (iii) å gi til en operabelt tilknyttet nukleinsyre som koder for en transkripsjonsenhet i forhold til den samme nukleinsyre alene: (iii-a) en høyere transkripsjonsforutsigbarhet, (iii-b) en høyere transkripsjon og/eller (iii-c) en høyere transkripsjonsstabilitet over tid.
NO20040011A 2001-07-04 2004-01-02 DNA-sekvenser med gentranskripsjonsregulatoriske egenskaper samt fremgangsmåter ved påvisning og anvendelse av slike DNA-sekvenser NO338477B1 (no)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP01202581A EP1273666A1 (en) 2001-07-04 2001-07-04 Method of selecting a DNA sequence with transcription modulating activity using a vector comprising an element with a gene transcription repressing activity
US30319901P 2001-07-05 2001-07-05
PCT/NL2002/000390 WO2003004704A2 (en) 2001-07-04 2002-06-14 Method of selecting dna sequence with transcription modulating activity using a vector comprising an element with a gene transcription repressing activity
US10/190,312 US7192741B2 (en) 2001-07-04 2002-07-05 DNA sequences comprising gene transcription regulatory qualities and methods for detecting and using such DNA sequences

Publications (2)

Publication Number Publication Date
NO20040011L NO20040011L (no) 2004-03-03
NO338477B1 true NO338477B1 (no) 2016-08-22

Family

ID=47915807

Family Applications (1)

Application Number Title Priority Date Filing Date
NO20040011A NO338477B1 (no) 2001-07-04 2004-01-02 DNA-sekvenser med gentranskripsjonsregulatoriske egenskaper samt fremgangsmåter ved påvisning og anvendelse av slike DNA-sekvenser

Country Status (22)

Country Link
US (9) US7192741B2 (no)
EP (8) EP1600510B1 (no)
JP (3) JP4500044B2 (no)
KR (2) KR100942117B1 (no)
CN (1) CN1266282C (no)
AT (8) ATE466943T1 (no)
AU (3) AU2002314629B2 (no)
BR (1) BRPI0210771B8 (no)
CA (2) CA2450020C (no)
CY (1) CY1107678T1 (no)
DE (8) DE60236331D1 (no)
DK (8) DK1829971T3 (no)
ES (8) ES2285630T3 (no)
HK (1) HK1068652A1 (no)
IL (4) IL159674A0 (no)
MX (1) MXPA03011801A (no)
NO (1) NO338477B1 (no)
NZ (1) NZ530218A (no)
PT (1) PT1600510E (no)
SG (1) SG143066A1 (no)
WO (1) WO2003004704A2 (no)
ZA (1) ZA200309599B (no)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60236331D1 (de) 2001-07-04 2010-06-17 Chromagenics Bv DNS-Sequenzen mit Anti-Repressor-Aktivität
CA2723500C (en) 2002-06-14 2014-10-28 Chromagenics B.V. A method for simultaneous production of multiple proteins; vectors and cells for use therein
WO2003106674A2 (en) * 2002-06-14 2003-12-24 Chromagenics B.V. Means and methods for regulating gene expression
ES2368733T3 (es) 2002-07-18 2011-11-21 Merus B.V. Producción recombinante de mezclas de anticuerpos.
USRE47770E1 (en) 2002-07-18 2019-12-17 Merus N.V. Recombinant production of mixtures of antibodies
NZ540471A (en) 2002-12-18 2008-07-31 Chromagenics Bv A method for improving protein production
AU2003290453A1 (en) 2002-12-20 2004-07-14 Chromagenics B.V. Means and methods for producing a protein through chromatin openers that are capable of rendering chromatin more accessible to transcription factors
US20100069614A1 (en) 2008-06-27 2010-03-18 Merus B.V. Antibody producing non-human mammals
CA2527694C (en) 2003-05-30 2015-07-14 Hendricus Renerus Jacobus Mattheus Hoogenboom Fab library for the preparation of anti vegf and anti rabies virus fabs
DK1670925T3 (da) 2003-10-02 2013-07-08 Crucell Holland Bv Pakningsceller til rekombinat adenovirus
WO2005059149A2 (en) * 2003-12-12 2005-06-30 Chromagenics B.V. Improved protein production
EP1737971B1 (en) 2004-01-20 2017-08-16 Merus N.V. Mixtures of binding proteins
PT1763586E (pt) * 2004-07-08 2008-02-25 Chromagenics Bv Nova sequência para melhorar a expressão de ácido nucleico
EP1786908B1 (en) * 2004-08-18 2010-03-03 Bayer CropScience AG Plants with increased plastidic activity of r3 starch-phosphorylating enzyme
SI1809750T1 (sl) * 2004-11-08 2012-08-31 Chromagenics Bv Izbira gostiteljskih celic, ki imajo visok nivo izraĹľanja proteina
US20100136616A1 (en) * 2004-11-08 2010-06-03 Chromagenics B.V. Selection of Host Cells Expressing Protein at High Levels
CA2581422C (en) 2004-11-08 2012-05-22 Chromagenics B.V. Selection of host cells expressing protein at high levels
US8999667B2 (en) 2004-11-08 2015-04-07 Chromagenics B.V. Selection of host cells expressing protein at high levels
US8039230B2 (en) 2004-11-08 2011-10-18 Chromagenics B.V. Selection of host cells expressing protein at high levels
US20060195935A1 (en) * 2004-11-08 2006-08-31 Chromagenics B.V. Selection of host cells expressing protein at high levels
CA2587712C (en) * 2004-11-18 2013-02-12 National University Of Corporation Hiroshima University Method and kit for expressing protein under regulation of the expression from repeated sequence formed by gene amplification and transformant
US7968700B2 (en) 2006-03-20 2011-06-28 Chromagenics B.V. Expression augmenting DNA fragments, use thereof, and methods for finding thereof
US20080124760A1 (en) 2006-07-26 2008-05-29 Barbara Enenkel Regulatory Nucleic Acid Elements
US20090142805A1 (en) * 2007-01-08 2009-06-04 Millipore Corporation High expression cell line that eliminates gene amplification
DK2443239T3 (en) 2009-06-15 2016-02-15 Cellagenics B V New stringent selection markers
US8566596B2 (en) 2010-08-24 2013-10-22 Cisco Technology, Inc. Pre-association mechanism to provide detailed description of wireless services
DK2611915T3 (da) 2010-09-01 2015-06-22 Cellagenics B V Nukleinsyrefragmenter fra en ribosomal proteinpromoter til forstærkning af genekspression
MX360109B (es) 2012-04-20 2018-10-23 Merus Nv Metodos y medios para la produccion de moleculas de tipo ig.
US11180572B2 (en) 2012-07-06 2021-11-23 Genmab B.V. Dimeric protein with triple mutations
SI2900694T1 (sl) 2012-09-27 2018-12-31 Merus N.V. Bispecifična IGG protitelesa kot vključitelji T-celic
US10417380B1 (en) 2013-12-31 2019-09-17 Mckesson Corporation Systems and methods for determining and communicating a prescription benefit coverage denial to a prescriber
US10489552B2 (en) 2014-02-14 2019-11-26 Mckesson Corporation Systems and methods for determining and communicating patient incentive information to a prescriber
NZ724013A (en) 2014-02-28 2019-11-29 Merus Nv Antibodies that bind egfr and erbb3
IL301147A (en) 2014-02-28 2023-05-01 Merus Nv An antibody that binds to ErbB-2 and ErbB-3
US10157262B1 (en) 2015-03-10 2018-12-18 Mckesson Corporation Systems and methods for determining patient financial responsibility for multiple prescription products
CN108026174B (zh) 2015-07-10 2023-02-17 美勒斯公司 人cd3结合抗体
AU2016340764B2 (en) 2015-10-23 2023-06-01 Fundació lnstitut de Recerca Biomèdica (IRB Barcelona) Binding molecules that inhibit cancer growth
US11514137B1 (en) 2016-03-30 2022-11-29 Mckesson Corporation Alternative therapy identification system
US10999224B1 (en) 2017-02-01 2021-05-04 Mckesson Corporation Method and apparatus for parsing an electronic message and constructing multiple differently prioritized messages therefrom
EP3600413A1 (en) 2017-03-31 2020-02-05 Merus N.V. Erbb-2 and erbb3 binding bispecific antibodies for use in the treatment f cells that have an nrg1 fusion gene
MX2020001432A (es) 2017-08-09 2020-03-20 Merus Nv Anticuerpos que se unen al receptor del factor de crecimiento epidermico (egfr) y tirosina-proteina cinasa met (cmet).
US10862832B1 (en) 2018-07-24 2020-12-08 Mckesson Corporation Computing system and method for automatically reversing an action indicated by an electronic message
US11043437B2 (en) 2019-01-07 2021-06-22 Applied Materials, Inc. Transparent substrate with light blocking edge exclusion zone
US11562437B1 (en) 2019-06-26 2023-01-24 Mckesson Corporation Method, apparatus, and computer program product for providing estimated prescription costs
US11636548B1 (en) 2019-06-26 2023-04-25 Mckesson Corporation Method, apparatus, and computer program product for providing estimated prescription costs
EP3772518A1 (en) 2019-08-07 2021-02-10 Merus N.V. Modified human variable domains
WO2021155369A1 (en) * 2020-01-31 2021-08-05 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods to identify genetic silencers and applications thereof
US11610240B1 (en) 2020-02-17 2023-03-21 Mckesson Corporation Method, apparatus, and computer program product for partitioning prescription transaction costs in an electronic prescription transaction
IL298394A (en) 2020-05-21 2023-01-01 Merus Nv Methods and means for producing ig-like molecules
US11587657B2 (en) 2020-09-04 2023-02-21 Mckesson Corporation Method, apparatus, and computer program product for performing an alternative evaluation procedure in response to an electronic message

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998011207A2 (en) * 1996-09-16 1998-03-19 Geron Corporation Assays for regulators of mammalian telomerase expression
WO2000009749A1 (en) * 1998-08-14 2000-02-24 Stichting Voor De Technische Wetenschappen Method of detecting a dna sequence, a dna sequence, a method of making a dna construct and the use thereof

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US719271A (en) * 1902-01-13 1903-01-27 Solomon P Smith Furnace.
US5610053A (en) 1993-04-07 1997-03-11 The United States Of America As Represented By The Department Of Health And Human Services DNA sequence which acts as a chromatin insulator element to protect expressed genes from cis-acting regulatory sequences in mammalian cells
EP0818536A4 (en) * 1995-03-24 2000-09-06 Shionogi & Co DNA MOLECULE DRAWN ON THE SUPPRESSION OF THE GENE EXPRESSION AND CORRESPONDING PROTEIN
DE19539493A1 (de) * 1995-10-24 1997-04-30 Thomae Gmbh Dr K Starker homologer Promotor aus Hamster
US5773695A (en) 1996-01-26 1998-06-30 North Carolina State University Plant nuclear scaffold attachment region and method for increasing gene expression in transgenic cells
US6037525A (en) * 1996-08-01 2000-03-14 North Carolina State University Method for reducing expression variability of transgenes in plant cells
US5888809A (en) 1997-05-01 1999-03-30 Icos Corporation Hamster EF-1α transcriptional regulatory DNA
WO2000005393A2 (en) 1998-07-21 2000-02-03 Cobra Therapeutics Limited A polynucleotide comprising a ubiquitous chromatin opening element (ucoe)
US6521419B1 (en) 1998-09-22 2003-02-18 Kanakaraju Koduri Expression vectors containing hot spot for increased recombinant protein expression in transfected cells
US6800457B2 (en) 1998-09-22 2004-10-05 Bristol-Myers Squibb Company Expression vectors containing hot spot for increased recombinant protein expression in transfected cells
AU1128400A (en) 1998-10-22 2000-05-08 Medical College Of Georgia Institute, Inc. Long terminal repeat, enhancer, and insulator sequences for use in recombinant vectors
AU784506B2 (en) * 1999-08-25 2006-04-13 Immunex Corporation Compositions and methods for improved cell culture
US20030166042A1 (en) 2000-02-11 2003-09-04 Millennium Pharmaceuticals, Inc. Novel seven-transmembrane proteins/G-protein coupled receptors
US6586205B1 (en) 2000-02-11 2003-07-01 Millennium Pharmaceuticals, Inc. 43239 a novel GPCR-like molecule and uses thereof
EP1430124B1 (en) 2000-09-20 2013-11-06 EMD Millipore Corporation Artificial ubiquitous chromatin opening elements (ucoe)
DE60236331D1 (de) 2001-07-04 2010-06-17 Chromagenics Bv DNS-Sequenzen mit Anti-Repressor-Aktivität
EP1273666A1 (en) 2001-07-04 2003-01-08 Chromagenics B.V. Method of selecting a DNA sequence with transcription modulating activity using a vector comprising an element with a gene transcription repressing activity
CA2723500C (en) * 2002-06-14 2014-10-28 Chromagenics B.V. A method for simultaneous production of multiple proteins; vectors and cells for use therein
WO2003106674A2 (en) 2002-06-14 2003-12-24 Chromagenics B.V. Means and methods for regulating gene expression
NZ540471A (en) 2002-12-18 2008-07-31 Chromagenics Bv A method for improving protein production
AU2003290453A1 (en) 2002-12-20 2004-07-14 Chromagenics B.V. Means and methods for producing a protein through chromatin openers that are capable of rendering chromatin more accessible to transcription factors

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998011207A2 (en) * 1996-09-16 1998-03-19 Geron Corporation Assays for regulators of mammalian telomerase expression
WO2000009749A1 (en) * 1998-08-14 2000-02-24 Stichting Voor De Technische Wetenschappen Method of detecting a dna sequence, a dna sequence, a method of making a dna construct and the use thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Van der vlag Johen ET AL. Transcriptional repression mediated by polycomb group proteins and other chromatin-associated repressors is selectively blocked by insulators. Journal of biological chemistry. 200, Vol.275, No. 1, Side 697-704. , Dated: 01.01.0001 *

Also Published As

Publication number Publication date
US20070037256A1 (en) 2007-02-15
AU2002314629B2 (en) 2007-08-30
AU2007234619A1 (en) 2007-12-13
EP1600510B1 (en) 2007-03-28
US7192741B2 (en) 2007-03-20
EP1829972B1 (en) 2010-05-12
PT1600510E (pt) 2007-06-25
EP1829971A3 (en) 2008-06-04
US20070031934A1 (en) 2007-02-08
EP1806407B1 (en) 2010-05-05
EP1829971A1 (en) 2007-09-05
ATE474053T1 (de) 2010-07-15
KR20090037485A (ko) 2009-04-15
DK1808488T3 (da) 2010-10-18
JP4500044B2 (ja) 2010-07-14
CY1107678T1 (el) 2013-04-18
ES2285630T3 (es) 2007-11-16
DK1842919T3 (da) 2010-08-16
EP1842919B1 (en) 2010-05-05
DE60237048D1 (de) 2010-08-26
DE60215502T2 (de) 2007-08-30
ATE466941T1 (de) 2010-05-15
EP1404872B1 (en) 2006-10-18
KR100942117B1 (ko) 2010-02-12
ES2274045T3 (es) 2007-05-16
US20070031936A1 (en) 2007-02-08
JP2010131024A (ja) 2010-06-17
ATE467682T1 (de) 2010-05-15
JP2004533262A (ja) 2004-11-04
NZ530218A (en) 2005-09-30
EP1808488A3 (en) 2007-11-14
CA2450020C (en) 2013-08-13
EP1829972A2 (en) 2007-09-05
HK1068652A1 (en) 2005-04-29
KR100942116B1 (ko) 2010-02-12
US7662591B2 (en) 2010-02-16
DK1845162T3 (da) 2010-08-16
ATE466942T1 (de) 2010-05-15
DE60236334D1 (de) 2010-06-17
US7659094B2 (en) 2010-02-09
AU2011202193B2 (en) 2011-09-29
DE60236333D1 (de) 2010-06-17
BR0210771A (pt) 2004-07-13
MXPA03011801A (es) 2005-03-07
ES2344074T3 (es) 2010-08-17
DK1404872T3 (da) 2007-02-19
BRPI0210771B1 (pt) 2015-12-22
ZA200309599B (en) 2006-05-31
EP1845162B1 (en) 2010-05-05
EP1808488A2 (en) 2007-07-18
US20070128717A1 (en) 2007-06-07
US20030199468A1 (en) 2003-10-23
ES2344072T3 (es) 2010-08-17
IL193373A (en) 2010-12-30
NO20040011L (no) 2004-03-03
DK1806407T3 (da) 2010-08-16
EP1829972A3 (en) 2007-10-24
ATE466943T1 (de) 2010-05-15
US7749733B2 (en) 2010-07-06
CA2812799C (en) 2016-01-26
EP1808488B1 (en) 2010-07-14
IL159674A0 (en) 2004-06-20
CN1524128A (zh) 2004-08-25
EP1600510A3 (en) 2006-02-22
JP5014443B2 (ja) 2012-08-29
US7736870B2 (en) 2010-06-15
ES2348174T3 (es) 2010-11-30
EP1842919A1 (en) 2007-10-10
DE60219221T2 (de) 2008-01-03
EP1404872A2 (en) 2004-04-07
EP1600510A2 (en) 2005-11-30
KR20090037960A (ko) 2009-04-16
DE60236379D1 (de) 2010-06-24
US20070026499A1 (en) 2007-02-01
JP5014444B2 (ja) 2012-08-29
US7736868B2 (en) 2010-06-15
US20070026498A1 (en) 2007-02-01
AU2011202193A1 (en) 2011-06-02
WO2003004704A2 (en) 2003-01-16
ES2344073T3 (es) 2010-08-17
IL159674A (en) 2009-02-11
US7655441B2 (en) 2010-02-02
US20070031935A1 (en) 2007-02-08
ES2344071T3 (es) 2010-08-17
CA2450020A1 (en) 2003-01-16
ATE343004T1 (de) 2006-11-15
EP1845162A1 (en) 2007-10-17
EP1806407A3 (en) 2008-06-04
DE60215502D1 (de) 2006-11-30
ATE358183T1 (de) 2007-04-15
SG143066A1 (en) 2008-06-27
US7736869B2 (en) 2010-06-15
EP1829971B1 (en) 2010-05-05
JP2010131025A (ja) 2010-06-17
IL193374A (en) 2010-12-30
DK1600510T3 (da) 2007-06-25
ATE466944T1 (de) 2010-05-15
US7951586B2 (en) 2011-05-31
ES2344070T3 (es) 2010-08-17
DE60236331D1 (de) 2010-06-17
US20070031933A1 (en) 2007-02-08
CA2812799A1 (en) 2003-01-16
DK1829972T3 (da) 2010-09-13
DE60219221D1 (de) 2007-05-10
CN1266282C (zh) 2006-07-26
EP1806407A2 (en) 2007-07-11
DE60236332D1 (de) 2010-06-17
WO2003004704A3 (en) 2003-10-16
AU2007234619B2 (en) 2011-06-02
DK1829971T3 (da) 2010-08-16
BRPI0210771B8 (pt) 2021-05-25

Similar Documents

Publication Publication Date Title
NO338477B1 (no) DNA-sekvenser med gentranskripsjonsregulatoriske egenskaper samt fremgangsmåter ved påvisning og anvendelse av slike DNA-sekvenser
JP2004533262A5 (no)
AU2002314629A1 (en) Method of selecting DNA sequence with transcription modulating activity using a vector comprising an element with a gene transcription repressing activity
CA2812821C (en) Dna sequences comprising gene transcription regulatory qualities and methods for detecting and using such dna sequences

Legal Events

Date Code Title Description
MK1K Patent expired