NL1012782C2 - New variant of the green fluorescent protein gene, useful for expressing labels, particularly for genetic or expression labeling, has e.g. better solubility or shifted excitation spectrum - Google Patents

New variant of the green fluorescent protein gene, useful for expressing labels, particularly for genetic or expression labeling, has e.g. better solubility or shifted excitation spectrum Download PDF

Info

Publication number
NL1012782C2
NL1012782C2 NL1012782A NL1012782A NL1012782C2 NL 1012782 C2 NL1012782 C2 NL 1012782C2 NL 1012782 A NL1012782 A NL 1012782A NL 1012782 A NL1012782 A NL 1012782A NL 1012782 C2 NL1012782 C2 NL 1012782C2
Authority
NL
Netherlands
Prior art keywords
gfp
variant
protein
wild type
amino acid
Prior art date
Application number
NL1012782A
Other languages
Dutch (nl)
Inventor
Adrianus Cornelis Jac Frijters
Michiel Theodoor Jan De Both
Original Assignee
Keygene Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Keygene Nv filed Critical Keygene Nv
Priority to NL1012782A priority Critical patent/NL1012782C2/en
Application granted granted Critical
Publication of NL1012782C2 publication Critical patent/NL1012782C2/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8209Selection, visualisation of transformants, reporter constructs, e.g. antibiotic resistance markers
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43595Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from coelenteratae, e.g. medusae
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/582Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with fluorescent label
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Urology & Nephrology (AREA)
  • Immunology (AREA)
  • Hematology (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

Variant (I) of the green fluorescent protein (gfp) gene, and nucleic acid constructs containing it, also their equivalents or analogs, and their fragments, having at least one mutation that encodes a protein with better solubility, a red or blue shift in the excitation spectrum, better dual-excitation properties or stronger fluorescence, relative to wild-type green fluorescent protein (GFP). Variant (I) of the gfp gene, and nucleic acid constructs containing it, also their equivalents or analogs, and their fragments, having at least one mutation that encodes a protein with: (i) better solubility; (ii) a red or blue shift in the excitation spectrum; (iii) better dual-excitation properties; (iv) stronger fluorescence relative to wild-type green fluorescent protein (GFP). The mutations are in codons encoding: (i) amino acids (aa) 99, 153 and/or 163 (improved solubility); (ii) aa 65, 66 and/or 67 (red/blue shift); (iii) aa 163, 167 and/or 175 (dual excitation) and (iv) aa 64 (stronger fluorescence. Independent claims are also included for the following: (1) variants (II) of GFP encoded by, or produced by expression of, (I); and (2) organism (plant, animal, human, alga, yeast, bacterium or other microorganism), or derived cells or cell lines, that contain (I) and/or express (II).

Description

Verbeterde gfp-variant, bruikbaar als markering, en g/p-construct.Improved gfp variant, usable as a marker, and g / p construct.

De onderhavige aanvrage betreft een variant van het gfp-gen, die gebruikt kan worden als label of markering in (micro-)biologische, biochemische en/of moleculair-5 biologische technieken, in het bijzonder als een genetische markering en/of expressie-markering in vivo.The present application relates to a variant of the gfp gene, which can be used as a label or marker in (micro) biological, biochemical and / or molecular biological techniques, in particular as a genetic marker and / or expression marker in vivo.

De aanvrage heeft verder betrekking op een nucleïnezuursequentie of genetisch construct die/dat voor de verbeterde g/p-variant volgens de aanvrage codeert.The application further relates to a nucleic acid sequence or genetic construct encoding the improved g / p variant of the application.

De aanvrage betreft verder het fluorescerende eiwit dat door deze variant van het 10 gfp-gen gecodeerd wordt, alsmede de toepassing van de gfp- variant volgens de uitvinding en/of het hierdoor gecodeerde eiwit als label of markering.The application further relates to the fluorescent protein encoded by this variant of the gfp gene, as well as the use of the gfp variant according to the invention and / or the protein encoded thereby as a label or marker.

Het wildtype gfp-gen, het hierdoor gecodeerde eiwit, alsmede het gebruik hiervan als label of markering, zijn bekend, onder meer uit de hieronder genoemde stand der techniek. Het wildtype gfp-gen, dat afkomstig is uit de kwal Aequorea 15 victoria, is ongeveer 720 bp groot en codeert voor een fluorescerend eiwit ("Green Fluorescent Protein" of "GFP" van ongeveer 238 aminozuren.The wild-type gfp gene, the protein encoded thereby, as well as its use as a label or marker, are known, inter alia, from the prior art mentioned below. The wild-type gfp gene, which comes from the jellyfish Aequorea victoria, is about 720 bp in size and encodes a fluorescent protein ("Green Fluorescent Protein" or "GFP" of about 238 amino acids.

In de stand der techniek zijn ook een aantal varianten van het wildtype gfp-gen en GFP-eiwit en het gebruik hiervan als marker of label beschreven, waarvoor wordt verwezen naar de in Tabel 1 genoemde stand der techniek, alsmede naar bijvoorbeeld 20 WO 95/07463, WO 95/21191, WO 96/23810, WO 96/23898, WO 96/27675, WOA number of variants of the wild-type gfp gene and GFP protein and their use as a marker or label have also been described in the prior art, for which reference is made to the prior art listed in Table 1, as well as, for example, WO 95 / 07463, WO 95/21191, WO 96/23810, WO 96/23898, WO 96/27675, WO

97/11094, WO 97/20078, WO 97/41228, WO 97/42320, WO 98/06737, WO 98/21355, WO 98/36081, US-A-5,491,084, US-A-5,625,048, US-A-5,741,668, US-A-5,777,079, US-A-5,804,387 en US-A-5,811,238.97/11094, WO 97/20078, WO 97/41228, WO 97/42320, WO 98/06737, WO 98/21355, WO 98/36081, US-A-5,491,084, US-A-5,625,048, US-A- 5,741,668, US-A-5,777,079, US-A-5,804,387 and US-A-5,811,238.

Doel van de uitvinding is het verschaffen van een verbeterde gfp-variant. Meer 25 in het bijzonder is het doel van de uitvinding het verschaffen van een verbeterde gfp-variant, die -vergeleken met zowel het wildtype gfp als de bekende varianten hiervan-een combinatie vertoont van de volgende eigenschappen: verbeterde oplosbaarheid van het gecodeerde eiwit, met name in biologische vloeistoffen of -media zoals bijvoorbeeld voorkomen in de (levende) cellen 30 waarin het mutante gfp tot expressie wordt gebracht; versterkte fluorescentie van het gecodeerde eiwit; 1012782 2 verschuiving van de (voornaamste) excitatiepiek van/voor het gecodeerde eiwit naar het rode, dan wel naar het blauwe uiteinde van het electromagnetische spectrum; (versterkte) dubbele excitatiepiek van het gecodeerde eiwit; en/of 5 - verbeterde verenigbaarheid van het gen of eiwit met (heterologe) biologische systemen in vivo, zoals verbeterde expressie.The object of the invention is to provide an improved GFP variant. More specifically, the object of the invention is to provide an improved gfp variant, which - compared to both the wild-type gfp and the known variants thereof - exhibits a combination of the following properties: improved solubility of the encoded protein, with especially in biological fluids or media such as, for example, present in the (living) cells in which the mutant gfp is expressed; enhanced fluorescence of the encoded protein; 1012782 2 shifting the (main) excitation peak from / for the encoded protein to the red or the blue end of the electromagnetic spectrum; (amplified) double excitation peak of the encoded protein; and / or 5 - improved compatibility of the gene or protein with (heterologous) biological systems in vivo, such as improved expression.

De uitvinding verschaft derhalve in een eerste aspect een variant van het gfp-gen, dan wel een nucleïnezuursequentie die hiervoor codeert, welke variant omvat, ten opzichte van de sequentie van het wild-type: 10 - ten minste één mutatie in ten minste één van de codons die coderen voor aminozuurposities 99,153 en/of 163, zodanig dat het door het variante gen gecodeerde eiwit een verbeterde oplosbaarheid vertoont, vergeleken met het wildtype GFP; ten minste één mutatie in ten minste één van de codons die coderen voor 15 aminozuurposities 65, 66 en/of 67, zodanig dat het excitatiespectrum van het door het variante gen gecodeerde eiwit verschoven wordt naar het rode of blauwe uiteinde van het spectrum, vergeleken met het wildtype GFP; ten minste één mutatie in ten minste een van de codons die coderen voor aminozuurposities 163,167 en/of 175, zodanig dat het door het variante gen 20 gecodeerde eiwit verbeterde "dual excitation"-karakteristieken vertoont, vergeleken met het wildtype GFP; en bij voorkeur tevens ten minste één mutatie in het codon dat codeert voor aminozuurpositie 64, zodanig dat het door het variante gen gecodeerde eiwit een versterkte fluorescentie vertoont, vergeleken met het wildtype GFP.The invention therefore provides in a first aspect a variant of the gfp gene, or a nucleic acid sequence encoding it, which variant comprises, relative to the wild-type sequence: 10 - at least one mutation in at least one of the codons encoding amino acid positions 99,153 and / or 163 such that the protein encoded by the variant gene exhibits improved solubility compared to the wild type GFP; at least one mutation in at least one of the codons encoding 15 amino acid positions 65, 66 and / or 67 such that the excitation spectrum of the protein encoded by the variant gene is shifted towards the red or blue end of the spectrum, compared to the wild type GFP; at least one mutation in at least one of the codons encoding amino acid positions 163,167 and / or 175 such that the protein encoded by the variant gene 20 exhibits improved dual excitation characteristics compared to the wild type GFP; and preferably also at least one mutation in the codon encoding amino acid position 64 such that the protein encoded by the variant gene exhibits enhanced fluorescence compared to the wild type GFP.

25 De mutaties op posities 65, 66 en/of 67 zijn hierbij bij voorkeur verder zodanig, dat het gecodeerde eiwit tevens een versterkte fluorescentie (d.w.z. emissie) vertoont, vergeleken met het wildtype GFP, in het bijzonder bij golflengten tussen 450 en 550 nm.Preferably, the mutations at positions 65, 66 and / or 67 are further such that the encoded protein also exhibits enhanced fluorescence (i.e., emission) compared to the wild type GFP, especially at wavelengths between 450 and 550 nm.

De uitvinding verschaft in een verder aspect een nucleïnezuursequentie of 30 genetisch construct, die/dat codeert voor de verbeterde gfp-variant volgens de uitvinding.In a further aspect, the invention provides a nucleic acid sequence or genetic construct encoding the improved gfp variant of the invention.

Deze sequentie/dit construct kan in de vorm van een DNA- of RNA-sequentie zijn en is bij voorkeur in de vorm van een dubbelstrengs-DNA. Zo kan de sequentie/het 1012782 3 construct in de vorm zijn van een synthetisch DNA - bijvoorbeeld verkregen zoals hieronder omschreven- dat al dan niet is geïntegreerd in het (genomisch) DNA van een gastheerorganisme; in een vorm die zich zelfstandig kan handhaven en/of repliceren in een gastheerorganisme; en/of in een vorm die stabiel kan worden overgedragen van een 5 gastheerorganisme naar een volgend (bijvoorbeeld door conjugatie of bij een kruising naar een volgende generatie), zoals een vector of een plasmide. De sequentie/het construct kan verder in een vorm zijn die geschikt is voor transformatie van een beoogd gastheerorganisme, zoals een plasmide of een andere transformatievector.This sequence / construct can be in the form of a DNA or RNA sequence and is preferably in the form of a double-stranded DNA. For example, the sequence / 1012782 3 construct may be in the form of a synthetic DNA - obtained, for example, as described below - which may or may not be integrated into the (genomic) DNA of a host organism; in a form that can independently maintain and / or replicate in a host organism; and / or in a form that can be stably transferred from one host organism to another (eg, by conjugation or at a cross to a next generation), such as a vector or a plasmid. The sequence / construct may further be in a form suitable for transformation of an intended host organism, such as a plasmid or other transformation vector.

De nucleïnezuursequentie/het construct volgens de uitvinding kan verder andere 10 op zichzelf bekende elementen van nucleïnezuursequenties of genetische constructen omvatten, zoals promoters of andere regelelementen, terminators, transcriptionele en/of translationele enhancers, integratiefactoren, signaalsequenties en dergelijke, alsmede sequenties die coderen voor andere eiwitten of genetisch bepaalde eigenschappen, eventueel als fusie met de gfp-variant volgens de uitvinding, zoals hieronder nader 15 omschreven.The nucleic acid sequence / construct of the invention may further comprise other known nucleic acid sequence or genetic construct elements, such as promoters or other regulatory elements, terminators, transcriptional and / or translational enhancers, integration factors, signal sequences and the like, as well as sequences encoding other proteins or genetically determined properties, optionally as a fusion with the gfp variant according to the invention, as further described below.

De uitvinding betreft verder de toepassing van de ^-variant volgens de uitvinding en/of het door deze variant gecodeerde fluorescerende eiwit als label of markering, in het bijzonder als genetische markering of expressiemarkering in vivo. Deze toepassing omvat in de regel ten minste een stap waarbij een gastheerorganisme 20 of een cel, deel of weefsel ervan wordt getransformeerd met een nucleïnezuursequentie of een genetisch construct dat codeert voor een gfp-variant volgens de uitvinding; en/of ten minste een stap waarbij een gfp-variant volgens de uitvinding in een gastheerorganisme, of een cel, deel of weefsel ervan, tot expressie wordt gebracht.The invention further relates to the use of the variant according to the invention and / or the fluorescent protein encoded by this variant as a label or marker, in particular as a genetic marker or expression marker in vivo. Typically, this use includes at least a step of transforming a host organism or a cell, part or tissue thereof with a nucleic acid sequence or genetic construct encoding a gfp variant of the invention; and / or at least one step in which a gfp variant of the invention is expressed in a host organism, or a cell, part or tissue thereof.

Verdere aspecten en voorkeursuitvoeringsvormen van de uitvinding zullen uit de 25 onderstaande beschrijving duidelijk worden.Further aspects and preferred embodiments of the invention will become apparent from the description below.

De gfp-varianten volgens uitvinding omvatten bij voorkeur een combinatie van de volgende mutaties, ten opzichte van de sequentie van het wild-type: ten minste één mutatie in ieder van de codons die coderen voor aminozuurposities 99,153 en/of 163, zodanig dat gecodeerde eiwit een 30 verbeterde oplosbaarheid vertoont, vergeleken met het wildtype GFP; ten minste één mutatie in ten minste een van de codons die coderen voor aminozuurposities 65,66 en/of 67, en bij voorkeur in het codon dat codeert voor aminozuurpositie 65, zodanig dat het excitatiespectrum van het gecodeerde eiwit 1012782 4 verschoven wordt naar het rode uiteinde van het spectrum, vergeleken met het wildtype GFP; ten minste één mutatie in ieder van de codons die coderen voor aminozuurposities 163,167 en/of 175, zodanig dat het gecodeerde eiwit 5 verbeterde "dual excitation"-karakteristieken vertoont, vergeleken met het wildtype GFP; en ten minste één mutatie in het codon dat codeert voor aminozuurpositie 64, zodanig dat het gecodeerde eiwit een versterkte fluorescentie vertoont, vergeleken met het wildtype GFP.The gfp variants of the invention preferably comprise a combination of the following mutations, relative to the wild-type sequence: at least one mutation in each of the codons encoding amino acid positions 99,153 and / or 163, such that encoded protein exhibits improved solubility compared to the wild type GFP; at least one mutation in at least one of the codons encoding amino acid positions 65,66 and / or 67, and preferably in the codon encoding amino acid position 65, such that the excitation spectrum of the encoded protein 1012782 4 is shifted to the red end of the spectrum, compared to the wild type GFP; at least one mutation in each of the codons encoding amino acid positions 163,167 and / or 175 such that the encoded protein exhibits improved dual excitation characteristics compared to the wild type GFP; and at least one mutation in the codon encoding amino acid position 64 such that the encoded protein exhibits enhanced fluorescence compared to the wild type GFP.

10 De mutaties op posities 65, 66 en/of 67 zijn hierbij opnieuw bij voorkeur zodanig, dat het gecodeerde eiwit tevens een versterkte fluorescentie (d.w.z. emissie) vertoont, vergeleken met het wildtype GFP, in het bijzonder bij golflengten tussen 450 en 550 nm.The mutations at positions 65, 66 and / or 67 are again preferably such that the encoded protein also exhibits enhanced fluorescence (ie emission) compared to the wild type GFP, especially at wavelengths between 450 and 550 nm.

De bovenbedoelde mutaties kunnen een of meer inserties, deleties en/of 15 substituties omvatten van een of meer nucleotiden in/van de codons die coderen voor de bovengenoemde aminozuurposities, zodanig dat de aldus verkregen mutante sequentie codeert voor een GFP-variant met een gewijzigd of ingevoegd aminozuur op de genoemde posities, en/of waarbij op deze positie(s) een of meer aminozuren zijn verwijderd, steeds ten opzichte van de aminozuursequentie van het wildtype-GFP; of ?0 'en combinatie van een of meer van dergelijke mutaties. De mutaties omvatten bij . orkeur een of meer substitities, zodanig dat het mutante codon codeert voor een ander aminozuur als aanwezig op de betreffende positie in het wildtype GFP.The above mutations may comprise one or more insertions, deletions and / or substitutions of one or more nucleotides in / of the codons encoding the above amino acid positions such that the mutant sequence thus obtained encodes a GFP variant with an altered or inserted amino acid at said positions, and / or wherein one or more amino acids have been removed at these position (s), always relative to the amino acid sequence of the wild type GFP; or? 0 'and combination of one or more such mutations. The mutations include at. choose one or more substitions such that the mutant codon encodes another amino acid present at the appropriate position in the wild-type GFP.

Bij voorkeur toegepaste aminozuursubstituties zijn weergegeven in de onderstaande Tabel 2 101 2782 5 TABEL 2Preferred amino acid substitutions are shown in Table 2 101 2782 below. TABLE 2

Aminozuurpositie Wild-type Variant volgens de uitvindingAmino acid position Wild-type Variant according to the invention

64 F L of M64 F L or M

65 S C, T, G of A65 S C, T, G or A

66 6766 67

99 F S99 F S

153 M Tof A153 M Great A

163 V A163 V A.

167 I T167 I T

175 S G175 S G

5 In het bijzonder de voorkeur verdient 65 S naar T, meer in het bijzonder in combinatie met 64 F naar L, hetgeen een aanzienlijk versterkte fluorescentie kan geven. Verder verdient ook 153 M naar A de voorkeur. Een bij voorkeur toegepast voorbeeld van deze voorkeursuitvoeringsvorm is vermeld in Tabel 1.Particularly preferred is 65 S to T, more particularly in combination with 64 F to L, which can give considerably enhanced fluorescence. Furthermore, 153 M to A is also preferred. A preferred example of this preferred embodiment is listed in Table 1.

De deskundige zal in staat zijn om -op basis van de genetische code en de 10 bekende gedegenereerdheid hiervan, alsmede de onderhavige beschrijving- codons te kiezen die coderen voor deze en andere geschikte in de uitvinding geschikte aminozuren/aminozuursubstituties. Of deze substituties leiden tot de gewenste verbeterde eigenschappen kan bijvoorbeeld worden vastgesteld door het gecodeerde eiwit tot expressie te brengen en de eigenschappen ervan te vergelijken met het 15 wildtype GFP en de bekende GFP-varianten, volgens op zichzelf bekende bepalingsmethoden.Those skilled in the art will be able to choose - based on the genetic code and its known degeneration, as well as the present description - codons encoding these and other suitable amino acids / amino acid substitutions useful in the invention. Whether these substitutions lead to the desired improved properties can be determined, for example, by expressing the encoded protein and comparing its properties to the wild-type GFP and the known GFP variants, according to methods known per se.

De mutaties op posities 99, 153 en/of 163 volgens de uitvinding leiden tot verbeterde oplosbaarheid in van het mutante GFP in biologische vloeistoffen of -media, met name zoals voorkomen in de (levende) cellen waarin het mutante gfp tot expressie 20 wordt gebracht, zoals de cytosolfractie. Hiervoor kan de oplosbaarheid in water, in een fysiologische buffer of -oplossing, of een waterig celextract als een maat worden 101 2782 6 genomen, bijvoorbeeld in een (vergelijkende) in vitro proef. De uitvinding is niet beperkt tot een verklaring van deze verbeterde oplosbaarheid; zo kan dit veroorzaakt worden door de aanwezigheid van aminozuren met hydrofiele(re) zijketens, of door een wijziging in de tertiare structuur van het eiwit, zoals een veranderde 5 vouwing/driedimensionale structuur.The mutations at positions 99, 153 and / or 163 according to the invention result in improved solubility of the mutant GFP in biological fluids or media, in particular as occurring in the (living) cells in which the mutant GFP is expressed, such as the cytosol fraction. For this, the solubility in water, in a physiological buffer or solution, or an aqueous cell extract can be taken as a measure 101 2782 6, for example in a (comparative) in vitro test. The invention is not limited to an explanation of this improved solubility; for example, this can be caused by the presence of amino acids with hydrophilic (er) side chains, or by a change in the tertiary structure of the protein, such as an altered folding / three-dimensional structure.

De mutaties op posities 163,167 en 175 volgens de uitvinding leiden tot verbeterde "dubbele excitatie” (“dual excitation")-karakteristieken van het eiwit. Wat hiermee wordt bedoeld blijkt uit Figuur 1, waarin de excitatie- en emissiespectra van het wildtype GFP, van enige GFP varianten uit de stand der techniek en van een GFP 10 variant volgens een voorkeuringsuitvoeringsvorm van de uitvinding zijn weergegeven.The mutations at positions 163, 167 and 175 of the invention result in improved "dual excitation" characteristics of the protein. What is meant by this is shown in Figure 1, which shows the excitation and emission spectra of the wild type GFP, of some GFP variants of the prior art and of a GFP variant according to a preferred embodiment of the invention.

Zoals blijkt uit Figuur 1 omvat het exitatiespectrum van het wild-type GFP een voornaamste piek, aangegeven met (I), en een secundaire piek, aangegeven met (II). Verbeterde "dubbele exitatie" volgens de uitvinding betekent dat - zoals eveneens weergegeven in Figuur 1- piek (II) in de GFP-varianten volgens de uitvinding versterkt 15 is ten opzichte van piek (I), dat wil zeggen in absolute zin of relatiefAs shown in Figure 1, the wild-type GFP exit spectrum includes a major peak, indicated by (I), and a secondary peak, indicated by (II). Improved "double excitation" according to the invention means that - as also shown in Figure 1 peak (II) in the GFP variants according to the invention is enhanced relative to peak (I), i.e. in absolute sense or relatively

Hierdoor kan de GFP-variant volgens de uitvinding bij twee trajecten van golflengte worden aangestraald, dat wil zeggen bij een golflengte die overeenkomt met piek (I) en/of een golflengte die overeenkomt met piek (II), waar het wild-type GFP voornamelijk bij piek (I) moet worden aangestraald (zoals blijkt uit Figuur 1 is piek II 20 in wildtype GFP verwaarloosbaar, zodat instralen bij een overeenkomstige golflengte doorgaans weinig zinvol zal zijn).This allows the GFP variant according to the invention to be irradiated at two wavelength ranges, i.e. at a wavelength corresponding to peak (I) and / or a wavelength corresponding to peak (II), where the wild-type GFP mainly at peak (I) must be irradiated (as shown in Figure 1, peak II 20 in wild-type GFP is negligible, so that irradiation at a corresponding wavelength will generally make little sense).

De mogelijkheid van het (tevens) aanstralen van piek (II) in de GFP-variant kan nuttig zijn, daar hiermee het optreden van autofluorescentie (d.w.z. fluorescentie van bestanddelen van het te meten biologische monster anders dan het GFP, hetgeen met 25 name kan voorkomen bij golflengten die overeenkomen met piek (I)) kan worden vermeden. Dergelijke autofluorescentie kan in het bijzonder een probleem vormen wanneer wildtype GFP of bekende GFP varianten worden toegepast als in vivo markering in eukaryotisch weefsel of eukaryotische cellen, zoals plantencellen; de GFP varianten volgens de uitvinding zijn dan ook in het bijzonder geschikt voor deze 30 toepassing.The possibility of (also) irradiating peak (II) in the GFP variant may be useful, as it allows the occurrence of autofluorescence (ie fluorescence of components of the biological sample to be measured other than the GFP, which may occur in particular at wavelengths corresponding to peak (I)) can be avoided. Such autofluorescence may be particularly problematic when wild-type GFP or known GFP variants are used as an in vivo marker in eukaryotic tissue or eukaryotic cells, such as plant cells; the GFP variants according to the invention are therefore particularly suitable for this application.

Bovendien zal - zoals blijkt uit Figuur 1- in de bij voorkeur toegepaste GFP-varianten volgens de uitvinding piek (II) bovendien een grotere (relatieve) intensiteit 101 2782 7 hebben dan piek (I), hetgeen een verdere reden is waarom instralen van deze GFP-varianten bij piek (II) i.p.v. bij piek (I) de voorkeur kan verdienen.Moreover, as shown in Figure 1, in the preferred GFP variants according to the invention, peak (II) will have a greater (relative) intensity 101 2782 7 than peak (I), which is a further reason why irradiation of these GFP variants at peak (II) rather than at peak (I) may be preferable.

Volgens een voorkeursuitvoeringsvorm van de uitvinding heeft de GFP variant volgens de uitvinding een excitatie/emissiespectrum zoals weergegeven in Figuur 1, 5 d.w.z. met een eerste excitatiepiek (piek (I)) tussen ongeveer 355 en 435 nm (met een maximum van ongeveer 395 nm), een tweede excitatiepiek (piek (II)) tussen 450 nm en 520 nm (met een maximum van ongeveer 490 nm), en een emissiepiek tussen ongeveer 470 nm en 550 nm (met een maximum van ongeveer 510 nm). Hierbij is de 2e exitatiepiek versterkt t.o.v. het wildtype GFP (d.w.z. uitgezet als relatieve intensiteit 10 zoals in Figuur 1), terwijl ook de emissie is versterkt t.o.v. het wildtype (opnieuw uitgezet als relatieve intensiteit). Hierbij vertonen de GFP varianten volgens de uitvinding bovendien (vergeleken met bijvoorbeeld het bekende "eGFP") tevens een excitatiepiek tussen ongeveer 355 en 435 nm vertonen (d.w.z. "dubbele exitatie").According to a preferred embodiment of the invention, the GFP variant according to the invention has an excitation / emission spectrum as shown in Figure 1, 5 ie with a first excitation peak (peak (I)) between about 355 and 435 nm (with a maximum of about 395 nm) , a second excitation peak (peak (II)) between 450 nm and 520 nm (with a maximum of about 490 nm), and an emission peak between about 470 nm and 550 nm (with a maximum of about 510 nm). Here, the 2nd excitation peak is enhanced relative to the wild type GFP (i.e., plotted as relative intensity 10 as in Figure 1), while the emission is also boosted relative to the wild type (plotted again as relative intensity). In addition, the GFP variants according to the invention additionally (compared to, for example, the known "eGFP") also exhibit an excitation peak between about 355 and 435 nm (i.e. "double exitation").

Met meer voorkeur is in de GFP varianten volgens de uitvinding “piek (II)” ten 15 minste even groot als “piek (I)”, en bij voorkeur ten minste 1,5 x zo groot, en met meer voorkeur ten minste 2 x zo groot, waarbij de "grootte" van de pieken de (relatieve) intensiteit van de maxima in het exitatiespectrum aangeeft ( d.w.z bij de golflengten van de betreffende maxima, die voor de verschillende GFP-varianten anders kunnen zijn).More preferably, in the GFP variants of the invention, "peak (II)" is at least the same size as "peak (I)", and preferably at least 1.5 times greater, and more preferably at least 2 times so large, where the "magnitude" of the peaks indicates the (relative) intensity of the maxima in the exit spectrum (ie at the wavelengths of the respective maxima, which may be different for the different GFP variants).

20 De g#?-variant volgens de uitvinding omvat bij voorkeur een of meer substituties in de aminozuren 65,66 en/of 67 -die coderen voor de chromofoor- zodanig dat het exitatiespectrum van de tot expressie gebrachte GFP-variant is verschoven richting het rode deel van het spectrum (zogenaamde "red-shift"), vergeleken met het wildtype GFP. Hiervoor wordt bij voorkeur een enkele substitutie op aminozuurpositie 65 25 toegepast.The g #? Variant according to the invention preferably comprises one or more substitutions in amino acids 65,66 and / or 67 - which encode the chromophore - such that the exit spectrum of the expressed GFP variant has shifted towards the red part of the spectrum (so-called "red-shift"), compared to the wild-type GFP. Preferably, a single substitution at amino acid position 65 is used for this.

Verder kan volgens de uitvinding eventueel ook een aminozuursubstitutie op positie 66 -al dan niet in combinatie met substituties op positie 65 en/of 67- worden toegepast, hetgeen kan leiden tot verschuiving van het exitatiespectrum naar het blauwe deel van het spectrum ("blue shift"), waarbij een z.g. "BFP" of "Blue Fluorescent 30 Protein" kan worden verkregen. Hiervoor kunnen bijvoorbeeld de mutaties 66 Y naar H en 68 V naar I worden genoemd, eventueel in combinatie met 64 F naar M.Furthermore, according to the invention, an amino acid substitution at position 66 - whether or not in combination with substitutions at position 65 and / or 67 - can optionally also be used, which may lead to shifting of the exit spectrum towards the blue part of the spectrum ("blue shift"). "), whereby a so-called" BFP "or" Blue Fluorescent Protein "can be obtained. For this, mutations 66 Y to H and 68 V to I can be mentioned, for example in combination with 64 F to M.

Een andere mutatie die kan worden genoemd voor aminozuur 66 is Y naar W.Another mutation that can be named for amino acid 66 is Y to W.

1012782 81012782 8

Met "verschuiving van het exitatiespectrum naar het rode, dan wel het blauwe uiteinde van het spectrum" wordt hier bedoeld dat de voornaamste golflengte(n) waarbij het mutante GFP volgens de uitvinding kan worden ingestraald bij een langere golflengte (in nm) ligt (verschuiving naar het rode uiteinde) dan wel bij een kortere 5 golflengte ligt (verschuiving naar het blauwe uiteinde), ten opzichte van het spectrum van het wildtype. Hierbij kan al een verschuiving van 10 nm, bij voorkeur 15-25 nm, een aanzienlijke verbetering in de (gebruiks)eigenschappen van de variant geven, bijvoorbeeld doordat de voor de exitatie van de mutant te gebruiken golflengte(n) beter aansluit/aansluiten bij de doorgaans gebruikte (meetapparatuur. Zo heeft het 10 exitatiespectum van wildtype GFP een optimum bij ongeveer 395 nm, terwijl dit de optimum voor een naar het rode uiteinde van het spectrum verschoven mutant ("red shift'-mutant) volgens de uitvinding bij ongeveer 490 nm kan liggen, hetgeen beter overeenkomt met de golflengte van 488 nm die veel in meetapparatuur wordt toegepast. Een dergelijke kleine verschuiving in het excitatiespectrum, met name naar langere 15 golflengte(n), kan er ook al toe leiden dat het te meten biologische monster minder autofluorescentie en/of lichtverstrooing vertoont.By "shifting the exit spectrum to the red or blue end of the spectrum" is meant here that the main wavelength (s) at which the mutant GFP according to the invention can be irradiated lies at a longer wavelength (in nm) (shift towards the red end) or at a shorter wavelength (shift towards the blue end), relative to the spectrum of the wild type. In this case, a shift of 10 nm, preferably 15-25 nm, can give a significant improvement in the (usage) properties of the variant, for example because the wavelength (s) to be used for the mutation excitation are better aligned with the commonly used (measurement equipment. For example, the wild-type GFP exit spectrum has an optimum at about 395 nm, while this is the optimum for a mutant (red shift mutant) according to the invention at the red end of the spectrum at about 490 nm. nm, which corresponds better to the wavelength of 488 nm which is widely used in measuring equipment Such a small shift in the excitation spectrum, in particular towards longer wavelength (s), can also lead to the biological sample to be measured less autofluorescence and / or light scattering.

De bovengenoemde verschuiving kan zowel verkregen worden doordat het gehele exitatiespectrum is "opgeschoven" in golflengte vergeleken bij het wildtype, of slechts één piek hiervan, waarbij eventueel ook een tegelijk optredende versterking van 20 deze piek (met name door de verbeterde "dubbele exitatie") een bijdrage kan leveren. Dit is bijvoorbeeld weergegeven voor een "red shift" mutant volgens de uitvinding in Figuur 1, waarbij piek (I) hetzelfde maximum heeft als het wildtype GFP, maar waarbij piek (II) zowel is verschoven naar een langere golflengte (met ongeveer 15-20 nm), als ook versterkt is, ten opzichte van het wildtype.The aforementioned shift can be obtained both by the fact that the entire exit spectrum is "shifted" in wavelength compared to the wild type, or only one peak of this, optionally including a simultaneous enhancement of this peak (notably through the improved "double exitation") can make a contribution. For example, this is shown for a "red shift" mutant according to the invention in Figure 1, where peak (I) has the same maximum as the wild type GFP, but peak (II) has both shifted to a longer wavelength (by about 15-20 nm), if also enhanced, relative to the wild type.

25 Mogelijk te gebruiken golflengten voor de exitatie van de GFP-mutanten volgens de uitvinding zijn weergegeven in Tabel 3. Hierbij zijn steeds de maxima vermeld, waarbij een traject van + 40 nm, bij voorkeur + 20 nm, met meer voorkeur + 10 nm ten opzichte van het vermelde maximum wordt aangehouden. Een golflengte tussen haakjes geeft een ondergeschikte piek aan, terwijl bij een mutant met "dubbele 30 exitatie"-eigenschappen de maxima voor beide pieken zijn vermeld. Ter vergelijking is ook het wildtype vermeld.Wavelengths that can be used for the excitation of the GFP mutants according to the invention are shown in Table 3. The maximums are always stated, with a range of + 40 nm, preferably + 20 nm, more preferably + 10 nm. is maintained in relation to the stated maximum. A wavelength in brackets indicates a minor peak, while a mutant with "double excitation" properties lists the maximums for both peaks. The wild type is also listed for comparison.

1012782 9 TABEL3 GFP maximum wildtype 395 (470) uitv.: "red shift" 395 en 490 uitv.: "blue shift" 3801012782 9 TABLE 3 GFP maximum wild type 395 (470) ls .: "red shift" 395 and 490 ls: "blue shift" 380

Verder kan de fluorescentie worden versterkt door de met veel voorkeur 5 toegepaste verdere substitutie op positie 64, bijvoorbeeld F naar M of bij voorkeur L.Furthermore, the fluorescence can be enhanced by the much more preferred further substitution at position 64, for example F to M or preferably L.

Naast de bovengenoemde mutaties die leiden tot verschuivingen in het excitatiespectrum kan de g(p-variant volgens de uitvinding nog een of meer mutaties omvatten die leiden tot een verandering in het emissiespectrum, d.w.z. in de “kleur” van het eiwit. Hierbij kan met name een zogenaamd"YFP" of "yellow fluorescent 10 protein" worden verkregen, d.w.z. een GFP-variant die straalt met een “groen-gele” kleur, in plaats van met de “groene” kleur van het wildtype GFP. Hiervoor kunnen mutaties worden genoemd zoals (uitgedrukt als het gecodeerde aminozuur) 65 S naar G, 68 V naar L, 72 S naar A, en/of 203 T naar Y of I, of een geschikte combinatie hiervan.In addition to the above mutations that lead to shifts in the excitation spectrum, the g (p variant according to the invention may comprise one or more mutations that lead to a change in the emission spectrum, ie in the "color" of the protein. a so-called "YFP" or "yellow fluorescent 10 protein" is obtained, ie a GFP variant radiating with a "green-yellow" color, instead of the "green" color of the wild type GFP. For this, mutations can be mentioned such as (expressed as the encoded amino acid) 65 S to G, 68 V to L, 72 S to A, and / or 203 T to Y or I, or an appropriate combination thereof.

15 Een verandering in het emissiespectrum kan in bepaalde GFP-varianten tevens gepaard gaan met een verandering in het excitatiespectrum. Zo kan de combinatie van 65 S naar G, 68 V naar L en 72 S naar A leiden tot een variant met een roodverschuiving in zowel het exitatie- als emissiespectrum, terwijl de combinatie van 64 F naar M, 66 Y naar H of W en 68 V naar I kan leiden tot een variant met een 20 blauwverschuiving in beide spectra. Ook YFP’s kunnen - naast de verandering van de geëmitteerde “kleur” - een verschuiving in (een van) de exitatiepiek(en) vertonen, zoals een roodverschuiving.In some GFP variants, a change in the emission spectrum can also be accompanied by a change in the excitation spectrum. For example, the combination of 65 S to G, 68 V to L and 72 S to A can lead to a variant with a redshift in both the excitation and emission spectrum, while the combination of 64 F to M, 66 Y to H or W and 68 V to I can lead to a variant with a blue shift in both spectra. YFPs can also display - in addition to the change of the emitted “color” - a shift in (one of) the excitation peak (s), such as a redshift.

De overige codons in de sequentie van de g/p-variant volgens de uitvinding zijn bij voorkeur zodanig dat zij coderen voor de overeenkomstige aminozuren van het 25 wildtype GFP, dan wel voor de bekende varianten hiervan. Hiertoe kunnen deze codons hetzelfde zijn als in de wild-type g/p-sequentie of bekende varianten, dan wel codons die hiermee equivalent zijn door de bekende gedegenereerdheid van de genetische code. Zo kan de g/p-variant volgens de uitvinding worden gecodeerd door een sequentie of een construct (hier "equivalente sequenties" genoemd) die/dat in het 101 2782 10 geheel of voor een of meer delen ervan bestaat uit codons/nucleotiden die verschillen van de wildtype ^-sequentie, maar die coderen voor dezelfde aminozuren, zodanig dat de sequentie als geheel codeert voor de aminozuursequentie van het wildtype-GFP met de hierboven aangegeven mutaties die de gfp-variant volgens de uitvinding 5 definiëren.The other codons in the sequence of the g / p variant according to the invention are preferably such that they encode the corresponding amino acids of the wild-type GFP, or the known variants thereof. For this purpose, these codons may be the same as in the wild-type g / p sequence or known variants, or codons equivalent to it by the known degeneracy of the genetic code. For example, the g / p variant of the invention may be encoded by a sequence or construct (herein referred to as "equivalent sequences") which in the entirety or in one or more parts thereof consists of codons / nucleotides that differ of the wild-type sequence, but which encode the same amino acids, such that the sequence as a whole encodes the amino acid sequence of the wild-type GFP with the mutations indicated above that define the gfp variant of the invention.

Zo kan een geheel of gedeeltelijk synthetische sequentie worden toegepast, die een verhoogd of verlaagd, en bij voorkeur verlaagd, gehalte aan A-T heeft, vergeleken met de wildtype g/p-sequentie. Het gebruik van een dergelijke synthetische, semi-synthetische of gedeeltelijk synthetische sequentie kan leiden tot een verbeterde 10 expressie in, en/of een verbeterde verenigbaarheid met, het beoogde gastheerorganisme, zoals hieronder nader besproken.For example, a fully or partially synthetic sequence can be used, which has an increased or decreased, and preferably decreased, A-T content compared to the wild type g / p sequence. The use of such a synthetic, semi-synthetic or partially synthetic sequence may lead to improved expression in, and / or improved compatibility with, the intended host organism, as discussed further below.

Daarnaast kan de g/p-variant volgens de uitvinding ook een of meer mutaties omvatten in de codons die overeenkomen met andere aminozuurposities dan 64,65, 99, 153, 163, 167 en 175, d.w.z. in die aminozuren die in de GFP-varianten volgens de 15 uitvinding hetzelfde kunnen zijn als in het wildtype. Deze mutaties kunnen een of meer inserties (zoals een insertie van valine of alanine tussen aminozuurpositie 1 en aminozuurpositie 2 in de wildtype sequentie), deleties en/of substituties van een of meer nucleotiden omvatten, dan wel een combinatie hiervan, zodanig dat de aldus verkregen mutante sequentie (hier "analoge sequentie" genoemd) codeert voor een 20 GFP-variant met een of meer gewijzigde, een of meer ingevoegde, en/of een of meer verwijderde aminozuren, steeds ten opzichte van de aminozuursequentie van het wildtype-GFP; of een combinatie van een of meer van dergelijke mutaties.In addition, the g / p variant of the invention may also include one or more mutations in the codons corresponding to amino acid positions other than 64.65, 99, 153, 163, 167 and 175, ie in those amino acids that are in the GFP variants according to the invention may be the same as in the wild type. These mutations may include one or more insertions (such as an insertion of valine or alanine between amino acid position 1 and amino acid position 2 in the wild type sequence), deletions and / or substitutions of one or more nucleotides, or a combination thereof, such that the resulting mutant sequence (referred to herein as "analogous sequence") encodes a GFP variant with one or more altered, one or more inserted, and / or one or more deleted amino acids, always relative to the amino acid sequence of the wild-type GFP; or a combination of one or more such mutations.

Hierbij zijn deze mutaties bij voorkeur zodanig, dat de aldus verkregen sequentie nog steeds codeert voor een fluorescerend, GFP-achtig eiwit. Met meer voorkeur is de 25 g/p-variant volgens de uitvinding dusdanig dat ten minste 50%, bij voorkeur ten minste 70%, met meer voorkeur ten minste 90% van de aanwezige aminozuren overeenkomen met de aminozuren op de overeenkomstige van het wildtype GFP (waarbij de aminozuurposities 64, 65,99, 153, 163, 167 en 175 buiten beschouwing worden gelaten, en een deletie en/of insertie van één aminozuur wordt gezien als een enkele 30 mutatie).Here, these mutations are preferably such that the sequence thus obtained still encodes a fluorescent GFP-like protein. More preferably, the 25 g / p variant according to the invention is such that at least 50%, preferably at least 70%, more preferably at least 90% of the amino acids present correspond to the amino acids corresponding to the wild-type GFP (disregarding amino acid positions 64, 65.99, 153, 163, 167 and 175, and a deletion and / or insertion of one amino acid is considered a single mutation).

Een aantal op zichzelf bekende aminozuursubstituties -vergeleken met het wildtype GFP- die kunnen worden toegepast - alleen of in combinatie -in de uitvinding zijn weergegeven in Tabel 4.A number of amino acid substitutions known per se - compared to the wild type GFP - that can be used - alone or in combination - in the invention are shown in Table 4.

101 2782 11 TABEL 4101 2782 11 TABLE 4

Aminozuur Wild-type MutatieAmino Acid Wild-type Mutation

2 S G2 S G

80 Q R80 Q R

123 I V123 I V

145 Y F ofH145 Y F or H

146 N I146 N I

148 H R148 H R

202 S F202 S F

203 T I of Y203 T I or Y

212 N K212 N K.

231 H L231 H L

238 K E, N of Q238 K E, N or Q

5 Andere mogelijke op zichzelf bekende, echter met minder voorkeur toegepaste substituties worden bijvoorbeeld beschreven in WO 95/21191, WO 96/23810, WO 96/27675, WO 97/11094, WO 98/06737, WO 98/21355, WO 98/36081, US-A-5,625,048, US-A-5,741,668, US-A-5,777,079.Other possible known per se, but less preferred substitutions are described, for example, in WO 95/21191, WO 96/23810, WO 96/27675, WO 97/11094, WO 98/06737, WO 98/21355, WO 98 / 36081, US-A-5,625,048, US-A-5,741,668, US-A-5,777,079.

De uitvinding omvat verder fragmenten van de variante ^-sequenties volgens 10 de uitvinding, d.w.z. nucleïnezuursequenties en/of constructen die voor een of meer, al dan niet aaneengesloten delen van de GFP-varianten volgens de uitvinding coderen. Deze fragmenten hebben echter bij voorkeur een zodanige grootte dat zij nog steeds coderen voor ten minste bij voorkeur ten minste 80%, met meer voorkeur ten minste 90% van de aminozuren van de GFP-variant volgens de uitvinding, en nog steeds ten 15 minste de hierboven beschreven mutaties volgens de uitvinding bevatten, d.w.z. op posities 64-67,99,153,163,167,175 van de overeenkomstige "volledige" GFP-variant volgens de uitvinding.The invention further comprises fragments of the variant sequences according to the invention, ie nucleic acid sequences and / or constructs encoding one or more contiguous or non-contiguous parts of the GFP variants according to the invention. However, these fragments are preferably sized to still encode at least preferably at least 80%, more preferably at least 90% of the amino acids of the GFP variant of the invention, and still at least mutations of the invention described above contain, ie at positions 64-67.99,153,163,167,175 of the corresponding "complete" GFP variant of the invention.

Met name omvatten dergelijke fragmenten varianten waarvan een of meer aaneengesloten codons vanaf het 3'- en/of het 5'-uiteinde zijn verwijderd, zodanig dat in 20 het gecodeerde eiwit een of meer van de aminozuren 1-20 en/of 218 - 238 zijn 101 2782 12 verwijderd, vergeleken met de widltype sequentie. Hierbij zijn bij voorkeur slechts een of meer van de aminozuren 1-7 en/of 229-238, met meer voorkeur slechts een of meer van de aminozuren 1-2 en/of 232-238 verwijderd.In particular, such fragments include variants having one or more contiguous codons removed from the 3 'and / or 5' end such that in the encoded protein one or more of amino acids 1-20 and / or 218-238 101 2782 12 have been removed, compared to the widl type sequence. Preferably, only one or more of amino acids 1-7 and / or 229-238, more preferably only one or more of amino acids 1-2 and / or 232-238, are removed.

Een bij voorkeur toegepaste nucleïnezuursequentie en aminozuursequentie die 5 coderen voor de ^-variant volgens de uitvinding zijn weergegeven in respectievelijk SEQ ID NO.1 en SEQ ID NO. 2. Zoals vermeld omvat de uitvinding tevens equivalente nucleïnezuursequenties die coderen voor dezelfde aminozuurvolgorde, en nucleïnezuursequenties met en of meer mutaties buiten de aminozuurposities 64-67, 99, 153, 163, 167, 175 in SEQ ID 1 en/of 2, alsmede fragmenten van al deze sequenties.A preferred nucleic acid sequence and amino acid sequence encoding the variant of the invention are shown in SEQ ID NO.1 and SEQ ID NO, respectively. 2. As mentioned, the invention also includes equivalent nucleic acid sequences encoding the same amino acid sequence, and nucleic acid sequences with and or more mutations outside amino acid positions 64-67, 99, 153, 163, 167, 175 in SEQ ID 1 and / or 2, as well as fragments of all these sequences.

10 Een voorbeeld van een volgens de uitvinding bij voorkeur toegepaste vector is weergegeven in Figuur 2.An example of a vector preferably used according to the invention is shown in Figure 2.

De (nucleïnezuursequenties en constructen die coderen voor de) ^-varianten volgens de uitvinding kunnen op een op zichzelf bekende wijze worden verkregen, zoals door synthese met een geautomatiseerde nucleïnezuur-synthetiseerinrichting; 15 door het aanbrengen van (punt)mutaties in een nucleïnezuur dat codeert voor een wild-type gfp en/of een van de bekende g/p-varianten; en/of door het op geschikte wijze combineren van delen van de nucleïnezuursequenties die coderen van het wild-type gfp-gen en de bekende gfp- varianten, dat wil zeggen door het gebruik van een of meer restrictie-enzymen en ligasen. Deze en andere geschikte technieken worden beschreven 20 in Sambrook et al, "Molecular Cloning: A Laboratory Manual" (2nd.ed.), Vols. 1-3, Cold Spring Harbor Laboratory (1989) of F. Ausubel et al, eds., "Current protocols in molecular biology", Green Publishing and Wiley Interscience, New York (1987), als ook in bijvoorbeeld WO 95/21191, WO 96/23810, WO 96/27675, WO 97/11094, WO 98/06737, WO 98/21355, WO 98/36081, US-A-5,625,048, US-A-5,741,668 en US-A-25 5,777,079.The (nucleic acid sequences and constructs encoding the) variants of the invention can be obtained in a manner known per se, such as by synthesis with an automated nucleic acid synthesizer; By applying (point) mutations in a nucleic acid encoding a wild-type gfp and / or one of the known g / p variants; and / or by suitably combining parts of the nucleic acid sequences encoding the wild-type gfp gene and the known gfp variants, that is, using one or more restriction enzymes and ligases. These and other suitable techniques are described in Sambrook et al, "Molecular Cloning: A Laboratory Manual" (2nd ed.), Vols. 1-3, Cold Spring Harbor Laboratory (1989) or F. Ausubel et al, eds., "Current protocols in molecular biology", Green Publishing and Wiley Interscience, New York (1987), as well as, for example, WO 95/21191, WO 96/23810, WO 96/27675, WO 97/11094, WO 98/06737, WO 98/21355, WO 98/36081, US-A-5,625,048, US-A-5,741,668 and US-A-5,777,079.

De gfp- varianten volgens de uitvinding worden echter bij voorkeur vervaardigd door middel van een of meer PCR-reacties, waarbij de gewenste mutaties door het gebruik van gemodificeerde primers (d.w.z. met een geschikte "mismatch" t.o.v. de als matrijs ("template") gebruikte uitgangssequentie(s)) op de hierboven vermelde posities 30 in de door amplificatie verkregen nucleïnezuursequenties worden ingebouwd. Hierbij worden - zoals nader uiteengezet in het Experimentele Gedeelte - in de regel een of meer afzonderlijke PCR-reacties uitgevoerd, die ieder leiden tot een deel van de totale sequentie van de g/p-variant volgens de uitvinding, of leiden tot de gehele sequentie, 1012782 13 waarbij de primers met de gewenste mutatie(s) de uiteinden van de verkregen geamplificeerde fragmenten zullen vormen. Deze fragmenten worden vervolgens samengevoegd, eventueel met een of meer delen van de wildtype g^-sequentie of van de sequentie(s) van bekende gjp-varianten, waarbij de volledige g/p-variant volgens de 5 uitvinding wordt verkregen.However, the gfp variants of the invention are preferably prepared by one or more PCR reactions, the desired mutations using modified primers (ie, with an appropriate "mismatch" to the template ("template") used). starting sequence (s)) are incorporated into the nucleic acid sequences obtained by amplification at the above-mentioned positions. Here, as explained in more detail in the Experimental Section, one or more separate PCR reactions are generally carried out, each of which leads to a part of the total sequence of the g / p variant according to the invention, or leads to the entire sequence. , 1012782 13 wherein the primers with the desired mutation (s) will form the ends of the amplified fragments obtained. These fragments are then combined, optionally with one or more parts of the wild-type g-1 sequence or of the sequence (s) of known gjp variants, whereby the complete g / p variant according to the invention is obtained.

De PCR-reacties en de verdere bewerkingen, zoals het samenvoegen van de verschillende fragmenten, kunnen op een op zichzelf bekende wijze worden uitgevoerd, bijvoorbeeld zoals hieronder omschreven of met de technieken uit US-A-4,683,202; Saiki et al., Science 239 (1988), 487-491 or PCR Protocols, 1990, Academic Press, San 10 Diego, California, USA. Voor de als matrijs in de PCR-reactie gebruikte uitgangssequentie(s) kunnen een of meer geschikte fragmenten van de wildtype gfp-sequentie worden gebruikt, en/of een of meer fragmenten van op zichzelf bekende gfp-varianten, die eventueel reeds een of meer van de gewenste mutaties kunnen omvatten.The PCR reactions and the further operations, such as combining the different fragments, can be performed in a manner known per se, for example as described below or with the techniques of US-A-4,683,202; Saiki et al., Science 239 (1988), 487-491 or PCR Protocols, 1990, Academic Press, San 10 Diego, California, USA. For the starting sequence (s) used as template in the PCR reaction, one or more suitable fragments of the wild-type gfp sequence can be used, and / or one or more fragments of known gfp variants, which optionally already contain one or more of the desired mutations.

De nucleïnezuursequentie van de g#?-variant volgens de uitvinding is bij 15 voorkeur zodanig dat deze verenigbaar is met de cellen, het weefsel of het organisme waarin deze tot expressie moet worden gebracht. Dit betekent met name dat -na expressie van het gen- een fluorescerend eiwit wordt gevormd/verkregen, bij voorkeur zonder toxische of afweerreacties.The nucleic acid sequence of the g #? Variant of the invention is preferably such that it is compatible with the cells, tissue or organism in which it is to be expressed. In particular, this means that - after expression of the gene - a fluorescent protein is formed / obtained, preferably without toxic or immune reactions.

Zo is het bekend dat expressie van de wild-type g#?-sequentie in planten zoals 20 Arabidopsis kan leiden tot een gedeeltelijk of zelfs geheel verstoorde vorming van het fluorescerende eiwit. Aangenomen wordt dat dit wordt veroorzaakt doordat Arabidopsis delen van de wild-type ^-sequentie na transcriptie "herkent" als intronsequenties, die vervolgens uitgesplitst worden. Dit kan worden ondervangen door het gebruik van een variante sequentie met -ten opzichte van de wildtype g^?-sequentie-25 een of meerdere gewijzigde codons die niet door het gastheerorganisme als (deel van een) intronsequentie worden herkend. Voorbeelden van geschikte gemodificeerde codoris worden gegeven in de in Tabel 1 genoemde stand der techniek, en omvatten bijvoorbeeld het gebruik van gewijzigde codons op base-posities 237-447,237-540. Ook kan een geheel synthetische sequentie met volledig gewijzigde codons ten 30 opzichte van de wild-type sequentie worden toegepast. G#?-varianten volgens de uitvinding met dergelijke gemodificeerde codons kunnen bijvoorbeeld worden verkregen door een of meer overeenkomstige sequenties te gebruiken als uitgangssequentie(s) tijdens de PCR-reactie, zoals hierboven beschreven.For example, it is known that expression of the wild-type g #? Sequence in plants such as Arabidopsis can lead to a partially or even completely disrupted formation of the fluorescent protein. This is believed to be caused by Arabidopsis "recognizing" parts of the wild-type sequence after transcription as intron sequences, which are then broken down. This can be overcome by using a variant sequence with one or more altered codons which are not recognized by the host organism as (part of an) intron sequence relative to the wild-type gene sequence. Examples of suitable modified codoris are given in the prior art listed in Table 1, and include, for example, the use of modified codons at base positions 237-447,237-540. An entirely synthetic sequence with completely modified codons relative to the wild-type sequence can also be used. For example, G #? Variants of the invention with such modified codons can be obtained by using one or more corresponding sequences as starting sequence (s) during the PCR reaction, as described above.

101 2782 14101 2782 14

De door de g/p-varianten gecodeerde fluorescerende eiwitten kunnen vervolgens worden verkregen door de aldus verkregen sequentie tot expressie te brengen in een geschikt gastheerorganisme, bij voorkeur in een micro-organisme zoals een bacterie, en de GFP-variant op een op zichzelf bekende wijze te isoleren, waarvoor bijvoorbeeld 5 wordt verwezen naar WO 95/07463 en WO 96/23810.The fluorescent proteins encoded by the g / p variants can then be obtained by expressing the sequence thus obtained in a suitable host organism, preferably in a microorganism such as a bacterium, and the GFP variant on a known per se manner, for example, for which reference is made to WO 95/07463 and WO 96/23810.

De g/p-variant volgens de uitvinding en het hierdoor gecodeerde fluorescerende eiwit kunnen op dezelfde wijze en voor dezelfde toepassingen worden gebruikt als het wild-type gfp-gen en -eiwit en de reeds bekende varianten hiervan, dat wil zeggen als een label of markering in (micro)biologische, biochemische en/of moleculair 10 biologische technieken. Zo kan het door de g/p-varianten volgens de uitvinding gecodeerde eiwit worden gebruikt als een fluorescerende markering of label in in vitro essays en bepalingen, waaronder hybridisatie-essays en immunologische bepalingen (zoals ELISA's) en dergelijke.The g / p variant according to the invention and the fluorescent protein encoded thereby can be used in the same manner and for the same applications as the wild-type gfp gene and protein and the already known variants thereof, i.e. as a label or marking in (micro) biological, biochemical and / or molecular biological techniques. For example, the protein encoded by the g / p variants of the invention can be used as a fluorescent marker or label in in vitro essays and assays, including hybridization essays and immunological assays (such as ELISAs) and the like.

De g/p-variant en het hierdoor gecodeerde eiwit zijn echter in het bijzonder 15 geschikt als markering en/of label voor toepassing in vivo, dat wil zeggen in eukaryotische of prokaryotische organismen zoals planten, dieren, mensen, bacteriën, schimmels, algen, gist en andere micro-organismen, alsmede in weefsels of cellen van deze organismen of hiervan afgeleide cellijnen.However, the g / p variant and the protein encoded by it are particularly suitable as a marker and / or label for use in vivo, ie in eukaryotic or prokaryotic organisms such as plants, animals, humans, bacteria, fungi, algae, yeast and other micro-organisms, as well as in tissues or cells of these organisms or cell lines derived from them.

Zo kan de g/p-variant volgens de uitvinding worden gebruikt als genetische 20 markering, dat wil zeggen om aan te geven dat een of meer nucleïnezuursequenties, genen en/of genetisch bepaalde eigenschappen zijn overgedragen in of naar een beoogd organisme. Voorbeelden zijn de transformatie van prokaryotische of eukaryotische cellen of organismen (waarbij de al dan niet gebruikte transformatievector naast de gewenste sequentie(s) tevens de g/p-variant volgens de uitvinding zal omvatten), of het 25 doorgeven van een of meer eigenschappen bij een kruising van de oudergeneratie naar de nakomelingen (waarbij de sequenties voor gfp-variant en de gewenste eigenschap zodanig zullen samenhangen dat aanwezigheid van de g^-variant in de nakomelingen indicatief is voor het verkrijgen van de gewenste eigenschap).For example, the g / p variant according to the invention can be used as a genetic marker, ie to indicate that one or more nucleic acid sequences, genes and / or genetically determined properties have been transferred in or to an intended organism. Examples are the transformation of prokaryotic or eukaryotic cells or organisms (in which the transformation vector used or not will also comprise the g / p variant according to the invention in addition to the desired sequence (s)), or the transmission of one or more properties in a cross from the parent generation to the progeny (where the sequences for gfp variant and the desired trait will be related such that the presence of the g1 variant in the progeny is indicative of obtaining the desired trait).

De g#?-variant volgens de uitvinding kan verder worden gebruikt als een 30 "reporter" om aan te geven dat een gewenste sequentie, een gewenst gen of een gewenste eigenschap in een organisme, weefsel of cel tot expressie wordt gebracht, waarbij de expressie van de g/p-variant en de gewenste sequentie/gen/eigenschap onder 1012782 15 regeling van dezelfde regelelementen zal staan, dan wel onder regeling van regelelementen die door dezelfde factor(en) worden geïnduceerd.The g #? Variant of the invention may further be used as a "reporter" to indicate that a desired sequence, gene or property is expressed in an organism, tissue, or cell, wherein the expression of the g / p variant and the desired sequence / gene / trait will be under control of the same control elements, or under control of control elements induced by the same factor (s).

Een andere mogelijke toepassing is expressie-analyse, zoals onderzoek naar de werking van regelelementen zoals promoters en enhancers, bijvoorbeeld voor het 5 volgen/bepalen van de expressie in de tijd of onder invloed van inducerende factoren (m.i. v. schadelijke factoren zoals ziekten, stress, zware metalen of droogte), en/of de expressie in verschillende weefsels of organen of in verschillende ontwikkelingsstadia van een organisme.Another possible application is expression analysis, such as research into the action of control elements such as promoters and enhancers, for example for monitoring / determining expression over time or under the influence of inducing factors (including harmful factors such as diseases, stress, heavy metals or drought), and / or the expression in different tissues or organs or in different stages of development of an organism.

Verder kan de gfp-variant bijvoorbeeld worden gebruikt voor locatie-analyse, 10 met name om na te gaan naar welke delen of weefsels van de plant, welke cellen of welke delen/organellen van de cel een bepaald genproduct of expressieproduct wordt gericht (bijvoorbeeld ten gevolge van de aanwezigheid van een bepaalde leadersequentie). Hierbij zal dit product in de regel als een fusie met de g/^-variant volgens de uitvinding tot expressie worden gebracht. Een ander voorbeeld van 15 dergelijke locatie-analyse omvat bijvoorbeeld het volgen in de tijd van het verspreiden van een virus of een soortgelijk pathogeen door een plant.Furthermore, the gfp variant can, for example, be used for location analysis, in particular to determine which parts or tissues of the plant, which cells or which parts / organelles of the cell a specific gene product or expression product is targeted (eg at due to the presence of a certain leader sequence). As a rule, this product will be expressed as a fusion with the g / - variant according to the invention. Another example of such location analysis includes, for example, tracking over time the spread of a virus or similar pathogen through a plant.

Voor verdere mogelijke toepassingen van het mutante gfp volgens de uitvinding wordt verwezen naar de bovengenoemde literatuur, in het bijzonder WO 95/07463, WO 97/11094, WO 97/42320, WO 98/06737 en met name de toepassingen in planten 20 beschreven in WO 97/41228.For further possible applications of the mutant gfp according to the invention reference is made to the above literature, in particular WO 95/07463, WO 97/11094, WO 97/42320, WO 98/06737 and in particular the applications in plants described in WO 97/41228.

De variant volgens de uitvinding kan in deze organismen worden ingebracht in de vorm van een geschikt construct of een geschikte vector, waarmee dit organisme getransformeerd kan worden, waaronder bekende transformatie-vectoren zoals plasmiden.The variant according to the invention can be introduced into these organisms in the form of a suitable construct or a suitable vector with which this organism can be transformed, including known transformation vectors such as plasmids.

25 Voorbeelden van geschikte technieken voor het transformeren van planten zijn bijvoorbeeld transformatie met Agrobacterium, of transformatie met "naakt" DNA, bijvoorbeeld door beschieten met deeltjes of door transformatie van protoplasten door bijvoorbeeld electroporatie of behandeling met PEG. Voorbeelden van geschikte vectorsystemen voor toepassing met Agrobacterium zijn bijvoorbeeld binaire vectoren 3 0 zoals pBI 121 en afgeleiden daarvan; co-integraatvectoren zoals pGV 1500 en afgeleiden van pBR322. Geschikte vectorsystemen voor transformatie met naakt DNA zijn bijvoorbeeld E.coli-vsctoren met hoog kopieergetal, zoals pUC-vectoren en pBluescript II (SK+) vectoren. Ook alle andere op zichzelf bekende systemen voor de transformatie 101 2782 16 van planten kunnen worden gebruikt, bijvoorbeeld zoals vermeld in WO 97/41228. Geschikte transformatiesystemen voor mensen en menselijke cellen, dieren en dierlijke cellen, alsmede bacteriën, gist(cellen), algen en virussen worden bijvoorbeeld beschreven in WO 95/07463, WO 96/23810, WO 95/07463, WO 95/21191, WO 5 97/11094, WO 97/42320, WO 98/06737 en WO 98/21355.Examples of suitable techniques for transforming plants are, for example, transformation with Agrobacterium, or transformation with "naked" DNA, for example by particle bombardment or by protoplast transformation by, for example, electroporation or treatment with PEG. Examples of suitable vector systems for use with Agrobacterium are, for example, binary vectors such as pBI 121 and derivatives thereof; co-integrate vectors such as pGV 1500 and derivatives of pBR322. Suitable vector systems for naked DNA transformation are, for example, high copy number E. coli vectors such as pUC vectors and pBluescript II (SK +) vectors. Any other per se known systems for the transformation 101 2782 16 of plants can also be used, for example as stated in WO 97/41228. Suitable transformation systems for human and human cells, animals and animal cells, as well as bacteria, yeast (cells), algae and viruses are described, for example, in WO 95/07463, WO 96/23810, WO 95/07463, WO 95/21191, WO 5 97/11094, WO 97/42320, WO 98/06737 and WO 98/21355.

De constructen volgens de uitvinding kunnen, naast de nucleïnezuursequentie die codeert voor de g/p-variant volgens de uitvinding, tevens een promotor omvatten, die op werkzame wijze is verbonden met de nucleïnezuursequentie die codeert voor de gfp-variant volgens de uitvinding, waarmee wordt bedoeld dat de promotor in staat is 10 de expressie van de gfp-\ariant in het gewenste organisme te induceren/regelen. Hiervoor is ten minste vereist dat de g#?-variant zich in het juiste afleesraam en de juiste oriëntatie ten opzichte van de promotor bevindt.The constructs of the invention may, in addition to the nucleic acid sequence encoding the g / p variant of the invention, also comprise a promoter operably linked to the nucleic acid sequence encoding the gfp variant of the invention, which meant that the promoter is able to induce / control expression of the gfp ariant in the desired organism. This requires at least the g #? Variant to be in the correct reading frame and orientation with respect to the promoter.

De promotor kan iedere geschikte, in het gewenste organisme werkzame promotor zijn, waaronder constitutieve en induceerbare promotors. Voorbeelden van 15 geschikte promotors voor toepassing in planten en plantencellen zijn bijvoorbeeld constitutieve promoters zoals de nos-promoter, de CaMV 35S promoter, de actine promoter en de mas (mannopinesynthase) promoter of induceerbare promoters zoals de WIN ("wound inducible") promoter en de HMGR (HydroxymethylglutarylCoA reductase) promoter. Andere geschikte promoters voor toepassing in planten worden 20 bijvoorbeeld vermeld in WO 97/41228.The promoter can be any suitable promoter active in the desired organism, including constitutive and inducible promoters. Examples of suitable promoters for use in plants and plant cells are, for example, constitutive promoters such as the nos promoter, the CaMV 35S promoter, the actin promoter and the mas (mannopine synthase) promoter or inducible promoters such as the WIN ("wound inducible") promoter and the HMGR (HydroxymethylglutarylCoA reductase) promoter. Other suitable promoters for use in plants are disclosed, for example, in WO 97/41228.

Geschikte promoters voor toepassing in mensen en menselijke cellen, dieren en dierlijke cellen, alsmede bacteriën, gist(cellen), algen en virussen worden bijvoorbeeld beschreven in WO 95/07463, WO 96/23810, WO 95/07463, WO 95/21191, WO 97/11094, WO 97/42320, WO 98/06737 en WO 98/21355.Suitable promoters for use in human and human cells, animals and animal cells, as well as bacteria, yeast (cells), algae and viruses are described, for example, in WO 95/07463, WO 96/23810, WO 95/07463, WO 95/21191, WO 97/11094, WO 97/42320, WO 98/06737 and WO 98/21355.

25 Verder kunnen promotors worden gebruikt die slechts in een specifiek deel of weefsel van een organisme geïnduceerd worden, zoals alleen in de bladeren of de wortels van een plant; dan wel promotors die alleen tijdens een bepaalde ontwikkelingsfase van het organisme geïnduceerd worden; of promoters die alleen geïnduceerd worden onder specifieke omstandigheden, zoals het optreden van bepaalde 30 ziektenbeelden of afweerreacties. Voorbeelden van geschikte weefselspecifieke promoters zijn de patatin promoter, GBSS promoter en plastocyanine promoter, alsmede de weefselspecifieke promoters voor toepassing in planten vermeld in WO 97/41228; een voorbeeld van een promoter die geactiveerd wordt gedurende een 101 2782 17 bepaalde ontwikkelingsfase van de plant is de S AG12 promoter (van het Arabidopsis "senescence associated gene").Furthermore, promoters can be used which are induced only in a specific part or tissue of an organism, such as only in the leaves or roots of a plant; or promoters that are induced only during a certain developmental stage of the organism; or promoters that are induced only under specific circumstances, such as the appearance of certain disease pictures or immune responses. Examples of suitable tissue specific promoters are the patatin promoter, GBSS promoter and plastocyanin promoter, as well as the tissue specific promoters for use in plants disclosed in WO 97/41228; an example of a promoter that is activated during a certain development phase of the plant is the S AG12 promoter (from the Arabidopsis "senescence associated gene").

In het construct volgens de uitvinding kan de g#?-variant worden voorafgegaan door een of meer sequenties die coderen voor signaalei witten, zoals pre-, pro- of 5 prepro-sequenties, zodanig dat de variante GFP als een fusie met deze signaaleiwitten tot expressie wordt gebracht. Dit kan met name van belang zijn wanneer het construct volgens de uitvinding wordt toegepast in eukaryotische organismen zoals planten en dieren, en/of voor het verkrijgen van de post-translationele modificaties, zoals de modificaties die leiden tot de vorming van de chromofoor.In the construct of the invention, the g #? Variant may be preceded by one or more sequences encoding signal proteins, such as pre, pro or prepro sequences, such that the variant GFP is expressed as a fusion with these signal proteins. is being brought. This may be of particular importance when the construct of the invention is used in eukaryotic organisms such as plants and animals, and / or to obtain the post-translational modifications, such as those leading to the formation of the chromophore.

10 De signaalsequentie kan ook een sequentie zijn die ervoor zorgt het dat het expressieproduct specifiek gericht wordt op bepaalde delen en/of organellen binnen de cel. Voorbeeld is de N-eindstandige signaalsequentie MKTNLFLFLIFSLLLSLSSAEF in combinatie met de C-eindstandige sequentie HDEL, die ervoor zorgt dat het tot expressie gebrachte eiwit zich richt op het endoplasmatisch reticulum. Dit zou 15 mogelijke toxische of afweerreacties in de cellen, weefsels en/of organismen waarin het gfp-gen tot expressie wordt gebracht, kunnen voorkomen of verminderen. Andere voorbeelden van signaalsequences voor toepassing in planten worden bijvoorbeeld gegeven in WO 97/41228.The signal sequence may also be a sequence that causes the expression product to specifically target certain parts and / or organelles within the cell. Example is the N-terminal signal sequence MKTNLFLFLIFSLLLSLSSAEF in combination with the C-terminal sequence HDEL, which causes the expressed protein to target the endoplasmic reticulum. This could prevent or reduce potential toxic or defense responses in the cells, tissues and / or organisms in which the gfp gene is expressed. Other examples of signal sequences for use in plants are given, for example, in WO 97/41228.

Voor de verdere regelelementen die in de constructen volgens de uitvinding 20 aanwezig kunnen zijn, zoals terminators, transcriptionele en/of translationele enhancers en integratiefactoren, worden bijvoorbeeld genoemd in WO 95/07463, WO 96/23810, WO 95/07463, WO 95/21191, WO 97/11094, WO 97/42320, WO 98/06737 en WO 98/21355.For the further control elements which may be present in the constructs according to the invention, such as terminators, transcriptional and / or translational enhancers and integration factors, are mentioned for example in WO 95/07463, WO 96/23810, WO 95/07463, WO 95 / 21191, WO 97/11094, WO 97/42320, WO 98/06737 and WO 98/21355.

Volgens een bijzondere uitvoeringsvorm codeert het construct volgens de 25 uitvinding voor een fusie van de g/p-variant met een of meer verdere gewenste genen, waarbij het variante GFP op geschikte wijze kan optreden als "reporter" voor de expressie van -of meer algemeen voor de aanwezigheid van- deze genen.According to a particular embodiment, the construct according to the invention encodes a fusion of the g / p variant with one or more further desired genes, wherein the variant GFP can suitably act as a "reporter" for the expression of - or more generally for the presence of these genes.

Deze genen kunnen bijvoorbeeld coderen voor eiwitten of peptiden die het getransformeerde organisme van een of meer verbeterde eigenschappen voorzien, zoals 30 resistentie tegen ziekten, stress, zware metalen en dergelijke. De fusies kunnen ook worden gebruikt voor expressie-analyse of onderzoek naar de biologische functie.For example, these genes can encode proteins or peptides that provide the transformed organism with one or more improved properties, such as resistance to diseases, stress, heavy metals and the like. The mergers can also be used for expression analysis or biological function studies.

Voorbeelden van genen/eiwitten die als fusie met de GFP-variant volgens de uitvinding in planten of plantencellen tot expressie kunnen worden gebracht zijn 1012782 18 (omschreven als de uiteindelijke fusie) β-glucuronidase/GFP; plant plasmamembraan eiwit AIR1/GFP6, of phragmoplastine/GFP.Examples of genes / proteins that can be expressed in plants or plant cells as a fusion with the GFP variant of the invention are 1012782 18 (defined as the final fusion) β-glucuronidase / GFP; plant plasma membrane protein AIR1 / GFP6, or phragmoplastin / GFP.

In het construct volgens de uitvinding kan een dergelijke fusie ook worden voorafgegaan door een of meer sequenties die coderen voor signaaleiwitten, zoals de 5 hierboven vermelde signaalsequenties, zodanig dat de GFP/eiwit-fusie als een verdere fusie met deze signaaleiwitten tot expressie wordt gebracht. Dit kan met name van belang zijn wanneer het construct volgens de uitvinding wordt toegepast in eukaryotische organismen zoals planten en dieren, en/of voor het verkrijgen van de post-translationele modificaties, zowel aan de GFP-variant als het gefuseerde eiwit, met 10 inbegrip van afsplitsing van het GFP en het eiwit.In the construct of the invention, such a fusion can also be preceded by one or more sequences encoding signal proteins, such as the signal sequences mentioned above, such that the GFP / protein fusion is expressed as a further fusion with these signal proteins. This may be of particular importance when the construct of the invention is used in eukaryotic organisms such as plants and animals, and / or to obtain the post-translational modifications to both the GFP variant and the fused protein, including of cleavage of the GFP and the protein.

De aanwezigheid van de gfp-variant in een cel, weefsel of gastheerorganisme kan op een op zichzelf bekende wijze worden aangetoond, met name door het gecodeerde GFP tot expressie te laten komen en de aanwezigheid hiervan vast te stellen, bij voorkeur op een op zichzelf wijze, zoals door middel van 15 fluorescentietechnieken. Hierbij wordt in de regel de GFP-variant volgens de uitvinding ingestraald met licht/straling van een geschikte golflengte, waarna de verkregen fluorescentie wordt bepaald, d.w.z. optisch, met een microscoop, of met geschikte apparatuur. Hierbij kan de mate van fluorescentie tevens een maat zijn voor de mate van expressie.The presence of the gfp variant in a cell, tissue or host organism can be demonstrated in a manner known per se, in particular by expressing and determining the presence of the encoded GFP, preferably in a per se manner such as by fluorescent techniques. As a rule, the GFP variant according to the invention is irradiated with light / radiation of a suitable wavelength, after which the fluorescence obtained is determined, i.e. optically, with a microscope, or with suitable equipment. The degree of fluorescence can also be a measure of the degree of expression.

20 De uitvinding zal nu worden toegelicht aan de hand van het onderstaandeThe invention will now be elucidated with reference to the following

Experimentele Gedeelte.Experimental Section.

Experimentele GedeelteExperimental Section

Beginjaren negentig werd het wild-type (wt) gfp-gen uit de kwal (Aequorea 25 victoria) ontdekt en gekarakteriseerd. Sindsdien heeft het gebruik van dit gen belangrijke bijdragen geleverd in zowel wetenschappelijk als toegepast biotechnologisch onderzoek.In the early 1990s, the wild-type (wt) gfp gene from the jellyfish (Aequorea 25 victoria) was discovered and characterized. Since then, the use of this gene has made important contributions in both scientific and applied biotechnology research.

Het gfp-gen codeert voor Green Fluorescent Protein (GFP), een eiwit met een aantal unieke eigenschappen. Wt-GFP is een 27 kDa monomeer en is opgebouwd uit 30 238 aminozuren. Het eiwit straalt groen licht uit (maximale emissie bij ongeveer 510 nm) wanneer het wordt aangestraald met UV (maximale absorbtie bij ongeveer 395 nm) of blauw (maximale absorbtie bij ongeveer 470 nm) licht. Het licht-absorberende gedeelte van wt-GFP, de chromofoor, bestaat uit een gecircularizeerd tripeptide en kan 1012782 19 alleen fluoresceren wanneer het covalent is gebonden aan, en volledig wordt ingesloten door, de rest van het eiwit. De chromofoor is afgeleid van S65-Y66-G67 van de primaire eiwitsequentie en wordt gevormd door modificaties na translatie van het gfp-gen.The gfp gene encodes Green Fluorescent Protein (GFP), a protein with a number of unique properties. Wt-GFP is a 27 kDa monomer and is made up of 30 238 amino acids. The protein emits green light (maximum emission at about 510 nm) when it is irradiated with UV (maximum absorption at about 395 nm) or blue (maximum absorption at about 470 nm) light. The light absorbing portion of wt-GFP, the chromophore, consists of a circularized tripeptide and can fluoresce 1012782 19 only when it is covalently bonded to and completely entrapped by the rest of the protein. The chromophore is derived from S65-Y66-G67 of the primary protein sequence and is formed by modifications after translation of the gfp gene.

5 De functionaliteit van het gfp-gen, en hiervan afgeleide varianten, is reeds aangetoond in allerlei andere organismen, zoals bacteriën, schimmels, dieren, mensen en planten. De aangetoonde fluorescentie in deze organismen blijkt niet afhankelijk te zijn van bepaalde (toegevoegde) co-factoren of substraten (anders dan zuurstof). Bovendien blijkt GFP zeer stabiel te zijn. Zelfs bij hoge hitte (tot 65°C), extreme pH 10 (tussen 5.5 en 12), vele organische oplossingen en een aantal denaturerende stoffen blijft GFP fluoresceren.The functionality of the gfp gene, and variants derived from it, has already been demonstrated in many other organisms, such as bacteria, fungi, animals, humans and plants. The demonstrated fluorescence in these organisms does not appear to depend on certain (added) co-factors or substrates (other than oxygen). In addition, GFP appears to be very stable. Even at high heat (up to 65 ° C), extreme pH 10 (between 5.5 and 12), many organic solutions and some denaturing agents, GFP continues to fluoresce.

Door al deze eigenschappen tesamen is GFP een ideale in vivo reporter voor gebruik in planten. Andere tot nu veel gebruikte reporters in planten, zoals beta-glucuronidase (GUS) en luciferase (LUC), vereisen de toevoeging van substraat om 15 reporter-activiteit te kunnen detecteren. In het geval van GUS is dit zelfs destructief voor het te analyseren materiaal door cytotoxische effecten.All of these properties together make GFP an ideal in vivo reporter for use in plants. Other commonly used plant reporters, such as beta-glucuronidase (GUS) and luciferase (LUC), require the addition of substrate to detect reporter activity. In the case of GUS, it is even destructive to the material to be analyzed due to cytotoxic effects.

Er zijn vele andere toepassingen met GFP denkbaar. Zo kan GFP bijvoorbeeld in plaats van GUS of LUC worden gebruikt als reporter voor hét selecteren van getransformeerde planten. Transformanten zijn makkelijker te identificeren op een niet-20 destructieve manier en grote aantallen planten kunnen sneller geanalyseerd worden, en de kostenbesparingen die hiermee bereikt zouden kunnen worden zouden het mogelijk kunnen maken om ook economisch minder interessante gewassen te transformeren.Many other applications with GFP are conceivable. For example, GFP can be used instead of GUS or LUC as a reporter for selecting transformed plants. Transformants are easier to identify in a non-destructive way, and large numbers of plants can be analyzed more quickly, and the cost savings that could be achieved with this could also make it possible to transform less economically interesting crops.

GFP kan ook gebruikt worden als een zogenaamde fluorescerende markering (’’fluorescent tag”) voor andere eiwitten. Hierbij wordt gebruik gemaakt van de 25 eigenschap dat GFP functioneel kan blijven wanneer het gfp-gen in frame wordt gefuseerd aan het amino- of carboxy-eindstandige uiteinde van een ander eiwit. Subcellulaire activiteiten van zo’n op deze wijze gemarkeerd eiwit, zoals genexpressie, eiwit-eiwit-interacties, eiwit-“traffïcking” en eiwit-localizatie kunnen zodoende bestudeerd worden.GFP can also be used as a so-called fluorescent marker ("fluorescent tag") for other proteins. This takes advantage of the property that GFP can remain functional when the gfp gene is fused in frame at the amino or carboxy terminal end of another protein. Subcellular activities of such protein labeled in this way, such as gene expression, protein-protein interactions, protein trafficking and protein localization, can thus be studied.

30 Een ander denkbare toepassing met GFP is het volgen van pathogenen in de plant op zowel macro- als microscopisch niveau. Zo zouden bijvoorbeeld virale infecties kunnen worden bestudeerd door van een virus manteleiwit-genen te vervangen met een g/p-gen.Another conceivable application with GFP is the monitoring of pathogens in the plant on both a macro and a microscopic level. For example, viral infections could be studied by replacing a virus's coat protein genes with a g / p gene.

101 2782 20101 2782 20

De bruikbaarheid van het originele (wt) gfp-gen in Arabidopsis, en waarschijnlijk andere planten, is beperkt door de aanwezigheid van een cryptisch intron, waarbij door aberante splicing een niet-functioneel GFP ontstaat. Dit probleem kan voor planten worden opgelost door het codon-gebruik aan te passen. Een andere 5 reden om het codon-gebruik aan te passen kan er in gelegen zijn dat, door verlaging van het relatief hoge A/T-gehalte in het wt-gfp-gen, betere expressie in planten wordt verkregen. Verder is het mogelijk gfp-varianten voor planten te voorzien met een signaalpeptide, waardoor GFP wordt gestuurd naar het lumen van het ER, bijvoorbeeld om een verondersteld toxisch effect in het cytoplasma of het nucleoplasma te 10 voorkomen, en/of om het regenereren van de getransformeerde planten beter te laten verlopen. Een mogelijk nadeel echter van lokalisatie of retentiesignalen is dat een dergelijk GFP eventueel niet meer voor lokalisatie-studies (microscopisch) binnen de cel gebruikt kan worden.The utility of the original (wt) gfp gene in Arabidopsis, and probably other plants, is limited by the presence of a cryptic intron, resulting in a non-functional GFP through aberrant splicing. This problem can be solved for plants by adjusting the codon usage. Another reason to adjust the codon usage may be that, by lowering the relatively high A / T content in the wt-gfp gene, better expression in plants is obtained. Furthermore, it is possible to provide plant gfp variants with a signal peptide, whereby GFP is sent to the lumen of the ER, for example, to prevent an assumed toxic effect in the cytoplasm or nucleoplasm, and / or to regenerate the transformed plants to run better. A possible disadvantage of localization or retention signals, however, is that such a GFP may no longer be used for localization studies (microscopic) within the cell.

Een ander doel bij het ontwerpen van gfp- varianten is het minimaliseren van het 15 toxisch door aggregatie in de cel tegen te gaan. Hierbij kunnen zg. "soluble modified" (sm) gfp-varianten worden verkregen, die tevens kunnen zorgen voor verhoging van fluorescentie, omdat oplosbaar GFP wél en geaggregeerd GFP niet functioneel is.Another goal in designing gfp variants is to minimize the toxic by inhibiting aggregation in the cell. So-called "soluble modified" (sm) gfp variants can be obtained, which can also increase fluorescence, because soluble GFP is and aggregated GFP is not functional.

G/p-varianten kunnen in wezen worden onderverdeeld in vier klassen, op basis van verschillende excitatie/emissie spectra: 1) GFP; 2) red-shift (RS)GFP; 3) YFP 20 (Yellow Fluorescent Protein) en 4) BFP (Blue Fluorescent Protein). Red shift- en Blue Fluorescent Protein-varianten kunnen bijvoorbeeld worden verkregen door mutaties waarbij de wt-aminozuren S65 en Y66 (maar in de regel niet G67) van de chromofoor worden gesubstitueerd. Emmissie van de kleur blauw, in plaats van groen, door Blue Fluorescent Protein-varianten wordt voornamelijk veroorzaakt door substitutie van wt-25 Y66 met met name H66 of W66 (oftewel mutatie Y66H en Y66W).G / p variants can essentially be divided into four classes, based on different excitation / emission spectra: 1) GFP; 2) red shift (RS) GFP; 3) YFP 20 (Yellow Fluorescent Protein) and 4) BFP (Blue Fluorescent Protein). For example, red shift and Blue Fluorescent Protein variants can be obtained by mutations in which the wt amino acids S65 and Y66 (but not usually G67) of the chromophore are substituted. Emission of the color blue, rather than green, by Blue Fluorescent Protein variants is mainly due to substitution of wt-25 Y66, in particular H66 or W66 (i.e. mutation Y66H and Y66W).

Voor alle genoemde klassen kan hierbij eventueel ook het chromofoor flankerende wt-aminozuur F64 worden gesubstitueerd.The chromophore flanking wt-amino acid F64 can optionally also be substituted for all the classes mentioned.

GFP-varianten volgens de uitvinding van het Yellow Fluorescent Protein-type kunnen bijvoorbeeld worden verkregen door mutaties waarbij (teri opzichte van de 30 wildtype-sequentie) de aminozuren S65, V68, S72, en/of T203 worden gesubstitueerd.GFP variants of the invention of the Yellow Fluorescent Protein type can be obtained, for example, by mutations in which (in relation to the wild-type sequence) the amino acids S65, V68, S72, and / or T203 are substituted.

Zoals reeds vermeld zullen deze "YFPs" zullen emitteren met een geel/groene kleur, in plaats van met de groene kleur van het wildtype.As already mentioned, these "YFPs" will emit with a yellow / green color, rather than with the green color of the wild type.

1012782 211012782 21

De keuze voor een bepaalde GFP-variant zal afhangen van de toepassing waarvoor een bepaalde variant gebruikt wordt. In het geval van planten dient rekening gehouden te worden met autofluorescentie van plantendelen. Sommige uit de stand der techniek bekende GFPs en BFPs blijken in wortel niet of moeilijk te detecteren. smRS-5 GFP en smGFP zijn daarentegen wel detecteerbaar in wortel. Daarnaast kunnen redshift g#?-varianten intensere fluorescentie vertonen.The choice for a certain GFP variant will depend on the application for which a certain variant is used. In the case of plants, autofluorescence of plant parts must be taken into account. Some GFPs and BFPs known from the prior art appear to be difficult to detect in root. smRS-5 GFP and smGFP, on the other hand, are detectable in root. In addition, redshift g #? Variants may exhibit more intense fluorescence.

De bruikbaarheid van een variant volgens de uitvinding kan bijvoorbeeld op basis van de volgende criteria beoordeeld worden: 1- Aangepast codongebruik (geen cryptisch intron en verlaagd A/T-gehalte voor 10 hogere expressie in eukaryoten).For example, the utility of a variant of the invention can be judged based on the following criteria: 1- Adapted codon usage (no cryptic intron and reduced A / T content for higher expression in eukaryotes).

2- Red-shift (excitatie piek meer in overeenstemming met bandbreedte gebruikte filters, hogere excitatie-coefficient, snellere chromophore-formering, minder last van autofluorescentie in plantdelen) 3- Bij voorkeur geen signaalpeptiden (onbruikbaar wanneer een gefuseerd eiwit 15 gelokalizeerd moet worden) 4- Mutaties waarmee een hogere fluorescentie wordt verkregen (al dan niet door verhoging van de "oplosbaarheid" van GFP in de cel (geaggregeerd GFP is in de regel weinig of niet actief).2- Red-shift (excitation peak more in accordance with bandwidth used filters, higher excitation coefficient, faster chromophore formation, less burden of autofluorescence in plant parts) 3- Preferably no signal peptides (useless when a fused protein needs to be localized) 4- Mutations that achieve a higher fluorescence (whether or not by increasing the "solubility" of GFP in the cell (aggregated GFP is usually little or inactive).

Geen van de in Tabel 1 vermelde, uit de stand der techniek bekende varianten 20 voldoet in afdoende mate aan al deze criteria.None of the prior art variants listed in Table 1 satisfactorily meet all of these criteria.

Voorbeeld 1: Constructie g/b-variant volgens de uitvinding (smeg/pkExample 1: Construction g / b variant according to the invention (smeg / pk

Uitgegaan werd van de bekende sequentie van het egfp-gen (van pEGFP, Clontech). In deze sequentie werden de zogenaamde "soluble modification"-mutaties 25 F99S, M153T, V163A en S175G en de "dual excitation peak" mutatie I167TThe known sequence of the egfp gene (from pEGFP, Clontech) was started from. In this sequence, the so-called "soluble modification" mutations were F99S, M153T, V163A and S175G and the "dual excitation peak" mutation I167T

geïntroduceerd. De in de uitgangssequentie aanwezige mutatie H231L (betekenis onbekend) werd in de originele staat (L231H) terug gebracht. Een 6e mutatie, K238Q, ontstond door de gekozen strategie van kloneren waarbij een Λ/wNI-restrictiesite in het Qgfp-gen werd geïntroduceerd. Deze mutatie valt echter niet binnen het bij voorkeur 30 aangehouden minimale gebied van gfp (aminozuur 7 t/m 229) voor fluorescentie, zodat deze mutatie geen (negatieve) invloed heeft op het niveau van fluorescentie.introduced. The mutation H231L (meaning unknown) present in the starting sequence was restored to its original state (L231H). A 6th mutation, K238Q, arose from the chosen cloning strategy introducing a Λ / wNI restriction site into the Qgfp gene. However, this mutation does not fall within the preferred sustained minimum range of gfp (amino acid 7 to 229) for fluorescence, so that this mutation does not (negatively) affect the level of fluorescence.

Om de mutaties te introduceren werden twee primersets (set “1” en set “2”) van ieder 2 primers ( d.w.z. primers “la/lb” en “2a/2b”) ontworpen, te weten: 101 2782 22To introduce the mutations, two primer sets (set “1” and set “2”) of 2 primers each (ie primers “la / lb” and “2a / 2b”) were designed, namely: 101 2782 22

Primer la: 5 ’ -AATTCG A ACC ATCT C3TTC AAGGACGACGGC AACT AC-3’ 5 Primer lb: 5 ’ -TAGGCCTTGATCCCGTTCTTCTGCTTGTCGGCCGTGATA-3 ’Primer la: 5 "-AATTCG A ACC ATCT C3TTC AAGGACGACGGC AACT AC-3" 5 Primer lb: 5 "-TAGGCCTTGATCCCGTTCTTCTGCTTGTCGGCCGTGATA-3"

Primer 2a: 5 ’-CATATGGATCTTCGCGAACTTCAAGACrcGCC ACAACATCGA 10 GACGGCGGCGTG-3 ’Primer 2a: 5 "-CATATGGATCTTCGCGAACTTCAAGACrcGCC ACAACATCGA 10 GACGGCGGCGTG-3"

Primer 2b: 5 ’ - AAC AGCTACT GGT AC AGCTCGTCC AT GCC4 7GAGTGATCCCGG-3 ’ 15 Deze sequenties zijn tevens weergegeven in respectievelijk SEQ ID’s no 3 t/m 6. Deze primersets zijn ontworpen om aminozuren te substitueren in het als uitgangsproduct gebruikte egfp-gen van plasmide pEGFP (Clontech) d.m.v. PCR. De base(n) welke resulteren in de mutaties zijn vet en cursief weergegeven en zijn als volgt (vanaf 5’-uiteinde): primer la: F99S; primer lb: M153T ; primer 2a: V163A; 1167T; 20 S175G; primer 2b: K238Q; L231H. De onderlijnde basen geven de restrictie-sites in deze primers weer, en zijn (opnieuw vanaf het 5’-uiteinde): primer la: ZfcfBI; primer lb: SM; primer 2a: NdeI; Nrul; primer 2b: Alwl.Primer 2b: 5 '- AAC AGCTACT GGT AC AGCTCGTCC AT GCC4 7GAGTGATCCCGG-3' 15 These sequences are also shown in SEQ IDs no. 3 through 6 respectively. These primer sets are designed to substitute amino acids in the egfp gene used as starting product. of plasmid pEGFP (Clontech) by PCR. The base (s) that result in the mutations are shown in bold and italics and are as follows (from 5 'end): primer 1a: F99S; primer lb: M153T; primer 2a: V163A; 1167T; 20 S175G; primer 2b: K238Q; L231H. The underlined bases represent the restriction sites in these primers, and are (again from the 5 'end): primer 1a: ZfcfBI; primer lb: SM; primer 2a: NdeI; Nrul; primer 2b: Alwl.

De nucleotidenvolgorden (bepaald met BaseClear) van de twee met deze 25 primersets verkregen PCR-producten zijn weergegeven in SEQ ID NO 7 (verkregen met primerset 1) en SEQ ID NO 8 (verkregen met primerset 2). De nucleotidenvolgorden van de gebruikte primers vormen het 5-’en 3’- uiteinde van deze PCR-ffagmenten.The nucleotide sequences (determined by BaseClear) of the two PCR products obtained with these 25 primer sets are shown in SEQ ID NO 7 (obtained with primer set 1) and SEQ ID NO 8 (obtained with primer set 2). The nucleotide sequences of the primers used form the 5 "and 3" ends of these PCR phagments.

Als "target"-sequenties voor primerset 1 en 2 fungeerden respectievelijk het 30 "midden"- en het 3'-gedeelte van egfp uit pEGFP. Met elke primerset werd vervolgens een PCR-reactie, inclusief een zogenaamde "hot"-start, uitgevoerd met behulp van de GeneAmp XL PCR kit (PE applied Biosystems). De met primerset 1 en 2 verkregen PCR-producten werden vervolgens gekloneerd in vector pCR®2.1 met behulp van de 101 2782 23 “Original TA Cloning Kit” (Invitrogen). De verkregen ligatieproducten werden door middel van electroporatie naar E.coli “ElectroMAX DH10B™-cellen" (GibcoBRL life technologies) getransformeerd. Hierbij werd het door “GibcoBRL life technologies” verstrekte transformatieprotocol gevolgd. De basevolgorde van de in pCR®2.1 5 gekloneerde PCR-producten werden bepaald door BaseClear (Leiden) en staan weergegeven in SEQ ID no 7 en 8..As "target" sequences for primer set 1 and 2, the "middle" and 3 'portion of egfp from pEGFP respectively. A PCR reaction, including a so-called "hot" start, was then performed with each primer set using the GeneAmp XL PCR kit (PE applied Biosystems). The PCR products obtained with primer sets 1 and 2 were then cloned into vector pCR®2.1 using the 101 2782 23 “Original TA Cloning Kit” (Invitrogen). The obtained ligation products were transformed by electroporation into E.coli "ElectroMAX DH10B ™ cells" (GibcoBRL life technologies). Following the transformation protocol provided by "GibcoBRL life technologies". The base sequence of the PCR cloned in pCR®2.1 5 products were determined by BaseClear (Leiden) and are listed in SEQ ID no 7 and 8 ..

De geamplificeerde gedeelten van egfp bleken, afgezien van de sequenties van de gebruikte primers met de mutaties, 100% identiek te zijn met de "targef'-sequenties van het egfp-gen in pEGFP. Het open leesraam van de nieuwe ^-variant werd 10 vervolgens gereconstrueerd door middel van een drie-punts ligatie waarbij de volgende drie fragmenten aan elkaar werden geligeerd: 1) een niet-gemodificeerd 5' gedeelte van het egfp uit pEGFP.The amplified portions of egfp were found to be 100% identical to the "targef" sequences of the egfp gene in pEGFP, except for the sequences of the primers used with the mutations. then reconstructed by a three-point ligation ligating the following three fragments: 1) an unmodified 5 'portion of the egfp from pEGFP.

2) het gemodificeerde "midden"-deel van egfp (verkregen met primerset 1).2) the modified "middle" part of egfp (obtained with primer set 1).

3) het gemodificeerde 3'-deel van egfp (verkregen met primerset 2).3) the modified 3 'part of egfp (obtained with primer set 2).

15 Het niet-gemodificeerde 5' gedeelte van egfp werd verkregen uit pEGFP door middel van digestie met de restrictie-enzymen Asel en HihPl. Hierbij werd een fragment van ongeveer 0,47 kb geïsoleerd. Het tweede fragment werd verkregen uit de pCR®2.1 -vector met het gemodificeerde "midden"-deel van egfp. Na digestie hiervan met de restrictie-enzymen 5siBI en Stul werd een fragment van ongeveer 0,2 kb 20 geïsoleerd. Het derde fragment werd verkregen door digestie van de pCR®2.1 -vector met het gemodificeerde 3'-deel van egfp. Hiervoor werden de restrictie-enzymen Ndel en Nruï gebruikt waardoor een fragment (inclusief de pCR®2.1-vector) van ruim 4,1 kb kon worden geïsoleerd. Alle fragmenten werden verkregen door middel van standaard gelelectroforese- en isolatietechnieken. Voor isolatie van de fragmenten werd de 25 “QiaexII gel extraction kit” (Qiagen) gebruikt. Na ligatie van de drie fragmenten werd het ligatiemengsel door middel van electroporatie naar E.coli “ElectroMAX DH10B™"-cellen (GibcoBRL life technologies) getransformeerd. Hierbij werd het door “GibcoBRL life technologies” verstrekte transformatieprotocol gevolgd. Op de geïncubeerde platen werden, met behulp van een “Leica MZ FLIII” fluorescentie 30 stereomicroscoop, duidelijke fluoriserende kolonies waargenomen. Dit bewijst dat ligatie van de fragmenten heeft geresulteerd in een volledig open leesraam. Ook restrictie-analyses uitgevoerd op plasmide DNA geïsoleerd van fluoriserende kolonies wezen dit uit.The unmodified 5 'portion of egfp was obtained from pEGFP by digestion with the restriction enzymes Asel and HihPl. A fragment of about 0.47 kb was isolated. The second fragment was obtained from the pCR®2.1 vector with the modified "middle" part of egfp. After digestion thereof with the restriction enzymes 5siBI and Stul, an approximately 0.2 kb fragment was isolated. The third fragment was obtained by digesting the pCR®2.1 vector with the modified 3 'part of egfp. For this purpose, the restriction enzymes Ndel and Nruï were used, allowing a fragment (including the pCR®2.1 vector) of over 4.1 kb to be isolated. All fragments were obtained by standard gel electrophoresis and isolation techniques. For isolation of the fragments, the “QiaexII gel extraction kit” (Qiagen) was used. After ligation of the three fragments, the ligation mixture was transformed by electroporation into E.coli "ElectroMAX DH10B ™" cells (GibcoBRL life technologies). Following the transformation protocol provided by "GibcoBRL life technologies". using a “Leica MZ FLIII” fluorescence stereo microscope, clear fluorescent colonies were observed, proving that ligation of the fragments resulted in a fully open reading frame, also restriction analyzes performed on plasmid DNA isolated from fluorescent colonies.

1012782 241012782 24

Het aldus verkregen plasmide, genaamd pKG1620, dat het het gfp-gen volgens de uitvinding, genaamd smegfp, bevat, is schematisch weergegeven in Figuur 2. De totale sequentie van pKG1620 is afgeleid van de gepubliceerde vector pCR®2.1 (base 438-4346), de gepubliceerde vector pEGFP (base 4347-4816) en de sequenties zoals 5 bepaald door BaseClear van de met primerset 1 (base 1-202) en 2 (base 203-437) verkregen PCR-producten.The plasmid thus obtained, called pKG1620, which contains the gfp gene of the invention, called smegfp, is schematically shown in Figure 2. The total sequence of pKG1620 is derived from the published vector pCR®2.1 (base 438-4346) , the published vector pEGFP (base 4347-4816) and the sequences as determined by BaseClear of the PCR products obtained with primer set 1 (base 1-202) and 2 (base 203-437).

In pKG1620 is het gfp-gen volgens de uitvinding gefuseerd aan een als voorbeeld gegeven lac-gen (daarnaast wordt in pKG1620 tevens de /ac-promoter toegepast). Het zal de deskundige duidelijk zijn dan dit lac-gen door een of meer 10 andere, van belang zijnde genen kan worden vervangen.In pKG1620, the gfp gene of the invention is fused to an exemplary lac gene (in addition, the / ac promoter is also used in pKG1620). It will be clear to the skilled person that this lac gene can be replaced by one or more other genes of interest.

Het aldus verkregen smegfp vertoonde een dual excitatiepiek rond de 395 en 490 nm en een emissiepiek rond de 510 nm. Zeer goed bruiikbare filtersets voor de Leica MZ FLIK” fluorescentie stereomicroscoop voor toepassing met smegfp volgens de uitvinding zijn bijvoorbeeld voor filterset “GFP2” een excitatiefïlter en “Barrier”-filter 15 van respectievelijk 480/40 en 510 nm en voor filterset “GFP3” een excitatiefïlter en “Barrier”-filter van respectievelijk 470/40 en 525/50 nm.The smegfp thus obtained showed a dual excitation peak around 395 and 490 nm and an emission peak around 510 nm. Very good filter sets for the Leica MZ FLIK ”fluorescence stereo microscope for use with smegfp according to the invention are, for example, for filter set“ GFP2 ”an excitation filter and“ Barrier ”filter 15 of 480/40 and 510 nm respectively and for filter set“ GFP3 ”a excitation filter and “Barrier” filter of 470/40 and 525/50 nm respectively.

Ook het doorkweken van kolonies met dit nieuwe construct, genaamd pKG1620, van plaat naar vloeibaar medium vormde geen probleem. Het verschijnsel bij GFP-werk waarbij E.coli kolonies soms niet willen "aanslaan", wordt meestal verklaard door 20 het toxisch effect van GPF-aggregatie in de cel. De zojuist beschreven observaties kunnen dus wijzen op een verbeterd oplosbaar GFP in E.coli.Cultivation of colonies with this new construct, called pKG1620, from plate to liquid medium was also no problem. The phenomenon in GFP work in which E. coli colonies sometimes do not want to "catch on" is usually explained by the toxic effect of GPF aggregation in the cell. Thus, the observations just described may indicate an improved soluble GFP in E. coli.

Voorbeeld 2: Expressie van efp-fusie.Example 2: Expression of efp fusion.

In dit voorbeeld werd het gfp-gen van Voorbeeld 1, genaamd smegfp, in frame 25 gefuseerd aan het carboxy-eindstandige uiteinde van een ander open leesraam. Hierbij bleek het smEGFP ook als fusie-eiwit nog steeds goed te fluoresceren.In this example, the gfp gene of Example 1, called smegfp, was fused in frame 25 at the carboxy-terminal end of another open reading frame. The smEGFP still appeared to fluoresce well as a fusion protein.

101 2782 25 TABEL 1101 2782 25 TABLE 1

GFP l.wildtype 2.Anderso 3.Davis 4.Haseloff 5.Clontech ó.Héim 7. Heim UITVGFP l.wildtype 2.Anderso 3.Davis 4.Haseloff 5.Clontech ó.Héim 7. Heim UITV

n gfp-Gen wt -gfp g/p-Vexl smRSgfp mg/p5-ER cgfp w7 w2 smeg/p exitatie 395 (470) ~4Ö5 "49Ö 395 & 470 490 433 (453) 333 (453) 395 & (max) nm 490 emissie 5ÏÖ 51Ö ~5ÏÖ 5ÏÖ TlÖ 475 (501) 180 lïÖ (max) nm cryptisch ja ja nee nee nee ja ja nee intron _ _ _ — x 17~ _ _ _ _ _ _ _ _ _ _ _ __ _ _ — 'r r _ _ _ _ _ J : "v __ — _ _ _ _ — ^n gfp-Gen wt -gfp g / p-Vexl smRSgfp mg / p5-ER cgfp w7 w2 smeg / p exitation 395 (470) ~ 4Ö5 "49Ö 395 & 470 490 433 (453) 333 (453) 395 & (max) nm 490 emission 5ÏÖ 51Ö ~ 5ÏÖ 5ÏÖ TlÖ 475 (501) 180 lïÖ (max) nm cryptic yes yes no no no yes yes no intron _ _ _ - x 17 ~ _ _ _ _ _ _ _ _ _ _ _ __ _ _ - 'rr _ _ _ _ _ J: "v __ - _ _ _ _ - ^

"Ï53 "M T T T T"Ï53" M T T T T

_ __ _ __ _ _ _ _ _ - _ ; : x __ _ _ _ _ _ _ __ — j _ _ ; : : “k _ — — __ — — gemod. geen geen 237-447 237-540 geheel geen geen geheel codons (b.p) a) letters geven aminozuur aan (één letter code) 5 b) alle niet aangegeven posities zijn gelijk aan het wildtype 101 2782 26 c) golflengten zijn in nm; golflengten tussen haakjes geven ondergeschikte piek aan._ __ _ __ _ _ _ _ _ - _; : x __ _ _ _ _ _ _ __ - j _ _; :: “K _ - - __ - - mod. none none 237-447 237-540 none none none integer codons (b.p) a) letters indicate amino acid (one letter code) 5 b) all positions not indicated are equal to wild type 101 2782 26 c) wavelengths are in nm; wavelengths in brackets indicate minor peak.

d) voor alle varianten is de chromofoor S, C of T65/Y66/G67 1. Wildtype beschreven door Prasher et al., 1992 5 2. Anderson et al, 1996d) for all variants, the chromophore is S, C or T65 / Y66 / G67 1. Wild type described by Prasher et al., 1992 5 2. Anderson et al, 1996

3. Davis/Vierstra; extra N-terminale sequentie: MKTNLFLFLIFSLLLSLSSAEF (F3. Davis / Vierstra; additional N-terminal sequence: MKTNLFLFLIFSLLLSLSSAEF (F

i.pv. Ml) / extra C-terminale sequentie: HDELinstead of M1) / additional C-terminal sequence: HDEL

4. Haseloff 5. Handleiding van Clontech, Ine.4. Haseloff 5. Clontech Manual, Ine.

10 6. Heim & Tsien, 1996 7. Heim & Tsien, 199610 6. Heim & Tsien, 1996 7. Heim & Tsien, 1996

Uitvinding: 1 extra aminozuur (V) na Ml.Invention: 1 extra amino acid (V) after M1.

101 2782 27 T A B E L 1 (vervolg)101 2782 27 T A B E L 1 (continued)

GFP 8. Heim 9. 10. Mitra ll.Cormac I2.Clontec 13. Pang l4.Quantu UITVGFP 8. Heim 9. 10. Mitra ll.Cormac I2.Clontec 13. Pang l4.Quantu UITV

Clontech k h m g/p-Ge n p4-l cbfp bfp g/pmut2 cyfp S65Tpg/p pQB125 sm egfp exitatie 505 (395) "38Ö ~38(j ~48Ö "5Ï3 "490 "475 395 & 490 (max) nm emissie TÏ5 ~44Ö ~44Ö TfÖ ~527 ~51Ö ÜiÖ ^ÏÖ (max) nm cryptisch nee onbek. ja nee nee ja nee intron _ _ _ _ _ _ - _ _ _ _ _ — _ _ _ _ _ _ - _ _ _ _ _ ; _ _ — _ _ __ _ _ __ ; ___ _ — : "t __ ; "a __ _ — __ _ — __Clontech khmg / p-Ge n p4-l cbfp bfp g / pmut2 cyfp S65Tpg / p pQB125 sm egfp exitation 505 (395) "38Ö ~ 38 (j ~ 48Ö" 5Ï3 "490" 475 395 & 490 (max) nm emission TÏ5 ~ 44Ö ~ 44Ö TfÖ ~ 527 ~ 51Ö ÜiÖ ^ ÏÖ (max) nm cryptic no unknown yes no no yes no intron _ _ _ _ _ _ - _ _ _ _ _ - _ _ _ _ _ _ - _ _ _ _ _; _ _ - _ _ __ _ _ __; ___ _ -: "t __;" a __ _ - __ _ - __

"2Ö3 T"2Ö3 T

_ ; : : ~ __ "238 "Ë n o ~ gemod. geen onbek. onbek. nee onbek. geheel 504-708 geheel codons (b.p) a) letters geven aminozuur aan (één letter code) 1012782 28 b) alle niet aangegeven posities zijn gelijk aan het wildtype c) golflengten zijn in nm; golflengten tussen haakjes geven ondergeschikte piek aan._; :: ~ __ "238" One o ~ mod. no fault. unknown. no unknown. whole 504-708 whole codons (b.p) a) letters indicate amino acid (one letter code) 1012782 28 b) all positions not indicated are equal to the wild type c) wavelengths are in nm; wavelengths in brackets indicate minor peak.

d) voor alle varianten is de chromofoor S, C of T65/Y66/G67 58. Heim & Tsien, 1996 9. Handleiding van Clontech 10. Mitraetal., 1996 11. Cormack et al., 12. Handleiding van Clontech 1013. Pang et al., 1996: “ST-LSl”-intron tussen baseparen 379-380 14. Handleiding van Quantum Biotechnologies; 1 extra aminozuur (V) na Ml.d) for all variants, the chromophore is S, C or T65 / Y66 / G67 58. Heim & Tsien, 1996 9. Clontech Manual 10. Mitraetal., 1996 11. Cormack et al., 12. Clontech Manual 1013. Pang et al., 1996: "ST-LS1" intron between base pairs 379-380 14. Quantum Biotechnologies Manual; 1 extra amino acid (V) after M1.

Uitvinding: 1 extra aminozuur (V) na Ml.Invention: 1 extra amino acid (V) after M1.

101 2782 29101 2782 29

SEQUENCE LISTINGSEQUENCE LISTING

<110> Keygene N.V.<110> Keygene N.V.

5 <120> Verbeterde gfp-variant, bruikbaar als markering, en gfp-construct <130> BO 42497 10 <140> <141> <160> 7 15 <170> Patentln Ver. 2.15 <120> Improved GFP variant, usable as marking, and GFP construct <130> BO 42497 10 <140> <141> <160> 7 15 <170> Patent Ver. 2.1

<210> 1 <211> 720 <212> DNA<210> 1 <211> 720 <212> DNA

20 <213> Artificial Sequence <220> <223> Description of Artificial Sequence: sme-gfp 25 <220> <221> misc_feature <222> (4)..(6) <223> inserted codon GTG compared to wild-type gfp sequence 30 <400> 1 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 35 ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg aaccatctct 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca cggccgacaa gcagaagaac 480 40 gggatcaagg cgaacttcaa gactcgccac aacatcgagg acggcggcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actcatggca tggacgagct gtaccagtag 720 4520 <213> Artificial Sequence <220> <223> Description of Artificial Sequence: sme-gfp 25 <220> <221> misc_feature <222> (4) .. (6) <223> inserted codon GTG compared to wild-type gfp sequence 30 <400> 1 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 35 ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg aaccatctct 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca cggccgacaa gcagaagaac 480 40 gggatcaagg cgaacttcaa gactcgccac aacatcgagg acggcggcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc CGCC gggatc actcatggca tggacgagct gtaccagtag 720 45

<210> 2 <211> 239 <212> PRT<210> 2 <211> 239 <212> PRT

<213> Artificial Sequence 50 <220> <223> Description of Artificial Sequence: sme-GFP <220><213> Artificial Sequence 50 <220> <223> Description of Artificial Sequence: sme-GFP <220>

55 <221> UNSURE55 <221> UNSURE

<222> (2) <223> inserted Valine compared to wild-type GFP sequence <400> 2 60 Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro lie Leu 1012782 1 5.. 10 15 30<222> (2) <223> inserted Valine compared to wild-type GFP sequence <400> 2 60 Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val lie Leu 1012782 1 5 .. 10 15 30

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly 20 25 30 5Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly 20 25 30 5

Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile 35 40 45Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile 35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 10 50 55 60Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 10 50 55 60

Leu Thr Tyr Gly Val Gin Cys Phe Ser Arg Tyr Pro Asp His Met Lys 65 70 75 80 15 Gin His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gin Glu 85 .90 95Leu Thr Tyr Gly Val Gin Cys Phe Ser Arg Tyr Pro Asp His Met Lys 65 70 75 80 15 Gin His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gin Glu 85 .90 95

Arg Thr lie Ser Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu 100 105 110 20Arg Thr lie Ser Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu 100 105 110 20

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly 115 120 125Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly 115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr 25 130 135 140Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr 25 130 135 140

Asn Tyr Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gin Lys Asn 145 150 155 160 30 Gly Ile Lys Ala Asn Phe Lys Thr Arg His Asn Ile Glu Asp Gly Gly 165 170 175Asn Tyr Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gin Lys Asn 145 150 155 160 30 Gly Ile Lys Ala Asn Phe Lys Thr Arg His Asn Ile Glu Asp Gly Gly 165 170 175

Val Gin Leu Ala Asp His Tyr Gin Gin Asn Thr Pro Ile Gly Asp Gly 180 185 190 35Val Gin Leu Ala Asp His Tyr Gin Gin Asn Thr Pro Ile Gly Asp Gly 180 185 190 35

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gin Ser Ala Leu 195 200 205Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gin Ser Ala Leu 195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe 40 210 215 220Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe 40 210 215 220

Val Thr Ala Ala Gly lie Thr His Gly Met Asp Glu Leu Tyr Gin 225 230 235 45Val Thr Ala Ala Gly lie Thr His Gly Met Asp Glu Leu Tyr Gin 225 230 235 45

<210> 3 <211> 22 <212> PRT<210> 3 <211> 22 <212> PRT

50 <213> Artificial Sequence <220> <223> Description of Artificial Sequence: N-terminal signal sequence 55 <400> 350 <213> Artificial Sequence <220> <223> Description of Artificial Sequence: N-terminal signal sequence 55 <400> 3

Met Lys Thr Asn Leu Phe Leu Phe Leu Ile Phe Ser Leu Leu Leu Ser 15 10 15 60 Leu Ser Ser Ala Glu Phe 20 101 2782 31 <210> 4 5 <211> 37With Lys Thr Asn Leu Phe Leu Phe Leu Ile Phe Ser Leu Leu Leu Ser 15 10 15 60 Leu Ser Ser Ala Glu Phe 20 101 2782 31 <210> 4 5 <211> 37

<212> DNA<212> DNA

<213> Artificial Sequence <220> 10 <223> Description of Artificial Sequence: primer la <400> 4 aattcgaacc atctctttca aggacgacgg caactac 37 15<213> Artificial Sequence <220> 10 <223> Description of Artificial Sequence: primer la <400> 4 aattcgaacc atctctttca aggacgacgg caactac 37 15

<210> 5 <211> 39 <212> DNA<210> 5 <211> 39 <212> DNA

<213> Artificial Sequence 20 <220> <223> Description of Artificial Sequence: primer lb <400> 5 25 taggccttga tcccgttctt ctgcttgtcg gccgtgata 39<213> Artificial Sequence 20 <220> <223> Description of Artificial Sequence: primer lb <400> 5 25 taggccttga tcccgttctt ctgcttgtcg gccgtgata 39

<210> 6 <211> 54 30 <212> DNA<210> 6 <211> 54 30 <212> DNA

<213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer 2a 35 <400> 6 catatggatc ttcgcgaact tcaagactcg ccacaacatc gagacggcgg cgtg 54 40 <210> 7<213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer 2a 35 <400> 6 catatggatc ttcgcgaact tcaagactcg ccacaacatc gagacggcgg cgtg 54 40 <210> 7

<211> 43 <212> DNA<211> 43 <212> DNA

<213> Artificial Sequence 45 <220> <223> Description of Artificial Sequence: primer 2b <400> 7 aacagctact ggtacagctc gtccatgcca tgagtgatcc egg 43 50 101 2782<213> Artificial Sequence 45 <220> <223> Description of Artificial Sequence: primer 2b <400> 7 aacagctact ggtacagctc gtccatgcca tgagtgatcc egg 43 50 101 2782

Claims (12)

1. Variant van het g/p-gen, dan wel nucle'mezunrsequentie of genetisch construct die/dat voor deze variant codeert, omvattende ten opzichte van de sequentie van het wild- 5 type: - ten minste één mutatie in ten minste één van de codons die coderen voor aminozuurposities 99, 153 en/of 163, zodanig dat het door het variante gen gecodeerde eiwit een verbeterde oplosbaarheid vertoont, vergeleken met het wildtype GFP; 10. ten minste één mutatie in ten minste één van de codons die coderen voor aminozuurposities 65, 66 en/of 67, zodanig dat het excitatiespectrum van het door het variante gen gecodeerde eiwit verschoven wordt naar het rode of blauwe uiteinde van het spectrum, vergeleken met het wildtype GFP; - ten minste één mutatie in ten minste een van de codons die coderen voor 15 aminozuurposities 163,167 en/of 175, zodanig dat het door het variante gen gecodeerde eiwit verbeterde "dual excitatiori'-karakteristieken vertoont, vergeleken met het wildtype GFP; en bij voorkeur tevens - ten minste één mutatie in het codon dat codeert voor aminozuurpositie 64, zodanig dat het door het variante gen gecodeerde eiwit een versterkte fluorescentie vertoont, 20 vergeleken met het wildtype GFP; en hiermee equivalente of hieraan analoge sequenties, alsmede fragmenten hiervan.1. A variant of the g / p gene, or the nucleus gene sequence or genetic construct encoding this variant, comprising, with respect to the sequence of the wild type: - at least one mutation in at least one of the codons encoding amino acid positions 99, 153 and / or 163 such that the protein encoded by the variant gene exhibits improved solubility compared to the wild type GFP; 10. at least one mutation in at least one of the codons encoding amino acid positions 65, 66 and / or 67 such that the excitation spectrum of the protein encoded by the variant gene is shifted to the red or blue end of the spectrum, compared with the wild type GFP; at least one mutation in at least one of the codons encoding 15 amino acid positions 163,167 and / or 175 such that the protein encoded by the variant gene exhibits improved "dual excitatiori" characteristics compared to the wild type GFP, and preferably also - at least one mutation in the codon encoding amino acid position 64 such that the protein encoded by the variant gene exhibits enhanced fluorescence compared to the wild type GFP, and equivalent or analogous sequences thereto, as well as fragments thereof. 2. Variant, nucleïnezuursequentie of genetisch construct volgens conclusie 1, omvattende, ten opzichte van de sequentie van het wild-type: 25. ten minste één mutatie in ieder van de codons die coderen voor aminozuurposities 99, 153 en/of 163, zodanig dat gecodeerde eiwit een verbeterde oplosbaarheid vertoont, vergeleken met het wildtype GFP; - ten minste één mutatie in ten minste een van de codons die coderen voor aminozuurposities 65,66 en/of 67, en bij voorkeur in het codon dat codeert voor 30 aminozuurpositie 65, zodanig dat het excitatiespectrum van het gecodeerde eiwit verschoven wordt naar het rode uiteinde van het spectrum, vergeleken met het wildtype GFP; 1012782 - ten minste één mutatie in ieder van de codons die coderen voor aminozuurposities 163,167 en/of 175, zodanig dat het gecodeerde eiwit verbeterde "dual excitation"-karakteristieken vertoont, vergeleken met het wildtype GFP; en - ten minste één mutatie in het codon dat codeert voor aminozuurpositie 64, zodanig 5 dat het gecodeerde eiwit een versterkte fluorescentie vertoont, vergeleken met het wildtype GFP; en hiermee equivalente of hieraan analoge sequenties, alsmede fragmenten hiervan.A variant, nucleic acid sequence or genetic construct according to claim 1, comprising, with respect to the wild type sequence: 25. at least one mutation in each of the codons encoding amino acid positions 99, 153 and / or 163, such that encoded protein exhibits improved solubility over the wild type GFP; - at least one mutation in at least one of the codons encoding amino acid positions 65,66 and / or 67, and preferably in the codon encoding amino acid position 65, such that the excitation spectrum of the encoded protein is shifted to the red end of the spectrum, compared to the wild type GFP; 1012782 - at least one mutation in each of the codons encoding amino acid positions 163,167 and / or 175 such that the encoded protein exhibits improved dual excitation characteristics compared to the wild type GFP; and - at least one mutation in the codon encoding amino acid position 64 such that the encoded protein exhibits enhanced fluorescence compared to the wild type GFP; and equivalent or analogous sequences thereto, as well as fragments thereof. 3. Variant, nucleïnezuursequentie of genetisch construct volgens conclusie 1 of 10 2, waarbij de mutaties op posities 65,66 en/of 67 verder zodanig zijn, dat het gecodeerde eiwit tevens een versterkte fluorescentie (d.w.z. emissie) vertoont, vergeleken met het wildtype GFP, in het bijzonder bij golflengten tussen 450 en 550 nm.The variant, nucleic acid sequence or genetic construct according to claim 1 or 10 2, wherein the mutations at positions 65,66 and / or 67 are further such that the encoded protein also exhibits enhanced fluorescence (ie emission) compared to the wild type GFP especially at wavelengths between 450 and 550 nm. 4. Variant, nucleïnezuursequentie of genetisch construct volgens een der conclusies 1-3, waarbij de mutaties in de codons op posities 64, 65, 99, 153,163,167 en 175 een of meer substitities van een of meer nucleotiden omvatten, zodanig dat het mutante codon codeert voor een ander aminozuur als aanwezig op de betreffende positie in het wildtype GFP. 20The variant, nucleic acid sequence or genetic construct according to any one of claims 1 to 3, wherein the mutations in the codons at positions 64, 65, 99, 153, 163, 167 and 175 comprise one or more substitions of one or more nucleotides such that the mutant codon encodes for another amino acid as present at the appropriate position in the wild type GFP. 20 5. Variant, nucleïnezuursequentie of genetisch construct volgens een der conclusies 1-4, waarbij de mutaties coderen voor de volgende aminozuursubstituties, ten opzichte van het wildtype: 25 101 2782 Aminozuurpositie Wild-type Variant volgens de uitvinding ~64 F L of MThe variant, nucleic acid sequence or genetic construct according to any one of claims 1 to 4, wherein the mutations encode the following amino acid substitutions, relative to the wild type: Amino acid position Wild type Variant of the invention ~ 64 F L or M 65. C, T, G of A 66 6765. C, T, G or A 66 67 99. S99. S 153. Tof A153. Great A 163. A163. A 167. T167. T 175. G175. G 6. Nucleïnezuursequentie of genetisch construct volgens een der conclusies 1-5, verder omvattende een of meer op zichzelf bekende elementen van 5 nucleïnezuursequenties of genetische constructen, zoals promoters of andere regelelementen, enhancers, integratiefactoren, signaalsequenties, en dergelijke.Nucleic acid sequence or genetic construct according to any one of claims 1 to 5, further comprising one or more known per se elements of nucleic acid sequences or genetic constructs, such as promoters or other control elements, enhancers, integration factors, signal sequences, and the like. 7. Nucleïnezuursequentie of genetisch construct volgens een der conclusies 1-6, verder omvattende ten minste een verdere sequentie die codeert voor een gen, een 10 gewenste eigenschap, een eiwit of een polypeptide, waarbij het eiwit of polypeptide eventueel als een fusie met de ^-variant volgens de uitvinding tot expressie wordt gebracht.Nucleic acid sequence or genetic construct according to any one of claims 1-6, further comprising at least one further sequence encoding a gene, a desired property, a protein or a polypeptide, the protein or polypeptide optionally as a fusion with the β. variant of the invention is expressed. 8. Variant van het GFP-eiwit, zoals gecodeerd door een gfp-variant volgens een der 15 conclusies 1-7, of zoals verkrijgbaar door expressie van een nucleïnezuursequentie of genetisch construct volgens een der conclusies 1-7.A variant of the GFP protein, as encoded by a gfp variant according to any one of claims 1-7, or as obtainable by expression of a nucleic acid sequence or genetic construct according to any one of claims 1-7. 9. Toepassing van een gfp-variant, een nucleïnezuursequentie of een genetisch construct volgens een conclusies 1-7, en/of van een variant van het GFP-eiwit volgens 20 conclusie 8, als een label of markering in (micro)biologische, biochemische en/of moleculair biologische technieken. 10127829. Use of a gfp variant, a nucleic acid sequence or a genetic construct according to claims 1-7, and / or of a variant of the GFP protein according to claim 8, as a label or marker in (micro) biological, biochemical and / or molecular biological techniques. 1012782 10. Toepassing van een g/p-variant, een nucleïnezuursequentie of een genetisch construct volgens een conclusies 1-7, en/of een variant van het GFP-eiwit volgens conclusie 8, als een genetische markering of expressiemarkering in vivo, in het bijzonder in planten, mensen, dieren of in cellen of weefsels hiervan, of in hiervan afgeleide 5 cellijnen.Use of a g / p variant, a nucleic acid sequence or a genetic construct according to claims 1-7, and / or a variant of the GFP protein according to claim 8, as a genetic marker or expression marker in vivo, in particular in plants, humans, animals or in cells or tissues thereof, or in cell lines derived therefrom. 11. Toepassing volgens conclusie 10, omvattende het transformeren van een gastheerorganisme of een cel, deel of weefsel ervan, met een nucleïnezuursequentie volgens een der conclusies 1-7; en/of omvattende het tot expressie laten komen in het 10 gastheerorganisme van een gjp-variant volgens een der conclusie 1 -7.Use according to claim 10, comprising transforming a host organism or a cell, part or tissue thereof, with a nucleic acid sequence according to any one of claims 1-7; and / or comprising expressing in the host organism a gjp variant according to any one of claims 1-7. 12. Organisme, zoals een plant, een dier, een mens, een bacterie, een alg, een gist(cel) of een ander micro-organismen, alsmede weefsels of cellen van deze organismen, of hiervan afgeleide cellijnen, die een sequentie of construct volgens een der conclusies 1- 15. omvatten, en/of een GFP-variant volgens conclusie 8 tot expressie brengen. 101278212. Organism, such as a plant, an animal, a human, a bacteria, an alga, a yeast (cell) or other micro-organisms, as well as tissues or cells of these organisms, or cell lines derived therefrom, which have a sequence or construct according to any one of claims 1-15., and / or expressing a GFP variant according to claim 8. 1012782
NL1012782A 1999-08-05 1999-08-05 New variant of the green fluorescent protein gene, useful for expressing labels, particularly for genetic or expression labeling, has e.g. better solubility or shifted excitation spectrum NL1012782C2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
NL1012782A NL1012782C2 (en) 1999-08-05 1999-08-05 New variant of the green fluorescent protein gene, useful for expressing labels, particularly for genetic or expression labeling, has e.g. better solubility or shifted excitation spectrum

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
NL1012782 1999-08-05
NL1012782A NL1012782C2 (en) 1999-08-05 1999-08-05 New variant of the green fluorescent protein gene, useful for expressing labels, particularly for genetic or expression labeling, has e.g. better solubility or shifted excitation spectrum

Publications (1)

Publication Number Publication Date
NL1012782C2 true NL1012782C2 (en) 2001-02-06

Family

ID=19769706

Family Applications (1)

Application Number Title Priority Date Filing Date
NL1012782A NL1012782C2 (en) 1999-08-05 1999-08-05 New variant of the green fluorescent protein gene, useful for expressing labels, particularly for genetic or expression labeling, has e.g. better solubility or shifted excitation spectrum

Country Status (1)

Country Link
NL (1) NL1012782C2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006029449A1 (en) * 2004-09-14 2006-03-23 Btf Pty Ltd Chromosomal insertion of gfp into bacteria for quality control
US7951557B2 (en) 2003-04-27 2011-05-31 Protalix Ltd. Human lysosomal proteins from plant cell culture
US10364413B2 (en) 2007-05-07 2019-07-30 Protalix Ltd. Large scale disposable bioreactor

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996023810A1 (en) * 1994-11-10 1996-08-08 The Regents Of The University Of California Modified green fluorescenct proteins
WO1996027675A1 (en) * 1995-03-06 1996-09-12 Medical Research Council Jellyfish green fluorescent protein (gfp) expression in plants
WO1997042320A1 (en) * 1996-05-08 1997-11-13 The Government Of The United States Of America, Represented By The Secretary, Department Of Health And Human Services Mutant aequorea victoria fluorescent proteins having increased cellular fluorescence
WO1998002571A1 (en) * 1996-07-16 1998-01-22 The Regents Of The University Of California Assays for protein kinases using fluorescent protein substrates
WO1998021355A1 (en) * 1996-11-15 1998-05-22 Life Technologies, Inc. Mutants of green fluorescent protein
WO1999003997A1 (en) * 1997-07-16 1999-01-28 University Of Florida Humanized and green fluorescent protein genes and methods
WO1999064592A2 (en) * 1998-06-09 1999-12-16 The Regents Of The University Of California Green fluorescent proteins for measuring the ph of a biological sample

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996023810A1 (en) * 1994-11-10 1996-08-08 The Regents Of The University Of California Modified green fluorescenct proteins
WO1996027675A1 (en) * 1995-03-06 1996-09-12 Medical Research Council Jellyfish green fluorescent protein (gfp) expression in plants
WO1997042320A1 (en) * 1996-05-08 1997-11-13 The Government Of The United States Of America, Represented By The Secretary, Department Of Health And Human Services Mutant aequorea victoria fluorescent proteins having increased cellular fluorescence
WO1998002571A1 (en) * 1996-07-16 1998-01-22 The Regents Of The University Of California Assays for protein kinases using fluorescent protein substrates
WO1998021355A1 (en) * 1996-11-15 1998-05-22 Life Technologies, Inc. Mutants of green fluorescent protein
WO1999003997A1 (en) * 1997-07-16 1999-01-28 University Of Florida Humanized and green fluorescent protein genes and methods
WO1999064592A2 (en) * 1998-06-09 1999-12-16 The Regents Of The University Of California Green fluorescent proteins for measuring the ph of a biological sample

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CRAMERI A ET AL: "IMPROVED GREEN FLUORESCENT PROTEIN BY MOLECULAR EVOLUTION USING DNA SHUFFLING", NATURE BIOTECHNOLOGY,US,NATURE PUBLISHING, vol. 14, 14 March 1996 (1996-03-14), pages 315 - 319, XP000791095, ISSN: 1087-0156 *
LLOPIS JUAN ET AL: "Measurement of cytosolic, mitochondrial, and Golgi pH in single living cells with green fluorescent proteins.", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA JUNE 9, 1998, vol. 95, no. 12, 9 June 1998 (1998-06-09), pages 6803 - 6808, XP002083569, ISSN: 0027-8424 *
MITRA R D ET AL: "FLUORESCENCE RESONANCE ENERGY TRANSFER BETWEEN BLUE-EMITTING AND RED-SHIFTED EXCITATION DERIVATIVES OF THE GREEN FLUORESCENT PROTEIN", GENE: AN INTERNATIONAL JOURNAL ON GENES AND GENOMES,GB,ELSEVIER SCIENCE PUBLISHERS, BARKING, vol. 173, no. 1, 1 July 1996 (1996-07-01), pages 13 - 17, XP002033688, ISSN: 0378-1119 *
PATTERSON G H ET AL: "USE OF THE GREEN FLUORESCENT PROTEIN AND ITS MUTANTS IN QUANTITATIVE FLUORESCENCE MICROSCOPY", BIOPHYSICAL JOURNAL,US,NEW YORK, US, vol. 73, no. 5, November 1997 (1997-11-01), pages 2782 - 2790, XP000783542, ISSN: 0006-3495 *
S.J. DAVIS AND R.D. VIERSTRA: "Soluble, highly fluorescent variants of green fluorescent protein (GFP) for use in higher plants", PLANT MOLECULAR BIOLOGY, vol. 36, no. 4, March 1998 (1998-03-01), KLUWER ACADEMIC PUBLISHERS, BELGIUM, pages 521 - 528, XP002135437 *
S.-Z. PANG ET AL.: "An improved green fluorescent protein gene as a vital marker in plants", PLANT PHYSIOLOGY, vol. 112, 1996, AM. SOC. PLANT PHYSIOLOGISTS, ROCKVILLE, MD,US, pages 893 - 900, XP002135438 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7951557B2 (en) 2003-04-27 2011-05-31 Protalix Ltd. Human lysosomal proteins from plant cell culture
US8449876B2 (en) 2003-04-27 2013-05-28 Protalix Ltd. Human lysosomal proteins from plant cell culture
US8741620B2 (en) 2003-04-27 2014-06-03 Protalix Ltd. Human lysosomal proteins from plant cell culture
US8790641B2 (en) 2003-04-27 2014-07-29 Protalix Ltd. Production of high mannose proteins in plant culture and therapeutic uses thereof
US9220737B2 (en) 2003-04-27 2015-12-29 Protalix Ltd. Plant cell culture expressing human lysosomal proteins and uses thereof
WO2006029449A1 (en) * 2004-09-14 2006-03-23 Btf Pty Ltd Chromosomal insertion of gfp into bacteria for quality control
US9309300B2 (en) 2004-09-14 2016-04-12 Macquarie University Chromosomal insertion of GFP into bacteria for quality control
US10364413B2 (en) 2007-05-07 2019-07-30 Protalix Ltd. Large scale disposable bioreactor

Similar Documents

Publication Publication Date Title
van der Krol et al. The basic domain of plant B-ZIP proteins facilitates import of a reporter protein into plant nuclei.
AU730927B2 (en) Use of the green fluorescent protein as a screenable marker for plant transformation
JP4229469B2 (en) Humanized green fluorescent protein gene and method
WO2022100527A1 (en) Novel cas enzyme and system and use thereof
Lee et al. Screening a cDNA library for protein–protein interactions directly in planta
WO2022166895A1 (en) Crispr enzyme and system and use thereof
CN114672473B (en) Optimized Cas protein and application thereof
WO1996027675A1 (en) Jellyfish green fluorescent protein (gfp) expression in plants
WO1997041228A9 (en) Use of the green fluorescent protein as a screenable marker for plant transformation
JP2009296886A (en) Tool for screening plant having useful trait and use thereof
Bhat et al. Interaction of maize Opaque-2 and the transcriptional co-activators GCN5 and ADA2, in the modulation of transcriptional activity
NL1012782C2 (en) New variant of the green fluorescent protein gene, useful for expressing labels, particularly for genetic or expression labeling, has e.g. better solubility or shifted excitation spectrum
JP4631003B2 (en) Protein complex detection method and protein complex detection kit
Mullaney et al. Activity of foreign proteins targeted within the bacteriophage T4 head and prohead: implications for packaged DNA structure
US6548642B1 (en) Synthetic genes for plant gums
AU1350801A (en) Production of functional hybrid genes and proteins
US8206978B2 (en) Green fluorescent protein optimized for expression with self-cleaving polypeptides
JP6762069B2 (en) Fluorescent protein
CN114277015B (en) CRISPR enzyme and application
CA2502657C (en) Use of the green fluorescent protein as a screenable marker for plant transformation
WO2023143150A1 (en) Novel cas enzyme and system and use
Bhat et al. The tobacco BY-2 cell line as a model system to understand in planta nuclear coactivator interactions
WO2023143342A1 (en) Cas enzyme, system, and use thereof
JP4300031B2 (en) Cloning vector
WO2024204529A1 (en) Method for introducing substance into generative cells

Legal Events

Date Code Title Description
PD2B A search report has been drawn up
VD1 Lapsed due to non-payment of the annual fee

Effective date: 20050301