WO2008096070A2 - Lignee cellulaire a forte activite transcriptionnelle pour la production de proteines, notamment therapeutiques - Google Patents

Lignee cellulaire a forte activite transcriptionnelle pour la production de proteines, notamment therapeutiques Download PDF

Info

Publication number
WO2008096070A2
WO2008096070A2 PCT/FR2007/002144 FR2007002144W WO2008096070A2 WO 2008096070 A2 WO2008096070 A2 WO 2008096070A2 FR 2007002144 W FR2007002144 W FR 2007002144W WO 2008096070 A2 WO2008096070 A2 WO 2008096070A2
Authority
WO
WIPO (PCT)
Prior art keywords
cell
nucleic acid
recombinase
protein
interest
Prior art date
Application number
PCT/FR2007/002144
Other languages
English (en)
Other versions
WO2008096070A3 (fr
WO2008096070A8 (fr
Inventor
Christine Gaucher
Christophe Sirac
Original Assignee
Lfb Biotechnologies Societe Par Actions Simplifiee Unipersonnelle
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lfb Biotechnologies Societe Par Actions Simplifiee Unipersonnelle filed Critical Lfb Biotechnologies Societe Par Actions Simplifiee Unipersonnelle
Priority to JP2009542139A priority Critical patent/JP2010512776A/ja
Priority to EP07872428.3A priority patent/EP2121917B1/fr
Priority to CA002671825A priority patent/CA2671825A1/fr
Priority to AU2007346339A priority patent/AU2007346339A1/en
Publication of WO2008096070A2 publication Critical patent/WO2008096070A2/fr
Publication of WO2008096070A3 publication Critical patent/WO2008096070A3/fr
Publication of WO2008096070A8 publication Critical patent/WO2008096070A8/fr

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/14Prodigestives, e.g. acids, enzymes, appetite stimulants, antidyspeptics, tonics, antiflatulents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/18Drugs for disorders of the alimentary tract or the digestive system for pancreatic disorders, e.g. pancreatic enzymes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P29/00Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT

Definitions

  • the present invention relates to a method for obtaining a cell line comprising in particular the integration of a sequence encoding a protein of interest into a site of high transcriptional activity for the production of proteins, in particular therapeutic proteins, as well as the lines obtained by this method.
  • recombinant proteins bacteria (1, 2), fungi / yeasts (3-5), plants (6), insect cells (7, 8) or cells of mammal (9-12).
  • mammalian cells are the most frequently used for the production of complex recombinant proteins for therapeutic use (such as monoclonal antibodies) because of a better post-translational ability to assemble, glycosylate and modify synthesized recombinant proteins. (10, 11).
  • the natural level of productivity of mammalian cells is low when compared to levels of expression in bacteria or yeasts.
  • the step of integrating the expression vector into the genome of the host cell represents a rare event (1/10 000 according to Gorman and Bullock 2000, reference 13), during which the insertion site, the number of integrated copies and therefore the resulting level of expression can not be controlled. Many efforts are therefore made to optimize these production systems and different improvement routes are explored, which concern: expression vectors and their integration methods, cells and their culture conditions and gene amplification (14-26).
  • insertion of the expression vector into a transcriptionally inactive region of the genome will result in weak or no expression, while integration of the vector into a transcriptionally active region may result in high expression. Since most of the genome is in a transcriptionally inactive state, it is usually necessary to screen a large number of transfectants to isolate a high producer clone (22).
  • Targeted integration of the expression vector can be achieved by homologous recombination (Reff MR, US Patent 6,841,383, Hollis GF, US Patent 6,750,041; 46,47).
  • homologous recombination is naturally occurring with a high frequency in yeast or other fungal organisms, it is actually much rarer in higher eukaryotes, which is a major barrier to its use in this type of recombination. of organisms (47).
  • the ratio of the homologous recombination frequency to the frequency of the random integration is between 1/100 and 1/5000 (48).
  • a complementary approach to improve the efficiency of homologous recombination is, moreover, to cause cleavage in the DNA using meganucleases (eg I-Sce I) (49).
  • Another approach consists in the use of recombinases (47, 50), and in particular in the use of Cre recombinases
  • the bacteriophage P1 Crepox recombination system has been adapted and used to target certain genes present in eukaryotic cells.
  • Flp-In TM cell lines constituting stable expression hosts and possessing a FRT recombination site in a region of the transcriptionally active genome.
  • Flp-In TM cell lines Invitrogen.
  • the integration of an expression vector into the site located within the transcriptionally active region is obtained by Flp-FRT recombination, which ensures a strong transcription of the gene of interest.
  • the proposed Flp-in lines (293, CHO, BHK, 3T3) are not always optimal for the production of certain recombinant proteins, such as monoclonal antibodies for example, because of their intrinsic post-translational modification properties.
  • these cell lines also have in their genome additional sequences making it possible to select the cells having correctly integrated the recombination sites within a highly transcribed region.
  • a protein of interest which can be expressed in the cell, either for the purpose of verifying the integration of the FRT sites, or, in the view of the invention, for the production of such proteins on an industrial scale.
  • this expression means that the cell line produces proteins that may or may not be present natively in the cell, and overexpresses them beyond their native expression level. .
  • nucleic acid sequence is intended to mean a single or double-stranded oligomer or polymer of nucleotide bases read from the 5 'end to the 3' end.
  • nucleic acid sequence may refer to a DNA molecule, NEA or an RNA / DNA hybrid molecule of natural or synthetic origin.
  • the left end of a single-stranded nucleotide sequence is the 5 'end.
  • DNA molecule is intended to mean any single or double-stranded oligomer or polymer consisting of a sequence of nucleotide bases of natural or synthetic origin and including, without being limited thereto, a gene, a set of genes, a gene fragment, a mixture of coding and non-coding sequences, regulatory sequences, or the sequence complementary to that corresponding to an ARM.
  • promoter or “promoter sequence” is intended to mean a nucleic acid sequence, natural or synthetic, situated upstream of the start codon of the translation and involved in the recognition and binding of AKN polymerase. This promoter sequence thus makes it possible to initiate the transcription of a coding region located downstream.
  • promoters are known to those skilled in the art and may include bacterial, viral, eukaryotic, yeast or mammalian promoters, the selection of the promoter being dependent on the host cellular system used to perform the expression.
  • the term "vector” is intended to mean a nucleic acid transit vehicle, a nucleic acid molecule adapted to deliver nucleic acid or a DNA molecule capable of autonomous replication.
  • a host cell for example a plasmid, a cosmid, a phagemid, a viral genome (chromosome), a phage genome (chromosome), and which allows the cloning of DNA molecules.
  • the vector may be either stably replicated by the cells as an autonomous structure, integrated into the host genome, or maintained in the nucleus or the host. cytoplasm of the host.
  • plasmid is meant, in the sense of the present invention, an autonomous circular DNA molecule, possibly linearized, capable of replication in a cell.
  • the term plasmid includes both so-called “expression” plasmids and so-called “non-expressing” plasmids.
  • expression plasmids
  • non-expressing plasmids
  • peptide By “peptide”, “polypeptide” or “protein” is meant, in the sense of the present invention, a primary sequence of amino acids linked by covalent peptide bonds. In general, a peptide, shorter than a protein, consists of a small number of amino acids, typically from 2 to 50. The term polypeptide can cover both peptides and proteins. A peptide, a polypeptide or a protein may be of synthetic, recombinant or natural origin.
  • transcription termination signal is meant, in the sense of the present invention, a nucleic acid sequence placed at the end of a transcribed region and which causes the transcription of this region to be stopped by the AKN polymerase.
  • transcription termination signals useful in the context of the present invention include, but are not limited to, polyadenylation sequences, such as, for example, the "SV40 early polyadenylation signal” polyadenylation sequence, and the BGH polyadenylation sequence.
  • polyadenylation sequence or "polyA” is meant, in the sense of the present invention, a DNA sequence which causes both termination of transcription and polyadenylation of nascent transcribed RNA. Effective polyadenylation of transcripts is generally desirable in the sense that transcripts lacking a polyA tail are often unstable and are rapidly degraded.
  • Effective cleavage and polyadenylation of mammalian messenger RNAs requires at least two signal elements: an AAUAAA sequence 7 to 30 base pairs upstream from a processing site, and GU or U rich sequences located 3 ' of the cleavage site.
  • polyadenylation sequence with low efficiency is meant, in the sense of the present invention, a polyadenylation sequence does not allow an effective implementation of transcription termination and polyadenylation of transcripts. This results in a small amount of transcripts and / or significant instability of the transcripts, which are, for the most part, degraded too rapidly to allow their translation. More particularly, the term “low-efficiency polyadenylation sequence” is understood to mean any polyadenylation sequence that makes it possible to carry out transcription termination and polyadenylation of transcripts at a level less than or equal to that induced by the polyadenylation sequence. "SV40 early polyadenylation signal”. Any polyadenylation sequence making it possible to achieve this objective can be used in the context of the invention.
  • these sequences may be intact polyadenylation sequences having a weak polyadenylation signal of transcription termination and polyadenylation of transcripts, such as SV40 early polyA, or polyA adenovirus Ll (71), or polyadenylation sequences mutated or deleted so as to decrease the level of implementation of transcription termination and polyaenenylation of transcripts with respect to the unmutated or non-deleted sequence.
  • a weak polyadenylation signal of transcription termination and polyadenylation of transcripts such as SV40 early polyA, or polyA adenovirus Ll (71)
  • polyadenylation sequences mutated or deleted so as to decrease the level of implementation of transcription termination and polyaenenylation of transcripts with respect to the unmutated or non-deleted sequence.
  • mutation and / or deletion of a polyadenylation sequence which makes it possible to reduce the efficiency of the polyadenylation signal with respect to the non-mutated sequence
  • isolated or “purified” is meant, within the meaning of the present invention, any modification made by the hand of man from the natural state. Therefore, any pre-existing object in nature that has been modified or extracted from its natural environment is said to be “isolated” or “purified”.
  • An “isolated” object may be any polynucleotide or any peptide / polypeptide / protein separated from coexisting molecules in its natural environment, obtained by cloning, amplification and / or chemical synthesis. Moreover, a polynucleotide or a peptide / protein that is introduced into an organism by transformation, genetic manipulation or by any other method is said to be “isolated” even if it already existed in this organism.
  • expression is meant, in the sense of the present invention, the transcription and / or translation of a particular polynucleotide sequence placed under the control of a regulatory sequence such as a promoter, for example.
  • the term "overexpression” means a level of expression for a given coding sequence which is significantly higher (for example twice, and preferably 10 times or even a hundred times) per cell. that the level per cell observed with the corresponding native coding sequence in a non-transfected cell by the construction of the invention.
  • the term "antibody” is intended to mean an immunoglobulin molecule which is immunologically reactive to a particular antigen and which, depending on the case, includes the polyclonal and / or monoclonal antibodies. This term also includes genetically modified forms, such as chimeric antibodies (e.g., humanized mouse or rabbit antibodies), or heteroconjugate antibodies (e.g., bispecific antibodies).
  • chimeric antibodies e.g., humanized mouse or rabbit antibodies
  • heteroconjugate antibodies e.g., bispecific antibodies.
  • the term “antibodies” also includes forms of antigen-binding antibodies, including antibody fragments having the ability to bind to antigens.
  • transfection or “transfection” is meant, in the sense of the present invention, a process by which cells incorporate an exogenous DNA and integrate this DNA into their genome.
  • cell line is meant, in the sense of the present invention, a set of cells coming from the same mother cell and having the same genetic characteristics as this mother cell.
  • a cell line is further characterized by its ability to stably grow in vitro over a large number of generations.
  • the term "area of high transcriptional activity" is intended to mean a region of the genomic or chromosomal DNA of an organism which has a chromatin organization or which comprises regulatory sequences capable of significantly increasing the frequency of transcription of genes present in or around this region.
  • the level of transcription encountered in such an area of activity is generally greater than the average level of transcription conventionally observed in the genome of this organism, and preferably 2 times higher, or advantageously 10 times higher, or even 50 times higher, and sometimes even 100 times higher.
  • a zone of high transcriptional activity makes it possible to obtain a value pcd (picograms of protein / cell / 24 hours) greater than or equal to 5, and of preferably greater than or equal to 10.
  • the term "zone of low transcriptional activity" is intended to mean a region of the genomic or chromosomal DNA of an organism which has a chromatin organization or which comprises regulatory sequences capable of completely blocking or diminishing significantly the frequency of transcription of genes present in or around this region.
  • the level of transcription encountered in such an activity zone is generally lower than the average transcription rate conventionally observed in the genome of this organism, and preferably 2 times lower, or advantageously 10 times lower, even 50 times lower, or even 100 times lower.
  • the rate of transcription encountered in such an area of activity may also be so low that it becomes impossible to evaluate, and may also be zero.
  • recombinase or "site-specific recombinase” is intended to mean an enzyme whose action on two nucleic acid molecules consists in causing recombination between said two molecules.
  • Recombination is a well-known natural method that leads to the cleavage of two nucleic acid molecules having identical or substantially similar sequences (homologues), and which leads to the reformation of the two molecules so that one region of each molecule initially present becomes bound to a region of the other molecule initially present. Two types of recombination reactions have been identified.
  • the first type which corresponds to the so-called “classical” or “homologous” recombination, will concern any pair of molecules having homologous nuleotide sequences capable of serving as a substrate for a "general” recombinase.
  • the homologous molecules in the second type of recombination, called “site-specific recombination", must, to serve as a substrate for the recombinase, comprise a particular nucleotide sequence called "specific recombination site".
  • site-specific recombination systems are described in the state of the art, such as, for example, the E. coli bacteriophage system Pl.
  • the specific sequences and the recombinases used can belong to different structural classes, and in particular to the family of Tn3 transposon resolvase or to the integrase family of the bacteriophage lambda.
  • Tn3 transposon resolvase or transposons Tn21 and Tn522 (Stark et al., 1992); The bacteriophage Gin invertase or the plasmid resolvases, such as that of the fragment by RP4 (Abert et al., Mol Microbiol 12 (1994) 131).
  • recombinases belonging to the bacteriophage ⁇ integrase family mention may in particular be made of lambda phage integrase (Landy et al., Science 197 (1977) 1147), P22 (Leong et al., J. Biol. Chem 260 (1985) 4468), Haemophilus influenzae HP1 (Hauser et al., J. Biol Chem 267 (1992) 6859), Cre integrase of phage P1, plasmid pSAM2 integrase (350341EPA EP 350 341). or the FLP recombinase of the 2 ⁇ plasmid and the XerC and XerD E coli recombinases.
  • recombinase recognition site is intended to mean a nucleic acid sequence capable of serving as a substrate for a recombinase.
  • reporter gene is intended to mean a polynucleotide having a sequence encoding a gene product, generally an enzyme, the presence of which can be easily detected and / or quantified when the construct comprising the sequence
  • the reporter gene is introduced into cells containing all the factors necessary for the expression of this gene.
  • reporter genes useful in the context of the present invention include, but are not limited to, fluorescent proteins such as the maxFP-green protein and its derivatives, luciferase, GFP (Green fluorescent protein) and its derivatives, or the RCFP (Reef Coral Fluorescent Proteins) as well as the beta-galactosidase encoded by the lacZ gene.
  • protein of interest means any peptide / polypeptide or any protein likely to be of industrial, prophylactic or therapeutic interest.
  • the proteins of interest that can be expressed in the cell lines according to the present invention can be chosen from:
  • proteins having a therapeutic activity that is to say, proteins having a physiological beneficial effect recognized on the human or animal subject in a form of recognized disease or a pathological dysfunction of said animal or human subject, including in prophylactic treatments; such proteins also include peptides, polypeptides, hormones, enzymes and the like, and preferably polypeptides having an activity selected from the group consisting of an activity in the digestive, pancreatic, biliary, antiviral, anti-inflammatory, pulmonary, antimicrobial functions hematological, neurological, cardiovascular, ophthalmic, antigenic, cerebral, anti-tumor, immunostimulatory, and immunomodulatory; in particularly preferred embodiments, the therapeutically active protein or polypeptide is selected from the group consisting of insulins; a growth hormone, including a human growth hormone and a bovine growth hormone; a growth hormone release factor; a parathyroid hormone; a thyroid stimulating hormone; a follicle stimulating hormone; a luteinizing hormone; interferons, such as interferon-alpha,
  • NT-5 or NT-6 a nerve growth factor such as NGF-beta
  • PDGF vascular endothelial growth factor
  • a fibroblast growth factor such as a
  • FGF or a bFGF
  • an epidermal growth factor or a bFGF
  • EGF transformation growth factor
  • TGF transformation growth factor
  • TGF-alpha and TGF-beta comprising a TGF-beta.1, a TGF-beta.2, a TGF-beta.3, a TGF-beta.4 , or a TGF-beta.5
  • a growth factor resembling insulin type I and type II IGF-I and IGF-II
  • IGF-I and IGF-II growth factor resembling insulin type I and type II
  • 1-3 - IGF-I
  • keratinocyte growth factor insulin-like growth factor binding proteins
  • CD proteins such as CD-3, CD-4, CD-8, and CD-19
  • erythropoietin osteoinduction factors
  • immunotoxins bone morphogenetic protein (BMP); colony stimulating factors (CSFs), for example M-CSF, GM-CSF, and G-CSF; factors of acceleration of aging; gastric lipases, pancreatic or bili
  • polypeptide or protein when the polypeptide or protein is selected from antibodies or antibody fragments, these may include immunoglobulin molecules, the immunoglobulin heavy chain, essentially complete immunoglobulin molecules, and all parts of an immunoglobulin. comprising a paratope, including Fab fragments, Fab 'fragments, F (ab') 2 fragments and Fv fragments, the immunoglobulin light chain, and Fv fragments;
  • cosmetically active proteins or polypeptides which, according to the legislation of many countries, are those which exert an activity only at the level of the epidermis, that is to say that the molecules in question do not cross until the lower layers, or otherwise have no action or effect on the dermis or basal cells.
  • proteins or polypeptides are known to those skilled in the art as such, some examples of which are ceramides, keratides, moisturizers, antibacterial agents and the like;
  • proteins or polypeptides with nutraceutical activity that is, molecules that are identical or similar to those commonly found in human or animal diets, and that may be found in whole or in part in the diet or a portion of it and that have a beneficial effect on health; as examples of the types of molecules that may be concerned by this part of the invention, mention may be made of modified or derived PAL (phenylalanine ammonia lyase), allergens, for example birch, poplar, and graminae, superoxide dismutase (SOD), and the like.
  • modified or derived PAL phenylalanine ammonia lyase
  • allergens for example birch, poplar, and graminae, superoxide dismutase (SOD), and the like.
  • the term "high antibiotic dose” is intended to mean a dose of antibiotic greater than or equal to 1 g / l, or advantageously greater than or equal to 2 g / l, or even greater than or equal to 4 g / l. l and preferably at 8g / l.
  • a method for obtaining a cell line comprising at least one cell comprising the following steps:
  • nucleic acid sequence encoding a transcription termination signal is a sequence encoding a polyadenylation signal.
  • nucleic acid sequence encoding a signal transcription termination is a sequence encoding all or part of a low efficiency polyadenylation signal, such as the early SV40 polyadenylation signal, or the polyadenylation signal of the L1 adenovirus, or any other polyadenylation signal exhibiting low efficiency as defined above.
  • the cell or cells of the cell line used in the methods of the present invention is a mammalian cell or an avian cell.
  • the starting cell i.e., before modification, is thus selected from the group consisting of: rat myeloma lines, including YB2 / 0 (ATCC CRL-1662) and IR983F, human myeloma such as Namalwa or any other cell of human origin such as PERC6, the CHO lines, in particular CHO-K, CHO-LeclO, CHO-Lecl, CHO Pro-5, CHO dhfr-, CHO Lecl3, or other lines selected from Wil-2, Jurkat, Vero, Molt-4, COS-7, 293-HEK, BHK, K6H6, NSO, SP2 / O-Ag14, P3X63Ag8.653, and Ebx.
  • rat myeloma lines including YB2 / 0 (ATCC CRL-1662) and
  • the integration of the unique recognition site of a recombinase is carried out by a series of steps comprising at least:
  • nucleic acid sequence encoding a protein of interest between the two sequences each encoding a recognition site of a recombinase; and integrating a nucleic acid sequence, encoding a selection marker, preferably an antibiotic resistance gene, between the two sequences each encoding a recombinase recognition site.
  • the recognition sequence of the recombinase may be the loxP and / or FRT sequence.
  • the protein of interest may be for example an antibody or an antibody fragment.
  • the action of a recombinase can be obtained by coexpression in the cell of said recombinase by means of a vector comprising a nucleic acid sequence encoding said recombinase.
  • the series of steps mentioned above also comprises the selection of the cells having excised all of the nucleic acid sequences mentioned above, and having a unique and integrated recognition site. recombinase.
  • the series of steps may even more preferably include the integration of a nucleic acid sequence encoding the thymidine kinase of Herpes simplex virus type I (HSV1-TK).
  • HSV1-TK Herpes simplex virus type I
  • cell selection can be performed by adding ganciclovir in the culture medium. Indeed, this selection makes it possible to ensure that only the cells having integrated the nucleic acid sequence encoding said HSV1-TK will resist the culture with the ganciclovir present in the medium.
  • the series of steps mentioned above furthermore includes, in a particularly preferred manner, a transfection of the selected cell line with an expression vector comprising a nucleic acid sequence encoding a protein or polypeptide of interest and a sequence nucleic acid encoding a recombinase recognition site directly downstream of a nucleic acid sequence encoding a selection marker, preferably an antibiotic resistance, lacking a polyadenylation sequence.
  • said expression vector is inserted at the unique recombinase recognition site, by virtue of the combined action of said recombinase, which is expressed or provided at the same time as the transfection.
  • the selection of the cells containing the integrated expression vector at the target site can be advantageously performed by testing the expression of the protein or polypeptide of interest.
  • the cells may also be selected for their resistance in the presence of a high concentration of antibiotic, in particular their resistance to an antibiotic dose greater than or equal to 1 g / l, or 2 g / l, or preferably 4 g / l, or 8g / l.
  • said protein or said polypeptide of interest is a therapeutic protein or polypeptide, in particular chosen from the group having an activity in the digestive, pancreatic, biliary, antiviral, anti-inflammatory, pulmonary, antimicrobial, hematological, and neurological functions. , cardiovascular, ophthalmological, antigenic, cerebral, anti-tumor, immunostimulant, and immunomodulatory.
  • another object of the present invention is a cell line comprising, stably integrated in its genome, a unique site for recognition of a recombinase in a zone of high transcriptional activity of the genome of said cell and directly downstream. of said unique recombinase recognition site, a nucleic acid sequence encoding a transcription termination signal.
  • the nucleic acid sequence encoding a transcription termination signal and stably integrated into the line is a sequence encoding a polyadenylation signal.
  • This nucleic acid sequence encoding a transcription termination or polyadenylation signal is a sequence encoding all or part of a low efficiency poyadenylation signal such as the early SV40 polyadenylation signal or any other modified polyadenylation signal. to impair its effectiveness, as defined above. .
  • the cell line be mammalian cells.
  • nucleic acid sequence encoding a protein of interest between the 2 sequences each encoding a recognition site of a recombinase
  • At least one nucleic acid sequence encoding a selection marker preferably an antibiotic resistance gene, lacking a polyadenylation sequence, located between the two sequences each encoding a recognition site of a recombinase, this sequence encoding a selection marker being located directly upstream of the recognition site of a recombinase, itself located directly upstream of the weak polyadenylation sequence described above.
  • each cell of the cell line has a pcd value equal to or greater than 5, or more preferably greater than or equal to 10.
  • the cell line may also, and very preferably, overexpress a protein or polypeptide of interest selected from the group of proteins or polypeptides of interest having an activity in the digestive, pancreatic, biliary, antiviral, anti-inflammatory, pulmonary, antimicrobial, haematological, neurological, cardiovascular, ophthalmological, antigenic, cerebral, anti-tumor, immunostimulatory, and immunomodulatory.
  • a protein or polypeptide of interest selected from the group of proteins or polypeptides of interest having an activity in the digestive, pancreatic, biliary, antiviral, anti-inflammatory, pulmonary, antimicrobial, haematological, neurological, cardiovascular, ophthalmological, antigenic, cerebral, anti-tumor, immunostimulatory, and immunomodulatory.
  • the cell line is that identified by the reference YGM-1 / 10G10, and deposited under the deposit number CNCM 1-3704 (line deposited at the CNCM, National Collection of Cultures of Microorganisms, Institute Pasteur, 25 rue du Dondel Roux, 75724 Paris Cedex 15, 18 December 2006).
  • the cell line is the line identified by the reference YGM-2 / 3G5, and filed under the deposit number CNCM 1-3885 ((line deposited at the CNCM, National Collection of Cultures of Microorganisms, Pasteur Institute, 25 rue du Dondel Roux, 75724 Paris Cedex 15, December 19, 2007 ).
  • an isolated nucleic acid molecule comprising a nucleic acid fragment identified by the number SEQ ID NO: 1.
  • This molecule represents or indicates a site of high transcriptional activity, and can therefore be used for the integration of the other sequences mentioned above.
  • sequence SEQ ID NO: 1 could also be used, directly or in a complementary manner, or by hybridization, to create a site of high transcriptional activity in the genome of an appropriate cell.
  • This could be done via a vector comprising a nucleic acid sequence as identified in the sequence listing by the number SEQ ID NO: 1.
  • a method for producing at least one protein or polypeptide of interest characterized in that a cell line as described above is cultured. , so as to express said protein or polypeptide of interest, followed by at least one step of recovering said protein of interest.
  • Cell lines such as those described and identified by their deposition number given above are ideal for this type of process.
  • the protein or polypeptide of interest is preferably chosen from the group of proteins or polypeptides of interest having an activity in the digestive, pancreatic, biliary, antiviral, anti-inflammatory, pulmonary, antimicrobial, haematological, neurological, cardiovascular, ophthalmological, antigenic, cerebral, anti-tumor, immunostimulatory, and immunomodulatory. Even more preferably, the protein or polypeptide of interest is an antibody or an antibody fragment.
  • FIG. 2 expression vector of the pFlpe recombinase
  • Figure 5 deletion pattern of the targeting vector by Flp recombinase
  • FIG. 6 Reintegration scheme of the expression vector by Flp recombinase
  • a first object of the invention relates to a method for inserting a DNA molecule of interest into a target site in the genome of a mammalian cell.
  • This method comprises a first step consisting in obtaining a cell line in the genome from which a unique recombinase recognition site is integrated within a zone of high transcriptional activity.
  • This first step includes the following steps: 1) Integration in a mammalian cell of a first nucleic acid, called a "targeting vector", containing (i) two tandem sequences corresponding to recognition sites of a recombinase, between which there is a reporter gene a gene encoding a protein similar to the proteins of interest, a selection gene for gene amplification and an antibiotic resistance gene but lacking a polyadenylation sequence; and (ii) a polyadenylation site located downstream of the second recombinase recognition site, ie located 5 'of the antibiotic resistance gene;
  • the cells forming cell lines selected in step 4) all have a unique recognition site of a recombinase integrated in a zone of high transcriptional activity of their genome.
  • One of the characteristics of the mammalian cell used in step 1) of the process is that it does not involve, before being modified by the process of the invention, sequence identical or similar to that of the recognition site of an integrated recombinase by the implementation of the method of the invention. Therefore, the recognition site of a recombinase integrated into the genome of the cells of the cell line of the invention is unique, since no other identical sequence is encountered in the genome of the cells of this line.
  • a first nucleic acid into a mammalian cell as implemented in step 1) of the method, can be carried out by any means known to those skilled in the art.
  • a technique of precipitation with calcium phosphate (CaPO 4) wherein I 1 precipitated DNA will be "integrated" by the cells via a process of phagocytosis
  • the lipofection technique which involves embedding the DNA to be inserted into lipid vesicles to allow fusion with the cell membrane of the host cell.
  • Another technique that can be implemented is the electroporation technique, which allows the cell, via an electric shock, to integrate the DNA of interest.
  • Another technique may be that of pronuclear microinjection.
  • the targeting vector used in the first step of the method of the invention consists of a nucleic acid molecule containing two recombinase recognition sites. These sites are identical to each other, and are identical to the unique site present in the cell line obtained by the implementation of the method of the invention. These two sites delimit a DNA fragment that contains a reporter gene, a gene encoding a protein similar to the proteins of interest, an antibiotic resistance gene. and a selection gene for gene amplification.
  • the targeting vector further comprises all the sequences that prove to be necessary to allow the expression of the genes placed between the two recognition sites of a recombinase. Among these necessary sequences, mention may be made, in a non-limiting manner, of the promoter, enhancer and polyadenylation sequences, for example.
  • the targeting vector occurs randomly in the genome of the transfected cell.
  • the targeting vector may therefore be integrated in areas devoid of transcriptional activity, or in areas with low, moderate or high transcriptional activity.
  • Cell lines having integrated the targeting vector into a region of high transcriptional activity are selected based on the expression or overexpression of a reporter gene.
  • this reporter gene easily visualizable and analysable, constitutes a control capable of reflecting the importance of the transcriptional activity of the environment in which this reporter gene is placed: if the transcriptional activity in the insertion zone is low, the reporter gene activity will be low. On the other hand, if the transcriptional activity in the insertion zone is strong, the activity of the reporter gene will be high.
  • the gene coding for a protein similar to the proteins of interest, situated downstream of the reporter gene, makes it possible to determine the capacity of the cell containing the transgenes to secrete proteins, which can not be determined with a fluorescent protein, whose expression is intracellular. Any protein that may be easily detectable may be suitable for this application.
  • the proteins that may be used in the context of the present invention the products of immunoglobulin genes, growth factors, interleukins, stimulating factors, kinases, growth factors, etc., may be mentioned in a nonlimiting manner. coagulation, alpha-antitrypsin, and albumin.
  • the antibiotic resistance gene allows the selection of transformed cells comprising the targeting vector. The selection is carried out by placing the transformed cells in contact with the corresponding antibiotic since only the cells having integrated the targeting vector have the possibility of surviving.
  • the antibiotic resistance gene is followed by a polyadenylation (or "polyA") sequence, which plays an important role in stabilizing the corresponding mRNAs (56-63). Any polyadenylation sequence known to those skilled in the art and allowing the expression of the antibiotic resistance gene can be used, but a low efficiency polyA sequence is preferably used.
  • this polyadenylation sequence is a weak polyadenylation sequence, that is to say a polyadenylation sequence having a low efficiency. Therefore, if integration of the targeting vector occurs in a region of low transcriptional activity, the antibiotic resistance gene will not be sufficiently expressed to allow survival of the exposed cell to the antibiotic. On the contrary, if the integration zone possesses With strong transcriptional activity, the "weak" character of the polyadenylation sequence will not prevent the resistance gene from expressing itself, and will render the corresponding cells resistant to the antibiotic.
  • SV40 early polyadenylation signal used in some commercial expression vectors (64-65).
  • the cells may also be selected for their resistance in the presence of a high concentration of antibiotic.
  • the combination of these two selection tools namely the use of a low efficiency polyadenylation sequence, and that of a high concentration of antibiotic in the medium, makes this selection method a particularly advantageous way to select cells in which the transgene is integrated at the desired place, that is to say at the level of the recognition site of the recombinase, without selecting the cells in which the recognition site of the recombinase has integrated in an area inducing lower transcriptional activity.
  • the fact that the polyadenylation sequence has only a low efficiency has the effect that the antibiotic resistance gene located directly upstream of this site is only weakly expressed.
  • the antibiotic concentration added in the medium is high (for example greater than or equal to 1g / 1, or greater than or equal to 2g / l, or to 4g / l, or greater than or equal to 8g / 1), only the cells having integrated the transgene in an area allowing sufficiently strong expression of the antibiotic resistance gene, and despite the low efficiency of the polyadenylation sequence, survive.
  • This selection method implementing both the low efficiency of the polyadenylation sequence and the addition of a high antibiotic concentration in the cell culture medium, has several advantages: it makes it possible to screen fewer clones, since clones that have integrated the transgene elsewhere in the genome at the level of the recombinase recognition site die under the effect of the high concentration of antibiotic present in the medium.
  • the selected clones have greater production capacities compared to a selection method carried out with the methods of the prior art.
  • the targeting vector is linearized with a restriction enzyme prior to transfection into the retained cells.
  • the restriction enzyme used is chosen for its ability to produce blunt ends.
  • only small amounts of targeting vector are used to perform the transfection.
  • the targeting vector furthermore comprises a polyadenylation sequence located downstream of the second recognition site of a recombinase.
  • This polyadenylation sequence is intended to be used during the subsequent integration of a novel vector comprising the gene of a protein of interest.
  • this polyadenylation sequence will select the cells having integrated the second vector at the recognition site of a recombinase.
  • this polyadenylation sequence has a low efficiency and can be considered as a "weak polyadenylation sequence". This is for example the SV40 early polyadenylation sequence, "SV40 early polyadenylation signal".
  • the targeting vector comprises a gene for carrying out a gene amplification mechanism.
  • This gene may, for example, be the gene for dihydrofolate reductase (or DHFR) or glutamine synthetase (GS), metabolic enzymes essential for cell survival.
  • DHFR dihydrofolate reductase
  • GS glutamine synthetase
  • metabolic enzymes essential for cell survival When the transfected cells having integrated the targeting vector are cultured in the presence of increasing doses of an inhibitor specific for one of the abovementioned enzymes (for example methotrexate for DHFR and methionine sulfoximine for GS), only the clones having multiplied their number of copies of the vector and thus increased the expression of the enzyme DHFR or GS will survive.
  • an inhibitor specific for one of the abovementioned enzymes for example methotrexate for DHFR and methionine sulfoximine for GS
  • the levels of gene amplification obtained are variable and depend essentially on the region of the genome in which the vector is integrated.
  • the target vector integration area is therefore selected according to its
  • the targeting vector comprises, between the two recognition sites of a recombinase, the herpes simplex virus type I thymidine kinase gene (HSV1-TK). .
  • the selection of the cells carried out in step 4) then comprises the addition of ganciclovir in the culture medium: the cells which have not excised the targeting vector will be killed in the presence of ganciclovir, whereas those whose targeting vector will have been excised will survive.
  • any suicide gene using a "prodrug" to become toxic, other than HSV1-TK may be used at this stage.
  • the CodA or Fcy genes may be mentioned with the 5-Fluorocytosine (5-FC) prodrug, this list not being limiting.
  • the recognition site of a recombinase used in the context of the present invention may correspond to any site known to those skilled in the art.
  • the loxP and FRT sites are used simultaneously.
  • this embodiment can be used to insert an expression vector, thanks to FRT, then to remove the gene for selection of this vector after its integration into the genome, using loxP.
  • the reporter gene encoding a protein similar to a protein of interest may correspond to any gene encoding a secreted protein similar or identical to a protein of therapeutic or industrial interest.
  • the genes encoding antibodies, growth factors, interleukins, stimulating factors, kinases, coagulation factors, alpha-lantitrypsin or albumin this list does not include being not limiting.
  • step 2) The additional expression of a protein similar to a protein of interest in addition to the protein encoded by the reporter gene makes it possible, from step 2), to select the cells not only according to the level of expression of the reporter gene , but also according to the secretory capacities of these cells.
  • the protein of interest is an antibody.
  • the protein of interest is an antibody, it is advisable in step 2) to select the cells capable of producing antibodies according to the desired level or form of glycosylation.
  • human myeloma lines such as Namalwa or any other cell of human origin such as PERC6, expression lines such as NSO, SP2 / 0, BHK
  • the line YB2 / 0 is chosen.
  • step 2) of selection of the high producing cells the cells whose production rate of the protein of interest is greater than 5 pcd (pg of protein / cell / 24 hours) are selected.
  • the production rate of the cells of interest is greater than 10 pcd.
  • the production rate of the cells of interest is greater than 15 pcd, and more particularly 20 pcd.
  • this production rate is between 5 and 50 pcd, or more particularly between 10 and 30 pcd.
  • the estimation of the number of copies integrated into the mammalian cell of departure can be carried out by any technique known to those skilled in the art.
  • any technique known to those skilled in the art By way of example, mention may be made of the quantitative PCR (Polymerization Chain Reaction) technique.
  • the recombinase During the step of excising the targeting vector (step 3), the recombinase generates a recombination event at the level of the pair of recognition sites of a recombinase, and causes excision of the targeting vector out of the cell genome, while a recognition site of a recombinase remains in the genome.
  • the excision mechanism implemented in the method of the invention leads to the elimination of the nucleotide sequences between the two recognition sites of a recombinase of the integrated targeting vector.
  • the recognition site remaining in the zone of high transcriptional activity of the genome retains, for its part, the same orientation as the recognition sites initially present in the integrated targeting vector.
  • a polyadenylation sequence also remains in the mammalian cell after the excision of the targeting vector, and is located downstream of the remaining recognition site of a recombinase.
  • the integrity of the recognition site of the recombinase remaining in the cells can be controlled by any technique known to those skilled in the art. As an example, PCR (Chain Reaction Polymerization) techniques followed by sequencing of the amplified DNA may be mentioned.
  • the recombinase can be expressed in the cell by transient transfection of a vector encoding this recombinase, with which the cell would have been transfected at the end of step 2).
  • the recognition site of a recombinase is the loxP site, the recombinase to be used is Cre.
  • the recognition site is FRT, the recombinase to be used is flp.
  • the recombinase used is Flpe, a recombinase derived from Flp, which has an activity greater than Flp under the culture conditions applied for mammalian cells (55).
  • the excision step therefore makes it possible to eliminate all the active sequences likely to influence the subsequent expression of future proteins of interest that could be inserted in the zone of strong transcriptional activity, by
  • the cell lines produced in the context of the first step of the method of the invention which comprise a single site for recognition of a recombinase integrated into a zone of high transcriptional activity of their genome
  • Highly Producing Cell Lines can be used for the production of any protein of interest.
  • the production of such a protein can be achieved by subsequently targeting the single recombination site with a vector comprising the sequences necessary for the transcription of a protein of interest carried by this vector.
  • a vector comprising the sequences necessary for the transcription of a protein of interest carried by this vector.
  • Another subject of the invention relates to a method as defined above and comprising another step ("reintegration step") aimed at inserting a DNA molecule of interest into a cell line obtained by the implementation of the first step of the process of the invention.
  • This second step includes the following steps:
  • step 4) transfection of a cell line obtained at the end of step 4) with an expression vector comprising a gene coding for a protein of interest, a gene allowing gene amplification and a gene for resistance to antibiotic, lacking a polyadenylation sequence, which is located directly upstream of a recombinase recognition site;
  • the selection will be performed in the presence of a high dose of antibiotic to disadvantage random integrations.
  • the expression vector used during the reintegration step of the method comprises a gene coding for a protein of interest, a gene allowing gene amplification and all the sequences necessary to allow the expression of the coding sequences present in this gene.
  • vector i.e., promoters, activators (or enhancers) and polyadenylation sequences.
  • This expression vector also comprises an antibiotic resistance gene with its promoter, lacking a polyadenylation sequence, located directly upstream of a recombinase recognition site.
  • the gene for resistance to an antibiotic carried by said expression vector is, for its part, devoid of polyadenylation sequence.
  • the antibiotic resistance gene must therefore be located at the end of the vector in order to be placed directly upstream of the polyadenylation sequence which has remained in the genome of the cell after the excision of the targeting vector.
  • the gene for resistance to an antibiotic is the same as that carried by the targeting vector.
  • the cell selection step can then be carried out using the same antibiotic dose as that used to select the high producing cells in step 2).
  • the selection step is therefore carried out by placing the cells in contact with the antibiotic corresponding to the resistance gene.
  • the expression vector is integrated into the genome of the cells at the single recombination site that persists at the end of step 4.
  • the recognition site of a The recombinase present on the expression vector is identical to that which has been integrated into the genome of the cell during the first part of the process.
  • the recombinase used will be Cre. If the recognition site of a recombinase is FRT, the recombinase used will be FIp.
  • any means allowing the action of the recombinase in the cell can be implemented in step 6) of the process of the invention.
  • the recombinase can be produced in the cell previously transfected via a vector comprising a gene encoding said recombinase.
  • the protein of interest derived from the expression of the DNA of interest present in the expression vector can be any protein of industrial or therapeutic interest. It may be chosen for example from antibodies, coagulation factors, cytokines, growth factors, enzymes, hormones, this list not being limiting.
  • the gene encoding the protein of interest may be the same as that carried by the targeting vector or be a gene coding for a different protein.
  • Another subject of the invention relates to a cell line comprising in its genome a single recognition site of a recombinase integrated in a zone of high transcriptional activity, said cell line having integrated a single copy of a transgene at said site of recognition of a recombinase, said cell line being stable over time, and obtainable at the outcome of step 4) of the process of the invention.
  • this line is the YGM-1 / 10G10 cell line, deposited on December 18, 2006, under the deposit number CNCM 1-3704, with the National Collection of Culture of Microorganisms (CNCM).
  • the YGM-I / 1OG10 line is obtained by carrying out the method of the invention, using the YB2 / 0 cell (ATCC CRL-1662) during step 1) of the process.
  • This YGM-I / 10G10 cell line has the following characteristics: absence of active sequences (promoters, selection gene, antibiotic resistance gene), presence of a recombinase recognition site, stability of the culture parameters and the integration site.
  • this cell line advantageously has a production rate of the protein of interest greater than 5 pcd ( ⁇ g of protein / cell / 24 hours).
  • the production rate of the cells of interest is greater than 10 pc ⁇ .
  • the production rate of the cells of interest is greater than 15 pcd, and more particularly 20 pcd.
  • this production rate is between 5 and 50 pcd, or more particularly between 10 and 30 pcd.
  • an object of the invention is a new YGM-1 / 10G10 expression line, free of any active transgenic sequence, derived from the YB2 / 0 line, in which the integration of the expression vector is controlled and directed. in an area favorable to transcription through the use of a recombinase.
  • this line is the line Cell YGM-2 / 3G5, filed on December 19, 2007, under deposit number CNCM 1-3885, with the National Collection of Culture of Microorganisms (CNCM).
  • the YGM-2 / 3G5 line is obtained by carrying out the method of the invention, using the YB2 / 0 cell (ATCC CRL-1662) during step 1) of the process.
  • This YGM-2 / 3G5 cell line has the following characteristics: absence of active sequences
  • this cell line advantageously has a production rate of the protein of interest greater than 5 pcd ( ⁇ g of protein / cell / 24 hours).
  • the production rate of the cells of interest is greater than 10 pcd.
  • the production rate of the cells of interest is greater than 15 pcd, and more particularly 20 pcd.
  • this production rate is between 5 and 50 pcd, or more particularly between 10 and 30 pcd.
  • another subject of the invention is a new YGM-2 / 3G5 expression line, free of any active transgenic sequence, derived from the YB2 / 0 line, in which the integration of the expression vector is controlled and directed into an area favorable to transcription through the use of a recombinase.
  • the YGM-I / 1OG10 and YGM-2 / 3G5 lines have the following characteristics and advantages:
  • the cell line obtained by the method of the invention is stable over time over a period of at least 3 months, or about 80 doubling times.
  • Another subject of the invention relates to an isolated nucleic acid molecule of sequence SEQ ID NO: 1 comprising a nucleic acid fragment of sequence SEQ ID NO: 4, said fragment being capable of increasing the expression of a protein of recombinant interest when said nucleic acid fragment is incorporated into an expression vector, or the zone of strong transcriptional activity comprising the sequence SEQ ID NO: 1 or a nucleic acid fragment comprising at least 80% of homology with SEQ ID sequence
  • said fragment being capable of increasing the expression of a recombinant protein of interest when said nucleic acid fragment is incorporated into a expression vector.
  • nucleic acid sequence corresponding to the isolated nucleic acid molecule of sequence SEQ ID NO: 1 comprising a nucleic acid fragment capable of increasing the expression of a protein of recombinant interest when said acid fragment nucleic acid is incorporated into an expression vector is as follows:
  • AAAAAAAAAA AAAGCCCAGG ATTGGATGGG TTTAGTGGAG AATTCTATCA
  • the isolated nucleic acid molecule of sequence SEQ ID NO: 1 comprising a nucleic acid fragment capable of increasing the expression of a protein of recombinant interest when said nucleic acid fragment is incorporated into a DNA vector.
  • expression whose sequence is presented above has the following characteristics (the positions are given according to the numbering of the nucleotides composing the sequence, which numbering is detailed above):
  • nucleic acid sequence corresponding to the nucleic acid fragment capable of increasing the expression of a protein of recombinant interest when said nucleic acid fragment is incorporated into an expression vector is as follows (SEQ ID NO : 4):
  • AAAAAAAAAA AAAGCCCAGG ATTGGATGGG TTTAGTGGAG AATTCTATCA
  • Another subject of the invention relates to a vector comprising the nucleic acid sequence SEQ ID NO: 1.
  • Another subject of the invention is a cell line comprising in its genome a unique recombinase recognition site integrated in a zone of high transcriptional activity, said cell line having integrated a single copy of a transgene at said recognition site of recombinase, said cell line being stable over time, and obtainable by the method of the invention.
  • Such a line comprises two tandem sequences corresponding to recognition sites of a recombinase on either side of a gene coding for a protein of interest and an antibiotic resistance gene, which is immediately in situ. upstream of the recognition site of a recombinase furthest downstream, the polyadenylation sequence of the antibiotic resistance gene being located immediately downstream of this recognition site with the antibiotic.
  • this cell line has, before gene amplification, a productivity of said transgene of between 5 and 50 pcd ( ⁇ g of protein / cell / 24h).
  • this cell line expresses said transgene stably over a period of at least 3 months.
  • Another subject of the invention relates to a process for the production of proteins of interest, in which the cell line of the invention expressing a protein of interest is cultured so as to express the said protein of interest, and to recovering said protein of interest.
  • Another subject of the invention is a vector for the insertion of a DNA of interest into the genome of a mammalian cell ("targeting vector"), comprising two recombinase recognition sites situated on the one hand. and a reporter gene, a gene coding for a protein of interest, a selection gene for gene amplification and an antibiotic resistance gene, and a polyadenylation sequence located downstream of the second recognition site of a recombinase.
  • the polyadenylation sequence of the antibiotic resistance gene is a weak polyA. This makes it possible to obtain better production rates at the screening output.
  • this vector comprises, between the two recombinase recognition sites, a gene coding for the thymidine kinase of Herpes simplex virus type I (HSV1-TK).
  • Another object of the invention relates to a vector system for inserting a DNA of interest at a target site into the genome of a mammalian cell, which comprises at least the following constituents:
  • an expression vector comprising a recombinase recognition site, a gene coding for a protein of interest and an antibiotic resistance gene, the recombinase recognition site being located directly downstream of the resistance gene; the antibiotic.
  • Another object of the invention is the use of the aforementioned vector system in a method for inserting a DNA molecule of interest into a target site into the genome of a mammalian cell, comprising the following steps :
  • Targeting vector pTVl (see Figure 1):
  • the targeting vector pTV1 was constructed (SEQ ID NO: 2) (FIG. 1) which contains the following transcription units:
  • maxFP-Green transcription unit fluorescent reporter gene
  • CMV promoter of the early gene of the human cytomegalovirus without its activator or enhancer part
  • polyA polyadenylation sequence
  • 2- the transcription unit of an anti-D antibody heavy chain containing in order a RSV promoter (Long Terminal Repeat of Rous Sarcoma Virus), an artificial intron derived from the vector pCi-neo, the sequence of the anti-D immunoglobulin heavy chain and the polyA BGH (Bovine Growth Hormone),
  • the neo transcription unit containing the SV40 promoter, the neomycin resistance gene and the early polyA SV40 sequence having a "weak" polyA activity containing the SV40 promoter, the neomycin resistance gene and the early polyA SV40 sequence having a "weak" polyA activity
  • DHFR dihydrofolate reductase transcription unit containing the SV40 promoter, the site-directed mutagenesis-modified dhfr selection gene in order to eliminate the Seal restriction site (silent mutation at the protein level) and its polyA site,
  • HSV1-tk transcription unit containing the SV40 promoter, the suicide gene coding for the thymidine kinase virus Herpes simplex virus type 1 (HSV1-tk) and the early polyA SV40 sequence.
  • Frt recombination sites are synthesized by PCR using the following primers:
  • Antisense primers (SEQ ID NO: 6): 5 '-CGTCCGGATATCTAAGATCTGAAGTTCCTATACTTTCTAGAGAATAGGAA-B'
  • the resulting PCR product contains the Frt site (bold and italic) as well as restriction sites (underlined) allowing cloning thereafter in the targeting vector pTV1 (SEQ ID No: 7):
  • Frt1 site was cloned upstream of the maxFP-Green transcription unit of the pTV1 vector.
  • a second Frt Site (Frt2) was cloned in the same sense as Frt1 between the HSV1-tk gene and its early polyA SV40 polyadenylation site.
  • the nucleic acid sequence corresponding to the targeting vector pTV1 is as follows (SEQ ID NO: 2):
  • AAAAGCTCCC GGGAGCTTGG ATATCCATTT TCGGATCTGA TCAAGAGACA 7001 GGATGAGGAT CGTTTCGCAT GATTGAACAA GATGGATTGC ACGCAGGTTC
  • AAACCTCCCA CACCTCCCCC TGAACCTGAA ACATAAAATG AATGCAATTG 9951 TTGTTGTTAA CTTGTTTATT GCAGCTTATA ATGGTTACAA ATAAAGCAAT ioooi AGCATCACAA ATTTCACAAA TAAAGCATTT TTTTCACTGC ATTCTAGTTG
  • the targeting vector pTV1 whose sequence is presented above (SEQ ID NO: 2) has the following characteristics (the positions are given according to the numbering of the nucleotides composing the sequence, which numbering is detailed above):
  • Kapppa (K) anti-D Ig from position 5778 to position 6004: polyadenylation signal bGH; from position 6658 to position 6983: SV40 promoter; from position 7019 to position 7813: neo phosphotransferase coding sequence; from position 7987 to position 8117: early SV40 polyadenylation signal (early polyA SV40);
  • the gene coding for the FLPe recombinase was amplified by PCR from the vector pOG4-FLPe (55) with the following primers:
  • the underlined sequence corresponds to the NheI restriction site. In bold is represented the beginning of the coding part of the FLPe gene with the initiator ATG in italics.
  • Antisense primers SEQ ID No: 9
  • the underlined sequence corresponds to the Xbal restriction site. In bold is represented the end of the coding sequence of the FLPe gene with the STOP codon in italics.
  • the FLPe PCR product thus obtained was cloned between the rat EF1-alpha promoter and a bGH (bovine growth hormone) polyadenylation sequence at the NheI and XbaI sites to obtain the final expression vector pEFrat-FLPe.
  • nucleic acid sequence corresponding to the vector pEFrat-FLPe is as follows (SEQ ID NO: 3):
  • the vector pEFrat-FLPe whose sequence is presented above (SEQ ID NO: 3) has the following characteristics
  • the pT125-FRT reintegration vector is derived from the vector T125-IG24 (Fig. 4) in which the CMV promoters have been replaced by RSV promoters and in which the polyadenylation sequence of the neomycin resistance gene has been removed and replaced. by a site Frt placed in the same orientation as the Frt sites of the vector pTVl.
  • the YB2 / 0 rat line (ATCC # CRL-1662) was cultured in EMS medium (Invitrogen, ref 041-95181M) containing 5% fetal calf serum (FCS). 5 million cells were electroporated (BioRad electroporator, model 1652077) using the Optibuffer transfection kit (Thermo Electron). For each transfection, 5 ⁇ g of vector pTV1 linearized with the restriction enzyme Seal were used. The electroporation conditions applied were 230 volts and 950 microfarads in a 0.5 ml cuvette. The contents of each electroporation cuvette were then distributed in 10 P96 plates with a density of 5000 cells per well. The selective medium was placed 3 days after transfection in EMS medium containing 5% FCS and 2 mg / ml G418 (Invitrogen, ref 10131-027).
  • resistant clones were screened by fluorescence induced by the maxFP TM -Green protein (482nm excitation wavelength, 502nm emission). A first reading was performed on all resistant clones in a fluorescence plate reader (VICTOR3, Perkin Elmer). All fluorescence-positive clones were then tested by flow cytometry to verify the fluorescence intensity specific to each cell and the homogeneity of the clones. The results were analyzed on free software WinMDI 2.8 (http: // facs .scripps edu). All clones with a homogeneous fluorescence peak and a mean fluorescence intensity (MFI) greater than 500 were conserved and passed to P24 plates for amplification.
  • MFI mean fluorescence intensity
  • the cells were maintained in P24 plates and their supernatant was assayed in ELISA in order to estimate their productivity of Anti-D antibodies. All clones with a productivity greater than 10 pcd (picograms / cell / 24h) were then tested in semi-quantitative PCR in order to estimate the number of copies of the pTV1 vector.
  • the estimation of the number of copies of the pTV1 vector was carried out in an ABI PRISM® 7000 apparatus with a standard PCR PCR on the LINE sequences (repeated sequences having a stable number in the clones obtained from the YB2 / 0 line). .
  • the clones estimated at a single copy were then tested in Southern blot for confirmation of the number of copies.
  • MTX (sigma, M8407) gene amplification assays were performed on strong single-copy producer clones to determine the amplification capabilities of the pTV1 vector-targeted locus. For this, doses of MTX greater than or equal to 25 nM were added to the EMS medium, 5% FCS. After 15 days of culture in a selective medium, the resistant clones were tested in ELISA in order to verify the productivity increase and in quantitative PCR in order to determine the increase in the number of copies. The productivity of the 3G11 clone (9.7 pcd) was thus increased to 22 pcd after a single amplification cycle. Similarly, the productivity of 35H4 cloxde (11.4 pcd) is increased by about 3 times after one amplification cycle.
  • the clones 8AlO and 3G11, strong producers (6.6 pcd and 9, 7 pcd respectively without amplification) with a single vector copy pTV1 were selected to generate a YGM line by deletion of the targeting vector.
  • the 8AlO clone was first amplified in T75 flasks in EMS medium, 5% FCS, 2 mg / ml G418. The day before the transfection, G418 was removed from the culture.
  • the cells were divided into P96 plates at a density of 5000 cells per well.
  • the selective medium was placed 2 days after transfection in EMS medium, 5% FCS containing 4 ⁇ M of Ganciclovir (Invivogen, ref South-gcv).
  • 5'pTVl (SEQ ID No: 10): 5'-CCTATGGAAAAACGCCAGCAAC-3 '
  • 3'pTVl (SEQ ID NO: 11): 5'-CCTTAGAAAGCGGTCTGTGAAA-S '
  • the 10G10 clone was selected to constitute the YGM-1 / 10G10 expression line and monitored for the stability of the integration site over a period of 3 months.
  • the 35H4 (1) 2G2 clone (13.3 pcd) was selected to generate a YGM line by deletion of the targeting vector.
  • the selective medium was placed 3 days after transfection in RPMI medium, 5% FCS containing 4 ⁇ M of Ganciclovir (Invivogen, ref South-gcv).
  • REV LED (SEQ ID NO: 14): 5'-TGGTATGGCTGATTATGATCCTC-S '
  • the 35H4 (2) 3G5 clone was selected to constitute the YGM-2 / 3G5 expression line and monitored for the stability of the integration site over a period of 3 months.
  • Example 4 Reintegration of an Expression Vector into YGM-1 / 10G10 and YGM-2 / 3G5 Lines (Fig. 6)
  • Reintegration of a vector encoding the same antibody used during the screening step was performed in order to verify the reproducibility of expression levels after reintegration into the YGM-I Frt site (clone 10G10 ).
  • the 10G10 clone obtained after excision of the targeting vector TV1 and having in its genome only one Frt recombination site and an early polyA SV40 polyadenylation sequence was amplified in T75 flasks in EMS medium, 5% FCS.
  • Cotransfection was carried out with 10 ⁇ g of the non-linearized pEFrat-FLPe vector and 5 ⁇ g of the non-linearized PT125-FRT reintegration vector. 5 million cells were electroporated in a 0.5ml cuvette (BioRad electroporator, model 1652077) using the Optibuffer transfection kit (Thermo Eelectron) and applying the following conditions: 230 volts and 950 microfarads.
  • the cells were then distributed on 10 P96 plates at a density of 5000 cells per well.
  • the selective medium was carried out 2 days after transfection in EMS medium, 5% FCS containing 2 mg / ml of G418.
  • the surviving clones were amplified in P24 plates and screened by PCR in order to verify the reintegration into the Frt site of the YGM-I line.
  • the m5NEO-2 and SV40polyA-lrev primers were used for this screening:
  • Clones exhibiting random integrations into the genome of the YGM-I line were eliminated.
  • the clones having integrated the pTl25-FRT vector into the Frt site of the YGM-I line were then tested in ELISA in order to evaluate their Anti-D T125 antibody productivity.
  • Clone 21B10 (5.5 pcd) was selected to check the stability of reinstatement over a 3-month period.
  • Reintegration of a vector encoding the same antibody used during the screening step was performed in order to verify the reproducibility of the expression levels after reintegration into the YGM-2 Frt site (clone 35H4 (2) 3G5).
  • the 35H4 (2) 3G5 clone obtained after excision of the targeting vector TV1 and having in its genome only one Frt recombination site and an early polyA SV40 polyadenylation sequence was amplified in T75 flasks in RPMI medium. % SVF.
  • Cotransfection was carried out with 4 ⁇ g of the non-linearized pEFrat-FLPe vector and 2 ⁇ g of non-linearized pTl25-FRT reintegration vector.
  • the cells were then distributed on 10 P96 plates at a density of 1000 cells per well.
  • the selective medium was carried out 2 days after transfection in EMS medium, 5% FCS containing 3 mg / ml of G418.
  • the surviving clones were amplified in P24 plates and screened by PCR in order to verify the reintegration into the Frt site of the YGM-2 line.
  • Rev LED (SEQ ID No: 14): 5'-TGGTATGGCTGATTATGATCCTC -3 'm-5-NEO-2 (SEQ ID No: 12): 5'-GATGCCTGCTTGCCGAATA -3'
  • the productivities obtained for these 4 clones (7.1 pcd, 7.0 pcd, 7.1 pcd and 7.7 pcd, respectively) are homogeneous and of the same order of magnitude as observed for the 35H4 clone or the 35H4 clone ( 1) 2G2 parental (11.4 pcd and 13.3 pcd, respectively) testifying to the interest of this strategy of targeting to obtain strong producers in a reproducible way.
  • the genetic stability of these cloids was studied, after cloning, over a period of 3 months.
  • Example 5 s identification of the integration site of the line YGM-I (10G10 clone) by reverse PCR
  • HEK293 cell line a vehicle for the expression of recombinant proteins. J Pharmacol. Toxicol. Methods 51: 187.
  • AAUAAA are required for efficient rabbit beta-globin mRNA 3 'end formation.
  • RNA processing efficiency plays a primary role in generating termination-competent KNA polymerase II elongation complexes.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Neurosurgery (AREA)
  • Pulmonology (AREA)
  • Neurology (AREA)
  • Hematology (AREA)
  • Diabetes (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Cardiology (AREA)
  • Virology (AREA)
  • Pain & Pain Management (AREA)

Abstract

L'invention, concerne un procédé d'obtention d'une lignée cellulaire comprenant les étapes consistant à intégrer dans le génome de ladite cellule un site unique de reconnaissance d'une recombinase dans une zone de forte activité transcriptionnelle du génome de ladite cellule; et intégrer, dans le génome de ladite cellule, en aval du site unique de reconnaissance d'une recombinase, une séquence d'acide nucléique codant un signal de terminaison de la transcription. L'invention concerne également les lignées cellulaires obtenues par ce procédé.

Description

Lignée cellulaire à forte activité transcriptionnelle pour la production de protéines, notamment thérapeutiques.
La présente invention concerne un procédé d'obtention d'une lignée cellulaire comprenant en particulier l'intégration d'une séquence codant une protéine d'intérêt dans un site de forte activité transcriptionnelle pour la production de protéines, notamment thérapeutiques, ainsi que les lignées cellulaires obtenues par ce procédé.
Domaine de l ' invention
Grâce au développement des biotechnologies la production de protéines recombinantes représente actuellement un secteur d'activité majeur dans le domaine biomédical avec de multiples applications diagnostiques ou thérapeutiques. En effet, l'évolution des techniques d'ingénierie moléculaire et cellulaire offre à présent la possibilité de maîtriser la production de quantités importantes de protéines- recombinantes dans différentes cellules hôte d'expression.
Différents systèmes biologiques peuvent être utilisés pour la production de protéines recombinantes : les bactéries (1, 2), les champignons/levures (3-5), les végétaux (6), les cellules d'insecte (7, 8) ou les cellules de mammifère (9-12). Toutefois, les cellules de mammifères sont les plus fréquemment utilisées pour la production de protéines recombinantes complexes à usage thérapeutique (tels que les anticorps monoclonaux) en raison d'une meilleure capacité post-traductionnelle à assembler, à glycosyler et à modifier les protéines recombinantes synthétisées (10, 11). Malheureusement, le niveau naturel de productivité des cellules de mammifères est faible lorsqu'on le compare aux niveaux d'expression obtenus dans les bactéries ou les levures. En effet, l'étape d'intégration du vecteur d'expression dans le génome de la cellule hôte représente un événement rare (1/10 000 selon Gorman and Bullock 2000, réf. 13), au cours duquel le site d'insertion, le nombre de copies intégrées et donc le niveau d'expression qui en résulte ne peuvent être contrôlés. De nombreux efforts sont donc mis en oeuvre pour optimiser ces systèmes de production et différentes voies d'amélioration sont explorées, qui concernent : les vecteurs d'expression et leurs modalités d'intégration, les cellules et leurs conditions de culture et l'amplification génique (14-26) .
L'ensemble de ces efforts s'est surtout concentré sur les lignées utilisées pour la production à l'échelle industrielle soit, principalement, les lignées CHO (14, 25, 27-29) et NSO (22, 30, 31) ou bien encore les lignées HEK293 (32, 33) ou BHK (34-36) . Toutefois, la sélection d'un clone fortement producteur reste encore très souvent une étape critique qui nécessite le criblage d'un grand nombre de transfectants en raison du caractère aléatoire de l'intégration du vecteur d'expression dans le génome de la lignée d'expression. En effet, après intégration du vecteur dans le génome, le niveau d'expression de la protéine recombinante est fortement influencé par l'« effet de position », c'est à dire par l'environnement génétique du locus d'intégration (37, 38). Ainsi, l'insertion du vecteur d'expression dans une région transcriptionnellement inactive du génome résultera en une expression faible, voire nulle, tandis que l'intégration du vecteur dans une région transcriptionnellement active pourra entraîner une forte expression. La majeure partie du génome se trouvant dans un état transcriptionnellement inactif, il est en général nécessaire de cribler un grand nombre de transfectants pour isoler un clone fortement producteur (22) .
Art antérieur
Afin de contrecarrer cet « effet de position », différentes stratégies sont explorées. L'une de ces approches consiste à supprimer l'effet de position par l'intermédiaire d'isolateurs ou de séquences LCR (Locus Control Région) (39-42) . Dans ce cas, l'expression du transgène est uniquement dépendante du nombre de copies du vecteur ayant été intégrées et de l'efficacité des séquences exogènes dirigeant l'expression de la protéine recombinante.
Une autre démarche repose sur la suppression de l'effet de position par l'addition de séquences induisant un état de chromatine favorable à l'activité transcriptionnelle (UCOE) (43).
D'autres stratégies consistent, au contraire, à supprimer le caractère aléatoire de l'intégration en dirigeant l'insertion du vecteur d'expression au niveau d'un locus favorable à l'expression du transgène. Dans ce cas l'intégration peut être ciblée au niveau d'un gène connu (Hollis GF, US 6,750,041) ou bien de sites présentant une bonne activité transcriptionnelle
(44, 45, Reff MR, brevet US 6,841,383). Grâce à cette démarche l'événement d'intégration est contrôlé et dirigé vers un locus garantissant l'expression du transgène à un niveau constant et, si possible, élevé. L'étape de transfection ne constitue donc plus un événement aléatoire mais devient un événement reproductible, avec pour conséquences , l'allégement des étapes de criblage et de caractérisation ainsi que la garantie d'une productivité comparable d'une transfection à l'autre.
L'intégration ciblée du vecteur d'expression peut être réalisée par recombinaison homologue (Reff MR, brevet US 6,841,383 ; Hollis GF, brevet US 6,750,041 ; 46, 47). Toutefois, si cette forme de recombinaison intervient naturellement avec une fréquence élevée dans la levure ou dans d'autres organismes fongiques, elle se révèle en fait beaucoup plus rare chez les eucaryotes supérieurs, ce qui constitue un obstacle important quant à son utilisation dans ce type d'organismes (47). Par exemple, dans les cellules de mammifères, le rapport de la fréquence de recombinaison homologue sur la fréquence de l'intégration aléatoire se situe entre 1/100 et 1/5000 (48). Une approche complémentaire destinée à améliorer l'efficacité de la recombinaison homologue consiste, par ailleurs, à provoquer l'apparition de coupures dans l 'ADN en utilisant des méganucléases (par exemple I-Sce I) (49) .
Une autre démarche consiste en l'utilisation de recombinases (47, 50), et notamment en l'utilisation des recombinases Cre
(51, 52) ou FIp (53, 54) . Le système de recombinaison Cre- loxP du bactériophage Pl a ainsi été adapté et utilisé pour cibler certains gènes présents dans les cellules eucaryotes
(51, 52, Sauer BL, EP 0 220 009). L'intégration ciblée dans le génome de cellules CHO (Chinese hamster ovary) au moyen de la recombinase Cre a par exemple été décrite (44) . Ce système de recombinaison est attractif en ce qu'il permet une expression reproductible en un même locus du génome. Toutefois, une telle approche permet uniquement de s'assurer de la reproductibilité des niveaux d'expression d'un gène rapporteur mais elle ne permet pas de garantir une forte expression du gène concerné .
Afin de pallier ce problème, des lignées cellulaires constituant des hôtes d'expression stables et possédant un site de recombinaison FRT dans une région du génome transcriptionnellement active ont été créées (lignées cellulaires Flp-In™, Invitrogen) . L'intégration d'un vecteur d'expression' dans le site localisé au sein de la région transcriptionnellement active est obtenue par une recombinaison de type Flp-FRT, ce qui assure une forte transcription du gène d'intérêt. Toutefois les lignées Flp-in proposées (293, CHO, BHK, 3T3) ne sont pas toujours optimales quant à la production de certaines protéines recombinantes, comme les anticorps monoclonaux par exemple, en raison de leurs propriétés intrinsèques de modification post- traductionnelle. Par ailleurs, ces lignées cellulaires comportent également dans leur génome des séquences additionnelles permettant de sélectionner les cellules ayant correctement intégré les sites de recombinaison au sein d'une région fortement transcrite.
II reste cependant préférable de pouvoir disposer de lignées cellulaires « hôtes » dépourvues de toute séquences actives (promoteur, activateurs ou gène de résistance aux antibiotiques) afin de ne pas restreindre l'utilisation de gènes de résistance ou de séquences régulatrices (promoteurs, activateurs, polyA) susceptibles d'être utilisés pour l'expression ultérieure de la protéine d'intérêt. Enfin, la re-expression éventuelle d'un gène rapporteur concomitante à l'expression de la protéine d'intérêt peut imposer des vérifications complexes, notamment dans le cadre de la production de protéines thérapeutiques, soumise à des normes réglementaires très strictes, notamment en ce qui concerne l'ingénierie moléculaire des lignées cellulaires produisant les protéines d'intérêt thérapeutique.
Plus récemment Kito et al (45) ont adapté l'approche Cre-loxP à la sélection de clones fortement producteurs dans les cellules CHO en utilisant le gène rapporteur codant la GFP, ce qui a permis d'obtenir des niveaux d'expression avoisinant 160 mg/1 après amplification génique. Cependant, comme dans le cas des lignées FIp-In précédemment évoquées, cette stratégie ne permet pas de s'affranchir de la présence de multiples séquences actives dans la lignée cellulaire utilisée en tant qu'hôte pour réaliser l'expression.
La production de protéines thérapeutiques recombinantes étant soumise à des normes réglementaires très strictes au niveau de l'ingénierie moléculaire des lignées cellulaires produisant les protéines d'intérêt thérapeutique, la présence de séquences actives dans le génome de ces cellules complique donc l'élaboration du dossier réglementaire, et rallonge les phases de développement des médicaments ainsi produits.
Ainsi, la mise au point de nouvelles lignées cellulaires fortement productrices, stables dans le temps, permettant de produire de manière simplifiée tout type de protéines d'intérêt industrielle, et notamment des protéines thérapeutiques, reste par conséquent un enjeu majeur pour améliorer la production de protéines recombinantes à partir de cellules eucaryotes et, en particulier, à partir de cellules de mainmifères .
Selon les différents objets faisant partie de la présente invention, il est fait référence à une protéine d'intérêt, qui puisse être exprimée dans la cellule, soit pour les besoins de la vérification de l'intégration des sites FRT, soit, dans la vision globale de l'invention, pour la production de telles protéines à l'échelle industrielle. Telle qu'elle est présentée dans la présente description, abrégé, et revendications, cette expression signifie que la lignée cellulaire produit des protéines qui peuvent ou non être présentes nativement dans la cellule, et les surexprime au- delà de leur taux d'expression native.
Définitions
De manière générale, aussi bien dans la description, et abrégé, que dans les revendications, les termes suivants qui sont rencontrés ont les significations suivantes, sauf stipulation différente :
Par « séquence d'acide nucléique », on entend, au sens de la présente invention, un oligomère ou un polymère, simple ou double brin, de bases nucléotidiques lues à partir de l'extrémité 5' vers l'extrémité 3'. Le terme « séquence d'acide nucléique » peut se référer à une molécule d'ADN, d'AEN ou à une molécule hybride ARN/ADN, d'origine naturelle ou synthétique. Dans la notation nucléotidique utilisée dans la présente demande, sauf mention particulière, l'extrémité gauche d'une séquence nucléotidique simple brin est l'extrémité 5' . Par « molécule d'ADN », on entend, au sens de la présente invention, tout oligomère ou polymère, simple ou double brin, constitué par un enchaînement de bases nucléotidigues, d'origine naturelle ou synthétique et comprenant, sans y être limité, un gène, un ensemble de gènes, un fragment de gène, un mélange de séquences codantes et non codantes, des séquences de régulation, ou la séquence complémentaire de celle correspondant à un ARM.
Par « promoteur » ou « séqiience promotrice », on entend, au sens de la présente invention, une séquence d'acide nucléique, naturelle ou synthétique, située en amont du codon de démarrage de la traduction et impliquée dans la reconnaissance et la liaison de l 'AKN polymérase. Cette séquence promotrice permet ainsi d'initier la transcription d'une région codante située en aval. De tels promoteurs sont connus par l'homme du métier et peuvent comprendre des promoteurs bactériens, viraux, eucaryotes, de levure ou de mammifère, la sélection du promoteur étant dépendante du système cellulaire hôte utilisé pour réaliser l'expression.
Par « vecteur », on entend, au sens de la présente invention, un véhicule de transit à base d'acides nucléiques, une molécule d'acide nucléique adaptée pour livrer de l'acide nucléique ou une molécule d'ADN capable de réplication autonome dans une cellule hôte, par exemple un plasmide, un cosmide, un phagemide, un génome (chromosome) viral, un génome (chromosome) phagique, et qui permet le clonage de molécules d'ADN. Selon l'hôte cellulaire considéré et la nature des séquences nucléiques constituant le vecteur, le vecteur peut être soit répliqué de manière stable par les cellules en tant que structure autonome, soit intégré au génome de l'hôte, soit maintenu dans le noyau ou le cytoplasme de l'hôte. Par « plasmide », on entend, au sens de la présente invention, une molécule d'ADN circulaire autonome, éventuellement linéarisée, capable de réplication dans une cellule. Le terme plasmide comprend à la fois les plasmides dits « d'expression » et les plasmides dits « de non-exprèssion ». Lorsque le plasmide est maintenu par une cellule hôte, il peut être soit répliqué de manière stable par les cellules en tant que structure autonome, soit être intégré au génome de l'hôte.
Par « peptide », « polypeptide » ou « protéine », on entend, au sens de la présente invention, une séquence primaire d'acides aminés liés par des liaisons peptidiques covalentes. En général, un peptide, plus court qu'une protéine, est constitué d'un faible nombre d'acides aminés, typiquement de 2 à 50. Le terme polypeptide peut recouvrir à la fois les peptides et les protéines. Un peptide, un polypeptide ou une protéine peuvent être d'origine synthétique, recombinante ou naturelle.
Par « signal de terminaison de la transcription », on entend, au sens de la présente invention, une séquence d'acide nucléique placée à la fin d'une région transcrite et qui provoque l'arrêt de la transcription de cette région par l 'AKN polymérase. Des exemples de signaux de terminaison de la transcription utiles dans le cadre de la présente invention comprennent, sans y être limités, des séquences de polyadénylation, comme par exemple la séquence de polyadénylation « SV40 early polyadénylation signal », et la séquence de polyadénylation BGH.
Par « séquence de polyadénylation » ou « polyA », on entend, au sens de la présente invention, une séquence d'ADN qui provoque à la fois la terminaison de la transcription et la polyadénylation de 1 'ARN transcrit naissant. Une polyadénylation efficace des transcrits est généralement souhaitable dans la mesure où les transcrits dépourvus de queue polyA s'avèrent souvent instables et sont rapidement dégradés .
Un clivage et une polyadénylation efficaces des ARN messagers de mammifères requièrent au moins deux éléments de signal: une séquence AAUAAA située 7 à 30 paires de bases en amont d'un site de processing, et des séquences riches en GU ou U situées en 3' du site de clivage.
Par « séquence de polyadénylation présentant une faible efficacité », on entend, au sens de la présente invention, une séquence de polyadénylation ne permettant pas une mise en œuvre efficace de la terminaison de la transcription et de la polyadénylation des transcrits. Il en résulte une faible quantité de transcrits et/ou une instabilité importante des transcrits, qui sont, pour la plupart, dégradés trop rapidement pour permettre leur traduction. Plus particulièrement, on entend par « séquence de polyadénylation présentant une faible efficacité » toute séquence de polyadénylation permettant une mise en œuvre de la terminaison de la transcription et de la polyadénylation des transcrits à un niveau inférieur ou égal à celle induite par la séquence de polyadénylation « SV40 early polyadénylation signal ». Toute séquence de polyadénylation permettant d'atteindre cet objectif peut être utilisée dans le cadre de l'invention. Plus particulièrement, ces séquences peuvent être des séquences de polyadénylation intègres présentant un signal de polyadénylation peu efficace de la terminaison de la transcription et de la polyadénylation des transcrits, comme par exemple le polyA SV40 early, ou le polyA de l'adénovirus Ll (71) , ou bien des séquences de polyadénylation mutées ou délétées de manière à diminuer le niveau de mise en œuvre de la terminaison de la transcription et de la polyaάénylation des transcrits par rapport à la séquence non mutée ou non délétée. On peut citer à titre d'exemple de mutation et/ou de délétion d'une séquence de polyadénylation, permettant de diminuer l'efficacité du signal de polyadénylation par rapport à la séquence non mutée, l'augmentation de la distance séparant les éléments AATAAA et la région riche en GT (66) , la délétion du polyA SV40 late d'un ou plusieurs nucléotides présents en amont de l 'hexanucléotide AATAAA (67), la délétion de certains éléments situés entre le nucléotides situés de 13 à 48 nucléotides en amont de la séquence AATAAA (68), la délétion des séquences riches en GT en aval de la séquence AATAAA et la modification de l'espace situé entre la séquence AATAAA et la région riche en GT (69), ou la mutation ou la délétion des régions USE (upstream séquence éléments) situées en amont de la séquence AATAAA (70), cette liste n'étant pas limitative.
Par « isolé » ou « purifié », on entend, au sens de la présente invention, toute modification réalisée par la main de l'homme à partir de l'état naturel. Par conséquent, tout objet préexistant dans la nature ayant été modifié ou extrait de son environnement naturel est dit « isolé » ou « purifié ». Un objet « isolé » peut correspondre à tout polynucléotide ou à tout(e) peptide/polypeptide/protéine séparé(e) des molécules coexistantes dans son environnement naturel, obtenu par clonage, par amplification et/ou par synthèse chimique. Par ailleurs, un polynucléotide ou un(e) peptide/protéine qui est introduit dans un organisme par transformation, manipulation génétique ou par toute autre méthode, est dit « isolé » même s'il préexistait dans cet organisme. Par « expression », on entend, au sens de la présente invention, la transcription et/ou la traduction d'une séquence polynucléotidique particulière, placée sous le contrôle d'une séquence régulatrice telle qu'un promoteur, par exemple.
Par « surexpression », on entend, au sens de la présente invention, un niveau d'expression pour une séquence codante donnée qui est significativement plus élevé (par exemple deux fois, et de préférence 10 fois ou même une centaine de fois) par cellule que le niveau par cellule observé avec la séquence codante native correspondante dans une cellule non transfectée par la construction de l'invention.
Par « anticorps », on entend, au sens de la présente invention, une molécule d'immunoglobuline immunologiquement réactive à un antigène particulier, et qui inclut, selon les cas, les anticorps polyclonaux et/ou monoclonaux. Ce terme comprend aussi les formes génétiquement modifiées, telles que les anticorps chimériques (par exemple les anticorps de souris ou de lapin humanisés) , ou les anticorps hétéroconjugués (par exemple les anticorps bispécifiques) . Le terme « anticorps » comprend également les formes d'anticorps se liant aux antigènes, y compris les fragments d'anticorps ayant la capacité de se lier aux antigènes.
Par « transfection » ou « transfecter », on entend, au sens de la présente invention, un procédé par lequel des cellules incorporent un ADN exogène et intègrent cet ADN dans leur génome .
Par « lignée cellulaire », on entend, au sens de la présente invention, un ensemble de cellules provenant d'une même cellule mère et possédant les mêmes caractéristiques génétiques que cette cellule mère. Une lignée cellulaire se caractérise en outre par sa capacité à croître de façon stable in vitro pendant un grand nombre de générations.
Par « zone de forte activité transcriptionnelle », on entend, au sens de la présente invention, une région de l'ADN génomique ou chromosomique d'un organisme qui présente une organisation chromatinienne ou qui comporte des séquences régulatrices susceptibles d'augmenter de façon significative la fréquence de transcription des gènes présents dans ou aux abords de cette région. Le taux de transcription rencontré dans une telle zone d'activité est généralement supérieur au taux de transcription moyen classiquement observé dans le génome de cet organisme, et de préférence 2 fois supérieur, ou avantageusement 10 fois supérieur, voire 50 fois supérieur, et parfois même 100 fois supérieur. Par exemple, pour la lignée YB2/0 (ATCC CRL 1662), on considère qu'une zone de forte activité transcriptionnelle permet d'obtenir une valeur pcd (picogrammes de protéine/cellule/24 heures) supérieure ou égale à 5, et de préférence supérieure ou égale à 10.
Par « zone de faible activité transcriptionnelle », on entend, au sens de la présente invention, une région de l'ADN génomique ou chromosomique d'un organisme qui présente une organisation chromatinienne ou qui comporte des séquences régulatrices susceptibles de bloquer totalement ou de diminuer de façon significative la fréquence de transcription des gènes présents dans ou aux abords de cette région. Le taux de transcription rencontré dans une telle zone d'activité est généralement inférieur au taux de transcription moyen classiquement observé dans le génome de cet organisme, et de préférence 2 fois inférieur, ou avantageusement 10 fois inférieur, voire 50 fois inférieur, ou même 100 fois inférieur. Le taux de transcription rencontré dans une telle zone d'activité peut également se révéler si faible qu'il devient impossible de l'évaluer, et peut également être nul.
Par « recombinase » ou « recombinase spécifique de site », on entend, au sens de la présente invention, une enzyme dont l'action sur deux molécules d'acide nucléique consiste à provoquer une recombinaison entre lesdites deux molécules. La recombinaison est un procédé naturel bien connu qui conduit à la scission de deux molécules d'acides nucléiques ayant des séquences identiques ou essentiellement similaires (homologues) , et qui mène à la reformation des deux molécules de sorte qu'une région de chaque molécule initialement présente devient liée à une région de l'autre molécule initialement présente. Deux types de réactions de recombinaison ont été identifiés. Le premier type, qui correspond à la recombinaison dite « classique » ou « homologue », va concerner n'importe quelle paire de molécules présentant des séquences nuléotidiques homologues susceptibles de servir de substrat à une recombinase « générale ». En revanche, dans le deuxième type de recombinaison, appelé « recombinaison spécifique de site », les molécules homologues doivent, pour servir de substrat à la recombinase, comporter une séquence nucléotidique particulière appelée « site de recombinaison spécifique ». Plusieurs systèmes de recombinaison spécifique de site sont décrits dans l'état de la technique, comme par exemple le système du bactériophage Pl de E. coll. En particulier, les séquences spécifiques et les recombinases utilisées peuvent appartenir à différentes classes structurales, et notamment à la famille de résolvase du transposon Tn3 ou à la famille de l'intégrase du bactériophage lambda. Parmi les recombinases appartenant à la famille du transposon Tn3 , on peut citer notamment la résolvase du transposon Tn3 ou des transposons, Tn21 et Tn522 (Stark étal., 1992) ; 1 ' invertase Gin du bactériophage mu ou encore les résolvases de plasmides, telle que celle du fragment par de RP4 (Abert et al., Mol. Microbiol . 12 (1994) 131 ) . Parmi les recombinases appartenant à la famille de l'intégrase du bactériophage λ, on peut citer notamment 1 ' intégrase des phages lambda (Landy et al., Science 197 (1977) 1147 ), P22 (Leong et al., J. Biol . Chem. 260 (1985) 4468 ), HPl de Haemophilus influenzae (Hauser et al., J. Biol. Chem. 267 (1992) 6859 ), fintégrase Cre du phage Pl, l'intégrase du plasmide pSAM2 (350341EPA EP 350 341) ou encore la FLP recombinase du plasmide 2μ et les recombinases XerC et XerD d'E coli .
Par « site de reconnaissance à une recombinase », on entend, au sens de la présente invention, une séquence d'acide nucléique susceptible de servir de substrat à une recombinase.
Par « gène rapporteur », on entend, au sens de la présente invention, un polynucléotide ayant une séquence encodant un produit de gène, de façon générale une enzyme, dont la présence peut être aisément détectée et/ou quantifiée lorsque la construction comprenant la séquence du gène rapporteur est introduite dans des cellules contenant tous les facteurs nécessaires à l'expression de ce gène. Des exemples de gènes rapporteurs utiles dans le cadre de la présente invention comprennent, sans y être limité, des protéines fluorescentes telles que la protéine maxFP-green et ses dérivés, la luciférase, la GFP (Green fluorescent protein) et ses dérivés, ou les RCFP (Reef Coral Fluorescent Proteins) ainsi que la beta-galactosidase encodée par le gène lacZ. Par « protéine d'intérêt », on entend, au sens de la présente invention, tout peptide/polypeptide ou toute protéine susceptible de présenter un intérêt industriel, prophylactique ou thérapeutique. Les protéines d'intérêt susceptibles d'être exprimées dans les lignées cellulaires selon la présente invention peuvent être choisies parmi :
- les protéines ayant une activité thérapeutique : c ' est-à- dire, des protéines ayant un effet bénéfique physiologique reconnu sur le sujet humain ou animal dans une forme de maladie reconnue ou un dysfonctionnement pathologique dudit sujet animal ou humain, y compris dans des traitements prophylactiques; de telles protéines comprennent également des peptides, polypeptides, hormones, enzymes et semblables, et de préférence des polypeptides ayant une activité choisie parmi le groupe consistant en une activité dans les fonctions digestive, pancréatique, biliaire, antivirale, anti-inflammatoire, pulmonaire, antimicrobienne, hématologique, neurologique, cardiovasculaire, ophtalmologique, antigénique, cérébrale, anti-tumorale, immunostimulante, et immunomodulatrice; dans des modes d'exécution particulièrement préférés, la protéine ou le polypeptide, à activité thérapeutique, est choisi parmi le groupe consistant en les insulines ; une hormone de croissance, y compris une hormone de croissance humaine et une hormone de croissance bovine ; un facteur de relargage d'une hormone de croissance ; une hormone parathyroïdienne ; une hormone stimulant la thyroïde ; une hormone de stimulation des follicules ; une hormone de lutéïnisation; les interférons, tel qu'un interféron-alpha, -beta et -gamma ou, par exemple, un interféron 13 ; un facteur de croissance endothélial vasculaire (VEGF) ; des récepteurs pour des hormones ou des facteurs de croissance ; une intégrine ; une protéine A ou D ; des facteurs rhumatoïdes ; un facteur neurotrophique tel qu'un facteur neurotrophique dérivé de l'os (BDNF) ; une neurotrophine 3, 4, 5 ou 6 (NT-3 , NT-4,
NT-5 ou NT-6) ; un facteur de croissance de nerfs tel qu'un NGF-beta ; un facteur de croissance dérivé des plaquettes
(PDGF) ; un facteur de croissance de fibroblastes tel qu'un
FGF ou un bFGF ; un facteur de croissance épidermique
(EGF) ; un facteur de croissance de transformation (TGF) tel qu'un TGF-alpha et un TGF-beta, comprenant un TGF-beta.l, un TGF-beta.2, un TGF-beta.3, un TGF-beta.4, ou un TGF-beta.5 ; un facteur de croissance ressemblant à l'insuline de type I et de type II (IGF-I et IGF-II), ou par exemple un des (1-3)- IGF-I (IGF-I du cerveau) ; un facteur de croissance des kératinocytes ; des protéines de liaison d'un facteur de croissance ressemblant à l'insuline ; des protéines CD telles qu'une CD-3, une CD-4, une CD-8, et une CD-19 ; une érythropoïétine ; des facteurs d'ostéoinduction ; des immunotoxines ; une protéine morphogênétique d'os (BMP) ; des facteurs de stimulation de colonies (CSFs) , par exemple M-CSF, GM-CSF, et G-CSF ; des facteurs d'accélération du vieillissement ; les lipases gastriques, les lipases pancréatiques ou biliaires, les élastases, les anti- protéases telles que l'alpha-1 anti-trypsine ; les protéases ; les oxydases ; les phytases ; les chitinases ; les invertases ; les cellulases ; les xynalases ; les protéines structurantes telles que le collagène ; les transferrines telles que la lactoferrine ; les protéines dérivées du sang, telles que l'hémoglobine ou l'albumine humaine ; les cofacteurs sanguins, les facteurs de coagulation tels que le facteur VII, le facteur VIII, le facteur IX, le facteur X, le facteur tissulaire, le facteur von Willebrand ; les facteurs anti-coagulation tels qu'une protéine C ; le facteur natriurétique atrial ; la rénine ; la calcitonine ; le glucagon ; un surfactant pulmonaire ; un activateur .du plasminogène, tel qu'une urokinase ou un activateur de plasminogène spécifique de tissus (t-PA) ; la thrombine ; la thrombopoïétine ; un facteur de croissance hématopoïétique, un facteur alpha ou beta de nécrose de tumeurs ; une enképhalinase ; une protéine d'inflammation des macrophages humains (MIP-I-alpha) ; une sérumalbumine telle que la sérumalbumine humaine ; la relaxine ; une DNase ; une cytokine ; les chimiokines telles que, par exemple un RANTES (regulated on activation normally T-cell expressed and secreted) ; des interleukines (ILs), par exemple IL-I à IL-IO ; les antioxydants tels que la superoxide dismutase, les anticorps, les fragments d'anticorps et les antigènes. Lorsque le polypeptide ou protéine est choisi parmi les anticorps ou les fragments d'anticorps, ceux-ci peuvent comprendre des molécules d'immunoglobuline, la chaîne lourde d' immunoglobuline, des molécules d'immunoglobuline essentiellement complètes, et toutes parties d'une immunoglobuline comportant un paratope, y compris des fragments Fab, des fragments Fab', des fragments F(ab')2 et des fragments Fv, la chaîne légère d'immunoglobuline, et des fragments Fv;
des protéines ou polypeptides à activité cosmétique qui, d'après les législation de nombreux pays, sont ceux qui exercent une activité uniquement au niveau de l'épiderme, c'est-à-dire que les molécules en question ne traversent pas jusqu'aux couches inférieures, ou autrement n'ont aucune action ou effet sur le derme ou les cellules basales . De telles protéines ou polypeptides sont connus de l'homme du métier en tant que tels, dont quelques exemples sont des céramides, des kératides, des agents hydratants, des agents antibactériens et semblables;
des protéines ou polypeptides à activité nutraceutique, c'est-à-dire des molécules qui sont identiques ou proches de celles que l'on trouve couramment dans le régime alimentaire humains ou animal, et qui peuvent se trouver en tout ou en partie dans l'alimentation ou une partie de cette dernière et qui ont un effet bénéfique sur la santé; en tant qu'exemples des types de molécules pouvant être concernées par cette partie de 1 ' invention, on peut citer la PAL modifiée ou dérivée (phénylalanine ammonia lyase) , les allergènes, par exemple de bouleau, de peuplier, et des Graminae, la superoxide dismutase (SOD), et semblables.
Par « forte dose d'antibiotiqτie », on entend, au sens de la présente invention, une dose d'antibiotique supérieure ou égale à lg/1, ou avantageusement supérieure ou égale à 2g/l, ou encore supérieure ou égale à 4g/l et de préférence à 8g/l.
Conformément à un aspect de la présente invention, il est prévu un procédé d'obtention d'une lignée cellulaire comportant au moins une cellule, comprenant les étapes suivantes :
- l'intégration dans le génome de ladite cellule d'un site unique de reconnaissance d'une recombinase dans une zone de forte activité transcriptionnelle du génome de ladite cellule ; et
- l'intégration, dans le génome de ladite cellule, en aval du site unique de reconnaissance d'une recombinase, d'une séquence d'acide nucléique codant un signal de terminaison de la transcription. De préférence, la séquence d'acide nucléique codant un signal de terminaison de la transcription est une séquence codant un signal de polyadénylation. De manière encore plus préférée, la séquence d'acide nucléique codant un signal de terminaison de la transcription est une séquence codant tout ou partie d'un signal de polyadenylation de faible efficacité, tel que le signal de polyadénylation SV40 précoce, ou le signal de polyadénylation de 1 ' adénovirus Ll, ou tout autre signal de polyadénylation présentant une faible efficacité tel que défini plus haut.
Selon un autre mode particulièrement avantageux de la présente invention, la ou les cellules de la lignée cellulaire utilisée dans les procédés de la présente invention est une cellule de mammifère ou une cellule aviaire. La cellule de départ, c'est- à-dire avant modification, est ainsi choisie parmi le groupe consistant en : les lignées de myélomes de rat, notamment YB2/0 (ATCC CRL-1662) et IR983F, de myélome humain comme Namalwa ou toute autre cellule d'origine humaine comme PERC6, les lignées CHO, notamment CHO-K, CHO-LeclO, CHO-Lecl, CHO Pro-5, CHO dhfr- , CHO Lecl3 , ou d'autres lignées choisies parmi Wil-2, Jurkat, Vero, Molt-4, COS-7, 293-HEK, BHK, K6H6, NSO, SP2/0-Ag 14, P3X63Ag8.653 , et Ebx.
Selon une forme préférée du procédé de la présente invention, l'intégration du site unique de reconnaissance d'une recombinase est effectuée par une série d'étapes comprenant au moins :
l'intégration de deux séquences d'acide nucléique codant chacune un site de reconnaissance d'une recombinase ;
l'intégration d'une séquence d'acide nucléique, codant un gène rapporteur, entre les deux séquences codant chacune un site de reconnaissance d'une recombinase ;
- l'intégration d'une séquence d'acide nucléique codant une protéine d'intérêt entre les 2 séquences codant chacune un site de reconnaissance d'une recombinase ; et l'intégration d'une séquence d'acide nucléique, codant un marqueur de sélection, de préférence un gène de résistance à un antibiotique entre les 2 séquences codant chacune un site de reconnaissance d'une recombinase.
Dans ce cas, la séquence de reconnaissance de la recombinase peut être la séquence loxP et/ou FRT. La protéine d'intérêt peut être par exemple un anticorps ou un fragment d'anticorps.
Il est également préféré de ne sélectionner que les cellules fortement productrices ayant intégré une seule copie de l'ensemble des séquences mentionnées précédemment. De manière encore plus préférée, seules les cellules ayant une valeur pcd
(pg de protéine/cellule/24 heures) égale ou supérieure à 5, et de préférence égale ou supérieure à 10, ou encore à 20, à 30, à 50, à 80 ou à 100, sont sélectionnées.
De préférence, et par la suite, on peut procéder à l'excision de 1 ' ensemble des séquences mentionnées précédemment par action d'une recombinase sur la cellule. Dans ce cas, l'action d'une recombinase peut être obtenue par co-expression dans la cellule de ladite recombinase au moyen d'un vecteur comportant une séquence d'acide nucléique codant ladite recombinase.
Selon un autre mode d'exécution préféré de la présente invention, la série d'étapes mentionnées précédemment comprend en outre la sélection des cellules ayant excisé 1 ' ensemble des séquences d'acide nucléique mentionnées précédemment, et possédant un site de reconnaissance unique et intègre de la recombinase.
En outre, la série d'étapes peut, de manière encore plus préférée, comprendre l'intégration d'une séquence d'acide nucléique , codant la thymidine kinase du virus Herpès simplex de type I (HSVl-TK) . Dans ce cas, la sélection des cellules peut être effectuée par l'ajout de ganciclovir dans le milieu de culture. En effet, cette sélection permet de s'assurer que seules les cellules ayant intégré la séquence d'acide nucléique codant ladite HSVl-TK résisteront à la culture avec le ganciclovir présent dans le milieu.
La série d'étapes mentionnées précédemment comprend, en outre, et ce de manière particulièrement préférée, une transfection de la lignée cellulaire sélectionnée avec un vecteur d'expression comprenant une séquence d'acides nucléiques codant une protéine ou polypeptide d'intérêt et une séquence d'acide nucléique codant un site de reconnaissance de recombinase directement en aval d'une séquence d'acide nucléique codant un marqueur de sélection, de préférence de résistance à un antibiotique, dépourvu de séquence de polyadénylation. Dans ce cas, on insère ledit vecteur d'expression au niveau du site unique de reconnaissance de recombinase, grâce à l'action combinée de ladite recombinase, qui est exprimée ou apportée en même temps que la transfection. La sélection des cellules contenant le vecteur d'expression intégré au site cible peut être avantageusement effectuée en testant l'expression de la protéine ou le polypeptide d'intérêt. Avantageusement les cellules pourront être également sélectionnées pour leur résistance en présence d'une forte concentration d'antibiotique, en particulier leur résistance à une dose d'antibiotique supérieure ou égale à lg/1, ou à 2g/l, ou de préférence à 4g/l, ou à 8g/l.
De manière particulièrement préférée, ladite protéine ou ledit polypeptide d'intérêt est une protéine ou polypeptide thérapeutique, notamment choisi parmi le groupe présentant une activité dans les fonctions digestive, pancréatique, biliaire, antivirale, anti-inflammatoire, pulmonaire, antimicrobiale, hématologique, neurologique, cardiovasculaire, ophthalmologique, antigénique, cérébrale, anti-tumorale, immunostimulante, et immunomodulatrice.
Les étapes de procédé décrites ci-dessus, à leurs différents stades, permettent d'obtenir une ou plusieurs lignées cellulaires présentant des caractéristiques particulièrement avantageuses. Par conséquent, un autre objet de la présente invention est une lignée cellulaire comprenant, intégré de manière stable dans son génome, un site unique de reconnaissance d'une recombinase dans une zone de forte activité transcriptionnelle du génome de ladite cellule et, directement en aval dudit site unique de reconnaissance d'une recombinase, une séquence d'acide nucléique codant un signal de terminaison de la transcription. De préférence, la séquence d'acide nucléique codant un signal de terminaison de la transcription et intégrée dans la lignée de manière stable est une séquence codant un signal de polyadénylation. Cette séquence d'acide nucléique codant un signal de terminaison de la transcription ou de polyadénylation est une séquence codant tout ou partie d'un signal de poyadenylation de faible efficacité tel que le signal de polyadénylation SV40 précoce ou tout autre signal de polyadénylation modifié de façon à en altérer l'efficacité, tel que défini plus haut. . Comme cela a été dit plus haut, on préfère que la lignée cellulaire soit constituée de cellules de mammifère.
La lignée cellulaire telle que décrite ici peut donc avantageusement comprendre en outre :
deux séquences d'acide nucléique codant chacune un site de reconnaissance d'une recombinase ;
au moins une séquence d'acide nucléique codant une protéine d'intérêt entre les 2 séquences codant chacune un site de reconnaissance d'une recombinase ; et
- au moins une séquence d'acide nucléique, codant un marqueur de sélection, de préférence un gène de résistance à un antibiotique, dépourvue de séquence de polyadénylation, située entre les deux séquences codant chacune un site de reconnaissance d'une recombinase, cette séquence codant pour un marqueur de sélection étant située directement en amont du site de reconnaissance d'une recombinase, lui même situé directement en amont de la séquence de polyadénylation faible précédemment décrite .
De préférence, et comme cela a été dit précédemment, l'ensemble des séquences mentionnées ci-dessus sont intégrées ensemble en une seule copie dans le génome des cellules de la lignée cellulaire. De manière plus préférée encore, chaque cellule de la lignée cellulaire présente une valeur pcd égale ou supérieure à 5, ou de manière préférée supérieure ou égale à 10.
La lignée cellulaire peut également, et ce de manière très préférée, surexprimer une protéine ou polypeptide d'intérêt choisi parmi le groupe des protéines ou polypeptides d'intérêt présentant une activité dans les fonctions digestive, pancréatique, biliaire, antivirale, anti-inflammatoire, pulmonaire, antimicrobiale, hématologique, neurologique, cardiovasculaire, ophtalmologique, antigénique, cérébrale, anti-tumorale, immunostimulante, et immunomodulatrice.
Selon un autre objet de la présente invention, la lignée cellulaire est celle identifiée par la référence YGM-1/10G10, et déposée sous le numéro de dépôt CNCM 1-3704 (lignée déposée à la CNCM, Collection Nationale de Cultures de Microorganismes, Institut Pasteur, 25 rue du Docteur Roux, , 75724 Paris Cedex 15, le 18 décembre 2006) .
Selon encore un autre objet de la présente invention, la lignée cellulaire est la lignée identifiée par la référence YGM-2/3G5, et déposée sous le numéro de dépôt CNCM 1-3885 ( (lignée déposée à la CNCM, Collection Nationale de Cultures de Microorganismes, Institut Pasteur, 25 rue du Docteur Roux, 75724 Paris Cedex 15, le 19 décembre 2007) .
Selon encore un autre objet de la présente invention, il est prévu une molécule d'acide nucléique isolée comprenant un fragment d'acide nucléique identifié par le numéro SEQ ID NO :1. Cette molécule représente ou indique un site de haute activité transcriptionnelle, et peut donc servir pour 1 ' intégration des autres séquences mentionnées ci-dessus . Il va de soi que la séquence SEQ ID NO :1 pourrait également servir, directement, ou de manière complémentaire, ou par hybridation, à créer un site de haute activité transcriptionnelle dans le génome d'une cellule appropriée. vCeci pourrait être effectué en passant par un vecteur comportant une séquence d'acide nucléique telle qu'identifiée dans le listage de séquences par le numéro SEQ ID NO : 1.
Selon encore un autre objet, particulièrement préféré, de la présente invention, on prévoit un procédé de production d'au moins une protéine ou polypeptide d'intérêt, caractérisé en ce qu'on met en culture une lignée cellulaire telle que décrite ci-dessus, de manière à exprimer ladite protéine ou polypeptide d'intérêt, suivi d'au moins une étape de récupération de ladite protéine d'intérêt. Les lignées cellulaires telles que celles décrites et identifiées par leur numéro de dépôt donné ci-dessus conviennent parfaitement à ce type de procédé. Dans ce cas, la protéine ou polypeptide d'intérêt est choisi de préférence parmi le groupe des protéines ou polypeptides d'intérêt présentant une activité dans les fonctions digestive, pancréatique, biliaire, antivirale, anti-inflammatoire, pulmonaire, antimicrobiale, hématologique, neurologique, cardiovasculaire, ophthalmologique, antigénique, cérébrale, anti-tumorale, immunostimulante, et immunomodulatrice. De manière encore plus préférée, la protéine ou polypeptide d'intérêt est un anticorps ou fragment d'anticorps.
FIGURES
Figure 1 : vecteur de ciblage pTVl
Figure 2 : vecteur d'expression de la recombinase pFlpe
Figure 3 : vecteur d'expression pTl25FRT
Figure 4 : vecteur T125-IG24
Figure 5 : schéma de délétion du vecteur de ciblage par la recombinase Flp
Figure 6 : schéma de réintégration du vecteur d'expression par la recombinase Flp
Description détaillée
Un premier objet de l'invention se rapporte à un procédé permettant d'insérer une molécule d'ADN d'intérêt au sein d'un site cible dans le génome d'une cellule de mammifère. Ce procédé comporte une première étape consistant en l'obtention d'une lignée cellulaire dans le génome de laquelle un site unique de reconnaissance d'une recombinase est intégré au sein d'une zone de forte activité transcriptionnelle. Cette première étape comprend les étapes suivantes : 1) L'intégration dans une cellule de mammifère d'un premier acide nucléique, appelé « vecteur de ciblage », contenant (i) deux séquences en tandem correspondant à des sites de reconnaissance d'une recombinase, entre lesquelles se trouvent un gène rapporteur, un gène codant une protéine similaire aux protéines d'intérêt, un gène de sélection permettant de réaliser une amplification génique et un gène de résistance à un antibiotique mais dépourvu de séquence de polyadénylation ; et (ii) un site de polyadénylation situé en aval du deuxième site de reconnaissance d'une recombinase, c'est à dire localisé en 5' du gène de résistance à un antibiotique ;
2) la sélection des cellules « fortement productrices » ayant intégré une copie unique du vecteur de ciblage ;
3) l'excision du vecteur de ciblage par l'action de la recombinase ; et
4) la sélection des cellules formant des lignées cellulaires qui ont excisé le vecteur de ciblage en ne conservant qu'un site unique et intègre de reconnaissance d'une recombinase.
Grâce au procédé de l'invention, les cellules formant des lignées cellulaires sélectionnées à l'étape 4) possèdent toutes un site unique de reconnaissance d'une recombinase intégré dans une zone de forte activité transcriptionnelle de leur génome.
Une des caractéristiques de la cellule de mammifère mise en œuvre dans l'étape 1) du procédé, est qu'elle ne comporte pas, avant sa modification par le procédé de l'invention, de séquence identique ou similaire à celle du site de reconnaissance d'une recombinase intégré par la mise en œuvre du procédé de l'invention. Par conséquent, le site de reconnaissance d'une recombinase intégré dans le génome des cellules de la lignée cellulaire de l'invention est unique, puisque aucune autre séquence identique n'est rencontrée dans le génome des cellules de cette lignée.
L'intégration d'un premier acide nucléique dans une cellule de mammifère, telle qu'elle est mise en œuvre dans l'étape 1) du procédé, peut être réalisée par tous les moyens connus de l'homme du métier. On peut citer à titre d'exemple la technique de précipitation au phosphate de calcium (CaPO4) , par laquelle I1ADN précipité va être « intégré » par les cellules via un processus de phagocytose ; ou bien la technique de lipofection, qui consiste à enrober l'ADN à insérer dans des vésicules de lipides pour permettre la fusion avec la membrane cellulaire de la cellule hôte. Une autre technique susceptible d'être mise en œuvre est la technique d'électroporation, qui permet à la cellule, via un choc électrique, d'intégrer l'ADN d'intérêt. Une autre technique peut être celle de la microinjection pronucléaire.
Le vecteur de ciblage utilisé dans la première étape du procédé de l'invention consiste en une molécule d'acide nucléique contenant deux sites de reconnaissance de recombinase. Ces sites sont identiques entre eux, et sont identiques au site unique présent dans la lignée cellulaire obtenue par la mise en œuvre du procédé de l'invention. Ces deux sites délimitent un fragment d'ADN qui contient un gène rapporteur, un gène codant une protéine similaire aux protéines d'intérêt, un gène de résistance à un antibiotique et un gène de sélection permettant une amplification génique. Le vecteur de ciblage comporte en outre toutes les séquences qui s'avèrent nécessaires pour permettre l'expression des gènes placés entre les deux sites de reconnaissance d'une recombinase. Parmi ces séquences nécessaires, on peut citer, de manière non limitative, les séquences promotrices, activatrices, et de polyadénylation par exemple.
L'intégration du vecteur de ciblage se produit de manière aléatoire dans le génome de la cellule transfectée. Le vecteur de ciblage pourra donc s ' intégrer dans des zones dépourvues d'activité transcriptionnelle, ou dans des zones possédant une activité transcriptionnelle faible, modérée ou élevée. Les lignées cellulaires ayant intégré le vecteur de ciblage dans une zone de forte activité transcriptionnelle sont sélectionnées en se fondant sur l'expression ou la surexpression d'un gène rapporteur.
L'expression de ce gène rapporteur, aisément visualisable et analysable, constitue un témoin capable de refléter l'importance de l'activité transcriptionnelle de l'environnement dans lequel ce gène rapporteur est placé : si l'activité transcriptionnelle dans la zone d'insertion est faible, l'activité du gène rapporteur sera faible. A contrario, si l'activité transcriptionnelle dans la zone d'insertion est forte, l'activité du gène rapporteur sera élevée.
Le gène codant pour une protéine similaire aux protéines d'intérêt, situé en aval du gène rapporteur, permet de déterminer la capacité de la cellule contenant les transgènes à sécréter les protéines, ce qui ne peut pas être déterminé avec une protéine fluorescente, dont l'expression est intracellulaire. Toute protéine susceptible d'être facilement détectable peut convenir pour cette application. Parmi les protéines utilisables dans le cadre de la présente invention, on peut par exemple citer, de façon non limitative, le produit des gènes d' immunoglobuline, les facteurs de croissance, les interleukines, les facteurs de stimulation, les kinases, les facteurs de coagulation, 1 'alpha-antitrypsine , et l'albumine.
Le gène de résistance à un antibiotique permet la sélection des cellules transformées comportant le vecteur de ciblage. La sélection est réalisée en plaçant les cellules transformées en contact avec l'antibiotique correspondant puisque seules les cellules ayant intégré le vecteur de ciblage ont la possibilité de survivre. Le gène de résistance à un antibiotique est suivi d'une séquence de polyadénylation (ou « polyA ») , qui joue un rôle important dans la stabilisation des ARNm correspondants (56-63) . Toute séquence de polyadénylation connue de l'homme du métier et permettant l'expression du gène de résistance à un antibiotique peut être utilisée, mais on utilise préférentiellement une séquence polyA de faible efficacité.
Avantageusement, cette séquence de polyadénylation est une séquence de polyadénylation faible, c'est-à-dire une séquence de polyadénylation présentant une faible efficacité. Par conséquent, si l'intégration du vecteur de ciblage se produit dans une zone de faible activité transcriptionnelle, le gène de résistance à un antibiotique ne sera pas exprimé de façon suffisante pour permettre la survie de la cellule exposée à l'antibiotique. Au contraire, si la zone d'intégration possède une forte activité transcriptionnelle, le caractère « faible » de la séquence de polyadénylation n'empêchera pas le gène de résistance de s'exprimer, et rendra les cellules correspondantes résistantes à l'antibiotique. L'utilisation d'une telle séquence de polyadénylation faible, notamment lorsque la pression de sélection est forte (à de fortes doses d'antibiotique), permet de diminuer sensiblement le nombre de clones à cribler et contribue à l'identification de clones susceptibles de constituer de forts « producteurs » de protéines d'intérêt.
A titre d'exemple de séquence de polyadénylation faible, on peut citer la séquence de polyadénylation précoce de SV40, « SV40 early polyadénylation signal », utilisée dans certains vecteurs d'expression commerciaux (64-65).
Avantageusement les cellules pourront être également sélectionnées pour leur résistance en présence d'une forte concentration d'antibiotique. La combinaison de ces deux outils de sélection, à savoir l'utilisation d'une séquence de polyadénylation de faible efficacité, et celle d'une forte concentration d'antibiotique dans le milieu, fait de ce mode de sélection un moyen particulièrement avantageux pour sélectionner les cellules dans lesquelles le transgène s'est intégré à l'endroit voulu, c'est-à-dire au niveau du site de reconnaissance de la recombinase, sans sélectionner les cellules dans lesquelles le site de reconnaissance de la recombinase s'est intégré dans une zone induisant une activité transcriptionnelle plus faible. En effet, le fait que la séquence de polyadénylation ne présente qu'une faible efficacité a pour effet que le gène de résistance à l'antibiotique situé directement en amont de ce site n'est que faiblement exprimé. Ainsi, si la concentration en antibiotique ajoutée dans le milieu est élevée (par exemple supérieure ou égale à lg/1, ou encore supérieure ou égale à 2g/l, ou à 4g/l, ou supérieure ou égale à 8g/1) , seules les cellules ayant intégré le transgène dans un zone permettant une expression suffisamment forte du gène de résistance à l'antibiotique, et ce malgré la faible efficacité de la séquence de polyadénayltion, survivent. Ce mode de sélection mettant en œuvre à la fois la faible efficacité de la séquence de polyadénylation et l'ajout d'une forte concentration en antibiotique dans le milieu de culture des cellules, a plusieurs avantages : il permet de cribler moins de clones, puisque les clones qui auront intégré le transgène ailleurs dans le génome qu'au niveau du site de reconnaissance à la recombinase meurent sous l'effet de la forte concentration en antibiotique présente dans le milieu. De plus les clones sélectionnés présentent de plus grandes capacités de production par rapport à un procédé de sélection effectué avec les procédés de l'art antérieur.
Avantageusement, le vecteur de ciblage est linéarisé par une enzyme de restriction préalablement à la transfection dans les cellules retenues. Afin de prévenir l'assemblage de plusieurs copies de vecteurs de ciblage avant l'étape d'intégration dans l'ADN génomique de la cellule, l'enzyme de restriction utilisée est choisie pour sa capacité à produire des extrémités franches. Par ailleurs, seules de faibles quantités de vecteur de ciblage sont utilisés pour réaliser la transfection. Ces précisions expérimentales permettent de limiter sensiblement le nombre de copies de vecteurs qui seront intégrées dans le génome de la cellule. En effet, il s'avère nécessaire, pour le bon déroulement de l'étape d'excision, que le vecteur de ciblage ne soit intégré qu'en copie unique au sein du génome de la cellule transfectée, de sorte que l'excision ultérieure ne pourra se produire qu'entre les deux sites de reconnaissance de la recombinase. Similairement , la bonne mise en œuvre du procédé de l'invention ne pourra être atteinte qu'à la condition qu'une seule zone de forte activité transcriptionnelle aura été ciblée.
Le vecteur de ciblage comporte par ailleurs une séquence de polyadénylation située en aval du deuxième site de reconnaissance d'une recombinase. Cette séquence de polyadénylation est destinée à être utilisée lors de l'intégration ultérieure d'un nouveau vecteur comportant le gène d'une protéine d'intérêt. Ainsi qu'il sera détaillé plus loin, cette séquence de polyadénylation permettra de sélectionner les cellules ayant intégré le deuxième vecteur au niveau du site de reconnaissance d'une recombinase. Avantageusement, cette séquence de polyadénylation présente une faible efficacité et peut être considérée comme une « séquence de polyadénylation faible ». Il s'agit par exemple de la séquence de polyadénylation précoce de SV40, « SV40 early polyadénylation signal ».
Avantageusement, le vecteur de ciblage comporte un gène permettant de procéder à un mécanisme d'amplification génique. Ce gène peut, par exemple, être le gène de la dihydrofolate réductase (ou DHFR) ou de la glutamine synthetase (GS) , des enzymes métaboliques essentielles à la survie cellulaire. Lorsque les cellules transfectées ayant intégré le vecteur de ciblage sont mises en culture en présence de doses croissantes d'un inhibiteur spécifique d'une des enzymes précitées (par exemple le méthotrexate pour la DHFR et la méthionine sulfoximine pour la GS) , seuls les clones ayant multiplié leur nombre de copies du vecteur et ayant ainsi augmenté l'expression de l'enzyme DHFR ou GS pourront survivre
(23, 30). Les taux d'amplification génique obtenus sont variables et dépendent essentiellement de la région du génome dans laquelle le vecteur s'est intégré. La zone d'intégration du vecteur de ciblage est donc sélectionnée en fonction de sa
« capacité d'amplification », afin de s'assurer de la possibilité ultérieure d'amplifier l'expression du transgène d' intérêt .
Par ailleurs, dans un autre mode de réalisation particulier de l'invention, le vecteur de ciblage comporte, entre les deux sites de reconnaissance d'une recombinase, le gène de la thymidine kinase du virus Herpès simplex de type I (HSVl-TK) . La sélection des cellules réalisée à l'étape 4) comprend alors l'ajout de ganciclovir dans le milieu de culture : les cellules n'ayant pas excisé le vecteur de ciblage seront tuées en présence de ganciclovir, alors que celles dont le vecteur de ciblage aura été excisé survivront. Il convient de noter que tout gène suicide utilisant une « prodrogue » pour devenir toxique, autre que HSVl-TK, peut être employé à cette étape. On peut citer, par exemple, les gènes CodA ou Fcy avec la prodrogue 5-Fluorocytosine (5-FC), cette liste n'étant pas limitative.
Le site de reconnaissance d'une recombinase utilisée dans le cadre de la présente invention peut correspondre à tout site connu de l'homme du métier. On peut citer, à titre d'exemple, le site loxP ou le site FRT. Dans un mode de réalisation de l'invention, les sites loxP et FRT sont utilisés simultanément. A titre d'exemple, ce mode de réalisation peut être utilisé pour insérer un vecteur d'expression, grâce à FRT, puis pour enlever le gène de sélection de ce vecteur après son intégration dans le génome, en utilisant loxP.
Le gène rapporteur codant pour une protéine similaire à une protéine d'intérêt peut correspondre à tout gène codant pour une protéine sécrétée similaire ou identique à une protéine d'intérêt thérapeutique ou industriel. On peut citer à titre d'exemple les gènes codant pour les anticorps, les facteurs de croissance, les interleukines , les facteurs de stimulation, les kinases, les facteurs de coagulation, l ' alpha- lantitrypsine ou l'albumine, cette liste n'étant pas limitative.
L'expression additionnelle d'une protéine similaire à une protéine d'intérêt en plus de la protéine codée par le gène rapporteur permet, dès l'étape 2), de sélectionner les cellules non seulement en fonction du taux d'expression du gène rapporteur, mais également en fonction des capacités sécrétrices de ces cellules.
Avantageusement, la protéine d'intérêt est un anticorps. Dans ce cas, il s'avère particulièrement avantageux de placer dans le vecteur les gènes codant pour la chaîne lourde et pour la chaîne légère dudit anticorps. Par ailleurs, si la protéine d'intérêt est un anticorps, il convient, lors de l'étape 2), de sélectionner les cellules capables de produire des anticorps en fonction du taux ou de la forme de glycosylation recherchés .
Avantageusement, la cellule de mammifère de départ utilisée pour la mise en œuvre du procédé de l'invention est choisie parmi : les lignées de myélomes de rat, notamment YB2/0 (ATCC CRL-1662, ref 59) et IR983F, les lignées de myélomes humains comme Namalwa ou toute autre cellule d'origine humaine comme PERC6, des lignées d'expression comme NSO, SP2/0, BHK, 293-HEK ou CHO, notamment CHO-K, CHO-LeclO, CHO-Lecl, CHO Pro-5, CHO dhfr- , CHO Lecl3, des lignées aviaires comme EBx (= lignée Vivalis) , des lignés mammaires ou encore d'autres lignées telles que Wil-2, Jurkat, Vero, Molt-4, COS-7, K6H6 et P3X63Ag8.653.
De manière particulièrement avantageuse, on choisit la lignée YB2 /0.
Lors de l'étape 2) de sélection des cellules fortement productrices, on sélectionne les cellules dont le taux de production de la protéine d'intérêt est supérieur à 5 pcd (pg de protéine/cellule/24 heures) . Avantageusement, le taux de production des cellules d'intérêt est supérieur à 10 pcd. De manière particulièrement avantageuse, le taux de production des cellules d'intérêt est supérieur à 15 pcd, et plus particulièrement à 20 pcd. Avantageusement, ce taux de production est compris entre 5 et 50 pcd, ou plus particulièrement entre 10 et 30 pcd.
L'estimation du nombre de copies intégrées dans la cellule de mammifère de départ peut être réalisée par toute technique connue de l'homme du métier. On peut citer à titre d'exemple la technique de PCR (Polymérisation Chain Reaction) quantitative .
Lors de l'étape d'excision du vecteur de ciblage (étape 3), la recombinase génère un événement de recombinaison au niveau de la paire de sites de reconnaissance d'une recombinase, et provoque l'excision du vecteur de ciblage hors du génome cellulaire, tandis qu'un site de reconnaissance d'une recombinase demeure dans le génome. Le mécanisme d'excision mis en œuvre dans le procédé de l'invention conduit à l'élimination des séquences nucléotidiques comprises entre les deux sites de reconnaissance d'une recombinase du vecteur de ciblage intégré. Le site de reconnaissance demeurant dans la zone de forte activité transcriptionnelle du génome conserve, pour sa part, la même orientation que les sites de reconnaissance initialement présents dans le vecteur de ciblage intégré. Par ailleurs, une séquence de polyadénylation demeure également dans la cellule de mammifère après l'excision du vecteur de ciblage, et se situe en aval du site restant de reconnaissance d'une recombinase. L'intégrité du site de reconnaissance de la recombinase demeurant dans les cellules pourra être contrôlée par toute technique connue de l'homme du métier. On peut citer à titre d'exemple les techniques de PCR (Polymérisation Chain Reaction) suivie d'un séquençage de 1 'ADN amplifié.
A titre d'exemple, la recombinase peut être exprimée dans la cellule par transfection transitoire d'un vecteur codant pour cette recombinase, avec lequel la cellule aurait été transfectée à l'issue de l'étape 2) .
Il convient de noter que si le site de reconnaissance d'une recombinase est le site loxP, la recombinase à utiliser est Cre. Au contraire, si le site de reconnaissance est FRT, la recombinase à utiliser est flp. Avantageusement, dans le cadre de la présente invention, la recombinase utilisée est Flpe, une recombinase dérivée de Flp, qui possède une activité supérieure à Flp dans les conditions de culture appliquées pour des cellules de mammifère (55) .
L'étape d'excision permet donc d'éliminer toutes les séquences actives susceptibles d'influencer l'expression ultérieure de futures protéines d'intérêt qui pourraient être insérées dans la zone de forte activité transcriptionnelle, par
1 ' intermédiaire de la séquence de recombinaison FRT persistante dans le génome des cellules transfectées . La lignée cellulaire obtenue après l'excision du vecteur de ciblage ne conserve donc plus aucun élément actif d'origine transgénique .
Les lignées cellulaires produites dans le cadre de la première étape du procédé de l'invention, qui comprennent un site unique de reconnaissance d'une recombinase intégré dans une zone de forte activité transcriptionnelle de leur génome
(« lignées cellulaires fortement productrices ») , peuvent être utilisées pour la production de n'importe quelle protéine d'intérêt. La production d'une telle protéine pourra être réalisée en ciblant ultérieurement le site unique de recombinaison avec un vecteur comportant les séquences nécessaires à la transcription d'une protéine d'intérêt portées par ce vecteur. Une telle utilisation de la lignée cellulaire fortement productrice de l ' invention sera explicitée plus loin.
Un autre objet de l'invention concerne un procédé tel que défini précédemment et comportant une autre étape (« étape de réintégration ») visant à insérer une molécule d'ADN d'intérêt dans une lignée cellulaire obtenue par la mise en œuvre de la première étape du procédé de l'invention. Cette deuxième étape comprend les étapes suivantes :
5) la transfection d'une lignée cellulaire obtenue à l'issue de l'étape 4) avec un vecteur d'expression comprenant un gène codant pour une protéine d'intérêt, un gène permettant une amplification génique et un gène de résistance à un antibiotique, dépourvu de séquence de polyadénylation, celui-ci étant localisé directement en amont d'un site de reconnaissance d'une recombinase;
6) l'insertion dudit vecteur d'expression au niveau du site unique de reconnaissance d'une recombinase, grâce à l'action de ladite recombinase ;
7) la sélection des cellules contenant le vecteur d'expression intégré au site cible en testant l'expression de la protéine d'intérêt. Avantageusement, la sélection sera réalisée en présence d'une forte dose d'antibiotique afin de défavoriser les intégrations aléatoires.
Le vecteur d'expression utilisé au cours de l'étape de réintégration du procédé comporte un gène codant pour une protéine d'intérêt, un gène permettant une amplification génique ainsi que toutes les séquences nécessaires pour permettre l'expression des séquences codantes présentes dans ce vecteur, c'est-à-dire des promoteurs, des activateurs (ou enhancers) et des séquences de polyadénylation. Ce vecteur d'expression comporte aussi un gène de résistance à un antibiotique avec son promoteur, dépourvu de séquence de polyadénylation, localisé directement en amont d'un site de reconnaissance d'une recombinase. Le gène de résistance à un antibiotique porté par ledit vecteur d'expression est, quant à lui, dépourvu de séquence de polyadénylation. Le gène de résistance à un antibiotique doit donc impérativement être situé à l'extrémité du vecteur afin de se placer directement en amont de la séquence de polyadénylation qui est demeurée dans le génome de la cellule après l'excision du vecteur de ciblage. Optionnellement, le gène de résistance à un antibiotique est le même que celui porté par le vecteur de ciblage. On peut alors réaliser l'étape de sélection des cellules en employant la même dose d'antibiotique que celle utilisée pour sélectionner les cellules fortement productrices à l'étape 2) .
L'étape de sélection s'effectue donc en plaçant les cellules en contact avec l'antibiotique correspondant au gène de résistance.
Sous l'action de la recombinase, le vecteur d'expression est intégré dans le génome des cellules au niveau du site de recombinaison unique qui persiste à l'issue de l'étape 4. Pour ce faire, le site de reconnaissance d'une recombinase présente sur le vecteur d'expression est identique à celui qui a été intégré dans le génome de la cellule au cours de la première partie du procédé.
Comme décrit précédemment, si le site de reconnaissance d'une recombinase est loxP, la recombinase utilisée sera Cre. Si le site de reconnaissance d'une recombinase est FRT, la recombinase utilisée sera FIp. Par ailleurs, tout moyen permettant l'action de la recombinase dans la cellule peut être mise en œuvre dans l'étape 6) du procédé de l'invention. A titre d'exemple, la recombinase peut être produite dans la cellule préalablement transfectée par l'intermédiaire d'un vecteur comportant un gène codant pour ladite recombinase.
Les cellules qui n'auront pas intégré le vecteur d'expression au niveau du site de reconnaissance d'une recombinase mourront, par conséquent, du fait des fortes doses d'antibiotique utilisées. En effet, le gène de résistance à l'antibiotique, qui ne dispose pas de séquence de polyadénylation en aval de sa séquence codante, ne pourra pas s'exprimer s'il n'est pas placé à proximité de la séquence de polyadénylation demeurée dans le génome des cellules à l'issu des étapes 3) et 4) .
Avantageusement, la protéine d'intérêt issue de l'expression de l'ADN d'intérêt présent dans le vecteur d'expression peut être n'importe quelle protéine d'intérêt industriel ou thérapeutique. Elle peut être choisie par exemple parmi les anticorps, les facteurs de la coagulation, les cytokines, les facteurs de croissance, les enzymes, les hormones, cette liste n'étant pas limitative. Par ailleurs, le gène codant pour la protéine d'intérêt peut être le même que celui porté par le vecteur de ciblage ou être un gène codant pour une protéine différente.
Un autre objet de l'invention concerne une lignée cellulaire comportant dans son génome un site unique de reconnaissance d'une recombinase intégré dans une zone de forte activité transcriptionnelle, ladite lignée cellulaire ayant intégré une copie unique d'un transgène au niveau dudit site de reconnaissance d'une recombinase, ladite lignée cellulaire étant stable dans le temps, et susceptible d'être obtenue à l'issue de l'étape 4) du procédé de l'invention.
Avantageusement, cette lignée est la lignée cellulaire YGM- 1/10G10, déposée le 18 Décembre 2006, sous le numéro de dépôt CNCM 1-3704, auprès de la Collection Nationale de Culture de Microorganismes (CNCM) . La lignée YGM-I/1OGlO est obtenue par la mise en œuvre du procédé de l'invention, en utilisant la cellule YB2/0 (ATCC CRL-1662) lors de l'étape 1) du procédé. Cette lignée cellulaire YGM-I/10G10 possède les caractéristiques suivantes : absence de séquences actives (promoteurs, gène de sélection, gène de résistance aux antibiotiques) , présence d'un site de reconnaissance d'une recombinase, stabilité des paramètres de culture et du site d'intégration. Par ailleurs, cette lignée cellulaire présente avantageusement un taux de production de la protéine d'intérêt supérieur à 5 pcd (pg de protéine/cellule/24 heures) . Avantageusement, le taux de production des cellules d'intérêt est supérieur à 10 pcά. De manière particulièrement avantageuse, le taux de production des cellules d'intérêt est supérieur à 15 pcd, et plus particulièrement à 20 pcd. Avantageusement, ce taux de production est compris entre 5 et 50 pcd, ou plus particulièrement entre 10 et 30 pcd.
Ainsi, un objet de l'invention est une nouvelle lignée d'expression YGM-1/10G10, libre de toute séquence transgénique active, dérivée de la lignée YB2/0, dans laquelle l'intégration du vecteur d'expression est contrôlée et dirigée dans une zone favorable à la transcription grâce à l'utilisation d'une recombinase.
Dans un autre mode de réalisation, cette lignée est la lignée cellulaire YGM-2/3G5, déposée le 19 Décembre 2007, sous le numéro de dépôt CNCM 1-3885, auprès de la Collection Nationale de Culture de Microorganismes (CNCM) . La lignée YGM-2/3G5 est obtenue par la mise en œuvre du procédé de l'invention, en utilisant la cellule YB2/0 (ATCC CRL-1662) lors de l'étape 1) du procédé. Cette lignée cellulaire YGM-2/3G5 possède les caractéristiques suivantes : absence de séquences actives
(promoteurs, gène de sélection, gène de résistance aux antibiotiques), présence d'un site de reconnaissance d'une recombinase, stabilité des paramètres de culture et du site d'intégration. Par ailleurs, cette lignée cellulaire présente avantageusement un taux de production de la protéine d'intérêt supérieur à 5 pcd (pg de protéine/cellule/24 heures) . Avantageusement, le taux de production des cellules d'intérêt est supérieur à 10 pcd. De manière particulièrement avantageuse, le taux de production des cellules d'intérêt est supérieur à 15 pcd, et plus particulièrement à 20 pcd. Avantageusement, ce taux de production est compris entre 5 et 50 pcd, ou plus particulièrement entre 10 et 30 pcd.
Ainsi, un autre objet de l'invention est une nouvelle lignée d'expression YGM-2/3G5, libre de toute séquence transgénique active, dérivée de la lignée YB2/0, dans laquelle l'intégration du vecteur d'expression est contrôlée et dirigée dans une zone favorable à la transcription grâce à l'utilisation d'une recombinase.
Les lignées YGM-I/1OGlO et YGM-2/3G5 présentent les caractéristiques et avantages suivants :
- Reproductibilité de l'expression, avec un niveau d'expression élevé et constant à chaque transfection grâce à l'intégration ciblée dans le même site ;
- Absence de séquences transgéniques actives (promoteurs, gènes de résistance, activateurs transcriptionnels) garantissant l'absence de modifications des caractéristiques de la lignée d'origine YB2/0 et plus de facilité d'utilisation lors de l'intégration ultérieure d'un vecteur d'expression d'une protéine d'intérêt ;
Gain de temps et de ressources grâce au faible nombre de transfectants à cribler ;
- Possibilité de pratiquer une étape d'amplification génique (par exemple, par l'intermédiaire d'un système de type dhfr- méthotrexate) grâce à la sélection d'un site d'intégration « amplifiable ».
Avantageusement, la lignée cellulaire obtenue par le procédé de l'invention est stable au cours du temps sur une période d'au moins 3 mois, soit environ 80 temps de doublement.
Un autre objet de l'invention concerne une molécule d'acide nucléique isolée de séquence SEQ ID NO :1 comprenant un fragment d'acide nucléique de séquence SEQ ID NO :4, ledit fragment étant capable d'augmenter l'expression d'une protéine d'intérêt recombinante lorsque ledit fragment d'acides nucléiques est incorporé dans un vecteur d'expression, ou la zone de forte activité transcriptionnelle comportant la séquence SEQ ID NO : 1 ou un fragment d'acide nucléique comprenant au moins 80% d'homologie avec la séquence SEQ ID
NO : 1, ledit fragment étant capable d'augmenter l'expression d'une protéine recombinante à laquelle on s'intéresse lorsque ledit fragment d'acides nucléiques est incorporé dans un vecteur d'expression.
La séquence d'acide nucléique correspondant à la molécule d'acide nucléique isolée de séquence SEQ ID NO : 1 comprenant un fragment d'acide nucléique capable d'augmenter l'expression d'une protéine d'intérêt recombinante lorsque ledit fragment d'acides nucléiques est incorporé dans un vecteur d'expression est la suivante :
1 TGGAAACAGA AACTAAATAG AGACATAGAG AAAATGAACA GAAGTTATGA
51 ACCAAATGGA TTTAACCGGT ATTTATACAA CATTTCATCT TAAΆACAAAA
101 GAATATACCT TCTTCTCAGC ACCTCATAGC CTCTTCTACN AAACCATATA
151 GTCGGTCACN AAACAAGCCT CAACAGATAC AAGAAGATAA AAATAATCCC
201 ATGCATACTA TCAGATCACC ATGGACTAAC TCTGGTCTTC AATAACAACA
251 AAAACAATGG AAGTCGAAGA ACACTCTATT CAΆTGATAAC TTGGTCAAGG
301 AAGAGATGAA AAAGGAAATT AAAGCCTTTT TAGAATTTCA TGAAAATGAA
351 GGCACAACAT ACCCAAACTT ATGAGACACA AGGAAAGCAG TGCTAAGAGG
401 AAAACTCATA GCTCTGAGTG CCTCCAAAAA GAAACAAGAG AGAGTGTATA
451 CTAGCAGCTT GAGAGCACAC CTGAAAGCTC TAGAACAAAA AGAAGCAAΆT
501 ACACCCAAGA GGAGAAGATC AAΆTGCAGGG CTGAAATCAA CCAAGTAGAA
551 ACAAAAGAAC TGTAAAAAGA ACCAACAAAA CCAGGAGTTG GTTGGTTGAG
601 AAAATCAAAA AGATAAATAA ACCCTTAΆTC AGAATAACCA GAGGGCACAG
651 AAACAGTATC CAAATTAACA AAATAAGAAA TGGAAAGGGA GACGTAAAAC
701 AGAATCCGAG GAAATAAAAA AAAATTGATC CTATTACAAA AGTCTATATT
751 CAACAAAGCT GGAAAATCTG GATGAAATAG ACAATTTTCT AGATAGATAC
801 CAGATACCAA AGTTAAATCA GGACCAGATA AATCATCTAA ACAGTCCCAT
851 AACTCCTAAA GAAATAGAAG CAGTTATTAA AATTCTCCCG ACCAAAAAAA
901 AAAAAAAAAA AAAGCCCAGG ATTGGATGGG TTTAGTGGAG AATTCTATCA
951 GACCTTCATC AAAGACCTAA TACCAATACT GTCCAΆACTA TTCCTTGCAA
1001 CACTGAATAT TCCGCATACA CTATTCACAG AAAAGCATCT TACGGATGGC
1051 ATGACAGTAA GAGAATTATG CAGTGCTGCC ATAACCATGA GTGATAACAC
1101 TGCGGCCAAC TTACTTCTGA CAACGATCGG AGGACCGAΆG GAGCTAACCG
1151 CTTTTTTGCA CAACATGGGG GATCATGTAA CTCGCCTTGA TCGTTGGGAA
1201 CCGGAGCTGA ATGAAGCCAT ACCAAACGAC GAGCGTGACA CCACGATGCC
1251 TGTAGCAATG GCAACAACGT TGCGCAAACT ATTAACTGGC GAACTACTTA 1301 CTCTAGCTTC CCGGCAACAA TTAATAGACT GGATGGAGGC GGATAAAGTT
1351 GCAGGACCAC TTCTGCGCTC GGCCCTTCCG GCTGGCTGGT TTATTGCTGA
1401 TAAATCTGGA GCCGGTGAGC GTGGGTCTCG CGGTATCATT GCAGCACTGG
1451 GGCCAGATGG TAAGCCCTCC CGTATCGTAG TTATCTACAC GACGGGGAGT 1501 CAGGCAACTA TGGATGAACG AAATAGACAG ATCGCTGAGA TAGGTGCCTC
1551 ACTGATTAAG CATTGGTAAC TGTCAGACCA AGTTTACTCA TATATACTTT
1601 AGATTGATTT AAAACTTCAT TTTTAATTTA AAAGGATCTA GGTGAAGATC
1651 CTTTTTGATA ATCTCATGAC CAAAATCCCT TAACGTGAGT TTTCGTTCCA
1701 CTGAGCGTCA GACCCCGTAG AAAAGATCAA AGGATCTTCT TGAGATCCTT 1751 TTTTTCTGCG CGTAATCTGC TGCTTGCAAA CAAAAAAACC ACCGCTACCA
1801 GCGGTGGTTT GTTTGCCGGA TCAAGAGCTA CCAACTCTTT TTCCGAAGGT
1851 AACTGGCTTC AGCAGAGCGC AGATACCAAA TACTGTCCTT CTAGTGTAGC
1901 CGTAGTTAGG CCACCACTTC AAGAACTCTG TAGCACCGCC TACATACCTC
1951 GCTCTGCTAA TCCTGTTACC AGTGGCTGCT GCCAGTGGCG ATAAGTCGTG 2001 TCTTACCGGG TTGGACTCAA GACGATAGTT ACCGGATAAG GCGCAGCGGT
2051 CGGGCTGAAC GGGGGGTTCG TGCACACAGC CCAGCTTGGA GCGAACGACC
2101 TACACCGAAC TGAGATACCT ACAGCGTGAG CTATGAGAAA GCGCCACGCT
2151 TCCCGAAGGG AGAAAGGCGG ACAGGTATCC GGTAAGCGGC AGGGTCGGAA
2201 CAGGAGAGCG CACGAGGGAG CTTCCAGGGG GAAACGCCTG GTATCTTTAT 2251 AGTCCTGTCG GGTTTCGCCA CCTCTGACTT GAGCGTCGAT TTTTGTGATG
2301 CTCGTCAGGG GGGCGGAGCC TATGGAAAAA CGCCAGCAAC GCGGCCTTTT 2351 TACGGTTCCT GGCCTTTTGC TGGCCTTTTG CTCACATGGC TCGACAGATC 2401 CATGTTCTTT CCTGCGTTAT CCCCTGATTC TGTGGATAAC CGTATTACCG 2451 CCTTTGAGTG AGCTGATACC GCTCGCCGCA GCCGAACGAC CGAGCGCAGC 2501 GAGTCAGTGA GCGAGGAAGC GGAAGAGCGC CTGATGCGGT ATTTTCTCCT
2551 TACGCATCTG TGCGGTATTT CACACCGCAT ATGGTGCACT CTCAGTACAA
2601 TCTGCTCTGA TGCCGCATAG TTAAGCCAGA GAAGTACCTA TTCCGAAGTT
2651 CCTATTCTCT AGAAAGTATA GGAACTTCTC ATGTTCTTTC CTGCGTTATC
2701 CCCTGATTCT GTGGATAACC GTATTACCGC CTTTGAGTGA GCTGATACCG 2751 CTCGCCGCAG CCGAACGACC GAGCGCAGCG AGTCAGTGAG CGAGGAAGCG
2801 GAAGAGCGCC TGATGCGGTA TTTTCTCCTT ACGCATCTGT GCGGTATTTC
2851 ACACCGCATA TGGTGCACTC TCAGTACAAT CTGCTCTGAT GCCGCATAGT
2901 TAAGCCAGCT AGAGGATCAT AATCAGCCAT ACCACATTTG TAGAGGTTTT
2951 ACTTGCTTTA AAAAACCTCC CACACCTCCC CCTGAACCTG AAACATAAAA 3001 TGAATGCAAT TGTTGTTGTT AACTTGTTTA TTGCAGCTTA TAATGGTTAC
3051 AAATAAAGCA ATAGCATCAC AAATTTCACA AATAAAGCAT TTTTTTCACT
3101 GCATTCTAGT TGTGGTTTGT CCAAACTCAT CAATGTATCT TATCATGTCT 3151 GGATCCCCAG GAAGCTCCTC TGTGTCCTCA TAAACCCTAA CCTCCTCTAC
3201 TTGAGAGGAC ATTCCAATCA TAGGCTGCCC ATCCACCCTC TGTGTCCTCC
3251 TGTTAATTAG GTCACTTAAC AAAAAGGAAA TTGGGTAGGG GTTTTTCACA
3301 GACCGCTTTC TAAGGGTAAT TTTAAAATAT CTGGGAAGTC CCTTCCACTG
3351 CTGTGTTCCA GAAGTGTTGG TAAACAGCCC ACAAATGTCA ACAGCAGAAA
3401 CATACAAGCT GTCAGCTTTG CACAAGGGCC CAACACCCTG CTCATCAAGA
3451 AGCACTGTGG TTGCTGTGTT AGTAATGTGC AAAACAGGAG GCACATTTTC
3501 CCCACCTGTG TAGGTTCCAA AATATCTAGT GTTTTCATTT TTACTTGGAT
3551 CAGGAACCCA GCACTCCACT GGATAAGCAT TATCCTTATC CAAAACAGCC
3601 TTGTGGTCAG TGTTCATCTG CTGACTGTCA ACTGTAGCAT TTTTTGGGGT
3651 TACAGTTTGA GCAGGATATT TGGTCCTGTA GTTTGCTAAC ACACCCTGCA
3701 GCTCCAAAGG TTCCCCACCA ACAGCAAAAA AATGAAAATT TGACCCTTGA
3751 ATGGGTTTTC CAGCACCATT TTCATGAGTT TTTTGTGTCC CTGAATGCAA
3801 GTTTAACATA GCAGTTACCC CAATAACCTC AGTTTTAACA GTAACAGCTT
3851 CCCACATCAA AATATTTCCA CAGGTTAAGT CCTCATTTAA ATTAGGCAAA
3901 GGAATTCTTG AAGACGAAAG GGCCTCGTGA TACGCCTATT TTTATAGGTT
3951 AATGTCATGA TAATAATGGT TTCTTAGACG TCAGGTGGCA CTTTTCGGGG
4001 AAATGTGCGC GGAACCCCTA TTTGTTTATT TTTCTAAATA CATTCAAΆTA
4051 TGTATCCGCT CATGAGACAA TAACCCTGAT AAATGCTTCA ATAATATTGA
4101 AAAAGGAAGA GTATGAGTAT TCAACATTTC CGTGTCGCCC TTATTCCCTT
4151 TTTTGCGGCA TTTTGCCTTC CTGTTTTTGC TCACCCAGAA ACGCTGGTGA
4201 AΆGTAAAAGA TGCTGAAGAT CAGTTGGGTG CACGAGTGGG TTACATCGAA
4251 CTGGATCTCA ACAGCGGTAA GATCCTTGAG AGTTTTCGCC CCGAAGAACG
4301 TTTTCCAATG ATGAGCACTT TTAAAGTTCT GCTATGTGGC GCGGTATTAT
4351 CCCGTGTTGA CGCCGGGCAA GAGCAACTCG GTCGCCGCAT ACACTATTCT
4401 CAGAATGACT TGGTTGAGT
La molécule d'acide nucléique isolée de séquence SEQ ID NO : 1 comprenant un fragment d'acide nucléique capable d'augmenter l'expression d'une protéine d'intérêt recombinante lorsque ledit fragment d'acides nucléiques est incorporé dans un vecteur d'expression dont la séquence est présentée ci- dessus possède les caractéristiques suivantes (les positions sont données en fonction de la numérotation des nucléotides composant la séquence, laquelle numérotation est détaillée ci-dessus) :
de la position 1 à la position 1024 : séquence génomique ; de la position 2631 à la position 2678 : site Frt ; de la position 1025 à la position 4419 : séquence du vecteur de ciblage restant en place après délétion.
La séquence d'acide nucléique correspondant au fragment d'acide nucléique capable d'augmenter l'expression d'une protéine d'intérêt recombinante lorsque ledit fragment d'acides nucléiques est incorporé dans un vecteur d'expression est la suivante (SEQ ID NO : 4) :
1 TGGAAACAGA AACTAAΆTAG AGACATAGAG AAAATGAACA GAAGTTATGA 51 ACCAAATGGA TTTAACCGGT ATTTATACAA CATTTCATCT TAAAACAAAA 101 GAATATACCT TCTTCTCAGC ACCTCATAGC CTCTTCTACN AAACCATATA
151 GTCGGTCACN AAACAAGCCT CAACAGATAC AAGAAGATAA AAATAATCCC
201 ATGCATACTA TCAGATCACC ATGGACTAAC TCTGGTCTTC AATAACAACA 251 AAAACAATGG AAGTCGAAGA ACACTCTATT CAATGATAAC TTGGTCAAGG
301 AAGAGATGAA AAAGGAAATT AAAGCCTTTT TAGAATTTCA TGAAAATGAA 351 GGCACAACAT ACCCAAACTT ATGAGACACA AGGAAAGCAG TGCTAAGAGG
401 AAAACTCATA GCTCTGAGTG CCTCCAAAAA GAAACAAGAG AGAGTGTATA
451 CTAGCAGCTT GAGAGCACAC CTGAΆAGCTC TAGAACAAAA AGAAGCAΆAT 501 ACACCCAAGA GGAGAAGATC AAATGCAGGG CTGAAATCAA CCAAGTAGAΆ
551 ACAAAAGAAC TGTAAAAAGA ACCAACAAAA CCAGGAGTTG GTTGGTTGAG 601 AAAATCAAAA AGATAAATAΆ ACCCTTAATC AGAATAACCA GAGGGCACAG
651 AAACAGTATC CAAATTAACA AAATAAGAAA TGGAAAGGGA GACGTAAAAC
701 AGAATCCGAG GAAATAAAAA AAAATTGATC CTATTACAAA AGTCTATATT
751 CAACAAAGCT GGAAAATCTG GATGAAATAG ACAATTTTCT AGATAGATAC
801 CAGATACCAA AGTTAAATCA GGACCAGATA AATCATCTAA ACAGTCCCAT 851 AACTCCTAAA GAAATAGAAG CAGTTATTAA AATTCTCCCG ACCAAAAAAA
901 AAAAAAAAAA AAAGCCCAGG ATTGGATGGG TTTAGTGGAG AATTCTATCA
951 GACCTTCATC AAAGACCTAA TACCAATACT GTCCAAACTA TTCCTTGCAA
1001 CACTGAATAT TCCGCATACA CTAT Un autre objet de l'invention concerne un vecteur comportant la séquence d'acides nucléiques SEQ ID NO : 1.
Un autre objet de l'invention est une lignée cellulaire comportant dans son génome un site unique de reconnaissance de recombinase intégré dans une zone de forte activité transcriptionnelle, ladite lignée cellulaire ayant intégré une seule copie d'un transgène au niveau dudit site de reconnaissance de recombinase, ladite lignée cellulaire étant stable dans le temps, et susceptible d'être obtenue par le procédé de l'invention.
Une telle lignée comporte deux séquences en tandem correspondant à des sites de reconnaissance d'une recombinase de part et d'autre d'un gène codant pour une protéine d'intérêt et d'un gène de résistance à un antibiotique, se situant immédiatement en amont du site de reconnaissance d'une recombinase le plus en aval, la séquence de polyadénylation du gène de résistance à l'antibiotique se situant immédiatement en aval de ce site de reconnaissance à l'antibiotique.
Avantageusement, cette lignée cellulaire possède, avant amplification génique, une productivité dudit transgène comprise entre 5 et 50 pcd (pg de protéines/cellule/24h) .
Avantageusement, cette lignée cellulaire exprime ledit transgène de manière stable sur une période d'au moins 3 mois. Un autre objet de l'invention concerne un procédé de production de protéines d'intérêt, dans lequel on met en culture la lignée cellulaire de l'invention exprimant une protéine d'intérêt, de manière à exprimer ladite protéine d'intérêt, et à récupérer ladite protéine d'intérêt.
Un autre objet de l'invention est un vecteur pour l'insertion d'un ADN d'intérêt dans le génome d'une cellule de mammifère (« vecteur de ciblage ») , comportant deux sites de reconnaissance d'une recombinase situés de part et d'autre d'un gène rapporteur, d'un gène codant pour une protéine d'intérêt, d'un gène de sélection permettant l'amplification génique et d'un gène de résistance à un antibiotique, et une séquence de polyadénylation située en aval du deuxième site de reconnaissance d'une recombinase. Avantageusement, la séquence de polyadénylation du gène de résistance à l'antibiotique est un polyA faible. Ceci permet d'obtenir de meilleurs taux de production en sortie de criblage.
Avantageusement, ce vecteur comporte, entre les deux sites de reconnaissance de recombinase, un gène codant pour la thymidine kinase du virus Herpès simplex de type I (HSVl-TK) .
Un autre objet de l'invention se rapporte à un système de vecteurs pour l'insertion d'un ADN d'intérêt à un site cible dans le génome d'une cellule de mammifère, qui comprend au moins les constituants suivants :
un vecteur de ciblage tel que décrit précédemment, un vecteur d'expression comprenant un site de reconnaissance d'une recombinase, un gène codant pour une protéine d'intérêt et un gène de résistance à un antibiotique, le site de reconnaissance à la recombinase étant situé directement en aval du gène de résistance à l'antibiotique.
Un autre objet de l'invention concerne l'utilisation du système de vecteur précité dans un procédé pour insérer une molécule d'ADN d'intérêt au sein d'un site cible dans le génome d'une cellule de mammifère, comprenant les étapes suivantes :
la transfection d'une cellule de mammifère avec ledit vecteur de ciblage ;
- la sélection des cellules « fortement productrices » ayant intégré une seule copie du vecteur de ciblage ;
l'excision du vecteur de ciblage par l'action de la recombinase ;
- la sélection des cellules ayant excisé le vecteur de ciblage et possédant un site de reconnaissance intègre ;
- la transfection des cellules sélectionnées à l'étape 4) avec ledit vecteur d'expression ;
l'intégration du vecteur d'expression dans le site de reconnaissance intègre par l'action de la recombinase ;
la sélection des cellules contenant le vecteur d'expression intégré au site cible en testant l'expression de la protéine d'intérêt. Avantageusement, la sélection sera réalisée en présence d'une forte dose d'antibiotique afin de défavoriser les intégrations aléatoires . D'autres aspects et avantages de l'invention seront décrits dans les exemples qui suivent, qui doivent être considérés comme illustratifs et ne limitent pas l'étendue de l'invention.
EXEMPLES
Exemple 1 : Réalisation des vecteurs utilisés pour la fabrication de la lignée cellulaire dans laquelle un site unique de reconnaissance d'une recoπtbinase est intégré dans une zone de forte activité transcriptionnelle
a. Vecteur de ciblage pTVl (voir figure 1) :
- Unités de transcription : Le vecteur de ciblage pTVl a été construit (SEQ ID NO : 2) (Fig.l) qui contient les unités de transcription suivantes :
1- l'unité de transcription de maxFP-Green (gène rapporteur fluorescent) contenant dans l'ordre le promoteur minimum CMV (promoteur du gène précoce du cytomégalovirus humain sans sa partie activatrice ou enhancer) , le gène codant la protéine maxFP™-Green (Evrogen) et la séquence de polyadénylation (polyA) late polyA SV40 (virus simien 40),
2- l'unité de transcription d'une chaîne lourde d'anticorps anti-D contenant dans l'ordre un promoteur RSV (Long Terminal Repeat du Virus du Sarcome de Rous) , un intron artificiel issu du vecteur pCi-néo, la séquence de la chaîne lourde d' immunoglobuline anti-D et la séquence du polyA BGH (Bovine growth Hormone) ,
3- l'unité de transcription d'une chaîne légère d'anticorps anti-D contenant les mêmes éléments que l'unité de transcription de la chaîne lourde de l'anticorps à l'exception de la séquence de la chaîne légère d' immunoglobuline et la séquence du polyA BGH.
4- l'unité de transcription néo contenant le promoteur SV40, le gène de résistance à la néomycine et la séquence « early polyA SV40 » possédant une activité polyA « faible »,
5- l'unité de transcription DHFR (dihydrofolate réductase) contenant le promoteur SV40, le gène de sélection dhfr modifié par mutagénèse dirigée afin d'éliminer le site de restriction Seal (mutation silencieuse au niveau protéique) et son site de polyA,
6- l'unité de transcription HSVl-tk contenant le promoteur SV40, le gène suicide codant la thymidine kinase du virus Virus Herpès simplex de type 1 (HSVl-tk) et la séquence « early polyA SV40 ».
- Synthèse des sites de recombinaison Frt :
Les sites de recombinaison Frt sont synthétisés par PCR grâce aux amorces suivantes :
Amorces sens (SEQ ID No : 5) :
5 ' -ACAGCTGTCGACTGAAGTACCTATTCCGAAGTTCCTATTCTCTAGAAAGT-S '
Amorces antisens (SEQ ID No : 6) : 5 ' -CGTCCGGATATCTAAGATCTGAAGTTCCTATACTTTCTAGAGAATAGGAA-B '
Le produit de PCR obtenu contient le site Frt (en gras et italique) ainsi que des sites de restrictions (soulignés) permettant le clonage par la suite dans le vecteur de ciblage pTVl (SEQ ID No : 7) :
AGACGTCTCGACTGAAGTACCTATTCCGAAGTTCCTATTCTCTAGAAAGTATAGGAACTTC
Sali site Frt
AGATCTTAGATATCCGGACG BgIII EcoRV
Un premier site Frt (Frtl) a été clone en amont de l'unité de transcription maxFP-Green du vecteur pTVl . Un second Site Frt (Frt2) a été clone dans le même sens que Frtl entre le gène HSVl-tk et son site de polyadénylation « early polyA SV40 ».
La séquence d'acide nucléique correspondant au vecteur de ciblage pTVl est la suivante (SEQ ID NO : 2) :
1 GAAGTACCTA TTCCGAAGTT CCTATTCTCT AGAAAGTATA GGAACTTCTA
51 CAGAGATCCG CCCGCCCCGT TGACGCAAAT GGGCGGTAGG CGTGTACGGT
101 GGGAGGTCTA TATAAGCAGA GCTCGTTTAG TGAACCGTCA GATCACTAGA
151 AGCTTTATTG CGGTAGTTTA TCACAGTTAA ATTGCTAACG CAGTCAGTGC 201 TTCTGACACA ACAGTCTCGA ACTTAAGCTG CAGTGACTCT CTTAAGGTAG
251 CCTTGCAGAA GTTGGTCGTG AGGCACTGGG CAGGTAAGTA TCAAGGTTAC
301 AAGACAGGTT TAAGGAGACC AATAGAAACT GGGCTTGTCG AGACAGAGAA
351 GACTCTTGCG TTTCTGATAG GCACCTATTG GTCTTACTGA CATCCACTTT
401 GCCTTTCTCT CCACAGGTGT CCACTCCCAG TTCAATTACA GCTCTTAAGG 451 CTAGAGTGGG ATCCACCGGT CGCCACCATG GAGAGCGACG AGAGCGGCCT 501 GCCCGCCATG GAGATCGAGT GCCGCATCAC CGGCACCCTG AACGGCGTGG
551 AGTTCGAGCT GGTGGGCGGC GGAGAGGGCA CCCCCGAGCA GGGCCGCATG
601 ACCAACAAGA TGAAGAGCAC CAAAGGCGCC CTGACCTTCA GCCCCTACCT
651 GCTGAGCCAC GTGATGGGCT ACGGCTTCTA CCACTTCGGC ACCTACCCCA
701 GCGGCTACGA GAACCCCTTC CTGCACGCCA TCAACAACGG CGGCTACACC
751 AACACCCGCA TCGAGAAGTA CGAGGACGGC GGCGTGCTGC ACGTGAGCTT
801 CAGCTACCGC TACGAGGCCG GCCGCGTGAT CGGCGACTTC AAGGTGATGG
851 GCACCGGCTT CCCCGAGGAC AGCGTGATCT TCACCGACAA GATCATCCGC
901 AGCAACGCCA CCGTGGAGCA CCTGCACCCC ATGGGCGATA ACGATCTGGA
951 TGGCAGCTTC ACCCGCACCT TCAGCCTGCG CGACGGCGGC TACTACAGCT
1001 CCGTGGTGGA CAGCCACATG CACTTCAAGA GCGCCATCCA CCCCAGCATC
1051 CTGCAGAACG GGGGCCCCAT GTTCGCCTTC CGCCGCGTGG AGGAGGATCA
1101 CAGCAACACC GAGCTGGGCA TCGTGGAGTA CCAGCACGCC TTCAAGACCC
1151 CGGATGCAGA TGCCGGTGAA GAATAAAGCG GCCTAGGGAT AACAGGGTAA
1201 TGGCCGCGAC TCTAGATCAT AATCAGCCAT ACCACATTTG TAGAGGTTTT 1251 ACTTGCTTTA AAAAACCTCC CACACCTCCC CCTGAACCTG AAACATAAAA
1301 TGAATGCAAT TGTTGTTGTT AACTTGTTTA TTGCAGCTTA TAATGGTTAC
1351 AAATAAAGCA ATAGCATCAC AAATTTCACA AATAAΆGCAT TTTTTTCACT
1401 GCATTCTAGT TGTGGTTTGT CCAAACTCAT CAATGTATCT TAAGGCGTAA
1451 ATTGTAAGCG TTAATATTTT GTTAAAATTC GCGTTAAATT TTTGTTAAAT
1501 CAGCTCATTT TTTAACCAAT AGGCCGAAAT CGGCAAAATC CCTTATAAAT
1551 CAAAAGAATA GACCGAGATA GGGTTGAGTG TTGTTCCAGT TTGGAACAAG
1601 AGTCCACTAT TAAAGAACGT GGACTCCAAC GTCAAAGGGC GAAAAACCGT
1651 CTATCAGGGC GATGGCCCAC GATCTTAGAT ATCCGGACGT GGATCTCCCG
1701 ATCCCCTATG GTGCACTCTC AGTACAATCT GCTCTGATGC CGCATAGTTA
1751 AGCCAGTATC TGCTCCCTGC TTGTGTGTTG GAGGTCGCTG AGTAGTGCGC
1801 GAGCAAAATT TAAGCTACAA CAAGGCAAGG CTTGACCGAC AATTGCATGA
1851 AGAATCTGCT TAGGGTTAGG CGTTTTGCGC TGCTTCGCGA TGTACGGGCC
1901 AGATATACGC GTATCTGAGG GGACTAGGGT GTGTTTAGGC GAAAAGCGGG
1951 GCTTCGGTTG TACGCGGTTA GGAGTCCCCT CAGGATATAG TAGTTTCGCT
2001 TTTGCATAGG GAGGGGGAAA TGTAGTCTTA TGCAATACTC TTGTAGTCTT
2051 GCAACATGGT AACGATGAGT TAGCAACATG CCTTACAAGG AGAGAAAAAG
2101 CACCGTGCAT GCCGATTGGT GGAAGTAAGG TGGTACGATC GTGCCTTATT
2151 AGGAAGGCAA CAGACGGGTC TGACATGGAT TGGACGAACC ACTGAATTCC
2201 GCATTGCAGA GATATTGTAT TTAAGTGCCT AGCTCGATAC AATAAACGCC 2251 ATTTGACCAT TCACCACATT GGTGTGCACC TCCAAGCTTG GTACCGAGCT
2301 CGGATCCACT AGTGCAGAAG TTGGTCGTGA GGCACTGGGC AGGTAAGTAT 2351 CAAGGTTACA AGACAGGTTT AAGGAGACCA ATAGAAACTG GGCTTGTCGA
2401 GACAGAGAAG ACTCTTGCGT TTCTGATAGG CACCTATTGG TCTTACTGAC
2451 ATCCACTTTG CCTTTCTCTC CACAGGTGTC CACTCCCAGT TCAATTACAG
2501 CTCTTGCTAG TGCCGCCACC ATGGAGTTTG GGCTGAGCTG GGTTTTCCTC 2551 GTTGCTCTTT TAAGAGGTGT CCAGTGTCAG GTGCAGCTGG TGGAGTCTGG
2601 GGGAGGCGTG GTCCAGCCTG GGAGGTCCCT GAGACTCTCC TGTACAGCCT
2651 CTGGATTCAC CTTCAAAAAC TATGCTATGC ATTGGGTCCG CCAGGCTCCA
2701 GCCAAGGGGC TGGAGTGGGT GGCAACTATA TCATATGATG GAAGGAATAT
2751 ACAATATGCA GACTCCGTGA AGGGCCGATT CACCTTCTCC AGAGACAATT 2801 CTCAGGACAC CCTGTATCTG CAACTGAACA GCCTCAGACC GGAGGACACG
2851 GCTGTGTATT ACTGTGCGAG ACCCGTAAGA AGCCGATGGC TGCAATTAGG 2901 TCTTGAAGAT GCTTTTCATA TCTGGGGCCA GGGGACAATG GTCACCGTCT 2951 CTTCAGCCTC CACCAAGGGC CCATCGGTCT TCCCCCTGGC ACCCTCCTCC
3001 AAGAGCACCT CTGGGGGCAC AGCGGCCCTG GGCTGCCTGG TCAAGGACTA 3051 CTTCCCCGAA CCGGTGACGG TGTCGTGGAA CTCAGGCGCC CTGACCAGCG
3101 GCGTGCACAC CTTCCCGGCT GTCCTACAGT CCTCAGGACT CTACTCCCTC
3151 AGCAGCGTGG TGACCGTGCC CTCCAGCAGC TTGGGCACCC AGACCTACAT
3201 CTGCAACGTG AATCACAAGC CCAGCAACAC CAAGGTGGAC AAGAAAGTTG
3251 AGCCCAAATC TTGTGACAAA ACTCACACAT GCCCACCGTG CCCAGCACCT 3301 GAACTCCTGG GGGGACCGTC AGTCTTCCTC TTCCCCCCAA AACCCAAGGA
3351 CACCCTCATG ATCTCCCGGA CCCCTGAGGT CACATGCGTG GTGGTGGACG
3401 TGAGCCACGA AGACCCTGAG GTCAAGTTCA ACTGGTACGT GGACGGCGTG
3451 GAGGTGCATA ATGCCAAGAC AAAGCCGCGG GAGGAGCAGT ACAACAGCAC
3501 GTACCGTGTG GTCAGCGTCC TCACCGTCCT GCACCAGGAC TGGCTGAATG 3551 GCAAGGAGTA CAAGTGCAAG GTCTCCAACA AAGCCCTCCC AGCCCCCATC
3601 GAGAAAACCA TCTCCAAAGC CAAAGGGCAG CCCCGAGAAC CACAGGTGTA
3651 CACCCTGCCC CCATCCCGGG ATGAGCTGAC CAAGAACCAG GTCAGCCTGA
3701 CCTGCCTGGT CAAAGGCTTC TATCCCAGCG ACATCGCCGT GGAGTGGGAG
3751 AGCAATGGGC AGCCGGAGAA CAACTACAAG ACCACGCCTC CCGTGCTGGA 3801 CTCCGACGGC TCCTTCTTCC TCTACAGCAA GCTCACCGTG GACAAGAGCA
3851 GGTGGCAGCA GGGGAACGTC TTCTCATGCT CCGTGATGCA TGAGGCTCTG
3901 CACAACCACT ACACGCAGAA GAGCCTCTCC CTGTCTCCGG GTAAATGATA
3951 GTCTAGAGCT CGCTGATCAG CCTCGACTGT GCCTTCTAGT TGCCAGCCAT
4001 CTGTTGTTTG CCCCTCCCCC GTGCCTTCCT TGACCCTGGA AGGTGCCACT 4051 CCCACTGTCC TTTCCTAATA AAATGAGGAA ATTGCATCGC ATTGTCTGAG
4101 TAGGTGTCAT TCTATTCTGG GGGGTGGGGT GGGGCAGGAC AGCAAGGGGG
4151 AGGATTGGGA AGACAATAGC AGGCATGCTG GGGATGCGGT GGGCTCTATG 4201 GCTTCTGAGG CGGAAAGAAC CAGCTGGGGC TCGAGATCTC CCGATCCCCT
4251 ATGGTGCACT CTCAGTACAA TCTGCTCTGA TGCCGCATAG TTAAGCCAGT
4301 ATCTGCTCCC TGCTTGTGTG TTGGAGGTCG CTGAGTAGTG CGCGAGCAAA
4351 ATTTAAGCTA CAACAAGGCA AGGCTTGACC GACAATTGCA TGAAGAATCT 4401 GCTTAGGGTT AGGCGTTTTG CGCTGCTTCG CGATGTACGG GCCAGATATA
4451 CGCGTATCTG AGGGGACTAG GGTGTGTTTA GGCGAAAAGC GGGGCTTCGG
4501 TTGTACGCGG TTAGGAGTCC CCTCAGGATA TAGTAGTTTC GCTTTTGCAT
4551 AGGGAGGGGG AAATGTAGTC TTATGCAATA CTCTTGTAGT CTTGCAACAT
4601 GGTAACGATG AGTTAGCAAC ATGCCTTACA AGGAGAGAAA AAGCACCGTG 4651 CATGCCGATT GGTGGAAGTA AGGTGGTACG ATCGTGCCTT ATTAGGAAGG
4701 CAACAGACGG GTCTGACATG GATTGGACGA ACCACTGAAT TCCGCATTGC
4751 AGAGATATTG TATTTAAGTG CCTAGCTCGA TACAATAAAC GCCATTTGAC
4801 CATTCACCAC ATTGGTGTGC ACCTCCAAGC TTGGTACCGA GCTCGGATCC
4851 ACTAGTGCAG AAGTTGGTCG TGAGGCACTG GGCAGGTAAG TATCAAGGTT 4901 ACAAGACAGG TTTAAGGAGA CCAATAGAAA CTGGGCTTGT CGAGACAGAG
4951 AAGACTCTTG CGTTTCTGAT AGGCACCTAT TGGTCTTACT GACATCCACT
5001 TTGCCTTTCT CTCCACAGGT GTCCACTCCC AGTTCAATTA CAGCTCTTGC
5051 TAGTGCCGCC ACCATGAGGG TCCCCGCTCA GCTCCTGGGG CTCCTGCTGC
5101 TCTGGCTCCC AGGTGCCAGA TGTGCCATCC GGATGACCCA GTCTCCATCC 5151 TCATTCTCTG CATCTACAGG AGACAGAGTC ACCATCACTT GTCGGGCGAG
5201 ccAGGATATT CGGAACTATG TAGCCTGGTA TCAGCAAΆAA TCAGGGAAAG
5251 CCCCTAAATT CCTGATCTAT GCTGCTTCCA CTTTGCAAAG TGGGGTCCCA
5301 TCAAGGTTCA GCGGCAGTGG ATCTGGGACA GATTTCACTC TCACCATCAA
5351 CTCCCTGCAG TCTGAAGATT TTGCAACTTA TTACTGTCAA CAATATTACA 5401 ATTCTCCTCC GACCTTCGGC CAAGGGACCA GGGTGGAAAT CACGCGAACT
5451 GTGGCTGCAC CATCTGTCTT CATCTTCCCG CCATCTGATG AGCAGTTGAA
5501 ATCTGGAACT GCCTCTGTTG TGTGCCTGCT GAATAACTTC TATCCCAGAG
5551 AGGCCAAAGT ACAGTGGAAG GTGGATAACG CCCTCCAATC GGGTAACTCC
5601 CAGGAGAGTG TCACAGAGCA GGACAGCAAG GACAGCACCT ACAGCCTCAG 5651 CAGCACCCTG ACGCTGAGCA AAGCAGACTA CGAGAAACAC AAAGTCTACG
5701 CCTGCGAAGT CACCCATCAG GGCCTGAGCT CGCCCGTCAC AAAGAGCTTC
5751 AACAGGGGAG AGTGTTGATA GTCTAGAGCT CGCTGATCAG CCTCGACTGT
5801 GCCTTCTAGT TGCCAGCCAT CTGTTGTTTG CCCCTCCCCC GTGCCTTCCT
5851 TGACCCTGGA AGGTGCCACT CCCACTGTCC TTTCCTAATA AAATGAGGAA 5901 ATTGCATCGC ATTGTCTGAG TAGGTGTCAT TCTATTCTGG GGGGTGGGGT
5951 GGGGCAGGAC AGCAAGGGGG AGGATTGGGA AGACAATAGC AGGCATGCTG
6001 GGGATGCGGT GGGCTCTATG GCTTCTGAGG CGGAAAGAAC CAGTCGAGGG 6051 GGGATCCCCA CGCGCCCTGT AGCGGCGCAT TAAGCGCGGC GGGTGTGGTG
6101 GTTACGCGCA GCGTGACCGC TACACTTGCC AGCGCCCTAG CGCCCGCTCC
6151 TTTCGCTTTC TTCCCTTCCT TTCTCGCCAC GTTCGCCGGC TTTCCCCGTC
6201 AAGCTCTAAA TCGGGGCATC CCTTTAGGGT TCCGATTTAG TGCTTTACGG 6251 CACCTCGACC CCAAAAAACT TGATTAGGGT GATGGTTCAC GTATAGGGAT
6301 AACAGGGTAA TGTAGTGGGC CATCGCCCTG ATAGACGGTT TTTCGCCCTT
6351 TGACGTTGGA GTCCACGTTC TTTAATAGTG GACTCTTGTT CCAAACTGGA
6401 ACAACACTCA ACCCTATCTC GGTCTATTCT TTTGATTTAT AAGGGATTTT
6451 GGGGATTTCG GCCTATTGGT TAAAAAATGA GCTGATTTAA CAAAAATTTA 6501 ACGCGAATTT TAACAAAATA TTAACGTTTA CAATTTAAAT ATTTGCTTAT
6551 ACAATCTTCC TGTTTTTGGG GCTTTTCTGA TTATCAACCG GGGTGGGTAC
6601 CGAGCTCGAA TTCTGTGGAA TGTGTGTCAG TTAGGGTGTG GAAAGTCCCC
6651 AGGCTCCCCA GGCAGGCAGA AGTATGCAAA GCATGCATCT CAATTAGTCA
6701 GCAACCAGGT GTGGAAAGTC CCCAGGCTCC CCAGCAGGCA GAAGTATGCA 6751 AAGCATGCAT CTCAATTAGT CAGCAACCAT AGTCCCGCCC CTAACTCCGC
6801 CCATCCCGCC CCTAACTCCG CCCAGTTCCG CCCATTCTCC GCCCCATGGC
6851 TGACTAATTT TTTTTATTTA TGCAGAGGCC GAGGCCGCCT CGGCCTCTGA
6901 GCTATTCCAG AAGTAGTGAG GAGGCTTTTT TGGAGGCCTA GGCTTTTGCA
6951 AAAAGCTCCC GGGAGCTTGG ATATCCATTT TCGGATCTGA TCAAGAGACA 7001 GGATGAGGAT CGTTTCGCAT GATTGAACAA GATGGATTGC ACGCAGGTTC
7051 TCCGGCCGCT TGGGTGGAGA GGCTATTCGG CTATGACTGG GCACAACAGA
7101 CAATCGGCTG CTCTGATGCC GCCGTGTTCC GGCTGTCAGC GCAGGGGCGC
7151 CCGGTTCTTT TTGTCAAGAC CGACCTGTCC GGTGCCCTGA ATGAACTGCA
7201 GGACGAGGCA GCGCGGCTAT CGTGGCTGGC CACGACGGGC GTTCCTTGCG 7251 CAGCTGTGCT CGACGTTGTC ACTGAAGCGG GAAGGGACTG GCTGCTATTG
7301 GGCGAAGTGC CGGGGCAGGA TCTCCTGTCA TCTCACCTTG CTCCTGCCGA
7351 GAAAGTATCC ATCATGGCTG ATGCAATGCG GCGGCTGCAT ACGCTTGATC
7401 CGGCTACCTG CCCATTCGAC CACCAAGCGA AACATCGCAT CGAGCGAGCA
7451 CGTACTCGGA TGGAAGCCGG TCTTGTCGAT CAGGATGATC TGGACGAAGA 7501 GCATCAGGGG CTCGCGCCAG CCGAACTGTT CGCCAGGCTC AAGGCGCGCA
7551 TGCCCGACGG CGAGGATCTC GTCGTGACCC ATGGCGATGC CTGCTTGCCG
7601 AATATCATGG TGGAAAATGG CCGCTTTTCT GGATTCATCG ACTGTGGCCG
7651 GCTGGGTGTG GCGGACCGCT ATCAGGACAT AGCGTTGGCT ACCCGTGATA
7701 TTGCTGAAGA GCTTGGCGGC GAATGGGCTG ACCGCTTCCT CGTGCTTTAC 7751 GGTATCGCCG CTCCCGATTC GCAGCGCATC GCCTTCTATC GCCTTCTTGA
7801 CGAGTTCTTC TGAGCGGGAC TCTGGGGTTC GAAATGACCG ACCAAGCGAC
7851 GCCCAACCTG CCATCACGAG ATTTCGATTC CACCGCCGCC TTCTATGAAA 7901 GGTTGGGCTT CGGAATCGTT TTCCGGGACG CCGGCTGGAT GATCCTCCAG
7951 CGCGGGGATC TCATGCTGGA GTTCTTCGCC CACCCCAACT TGTTTATTGC
8001 AGCTTATAAT GGTTACAAAT AAAGCAATAG CATCACAAAT TTCACAAATA
8051 AAGCATTTTT TTCACTGCAT TCTAGTTGTG GTTTGTCCAA ACTCATCAAT 8101 GTATCTTATC ATGTCTGGAT CCCGTCGAGT TTAAACGATT TAAATACTGG
8151 GGCTCGACTG TGGAATGTGT GTCAGTTAGG GTGTGGAAAG TCCCCAGGCT
8201 ccccAGCAGG CAGAAGTATG CAAAGCATGC ATCTCAATTA GTCAGCAACC
8251 AGGTGTGGAA AGTCCCCAGG CTCCCCAGCA GGCAGAAGTA TGCAAAGCAT
8301 GCATCTCAAT TAGTCAGCAA CCATAGTCCC GCCCCTAACT CCGCCCATCC 8351 CGCCCCTAAC TCCGCCCAGT TCCGCCCATT CTCCGCCCCA TGGCTGACTA
8401 ATTTTTTTTA TTTATGCAGA GGCCGAGGCC GCCTCGGCCT CTGAGCTATT
8451 CCAGAAGTAG TGAGGAGGCT TTTTTGGAGG CCTAGGCTTT TGCAAAAAGC
8501 TTGGGGGGGG GGACAGCTCA GGGCTGCGAT TTCGCGCCAA ACTTGACGGC
8551 AATCCTAGCG TGAAGGCTGG TAGGATTTTA TCCCCGCTGC CATCATGGTT 8601 CGACCATTGA ACTGCATCGT CGCCGTGTCC CAAAATATGG GGATTGGCAA
8651 GAACGGAGAC CTACCCTGGC CTCCGCTCAG GAACGAGTTC AAGTATTTCC
8701 AAAGAATGAC CACAACCTCT TCAGTGGAAG GTAAACAGAA TCTGGTGATT
8751 ATGGGTAGGA AAACCTGGTT CTCCATTCCT GAGAAGAATC GACCTTTAAA
8801 GGACAGAATT AATATAGTTC TCAGTAGAGA ACTCAAAGAA CCACCACGAG 8851 GAGCTCATTT TCTTGCCAAA AGTTTGGATG ATGCCTTAAG ACTTATTGAA
8901 CAACCGGAAT TGGCAAGTAA AGTAGACATG GTTTGGATAG TCGGAGGCAG
8951 TTCTGTTTAC CAGGAAGCCA TGAATCAACC AGGCCACCTC AGACTCTTTG
9001 TGACAAGGAT CATGCAGGAA TTTGAAAGTG ACACGTTTTT CCCAGAAATT
9051 GATTTGGGGA AATATAAACT TCTCCCAGAA TACCCAGGCG TCCTCTCTGA 9101 GGTCCAGGAG GAAAAAGGCA TCAAGTATAA GTTTGAAGTC TACGAGAAGA
9151 AAGACTAACA GGAAGATGCT TTCAAGTTCT CTGCTCCCCT CCTAAAGCTA
9201 TGCATTTTTA TAAGACCATG GGACTTTTGC TGGCTTTAGA TCGATCTTTG 9251 TGAAGGAACC TTACTTCTGT GGTGTGACAT AATTGGACAA ACTACCTACA
9301 GAGATTTAAA GCTCTAAGGT AAATATAAAA TTTTTAAGTG TATAATGTGT 9351 TAAACTACTG ATTCTAATTG TTTGTGTATT TTAGATTCCA ACCTATGGAA
9401 CTGATGAATG GGAGCAGTGG TGGAATGCCT TTAATGAGGA AAACCTGTTT
9451 TGCTCAGAAG AAATGCCATC TAGTGATGAT GAGGCTACTG CTGACTCTCA
9501 ACATTCTACT CCTCCAAAAA AGAAGAGAAA GGTAGAAGAC CCCAAGGACT
9551 TTCCTTCAGA ATTGCTAAGT TTTTTGAGTC ATGCTGTGTT TAGTAATAGA 9601 ACTCTTGCTT GCTTTGCTAT TTACACCACA AAGGAAAAAG CTGCACTGCT
9651 ATACAAGAAA ATTATGGAAA AATATTCTGT AACCTTTATA AGTAGGCATA
9701 ACAGTTATAA TCATAACATA CTGTTTTTTC TTACTCCACA CAGGCATAGA 9751 GTGTCTGCTA TTAATAACTA TGCTCAAAAA TTGTGTACCT TTAGCTTTTT
9801 AATTTGTAAA GGGGTTAATA AGGAATATTT GATGTATAGT GCCTTGACTA
9851 GAGATCATAA TCAGCCATAC CACATTTGTA GAGGTTTTAC TTGCTTTAAA
9901 AAACCTCCCA CACCTCCCCC TGAACCTGAA ACATAAAATG AATGCAATTG 9951 TTGTTGTTAA CTTGTTTATT GCAGCTTATA ATGGTTACAA ATAAAGCAAT ioooi AGCATCACAA ATTTCACAAA TAAAGCATTT TTTTCACTGC ATTCTAGTTG
10051 TGGTTTGTCG ACGCGGCCGC TGTGGAATGT GTGTCAGTTA GGGTGTGGAA
10101 AGTCCCCAGG CTCCCCAGCA GGCAGAAGTA TGCAAAGCAT GCATCTCAAT
10151 TAGTCAGCAA CCAGGTGTGG AAAGTCCCCA GGCTCCCCAG CAGGCAGAAG 10201 TATGCAAAGC ATGCATCTCA ATTAGTCAGC AACCATAGTC CCGCCCCTAA
10251 CTCCGCCCAT CCCGCCCCTA ACTCCGCCCA GTTCCGCCCA TTCTCCGCCC
10301 CATGGCTGAC TAATTTTTTT TATTTATGCA GAGGCCGAGG CCGCCTCGGC
10351 CTCTGAGCTA TTCCAGAAGT AGTGAGGAGG CTTTTTTGGA GGCCTAGGCT
10401 TTTGCAAAAA GCTCTGAGAT CACCGGCGAA GGAGGGCCAC CATGGCCTCG 10451 TACCCCGGCC ATCAACACGC GTCTGCGTTC GACCAGGCTG CGCGTTCTCG
10501 CGGCCATAGC AACCGACGTA CGGCGTTGCG CCCTCGCCGG CAGCAAGAAG
10551 CCACGGAAGT CCGCCCGGAG CAGAAAATGC CCACGCTACT GCGGGTTTAT
10601 ATAGACGGTC CCCACGGGAT GGGGAAAACC ACCACCACGC AACTGCTGGT
10651 GGCCCTGGGT TCGCGCGACG ATATCGTCTA CGTACCCGAG CCGATGACTT 10701 ACTGGCGGGT GCTGGGGGCT TCCGAGACAA TCGCGAACAT CTACACCACA
10751 CAACACCGCC TCGACCAGGG TGAGATATCG GCCGGGGACG CGGCGGTGGT
10801 AATGACAAGC GCCCAGATAA CAATGGGCAT GCCTTATGCC GTGACCGACG
10851 CCGTTCTGGC TCCTCATATC GGGGGGGAGG CTGGGAGCTC ACATGCCCCG
10901 CCCCCGGCCC TCACCCTCAT CTTCGACCGC CATCCCATCG CCGCCCTCCT 10951 GTGCTACCCG GCCGCGCGGT ACCTTATGGG CAGCATGACC CCCCAGGCCG
11001 TGCTGGCGTT CGTGGCCCTC ATCCCGCCGA CCTTGCCCGG CACCAACATC
11051 GTGCTTGGGG CCCTTCCGGA GGACAGACAC ATCGACCGCC TGGCCAAACG
11101 CCAGCGCCCC GGCGAGCGGC TGGACCTGGC TATGCTGGCT GCGATTCGCC
11151 GCGTTTACGG GCTACTTGCC AATACGGTGC GGTATCTGCA GTGCGGCGGG 11201 TCGTGGCGGG AGGACTGGGG ACAGCTTTCG GGGACGGCCG TGCCGCCCCA
11251 GGGTGCCGAG CCCCAGAGCA ACGCGGGCCC ACGACCCCAT ATCGGGGACA
11301 CGTTATTTAC CCTGTTTCGG GCCCCCGAGT TGCTGGCCCC CAACGGCGAC
11351 CTGTATAACG TGTTTGCCTG GGCCTTGGAC GTCTTGGCCA AACGCCTCCG
11401 TTCCATGCAC GTCTTTATCC TGGATTACGA CCAATCGCCC GCCGGCTGCC 11451 GGGACGCCCT GCTGCAACTT ACCTCCGGGA TGGTCCAGAC CCACGTCACC
11501 ACCCCCGGCT CCATACCGAC GATATGCGAC CTGGCGCGCA CGTTTGCCCG
11551 GGAGATGGGG GAGGCTAACT GAGAATTTCG ACTGAAGTAC CTATTCCGAA 11601 GTTCCTATTC TCTAGAAAGT ATAGGAACTT CTCATGTTCT TTCCTGCGTT
11651 ATCCCCTGAT TCTGTGGATA ACCGTATTAC CGCCTTTGAG TGAGCTGATA
11701 CCGCTCGCCG CAGCCGAACG ACCGAGCGCA GCGAGTCAGT GAGCGAGGAA
11751 GCGGAAGAGC GCCTGATGCG GTATTTTCTC CTTACGCATC TGTGCGGTAT 11801 TTCACACCGC ATATGGTGCA CTCTCAGTAC AATCTGCTCT GATGCCGCAT
11851 AGTTAAGCCA GCTAGAGGAT CATAATCAGC CATACCACAT TTGTAGAGGT
11901 TTTACTTGCT TTAAAAAACC TCCCACACCT CCCCCTGAAC CTGAAACATA
11951 AAATGAATGC AATTGTTGTT GTTAACTTGT TTATTGCAGC TTATAATGGT
12001 TACAAATAAA GCAATAGCAT CACAAATTTC ACAAATAAAG CATTTTTTTC 12051 ACTGCATTCT AGTTGTGGTT TGTCCAAACT CATCAATGTA TCTTATCATG
12101 TCTGGATCCC CAGGAAGCTC CTCTGTGTCC TCATAAACCC TAACCTCCTC
12151 TACTTGAGAG GACATTCCAA TCATAGGCTG CCCATCCACC CTCTGTGTCC
12201 TCCTGTTAAT TAGGTCACTT AACAAAAAGG AAATTGGGTA GGGGTTTTTC
12251 ACAGACCGCT TTCTAAGGGT AATTTTAAAA TATCTGGGAA GTCCCTTCCA 12301 CTGCTGTGTT CCAGAAGTGT TGGTAAACAG CCCACAAΆTG TCAACAGCAG
12351 AAACATACAA GCTGTCAGCT TTGCACAAGG GCCCAACACC CTGCTCATCA
12401 AGAAGCACTG TGGTTGCTGT GTTAGTAATG TGCAAAACAG GAGGCACATT
12451 TTCCCCACCT GTGTAGGTTC CAAAATATCT AGTGTTTTCA TTTTTACTTG
12501 GATCAGGAAC CCAGCACTCC ACTGGATAAG CATTATCCTT ATCCAAAACA 12551 GCCTTGTGGT CAGTGTTCAT CTGCTGACTG TCAACTGTAG CATTTTTTGG
12601 GGTTACAGTT TGAGCAGGAT ATTTGGTCCT GTAGTTTGCT AACACACCCT
12651 GCAGCTCCAA AGGTTCCCCA CCAACAGCAA AAAAATGAAA ATTTGACCCT
12701 TGAATGGGTT TTCCAGCACC ATTTTCATGA GTTTTTTGTG TCCCTGAATG
12751 CAAGTTTAAC ATAGCAGTTA CCCCAATAAC CTCAGTTTTA ACAGTAACAG 12801 CTTCCCACAT CAAAATATTT CCACAGGTTA AGTCCTCATT TAAATTAGGC
12851 AAAGGAATTC TTGAAGACGA AAGGGCCTCG TGATACGCCT ATTTTTATAG 12901 GTTAATGTCA TGATAATAAT GGTTTCTTAG ACGTCAGGTG GCACTTTTCG 12951 GGGAAATGTG CGCGGAACCC CTATTTGTTT ATTTTTCTAA ATACATTCAA
13001 ATATGTATCC GCTCATGAGA CAATAACCCT GATAAATGCT TCAATAATAT 13051 TGAAAAAGGA AGAGTATGAG TATTCAACAT TTCCGTGTCG CCCTTATTCC
13101 CTTTTTTGCG GCATTTTGCC TTCCTGTTTT TGCTCACCCA GAAACGCTGG
13151 TGAAAGTAAA AGATGCTGAA GATCAGTTGG GTGCACGAGT GGGTTACATC
13201 GAACTGGATC TCAACAGCGG TAAGATCCTT GAGAGTTTTC GCCCCGAAGA
13251 ACGTTTTCCA ATGATGAGCA CTTTTAAAGT TCTGCTATGT GGCGCGGTAT 13301 TATCCCGTGT TGACGCCGGG CAAGAGCAAC TCGGTCGCCG CATACACTAT
13351 TCTCAGAATG ACTTGGTTGA GTACTCACCA GTCACAGAAA AGCATCTTAC
13401 GGATGGCATG ACAGTAAGAG AATTATGCAG TGCTGCCATA ACCATGAGTG 13451 ATAACACTGC GGCCAACTTA CTTCTGACAA CGATCGGAGG ACCGAAGGAG
13501 CTAACCGCTT TTTTGCACAA CATGGGGGAT CATGTAACTC GCCTTGATCG
13551 TTGGGAACCG GAGCTGAATG AAGCCATACC AAACGACGAG CGTGACACCA
13601 CGATGCCTGT AGCAATGGCA ACAACGTTGC GCAAACTATT AACTGGCGAA
13651 CTACTTACTC TAGCTTCCCG GCAACAATTA ATAGACTGGA TGGAGGCGGA
13701 TAAAGTTGCA GGACCACTTC TGCGCTCGGC CCTTCCGGCT GGCTGGTTTA
13751 TTGCTGATAA ATCTGGAGCC GGTGAGCGTG GGTCTCGCGG TATCATTGCA
13801 GCACTGGGGC CAGATGGTAA GCCCTCCCGT ATCGTAGTTA TCTACACGAC
13851 GGGGAGTCAG GCAACTATGG ATGAACGAAA TAGACAGATC GCTGAGATAG
13901 GTGCCTCACT GATTAAGCAT TGGTAACTGT CAGACCAAGT TTACTCATAT
13951 ATACTTTAGA TTGATTTAAA ACTTCATTTT TAATTTAAAA GGATCTAGGT
14001 GAAGATCCTT TTTGATAATC TCATGACCAA AATCCCTTAA CGTGAGTTTT
14051 CGTTCCACTG AGCGTCAGAC CCCGTAGAAA AGATCAAAGG ATCTTCTTGA
14101 GATCCTTTTT TTCTGCGCGT AATCTGCTGC TTGCAAACAA AAAAACCACC
14151 GCTACCAGCG GTGGTTTGTT TGCCGGATCA AGAGCTACCA ACTCTTTTTC
14201 CGAAGGTAAC TGGCTTCAGC AGAGCGCAGA TACCAAATAC TGTCCTTCTA
14251 GTGTAGCCGT AGTTAGGCCA CCACTTCAAG AACTCTGTAG CACCGCCTAC
14301 ATACCTCGCT CTGCTAATCC TGTTACCAGT GGCTGCTGCC AGTGGCGATA
14351 AGTCGTGTCT TACCGGGTTG GACTCAΆGAC GATAGTTACC GGATAAGGCG
14401 CAGCGGTCGG GCTGAACGGG GGGTTCGTGC ACACAGCCCA GCTTGGAGCG
14451 AACGACCTAC ACCGAACTGA GATACCTACA GCGTGAGCTA TGAGAAAGCG
14501 CCACGCTTCC CGAAGGGAGA AAGGCGGACA GGTATCCGGT AAGCGGCAGG
14551 GTCGGAACAG GAGAGCGCAC GAGGGAGCTT CCAGGGGGAA ACGCCTGGTA
14601 TCTTTATAGT CCTGTCGGGT TTCGCCACCT CTGACTTGAG CGTCGATTTT
14651 TGTGATGCTC GTCAGGGGGG CGGAGCCTAT GGAAAAACGC CAGCAACGCG
14701 GCCTTTTTAC GGTTCCTGGC CTTTTGCTGG CCTTTTGCTC ACATGGCTCG
14751 ACAGATCCAT GTTCTTTCCT GCGTTATCCC CTGATTCTGT GGATAACCGT
14801 ATTACCGCCT TTGAGTGAGC TGATACCGCT CGCCGCAGCC GAACGACCGA
14851 GCGCAGCGAG TCAGTGAGCG AGGAAGCGGA AGAGCGCCTG ATGCGGTATT
14901 TTCTCCTTAC GCATCTGTGC GGTATTTCAC ACCGCATATG GTGCACTCTC
14951 AGTACAATCT GCTCTGATGC CGCATAGTTA AGCCAGA
Le vecteur de ciblage pTVl dont la séquence est présentée ci-dessus (SEQ ID NO: 2) possède les caractéristiques suivantes (les positions sont données en fonction de la numérotation des nucléotides composant la séquence, laquelle numérotation est détaillée ci-dessus) :
de la position 1 à la position 48 : site de recombinase FRT ; - de la position 63 à la position 144 : promoteur CMV minimum ;
- de la position 478 à la position 1176 : protéine maxFP- green ;
- de la position 1352 à la position 1402 : signal de polyadénylation SV40 late ;
- de la position 1888 à la position 2283 : LTR RSV ; de la position 2521 à la position 3951 : chaîne lourde (H) Ig anti-D ; de la position 3958 à la position 4184 : signal de polyadénylation bGH ;
- de la position 4431 à la position 4826 : LTR RSV ; de la position 5064 à la position 5771 : chaîne légère
Kapppa (K) Ig anti-D ; de la position 5778 à la position 6004 : signal de polyadénylation bGH ; de la position 6658 à la position 6983 : promoteur SV40 ; de la position 7019 à la position 7813 : séquence codante neo phosphotransférase ; de la position 7987 à la position 8117 : signal de polyadénylation précoce de SV40 (early polyA SV40) ;
- de la position 8301 à la position 8496 : promoteur SV40 ; de la position 8595 à la position 9158 : séquence codante DHFR ; de la position 9965 à la position 10019 : signal de polyadénylation SV40 late ; de la position 10092 à la position 10394 : promoteur SV40 ; de la position 10442 à la position 11572 : séquence codante HSV-TK ; de la position 11584 à la position 11631 : site de recombinase FRT ; de la position 11974 à la position 12104 : signal de polyadénylation précoce de SV40 (early polyA SV40) ; de la position 12996 à la position 13926 : gène de résistance à l 'ampicilline.
b. Vecteur pEFrat-FLPe (SEQ ID NO : 3, Fig. 2)
Le gène codant la recombinase FLPe a été amplifié par PCR à partir du vecteur pOG4-FLPe (55) avec les amorces suivantes :
Amorce sens (SEQ ID No : 8) :
5 ' -ATCTGGCTAGCCGCCACCATGCCACAATTTGATATATTAT-S
La séquence soulignée correspond au site de restriction Nhel . En gras est représenté le début de la partie codante du gène FLPe avec l'ATG initiateur en italique.
Amorces antisens (SEQ ID No : 9 ) :
5 ' - TGTCATCTAGATTAT2ΑTATGCGTCTATTTATGT-3 '
La séquence soulignée correspond au site de restriction Xbal . En gras est représenté la fin de la séquence codante du gène FLPe avec le codon STOP en italique. Le produit de PCR FLPe ainsi obtenu a été clone entre le promoteur EFl-alpha de rat et une séquence de polyadénylation bGH (bovine growth hormone) au niveau des sites Nhel et Xbal pour obtenir le vecteur d'expression final pEFrat-FLPe.
La séquence d'acide nucléique correspondant au vecteur pEFrat-FLPe est la suivante (SEQ ID NO : 3 ) :
1 GATCTCCAGG GACCGTCCCT AAATTCTCAC AGACCCAAAT CCCTGTAGCC
51 GCCCCACGAC AGCGCGAGGA GCATGCGCCC AGGGCTGAGC GCGGGTAGAT
101 CAGAGCACAC AAGCTCACAG TCCCCGGCGG TGGGGGGAGG GGCGCGCTGA
151 GCGGGGGCCA GGGAGCTGGC GCGGGGCAAA CTGGGAAAGT GGTGTCGTGT
201 GCTGGCTCCG CCCTCTTCCC GAGGGTGGGG GAGAACGGTA TATAAGTGCG
251 GTAGTCGCCT TGGACGTTCT TTTTCGCAAC GGGTTTGCCG TCAGAACGCA
301 GGTGAGTGGC GGGTGTGGCT TCCGCGGGCC CCGGAGCTGG AGCCCTGCTC
351 TGAGCGGGCC GGGCTGATAT GCGAGTGTCG TCCGCAGGGT TTAGCTGTGA
401 GCATTCCCAC TTCGAGTGGC GGGCGGTGCG GGGGTGAGAG TGCGAGGCCT
451 AGCGGCAACC CCGTAGCCTC GCCTCGTGTC CGGCTTGAGG CCTAGCGTGG
501 TGTCCGCCGC CGCGTGCCAC TCCGGCCGCA CTATGCGTTT TTTGTCCTTG
551 CTGCCCTCGA TTGCCTTCCA GCAGCATGGG CTAACAAAGG GAGGGTGTGG
601 GGCTCACTCT TAAGGAGCCC ATGAAGCTTA CGTTGGATAG GAATGGAAGG
651 GCAGGAGGGG CGACTGGGGC CCGCCCGCCT TCGGAGCACA TGTCCGACGC
701 CACCTGGATG GGGCGAGGCC TGTGGCTTTC CGAAGCAATC GGGCGTGAGT
751 TTAGCCTACC TGGGCCATGT GGCCCTAGCA CTGGGCACGG TCTGGCCTGG
801 CGGTGCCGCG TTCCCTTGCC TCCCAACAAG GGTGAGGCCG TCCCGCCCGG
851 CACCAGTTGC TTGCGCGGAA AGATGGCCGC TCCCGGGGCC CTGTTGCAAG
901 GAGCTCAAAA TGGAGGACGC GGCAGCCCGG TGGAGCGGGC GGGTGAGTCA
951 CCCACACAAA GGAAGAGGGC CTTGCCCCTC GCCGGCCGCT GCTTCCTGTG
1001 ACCCCGTGGT CTATCGGCCG CATAGTCACC TCGGGCTTCT CTTGAGCACC
1051 GCTCGTCGCG GCGGGGGGAG GGGATCTAAT GGCGTTGGAG TTTGTTCACA
1101 TTTGGTGGGT GGAGACTAGT CAGGCCAGCC TGGCGCTGGA AGTCATTCTT
1151 GGAATTTGCC CCTTTGAGTT TGGAGCGAGG CTAATTCTCA AGCCTCTTAG
1201 CGGTTCAAAG GTATTTTCTA AACCCGTTTC CAGGTGTTGT GAGCTAGCCG 1251 CCACCATGCC ACAATTTGAT ATATTATGTA AAACACCACC TAAGGTCCTG
1301 GTTCGTCAGT TTGTGGAAAG GTTTGAAAGA CCTTCAGGGG AAAAAATAGC
1351 ATCATGTGCT GCTGAACTAA CCTATTTATG TTGGATGATT ACTCATAACG
1401 GAACAGCAAT CAAGAGAGCC ACATTCATGA GCTATAATAC TATCATAAGC 1451 AATTCGCTGA GTTTCGATAT TGTCAACAAA TCACTCCAGT TTAAATACAA
1501 GACGCAAAAA GCAACAATTC TGGAAGCCTC ATTAAAGAAA TTAATTCCTG
1551 CTTGGGAATT TACAATTATT CCTTACAATG GACAAAAACA TCAATCTGAT
1601 ATCACTGATA TTGTAAGTAG TTTGCAATTA CAGTTCGAAT CATCGGAAGA 1651 AGCAGATAAG GGAAATAGCC ACAGTAAAAA AATGCTTAAA GCACTTCTAA 1701 GTGAGGGTGA AAGCATCTGG GAGATCACTG AGAAAATACT AAATTCGTTT
1751 GAGTATACCT CGAGATTTAC AAAAACAAAA ACTTTATACC AATTCCTCTT
1801 CCTAGCTACT TTCATCAATT GTGGAAGATT CAGCGATATT AAGAACGTTG
1851 ATCCGAAATC ATTTAAATTA GTCCAAAATA AGTATCTGGG AGTAATAATC
1901 CAGTGTTTAG TGACAGAGAC AAAGACAAGC GTTAGTAGGC ACATATACTT 1951 CTTTAGCGCA AGGGGTAGGA TCGATCCACT TGTATATTTG GATGAATTTT
2001 TGAGGAATTC TGAACCAGTC CTAAAACGAG TAAATAGGAC CGGCAATTCT
2051 TCAAGCAACA AACAGGAATA CCAATTATTA AAAGATAACT TAGTCAGATC
2101 GTACAACAAG GCTTTGAAGA AAAATGCGCC TTATCCAATC TTTGCTATAA
2151 AGAATGGCCC AAAATCTCAC ATTGGAAGAC ATTTGATGAC CTCATTTCTG 2201 TCAATGAAGG GCCTAACGGA GTTGACTAAT GTTGTGGGAA ATTGGAGCGA
2251 TAAGCGTGCT TCTGCCGTGG CCAGGACAAC GTATACTCAT CAGATAACAG
2301 CAATACCTGA TCACTACTTC GCACTAGTTT CTCGGTACTA TGCATATGAT
2351 CCAATATCAA AGGAAATGAT AGCATTGAAG GATGAGACTA ATCCAATTGA
2401 GGAGTGGCAG CATATAGAAC AGCTAAAGGG TAGTGCTGAA GGAAGCATAC 2451 GATACCCCGC ATGGAATGGG ATAATATCAC AGGAGGTACT AGACTACCTT
2501 TCATCCTACA TAAATAGACG CATATAATAA TCTAGAGCTC GCTGATCAGC
2551 CTCGACTGTG CCTTCTAGTT GCCAGCCATC TGTTGTTTGC CCCTCCCCCG
2601 TGCCTTCCTT GACCCTGGAA GGTGCCACTC CCACTGTCCT TTCCTAATAA
2651 AATGAGGAAA TTGCATCGCA TTGTCTGAGT AGGTGTCATT CTATTCTGGG 2701 GGGTGGGGTG GGGCAGGACA GCAAGGGGGA GGATTGGGAA GACAATAGCA
2751 GGCATGCTGG GGATGCGGTG GGCTCTATGG CTTCTGAGGC GGAAAGAACC
2801 AGCTGGGGCT CGAGGGGGGA TCCCGTCGAC CTCGAGAGCT TGGCGTAATC
2851 ATGGTCATAG CTGTTTCCTG TGTGAAATTG TTATCCGCTC ACAATTCCAC
2901 ACAACATACG AGCCGGAAGC ATAAAGTGTA AAGCCTGGGG TGCCTAATGA 2951 GTGAGCTAAC TCACATTAAT TGCGTTGCGC TCACTGCCCG CTTTCCAGTC
3001 GGGAAACCTG TCGTGCCAGC TGCATTAATG AATCGGCCAA CGCGCGGGGA
3051 GAGGCGGTTT GCGTATTGGG CGCTCTTCCG CTTCCTCGCT CACTGACTCG 3101 CTGCGCTCGG TCGTTCGGCT GCGGCGAGCG GTATCAGCTC ACTCAAAGGC
3151 GGTAATACGG TTATCCACAG AATCAGGGGA TAACGCAGGA AAGAACATGT
3201 GAGCAAAAGG CCAGCAAAAG GCCAGGAACC GTAAAAAGGC CGCGTTGCTG
3251 GCGTTTTTCC ATAGGCTCCG CCCCCCTGAC GAGCATCACA AAAATCGACG 3301 CTCAAGTCAG AGGTGGCGAA ACCCGACAGG ACTATAAAGA TACCAGGCGT
3351 TTCCCCCTGG AAGCTCCCTC GTGCGCTCTC CTGTTCCGAC CCTGCCGCTT
3401 ACCGGATACC TGTCCGCCTT TCTCCCTTCG GGAAGCGTGG CGCTTTCTCA
3451 ATGCTCACGC TGTAGGTATC TCAGTTCGGT GTAGGTCGTT CGCTCCAAGC
3501 TGGGCTGTGT GCACGAACCC CCCGTTCAGC CCGACCGCTG CGCCTTATCC 3551 GGTAACTATC GTCTTGAGTC CAACCCGGTA AGACACGACT TATCGCCACT
3601 GGCAGCAGCC ACTGGTAACA GGATTAGCAG AGCGAGGTAT GTAGGCGGTG
3651 CTACAGAGTT CTTGAAGTGG TGGCCTAACT ACGGCTACAC TAGAAGGACA
3701 GTATTTGGTA TCTGCGCTCT GCTGAAGCCA GTTACCTTCG GAAAAAGAGT
3751 TGGTAGCTCT TGATCCGGCA AACAAACCAC CGCTGGTAGC GGTGGTTTTT 3801 TTGTTTGCAA GCAGCAGATT ACGCGCAGAA AAAAAGGATC TCAAGAAGAT
3851 CCTTTGATCT TTTCTACGGG GTCTGACGCT CAGTGGAACG AAAΆCTCACG
3901 TTAAGGGATT TTGGTCATGA GATTATCAAA AAGGATCTTC ACCTAGATCC
3951 TTTTAAATTA AAAATGAAGT TTTAAATCAA TCTAAAGTAT ATATGAGTAA
4001 ACTTGGTCTG ACAGTTACCA ATGCTTAΆTC AGTGAGGCAC CTATCTCAGC 4051 GATCTGTCTA TTTCGTTCAT CCATAGTTGC CTGACTCCCC GTCGTGTAGA
4101 TAACTACGAT ACGGGAGGGC TTACCATCTG GCCCCAGTGC TGCAATGATA
4151 CCGCGAGACC CACGCTCACC GGCTCCAGAT TTATCAGCAA TAAACCAGCC
4201 AGCCGGAAGG GCCGAGCGCA GAAGTGGTCC TGCAACTTTA TCCGCCTCCA
4251 TCCAGTCTAT TAATTGTTGC CGGGAAGCTA GAGTAAGTAG TTCGCCAGTT 4301 AATAGTTTGC GCAACGTTGT TGCCATTGCT ACAGGCATCG TGGTGTCACG
4351 CTCGTCGTTT GGTATGGCTT CATTCAGCTC CGGTTCCCAA CGATCAAGGC
4401 GAGTTACATG ATCCCCCATG TTGTGCAAAA AAGCGGTTAG CTCCTTCGGT
4451 CCTCCGATCG TTGTCAGAAG TAAGTTGGCC GCAGTGTTAT CACTCATGGT
4501 TATGGCAGCA CTGCATAATT CTCTTACTGT CATGCCATCC GTAAGATGCT 4551 TTTCTGTGAC TGGTGAGTAC TCAACCAAGT CATTCTGAGA ATAGTGTATG
4601 CGGCGACCGA GTTGCTCTTG CCCGGCGTCA ATACGGGATA ATACCGCGCC
4651 ACATAGCAGA ACTTTAAAAG TGCTCATCAT TGGAAAACGT TCTTCGGGGC
4701 GAAAACTCTC AAGGATCTTA CCGCTGTTGA GATCCAGTTC GATGTAACCC
4751 ACTCGTGCAC CCAACTGATC TTCAGCATCT TTTACTTTCA CCAGCGTTTC 4801 TGGGTGAGCA AAAACAGGAA GGCAAAATGC CGCAAAAAAG GGAATAAGGG
4851 CGACACGGAA ATGTTGAATA CTCATACTCT TCCTTTTTCA ATATTATTGA
4901 AGCATTTATC AGGGTTATTG TCTCATGAGC GGATACATAT TTGAATGTAT 4951 TTAGAAAAAT AAACAAATAG GGGTTCCGCG CACATTTCCC CGAAAAGTGC 5001 CACCTGACGT CGACGGATCG GGA
Le vecteur pEFrat-FLPe dont la séquence est présentée ci- dessus (SEQ ID NO: 3) possède les caractéristiques suivantes
(les positions sont données en fonction de la numérotation des nucléotides composant la séquence, laquelle numérotation est détaillée ci-dessus) :
de la position 1 à la position 1243 : promoteur EF-lalpha rat ;
- de la position 1256 à la position 2527 : séquence codante Flpe ;
- de la position 2537 à la position 2763 : signal de polyadénylation bGH ; - de la position 3020 à la position 3543 : origine de réplication Col El ; de la position 4887 à la position 4027 : gène de résistance à l'ampicilline.
c. Vecteur de réintégration pT125-FRT (Fig. 3):
Le vecteur de réintégration pTl25-FRT est issu du vecteur T125-IG24 (Fig. 4) dans lequel les promoteurs CMV ont été remplacés par des promoteurs RSV et dans lequel la séquence de polyadénylation du gène de résistance à la néomycine à été enlevée et remplacée par un site Frt placé dans la même orientation que les sites Frt du vecteur pTVl .
Exemple 2 : Ciblage de zones à haute activité transcriptionnelle dans la lignée YB2/0 a. Transfection de la lignée YB2/0 par le vecteur pTVl
La lignée de rat YB2/0 (ATCC # CRL-1662) a été cultivée en milieu EMS (Invitrogen, réf. 041-95181M) contenant 5% de sérum de veau fœtal (SVF) . 5 millions de cellules ont été électroporées (électroporateur BioRad, modèle 1652077) en utilisant le kit de transfection Optibuffer (Thermo Electron) . Pour chaque transfection, 5μg de vecteur pTVl linéarisé par l'enzyme de restriction Seal ont été utilisés. Les conditions d'électroporation appliquées étaient de 230 volts et 950 microfarads dans une cuvette de 0,5ml. Le contenu de chaque cuvette d'électroporation a ensuite été réparti dans 10 plaques P96 avec une densité de 5000 cellules par puit. La mise en milieu sélectif a été réalisée 3 jours après la transfection dans du milieu EMS contenant 5% de SVF et 2mg/ml de G418 (Invitrogen, réf. 10131-027).
b. Criblage par fluorescence des clones résistants au G418
10 jours et 15 jours après la transfection, les clones résistants ont été criblés par fluorescence induite par la protéine maxFP™-Green (longueur d'onde d'excitation 482nm, émission 502nm) . Une première lecture a été effectuée sur tous les clones résistants dans un lecteur de plaques à fluorescence (VICTOR3 , Perkin Elmer) . Tous les clones positifs en fluorescence ont alors été testés par cytométrie en flux afin de vérifier l'intensité de fluorescence propre à chaque cellule et l'homogénéité des clones. Les résultats ont été analysés sur le logiciel libre WinMDI 2.8 (http: //facs .scripps . edu) . Tous les clones présentant un pic de fluorescence homogène et une intensité moyenne de fluorescence (MFI) supérieure à 500 ont été conservés et passés en plaques P24 pour amplification.
c. Criblage par ELISA et détermination du nombre de copies
Les cellules ont été entretenues en plaques P24 et leur surnageant a été dosé en ELISA afin d'estimer leur productivité en anticorps Anti-D. Tous les clones présentant une productivité supérieure à 10 pcd (picogrammes/cellule/24h) ont alors été testés en PCR semi-quantitative afin d'estimer le nombre de copies du vecteur pTVl . L'estimation du nombre de copie du vecteur pTVl a été réalisée dans un appareil ABI PRISM® 7000 avec comme témoin normalisateur une PCR sur les séquences LINE (séquences répétées présentant en nombre stable dans les clones obtenus à partir de la lignée YB2/0) . Les clones estimés à une seule copie ont alors été testés en Southern blot pour confirmation du nombre de copie.
d. Test d'amplification génique au méthotrexate (MTX)
Des tests d'amplification génique au MTX (sigma, réf. M8407) ont été réalisés sur les clones forts producteurs à copie unique afin de déterminer les capacités d'amplification du locus ciblé par le vecteur pTVl . Pour cela, des doses de MTX supérieures ou égales à 25 nM ont été ajoutées au milieu EMS, 5% SVF. Après 15 jours de culture en milieu sélectif, les clones résistants ont été testés en ELISA afin de vérifier l'augmentation de productivité et en PCR quantitative afin de déterminer l'augmentation du nombre de copie. La productivité du clone 3G11 (9,7 pcd) a été ainsi augmentée à 22 pcd après un seul cycle amplification. De même la productivité du cloxde 35H4 (11,4 pcd) est augmentée d'environ 3 fois après un cycle d'amplification.
Exemple 3 : Excision du vecteur de ciblage pTVl par action de la recombinase FLPe, obtention des lignées YGM-1/10G10 et YGM- 2/3G5 (Fig. 5)
• Lignée -YGM-I/1OGlO
Les clones 8AlO et 3G11, forts producteurs (6,6 pcd et 9 , 7 pcd respectivement sans amplification) à copie unique de vecteur pTVl ont été sélectionnés pour générer une lignée YGM par délétion du vecteur de ciblage.
Le clone 8AlO a été tout d'abord amplifié dans des flasques T75 en milieu EMS, 5% SVF, 2mg/ml G418 . La veille de la transfection, le G418 a été retiré de la culture.
5μg du vecteur pEFrat-FLPe non linéarisé dilué dans 175μl d'EMS sans sérum et 25μl de Superfect ont été incubés à température ambiante 10 minutes puis mélangés avec 1ml d'EMS, 5% SVF. Ce mélange a été rajouté à 2xlO6 cellules préalablement lavées en PBS et diluées à 2,5xlO5 cellules/ml dans du milieu EMS, 5% SVF. Après 4 heures d'incubation à 37°C, les cellules ont été passées en milieu EMS, 5% SVF.
Après 24 heures de culture, les cellules ont été réparties en plaques P96 à une densité de 5000 cellules par puit.
La mise en milieu sélectif a été réalisée 2 jours après la transfection dans du milieu EMS, 5% SVF contenant 4uM de Ganciclovir (Invivogen, réf. sud-gcv) .
Après 15 jours de culture, les clones survivants ont été testés pour l'absence de fluorescence en cytométrie de flux, pour l'absence de production d'immunoglobulines anti-D en ELISA et pour l'excision complète du vecteur pTVl en PCR avec les amorces suivantes :
5'pTVl (SEQ ID No : 10) : 5 ' -CCTATGGAAAAACGCCAGCAAC-3 '
3'pTVl (SEQ ID No : 11) : 5'-CCTTAGAAAGCGGTCTGTGAAA-S'
Parmi les clones excisés, le clone 10G10 a été sélectionné pour constituer la lignée d'expression YGM-1/10G10 et contrôlé pour la stabilité du site d'intégration sur une période de 3 mois .
• Lignée YGM-2/3G5
Dérivé du cloïde 35H4, fort producteur (11,4 pcd sans amplification) à copie unique de vecteur pTVl, le clone 35H4(1)2G2 (13,3 pcd) a été sélectionné pour générer une lignée YGM par délétion du vecteur de ciblage.
Le clone 35H4(1)2G2 a été tout d'abord amplifié dans des flasques T75 en milieu RPMI, 5% SVF, lmg/ml G418. Le G418 a été retiré de la culture deux repiquages avant la transfection.
25μg du vecteur pEFrat-FLPe non linéarisé dilué dans 500μl de RPMI sans sérum et 75μl de FuGene HD (Roche) ont été incubés à température ambiante 15 minutes. 120μl de ce mélange a été rajouté dans chaque puits de plaque P6 contenant 6x1O5 cellules/ml dans du milieu RPMI, 5% SVF. Après 24 heures de culture, les cellules ont été réparties en plaques P96 à une densité de 1000 cellules par puits.
La mise en milieu sélectif a été réalisée 3 jours après la transfection dans du milieu RPMI, 5% SVF contenant 4μM de Ganciclovir (Invivogen, réf. sud-gcv) .
Après 15 jours de culture, les clones survivants ont été testés pour l'absence de fluorescence en cytométrie de flux, pour l'absence de production d' immunoglobulines anti-D en ELISA et pour l'excision complète du vecteur pTVl en PCR avec les amorces suivantes :
DEL REV (SEQ ID No : 14): 5'-TGGTATGGCTGATTATGATCCTC-S'
DEL FOR 3 (SEQ ID No : 15): 5'-CCTTTTGCTCACATGGCTCGAC-S'
Parmi les clones excisés, le clone 35H4(2)3G5 a été sélectionné pour constituer la lignée d'expression YGM-2/3G5 et contrôlé pour la stabilité du site d'intégration sur une période de 3 mois .
Exemple 4 : Réintégration d'un vecteur d'expression dans les lignées YGM-1/10G10 et YGM-2/3G5 (Fig. 6)
• Lignée YGM-I/10G10
La réintégration d'un vecteur codant le même anticorps utilisé lors de l'étape de criblage (anticorps anti-D) a été réalisée afin de vérifier la reproductibilité des niveaux d'expression après réintégration dans le site Frt de YGM-I (clone 10G10) .
Le clone 10G10 obtenu après excision du vecteur de ciblage TVl et ne possédant dans son génome qu'un site de recombinaison Frt et une séquence de polyadénylation « early polyA SV40 » a été amplifié dans des flasques T75 en milieu EMS, 5% SVF.
Une cotransfection a été réalisée avec 10 μg du vecteur pEFrat-FLPe non linéarisé et 5 μg de vecteur de réintégration PT125-FRT non linéarisé. 5 millions de cellules ont été électroporées dans une cuvette de 0,5ml (électroporateur BioRad, modèle 1652077) en utilisant le kit de transfection Optibuffer (Thermo Eélectron) et en applicant les conditions suivantes : 230 volts et 950 microfarads.
Les cellules ont été ensuite réparties sur 10 plaques P96 à une densité de 5000 cellules par puit.
La mise en milieu sélectif a été réalisée 2 jours après la transfection dans du milieu EMS, 5% SVF contenant 2mg/ml de G418.
Après 15 jours de culture, les clones survivants ont été amplifiés en plaques P24 et criblés en PCR afin de vérifier la réintégration dans le site Frt de la lignée YGM-I.
Les amorces m5NEO-2 et SV40polyA-lrev ont été utilisées pour ce criblage :
Amorce m5NEO-2 (SEQ ID No 12 ) :
5 ' -GATGCCTGCTTGCCGAATA-3 '
Amorce SV40polγA-lrev (SEQD ID No : 13) :
5 ' -CCTTAGAAAGCGGTCTGTGAAA-3 '
Les clones présentant des intégrations aléatoires dans le génome de la lignée YGM-I ont été éliminés . Les clones ayant intégré le vecteur pTl25-FRT dans le site Frt de la lignée YGM-I ont alors été testés en ELISA afin d'évaluer leur productivité en anticorps Anti-D T125.
Le clone 21B10 (5.5 pcd) a été retenu pour vérifier la stabilité de la réintégration sur une période de 3 mois.
• Lignée YGM-2/3G5
La réintégration d'un vecteur codant le même anticorps utilisé lors de l'étape de criblage (anticorps anti-D) a été réalisée afin de vérifier la reproductibilité des niveaux d'expression après réintégration dans le site Frt de YGM-2 (clone 35H4(2)3G5) .
Le clone 35H4(2)3G5 obtenu après excision du vecteur de ciblage TVl et ne possédant dans son génome qu'un site de recombinaison Frt et une séquence de polyadénylation « early polyA SV40 » a été amplifié dans des flasques T75 en milieu RPMI, 5% SVF.
Une cotransfection a été réalisée avec 4 μg du vecteur pEFrat- FLPe non linéarisé et 2 μg de vecteur de réintégration pTl25- FRT non linéarisé.
Les deux vecteurs non linéarisés dilués dans 300μl de EMS sans sérum et 18μl de FuGene HD (Roche) ont été incubés à température ambiante 15 minutes. 75μl de ce mélange a été rajouté dans chaque puits de plaque P6 contenant βxlO5 cellules/ml dans du milieu EMS, 5% SVF. Après 24 heures de culture, les cellules ont été réparties en plaques P96 à une densité de 1000 cellules par puits.
Les cellules ont été ensuite réparties sur 10 plaques P96 à une densité de 1000 cellules par puits.
La mise en milieu sélectif a été réalisée 2 jours après la transfection dans du milieu EMS, 5% SVF contenant 3mg/ml de G418 .
Après 12 jours de culture, les clones survivants ont été amplifiés en plaques P24 et criblés en PCR afin de vérifier la réintégration dans le site Frt de la lignée YGM-2.
Les amorces suivantes ont été utilisées pour ce criblage :
Contrôle de l' intégration en 5' :
DEL FOR 3 (SEQ ID No : 15) : 5'- CCTTTTGCTCACATGGCTCGAC -3' 3FRT3 (SEQ ID No : 16) : 5'- TTGTCTCATGAGCGGATACA -3'
Contrôle de I7 intégration en 3' :
DEL REV (SEQ ID No : 14) : 5'- TGGTATGGCTGATTATGATCCTC -3' m-5-NEO-2 (SEQ ID No : 12) : 5'- GATGCCTGCTTGCCGAATA -3'
Grâce à ce criblage les transfectants résistants au G418 mais présentant des intégrations aléatoires dans le génome de la lignée YGM-2 ont été éliminés. Parmi les transfectants ayant intégré le vecteur pTl25-FRT dans le site Frt de la lignée YGM-2 les cloïdes 19Dl, 25E5, 30A5 et 20F11 ont été testés en ELISA afin d'évaluer leur productivité en anticorps Anti-D. Les productivités obtenues pour ces 4 clones (7,1 pcd; 7,0 pcd ; 7,1 pcd et 7,7 pcd, respectivement) sont homogènes et du même ordre de grandeur que celle observées pour le cloïde 35H4 ou le clone 35H4(1)2G2 parental (11,4 pcd et 13,3 pcd, respectivement) témoignant de l'intérêt de cette stratégie de ciblage pour l ' obtention de forts producteurs de façon reproductible. La stabilité génétique de ces cloïdes a été étudiée, après clonage, sur une période de 3 mois.
Exemple 5 s identification du site d'intégration de la lignée YGM-I (clone 10G10) par PCR-inverse
La caractérisation de la séquence du site d'intégration a été réalisée après amplification par PCR-inverse. Brièvement, l'ADN des clones 8AlO (contenant le vecteur de ciblage) ou 10G10 (lignée YGM-I délétée) a été digéré par différentes enzymes de restriction et les fragments de restriction obtenus ont été religaturés sur eux-même à l'aide d'une ligase T4. Des PCR-inverse ont été ensuite réalisées en utilisant des amorces dirigées en sens opposé et ancrées dans les séquences du vecteur de ciblage. Les produits de PCR ainsi obtenus présentent à leurs extrémités 5 ' et 3 ' des séquences issues du vecteur de ciblage et en leur centre une séquence inconnue de taille variable (en fonction de l'enzyme de restriction utilisée) correspondant à la région d'intégration directement adjacente au vecteur de ciblage. Le séquençage de ces différents produits de PCR permet ainsi d'obtenir la séquence du site d'intégration à forte activité transcriptionnelle (SEQ ID NO :1) .
Références
1. Baneyx F. and M. Mujacic. Recombinant protein folding and misfolding in Escherichia coli. Nat Biotech 22 (11):1399- 1408, 2004.
2. Makrides, S. C. 1996. Stratégies for achieving high-level expression of gènes in Escherichia coli. Microbiol . Rev 60:512.
3. Gasser, B., and D. Mattanovich. 2006. Antibody production with yeasts and filamentous fungi : on the road to large scale? Biotechnol Lett.
4. T. U. Gerngross . Advances in the production of human therapeutic proteins in yeasts and filamentous fungi . Nat Biotech 22 (11) : 1409-1414, 2004.
5. Smerdon, G. R., E. F. WaIton, and S. J. Aves . 1998. Stable production of human gastric lipase by chromosomal intégration in the fission yeast Schizosaccharomyces pombe. Appl . Microbiol . Biotechnol 49:45.
6. Hellwig, S., J. Drossard, R. M. Twyman, and R. Fischer. 2004. Plant cell cultures for the production of recombinant proteins. Nat Biotechnol 22:1415.
7. Miller, L. K. 1993. Baculoviruses : high-level expression in insect cells . Curr Opin Genêt. Dev 3:97.
8. McCaIl, E. J., A. Danielsson, I. M. Hardern, C. Dartsch, R.
Hicks, J. M. Wahlberg, and W. M. Abbott. 2005. Improvements to the throughput of recombinant protein expression in the baculovirus/insect cell System. Protein Expr. Purif. 42:29.
9. Schmidt, F. R. 2004. Recombinant expression Systems in the pharmaceutical industry. Appl Microbiol. Biotechnol 65:363.
10. Simonsen, C. C, and M. McGrogan. 1994. The molecular biology of production cell lines. Biologicals 22:85.
11. Geisse, S., H. Gram, B. Kleuser, and H. P. Kocher. 1996. Eukaryotic expression Systems: a comparison. Protein Expr. Purif. 8:271.
12. Bendig, M. M. 1988. The production of foreign proteins in mammalian cells . Genêt. Eng91.C.
13. Gorman and C. Bullock. Site-specific gène targeting for gène expression in eukaryotes . Curr Opin Biotechnol 11 (5) :455-460, 2000.
14. M. E. Reff . High-level production of recombinant immunoglobulins in mammalian cells. Curr Opin Biotechnol 4 (5) :573-576, 1993.
15. D. C. Andersen and L. Krummen. Recombinant protein expression for therapeutic applications. Curr Opin Biotechnol 13 (2) :117-123 , 2002.
16. R. J. Kaufman. Use of recombinant DNA technology for engineering mammalian cells to produce proteins . Bioprocess Technol 10:15-69, 1990.
17. R. J. Kaufman. Overview of vector design for mammalian gène expression. Mol .Biotechnol 16 (2):151-160, 2000.
18. Lucas, B. K., L. M. Giere, R. A. DeMarco, A. Shen, V. Chisholm, and C. W. Crowley. 1996. High-level production of recombinant proteins in CHO cells using a dicistronic DHFR intron expression vector. Nucl . Acids Res . 24:1774.
19. F. Hesse and R. Wagner. Developments and improvements in the manufacturing of human therapeutics with mammalian cell cultures. Trends Biotechnol 18 (4):173-180, 2000.
20. M. Butler. Animal cell cultures: récent achievements and perspectives in the production of biopharmaceuticals . Appl Microbiol.Biotechnol 68 (3):283-291, 2005.
21. Fussenegger, M., and J. E. Bailey. 1998. Molecular régulation of cell-cycle progression and apoptosis in mammalian cells: implications for biotechnology. Biotechnol Prog. 14:807.
22. Peakman, T. C, J. Worden, R. H. Harris, H. Cooper, J. Tite, M. J. Page, D. R. Gewert, M. Bartholemew, J. S. Crowe, and S. Brett. 1994. Comparison of expression of a humanized monoclonal antibody in mouse NSO myeloma cells and Chinese hamster ovary cells. Hum Antibodies Hybridomas 5:65.
23. S. J. Kim, N. S. Kim, C. J. Ryu, H. J. Hong, and G. M. Lee. Characterization of chimeric antibody producing CHO cells in the course of dihydrofolate reductase-mediated gène amplification and their stability in the absence of sélective pressure. Biotechnol Bioeng. 58 (l):73-84, 1998.
24. Seth, G., P. Hossler, J. C. Yee, and W. S. Hu. 2006. Engineering cells for cell culture bioprocessing-- physiological fundamentals . Adv. Biochem. Eng Biotechnol 101:119.
25. F. M. Wurm, A. Johnson, T. RyIl, C. Kohne, H. Scherthan, F. Glaab, Y. S. Lie, C. J. Petropoulos, and W. R. Arathoon. Gène transfer and amplification in CHO cells. Efficient methods for maximizing spécifie productivity and assessment of genetic conséquences. Ann.N. Y.Acad. Sci 782:70-78, 1996.
26. F. M. Wurm. Production of recombinant protein therapeutics in cultivated mammalian cells. Nat Biotechnol 22 (11) :1393- 1398, 2004.
27. Trill, J. J., A. R. Shatzman, and S. Ganguly. 1995. Production of monoclonal antibodies in COS and CHO cells . Curr Opin Biotechnol 6:553.
28. F. M. Wurm. Intégration, amplification and stability of plasmid séquences in CHO cell cultures. Biologicals 18 (3) .159-164, 1990.
29. M. Schroder, K. Matischak, and P. Friedl. Sérum- and protein-free média formulations for the Chinese hamster ovary cell line DUKXBlI. J Biotechnol 108 (3):279-292, 2004.
30. C. R. Bebbington, G. Renner, S. Thomson, D. King, D. Abrams, and G. T. Yarranton. High-level expression of a recombinant antibody from myeloma cells using a glutamine synthetase gène as an amplifiable selectable marker. Biotechnology (N.Y.) 10 (2):169-175, 1992.
31. Barnes LM et al 2000 Cytotechnology 32 : 109-123. Advances in animal cell recombinant protein production
32. Thomas, P., and T. G. Smart. 2005. HEK293 cell line: a vehicle for the expression of recombinant proteins . J Pharmacol. Toxicol. Methods 51:187.
33. Grunberg, J., K. Knogler, R. Waibel, and I. Novak-Hofer. 2003. High-yield production of recombinant antibody fragments in HEK-293 cells using sodium butyrate. Biotechniques 34:968.
34. Racher, A. J., J. L. Moreira, P. M. Alves, M. Wirth, U. H. Weidle, H. Hauser, M. J. Carrondo, and J. B. Griffiths. 1994. Expression of recombinant antibody and secreted alkaline phosphatase in mammalian cells . Influence of cell line and culture System upon production kinetics. Appl. Microbiol. Biotechnol 40:851.
35. Griffiths, J. B., and A. J. Racher. 1994. Cultural and physiological factors affecting expression of recombinant proteins . Cytotechnology 15:3.
36. Y. Kariya, K. Ishida, Y. Tsubota, Y. Nakashima, T. Hirosaki, T. Ogawa, and K. Miyazaki . Efficient expression System of human recombinant laminin-5. J Biochem. (Tokyo) 132 (4):607-612, 2002.
37. al-Shawi, R., J. Kinnaird, J. Burke, and J. 0. Bishop. 1990. Expression of a foreign gène in a line of transgenic mice is modulated by a chromosomal position effect. Mol CeIl Biol 10:1192.
38. Yoshimura, F. K., and K. Chaffin. 1987. Différent activities of viral enhancer éléments before and after stable intégration of transfected DNAs. Mol CeIl Biol 7:1296.
39. Felsenfeld, G., J. Boyes, J. Chung, D. Clark, and V. Studitsky. 1996. Chromatin structure and gène expression.
PNAS 93:9384.
40. Guglielmi, L., V. Truffinet, M. Cogne, and Y. Denizot. 2003. The beta-globin HS4 insulator confers copy-number dépendent expression of IgH regulatory éléments in stable B cell transfectants. Immunol Lett. 89:119.
41. Chung, J. H., M. Whiteley, and G. Felsenfeld. 1993. A 5' élément of the chicken beta-globin domain serves as an insulator in human erythroid cells and protects against position effect in Drosophila. Cell 74:505.
42. Tajima, S., K. Shinohara, M. Fukumoto, R. Zaitsu, J. Miyagawa, S. Hino, J. Fan, K. Akasaka, and M. Matsuoka. 2006. Ars Insulator Identified in Sea Urchin Possesses an Activity to Ensure the Transgene Expression in Mouse Cells. J Biochem (Tokyo) 139:705.
43. T. Benton, T. Chen, M. McEntee, B. Fox, D. King, R. Crombie, T. C. Thomas, and C. Bebbington. The use of UCOE vectors in combination with a preadapted sérum free, suspension cell line allows for rapid production of large quantities of protein. Cytotechnology 38 (l-3):43-46, 2006.
44. Fukushige, S., and B. Sauer . 1992. Genomic targeting with a positive-sélection lox intégration vector allows highly reproducible gène expression in mammalian cells. Proc Natl . Acad. Sci U. S. A. 89:7905.
45. Kito, M., S. Itami, Y. Fukano, K. Yamana, and T. Shibui . 2002. Construction of engineered CHO strains for high-level production of recombinant proteins. Appl Microbiol. Biotechnol 60:442.
46. H. P. FeIl, S. Yarnold, I. Hellstrom, K. E. Hellstrom, and K. R. Folger. Homologous recombination in hybridoma cells: heavy chain chimeric antibody produced by gène targeting. Proc Natl.Acad. Sci U. S A 86 (21) : 8507-8511, 1989.
47. D. A. Sorrell and A. F. KoIb. Targeted modification of mammalian génomes. Biotechnol Adv 23 (7-8) :431-469, 2005.
48. Morrow, B., and R. Kucherlapâti . 1993. Gène targeting in mammalian cells by homologous recombination. Curr Opin
Biotechnol 4:577.
49. Choulika, A., A. Perrin, B. Dujon, and J. F. Nicolas. 1995. Induction of homologous recombination in mammalian chromosomes by using the I-Scel System of Saccharomyces cerevisiae. Mol. Cell. Biol . 15:1968.
50. KoIb, A. F. 2002. Génome engineering using site-specific recombinases . Cloning Stem Cells 4:65.
51. Sauer, B. 1987. Functional expression of the cre-lox site- specific recombination System in the yeast Saccharomyces cerevisiae. Mol Cell Biol 7:2087. 52. Sauer, B., and N. Henderson. 1990. Targeted insertion of exogenous DNA into the eukaryotic génome by the Cre recombinase. New. Biol 2:441.
53. Golic, K. G., and S. Lindquist. 1989. The FLP recombinase of yeast catalyzes site-specific recombination in the
Drosophila génome. CeIl 59:499.
54. O'Gorman, S., D. T. Fox, and G. M. Wahl . 1991. Recombinase-mediated gène activation and site-specific intégration in mammalian cells. Science 251:1351.
55. Buchholz, F., P. 0. Angrand, and A. F. Stewart . 1998. Improved properties of FLP recombinase evolved by cycling mutagenesis. Nat Biotechnol 16:657.
56. Xu, Z. L., H. Mizuguchi, A. Ishii-Watabe, E. Uchida, T. Mayumi , and T. Hayakawa. 2001. Optimization of transcriptional regulatory éléments for constructing plasmid vectors . Gène 272:149.
57. Xu, Z. L., H. Mizuguchi, A. Ishii-Watabe, E. Uchida, T. Mayumi, and T. Hayakawa. 2002. Strength évaluation of transcriptional regulatory éléments for transgene expression by adenovirus vector . J Control Release. 81:155.
58. Pfarr, D. S., L. A. Rieser, R. P. Woychik, F. M. Rottman, M. Rosenberg, and M. E. Reff . 1986. Differential effects of polyadenylation régions on gène expression in mammalian cells. DNA 5:115.
59. Petitclerc, D., J. Attal , M. C. Theron, M. Bearzotti, P. Bolifraud, G. Kann, M. G. Stinnakre, H. Pointu, C. Puissant, and L. M. Houdebine. 1995. The effect of various introns and transcription terminators on the efficiency of expression vectors in various cultured cell lines and in the mammary gland of transgenic mice. J Biotechnol 40:169. 60. Kim, D., J. D. Kim, K. Baek, Y. Yoon, and J. Yoon. 2003. Improved mammalian expression Systems by manipulating transcriptional termination régions . Biotechnol Prog 19:1620.
61. Edmonds, M. 2002. A history of poly A séquences: from formation to factors to function. Prog. Nucleic Acid. Res Mol Biol 71:285.
62. Lewis, J. D., S. I. Gunderson, and I. W. Mattaj . 1995. The influence of 5 ' and 3 ' end structures on pre-mRNA metabolism. J CeIl Sci Suppl 19:13.
63. Cramer, P., A. Srebrow, S. Kadener, S. Werbajh, M. M. de la, G. Melen, G. Nogues , and A. R. Kornblihtt. 2001. Coordination between transcription and pre-mRNA processing. FEBS. Lett. 498:179.
64. Carswell et al.. (1989), Molecular and Cellular Biology, Oct. 1989, p. 4248-4258.
65. Denome et al. (1988), Molecular and Cellular Biology, Nov. 1988, p. 4829-4839.
66. GiI A, Proudfoot NJ. (1987), CeIl. 1987 May 8 ; 49 (3 ) : 399- 406. Position-dependent séquence éléments downstream of
AAUAAA are required for efficient rabbit beta-globin mRNA 3 ' end formation.
67. Gimmi ER, Soprano KJ, Rosenberg M, Reff ME (1998), Nucleic Acids Res. 1988 Sep 26 ; 16 (18) : 8977-97. Deletions in the SV40 late polyadenylation région downstream of the AATAAA médiate similar effects on expression in various mammalian cell lines.
68. Schek N, Cooke C, Alwine JC (1992), Mol Cell Biol. 12 (12) :5386-93. Définition of the upstream efficiency élément of the simian virus 40 late polyadenylation signal by using in vitro analyses.
69. Levitt N, Briggs D, GiI A, Proudfoot NJ (1989), Gènes Dev. 3 (7) :1019-25. Définition of an efficient synthetic poly(A) site.
70. Moreira A, Wollerton M, Monks J, Proudfoot NJ (1995) 14 (15) :3809-19 Upstream séquence éléments enhance poly(A) site efficiency of the C2 complément gène and are phylogenetically conserved. 71. Edwalds-Gilbert G, Prescott J, Falck-Pedersen E. (1993), Mol CeIl Biol. Jun; 13 (6) : 3472-80. 3' RNA processing efficiency plays a primary rôle in generating termination- competent KNA polymerase II elongation complexes .

Claims

Revendications
1. Procédé d'obtention d'une lignée cellulaire comportant au moins une cellule, comprenant les étapes suivantes :
- l'intégration dans le génome de ladite cellule d'un site unique de reconnaissance d'une recombinase dans une zone de forte activité transcriptionnelle du génome de ladite cellule ; et
- l'intégration, dans le génome de ladite cellule, en aval du site unique de reconnaissance d'une recombinase, d'une séquence d'acide nucléique codant un signal de terminaison de la transcription.
2. Procédé selon la revendication 1, dans lequel la séquence d'acide nucléique codant un signal de terminaison de la transcription est une séquence codant un signal de polyadénylation.
3. Procédé selon la revendication 1, dans lequel la séquence d'acide nucléique codant le marqueur de sélection comporte également une séquence de polyadénylation présentant une faible efficacité.
4. Procédé selon l'une quelconque des revendications 1 à 3, dans lequel la séquence d'acide nucléique codant un signal de terminaison de la transcription est une séquence codant tout ou partie de la séquence du signal de polyadénylation SV40 précoce ou le signal de polyadénylation de l'adénovirus Ll.
5. Procédé selon l'une quelconque des revendications 1 à 3, dans lequel la séquence d'acide nucléique codant un signal de terminaison de la transcription est une séquence mutée ou délétée d'un signal de polyadénylation, ladite mutation et/ou délétion permettant de diminuer l'efficiacité du signal de polyadénylation par rapport à la séquence non mutée, étant choisie parmi l'augmentation de la distance séparant les éléments AATAAA et la région riche en GT, la délétion du polyA SV40 late d'un ou plusieurs nucléotides présents en amont de l'hexanucléotide AATAAA, la délétion de certains éléments situés entre le nucléotides situés de 13 à 48 en amont de la séquence AATAAA, la délétion des séquences riches en GT en aval de la séquence AATAAA accompagné de la modification de l'espace situé entre la séquence AATAAA et la région riche en GT, ou la mutation ou la délétion des régions USE (upstream séquence éléments) situées en amont de la séquence AATAAA.
6. Procédé selon la revendication 1, dans lequel la cellule est une cellule de mammifère.
7. Procédé selon la revendication 1, dans lequel l'intégration du site unique de reconnaissance d'une recombinase est effectuée par une série d'étapes comprenant au moins :
- l'intégration de deux séquences d'acide nucléique codant chacune un site de reconnaissance d'une recombinase ; - l'intégration d'une séquence d'acide nucléique, codant un gène rapporteur, entre les deux séquences codant chacune un site de reconnaissance d'une recombinase ;
l'intégration d'une séquence d'acide nucléique codant une protéine d'intérêt entre les 2 séquences codant chacune un site de reconnaissance d'une recombinase ; et
l'intégration d'une séquence d'acide nucléique, codant un marqueur de sélection, de préférence un gène de résistance à un antibiotique, entre les 2 séquences codant un site de reconnaissance d'une recombinase.
8. Procédé selon la revendication 1, dans lequel seules les cellules fortement productrices ayant intégré une seule copie de l'ensemble des séquences de la revendication 7 sont sélectionnées.
9. Procédé selon la revendication 8, dans lequel seules les cellules ayant une valeur pcd (pg de protéine/cellule/24 heures) égale ou supérieure à 5, et de préférence égale ou supérieure à 10, sont sélectionnées.
10. Procédé selon la revendication 7, dans lequel la série d'étapes comprend en outre l'excision de l'ensemble des séquences de la revendication 5 par action d'une recombinase sur la cellule.
11. Procédé selon la revendication 7, dans lequel l'action d'une recombinase est obtenue par co-expression de ladite recombinase dans la cellule au moyen d'un vecteur comportant une séquence d'acide nucléique codant ladite recombinase.
12. Procédé selon la revendication 7, dans lequel la série d'étapes comprend en outre la sélection des cellules ayant excisé l'ensemble des séquences d'acide nucléique de la revendication 7, et possédant un site de reconnaissance intègre de la recombinase.
13. Procédé selon la revendication 7, dans lequel la série d'étapes comprend en outre l'intégration d'une séquence d'acide nucléique, codant la thymidine kinase du virus Herpès simplex de type I (HSVl-TK) .
14. Procédé selon la revendication 13, dans lequel la sélection des cellules avant excision est effectuée par l'ajout de ganciclovir dans le milieu de culture.
15. Procédé selon l'une des revendications 7 à 14, dans lequel la sélection des cellules est effectuée par l'ajout d'un antibiotique dans le milieu à une dose supérieure ou égale à Ig/1, de préférence supérieure ou égale à 2g/l, à 4g/l, ou encore à 8g/l.
16. Procédé selon la revendication 1, dans lequel la séquence de reconnaissance d'une recombinase est la séquence loxP et/ou FRT.
17. Procédé selon la revendication 7, dans lequel la protéine d'intérêt est un anticorps ou un fragment d'anticorps .
18. Procédé selon la revendication 1, dans lequel la cellule est une cellule de mammifère, et elle est choisie au départ parmi le groupe consistant en : les lignées de myélomes de rat, notamment YB2/0 (ATCC CRL-1662) et IR983F, de myélome humain comme Namalwa ou toute autre cellule d'origine humaine comme PERC6, les lignées CHO, notamment CHO-K, CHO-LeclO, CHO-Lecl, CHO Pro-5, CHO dhfr-, CHO Lecl3 , ou d'autres lignées choisies parmi WiI- 2, Jurkat, Vero, Molt-4, COS-7, 293-HEK, BHK, K6H6 , NSO, SP2/0-Ag 14 et P3X63Ag8.653.
19. Procédé selon la revendication 7 , dans lequel la série d'étapes comprend en outre une transfection de la lignée cellulaire sélectionnée avec un vecteur d'expression comprenant une séquence d'acide nucléiques codant une protéine ou polypeptide d'intérêt et une séquence d'acide nucléique codant un site de reconnaissance de recombinase directement en aval d'une séquence d'acide nucléique codant un marqueur de sélection, de préférence de résistance à un antibiotique, dépourvu de séquence de polyadénylation.
20. Procédé selon la revendication 19, dans lequel on insère le dit vecteur d'expression au niveau du site unique de reconnaissance de recombinase, grâce à l'action de ladite recombinase.
21. Procédé selon la revendication 19, dans lequel on sélectionne des cellules contenant le vecteur d'expression intégré au site cible en testant l'expression de la protéine d'intérêt et en ajoutant dans le milieu une forte dose d'antibiotique.
22. Procédé selon la revendication 7, dans lequel ladite protéine ou polypeptide d'intérêt est une protéine ou polypeptide thérapeutique, notamment choisi parmi le groupe présentant une activité dans les fonctions digestive, pancréatique, biliare, antivirale, antiinflammatoire, pulmonaire, antimicrobiale, hématologique, neurologique, cardiovasculaire, ophthalmologique, antigenique, cérébrale, anti-tumorale, immunostimulante, et immunomodulatrice.
23. Lignée cellulaire obtenue selon le procédé de l'une quelconque des revendications 1 à 22.
24. Lignée cellulaire comprenant, intégré de manière stable dans son génome, un site unique de reconnaissance d'une recombinase dans une zone de forte activité transcriptionnelle du génome de ladite cellule et, directement en aval dudit site unique de reconnaissance d'une recombinase, une séquence d'acide nucléique codant un signal de terminaison de la transcription.
25. Lignée cellulaire selon la revendication 24, dans laquelle la séquence d'acide nucléique codant un signal de terminaison de la transcription est une séquence codant un signal de polyadénylation, notamment un signal de polyadénylation de faible efficacité.
26. Lignée cellulaire selon la revendication 24, dans laquelle la séquence d'acide nucléique codant un signal de terminaison de la transcription est une séquence codant au moins partiellement le signal de polyadénylation SV40 précoce.
27. Lignée cellulaire selon la revendication 24, dans laquelle la cellule est une cellule de mammifère.
28. Lignée cellulaire selon la revendication 24, dans laquelle la cellule comprend, en outre :
- deux séquences d'acide nucléique codant chacune un site de reconnaissance d'une recombinase ;
- au moins une séquence d'acide nucléique codant une protéine d'intérêt entre les deux séquences codant chacune un site de reconnaissance d'une recombinase ; et
- au moins une séquence d'acide nucléique, codant un . marqueur de sélection, de préférence un gène de résistance à un antibiotique, entre les deux séquences codant chacune un site de reconnaissance d'une recombinase, ladite séquence codant pour un marqueur de sélection étant située directement en amont de la séquence d'acide nucléique codant ledit signal de terminaison de la transcription.
29. Lignée cellulaire, dans laquelle l'ensemble des séquences de la revendication 28 sont intégrées ensemble en une seule copie.
30. Lignée cellulaire selon la revendication 29, dans laquelle la cellule présente une valeur pcd égale ou supérieure à 10.
31. Lignée cellulaire, dans laquelle la cellule possède un seul site de reconnaissance intègre de la recombinase.
32. Lignée cellulaire selon la revendication 24, dans laquelle la séquence de reconnaissance d'une recombinase est la séquence loxP et/ou FRT.
33. Lignée cellulaire selon la revendication 28, dans laquelle la protéine d'intérêt est un anticorps ou un fragment d ' anticorps .
34. Lignée cellulaire modifiée selon la revendication 24, dans laquelle la cellule de départ avant modification est une cellule de mammifère, choisie parmi le groupe consistant en : les lignées de myélomes de rat, notamment YB2/0 (ATCC CRL-1662) et IR983F, de myélome humain comme Namalwa ou toute autre cellule d'origine humaine comme PERC6, les lignées CHO, notamment CHO-K, CHO-LeclO, CHO- Lecl, CHO Pro-5, CHO dhfr- , CHO Lecl3 , ou d'autres lignées choisies parmi Wil-2, Jurkat, Vero, Molt-4, COS- 7, 293-HEK, BHK, K6H6 , NSO, SP2/0-Ag 14 et P3X63Ag8.653.
35. Lignée cellulaire selon la revendication 28, laquelle comprend une séquence d'acide nucléique codant un site de reconnaissance de recombinase en aval d'une séquence d'acide nucléique codant une protéine d'intérêt et une séquence d'acide nucléique codant un marqueur de sélection, de préférence de résistance à un antibiotique, dépourvu de séquence de polyadénylation.
36. Lignée cellulaire selon la revendication 24 ou la revendication 28, surexprimant une protéine ou polypeptide d'intérêt choisi parmi le groupe des protéines ou polypeptides d'intérêt présentant une activité dans les fonctions digestive, pancréatique, biliare, antivirale, anti-inflammatoire, pulmonaire, antimicrobiale, hématologique, neurologique, cardiovasculaire, ophthalmologique, antigénique, cérébrale, anti-tumorale, immunostimulante, et immunomodulatrice.
37. Lignée cellulaire, identifiée par la référence YGM- 1/10G10, et déposée sous le numéro de dépôt CNCM 1-3704.
38. Lignée cellulaire, identifiée par la référence YGM- 2/3G5, et déposée sous le numéro de dépôt CNCM 1-3885.
39. Molécule d'acide nucléique isolée comprenant un fragment d'acide nucléique identifié par le numéro SEQ ID NO : 1.
40. Vecteur comportant une séquence d'acide nucléique identifiée dans le listage de séquences par le numéro SEQ ID NO : 1.
41. Procédé de production d'au moins une protéine ou polypeptide d'intérêt, caractérisé en ce qu'on met en culture une lignée cellulaire selon l'une quelconque des revendications 24 à 38, de manière à exprimer ladite protéine d'intérêt, suivi d'au moins une étape de récupération de ladite protéine d'intérêt.
42. Procédé de production d'au moins une protéine ou polypeptide d'intérêt selon la revendication 41, caractérisé en ce que l'on utilise une lignée cellulaire selon la revendication 37 ou 38.
43. Procédé selon l'une quelconque des revendications 41 ou 42, dans lequel la protéine ou polypeptide d'intérêt est choisi parmi le groupe des protéines ou polypeptides d'intérêt présentant une activité dans les fonctions digestive, pancréatique, biliare, antivirale, anti- inflammatoire, pulmonaire, antimicrobiale, hématologique, neurologique, cardiovasculaire, ophthalmologique, antigénique, cérébrale, anti-tumorale, immunostimulante, et immunomodulatrice.
44. Procédé selon la revendication 43 , dans lequel la protéine ou polypeptide d'intérêt est un anticorps ou fragment d'anticorps.
5. Vecteur comprenant la séquence SEQ ID NO : 2.
PCT/FR2007/002144 2006-12-20 2007-12-20 Lignee cellulaire a forte activite transcriptionnelle pour la production de proteines, notamment therapeutiques WO2008096070A2 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2009542139A JP2010512776A (ja) 2006-12-20 2007-12-20 治療への応用性が高いことで知られている蛋白質を生産するための高転写性活性細胞株
EP07872428.3A EP2121917B1 (fr) 2006-12-20 2007-12-20 Lignee cellulaire a forte activite transcriptionnelle pour la production de proteines, notamment therapeutiques
CA002671825A CA2671825A1 (fr) 2006-12-20 2007-12-20 Lignee cellulaire a forte activite transcriptionnelle pour la production de proteines, notamment therapeutiques
AU2007346339A AU2007346339A1 (en) 2006-12-20 2007-12-20 Cell line having a high transcription activity for the production of proteins, in particular therapeutic proteins

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0611157 2006-12-20
FR0611157A FR2910490B1 (fr) 2006-12-20 2006-12-20 Lignee cellulaire a forte activite transcriptionnelle pour la production de proteines, notamment therapeutiques

Publications (3)

Publication Number Publication Date
WO2008096070A2 true WO2008096070A2 (fr) 2008-08-14
WO2008096070A3 WO2008096070A3 (fr) 2008-10-23
WO2008096070A8 WO2008096070A8 (fr) 2009-07-16

Family

ID=38255098

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2007/002144 WO2008096070A2 (fr) 2006-12-20 2007-12-20 Lignee cellulaire a forte activite transcriptionnelle pour la production de proteines, notamment therapeutiques

Country Status (8)

Country Link
EP (1) EP2121917B1 (fr)
JP (1) JP2010512776A (fr)
KR (1) KR20090125035A (fr)
CN (1) CN101646774A (fr)
AU (1) AU2007346339A1 (fr)
CA (1) CA2671825A1 (fr)
FR (1) FR2910490B1 (fr)
WO (1) WO2008096070A2 (fr)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012167192A3 (fr) * 2011-06-01 2014-05-08 Precision Biosciences, Inc. Procédés et produits pour la production de lignées cellulaires génétiquement modifiées de mammifère par des transgènes amplifiés
WO2017132376A1 (fr) 2016-01-27 2017-08-03 Just Biotherapeutics, Inc. Promoteur hybride et ses utilisations
US11098310B2 (en) 2016-01-27 2021-08-24 Just-Evotec Biologics, Inc. Expression from transposon-based vectors and uses
US11261462B2 (en) 2016-01-27 2022-03-01 Just-Evotec Biologics, Inc. Inducible expression from transposon-based vectors and uses
WO2023044430A3 (fr) * 2021-09-17 2023-04-27 Homology Medicines, Inc. Éléments de polyadénylation d'origine non naturelle et leurs procédés d'utilisation

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2522615T3 (es) 2007-06-04 2014-11-17 Regeneron Pharmaceuticals, Inc. Regiones de expresión y estabilidad potenciadas
US10480009B2 (en) * 2015-10-01 2019-11-19 Massachusetts Institute Of Technology Biological state machines

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101024443B1 (ko) * 2003-01-07 2011-03-23 심포젠 에이/에스 재조합 폴리클로날 단백질의 제조 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
None

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012167192A3 (fr) * 2011-06-01 2014-05-08 Precision Biosciences, Inc. Procédés et produits pour la production de lignées cellulaires génétiquement modifiées de mammifère par des transgènes amplifiés
EP2714936A4 (fr) * 2011-06-01 2015-07-29 Prec Biosciences Inc Procédés et produits pour la production de lignées cellulaires génétiquement modifiées de mammifère par des transgènes amplifiés
US9822381B2 (en) 2011-06-01 2017-11-21 Precision Biosciences, Inc. Methods and products for producing engineered mammalian cell lines with amplified transgenes
EP3489366A1 (fr) * 2011-06-01 2019-05-29 Precision Biosciences, Inc. Procédés pour la production de lignées cellulaires génétiquement modifiées de mammifère par des transgènes amplifiés
EP3683319A1 (fr) * 2011-06-01 2020-07-22 Precision Biosciences, Inc. Procédés et produits pour la production de lignées cellulaires génétiquement modifiées de mammifère par des transgènes amplifiés
WO2017132376A1 (fr) 2016-01-27 2017-08-03 Just Biotherapeutics, Inc. Promoteur hybride et ses utilisations
US11028410B2 (en) 2016-01-27 2021-06-08 Just-Evotec Biologics, Inc. Hybrid promoter and uses thereof
US11098310B2 (en) 2016-01-27 2021-08-24 Just-Evotec Biologics, Inc. Expression from transposon-based vectors and uses
US11261462B2 (en) 2016-01-27 2022-03-01 Just-Evotec Biologics, Inc. Inducible expression from transposon-based vectors and uses
US11685933B2 (en) 2016-01-27 2023-06-27 Just-Evotec Biologics, Inc. Inducible expression from transposon-based vectors and uses
US11692193B2 (en) 2016-01-27 2023-07-04 Just-Evotec Biologies, Inc. Expression from transposon-based vectors and uses
WO2023044430A3 (fr) * 2021-09-17 2023-04-27 Homology Medicines, Inc. Éléments de polyadénylation d'origine non naturelle et leurs procédés d'utilisation

Also Published As

Publication number Publication date
WO2008096070A3 (fr) 2008-10-23
FR2910490B1 (fr) 2012-10-26
CA2671825A1 (fr) 2008-08-14
WO2008096070A8 (fr) 2009-07-16
EP2121917B1 (fr) 2014-02-26
JP2010512776A (ja) 2010-04-30
AU2007346339A1 (en) 2008-08-14
EP2121917A2 (fr) 2009-11-25
KR20090125035A (ko) 2009-12-03
FR2910490A1 (fr) 2008-06-27
CN101646774A (zh) 2010-02-10

Similar Documents

Publication Publication Date Title
KR102451510B1 (ko) Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법
KR102191739B1 (ko) 변형된 구제역 바이러스 3c 프로테아제, 조성물 및 이의 방법
KR101982360B1 (ko) 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
AU2021204620A1 (en) Central nervous system targeting polynucleotides
EP2121917A2 (fr) Lignee cellulaire a forte activite transcriptionnelle pour la production de proteines, notamment therapeutiques
US20220220188A1 (en) Compositions and methods of chimeric alloantigen receptor t cells
KR20200064129A (ko) 트랜스제닉 선택 방법 및 조성물
KR20100113112A (ko) 개선된 포유동물 발현 벡터 및 이의 용도
DK2663645T3 (da) Gærstammer, der er modificeret til produktion af ethanol fra glycerol
US20040244071A1 (en) Method for stable inversion of dna sequence by site-specific recombination and dna vectors and transgenic cells thereof
KR102628872B1 (ko) 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법
US20200188531A1 (en) Single-vector gene construct comprising insulin and glucokinase genes
KR20200032174A (ko) 강화된 키메라 항원 수용체 및 이의 용도
CN113817775B (zh) 修饰的阿柏西普、组合物、方法及其在基因治疗中的应用
CN112041334A (zh) 人foxp3在经基因编辑的t细胞中的表达
CN113692225B (zh) 经基因组编辑的鸟类
KR20240001708A (ko) 유전적 장애의 치료를 위해 생체내 뉴클레아제-매개의 유전자 표적화를 위한 조성물 및 방법
KR20210122801A (ko) 간 특이적 유도성 프로모터 및 이의 사용 방법
CN116323942A (zh) 用于基因组编辑的组合物及其使用方法
KR102664852B1 (ko) 광 유도 유전자 발현 조절용 벡터 시스템 및 이의 용도
CN114958758B (zh) 一种乳腺癌模型猪的构建方法及应用
RU2781083C2 (ru) Варианты, композиции и методы применения хоминг-эндонуклеазы pd-1

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200780047300.3

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 2007872428

Country of ref document: EP

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 07872428

Country of ref document: EP

Kind code of ref document: A2

WWE Wipo information: entry into national phase

Ref document number: 2671825

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 1020097012531

Country of ref document: KR

ENP Entry into the national phase

Ref document number: 2009542139

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 4039/DELNP/2009

Country of ref document: IN

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2007346339

Country of ref document: AU

ENP Entry into the national phase

Ref document number: 2007346339

Country of ref document: AU

Date of ref document: 20071220

Kind code of ref document: A

REG Reference to national code

Ref country code: BR

Ref legal event code: B01E

Ref document number: PI0721241

Country of ref document: BR

Free format text: APRESENTE DOCUMENTOS COMPROBATORIOS QUE EXPLIQUEM A DIVERGENCIA NO NOME DO DEPOSITANTE CONSTANTE NA PUBLICACAO INTERNACIONAL WO2008/096070 DE 14/08/2008 "LFB BIOTECHNOLOGIES SOCIETE PAR ACTIONS SIMPLIFIEE UNIPERSONNELLE" E O CONSTANTE DA PETICAO INICIAL NO 016090003925 DE 19/06/2009, "LFB BIOTECHNOLOGIES", REGULARIZANDO INCLUSIVE A PROCURACAO.

ENPW Started to enter national phase and was withdrawn or failed for other reasons

Ref document number: PI0721241

Country of ref document: BR

Free format text: PEDIDO RETIRADO EM RELACAO AO BRASIL POR NAO ATENDER AS DETERMINACOES REFERENTES A ENTRADA DO PEDIDO NA FASE NACIONAL E POR NAO CUMPRIMENTO DA EXIGENCIA FORMULADA NA RPI NO 2257 DE 08/04/2014