FR2817559A1 - Procede de determination d'un ou plusieurs polymorphisme(s) fontionnel(s) dans la sequence nucleique d'un gene "candidat" fonctionnel preselectionne et ses applications - Google Patents

Procede de determination d'un ou plusieurs polymorphisme(s) fontionnel(s) dans la sequence nucleique d'un gene "candidat" fonctionnel preselectionne et ses applications Download PDF

Info

Publication number
FR2817559A1
FR2817559A1 FR0015838A FR0015838A FR2817559A1 FR 2817559 A1 FR2817559 A1 FR 2817559A1 FR 0015838 A FR0015838 A FR 0015838A FR 0015838 A FR0015838 A FR 0015838A FR 2817559 A1 FR2817559 A1 FR 2817559A1
Authority
FR
France
Prior art keywords
sep
gene
sequence
protein
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0015838A
Other languages
English (en)
Other versions
FR2817559B1 (fr
Inventor
Jean Louis Escary
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GenOdyssee SA
Original Assignee
GenOdyssee SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GenOdyssee SA filed Critical GenOdyssee SA
Priority to FR0015838A priority Critical patent/FR2817559B1/fr
Priority to PCT/EP2001/015427 priority patent/WO2002046459A2/fr
Priority to AU2002219230A priority patent/AU2002219230A1/en
Priority to EP01999666A priority patent/EP1349963A2/fr
Priority to US10/010,749 priority patent/US20020155467A1/en
Publication of FR2817559A1 publication Critical patent/FR2817559A1/fr
Application granted granted Critical
Publication of FR2817559B1 publication Critical patent/FR2817559B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Oncology (AREA)
  • Virology (AREA)
  • Communicable Diseases (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Procédé de détermination d'un ou plusieurs polymorphismes de type SNP fonctionnels dans la séquence nucléique d'un gène " candidat " présélectionné dans lequel :a) on isole le fragment d'acides nucléiques génomiques du gène " candidat " d'un nombre significatif d'individus choisis de manière aléatoire dans la population, b) on procède à une analyse comparative de la séquence nucléique des individus étudiés,c) on classe les séquences nucléiques identiques dans des groupes homogènes, etd) on identifie le SNP fonctionnel de la séquence nucléique de groupe (s) hétérozygote (s) par rapport à la séquence nucléique du gène " candidat " de référence.

Description

<Desc/Clms Page number 1>
Figure img00010001
La présente invention concerne un procédé de détermination d'un ou plusieurs polymorphisme (s) fonctionnel (s) dans la séquence nucléique d'une gène"candidat"présélectionné et ses applications.
La recherche de polymorphismes dans le génome humain revêt une importance de plus en plus grande notamment pour la recherche de la cause de certaines maladies ou sensibilités particulières ainsi que dans la recherche de médicaments permettant d'influer sur celles-ci
Il est généralement admis qu'il existe une contribution génétique et une contribution environnementale à l'apparition des maladies communes chez l'être humain et à la résistance de certains individus à ces mêmes maladies. La prédisposition et la résistance génétique à l'apparition des maladies communes chez l'être humain seront appelées o-après"les caractères".
Pour ce qui est de la contribution génétique à ces maladies, il est aussi communément admis par l'homme du métier deux choses. d'une part que le nombre de gènes qui participent chez l'être humain à ces caractères est supérieur à un (origine polygénique des caractères), et d'autre part que ces caractères sont suspectés être Imputables majoritalrement à des variations d'expression ou de fonction des gènes qui sont codés sur le génome humain entre les différents individus de la population mondiale. Ces variations sont aussi suspectées par l'homme du métier comme étant majoritairement des variations d'une paire de bases ou SNP (Single Nucleotide Polymorphism) qui représenteraient en moyenne un total de 0. 1% de la séquence du génome humain entier soit près de 3 millions de paires de bases.
D'une part, la caractérisation des SNPs fonctionnels qu ! révéleront la présence chez certains individus d'allèles de gènes"candidats"reliés à une prédisposition ou au développement des maladies communes permettra la mise au point de molécules thérapeutiques ayant pour but de corriger les effets observés de ces allèles sur l'organisme des individus porteurs et en particulier, sans s'y restreindre, de corriger l'impact des SNPs fonctionnels sur la structure des protéines codées par les gènes"candidats"chez les patients.
De même, les SNPs fonctionnels qui démontreront une relation
<Desc/Clms Page number 2>
Figure img00020001

entre les allèles mutants et une résistance de certains individus aux maladies communes permettront d'inventer des molécules thérapeutiques qui seront chargées d'imiter l'impact protecteur de ces allèles sur les organismes porteurs de ces allèles, et en particulier d'imiter l'impact de ces allèles mutants de SNPs fonctionnels sur la structure des protéines porteuses correspondantes.
Ces kits de diagnostic/pronostic et ces molécules thérapeutiques nouvelles seront les outils de prévention et de traitement des maladies communes
Les efforts actuels de la recherche post-génomique portent sur une recherche des SNPs fonctionnels qui démontrent la relation entre un ou plusieurs allèles mutants et un des deux caractères"sensibilité"ou"résistance" aux maladies communes dans la population. Ainsi, la recherche de nouvelles cibles thérapeutiques sur le génome telles que décrites plus haut est effectuée par des analyses de génotypage des SNPs dans des échantillons de personnes présélectionnés pour un des deux caractères, suivies d'analyses statistiques d'associations génétiques entre certains allèles codés par ces SNPs et le ou les caractère (s) d'intérêt.
Les Individus pour lesquels le génotype doit être déterminé sont sélectionnés à l'aide des critères phénotypiques précis comme par exemple des critères médicaux, cliniques, épidémiologiques, physiologiques ou biologiques, qui mesurent le degré de sensibilité ou de résistance de ces Individus aux maladies communes.
Donc, jusqu'à présent, la recherche de variations dans les séquences nucléiques humaines, notamment celles appelé SNPs (Single Nucléotide Polymorphisms) c'est-à-dire concernant un seul nucléotide, a été réalisée soit de manière systématique (séquençage du génome humain), soit en procédant au séquençage du génome d'individus sélectionnés par exemple en raison d'une sensibilité ou résistance particulière qu'ils présentent.
La méthode utilisée a consisté à découvrir une relation directe entre un allèle mutant codé par un SNP fonctionnel ou non fonctionnel et un des deux caractères des maladies communes.
Ceci se fait en quatre étapes :
<Desc/Clms Page number 3>
Figure img00030001

dans l'étape 1 on procède à l'identification de SNPs dans un échantillon de malades et/ou un échantillon de résistants et, toujours, dans un échantillon d'individus dits contrôles (individus présentant des données phénotypiques normales regardant le ou les caractères étudiés). De plus, les SNPs sont recherchés soit sur le génome afin de déterminer une association ou liaison génétique entre une ou plusieurs régions du génome et le ou les caractères étudiés (approche"Genomescan"), l'étape 2 consiste à génotyper des allèles codés par les SNPs identifiés à la première étape dans un échantillon de patients et/ou de résistants, et toujours aussi, dans un échantillon de contrôles, suivi de l'analyse statistique des associations ou liaisons génétiques entre un ou plusieurs allèle (s) génotypé (s) et le ou les caractère (s) étudié (s) dans l'étape 3 les données de génotypage sont analysées comme suit calculs statistiques qui permettent d'estimer le degré de fiabilité d'une association génétique constatée par une plus forte fréquence d'un ou de plusieurs allèle (s) chez les individus sélectionnés pour l'un ou l'autre des caractères que chez les individus contrôles Les associations génétiques confirmées par le calcul statistique entre un ou plusieurs SNP (s) fonctionnel (s) et l'un ou l'autre des caractères révèlent une relation entre la variabilité d'expression ou de fonction du ou des gènes et protéines porteurs du ou des SNP (s) et le caractère étudié. Cette information permet de donner le statut de cibles thérapeutiques aux allèles mutants des gènes concernés Le décryptage récent de la séquence du génome humain et le séquençage nombreux nouveaux gènes sur le génome permet d'imaginer dans un proche avenir l'identification de nombreuses nouvelles cibles thérapeutiques selon cette méthode pour la prévention et le traitement des maladies communes. l'étape 4 consiste à confirmer le statut de cibles thérapeutiques à certains allèles codés par des SNP fonctionnels et identifiés associés génétiquement au caractère d'intérêt. Ceci se fait en mettant au point des tests biologiques qui permettent d'établir par une méthode de modélisation la relation entre l'allèle et le caractère. Par exemple, on montre que l'allèle mutant codé par un
<Desc/Clms Page number 4>
Figure img00040001

SNP trouvé dans la région promotrice d'un gène"candidat"a un effet sur l'expression du gène, ou encore que l'allèle mutant codé par un SNP fonctionnel trouvé dans la séquence codante d'un gène"candidat"a un effet sur la structure de la protéine codée par le gène, et plus encore sur la structure des domaines actifs de cette structure, montrant un effet clair de l'allèle mutant sur l'activité de ladite protéine et donc du gène Les informations biologiques générées sont indispensables pour pouvoir faire un lien fonctionnel entre l'étude génétique du caractère et les données, et sans s'y restreindre, médicales, cliniques, physiologiques ou biologiques collectées pour sélectionnés les patients ou les résistants, selon le caractère étudié. A partir de ce lien fonctionnel établi entre certains allèles et le caractère étudié, la caractérisation de l'impact biologique de l'allèle concerné sur l'expression ou la fonction du gène ou de la protéine étudié (e). On peut mettre au point des kits de diagnostic/pronostic et/ou de nouvelle (s) molécule (s) thérapeutique (s).
En outre, la recherche des individus malades pour lesquels une particularité génétique doit être déterminée, requiert des opérations longues, coûteuses et souvent difficiles, visant à constituer des groupes phénotypiques d'intérêt dont les séquences d'ADN devront être étudiées. Ceci est notamment dû au fait qu'il faut, préalablement au lancement de l'étude, rechercher et trouver un nombre représentatif de personnes manifestant un caractère phénotypique commun.
Il serait donc souhaitable de disposer d'une méthode permettant de découvrir avec une bonne certitude l'existence de polymorphismes dans le génome humain.
En outre, un travail de séquençage systématique conduit à une perte importante d'énergie puisqu'il revient à travailler également sur des séquences sans intérêt notamment thérapeutique.
Or la demanderesse a identifié une nouvelle méthode permettant le repérage de polymorphismes et notamment d'anomalies génomiques qui présente notamment des avantages suivants :
Le procédé permet, sans avoir recours aux études de génotypage
<Desc/Clms Page number 5>
Figure img00050001

de personnes présentant un phénotype particulier et aux études d'association ou de liaison génétique entre marqueurs SNP et le ou les phénotype (s) étudié (s) qui suivent, de constituer une banque de données de variants génétiques responsables de modifications fonctionnelles de l'expression ou de l'activité des gènes sur le génome, et donc de cibles diagnostic/pronostiC et thérapeutiques potentielles sur le génome pour la prévention et le traitement des maladies communes. En effet, Il est reconnu que l'impact du fond génétique d'une personne sur sa sensibilité ou sa résistance à l'apparition et au développement des maladies est du à des mutations qui modifient l'expression et/ou l'activité normales de un ou de plusieurs de ses gènes. Parmi ces mutations, on compte les SNPs fonctionnels. Parmi ces derniers, un ou tous constitueront donc des cibles pour la mise au point de kits de diagnostic/pronostic et thérapeutiques pour la prévention et le traitement des dites maladies.
De plus, le procédé est plus fiable pour découvrir des cibles pronostic/diagnostic et thérapeutiques sur le génome par rapport aux études statistiques d'association ou de liaisons génétiques réalisées grâce à des études de génotypage de personnes sensibles ou résistantes aux maladies et de personnes contrôles. En effet, bien que mesuré, le risque de découvrir une association ou une liaison génétique entre un ou plusieurs SNPs et l'apparition et/ou le développement d'une ou plusieurs maladie (s) alors que cette association ou cette liaison est fausse dans la réalité (on appelle ce type d'association ou de liaison génétique une association ou une liaison fausse positive), est réel et ne peut être évité du fait même de la nature statistique des méthodes de calcul.
De ce fait, le présent procédé décrit la mise au point de tests biologiques concrets démontrant le rôle fonctionnel réel de certains allèles codés par des SNPs fonctionnels sur l'expression ou l'activité des gènes constitue une découverte plus fiable de cibles diagnostic/pronostic et thérapeutiques potentielles sur le génome.
Le procédé selon l'invention permet aussi de faire l'économie de toute présélection des personnes sur un caractère phénotypique particulier,
<Desc/Clms Page number 6>
Figure img00060001

défini ici comme une sensibilité ou résistance particulière aux maladies, pour découvrir des SNPs fonctionnels constituant des cibles diagnostic/pronostic et thérapeutiques potentielles sur le génome. Le procédé de l'invention permet donc une économie de temps, d'argent et d'énergie pour la découverte de ces cibles potentielles pour le développement de kits de diagnostic/pronostic et de molécules thérapeutiques pour la prévention et le traitement des maladies.
Le procédé selon l'invention se fonde, à la différence de l'art
Figure img00060002

antérieur, sur l'identification de SNPs fonctionnels dans des gènes"candidats", dans une population aléatoire non sélectionnée sur des critères et des données, et sans s'y restreindre, médicales, cliniques, épidémiologiques, physiologiques ou biologiques. Autrement dit, le procédé selon l'invention vise une méthode qui permet de découvrir des SNPs fonctionnels dans des gènes "candidats"dans une population aléatoire, permettant l'identification d'allèles mutants constituant des cibles thérapeutiques potentielles ou dites "candidates", pour le diagnostic/pronostic ou le traitement des maladies communes, sans avoir recours à l'analyse d'échantillons d'individus patients ou résistants présélectionnés. Cette population aléatoire rend compte d'un grand nombre d'ethnies humaines différentes.
Le procédé se déroule en simplement deux étapes majeures l'identification du génotypage de SNPs fonctionnels dans un échantillon aléatoire de la population constitué d'individus recrutés au hasard dans la population, et la validation biologique de l'impact de l'allèle mutant codé par chacun des SNPs fonctionnels sur l'expression ou la fonction des gènes "candidats"ou des protéines codées par ces gènes.
L'identification d'un effet biologique fort de ces allèles sur l'expression ou la fonction des gènes"candidats"ou des protéines codées par ces gènes permet de donner, grâce au données disponibles dans l'art antérieur concernant les gènes"candidats"fonctionnels, le statut de cibles thérapeutiques potentielles ou"candidates"aux allèles mutants démontrant un effet biologique fort et ce pour les domaines thérapeutiques (maladies communes) pour lesquels les gènes"candidats"sont suspectés dans l'art antérieur jouer un rôle.
<Desc/Clms Page number 7>
Figure img00070001

Une fois les SNPs détectés, l'identification d'allèle (s) associé (s) génétiquement au (x) caractère (s) d'intérêt et donc l'identification de nouvelles cibles thérapeutiques reliées aux maladies communes peut être effectuée.
Comme les maladies communes sont par définition des maladies qui touchent un grand nombre d'individus, un échantillon d'individus pris au hasard dans la population contient donc un nombre raisonnable de patients et de résistants non identifiés comme tels. On peut ainsi découvrir des SNPs fonctionnels associés à l'un ou l'autre des caractères des maladies communes et donc permettant d'identifier des cibles thérapeutiques reliées à ces maladies en analysant directement une telle population d'individus dite aléatoire. Le génotypage de ces mêmes individus pour les SNPs fonctionnels ainsi identifiés permet d'estimer la fréquence allélique de ces SNPs dans les différentes ethnies humaines représentées dans la population aléatoire, ce qui permet de prédire également l'impact de l'identification pour le diagnostic/pronostic ou le traitement de ces différentes ethnies.
C'est pourquoi la présente demande a pour objet un procédé de détermination d'un ou plusieurs polymorphismes fonctionnels dans la séquence nucléique d'un gène"candidat"présélectionné dans lequel : a) on isole le fragment d'acides nucléiques génomiques du gène"candidat"d'un nombre significatif d'individus choisis de manière aléatoire dans la population, b) on procède à une analyse comparative de la séquence nucléique des individus étudiés, c) on classe les séquences nucléiques identiques dans des groupes homogènes, et d) on identifie le polymorphisme de la séquence nucléique de chaque groupe hétérozygote par rapport à la séquence nucléique du gène"candidat"de référence.
Ainsi, au lieu de procéder à un travail systématique comme dans l'art antérieur et partir d'individus particuliers (malades ou résistants) pour en obtenir les gènes et les étudier, on s'intéresse au départ du procédé de la présente invention uniquement aux gènes connus dans l'état de la technique comme remplissant des fonctions particulières dans une pathologie ou dans un processus biologique particulier et on étudie les gènes d'un échantillon de
<Desc/Clms Page number 8>
Figure img00080001

population aléatoire, c'est à dire qui n'est pas choisi parce qu'il présente la particularité que l'on cherche à étudier.
Dans la présente invention et dans ce qui suit, on désigne par gène"candidat"un gène dont on connaît : en intégralité ou en partie la séquence nucléotidique régulatrice et codante et/ou la séquences de la protéine codée par ce gène, et ta connaissance de toute donnée médicale, clinique, épidémiologique, physiologique ou biologique, relative à ladite séquence nuctéotdtque ou à ladite protéine et qui permet de révéler à l'expérimentateur, un rôle potentiel ou supposé de l'expression de ces gènes ou de la ou des protéine (s) codée (s) par ces gènes si elle (s) existe (nt), ou encore l'activité de la ou des protéine (s) codée (s) par ces gènes, si elle (s) existe (nt), dans l'apparition des maladies communes ou, au contraire, dans une résistance particulière à ces maladies dans la population humaine.
On entend par"gène candidat fonctionnel", un gène"candidat" dont on peut déterminer la fonction On entend par"fonctionnalité"la modulation de l'activité biologique d'une molécule biologique, cette modulation pouvant consister en une augmentation, une diminution ou une suppression de ladite activité biologique. L'activité biologique peut, notamment, être liée à l'affinité ou à l'absence d'affinité de la molécule biologique vis-à-vis d'un récepteur.
On définit par"séquences sauvages de référence"les séquences nucléotidiques régulatrices et codantes du gène"candidat", comme défini cidessus, et qui sont connues intégralement ou en partie dans l'art antérieur et qui servent de matrices à l'expérimentateur pour le dessin des fragments du gène"candidat"et l'amplification PCR (Polymérase Chain Reaction) de ces fragments à partir de l'ADN génomique des individus de la population aléatoire pour effectuer l'identification des SNPs fonctionnels chez ces individus. Est également comprise comme séquence sauvage de référence, la séquence de la protéine codée par la séquence codante sauvage de référence du gène "candidat"telle que définie au-dessus et qui est soit connue de l'art antérieur, soit déterminée par l'expérimentateur à partir de la séquence codante sauvage
<Desc/Clms Page number 9>
Figure img00090001

de référence du gène"candidat"telle que définie au-dessus et connu de l'art antérieur.
Il est également convenu que dans le cas où la séquence sauvage de référence du gène"candidat"ne serait pas intégralement connue de l'art antérieur, l'homme du métier peut, avec ses propres ressources technologiques incluant par exemple le clonage et le séquençage de la totalité des séquences régulatrices et codante du gène"candidat", à partir du séquençage complet ou partiel d'un clone génomique contenant tout ou partie de la séquence du gène "candidat", déterminer la partie manquante et l'intégrer à l'identification de SNPs fonctionnels dans le gène"candidat"au sein de la population aléatoire.
On désigne par"SNP"toute variation, naturelle d'une paire de bases identifiées dans un gène"candidat"dans le génome d'un ou de plusieurs individus au sein de la population aléatoire De préférence, on désigne les SNPs identifiés uniquement dans les séquences régulatrices contenant, par exemple, le promoteur, les ou les éventuelle (s) séquence (s)"enhancer"et les sites d'épissage des introns du gène"candidat"ou encore la séquence codante (les exons) du gène"candidat". Chaque SNP reflète la présence de deux bases différentes à la même position dans la séquence nucléotidlque du gène "candidat", démontrant la présence de deux allèles différents du gène "candidat"dans le génome de l'individu ou des individus chez lesquels le SNP a été identifié dans la population aléatoire.
On appelle SNP"fonctionnel"toute variation naturelle de séquence d'une paire de bases dans les séquences régulatrices d'un gène "candidat"ou, si elle existe dans la partie codante de la séquence de ce gène, qui code pour le peptide signal de la ou des protéine (s) codée (s) par le gène "candidat", qui est identifiée dans le génome d'un ou de plusieurs individus de la population aléatoire et qui révèle une variabilité de l'expression du gène "candidat" (niveau de transcription et de traduction) ou de la ou des protéine (s) codée (s) par le gène si elle (s) existe (nt) (modifications post-traductionnelles comme par exemple la glycosylation) dans la population aléatoire.
On appelle également SNP"fonctionnel"toute variation naturelle d'une paire de bases située dans la séquence codante d'un gène"candidat"et
<Desc/Clms Page number 10>
Figure img00100001

identifiée dans le génome d'un ou de plusieurs individus de la population aléatoire qui révèle soit un arrêt de la traduction (introduction d'un codon STOP) soit une modification de la nature d'un acide aminé de la ou des protéines codée (s) par ce gène si elle (s) existe (nt) et qui modifie l'activité de la ou des dite (s) protéine (s), révélant une variabilité de l'activité (également appelée fonctionnalité) de la ou des protéine (s) codée (s) par le gène"candidat"dans la population aléatoire. On distinguera ce dernier type de SNP"fonctionnel"du SNP dit"codant"qui est constitué par toute variation naturelle d'une paire de bases identifiée dans la séquence codante d'un gène"candidat"dans le génome d'un ou de plusieurs individus de la population aléatoire et qui entraîne une modification de la nature d'un acide aminé de la ou des protéines codée (s) par ce gène si elle (s) existe (nt) et qui ne modifient pas l'activité de la ou des dite (s) protéine (s) Les SNPs fonctionnels et codants se distinguent des SNPs dits"silencieux"également identifiés dans les séquences codantes des gènes "candidats"dans la population aléatoire mais qui ne modifient pas la nature des acides aminés des protéines codées par ces gènes"candidats"
Le gène fonctionnel"candidat"peut être présélectionné en effectuant une recherche dans la littérature (NCBI, Entrez ou Medline par exemple) et les bases de données (PubMed ou OMIM par exemple). L'extrapolation de données obtenues dans des modèles autres que le modèle humain (murin, levure,...) est possible mais passe par la caractérisation des gènes/protéines humains impliqués dans les processus décrits dans ces modèles (par exemple : par homologie de séquences, par reconstruction de voie de signalisations ou de voies métaboliques)
Par définition est appelée séquence"mutante"ou"mutée"toute séquence nucléotidique régulatrice ou codante du gène"candidat" correspondant à un allèle nouveau du gène révélé par l'identification d'un SNP dans ces séquences et qui est inconnue de l'art antérieur De même est appelée séquence mutante ou mutée toute séquence nouvelle de la protéine codée par le gène"candidat"qui est révélée par l'identification d'un SNP codant dans la séquence codante du gène"candidat"et qui est l'expression d'un nouvel allèle du gène codé par le SNP codant et qui n'est pas connu de l'art
<Desc/Clms Page number 11>
Figure img00110001

antérieur.
On définit par maladie"commune"toute maladie de la population humaine pour laquelle on estime que plus d'un gène est impliqué dans l'apparition de celle-ci chez les patients ou/et dans une résistance particulière au développement de cette maladie chez certains individus de la population. On les appelle également, et pour les mêmes raisons, des maladies polygéniques.
Ce sont entre autres les cancers, les maladies cardiovasculaires, toute maladie constituant un facteur de risque pour les maladies cardiovasculaires comme par exemple les diabètes de type 1 et 2, l'hypertension, l'hypercholestérolémie, les maladies métaboliques comme l'obésité, également les maladies autoimmunes, les maladies infectieuses, les maladies du système nerveux central comme par exemple la maladie d'Alzheimer ou la schizophrénie ou encore la dépression, également le rejet de greffe de tissu (s) ou d'organe (s), l'anémie, l'allergie, ou encore l'asthme.
Le gène fonctionnel"candidat"est tout d'abord choisi en fonction de l'art antérieur qui permet de déterminer son rôle potentiel dans l'apparition des maladies communes dans la population humaine ou dans une résistance particulière de certains Individus de cette population à ces maladies.
On isole ensuite la séquence nucléique du gène"candidat"d'une population aléatoire d'un nombre significatif d'individus.
On définit par"population aléatoire"tòute population humaine dont les individus ont été recrutés au hasard et sans critères phénotypiques particuliers incluant par exemple la collection de données médicales, cliniques, épidémiologiques, physiologiques ou biologiques.
Dans une étape suivante, on soumet les gènes ainsi préparés à une analyse qualitative et quantitative telle qu'une chromatographie pour détecter une différence de génotype et/ou de séquence entre les différentes molécules d'ADN étudiées.
On classe ensuite les séquences nucléiques identiques dans des groupes homogènes (par allèles).
On procède alors au séquençage des séquences nucléiques de chaque groupe selon les méthodes bien connues de l'état de la technique.
<Desc/Clms Page number 12>
Figure img00120001
On peut alors procéder, si désiré, au génotypage des séquences nucléiques de chaque groupe.
Le procédé de l'invention est illustré par le cas de l'interféron a 2 dans lequel on a identifié un SNP fonctionnel dans la partie codante du gène et qui révèle une modification forte de la structure du site d'accrochage (binding site) de l'interféron ex 2 à son récepteur
L'art antérieur a déjà révélé le rôle essentiel de ce site dans la fonction de l'interféron ex 2 et permet de prédire un rôle fort de l'allèle mutant ici analysé dans la fonction de l'interféron ex 2 L'art antérieur montre également le rôle important de ce gène comme immunomodulateur et agent essentiel de la réponse de l'organisme à l'infection d'un grand nombre d'agents infectieux (virus, bactéries, champignons, et parasites).
L'interféron ex 2 est actuellement utilisé comme agent thérapeutique pour traiter divers types de cancers ainsi que pour combattre l'infection par les virus de l'hépatite B et C et le virus du SIDA. Ces données permettent de donner un statut probable de cible thérapeutique potentielle ou candidate à l'allèle mutant nature ! identifié dans la population aléatoire et responsable d'une modification majeure de la structure du site actif de l'interféron a 2.
La présente invention a notamment pour objet un procédé de détermination décrit ci-dessus, dans lequel le gène est présélectionné en effectuant une recherche dans la littérature ou les bases de données telles que respectivement NCBI, Entrez ou Medline par exemple et PubMed ou OMIM par exemple L'extrapolation de données obtenues dans des modèles autres que le modèle humain (murin, levure,...) est possible mais passe par la caractérisation des gènes/protéines humains impliqués dans les processus décrits dans ces modèles (par exemple : par homologie de séquences, par reconstruction de voie de signalisations ou de voies métaboliques).
Le gène fonctionnel est également présélectionné en effectuant une recherche dans la littérature ou les bases de données telles qu'on puisse y voir décrites par exemple la séquence sauvage de référence du gène et de la ou des protéine (s) codée (s) par ce gène chez l'être humain et/ou chez toute
<Desc/Clms Page number 13>
Figure img00130001

espèce du règne animal, la structure de la ou des protéine (s) sauvage (s) de référence chez l'être humain et/ou toute espèce du règne animal, une ou des étude (s) de structures de la ou des protéine (s) sauvages de référence codée (s) par le gène candidat comme des études de cristallographie, une ou des étude (s) de comparaison de séquence du gène sauvage de référence codée (s) par le gène dans le règne animal, une ou des expérience (s) de mutagénèse dirigée sur la séquence sauvage de référence du gène candidat montrant le rôle de certains acides aminés dans la fonction de la ou de (s) protéine (s) codée (s) par le gène candidat, des tests d'activité in vivo dans les animaux ou in vitro menés avec des cellules humaines ou de tout autre animal comme par exemple des tests cellulaires de prolifération, de différenciation, ou montrant l'implication du gène ou de la protéine sauvages de référence dans l'activation ou la répressions d'une voie métabolique, en particulier la régulation de l'activité des protéines kinases et de l'expression nucléaire de gènes particuliers, des modèles animaux montrant le rôle du gène ou de la ou des protéine (s) codé par le gène"candidat"dans l'apparition d'une pathologie particulière (par exemple des souris transgéniques), des données épidémiologiques, médicales ou cliniques montrant une implication du gène ou de la ou des protéine (s) codée (s) par ledit gène dans l'apparition ou la résistance à une maladie commune dans la population humaine.
Le gène"candidat"est ainsi choisi en fonction de l'art antérieur. Il permet de déterminer son rôle potentiel dans l'apparition des maladies communes dans la population humaine ou dans une résistance particulière de certains individus de cette population à ces maladies.
Tout gène du génome humain connu dans l'art antérieur et dont la connaissance publiée ou non dans la littérature fait suspecter ou apparaître à l'homme du métier un rôle potentiel de, soit l'expression de ce gène (niveau de transcription et traduction), soit de la ou des protéine (s) codée (s) par ce gène si elle (s) existe (nt) (modifications post-traductionnelles), soit encore de l'activité de la ou des protéine (s) codée (s) par ce gène si elle (s) existe (nt) dans l'apparition des maladies communes ou au contraire dans une résistance particulière à ces maladies chez l'être humain est considéré comme un gène
<Desc/Clms Page number 14>
Figure img00140001

"candidat"accessible à l'homme du métier par différentes sources. Les séquences de ces gènes décrites dans la littérature sont appelées"séquences sauvages de référence".
Parmi les données de l'art antérieur qui peuvent être mises en oeuvre pour l'identification et la caractérisation de SNPs fonctionnels dans les gènes"candidats"dans la population aléatoire, une attention particulière est portée sur la connaissance des séquences régulatrices des gènes"candidats" et si elles existent, des séquences qui, dans les séquences codantes, codent pour les peptides signaux'des protéines codées par ces gènes qui sont responsables de l'expression de ces gènes ou des protéine (s) codées par ces gènes, comme sur la connaissance de la structure tridimensionnelle des protéines sauvages de référence codées par les séquences codantes sauvages de référence des gènes"candidats"ainsi que sur la connaissance des acides aminés qui, au sein de ces structures, ont été déjà identifiés comme jouant un rôle dans l'activité des dites protéines sauvages de référence
On retient tout particulièrement un procédé dans lequel le gène "candidat"est pertinent dans une pathologie particulière.
Le gène"candidat"peut être notamment tout gène susceptible d'être impliqué dans des processus biologiques ou maladies communes, ou dans une résistance particulière à ces maladies chez l'être humain, tout particulièrement le gène de l'interféron a 2 humain.
On peut par contre sélectionner les individus par groupes ethniques comme on le verra ci-après dans la partie expérimentale, et pour chacun de ces groupes prendre un"nombre significatif d'individus"par groupe ethnique constituant ainsi la population aléatoire, par exemple supérieur à 5, notamment supérieur à 10, de préférence supérieur à 20 et tout particulièrement supérieur à 100.
Par"nombre significatif d'individus"on entend un nombre d'individus et donc de gènes étudiés par exemple supérieur à 100, notamment supérieur à 150, de préférence supérieur à 200 et tout particulièrement compris entre 250 et 400.
Dans des conditions préférentielles de mise en oeuvre du procédé
<Desc/Clms Page number 15>
Figure img00150001

ci-dessus, la séquence nucléique du gène"candidat"d'un nombre significatif d'individus choisis de manière aléatoire dans la population est isolée par une réaction de PCR La Polymérase Chain Reaction est bien connue de l'homme du métier
L'isolation des ADNs génomiques peut également être réalisée par les méthodes bien connues de l'état de la technique
Dans des conditions préférentielles de mise en oeuvre du procédé ci-dessus décrit, on amplifie les fragments d'ADNs spécifiques correspondant aux fragments prédéterminés de séquences régulatrices et codantes des gènes "candidats"des individus de la population aléatoire, par réaction de polymérisation en chaîne (PCR) en utilisant des am. orces oligonucléotidiques appropriées Des logiciels tel Primer3&commat; peuvent être utilisés pour choisir plusieurs couples d'amorces permettant d'amplifier par PCR les régions choisies (par exemple des séquences totales ou partielles d'accrochage de facteurs de transcription dans les promoteurs, des séquences totales ou partielles d'épissage des introns, des séquences totales ou partielles d'exons).
Cette dernière est notamment dans le cas de l'interféron a, effectuée à partir des amorces correspondant aux séquences ID SEQ NO1 et ID SEQ N2
SI l'analyse comparative de la séquence nucléique des individus étudiés peut être effectuée par toute technique connue de l'homme du métier, on retient tout particulièrement la chromatographie liquide haute performance en condition dénaturante (DHPLC :"Denaturing-High Performance Liquid Chromatography).
Dans des conditions préférentielles, la détection des SNPs est réalisée par analyse DHPLC. Cette méthodologie exploite la différence de rétention sur colonne des espèces double brin homo-et hétéroduplex sous des conditions de partielle dénaturation thermique.
En effet, la DHPLC présente les avantages de détecter les SNPs avec une plus forte efficacité (97 %) par rapport au séquençage 85 à 90 %).
Un tel procédé qui implique l'emploi d'une méthode de multiplexage des échantillons est décrit dans FR-A-2 793 262 (demande
<Desc/Clms Page number 16>
Figure img00160001

NO 99 5651 du 4 Mai 1999).
Brièvement, les fragments d'ADN amplifiés à partir de l'ADN génomique d'individus hétérozygotes ou homozygotes sont séparés sous conditions partiellement dénaturantes par HPLC.
De préférence, on mélange les produits d'amplification correspondant à plusieurs individus, de préférence entre 3 et 50 individus, particulièrement entre 3 et 5 individus, et tout particulièrement 3 individus, avant de procéder à la dénaturation et à l'analyse DHPLC.
D'autres conditions préférentielles de mise en oeuvre de la DHPLC et des étapes ultérieures du procédé de l'invention sont décrites dans FR-A-2 793 262.
Le classement des séquences nucléiques identiques dans des groupes homogènes est avantageusement effectué par l'analyse des profils obtenus par les chromatogrammes résultant de la DHPLC On classe les séquences nucléiques identiques dans des groupes de chromatogrammes DHPLC homogènes.
La chromatographie, notamment la DHPLC associée au séquençage permet de situer chaque SNP sur chaque fragment nucléotidique et de caractériser la nature des bases associés à chaque polymorphisme.
L'identification du polymorphisme de la séquence nucléique des individus hétérozygotes de chaque groupe présentant un chromatogramme hétérozygote par rapport à séquence sauvage de référence est de préférence effectuée par séquençage des séquences nucléiques hétérozygotes. Le séquençage est un procédé bien connu de l'homme du métier et ici il peut être effectué par exemple par la technologie de séquençage capillaire bien connue de l'homme du métier.
L'identification de l'impact sur la structure de la protéine codée par le gène"candidat"de l'allèle mutant de chaque SNP fonctionnel de la séquence nucléique de chaque groupe hétérozygote par rapport à une séquence sauvage du gène"candidat"de référence peut être effectuée par modélisation moléculaire bio-informatique.
La présente invention a également pour objet un procédé de
<Desc/Clms Page number 17>
Figure img00170001

détermination de la fréquence du polymorphisme de la séquence nucléique obtenue selon le procédé de détermination ci-dessus décrit par rapport à séquence sauvage de référence, dans lequel on procède en outre au génotypage des séquences nucléiques de chaque individu de chaque groupe de la population aléatoire obtenue comme expliqué précédemment.
Les SNPs fonctionnels identifiés dans les gènes"candidats"dans la population aléatoire sont génotypés dans la même population aléatoire et une analyse statistique est alors faite de la fréquence de chaque allèle (fréquence allélique) codé par ces SNPs dans la population aléatoire, ce qui permet de déterminer l'importance de leur impact dans les diverses ethnies qui constituent cette population aléatoire.
Les données de génotypage sont analysées pour estimer les fréquences de distributions des différents allèles observés dans les populations étudiées Même Si l'effort se porte principalement sur les SNPs validés fonctionnellement, des recherches de déséquilibre de liaison entre les SNPs découverts dans la population aléatoire peuvent être réalisées pour déterminer les SNPs non fonctionnels pouvant néanmoins être associés à des SNPs fonctionnels plus pertinent, et donc être des marqueurs de ces derniers Ces SNPs non fonctionnels pourront être utilisés pour le développement de kits de diagnostic/pronostic comme marqueurs des SNPs fonctionnels avec lesquels ils seront en équilibre de liaison. Les calculs de fréquènces alléliques peuvent être réalisés à l'aide de logiciels tels SAS-suite&commat; (SAS) ou PLUS&commat; (MathSoft). La comparaison des distributions alléliques des SNPs au travers des différentes ethnies de la population aléatoire peut mettre en oeuvre les logiciels ARLEQUIN (D et SAS-suite&commat;.
La présente invention a aussi pour objet un procédé de détermination de la fréquence du polymorphisme de la séquence nucléique identifiée ci-dessus, dans lequel le génotypage est effectué par un miniséquençage avec des ddNTPs chauds (2 ddNTPs différents marqués par des fluorophores différents) et froids (2 ddNTPs non marqués), en liaison avec un lecteur de fluorescence polarisé. Le protocole de miniséquençage avec lecture de fluorescence polarisée (Technologie FP-TDI ou Fluorescence
<Desc/Clms Page number 18>
Figure img00180001

Polarization Template-direct Dye-Terminator Incorporation) est bien connu de l'homme du métier.
Il est réalisé sur un produit obtenu après amplification par PCR de l'ADN de chaque individu, ce produit PCR étant choisi pour couvrir la région génique contenant le SNP étudié comme Il est indiqué à la Figure 1. Après la dernière étape dans le thermocycleur de la PCR, la plaque est alors placée sur un lecteur de fluorescence polarisée pour la lecture des bases marquées en utilisant les filtres d'excitation et d'émission spécifiques des fluorophores. Les valeurs d'intensité des bases marquées sont reportées sur un graphe. Ainsi on obtient jusqu'à quatre catégories, comme indiqué dans la Figure 3.
Les amorces sens et antisens utilisées dans le cas du gène interféron ci. 2 humain correspondent respectivement aux séquences ID SEQ ? Set ! DSEQ ? 6 La présente invention a également pour objet l'utilisation du procédé de détermination du polymorphisme dans la séquence nucléique d'un gène"candidat"décrit précédemment pour la recherche d'une variation de séquence dans un gène"candidat"On entend par"variation"une modification de la séquence nucléique d'un gène"candidat"comme par exemple la présence d'un ou plusieurs polymorphismes de type SNP. La présente invention a donc également pour objet le diagnostic génétique d'une maladie liée à la présente chez un ou plusieurs individus {je la population humaine de l'allèle mutant codé par le SNP fonctionnel La présente invention permet également d'effectuer un diagnostic génétique d'une maladie liée à la présence d'une ou plusieurs mutation (s) sous la forme d'un ou plusieurs allèle (s) mutant (s) codé (s) par un ou plusieurs SNP (s) fonctionnel (s), de constituer une carte de marqueurs génétiques fonctionnels pris en référence ainsi que de mettre en évidence une séquence transgénique (c'est à dire différent de la séquence de référence) portée par ledit allèle mutant dans la séquence nucléique d'un gène"candidat".
La présente invention permet également de constituer une carte de marqueurs génétiques fonctionnels pris en référence pour le développement de tests de pharmacogénétique ou autrement dit pharmacogénomique pour lesquels
<Desc/Clms Page number 19>
Figure img00190001

un profilage génétique des individus recrutés pour des essais cliniques sera effectué à partir des marqueurs SNPs fonctionnels pris en référence afin d'identifier le ou les panels de marqueurs qui permettrons de différencier les individus répondeurs, non répondeurs ou les individus chez lesquels les molécules thérapeutiques testées auront des effets indésirables, dans le but d'optimiser lesdits essais cliniques pour une meilleure efficacité des molécules thérapeutiques
La présente invention permet également de développer des molécules thérapeutiques telles que des anticorps, des vecteurs de thérapie génique et des molécules actives déterminées à partir de la structure de la ou les protéine (s) mutée (s) codée (s) par les ou les allèle (s) muté (s) codé (s) par une ou plusieurs mutation (s) de type SNP fonctionnel reliées à l'apparition ou à la résistance aux maladies communes dans la population pour le traitement de ces mêmes maladies
La présente invention a tout autant pour objet l'utilisation du procédé ci-dessus de détermination du SNP fonctionnel dans la séquence nucléique d'un gène"candidat"pour la mise en évidence de l'ensemble des SNPs fonctionnels de séquence portée par ledit gène"candidat"dans une population aléatoire. Ce qui permet de prédire également l'impact de l'identification de SNP fonctionnel pour le diagnostic/pronostic ou le traitement de ces différentes ethnies.
La présente invention a tout autant pour objet l'utilisation du procédé ci-dessus de détermination de SNPs fonctionnels dans les séquences nucléiques de gènes"candidats"pour la mise en évidence ou la détermination de nouvelles cibles diagnostic/pronostic ou thérapeutiques potentielles dans une population aléatoire pour la prévention et le traitement des maladies communes.
La présente invention a de même pour objet un procédé de détermination de la fonctionnalité d'une protéine mutante issue de la séquence nucléique déterminée par le procédé décrit ci-dessus, dans lequel on compare la fonctionnalité de la protéine issue de ladite séquence nucléique par rapport à la fonctionnalité de la protéine sauvage de référence issue de la séquence
<Desc/Clms Page number 20>
Figure img00200001

nucléique sauvage de référence du gène"candidat".
La présente invention a aussi pour objet l'utilisation du procédé de détermination de SNP fonctionnel dans la séquence nucléique d'un gène "candidat"ci-dessus pour la détermination de la fonctionnalité de ladite séquence génétique mutée codée par l'allèle mutant codé par le SNP fonctionnel par comparaison de la fonctionnalité de la protéine issue de ladite séquence nucléique mutée par rapport à la fonctionnalité de la protéine issue de la séquence nucléique sauvage de référence du gène"candidat". La détermination de la fonctionnalité d'une séquence nucléique dépend de la séquence nucléique prise en référence et appelée gène"candidat". Des outils, par exemple bio-informatiques, permettent une sélection des SNPs fonctionnels qui sont situés dans les séquences régulatrices des gènes"candidats"qui révèlent une modification des séquences connues dans l'art antérieur comme étant importante pour l'expression du gène incluant sans s'y restreindre les TATA et CAT boxes et les sites dits"enhancers".
Une sélection est aussi faite des SNPs fonctionnels qui sont situés dans les séquences codantes des gènes"candidats"et qui révèlent l'apparition d'un codon STOP dans ces séquences et donc un arrêt anormal de la traduction à l'endroit du ou des SNPs fonctionnels. Enfin une sélection est faite parmi tous les SNPs identifiés entre d'une part les SNPs codants qui induisent une modification de la nature des acides aminés des protéines codées par ces gènes, et d'autres part, les SNPs qu ! n'entraînent pas une modification de la nature des acides aminés des protéines codées par ces gènes.
La nature de la modification dans la séquence permet de déterminer s'il y a ou non codage d'un acide aminé différent, et s'il est différent on peut examiner si cet acide aminé est essentiel à la fonction remplie par la protéine correspondante.
On peut en effet déterminer la nature physico-chimique des modifications d'acides aminés révélées par les SNPs codants incluant, l'apparition ou le changement de charge électrique de l'acide aminé et le changement de caractère hydrophile ou hydrophobe de l'acide aminé.
Les acides aminés importants et/ou les domaines pour lesquels
<Desc/Clms Page number 21>
Figure img00210001

une relation avec une activité fonctionnelle de la protéine a été prouvée, ou est suspectée, sont identifiés. Pratiquement cela consiste à répertorier toutes les protéines appartenant à la même famille dans l'espèce humaine ou dans le règne animal et partageant donc les mêmes activités fonctionnelles (homologues, hétérologues ou orthologues) et souvent une structure comparable, au moins au niveau d'un ou plusieurs domaines, puis à générer des alignements multiples. En outre, plusieurs bases de données sont disponibles dans le domaine public qui répertorient ces domaines fonctionnels sous forme de motifs, patterns ou matrices (PROSITE, BLOCKS, PFAM,..) Une recherche exhaustive de la littérature complète l'ensemble, et une attention particulière est portée aux travaux relatant des mutations observées ou induites par mutagenèse dirigée et leurs implications sur la fonction rapportée de la protéine. Des SNPs fonctionnels trouvés dans la séquence de ces acides aminés importants sont particulièrement étudiés.
Il est possible de déterminer l'organisation génomlque du gène à étudier, de localiser les promoteurs, les exons et introns ainsi que les sites dits de"sphcing"à partir de la séquence du gène"candidat". Seules les parties du gène pour lesquelles une recherche de SNP est pertinente pour le partenaire (exemple : exons) sont retenues.
De nouveaux SNPs fonctionnels sont également sélectionnés parmi les SNPs codants lorsque ! a modification de nature d'acide aminé observée pour un SNP codant donné concerne un acide aminé du peptide signal de la protéine codée par le gène"candidat"dans le cas où un peptide signal existe permettant de prédire une modification de l'adressage de la protéine correspondante, ou lorsque le SNP codant révèle la modification d'un acide aminé qui, dans la description de l'art antérieur, est décrit comme important pour la structure de la ou des protéines correspondante (s).
En identifiant les résidus et/ou domaines conservés entre espèces et/ou entre ces protéines et/ou domaines, on peut ainsi prédire in-silico les mutations occasionnées par les SNPs qui sont de nature à affecter l'activité fonctionnelle de la cible.
L'impact de l'allèle mutant révélé par cette dernière sorte de SNP
<Desc/Clms Page number 22>
Figure img00220001

sur la structure fonctionnelle de la protéine correspondante est alors déterminé, par exemple, grâce à un logiciel informatique permettant la modélisation moléculaire des deux types de protéines codées par le SNP fonctionnel, la sauvage de référence et la mutante. Chaque protéine est ici l'expression de chaque allèle du gène"candidat"codé par le SNP fonctionnel
La connaissance préalable selon l'art antérieur de la structure tridimensionnelle de la protéine sauvage de référence et au sein de celle-ci des acides aminés impliqués dans l'activité de celle-ci constitue un avantage qui permet de déterminer de façon fiable la modification provoquée par l'allèle muté codé par le SNP fonctionnel sur la structure et donc la fonction de la protéine.
On peut aussi produire par les méthodes connues la protéine correspondant à la séquence sauvage de référence et la protéine mutée ou mutante correspondant à l'allèle mutant
Par la mise en oeuvre d'un test in vitro par exemple biologique ou pharmacologique approprié, on peut en déduire SI la modification provoquée par l'allèle muté du gène modifie ou non de quelle façon que ce soit la fonction de la protéine codée par le gène"candidat". Egalement peuvent être développés des tests d'expression in vitro (par exemple des tests d'expression de gènes rapporteurs comme celui codant pour la luciférase mis sous contrôle des séquences régulatrices mutées) visant à identifier les allèles mutants qui dans les séquences régulatrices des gènes"candidats"modifient l'expression des dits gènes.
Combinés aux annotations des séquences primaires protéiques, les modèles structuraux des cibles peuvent être construits en utilisant des outils de modélisation de-novo (par exemple SEQFOLD/MSI), d'homologie (exemple : MODELER/MSI), de minimisation des champs de forces (exemples : DISCOVER, DELPHI/MSI), et/ou de dynamique moléculaire (exemple.
CFF/MSI).
Les structures tridimensionnelles des variants peuvent alors être modélisées et les conséquences de ces modifications structurales sur l'activité fonctionnelle de la cible prédites.
Figure img00220002
Dans le cas de l'interféron a 2 humain la détermination de la
<Desc/Clms Page number 23>
Figure img00230001

fonctionnalité se fait par exemple par le test d'activité anti-proliférative de l'interféron a 2 humain sur la lignée humaine tumorale Daudi du lymphom Burkitt (JBC Papers in Press, published on September 12,2000 as Manuscript M006854200).
La présente invention a de même pour objet un procédé de détermination de la fonctionnalité d'une protéine mutante telle qu'obtenue par le procédé décrit ci-dessus pour le développement de tests de diagnostic ou de pronostic des maladies communes.
La présente invention a de même pour objet un procédé de détermination de la fonctionnalité d'une protéine mutante telle qu'obtenue par le procédé décrit ci-dessus pour le développement de molécules thérapeutiques pour le traitement des maladies communes.
Un autre objet notable de l'invention est l'utilisation du procédé de détermination de la fonctionnalité d'une protéine Issue de la séquence nucléique obtenue comme défini ci-dessus pour le diagnostic génétique d'une maladie liée à la présence d'une ou plusieurs mutation (s) de type SNP.
La présente invention a aussi pour objet l'utilisation du procédé de détermination de la fonctionnalité d'une protéine issue de la séquence nucléique obtenue précédemment pour le développement de molécule thérapeutique tel qu'un anticorps, un vecteur de thérapie génique, et une molécule active déterminée à partir de la structure de la ou les protéine (s) mutée (s) codée (s) par les ou les allèle (s) muté (s) codé (s) par une ou plusieurs mutation (s) de type SNP fonctionnel.
La mise en oeuvre de la présente invention permet de sélectionner facilement des fragments d'acides nucléiques intéressants. C'est pourquoi la présente invention a également pour objet des fragments d'acides nucléiques, caractérisés en ce qu'ils contiennent une séquence nucléique révélée par le procédé de détermination d'une variation dans la séquence nucléique d'un gène "candidat"défini ci-dessus et notamment un fragment d'acide nucléique contenant au moins les 567 paires de bases de la séquence nucléique ID SEQ ? 4 de l'interféron a 2, dans laquelle le nucléotide A est muté en nucléotide G en position 211.
Les fragments d'acides nucléiques contenant une séquence nucléique révélée par le procédé de détermination d'une variation dans la séquence nucléique d'un gène"candidat"défini ci-dessus peuvent être obtenus à partir de la séquence sauvage de référence du gène"candidat"par mutation de la ou des paire (s) de bases du ou des SNP (s) déterminé (s) ci dessus par des méthodes bien connues de l'homme du métier et en particulier par mutagenèses dirigée. Le fragment d'acide nucléique contenant au moins les
<Desc/Clms Page number 24>
Figure img00240001

567 paires de bases de la séquence nucléique ID SEQ N 4 de l'interféron a 2, dans laquelle le nucléotide A est muté en nucléotide G en position 211 a été obtenu en modifiant à cette position le nucléotide A en nucléotide G par mutagenèses dirigée la séquence sauvage de référence du gène"candidat".
La présente invention a également pour objet l'utilisation de l'information génétique contenue dans le fragment d'acide nucléique décrit ci- dessus, pour le diagnostic génétique de maladies telles que les divers types de cancers, l'infection par les virus des hépatites B et C, et le virus du SIDA.
Ces fragments d'acides nucléiques peuvent être incorporés dans des vecteurs. C'est pourquoi la présente invention a aussi pour objet un vecteur recombinant comprenant une séquence nucléique ci-dessus et comprenant en outre des régions régulatrices qui sont placées de telle manière que l'expression de ladite séquence nucléique soit possible. Différents types de vecteurs recombinants peuvent être utilisés tels que des vecteurs d'expression dans les bactéries, les cellules mammifères ou les cellules d'insectes comme par exemple les cellules de drosophile
Ces vecteurs recombinants peuvent être utilisés pour transfecter des cellules de façon à obtenir des cellules transformées Ainsi la présente invention a également pour objet une lignée cellulaire transformée à l'aide d'un vecteur ci-dessus. Différents types de lignées cellulaires peuvent être utilisées telles que celles décrites ci-dessus.
La présente invention a également pour objet une protéine issue de la séquence nucléique mutée obtenue par le procédé de détermination du SNP fonctionnel dans la séquence nucléique sauvage d'un gène"candidat"de référence décrit ci-dessus et notamment la protéine correspondant à la séquence peptidique ID SEQ NO7, dans laquelle l'histidine (H) est modifiée en arginine (R) en position 57 de la protéine immature ou en position 34 de la protéine mature dans le cas de l'interféron ce 2 humain.
Il existe de nombreuses manière pour produire la protéine décrite ci-dessus. Préférentiellement, la présente invention a de pour objet un procédé pour la production d'une telle protéine, dans lequel une lignée de cellules transformées défini ci-dessus est cultivée et ladite protéine isolée du milieu de
<Desc/Clms Page number 25>
Figure img00250001

culture. Un tel procédé est bien connu de l'homme du métier.
La présente invention a encore pour objet un anticorps, caractérisé en ce qu'il est obtenu par immunisation d'un animal avec une telle protéine. Un tel procédé est bien connu de l'homme du métier
L'identification de ces SNPs fonctionnels permet ainsi la recherche post-génomique ou post-séquençage du génome humain pour l'identification de cibles thérapeutiques nouvelles qui permettront la mise au point de kits
Figure img00250002

diagnostiques ou pronostiques de ces maladies comme de nouvelles molécules thérapeutiques.
La présente invention a aussi pour objet une molécule active, caractérisée en ce qu'elle est développée à partir d'une protéine ci-dessus pour la prévention ou le traitement de maladies telles que les divers types de cancers, l'infection par les virus des hépatites B et C, et le virus du SIDA
La présente invention a aussi pour objet une protéine telle que CI- dessus, utilisée dans un but diagnostique ou thérapeutique pour la prévention ou le traitement de maladies telles que les divers types de cancers, infection par les virus des hépatites B et C, et le virus du SIDA.
La présente invention a également pour objet des cellules-hôtes comprenant le vecteur recombinant mentionné ci-dessus. L'introduction de séquences nucléiques déterminées ci-dessus peut être effectuée par des méthodes bien connues de l'homme du métièr et dans les manuels de laboratoires tels que Davis et al., Basic Methods in Molecular Biology (1986) et Sambrook et al., Molecular Cloning : A Laboratory Manual, 2eme édition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New-York (1989). Les cellules-hôtes peuvent être des bactéries, des champignons, des levures, des cellules d'insectes, des cellules de plantes ou des cellules animales telles que CHO, COS, HeLa, C127, 3T3, BHK et HEK 293.
Les protéines déterminées ci-dessus peuvent être employées dans des procédés pour déterminer de nouveaux composés ayant un effet positif (activateur) ou négatif (inhibiteur) sur l'activité de ladite protéine. De tels procédés impliquent l'utilisation des cellules-hôtes décrites ci-dessus en présence de composés candidats pour l'expérimentation. La détermination de
<Desc/Clms Page number 26>
Figure img00260001

l'effet produit par ces composés candidats peut être effectuée par des expérimentations telles que par exemple un test de liaison entre le composé candidat et la cellule-hôte, ou un test démontrant l'activation ou l'inhibition d'un signal dont la protéine décrite ci-dessus est responsable dans la cellule-hôte,
La présente invention a donc aussi pour objet une méthode pour l'identification d'agents activateurs ou inhibiteurs de la protéine ci-dessus, comprenant. a) la mise en présence de cellules-hôtes avec un composé à tester et b) la détermination de l'effet activateur généré par le composé à tester sur ladite protéine.
La présente invention a encore pour objet un agent activateur ou inhibiteur identifié par la méthode décrite ci-dessus,
La présente invention a aussi pour objet un médicament renfermant à titre de principe actif une protéine définie précédemment.
La présente invention a aussi pour objet l'utilisation d'une protéine obtenue par le procédé ci-dessus, pour la fabrication d'un médicament pour la prévention ou le traitement de maladies telles que les divers types de cancers, l'infection par les virus des hépatites B et C, et le virus du SIDA
Les conditions préférentielles de mise en oeuvre du procédé de détermination d'une variation dans la séquence nucléique d'un gène"candidat" fonctionnel présélectionné ci-dessus décrites s'appliquent également aux autres objets de l'invention visés ci-dessus.
La Figure 1 représente le principe du miniséquençage qui est effectué lors du génotypage. Les nucléotides ddATP entouré en pointillés sont marqués par le fluorophore Ri 10*. Les nucléotides ddGTP entouré en traits pleins sont marqués par le fluorophore Tamra*
La Figure 2 représente un profil sauvage correspondant à un individu homozygote (en haut) et à représente un profil correspondant à un individu hétérozygote (en bas). Les abscisses représentent le temps de rétention en minutes. Les ordonnées représentent l'intensité en millivolt.
La Figure 3 représente le résultat du génotypage du SNP interféron a 2 H 57R. La base 211 a o 9 est génotypée en Antisens t o c sur le fragment
<Desc/Clms Page number 27>
Figure img00270001

PCR GEA 008F02. Les ordonnées représentent les valeurs mP et correspondent au filtre R110* (ddTTP). Les abscisses représentent les valeurs mP et correspondent au filtre Tamra* (ddCTP).
L'ensemble 1 (en haut à gauche) de 232 individus représente les individus
TT.
L'ensemble 2 (à droite) représente les 4 individus CT.
L'ensemble 3 (en bas à gauche) représente les 7 blancs.
-L'ensemble 4 (au milieu à gauche) représente les 3 individus non génotypés
L'exemple qui suit illustre la présente invention.
Exempte : Détermination d'une variation dans la séquence nucléique du gène codant pour l'interféron alpha 2 humain (INFa2).
Stade a) Présélection de la séquence référence du qène"candidat"
La séquence et l'organisation génomique du gène codant pour l'interféron alpha-2 humain sont déposées sous le nom de"interféron alpha-a" depuis 1994 dans la banque GenBank du NCBI (http ://www. ncbi. nlm nih. gov/), sous le code"J00207". Cette séquence est utilisée comme"séquence sauvage de référence"et les numérotations des positions en nucléotides citées CI après sont relatives à cette séquence. La région codante (CDS) de ce gène comprend 567 paires de bases (pdb) et code pour une protéine de 189 acides aminés.
Les interférons alpha composent une famille excessivement proche en terme de séquences protéiques aussi bien chez l'homme que chez tous les mammifères supérieurs Ceci est tout à fait évident lorsque l'on aligne les séquences de ces protéines par un outil tel que ClustalW. Le résidu H34 est décrit par J Plehler et colI. (Journal of Biological Chemistry ; JBC, sept 2000) comme participant au domaine de liaison de cet interféron sur son récepteur (récepteur-2 des interférons). Il faut noter que cette même histidine en position 34 (H34) dans la protéine mature est à la position 57 (H57) dans la protéine immature. Les deux positions pourront être évoquées pour parler du même acide aminé histidine modifié dans la séquence de l'interféron a 2 humain par le SNP fonctionnel décrit ici. Le travail de J Piehler a consisté à faire de la
<Desc/Clms Page number 28>
Figure img00280001

mutagenèse dirigée systématique en remplaçant plusieurs résidus de cette région par des alanines. Dans le cas de la mutation H34A, J Piehler observe une diminution significative de la capacité de cet interféron à interagir avec son récepteur. La structure déterminée par RMN de l'interféron alpha-2 monomérique est connu et disponible dans la base de données PDB (http ://www. rcsb. org/pdb/), sous le code HTF.
Stade b) Isolation de l'ADN génomlque du gène "candidat" fonctionnel dans une population aléatoire d'individus.
Pour découvrir les SNPs selon la procédure détaillée au-dessous, a été criblée une population d'individus pris au hasard (non sélectionnés sur un critère phénotypique particulier tel que collection de données médicales, cliniques, épidémiologiques, physiologiques ou biologiques) et appelée population aléatoire
Les ADN génomiques des individus de la population testée ont été fournis par l'Institut Coriell aux Etats-Unis.
Les individus se répartissent comme suit :
<Desc/Clms Page number 29>
Figure img00290001
<tb>
<tb> POPULATION <SEP> DESCRIPTION <SEP> NOMBRE <SEP> D'INDIVIDUS
<tb> 1 <SEP> Individu <SEP> du <SEP> Pacifique <SEP> 7
<tb> libérien <SEP> 10
<tb> 3 <SEP> 1 <SEP> Italien <SEP> 10
<tb> 4 <SEP> Mexicain <SEP> 10
<tb> 5 <SEP> Caribéen <SEP> 10
<tb> 6 <SEP> Afro-Américain <SEP> 50
<tb> 7 <SEP> Caucasien <SEP> 50
<tb> 8 <SEP> Chinois <SEP> 10
<tb> 9 <SEP> Indo-Pakistanais <SEP> 9
<tb> 10 <SEP> Moyen-Orient <SEP> 20
<tb> 11 <SEP> Sud-Américain <SEP> (Andes) <SEP> 10
<tb> 12 <SEP> Sud-Américain <SEP> 10
<tb> 13 <SEP> Asie <SEP> du <SEP> Sud <SEP> 10
<tb> 14 <SEP> 5
<tb> 15 <SEP> Grec <SEP> 8
<tb> 16 <SEP> Japonais <SEP> 10
<tb>
Figure img00290002

Les amorces utilisées pour la réaction de polymérisation en chaîne (PCR), sont les suivantes : G008 22F et G008 22R.
Les amorces utilisées pour cloner le gène codant pour l'interféron alpha 2 humain sont les suivantes :
Figure img00290003
<tb>
<tb> 1 <SEP> GenFragm <SEP> TM <SEP> start/stop <SEP> longueur <SEP> séquence
<tb> G008 <SEP> 22F <SEP> 56. <SEP> 03 <SEP> 470 <SEP> 20 <SEP> CACCCATTTCAACCAGTCTA
<tb> G008 <SEP> 22R <SEP> 55. <SEP> 77 <SEP> 1124 <SEP> 19 <SEP> AGCTGGCATACGAATCAAT
<tb>
Notes : F : sens (forward) ; R : antisens (reverse) startlstop : début (sens) ou stop (antisens) des amorces par rapport à la
<Desc/Clms Page number 30>
Figure img00300001

séquence de référence longueur'taille des amorces
La spécificité de ces amorces a été testée et Il est apparu qu'aucun autre fragment de taille comparable n'était attendu autre que celui recherché Ces amorces ont permis d'amplifier le fragment F22G0088GF2 (ID SEQ ? 4 de 655 pdb), dont la séquence est donnée ci-après (en gras, la séquence codante correspondant à ID SEQ ? 3) F22G008GF2
Figure img00300002

cacccatttcaaccagtctagcagcatctgcaacatctacaatggccttgacctttgctttactggtggccct cctggtgctcagctgcaagtcaagctgctctgtgggctgtgatctgcctcaaacccacagcctgggta gcaggaggaccttgatgctcctggcacagatgaggagaatctctcttttctcctgcttgaaggacaga catgactttggatttccccaggaggagtttggcaaccagttccaaaaggctgaaaccatccctgtcctc catgagatgatccagcagatcttcaatctcttcagcacaaaggactcatctgctgcttgggatgagacc ctcctagacaaattctacactgaactctaccagcagctgaatgacctggaagcctgtgtgatacaggg ggtgggggtgacagagactcccctgatgaaggaggactccattctggctgtgaggaaatacttccaa agaatcactctctatctgaaagagaagaaatacagcccttgtgcctgggaggttgtcagagcagaaat catgagatctttttctttgtcaacaaacttgcaagaaagtttaagaagtaaggaatgaaaactggttcaac atggaaatgattttcattgattcgtatgccagct
Dans le cas de l'interféron alpha 2, deux fragments ont été sélectionnés et nommés F1 (ID SEQ NO 4) et F2 (ID SEQ ? 3). F2 (ID SEQ NO 3) recouvre les séquences codantes du gène. Nous présentons ici les résultats obtenus lors de l'analyse du fragment codant F2 (GEA008F02).
Matériels' Eau autoclavée Tampon PCR 10x (livre avec l'enzyme) GIBCO MgSO4 50mM Enzyme Taq Platinum 5U/ul dNTP100mM
<Desc/Clms Page number 31>
Amorces F et R ADN génomique 1 ng/ul Plaque 96 puits (Costar) Plaque 384 puits (ABGene)
Réaction PCR : x plaques 96 puits ou 384 puits par fragment à amplifier suivant le nombre d'individus à tester.
Figure img00310001
<tb>
<tb>
Produit <SEP> Utilisée <SEP> Conc. <SEP> Finale <SEP> Vol/puits <SEP> ( l)
<tb> Tampon <SEP> Gibco <SEP> 11304-029 <SEP> 10X <SEP> 1X <SEP> 2,5
<tb> MgSO4 <SEP> Gibco <SEP> 50 <SEP> mM <SEP> 11304-029 <SEP> 50 <SEP> mM <SEP> 0. <SEP> 02 <SEP> M <SEP> 1,075
<tb> dNTP <SEP> Gibco <SEP> 10297-018 <SEP> 10 <SEP> mM <SEP> 0,2 <SEP> mM <SEP> 0,5
<tb> Primer <SEP> F <SEP> Gibco <SEP> 10 <SEP> M <SEP> 0,2 <SEP> M <SEP> 0,5
<tb> Primer <SEP> R <SEP> Gibco <SEP> 10 <SEP> M <SEP> 0,2 <SEP> M <SEP> 0,5
<tb> H2O <SEP> 14,85
<tb> Enzyme <SEP> Gibco <SEP> 5U/ l <SEP> 11304-029 <SEP> 5 <SEP> U/ l <SEP> 0,375 <SEP> U <SEP> 0,075
<tb> ADN <SEP> 1 <SEP> ng/ l <SEP> 5
<tb> Vol <SEP> final <SEP> 25
<tb>
Programmation des thermocycleurs (Tetrad MJ research) :
Figure img00310002
<tb>
<tb> 1 <SEP> le <SEP> : <SEP> 94 C <SEP> 1 <SEP> min
<tb> 35 <SEP> cycles. <SEP> 940C <SEP> 15 <SEP> sec
<tb> 56OC <SEP> 30 <SEP> sec
<tb> 68 C <SEP> 1 <SEP> min
<tb>
Après le test des amplifiats sur gel d'agarose 2%, les produits amplifiés sont dénaturés sur Thermocycleurs (Tetrad de MJ Research) suivant le programme de cycles :
<Desc/Clms Page number 32>
Figure img00320001
<tb>
<tb> 1 <SEP> cycle <SEP> : <SEP> 95 C <SEP> 3 <SEP> min
<tb> 1 <SEP> cycle <SEP> : <SEP> 95OC <SEP> 1 <SEP> min
<tb>
Figure img00320002

puis une série de cycles en diminuant la température de 1, 6OC/cycle jusqu'à 25OC).
Une fois dénaturés, les échantillons sont multiplexés par trois sur plaque 96 puits.
Stade c) Etude de la séquence ADN de chaque individu
Les produits de la PCR ont été analysé par DHPLC (chromatographie liquide haute performance dénaturante).
Tampon A : pour 1 litre, - 250 l d'acétonitrile (ACN)
50 ml de Triéthylammonium (TEAA) 2M Tampon B : pour 1 litre,
250 ml d'acétonitrile (ACN)
50 ml de Triéthylammonium (TEAA) 2M
La colonne est équilibrée sous des conditions de tampon suivantes :
50% de Tampon A
50% de Tampon B avec un flux programme de 0,9 ml/min
Les performances de la colonne sont testées : d'une part à 50 C par injection de 5 J de pUC 18 digéré par l'enzyme de restriction Hae I avec un flux de tampon de 0, 75ml/1 et un gradient de 43% de tampon B et 57% de tampon A, d'autre part à 65 C par injection de 5 l d'un standard de mutation avec un flux de tampon de 0, 9ml/p. ! et un gradient de 47% de tampon B et 53% de tampon
A.
L'étude des séquences par le logiciel Wave Maker# (Transgénomique Inc.) a au préalable donné des informations sur la
<Desc/Clms Page number 33>
Figure img00330001

température et le gradient de tampon suivant lesquels doivent être traités les échantillons. Des tests d'essai sont réalisés afin d'établir les conditions effectives d'analyse des séquences.
Donc avec la ou les température (s) et les conditions de Gradient en Tampon A et B, 3tI de chacun des 96 échantillons sont analysés durant 14 heures sur les machines DHPLC appelées Waves# (Transgénomique Inc.)
L'analyse des fragments nécessite des températures particulières accompagnées des gradients en Tampon indiqués dans le tableau ci-dessous, obtenues par le logiciel Wave Maker# (Transgénomique Inc.)
Figure img00330002
<tb>
<tb> Temps <SEP> %C <SEP> Flux
<tb> (min) <SEP> (ml/min)
<tb> 0 <SEP> 45 <SEP> 55 <SEP> 0 <SEP> 0,9
<tb> 0,1 <SEP> 40 <SEP> 60 <SEP> 0 <SEP> 0,9
<tb> 4,1 <SEP> 32 <SEP> 68 <SEP> 0 <SEP> 0,9
<tb> 4,2 <SEP> 0 <SEP> 100 <SEP> 0 <SEP> 0,9
<tb> 4,7 <SEP> 0 <SEP> 100 <SEP> 0 <SEP> 0,9
<tb> 4,8 <SEP> 45 <SEP> 55 <SEP> 0 <SEP> 0,9
<tb> 6,8 <SEP> 45 <SEP> 55 <SEP> 0 <SEP> 0,9
<tb>
Figure img00330003

La colonne équilibrée est testée avec les conditions proposées par le Wave Maker# (Transgénomique Inc.). Ces conditions sont rendues effectives lors de l'analyse définitive du fragment F2 des échantillons.
Les chromatogrammes obtenus sont ensuite analysés.
L'analyse des profils chromatographiques obtenus a permis de détecter des hétérozygotes et des homozygotes parmi les individus de la population testée sur la base de chromatogrammes ou encore"profils"de formes différentes. Certains profils ont permis d'établir des familles (groupes) d'individus présentant des chromatogrammes similaires.
Un profil sauvage correspondant à un individu homozygote (chromatogramme de la Figure 2 (partie du haut).
Un profil différent correspondant à un individu hétérozygote (chromatogramme de la Figure 2 (partie du bas)).
<Desc/Clms Page number 34>
Figure img00340001
Stade d) Séquençage des ADN de chaque groupe.
On procède ensuite au séquençage des produits PCR, par capillaire sur les séquenceurs ABI-PRISM 3700 DNA, correspondant aux profils hétérozygotes Protocole de séquençaqe sur la base d'une plaque 96 puits.
Purification des produits PCR :
On pèse 50g de Biogel P100 Fine. On suspend dans 1 litre d'eau ultra-pure On laisse reposer 8 heures. On agite On remplit une plaque"fond filtrant"multiscreen (Biogel P100 Fine) : 400 ml par puits. On superpose sur une plaque de récupération. On centrifuge 500 g, 3 min On remplace la plaque de récupération par 1 plaque neuve Greiner, on superpose à l'aide d'un adaptateur Millipore. Les produits de PCR sont déposés sur la P100. On centrifuge à 500 g, 4 min. On conserve à-20 C Réaction de séquençaqe :
Le séquençage consiste en une nouvelle réaction PCR. Une réaction de séquençage correspond aux proportions suivantes par puits contenant le multiplex à partir de trois individus différents de fragments amplifiées pour la détection de SNP par DHPLC.
1 due Big Dye Terminator - 1 l de tampon 5X (tris-HCI 400mM // MgCl2 10mM)
10 ng de produits de PCR pour 100 pb (paires de bases).
6 pot de Primer
H2Oqsp10 l.
On centrifuge brièvement.
Cycles de Réaction :
Dénaturation 95 C/5 min - 95OC/10 sec
Figure img00340002

Tm/5sec - min 25 cycles. Durée : 2, 5 heures.
<Desc/Clms Page number 35>
Figure img00350001
Purification des produits de séquençage : On pèse 50g de Sephadex G50 Super-Fine. On suspend dans 1 litre d'eau ultra-pure. On laisse reposer 8 heures. On agite. On remplit une plaque"fond filtrant"multiscreen (de Sephadex G50 Super-Fine) : 400 ml par puits On superpose sur une plaque de récupération. On centrifuge 1500 g, 2 min. On remplace la plaque de récupération par une plaque neuve"Optical", spéciale, machine de séquençage capillaire ABI-PRISM 3700 DNA Dans la plaque sortante de réaction de séquençage, on ajoute 10 nul d'eau ultra-pure par puits. On verse les produits de séquençage ainsi dilués sur la G50. On centrifuge à 1200 g, 3 min. On conserve à-20 C.
Miqration des échantillons'
La migration se fait sur le séquenceur à capillaires ABI-PRISM 3700 DNA
On analyse avec les modalités suivantes : On récupère la plaque "Optical"contenant les échantillons et on la recouvre d'un film en aluminium adhésif On place la plaque sur un portoir adapté au séquenceur capillaire ABIPRISM 3700 DNA, et on met le tout dans un cadran A, B, C ou D libre. On vérifie les niveaux de tampon, d'eau, de polymère, d'isopropanol. On les ajuste si besoin est.
Dans le menu START, onglet PE Biosystems, sous-dossier"3700 Programs", on ouvre"Data Collection. Dans l'onglet"Plate set up", on importe la feuille de route en cliquant sur"import". On attribue la feuille de route en cliquant sur le cadran contenant un grand point d'interrogation, cadran qui correspond à la plaque à séquencer. Lorsqu'elle est active, on clique sur la flèche verte. Durée de fessai : 4 heures.
Contrôle des séquences :
Dans le menu START, onglet PE Biosystems, on ouvre"Data Extraxtor". On clique sur"Extract Now". Dans le menu START. onglet PE Biosystems, on ouvre"Sequencing Analysis 3.6". On clique sur"add files"et on
<Desc/Clms Page number 36>
Figure img00360001

importe les séquences précédemment extraites. On ouvre les séquences une par une et on vérifie la qualité des éléctrophorégrammes c'est à dire la qualité de migration des séquences dans les capillaires, la longueur de lecture, on estime le pourcentage de séquences lisibles. On transfère les séquences dans le réseau informatique, fichier"Sequencing-Séquences Discovery", pour identification des SNP.
A l'aide des séquences, et par le logiciel d'analyse des séquences "PolyPhred", ont été identifiées la nature nucléotidique et la position du polymorphisme. A la position 680 de la séquence sauvage de référence du gène codant pour l'interféron alpha 2, une base A est remplacée par G dans un pool de 3 individus dans la population aléatoire. La superposition des pics est Informatrice du SNP.
Stade e) Génotypage d'un SNP fonctionnel.
Une fois le SNP identifié, il est analysé pour identifier S'li modifie un acide aminé présent sur la protéine mature Modification Acide Aminé.
H57R (Histidine modifié en Arginine en position 57 de la protéine immature ou en 34 de la protéine mature)
Technique utilisée. miniséquençage fluorescent. Technologie FP-TDI ou
Fluorescence Polarization Template-direct Dye-terminator Inc.
Principe du miniséquençage : Le génotypage de SNPs est basé sur le principe du miniséquençage dont le produit est détecté par une lecture de fluorescence polarisée. Le miniséquençage consiste à allonger un oligonucléotide, placé juste en amont du site polymorphe, par des didéoxynucléotides fluoromarqués à l'aide d'une enzyme polymérase comme illustré à la Figure 1. Le résultat de cet allongement est directement analysé par une lecture de fluorescence polarisée.
Etapes du protocole :
Le miniséquençage est réalisé sur un produit obtenu après amplification par PCR à partir de l'ADN génomique de chaque individu de la population aléatoire d'un fragment de séquence du gène interféron a 2 qui porte
<Desc/Clms Page number 37>
Figure img00370001

le SNP fonctionnel. Ce produit PCR est choisi pour couvrir la région génique contenant le SNP étudié. Ensuite, on élimine les amorces de PCR et les dNTPs non incorporés avant de réaliser le miniséquençage. Toutes ces étapes, ainsi que la lecture, sont réalisées dans la même plaque.
Le génotypage requiert donc 5 étapes : 1) Amplification par PCR 2) Purification du produit de PCR par digestion enzymatique 3) Elongation de l'oligonucléotide 4) Lecture 5) Interprétation de la lecture 1) L'amplification PCR de la séquence du gène Interféron a 2 qui couvre la région génique contenant le SNP fonctionnel se fait à l'aide des mêmes amorces que celles utilisées pour l'identification des SNPs On réalise donc l'amplifiat PCR pour chaque individu de la population aléatoire comme décrit dans l'étape de la découverte du SNP fonctionnel ci-dessus. Cet amplifiat servant de matrice pour la réaction de miniséquençage qui sert à génotyper les individus pour le SNP fonctionnel. On réalise l'amplification PCR dans la même plaque. Le volume réactionnel est de 5 ut comme décrit dans le tableau suivant :
<Desc/Clms Page number 38>
Figure img00380001
<tb>
<tb> Conc. <SEP> Vol. <SEP> par <SEP> Conc.
<tb>
Fournisseur <SEP> Réactif
<tb> initiale <SEP> tube <SEP> ( l) <SEP> finale
<tb> Life <SEP> Technologie <SEP> Livré <SEP> avec <SEP> Taq <SEP> Tampon <SEP> (X) <SEP> 10 <SEP> 0, <SEP> 5 <SEP> 1
<tb> Life <SEP> Technologie <SEP> Livré <SEP> avec <SEP> Taq <SEP> MgSO4 <SEP> (mM) <SEP> 50 <SEP> 0, <SEP> 2 <SEP> 2
<tb> AP <SEP> Blotech <SEP> 27-2035-03 <SEP> Dntp <SEP> (mM) <SEP> 10 <SEP> 0,1 <SEP> 0,2
<tb> Life <SEP> Technologie <SEP> Sur <SEP> demande <SEP> Amorce <SEP> F <SEP> (uM) <SEP> 10 <SEP> 0,1 <SEP> 0,2
<tb> Life <SEP> Technologie <SEP> Sur <SEP> demande <SEP> ( M) <SEP> 10 <SEP> 0,1 <SEP> 0,2
<tb> Life <SEP> Technologie <SEP> 11304-029 <SEP> Taq <SEP> platinium <SEP> 5U/ l <SEP> 0,02 <SEP> 0,1 <SEP> U/
<tb> réaction
<tb> H2O <SEP> Qsp <SEP> 5 <SEP> l <SEP> 1,98
<tb> ADN <SEP> 2,5 <SEP> ng/ l <SEP> 2 <SEP> 5ng/
<tb> réaction
<tb> Vol <SEP> final <SEP> 5 <SEP> 111
<tb>
Figure img00380002

Ces réactifs sont distribués dans une plaque PCR noire à 384 puits fournie par ABGene (ref : TF-0384-k). Une fois remplie, la plaque est scellée, centrifugée puis placée dans un thermocycleur pour plaque 384 (Tetrad de MJ Research) et subit l'incubation suivante : Cycles de PCR : 1 min à 94 DC, suivi de 36 cycles composés de 3 étapes (15sec à 94 C, 30sec à 56 C, 1 min à 68 C).
2) La PCR est ensuite purifiée à l'aide de deux enzymes que sont la phosphatase alcaline de crevette (ou Shrimp Alkaline Phosphatase SAP) et l'exonucléase 1 (Exo 1). La première de ces enzymes permet la déphosphorylation des dNTPs non incorporés au cours de la PCR, tandis que la seconde élimine les résidus simple brin d'ADN et donc les amorces non utilisées au cours de la PCR Cette digestion se fait par addition dans la plaque de PCR d'un mélange réactionnel de 5 u ! préparé comme décrit dans le tableau suivant :
<Desc/Clms Page number 39>
Figure img00390001
<tb>
<tb> Fournisseur <SEP> Référence <SEP> Réacif <SEP> Conc. <SEP> Vol. <SEP> par <SEP> Conc.
<tb> initiale <SEP> tube <SEP> (ui) <SEP> finale
<tb> AP <SEP> Biotech <SEP> E70092X <SEP> SAP <SEP> 1 <SEP> U/ l <SEP> 0,5 <SEP> 0,5/
<tb> réaction
<tb> 1/
<tb> AP <SEP> Biotech <SEP> 070073Z <SEP> Exo <SEP> 1 <SEP> 10 <SEP> U/ l <SEP> 0,1
<tb> réaction
<tb> AP <SEP> Biotech <SEP> Fourni <SEP> Tampon <SEP> 10 <SEP> 05 <SEP> 1
<tb> avec <SEP> SAP <SEP> SAP <SEP> (X)
<tb> H2O <SEP> Qsp <SEP> 5 <SEP> l <SEP> 3,9
<tb> PCR <SEP> 5 <SEP> l
<tb> Vol <SEP> final <SEP> 10 <SEP> l
<tb>
Figure img00390002

Une fois remplie, la plaque est scellée, centrifugée puis placée dans un thermocycleur pour plaque 384 (Tetrad de MJ Research) et subit l'incubation suivante : Digestion SAP-EXO : 45 min à 37 C, 15min à 80 C.
3) L'étape d'élongation ou de miniséquençage est ensuite réalisée sur ce produit de PCR digéré, par addition d'un mélange réactionnel préparé comme indiqué dans le tableau suivant :
Figure img00390003
<tb>
<tb> Fournisseur <SEP> Référence <SEP> Réactif <SEP> Conc <SEP> Vol <SEP> par <SEP> Conc
<tb> initiale <SEP> tube <SEP> ( l) <SEP> finale
<tb> Propre <SEP> Tampon <SEP> Elongation <SEP> 5
<tb> préparation <SEP> (X)
<tb> Life <SEP> 100,5
<tb> 1Sur <SEP> demande <SEP> Amorce <SEP> Miniseq <SEP> ( M)
<tb> Technologies
<tb> **ddNTPs <SEP> ( M)
<tb> 27-2051 <SEP> 025 <SEP> 0,125
<tb> AP <SEP> Biotech
<tb> (61, <SEP> 71, <SEP> 81)-01 <SEP> 2 <SEP> froids <SEP> de <SEP> chaque <SEP> de <SEP> chaque
<tb> **ddNTPs <SEP> ( M)
<tb> NEN <SEP> Nel <SEP> 472/5 <SEP> 2 <SEP> marqués <SEP> 2,5 <SEP> 0,25 <SEP> 0,125
<tb> et <SEP> Nel <SEP> 492/5 <SEP> de <SEP> chaque <SEP> de <SEP> chaque
<tb> Tamra <SEP> et <SEP> R110
<tb> 0,4 <SEP> U/
<tb> AP <SEP> Biotech <SEP> E79000Z <SEP> 0,125
<tb> Thermo-sequenase <SEP> réaction
<tb> H2O <SEP> 3,125
<tb> PCR <SEP> digérée <SEP> 10 <SEP> l
<tb> Vol <SEP> final <SEP> 15 <SEP> l
<tb>
Le tampon élongation 5X est composé de Tris-HCI pH 9 à 250 mM, de
KCI à 250 mM, de NaCl à 25 mM, de MgCI2 à 10 mM et de glycérol à 40%.
<Desc/Clms Page number 40>
Figure img00400001
** Pour les ddNTPs, un mélange des 4 bases est réalisé en fonction du polymorphisme étudié. Seulement les 2 bases d'intérêts (A/G) composant le SNP fonctionnel portent un marquage soit en Tamra, soit en Ri 10 ex
SNP A/G : le mélange de ddNTP est composé de : -2,5 MdeddCTPfroid, -2,5 MdeddTTPfroid,
Figure img00400002

- 2, 5 uM de ddATP (1, 825 uM de ddATP froid et 0, 625 uM de ddATP marqué au Tamra), - 2. 5 uM de ddGTP (1, 825 uM de ddATP froid et 0, 625 uM de ddATP marqué au R110).
Une fois remplie, la plaque est scellée, centrifugée puis placée dans un thermocycleur pour plaque 384 puits (Tetrad de MJ Research) et subit l'incubation suivante : Cycles d'élongation : 1 min à 93OC, suivi de 35 cycles composés de 2 étapes (10 sec à 93 C, 30 sec à 55OC) Après la dernière étape dans le thermocycleur, la plaque est directement placée sur un lecteur de fluorescence polarisée de type Analyst&commat; HT de LJL Blosystems Inc.. La plaque est lue à l'aide du logiciel Criterion Host# en utilisant deux méthodes. La première permet de lire la base marquée en Tamra en utilisant les filtres d'excitation et d'émission spécifiques de ce fluorophore (excitation 550-10 nm, émission 580-10 nm) et la seconde permet de lire la base marquée en R110 en utilisant les filtres d'excitation et d'émission spécifiques de ce fluorophore (excitation 490-10 nm, émission 520-10 nm). Dans les deux cas un miroir double dichroïque (R1O/Tamra) est utilisé et les autres paramètres de lecture sont : Z-height : 1,5 mm Attenuator : out Temps d'intégration : 100, 000 usée Raw data units : counts/sec Switch polarization : by well Plate settling time : 0 msec PMT setup : Smart Read (+), sensitivity 2 Dynamic polarize : emission
<Desc/Clms Page number 41>
Figure img00410001

Static polarizer : S Un fichier résultat est alors obtenu contenant les valeurs calculées de mP pour le filtre Tamra et celle pour le filtre RHO. Ces valeurs de mP sont calculées à partir des valeurs d'intensité obtenues sur le plan parallèle (//) et sur le plan perpendiculaire (-L) d'après la formule suivante : mP =1000 (//-g. l)/ (// + g. JL).
Dans ce calcul la valeur sur le filtre 1-est pondérée d'un facteur g. Celui-ci
Figure img00410002

est un paramètre m, achine qul dolt être déterminé préalablement expérimentalement 4) et 5) Interprétation de la lecture et détermination des génotypes.
Les valeurs de mP sont reportées sur un graphe à l'aide du logiciel Excel de Microsoft Inc., soit maintenant du logiciel AlleleCarrer&commat; développé par
LJL Biosystems Inc En abscisse est indiquée la valeur de mP de la base marquée au Tamra, en ordonnée est indiquée la valeur de mP de la base marquée au Ri 10. Une forte valeur de mP indique que la base marquée avec ce fluorophore est incorporée et, inversement, une faible valeur de mP révèle l'absence d'incorporation de cette base. On obtient jusqu'à quatre catégories comme indiquées dans la Figure 1. L'utilisation du logiciel AlleleCarrer&commat; permet, une fois le repérage des différentes catégories fait, d'extraire directement le génotype défini pour chaque individu sous forme d'une table.
Les séquences des deux amorces de miniséquençage nécessaires pour le génotypage ont été déterminés. Ces amorces sont sélectionnées pour correspondre aux 20 nucléotides placés juste en amont du site polymorphe.
Du fait que le produit de PCR contenant un SNP est un produit d'ADN double brin, le génotypage peut donc se faire soit sur le brin sens soit sur le brin antisens. Les amorces sélectionnées sont fabriquées par Life
Technologies Inc.. Le miniséquençage du SNP A211G du fragment
GEA008F02 a d'abord été validé sur 16 échantillons puis génotypé sur l'ensemble de la population aléatoire composée de 239 individus et 10 blancs.
<Desc/Clms Page number 42>
Figure img00420001
Les amorces du miniséquençaqe sont les suivantes : Amorce sens : (ID SEQ ? 5) GEA008F02A211 UP : ctcctgcttgaaggacagac Amorce antisens : (ID SEQ ? 6) GEA008F02A211LO : cctggggaaatccaaagtca Conditions de miniséquençage testées Condition N 1 Amorce sens + ddATP-R110 + ddGTP-Tamra Condition N 2 : Amorce sens + ddGTP-R110 + ddATP-Tamra
Figure img00420002

Condition NO3 : Amorce antisens + ddTTP-R110 + ddCTP-Tamra Condition ? 4 : Amorce sens + ddCTP-RHO + ddTTP-Tamra Ces 4 conditions ont été testées et la condition N 3 a été retenue pour le génotypage.
Résultats :
Le génotypage de la population aléatoire a été réalisée en utilisant la condition décrite précédemment. Les ADN génomiques des individus de la population aléatoire (voir stade b) de l'exemple 1) ont été fournis par l'Institut Coriell aux Etats-Unis.
Après la réalisation complète processus de génotypage, la détermination des génotypes des individus de la population aléatoire pour la
Figure img00420003

SNP fonctionnel étudié ici a été réalisée à l'aide du graphe représenté sur la Figure 3. Ce génotype est en théorie soit homozygote M, soit hétérozygote
Figure img00420004

AG, soit homozygote GG chez les individus testés. En réalité et comme montré ci-dessous, le génotype homozygote GG n'est pas détecté dans la population aléatoire.
Les résultats des contrôles, de la répartition des génotypes déterminés dans la population aléatoire et le calcul des différentes fréquences alléliqus pour ce SNP fonctionnel sont présentés dans le tableau suivant :
Figure img00420005
<tb>
<tb> Nombre <SEP> de
<tb> testés <SEP> génotypés <SEP> testés <SEP> validés <SEP> réussite
<tb> 239 <SEP> 236 <SEP> 7 <SEP> 7 <SEP> 99,2
<tb>
<Desc/Clms Page number 43>
Figure img00430001
<tb>
<tb> Répartition <SEP> des <SEP> génotypes
<tb> Nombre <SEP> de <SEP> TT <SEP> Nombre <SEP> de <SEP> TC <SEP> Nombre <SEP> de <SEP> CC
<tb> 232 <SEP> 4 <SEP> 0
<tb> (à <SEP> gauche <SEP> du <SEP> graphe) <SEP> (à <SEP> droite <SEP> du <SEP> graphe)
<tb> Fréquence <SEP> Génotypique <SEP> (%) <SEP> fréquence <SEP> Allélique <SEP> (%)
<tb> TT <SEP> TC <SEP> CC <SEP> T <SEP> C
<tb> 98,3 <SEP> 1,7 <SEP> 0 <SEP> 99,2 <SEP> 0,8
<tb>
Figure img00430002

Définition de la fréquence àllélique ou génotypique : c'est la fréquence, d'un allèle ou d'un génotype donné, estimée dans une population.
Il faut préciser que l'allèle T lu en antisens correspond à l'allèle A lu en sens, soit à la présence d'une histidine en position 57 de l'INF alpha 2 et donc que l'allèle C lu en antisens correspond à l'allèle G lu en sens correspondant à une arginine pour cette position dans la séquence de la protéine correspondante.
En examinant ces résultats par population, on constate que les 4 individus hétérozygotes sont tous issus d'une seule sous-population ou groupe ethnique, la sous-population"Afro-américaine"de la population aléatoire.
L'analyse de ce SNP fonctionnel dans cette population est la suivante.
Figure img00430003
<tb>
<tb>
Répartition <SEP> des <SEP> génotypes <SEP> Fréquence <SEP> Génotypique <SEP> (%) <SEP> Fréquence <SEP> Allélique <SEP> (%)
<tb> 1 <SEP> Nbrede <SEP> Nbre <SEP> de'Nbre <SEP> deTTTCCCT'C
<tb> TT <SEP> TC <SEP> CC
<tb> 45 <SEP> 4 <SEP> 0 <SEP> 91, <SEP> 8 <SEP> 82 <SEP> 0 <SEP> 95, <SEP> 9 <SEP> 4, <SEP> 1
<tb>

Claims (33)

REVENDICATIONS
1. Procédé de détermination d'un ou plusieurs polymorphismes de type SNP fonctionnels dans la séquence nucléique d'un gène"candidat" présélectionné dans lequel : a) on isole le fragment d'acides nucléiques génomiques du gène"candidat"d'un nombre significatif d'individus choisis de manière aléatoire dans la population, b) on procède à une analyse comparative de la séquence nucléique des individus étudiés, c) on classe les séquences nucléiques identiques dans des groupes homogènes, et d) on identifie le SNP fonctionnel de la séquence nucléique de groupe (s) hétérozygote (s) par rapport à la séquence nucléique du gène"candidat"de référence
2. Procédé selon la revendication 1, dans lequel le gène "candidat"est le gène de l'interféron a 2 humain.
3. Procédé selon l'une quelconque des revendications 1 à 2, dans lequel le nombre significatif d'individus choisis de manière aléatoire dans la population est supérieur à 100.
4. Procédé selon l'une quelconque des revendications 1 à 3, dans lequel la séquence nucléique du gène"candidat"d'un nombre significatif d'individus choisis de manière aléatoire dans la population est isolée par une réaction de PCR.
5. Procédé selon la revendication 4, caractérisé en ce que la PCR est effectuée à partir des amorces correspondant aux séquences ID SEQ N 1 et ID SEQ N 2.
6. Procédé selon l'une quelconque des revendications 1 à 5, dans lequel l'analyse comparative de la séquence nucléique des individus étudiés est effectuée grâce à une méthode de multiplexage utilisant la chromatographie liquide haute performance en condition dénaturante (DHPLC).
7. Procédé selon l'une quelconque des revendications 1 à 6, dans lequel le classement des séquences nucléiques identiques dans des groupes homogènes d'homozygotes et d'hétérozygotes est effectuée par
<Desc/Clms Page number 45>
l'analyse des profils obtenus par les chromatogrammes résultant de la DHPLC.
Figure img00450001
8. Procédé selon l'une quelconque des revendications 1 à 7, dans lequel l'identification des deux allèles de chaque SNP fonctionnel de la séquence nucléique de chaque groupe hétérozygote par rapport à une séquence sauvage du gène"candidat"de référence est effectuée par séquençage des séquences nucléiques ou des fragments de séquences nucléiques.
9. Procédé selon l'une quelconque des revendications 1 à 8, dans lequel on procède en outre à une modélisation moléculaire bioinformatique.
10. Procédé selon l'une quelconque des revendications 1 à 9, dans lequel on procède en outre à un génotypage des individus d'une population aléatoire.
11. Procédé selon la revendication 10, dans lequel le génotypage est effectué par un miniséquençage.
12. Procédé selon la revendication 11, caractérisé en ce que les amorces sens et antisens utilisées correspondent respectivement aux séquences ID SEQ ? 5 et) D SEQ NO 6.
13. Utilisation du procédé selon l'une quelconque des revendications 1 à 12 pour la recherche d'une variation de séquence dans un gène"candidat".
14. Utilisation du procédé selon l'une quelconque des revendications 1 à 12 pour le diagnostic génétique d'une maladie liée à la présence chez un ou plusieurs individus de la population humaine de l'allèle mutant codé par le SNP fonctionnel.
15. Utilisation du procédé selon l'une quelconque des revendications 1 à 12 pour la constitution d'une carte de marqueurs génétiques.
16. Utilisation du procédé selon l'une quelconque des revendications 1 à 12 pour la mise en évidence d'une séquence transgénique portée par ledit gène"candidat".
17. Utilisation du procédé selon l'une quelconque des revendications 1 à 12 pour la mise en évidence de l'ensemble des
<Desc/Clms Page number 46>
polymorphismes de séquence de type SNP fonctionnel portée par ledit gène "candidat"dans une population donnée.
Figure img00460001
18. Procédé de détermination de la fonctionnalité d'une protéine issue de la séquence d'un allèle mutant codé par un SNP fonctionnel déterminé selon l'une quelconque des revendications 1 à 12, dans lequel on compare la fonctionnalité de la protéine issue de ladite séquence nucléique par rapport à la fonctionnalité de la protéine issue de la séquence nucléique sauvage de référence du gène"candidat".
19. Utilisation du procédé selon l'une quelconque des revendications 1 à 12 pour la détermination de la fonctionnalité de ladite séquence génétique codée par l'allèle muté par comparaison de la fonctionnalité de la protéine issue de ladite séquence nucléique mutée par rapport à la fonctionnalité de la protéine issue de la séquence nucléique sauvage de référence du gène"candidat".
20. Utilisation du procédé de détermination de la fonctionnalité d'une protéine issue de la séquence nucléique obtenue selon la revendication 18 pour le diagnostic génétique d'une maladie liée à la présence d'une ou plusieurs mutation (s) de type SNP fonctionnel.
21. Utilisation du procédé de détermination de la fonctionnalité d'une protéine issue de la séquence nucléique obtenue selon la revendication 18 pour le développement de molécule thérapeutique tel qu'un anticorps, un vecteur de thérapie génique, et une molécule active déterminée à partir de la structure de la ou les protéine (s) mutée (s) codée (s) par les ou les allèle (s) muté (s) codé (s) par une ou plusieurs mutation (s) de type SNP fonctionnel.
22. Fragment d'acide nucléique contenant au moins les 567 paires de base de la séquence nucléique ID SEQ NO4, dans laquelle le nucléotide A est muté en nucléotide G en position 211.
23. Utilisation d'un fragment d'acide nucléique selon la revendication 22, pour le diagnostic génétique de maladies telles que les divers types de cancers, l'infection par les virus des hépatites B et C, et le virus du SIDA.
24. Vecteur recombinant comprenant une séquence nucléique
<Desc/Clms Page number 47>
selon la revendication 22, comprenant en outre des régions régulatrices qui sont positionnées de telle manière que l'expression de ladite séquence nucléique soit possible dans les bactéries ou dans les cellules de mammifères ou d'insectes.
Figure img00470001
25. Lignée de cellules transformées par le vecteur recombinant selon la revendication 24.
26. Protéine selon la séquence peptidique ID SEQ NO7, dans laquelle l'histidine (H) est modifiée en arginine (R) en position 57 de la protéine interféron a 2 immature ou en position 34 de la protéine interféron a 2 mature.
27. Procédé pour produire la protéine définie dans la revendication 26, dans lequel une lignée de cellules selon la revendication 25 est cultivée et ladite protéine est isolée du milieu de culture.
28. Anticorps, caractérisé en ce qu'il est obtenu par immunisation d'un animal avec une protéine définie selon la revendication 26.
29. Utilisation d'un protéine définie selon la revendication 26, dans un but diagnostique ou thérapeutique pour la prévention ou le traitement de maladies telles que les divers types de cancers, l'infection par les virus des hépatites B et C, et le virus du SIDA.
30. Cellules hôtes transféctées par le vecteur recombinant selon la revendication 24.
31. Méthode pour l'identification d'agents activateurs ou inhibiteur de la protéine définie dans la revendication 26, comprenant : a) la mise en présence de cellules-hôtes selon la revendication 30 avec un composé à tester, et b) la détermination de l'effet activateur ou inhibiteur généré par le composé à tester sur ladite protéine.
32. Médicament renfermant à titre de principe actif une protéine définie dans la revendication 26.
33. Utilisation d'une protéine selon la revendication 26, pour la fabrication d'un médicament pour la prévention ou le traitement de maladies telles que les divers types de cancers, l'infection par les virus des hépatites B et C, et le virus du SIDA.
FR0015838A 2000-12-06 2000-12-06 Procede de determination d'un ou plusieurs polymorphisme(s) fontionnel(s) dans la sequence nucleique d'un gene "candidat" fonctionnel preselectionne et ses applications Expired - Fee Related FR2817559B1 (fr)

Priority Applications (5)

Application Number Priority Date Filing Date Title
FR0015838A FR2817559B1 (fr) 2000-12-06 2000-12-06 Procede de determination d'un ou plusieurs polymorphisme(s) fontionnel(s) dans la sequence nucleique d'un gene "candidat" fonctionnel preselectionne et ses applications
PCT/EP2001/015427 WO2002046459A2 (fr) 2000-12-06 2001-12-06 Procede de determination d'au moins un polymorphisme fonctionnel dans la sequence des nucleotides d'un gene candidat preselectionne et applications dudit procede
AU2002219230A AU2002219230A1 (en) 2000-12-06 2001-12-06 Method for the determination of at least one functional polymorphism in the nucleotide sequence of a preselected candidate gene and its applications
EP01999666A EP1349963A2 (fr) 2000-12-06 2001-12-06 Procede de determination d'au moins un polymorphisme fonctionnel dans la sequence des nucleotides d'un gene candidat preselectionne et applications dudit procede
US10/010,749 US20020155467A1 (en) 2000-12-06 2001-12-06 Method for the determination of at least one functional polymorphism in the nucleotide sequence of a preselected candidate gene and its applications

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0015838A FR2817559B1 (fr) 2000-12-06 2000-12-06 Procede de determination d'un ou plusieurs polymorphisme(s) fontionnel(s) dans la sequence nucleique d'un gene "candidat" fonctionnel preselectionne et ses applications

Publications (2)

Publication Number Publication Date
FR2817559A1 true FR2817559A1 (fr) 2002-06-07
FR2817559B1 FR2817559B1 (fr) 2003-12-12

Family

ID=8857315

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0015838A Expired - Fee Related FR2817559B1 (fr) 2000-12-06 2000-12-06 Procede de determination d'un ou plusieurs polymorphisme(s) fontionnel(s) dans la sequence nucleique d'un gene "candidat" fonctionnel preselectionne et ses applications

Country Status (5)

Country Link
US (1) US20020155467A1 (fr)
EP (1) EP1349963A2 (fr)
AU (1) AU2002219230A1 (fr)
FR (1) FR2817559B1 (fr)
WO (1) WO2002046459A2 (fr)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2822845B1 (fr) * 2001-03-30 2003-12-12 Genodyssee Nouveaux polynucleotides comportant des polymorphismes de type snp fonctionnels dans la sequence nucleotidique du gene ifn-alpha-21 ainsi que de nouveaux polypeptides codes par ces polynucleotides et leurs utilisations therapeutiques
US20080125978A1 (en) * 2002-10-11 2008-05-29 International Business Machines Corporation Method and apparatus for deriving the genome of an individual
US10395759B2 (en) 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection
CN107446998A (zh) * 2017-07-25 2017-12-08 重庆京因生物科技有限责任公司 MTHFR‑C677T、rs1801133位点基因多态性快速检测的引物、分子信标、试剂盒及其检测方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1983002461A1 (fr) * 1982-01-19 1983-07-21 Cetus Corp Interferons hybrides de classes multiples
EP0095702A1 (fr) * 1982-05-28 1983-12-07 Dr. Karl Thomae GmbH Interféron alpha2(Arg) préparé par procédé microbiologique, ADN-séquence codant pour cet interféron, microorganismes contenant cette information génétique et procédé pour leur production
EP0626448A2 (fr) * 1993-05-26 1994-11-30 BOEHRINGER INGELHEIM INTERNATIONAL GmbH Procédé de la préparation et de purification d'interféron-alpha
EP0658627A2 (fr) * 1993-12-15 1995-06-21 Kabushiki Kaisha Hayashibara Seibutsu Kagaku Kenkyujo ADN récombiné avec le promoteur d'interféron alpha
WO1998000541A2 (fr) * 1996-07-03 1998-01-08 Chiron Corporation Procedes d'administration de porteurs fournissant des genes recombinants pour le traitement d'une maladie chez l'homme
US5795976A (en) * 1995-08-08 1998-08-18 The Board Of Trustees Of The Leland Stanford Junior University Detection of nucleic acid heteroduplex molecules by denaturing high-performance liquid chromatography and methods for comparative sequencing
WO1999057292A1 (fr) * 1998-05-07 1999-11-11 Transkaryotic Therapies, Inc. Sequences genomiques en amont de la region codante du gene ifn-alpha2 destinees a la production et a l'administration de proteines
WO2000066772A1 (fr) * 1999-05-04 2000-11-09 Centre National De La Recherche Scientifique (Cnrs) Procede de detection par dhplc d'une difference de genotype et/ou de sequence d'adn

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9904585D0 (en) * 1999-02-26 1999-04-21 Gemini Research Limited Clinical and diagnostic database
US6379889B1 (en) * 1999-11-04 2002-04-30 Agilent Technologies, Inc. Multiplexing methods for identifying nucleic acids using denaturing liquid chromatography

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1983002461A1 (fr) * 1982-01-19 1983-07-21 Cetus Corp Interferons hybrides de classes multiples
EP0095702A1 (fr) * 1982-05-28 1983-12-07 Dr. Karl Thomae GmbH Interféron alpha2(Arg) préparé par procédé microbiologique, ADN-séquence codant pour cet interféron, microorganismes contenant cette information génétique et procédé pour leur production
EP0626448A2 (fr) * 1993-05-26 1994-11-30 BOEHRINGER INGELHEIM INTERNATIONAL GmbH Procédé de la préparation et de purification d'interféron-alpha
EP0658627A2 (fr) * 1993-12-15 1995-06-21 Kabushiki Kaisha Hayashibara Seibutsu Kagaku Kenkyujo ADN récombiné avec le promoteur d'interféron alpha
US5795976A (en) * 1995-08-08 1998-08-18 The Board Of Trustees Of The Leland Stanford Junior University Detection of nucleic acid heteroduplex molecules by denaturing high-performance liquid chromatography and methods for comparative sequencing
WO1998000541A2 (fr) * 1996-07-03 1998-01-08 Chiron Corporation Procedes d'administration de porteurs fournissant des genes recombinants pour le traitement d'une maladie chez l'homme
WO1999057292A1 (fr) * 1998-05-07 1999-11-11 Transkaryotic Therapies, Inc. Sequences genomiques en amont de la region codante du gene ifn-alpha2 destinees a la production et a l'administration de proteines
WO2000066772A1 (fr) * 1999-05-04 2000-11-09 Centre National De La Recherche Scientifique (Cnrs) Procede de detection par dhplc d'une difference de genotype et/ou de sequence d'adn

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
BOLK S ET AL: "HIGH-THROUGHPUT SNP GENOTYPING USING SINGLE-BASE EXTENSION", AMERICAN JOURNAL OF HUMAN GENETICS, UNIVERSITY OF CHICAGO PRESS, CHICAGO,, US, vol. 65, no. 4, 1999, pages A97, XP000979094, ISSN: 0002-9297 *
GEWERT DIRK R ET AL: "Detection of rare allelic variants of the interferon-alpha-2 gene in human genomic DNA.", JOURNAL OF INTERFERON AND CYTOKINE RESEARCH, vol. 15, no. 5, 1995, pages 403 - 406, XP001016230, ISSN: 1079-9907 *
KARAYIANNI-VASCONCELOS ET AL.: "Comparison of antigenic properties of three interferon (IFN)-alpha2 subvariants and establishment of a quantitative IFN-alpha2 ELISA", ACTA VIROL., vol. 37, 1993, pages 509 - 514, XP001016312 *
KITA MASAKAZU ET AL: "Determination of interferon-alpha-2 allele composition in the genomic DNA from healthy volunteers and leukemic patients in Japan.", JOURNAL OF INTERFERON AND CYTOKINE RESEARCH, vol. 17, no. 3, 1997, pages 135 - 140, XP001016233, ISSN: 1079-9907 *
LEE NANCY ET AL: "Interferon-alpha-2 variants in the human genome.", JOURNAL OF INTERFERON AND CYTOKINE RESEARCH, vol. 15, no. 4, 1995, pages 341 - 349, XP001016231, ISSN: 1079-9907 *
VOSS T ET AL: "PERIPLASMIC EXPRESSION OF HUMAN INTERFERON-ALPHA2C IN ESCHERICHIA COLI RESULTS IN A CORRECTLY FOLDED MOLECULE", JOURNAL OF BIOCHEMISTRY, JAPANESE BIOCHEMICAL SOCIETY, TOKYO, JP, vol. 298, 1994, pages 719 - 725, XP002041430, ISSN: 0021-924X *

Also Published As

Publication number Publication date
WO2002046459A2 (fr) 2002-06-13
FR2817559B1 (fr) 2003-12-12
AU2002219230A1 (en) 2002-06-18
EP1349963A2 (fr) 2003-10-08
WO2002046459A3 (fr) 2003-03-13
US20020155467A1 (en) 2002-10-24

Similar Documents

Publication Publication Date Title
Tang et al. Characterization of mitochondrial DNA heteroplasmy using a parallel sequencing system
US20190002979A1 (en) Haplotyping of hla loci with ultra-deep shotgun sequencing
Nguyen et al. Molecular combing reveals complex 4q35 rearrangements in Facioscapulohumeral dystrophy
JP2012511895A (ja) ヒト認知の原因となる遺伝子変異体及び診断標的及び治療標的としてのそれらを使用する方法
KR20110081836A (ko) 연령-관련 황반 변성에서 유전자 다형성
DK2491134T3 (en) Genetic polymorphisms in age-related macular degeneration
US20150379195A1 (en) Software haplotying of hla loci
Luo et al. A chromosome-level genome of the human blood fluke Schistosoma japonicum identifies the genomic basis of host-switching
Vallejo et al. Genetic diversity and background linkage disequilibrium in the North American Holstein cattle population
Pinto et al. Food and pathogen adaptations in the Angolan Namib desert: Tracing the spread of lactase persistence and human African trypanosomiasis resistance into southwestern Africa
Vai et al. DNA sequencing in cultural heritage
FR2817559A1 (fr) Procede de determination d&#39;un ou plusieurs polymorphisme(s) fontionnel(s) dans la sequence nucleique d&#39;un gene &#34;candidat&#34; fonctionnel preselectionne et ses applications
Cantor The use of genetic SNPs as new diagnostic markers in preventive medicine
EP1220950B9 (fr) Marqueurs genetiques de la toxicite, preparation et utilisation
Pierini et al. Targeted analysis of polymorphic loci from low-coverage shotgun sequence data allows accurate genotyping of HLA genes in historical human populations
CN114875148A (zh) 一种家族性多发性脂肪瘤检测试剂盒及引物组的应用
Rossman Cloning genes whose levels of expression are altered by metals: implications for human health research
EA015913B1 (ru) Способ генетической идентификации личности на основе анализа однонуклеотидного полиморфизма генома человека с использованием олигонуклеотидного биологического микрочипа (биочипа)
CN111893177B (zh) 遗传性耳聋诱导基因的突变筛选方法及突变检测试剂盒
Cichon et al. Insights From Genome-Wide Association Studies (GWAS)
KR102072504B1 (ko) Dock8 유전자 단일염기다형성을 이용한 아토피 피부염 진단용 조성물과 검출 방법
CN109385429B (zh) 一种与遗传性听力损失疾病相关的核酸及其应用
US20040126800A1 (en) Regulatory single nucleotide polymorphisms and methods therefor
Ralli et al. A Weights-based variant ranking pipeline for familial complex disorders
JP2006174802A (ja) 土壌線虫の重金属応答遺伝子を検出するためのポリヌクレオチド、プローブ、dnaマイクロアレイ及び土壌線虫を用いた土壌汚染の評価方法

Legal Events

Date Code Title Description
ST Notification of lapse