Utilisation d'associations entre au moins un polymorphisme de séquence nucléique du gène Sh2 et au moins une caractéristique de qualité de la graine, dans des procédés de sélection de plantes
DOMAINE DE L'INVENTION
La présente invention se rapporte au domaine de la sélection de variétés de plantes possédant des caractéristiques agronomiques améliorées, en particulier des caractéristiques phénotypiques de qualité des graines améliorées. Elle est relative à la détection des caractéristiques phénotypiques de qualité des graines améliorées par analyse du polymorphisme d'un gène Sh2 pour sélectionner des plantes à qualité de graine améliorée ainsi qu'à des moyens pour la mise en œuvre de cette détection.
ART ANTERIEUR
Composition du grain
Le grain accumule des réserves énergétiques suffisantes pour permettre la germination de l'embryon. Ces réserves sont sous forme de réserves glucidiques, protéiques ou oléiques. Chez les céréales, les réserves accumulées sont principalement de formes glucidique et protéique. Les réserves glucidiques sont en grande partie constituées par des polyosides tels que l'amidon. L'amidon est composé de deux fractions polysaccharidiques distinctes, l'amylose et l'amylopectine. L'amylose constitue la fraction minoritaire de l'amidon, c'est une chaîne de monomères de glucose liés en α 1-4 présentant moins de 1 % de ramifications. L'amylopectine représente la fraction majoritaire de l'amidon. Elle est constituée de monomères de glucose liés en α 1-4 et est ramifiée à environ 5% avec des monomères de glucose liés à la chaîne principale par des liaisons α 1-6. L'amidon représente près de 85% du poids de l'albumen des grains, la fraction de réserves énergétiques restante étant essentiellement constituée de protéines.
Importance agronomique et nutritive des céréales et de l'amidon
L'amidon est le polyoside majoritaire de stockage énergétique chez les végétaux. Il revêt une importance particulière dans les céréales. Ainsi, l'amidon de riz, de blé ou de maïs constitue le principal apport en sucre dans l'alimentation humaine et animale. L'étude des processus de remplissage du grain, la sélection et la création de variétés de céréales avec des teneurs en amidon modifiées constituent un des axes privilégiés des recherches concernant les céréales.
Enzyme ADP-Glucose Pyrophosphorylase
L'ADP Glucose Pyrophosphorylase (AGPase) est une enzyme clef de la voie de biosynthèse des polysaccharides, aussi bien chez les bactéries que chez les végétaux. Chez les plantes, elle permet de déphosphoryler le glucose-1 -phosphate en ADP-glucose, monomère constitutif de l'amidon.
L'AGPase végétale possède une structure complexe sous forme d'hétérotétramère composé de deux types de sous-unités similaires mais distincts. Les deux types de sous-unités, d'un poids moléculaire proche de 50 kDa dans l'albumen, sont codées, l'une par le gène Sh2 pour Shrunken 2, (Bhave et al., 1990) et l'autre par le gène Bt2 pour Brittle-2, (Bae et al., 1990).
Polymorphisme génétique
Au sein d'une même espèce, le génome présente du polymorphisme. Les principales causes de ces variabilités génétiques sont des mutations intervenant lors de la réplication de l'ADN qui précède la multiplication cellulaire. Ce peut être l'insertion ou la délétion de un ou plusieurs nucléotides (regroupés sous le terme d'indel), ou bien une substitution de type transition (substitution d'une base purique par une autre base purique ou d'une base pyrimidique par une autre base pyrimidique) ou transversion (substitution d'une base purique par une base pyrimidique ou vice versa). Les sites polymorphes sont ainsi classés en deux catégories selon qu'il s'agit de la substitution d'une base
(SNP pour single nucleotide polymorphism) ou bien d'un indel (Insertion- Délétion).
Si les sites polymorphes sont retrouvés plus fréquemment dans les régions non codantes du génome, une partie des SNPs ou des indels est retrouvée dans les régions codantes du génome ou dans des régions impliquées dans la régulation de la transcription et/ou de la traduction, telles que les régions promotrices, les régions 5'-leader, voire même certains introns. Ce type de polymorphisme peut alors avoir un impact sur l'expression d'un gène, la structure ou l'activité d'une protéine, et par suite sur l'expression d'un phénotype donné par la plante.
L'analyse de la variabilité des séquences d'ADN permet de caractériser un individu ou un groupe d'individus par son génome. En effet, La connaissance de la variabilité génétique des individus permet de générer des marqueurs pour détecter la ou les forme(s) allélique(s) présente(s) chez d'autres individus. Ce peut être des amorces PCR, des sondes allèles spécifiques, ou toute autre séquence nucléotidique permettant de détecter un site polymorphe particulier du gène. Lorsqu'un marqueur spécifique à un locus est lié à un caractère agronomique particulier de la plante, la connaissance de la forme allélique du marqueur permet de prédire le phénotype d'un individu. Il est aussi possible d'utiliser les marqueurs définis grâce au polymorphisme de séquence pour introgresser ou intégrer, par transgénèse, un allèle favorable dans une plante.
Cas du maïs, enzyme AGPase et gène Sh2
Chez le maïs, plusieurs études ont révélé des QTLs (pour « Quantitative Trait Loci »), aussi désignés « loci contrôlant un caractère à variation quantitative », de caractères de remplissage du grain, dans la région du chromosome 3 qui porte le gène Sh2. Il s'agit, en particulier, de QTLs associés à la teneur en amidon et en protéines (Goldman, 1993), ainsi qu'à la teneur en amylose et au rapport amylose/amylopectine (Séné et al., 2000). De plus, des modifications de la région amont 3' du gène, sous l'effet de transposons de type Ac/Ds, peuvent induire une augmentation de la quantité d'amidon dans le grain (Giroux et al. 1996). II apparaît donc que la variabilité du gène Sh2 puisse rendre compte de
la variation de caractères de remplissage du grain. Shaw et Hannah (1992) ont séquence le gène Sh2 de la variété de maïs Black Mexican Sweet, qui comprend environ 7200 paires de bases.
Toutefois, si les études publiées dans l'état de la technique sur le gène Sh2, suggèrent une certaine relation entre l'activité de ce gène et les qualités de la graine, elles ne décrivent aucun moyen technique précis prédictif des caractéristiques phénotypiques de la qualités des graines, utilisable à grande échelle, et permettant de discriminer, entre eux, les divers types ou niveaux de phénotypes caractérisant la qualité de la graine, tels que le nombre de grains par épi, la masse du grain mûr, la teneur en amidon du grain, la teneur en amylose du grain ou la teneur en protéines du grain ou encore une combinaison des caractéristiques phénotypiques pécitées
SOMMAIRE DE L'INVENTION
L'invention fournit pour la première fois un ensemble de moyens permettant de sélectionner des variétés de plantes pour leurs caractéristiques phénotypiques améliorées de qualité des graines, par l'analyse de polymorphismes nouvellement identifiés dans le gène Sh2, polymorphismes qui sont statistiquement associés à une caractéristique phénotypique précise de la qualité de la graine, ou à une combinaison de caractéristiques phénotypiques de la qualité de la graine.
Il a en effet été montré selon l'invention qu'un allèle donné de chacun des nouveaux sites polymorphes du gène Sh2 était statistiquement associé à l'expression d'un ou plusieurs caractères phénotypiques définissant la qualité de la graine.
L'invention a pour objet l'utilisation d'une sonde ou d'une amorce nucléotidique dans un procédé de sélection de plantes possédant des caractéristiques phénotypiques améliorées de qualité des graines, caractérisée en ce que ladite sonde ou ladite amorce nucléotidique permet la détection d'une base polymorphe ou d'une séquence nucléotidique polymorphe définissant un allèle d'un site polymorphe du gène Sh2 de séquence SEQ ID N°1, ladite base polymorphe ou ladite séquence nucléotidique polymorphe étant contenue dans un acide
nucléique inclus dans le gène Sh2, choisi parmi les acides nucléiques comprenant un site nucléotidique polymorphe associé à une caractéristique ou à une combinaison de caractéristiques phénotypiques liées à la qualité de la graine, notamment le nombre de graines par épi, la masse de la graine mûre, la teneur en protéines de la graine, la teneur en amidon de la graine, la teneur en amylose de la graine ou le rapport pondéral protéines/amidon de la graine.
Elle est également relative à un procédé pour déterminer l'identité de l'allèle d'un site polymorphe au sein d'un acide nucléique dérivé d'un gène Sh2 en vue de sélectionner une plante possédant des caractéristiques phénotypiques améliorées de qualité de la graine, caractérisé en ce qu'il comprend une étape de caractérisation de l'identité de la base polymorphe ou de la séquence nucléotidique polymorphe présente à au moins une position nucléotidique dudit acide nucléique correspondant à au moins un des nucléotides inclus dans un site nucléotidique polymorphe nouvellement identifié du gène Sh2.
Selon ce procédé, la détermination de l'identité de l'allèle d'un site polymorphe ou d'une combinaison de sites polymorphes permet de prédire le phénotype de qualité de la graine de la plante analysée, sans nécessiter d'analyse directe des caractères phénotypiques eux-mêmes.
L'invention concerne aussi des sondes et des amorces nucléotidiques permettant de déterminer la forme allélique d'un site polymorphe du gène Sh2, utiles notamment comme moyens de détermination de l'identité de la base polymorphe ou de la séquence nucléotidique polymorphe au site polymorphe associé à une caractéristique ou à une combinaison de caractéristiques phénotypiques de la qualité de la graine.
Elle a aussi pour objet un acide nucléique dérivé du gène Sh2 et comprenant au moins un site polymorphe tel que défini dans la présente description, ainsi que des vecteurs recombinants comprenant un tel acide nucléique.
Elle a également trait à une cellule hôte transformée par un acide nucléique ou un vecteur recombinant décrit ci-dessus, de préférence une cellule hôte bactérienne ou végétale.
Elle concerne encore une plante transformée par un acide nucléique ou par un vecteur recombinant décrit ci-dessus.
Elle est aussi relative à des anticorps dirigés spécifiquement contre un polypeptide SH2 codé par un acide nucléique dérivé du gène Sh2 comprenant un site polymorphe tel que défini dans la présente description ainsi qu'à un nécessaire ou kit comprenant l'un de ces anticorps ou encore une combinaison de plusieurs de ces anticorps.
DESCRIPTION DES FIGURES
La Figure 1 représente la séquence nucléotidique du gène Sh2 décrite par Shaw et Hannah (1992), qui est identique à la séquence SEQ ID N°1 du listage de séquence.
La première colonne de gauche représente la numérotation en nucléotides de la séquence SEQ ID N° 1 du listage de séquences de la présente description. Le premier nucleotide est numéroté 1.
La seconde colonne de gauche représente la numérotation en nucléotides prescrite par Shaw et Hannah (1992), qui est basée sur la position du nucleotide du site d'initiation de la transcription, numéroté +1. Le nucleotide en position 1 de la séquence SEQ ID N°1 est le nucleotide en position -1020 selon la nomenclature de Shaw et Hannah (1992).
DESCRIPTION DETAILLEE DE L'INVENTION
La demanderesse a identifié, dans la séquence du gène Sh2, une collection de polymorphismes dont elle a montré qu'ils étaient, chacun, associés à au moins une caractéristique phénotypique définissant la qualité de la graine d'une plante. L'identification de ces polymorphismes a rendu possible la mise au point de procédés de détection de ces polymorphismes à partir de l'ADN d'un individu végétal, cellule végétale, plante au stade plantule, plante à un stade précoce de développement ou plante au stade végétatif, permettant de prédire quelles sont ou seront les caractéristiques phénotypiques liées à la qualité de la graine ou de la future graine.
L'association entre la présence d'un allèle défini d'un site polymorphe du gène Sh2 et au moins un caractère de remplissage du grain permet de mettre en relation un allèle donné ou une combinaison d'allèles donnés (haplotype) et un caractère phénotypique ou une combinaison de caractères phénotypiques définissant la qualité de la graine. Les inventeurs ont montré que le polymorphisme du gène Sh2 est statistiquement associé à des caractères de qualité de la graine, tels que :
- le nombre de graines par épi - la masse de la graine mature
- la teneur en protéines de la graine
- la teneur en amidon de la graine
- la teneur en amylose de la graine
- le rapport teneur en protéines/teneur en amidon dans la graine.
L'identification d'allèles particuliers de sites polymorphes associés aux caractéristiques de qualité de la graine, dans la séquence du gène Sh2, a permis de définir des séquences oligonucléotidiques spécifiques d'un allèle donné d'un ou de plusieurs sites polymorphes du gène Sh2 et d'utiliser ces séquences en tant que sondes ou amorces pour faciliter la sélection de plantes assistée par marqueurs, pour générer des séquences alléliques favorables par mutagénèse dirigée, ou pour cloner des séquences apportant un caractère agronomique favorable, lié à la qualité de la graine, à la plante transformée avec ces séquences. II a aussi été montré selon l'invention que certains polymorphismes du gène Sh2 entraînaient des modifications dans la séquence d'acides aminés. Les allèles favorables repérés au niveau de ces polymorphismes peuvent être utilisés pour modifier la structure ou l'activité de l'enzyme AGPase. Le gène Sh2 utilisé comme séquence nucléotidique de référence à partir de laquelle sont définis les divers sites polymorphes nouvellement identifiés selon l'invention est la séquence nucléotidique référencée dans la base de données GenBank sous le numéro d'accès M81603 et qui est reproduite comme la séquence SEQ ID N°1 du listage de séquences.
Le gène Sh2 de séquence SEQ ID N°1 possède 7320 nucléotides longueur. Il possède 16 exons, respectivement :
- Exon n°1 : du nucleotide en position 1021 jusqu'au nucleotide en position 1082 de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 1 jusqu'au nucleotide en position 62 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992), telle qu'illustrée sur la Figure 1. ;
- Exon n°2 : du nucleotide en position 1521 jusqu'au nucleotide en position 1745 de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 501 jusqu'au nucleotide en position 725 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
- Exon n°3 : du nucleotide en position 2222 jusqu'au nucleotide en position 2344 de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 1202 jusqu'au nucleotide en position 1324 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
- Exon n°4 : du nucleotide en position 2629 jusqu'au nucleotide en position 2799 de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 1609 jusqu'au nucleotide en position 1779 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
- Exon n°5 : du nucleotide en position 3036 jusqu'au nucleotide en position 3125 de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 2016 jusqu'au nucleotide en position 2105 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
- Exon n°6 : du nucleotide en position 3217 jusqu'au nucleotide en position 3303 de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 2197 jusqu'au nucleotide en position 2283 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
- Exon n°7 : du nucleotide en position 3388 jusqu'au nucleotide en position 3443 de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 2368 jusqu'au nucleotide en
position 2423 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
- Exon n°8 : du nucleotide en position 3546 jusqu'au nucleotide en position 3639 de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 2526 jusqu'au nucleotide en position 2619 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
- Exon n°9 : du nucleotide en position 3805 jusqu'au nucleotide en position 3917 de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 2785 jusqu'au nucleotide en position 2897 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
- Exon n°10 : du nucleotide en position 3986 jusqu'au nucleotide en position 4058 de la séquence SEQ ID N°1, ce qui correspond à la séquence allant du nucleotide en position 2966 jusqu'au nucleotide en position 3038 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
- Exon n°1 1 : du nucleotide en position 4217 jusqu'au nucleotide en position 4297de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 3197 jusqu'au nucleotide en position 3277 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
- Exon n°12 : du nucleotide en position 4463 jusqu'au nucleotide en position 4549 de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 3443 jusqu'au nucleotide en position 3529 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
- Exon n°13 : du nucleotide en position 4620 jusqu'au nucleotide en position 4724 de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 3600 jusqu'au nucleotide en position 3704 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
- Exon n°14 : du nucleotide en position 6546 jusqu'au nucleotide en position 6652 de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 5526 jusqu'au nucleotide en
position 5632 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
- Exon n°15 : du nucleotide en position 6735 jusqu'au nucleotide en position 6795 de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 5715 jusqu'au nucleotide en position 5775 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
- Exon n°16 : du nucleotide en position 6912 jusqu'au nucleotide en position 7287 de la séquence SEQ ID N°1 , ce qui correspond à la séquence allant du nucleotide en position 5892 jusqu'au nucleotide en position 6267 du gène Sh2 selon la nomenclature de Shaw et Hannah (1992). ;
Dans la présente description, la numérotation utilisée pour définir la position du nucleotide polymorphe ou de la séquence nucléotidique polymorphe d'un site polymorphe du gène Sh2 est exclusivement celle décrite par Shaw et Hannah (1992) et qui est rappelée dans la première colonne de gauche de la séquence du gène Sh2 représentée à la Figure 1.
Sites polymorphes du gène Sh2 selon l'invention
Le polymorphisme du gène Sh2 a été déterminé à partir de l'ADN provenant de 33 lignées consanguines de maïs, dont les caractéristiques phénotypiques liées à la qualité du grain ont été simultanément analysées.
L'analyse de polymorphisme a permis de caractériser 72 sites polymorphes dans la séquence du gène Sh2.
Parmi ces 72 sites polymorphes, 19 d'entre eux ont présenté une différence nucléotidique pour une seule des lignées étudiées. Ces 19 sites polymorphes ne présentaient pas une distribution statistique informative pouvant être mise en œuvre dans une étude d'association entre la présence d'un allèle donné de ces sites polymorphes et la constatation d'un caractère phénotypique donné de la qualité de la graine.
Parmi les 53 sites polymorphes informatifs, certains d'entre eux ont été considérés comme redondants en ce que les mêmes allèles de deux ou plus de ces sites étaient systématiquement retrouvés conjointement dans l'ADN de plusieurs lignées. Deux sites polymorphes redondants apportent la même information statistique concernant l'association de l'un de leurs allèles avec une caractéristique phénotypique déterminée de la qualité de la graine. Ils permettent une discrimination identique entre deux lignées ou deux groupes de lignées. Selon l'invention, 43 sites polymorphes du gène Sh2 ont été retenus comme constituant des polymorphismes ou des groupes de polymorphismes d'intérêt, dont un allèle déterminé et caractérisé est statistiquement associé à une caractéristique phénotypique de la qualité de la graine et parfois à plusieurs caractéristiques phénotypiques de la qualité de la graine. Par « site polymorphe » du gène Sh2, on entend une région de la séquence du gène Sh2 laquelle, dans le génome de certaines lignées végétales, plus spécifiquement dans certaines lignées de maïs, diffère par un ou plusieurs nucléotides consécutifs par rapport à la région correspondante du gène Sh2 défini par la séquence SEQ ID N°1. Un site polymorphe peut consister en une variation d'un seul nucleotide qui peut prendre deux significations, par exemple une base A ou une base T, un tel site polymorphe étant alors désigné polymorphisme SNP (pour « Single Nucleotide Polymorphism »). Un site polymorphe peut aussi consister en l'addition ou la délétion d'un ou plusieurs nucléotides consécutifs, par rapport à la séquence de référence SEQ ID N°1. Ce second type de sites polymorphes est désigné « indel » (pour « Insertion- Délétion »).
Les sites polymorphes du gène Sh2 caractérisés dans la présente invention sont définis ci-dessous. Ils sont caractérisés par leur différence nucléotidique par rapport à la séquence du gène Sh2 SEQ ID N°1 de référence et dont les positions de nucléotides sont définis selon la nomenclature de Shaw et Hannah (1992) . Tels qu'ils sont définis ci- dessous, les sites polymorphes du gène Sh2 sont caractérisés par leur allèle dont la présence, dans le génome d'une plante, est associée à l'expression d'un caractère phénotypique modifié de qualité de la graine.
(a) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -921 du gène Sh2 est un G ;
(b) un acide nucléique dans lequel les nucléotides correspondant aux nucléotides en positions -830 à -824, de séquence 5'-TGAGAAA-3', du-gène Sh2 sont absents ;
(c) un acide nucléique dans lequel les nucléotides correspondant aux nucléotides en positions -580 à -573, de séquence 5'-TCACCTAT-3', du gène Sh2 sont absents ; (d) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -438 du gène Sh2 est un G ;
(e) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -362 du gène Sh2 est un A ;
(f) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position —347 du gène Sh2 est un T ;
(g) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -296 du gène Sh2 est un T ;
(h) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -277 du gène Sh2 est un T ; (i) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -266 du gène Sh2 est un C ;
(j) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -168 du gène Sh2 est un A ;
(k) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -15 du gène Sh2 est un A ;
(I) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +35 du gène Sh2 est un T ;
(m) un acide nucléique dans lequel un T additionnel se trouve après le nucleotide en position +304 du gène Sh2 ; (n) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +515 du gène Sh2 est un C ;
(o) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +587 du gène Sh2 est un C ;
(p) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +678 du gène Sh2 est un A ;
(q) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +960 du gène Sh2 est un A ;
(r) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +1059 du gène Sh2 est un G ; (s) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +1068 du gène Sh2 est un G ;
(t) un acide nucléique dans lequel le nucleotide A correspondant au nucleotide en position +1081 du gène Sh2 est absent;
(u) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +1473 du gène Sh2 est un C ;
(v) un acide nucléique dans lequel un T additionnel est présent après le nucleotide en position +1505 du gène Sh2 ;
(w) un acide nucléique dans lequel un T additionnel est présent après le nucleotide en position +1542 du gène Sh2 ; (x) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +1867 du gène Sh2 est un C ;
(y) un acide nucléique dans lequel le nucleotide T correspondant au nucleotide en position +2514 du gène Sh2 est absent;
(z) un acide nucléique dans lequel un T additionnel est présent après le nucleotide en position 2771 du gène Sh2;
(ab) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +2939 du gène Sh2 est un G ;
(ac) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +2983 du gène Sh2 est un C ; et (ad) un acide nucléique comprenant l'insertion de la séquence
5'-GTTTTTATTTA-3' après le nucleotide correspondant au nucleotide en position +3123 du gène Sh2.
Pour le site polymorphe +587, la présence d'une base C constitue une substitution de base conservative n'entraînant aucun changement dans la séquence d'acides aminés du polypeptide SH2 correspondant, par rapport au polypeptide SH2 de séquence SEQ ID N°52 codé par la séquence SEQ ID N°1.
Pour le site polymorphe +678, la présence d'une base A entraîne le remplacement, dans la séquence du polypeptide SH2 de séquence
SEQ ID N° 52, de l'acide aminé Alanine, codé par la séquence SEQ ID N° 1 à cette position, par l'acide aminé Thréonine.
Pour le site polymorphe +2983, la présence d'une base C entraîne le remplacement, dans la séquence du polypeptide SH2 de séquence SEQ ID N°52, de l'acide aminé Leucine, codé par la séquence SEQ ID N° 1 à cette position, par l'acide aminé Serine.
Comme exposé précédemment, la caractérisation selon l'invention de sites polymorphes informatifs au sein de la séquence du gène Sh2 a rendu possible la construction de divers moyens de détection d'un allèle donné de chacun des sites polymorphes, utiles notamment dans des procédés de sélection de lignées de plantes, spécifiquement de maïs, possédant des caractéristiques phénotypiques de qualité de la graine recherchées.
De tels procédés de sélection de lignées de plantes peuvent être réalisés à des stades précoces du développement de la plante, avant la formation des graines, à un moment du développement de la plante pour lequel il n'est pas possible de déterminer les caractéristiques phénotypiques de la graine. Les procédés mettant en œuvre une analyse des sites polymorphes du gène Sh2 de l'invention ont donc une valeur prédictive d'un grand intérêt technique et économique.
Utilisations et procédés mettant en œuyre les caractéristiques des sites polymorphes selon l'invention.
L'invention a pour objet l'utilisation d'une sonde ou d'une amorce nucléotidique dans un procédé de sélection de plantes possédant des caractéristiques phénotypiques améliorées de qualité des graines, caractérisée en ce que ladite sonde ou ladite amorce nucléotidique permet la détection d'une base polymorphe ou d'une séquence nucléotidique polymorphe définissant un allèle d'un site polymorphe du gène Sh2 de séquence SEQ ID N°1 , ladite base polymorphe ou ladite séquence nucléotidique polymorphe étant contenue dans un acide nucléique inclus dans un gène Sh2, choisi parmi les acides nucléiques suivants :
(a) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -921 du gène Sh2 est un G ;
(b) un acide nucléique dans lequel les nucléotides correspondant aux nucléotides en positions -830 à -824, de séquence 5'-TGAGAAA-3', du gène Sh2 sont absents ;
(c) un acide nucléique dans lequel les nucléotides correspondant aux nucléotides en positions -580 à -573, de séquence 5'-TCACCTAT-3', du gène Sh2 sont absents ;
(d) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -438 du gène Sh2 est un G ;
(e) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -362 du gène Sh2 est un A ;
(f) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position —347 du gène Sh2 est un T ;
(g) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -296 du gène Sh2 est un T ; (h) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -277 du gène Sh2 est un T ;
(i) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -266 du gène Sh2 est un C ;
(j) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -168 du gène Sh2 est un A ;
(k) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position -15 du gène Sh2 est un A ;
(I) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +35 du gène Sh2 est un T ; (m) un acide nucléique dans lequel un T additionnel est présent après le nucleotide en position +304 du gène Sh2 ;
(n) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +515 du gène Sh2 est un C ;
(o) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +587 du gène Sh2 est un C ;
(p) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +678 du gène Sh2 est un A ;
(q) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +960 du gène Sh2 est un A ;
(r) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +1059 du gène Sh2 est un G ;
(s) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +1068 du gène Sh2 est un G ; (t) un acide nucléique dans lequel le nucleotide A correspondant au nucleotide en position +1081 du gène Sh2 est absent;
(u) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +1473 du gène Sh2 est un C ;
(v) un acide nucléique dans lequel un T additionnel est présent après le nucleotide en position +1505 du gène Sh2;
(w) un acide nucléique dans lequel un T additionnel est présent après le nucleotide en position +1542 du gène Sh2 ;
(x) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +1867 du gène Sh2 est un C ; (y) un acide nucléique dans lequel le nucleotide T correspondant au nucleotide en position +2514 du gène Sh2 est absent;
(z) un acide nucléique dans lequel un T additionnel est présent après le nucleotide en position 2771 du gène Sh2;
(ab) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +2939 du gène Sh2 est un G ;
(ac) un acide nucléique dans lequel le nucleotide correspondant au nucleotide en position +2983 du gène Sh2 est un C ; et
(ad) un acide nucléique comprenant l'insertion de la séquence 5'-GTTTTTATTTA-3' après le nucleotide correspondant au nucleotide en position +3123 du gène Sh2.
L'expression «qualité du grain» englobe les caractères influant sur la qualité et la quantité de la graine tels que par exemple : le nombre de graines par épi, la masse des graines matures, la teneur en protéines, en amidon, en amylose et le rapport pondéral teneur en protéines/teneur en amidon dans la graine, ainsi que tous les caractères complexes incluant un ou plusieurs de ces caractères.
Une des méthodes pouvant être utilisée pour déterminer le phénotype d'un individu à ce ou ces sites peut consister à : i) obtenir un échantillon d'ADN d'un individu,
ii) identifier l'allèle à une ou plusieurs des positions citées ci- dessus (en référence aux positions décrites selon la séquence Genbank n°M81603) dans le gène Sh2, iii) prédire la qualité du grain de l'individu en référence à l'association du polymorphisme du gène Sh2 tel que décrit ci-dessus et du caractère de qualité de grain. L'échantillon d'ADN est obtenu selon les méthodes classiques d'extractions d'ADN utilisées chez les plantes, en particulier à partir de jeunes feuilles de maïs (Dellaporta et al. 1983). L'échantillon d'ADN devra contenir au moins la séquence du gène
Sh2, c'est-à-dire une région de cette séquence pouvant être amplifiée par une quelconque technique connue de l'art antérieur, telle que par exemple, la PCR.
La qualité du grain de l'individu étudié peut être déterminée en référence à la présence d'un allèle à au moins une, plusieurs ou toutes les positions décrites en combinaison avec d'autres polymorphismes dans le gène Sh2 qui sont connus ou qui seront caractérisés ultérieurement
Il existe un grand nombre de procédures d'analyse connues dans l'état de la technique qui peuvent être utilisées par l'homme du métier pour détecter la forme allélique d'un ou plusieurs sites polymorphes du gène Sh2 de l'invention. En général, la détection des allèles requiert une technique de discrimination des polymorphismes. En général, les méthodes courantes impliquent l'amplification de la séquence cible puis l'identification des allèles par des hybridations de courtes sondes, par restriction par des endonucléases, par discrimination par polymérases ou ligases, en observant le nucleotide incorporé par la polymérase en fonction de la séquence-matrice, ou par détection de mésappariement sur de l'ADN double brin. Parmi ces techniques de détection d'allèles, il peut être cité les techniques suivantes : séquençage d'ADN, séquençage par hybridation,
SSCP (Single strand conformation polymorphism analysis), DGGE
(Denaturing gradient gel electrophoresis), TGGE (Température gradient gel electrophoresis), analyse d'hétéroduplex, CMC (Chemical mismatch cleavage), Dot blots, Reverse dot blots, oligonucleotide array (puce à
ADN), Taqman™ (US 5210015 et US 5487972, Hoffmann-La Roche), ARMS™ (Amplification refractory mutation System), ALEX™ (Amplification refractory mutation System linear extension, EP 332435B1 , Zeneca Itd)), COPS (Gibbs et al. 1989), mini-séquençage, APEX (Arrayed primer extension), RFLP (Restriction fragment length polymorphism), sites de restriction sur produit de PCR (CAPS), OLA (Oligonucleotide ligation assay), pyroséquençage (Nyrèn et al. 1997).
Ces techniques peuvent être utilisées en combinaison avec des systèmes de générations de signaux comme, par exemple, les techniques suivantes : FRET (Fluorescence résonance energy transfer), fluorescence quenching, fluorescence polarisation (UK 2228998, Zeneca Itd), chimioluminescence, électrochimioluminescence, radioactivité, colorimétrie, hybridization protection assay, spectrométrie de masse. D'autres techniques d'amplification telles que la SSR (Self sustained replication), LCR (Ligase chain reaction), SDA (Strand displacement amplification) ou leb-DNA (branched DNA). La plupart de ces techniques de détection des variations alléliques sont récapitulées dans des ouvrages standard comme « Laboratory Protocols for mutation détection », Ed. by U.Landegren, Oxford University press, 1996 et « PCR », 2nd Edition by Newton et Graham, BIOS Scientific Publishers Ltd, 1997). D'autres protocoles de séquençage, de clonage et autres aspects de biologie moléculaire sont répertoriés dans «Gènes VII» (Lewin, 1999).
Ces techniques peuvent utiliser des oligonucléotides synthétisés à partir des séquences suivantes (la forme allélique du SNP ou indel détecté dans l'invention est indiquée entre parenthèses, et la différence entre la forme allélique de la variété de référence BMS et l'allèle décrit est indiquée en gras) :
Dans l'utilisation d'une sonde ou d'une amorce nucléotidique, telle qu'elle est définie ci-dessus, ladite sonde ou ladite amorce nucléotidique peut être caractérisée en ce qu'elle permet de discriminer entre la présence d'un premier acide nucléique (1 ) et d'un second acide nucléique (2), lesdits acides nucléiques (1 ) et (2) étant choisis parmi les suivants :
Sites polymorphes
(a) Site - 921 : l'acide nucléique (1 ) de séquence SEQ ID N°2 dans lequel le nucleotide en position 41 est une base G et l'acide nucléique (2) de séquence SEQ ID N°2 dans lequel le nucleotide en position 41 est une base A ;
(b) Site - 438 : l'acide nucléique (1 ) de séquence SEQ ID N°3 dans lequel le nucleotide en position 41 est une base G et l'acide nucléique (2) de séquence SEQ ID N°3 dans lequel le nucleotide en position 41 est une base A ; (c) Site - 362 : l'acide nucléique (1 ) de séquence SEQ ID N°4 dans lequel le nucleotide en position 41 est une base A et l'acide nucléique (2) de séquence SEQ ID N°4 dans lequel le nucleotide en position 41 est une base G ;
(d) Site - 347 : l'acide nucléique (1) de séquence SEQ ID N°5 dans lequel le nucleotide en position 41 est une base T et l'acide nucléique
(2) de séquence SEQ ID N°5 dans lequel le nucleotide en position 41 est une base C ;
(e) Site - 296 : l'acide nucléique (1 ) de séquence SEQ ID N°6 dans lequel le nucleotide en position 41 est une base T et l'acide nucléique (2) de séquence SEQ ID N°6 dans lequel le nucleotide en position 41 est une base C ;
(f) Site - 277 : l'acide nucléique (1 ) de séquence SEQ ID N°7 dans lequel le nucleotide en position 41 est une base T et l'acide nucléique (2) de séquence SEQ ID N°7 dans lequel le nucleotide en position 41 est une base C ;
(g) Site- 266 : l'acide nucléique (1 ) de séquence SEQ ID N°8 dans lequel le nucleotide en position 41 est une base C et l'acide nucléique (2) de séquence SEQ ID N°8 dans lequel le nucleotide en position 41 est une base T ; (h) Site - 168 : l'acide nucléique (1) de séquence SEQ ID N°9 dans lequel le nucleotide en position 41 est une base A et l'acide nucléique (2) de séquence SEQ ID N°9 dans lequel le nucleotide en position 41 est une base G ; (i) Site - 15 : l'acide nucléique (1 ) de séquence SEQ ID N°10 dans lequel le nucleotide en position 41 est une base A et l'acide nucléique
(2) de séquence SEQ ID N°10 dans lequel le nucleotide en position 41 est une base G ;
(j) Site + 35 : l'acide nucléique (1 ) de séquence SEQ ID N°11 dans lequel le nucleotide en position 41 est une base T et l'acide nucléique (2) de séquence SEQ ID N°11 dans lequel le nucleotide en position 41 est une base C ;
(k) Site + 515 : l'acide nucléique (1 ) de séquence SEQ ID N°12 dans lequel le nucleotide en position 41 est une base C et l'acide nucléique (2) de séquence SEQ ID N°12 dans lequel le nucleotide en position 41 est une base T ;
(1) Site + 587 : l'acide nucléique (1 ) de séquence SEQ ID N°13 dans lequel le nucleotide en position 41 est une base C et l'acide nucléique
(2) de séquence SEQ ID N°13 dans lequel le nucleotide en position 41 est une base T ; (m) Site + 678 : l'acide nucléique (1 ) de séquence SEQ ID N°14 dans lequel le nucleotide en position 41 est une base A et l'acide nucléique (2) de séquence SEQ ID N°14 dans lequel le nucleotide en position 41 est une base G ; (n) Site + 960 : l'acide nucléique (1 ) de séquence SEQ ID N°15 dans lequel le nucleotide en position 41 est une base A et l'acide nucléique
(2) de séquence SEQ ID N°15 dans lequel le nucleotide en position 41 est une base G ;
(o) Site + 1059 : l'acide nucléique (1 ) de séquence SEQ ID N°16 dans lequel le nucleotide en position 41 est une base G et l'acide nucléique (2) de séquence SEQ ID N°16 dans lequel le nucleotide en position 41 est une base C ;
(p) Site + 1068 : l'acide nucléique (1 ) de séquence SEQ ID N°17 dans lequel le nucleotide en position 41 est une base G et l'acide nucléique (2) de séquence SEQ ID N°17 dans lequel le nucleotide en position 41 est une base T ;
(q) Site + 1473 : l'acide nucléique (1 ) de séquence SEQ ID N°18 dans lequel le nucleotide en position 41 est une base C et l'acide nucléique (2) de séquence SEQ ID N°18 dans lequel le nucleotide en position 41 est une base T ;
(r) Site + 1867 : l'acide nucléique (1 ) de séquence SEQ ID N°19 dans lequel le nucleotide en position 41 est une base C et l'acide nucléique
(2) de séquence SEQ ID N°19 dans lequel le nucleotide en position 41 est une base T ; (s) Site + 2939 : l'acide nucléique (1 ) de séquence SEQ ID N°20 dans lequel le nucleotide en position 41 est une base G et l'acide nucléique
(2) de séquence SEQ ID N°20 dans lequel le nucleotide en position 41 est une base T ;
(t) Site + 2983 : l'acide nucléique (1 ) de séquence SEQ ID N°21 dans lequel le nucleotide en position 41 est une base C et l'acide nucléique
(2) de séquence SEQ ID N°21 dans lequel le nucleotide en position 41 est une base T ;
(u) Site - 830 à -824 : l'acide nucléique (1 ) de séquence SEQ ID N°23 et l'acide nucléique (2) de séquence SEQ ID N° 22 ; (v) Site - 580 à - 573 : l'acide nucléique (1 ) de séquence SEQ ID
N°25 et l'acide nucléique (2) de séquence SEQ ID N° 24 ;
(w) Site + 304 : l'acide nucléique (1 ) de séquence SEQ ID N°27 et l'acide nucléique (2) de séquence SEQ ID N° 26 ;
(x) Site + 1081 : l'acide nucléique (1 ) de séquence SEQ ID N°29 et l'acide nucléique (2) de séquence SEQ ID N° 28 ;
(y) Site + 1505 : l'acide nucléique (1 ) de séquence SEQ ID N°31 et l'acide nucléique (2) de séquence SEQ ID N° 30 ;
(z) Site + 1542 : l'acide nucléique (1 ) de séquence SEQ ID N°33 et l'acide nucléique (2) de séquence SEQ ID N° 32 ; (aa) Site + 2514 : l'acide nucléique (1 ) de séquence SEQ ID N°35 et l'acide nucléique (2) de séquence SEQ ID N° 34 ;
(ab) Site + 2771 : l'acide nucléique (1 ) de séquence SEQ ID N°37 et l'acide nucléique (2) de séquence SEQ ID N° 36 ; et
(ac) Site + 3123 : l'acide nucléique (1 ) de séquence SEQ ID N°39 et l'acide nucléique (2) de séquence SEQ ID N° 38.
Selon un autre mode de réalisation préféré, ledit acide nucléique est un acide nucléique s'hybridant spécifiquement avec un acide nucléique de séquence complémentaire à l'un quelconque des acides nucléiques (1 ) ou (2) définis en (a) à (ac) ci-dessus. L'utilisation ci-dessus peut être aussi caractérisée en ce que :
a) la sonde nucléotidique s'hybride spécifiquement avec un acide nucléique d'une première forme allélique de la base polymorphe ou de la séquence nucléotidique polymorphe définissant un premier allèle d'un site polymorphe du gène Sh2 et ne s'hybride pas avec un acide nucléique d'une seconde forme allélique de la base polymorphe ou de la séquence nucléotidique polymorphe définissant un second allèle d'un site polymorphe du gène Sh2 ; ou b) l'amorce nucléotidique hybride spécifiquement avec une séquence nucléotidique contenue dans un gène Sh2, ladite séquence nucléotidique étant localisée en amont d'une forme allélique d'une base polymorphe ou d'une séquence nucléotidique polymorphe dont la présence ou l'absence définit un allèle d'un site polymorphe du gène Sh2.
Le polymorphisme du gène Sh2 une fois identifié par l'une des méthodes décrites ci-dessus peut être utilisé, selon l'invention, pour réaliser une sélection prédictive de plantes avec une meilleure qualité de grain, y compris la sélection de plantes au stade plantule et/ou au stade précoce et/ou au stade végétatif.
La séquence nucléotidique du gène Sh2 de maïs SEQ ID N°1 présente une forte identité en nucléotides avec les séquences nucléotidiques de nombreuses céréales, en particulier de nombreuses variétés de graminées, identité qui est presque totale dans le cadre ouvert de lecture (ORF).
En particulier, la séquence du gène Sh2 de maïs possède une très grande identité en nucléotides avec le gène Sh2 de sorgho, l'identité la plus grande entre les deux séquences étant retrouvée dans le cadre ouvert de lecture (ORF). Ainsi, le polypeptide SH2 codé par le gène Sh2 de sorgho possède une différence d'un seul acide aminé avec le polypeptide SH2 codé par le gène Sh2 de maïs SEQ ID N°1. Sans vouloir être liés par une quelconque théorie, les inventeurs pensent que les sites polymorphes retrouvés dans le gène Sh2 de maïs sont également retrouvés dans le gène Sh2 du génome d'autres céréales, en particulier graminées, et encore plus spécifiquement dans le gène Sh2 du sorgho. Les sites polymorphes localisés dans le cadre ouvert de lecture du gène Sh2 de maïs SEQ ID N°1 sont ceux qui ont
statistiquement le plus de probabilité de se retrouver aussi dans les gènes Sh2 d'autres céréales, en particulier d'autres graminées, comme le sorgho.
La sélection prédictive s'applique donc en particulier aux céréales telles que par exemple le maïs et le sorgho. L'utilisation du polymorphisme allélique décrit dans l'invention s'applique particulièrement à la sélection de variétés de maïs. Lorsqu'une population est ségrégeante sur plusieurs loci affectant plusieurs caractères de qualité de grain, la sélection assistée par marqueur (SAM) est plus efficace qu'une simple évaluation phénotypique puisqu'elle permet notamment des cycles de sélection beaucoup plus rapides que les techniques classiques de caractérisation directe du phénotype. Un autre avantage de la SAM par rapport à l'évaluation phénotypique est que les analyses sont complètement indépendantes des aléas climatiques.
L'utilisation ci-dessus est en outre caractérisée en ce que les caractéristiques phénotypiques améliorées de qualité de la graine sont choisies parmi le nombre de graines par épi, la masse des graines, la teneur en protéines des graines, la teneur en amidon des graines, la teneur en amylose des graines et le rapport pondéral protéines/amidon des graines, ou une combinaison de ces caractéristiques phénotypiques.
L'invention a aussi pour objet un procédé pour déterminer l'identité de l'allèle d'un site polymorphe au sein d'un acide nucléique dérivé d'un gène Sh2 en vue de sélectionner une plante possédant des caractéristiques phénotypiques améliorées de qualité de la graine, caractérisé en ce qu'il comprend une étape de caractérisation de l'identité de la base polymorphe ou de la séquence nucléotidique polymorphe présente à au moins une position nucléotidique dudit acide nucléique correspondant à au moins un des nucléotides en position - 921 , -830 à -824, -580 à -573,-438,- 362, -347, -296, -277, -266, -168, - 15, +35, +304, +515, +587, +678, +960, +1059, +1068, +1081, +1473, +1505, +1542, +1867, +2514, +2771 , +2939, +2983 et +3123 du gène Sh2 de séquence SEQ ID N°1.
Selon un premier aspect, le procédé ci-dessus est caractérisé en ce que la caractérisation du site polymorphe est réalisée par séquençage dudit acide nucléique.
Selon un second aspect du procédé ci-dessus, la caractérisation de l'identité du site polymorphe est réalisée par hybridation d'une sonde nucléotidique s'hybridant spécifiquement avec la séquence d'un allèle déterminé du gène Sh2. Selon cet aspect, la caractérisation de l'identité du site polymorphe est réalisée par hybridation d'une sonde nucléotidique s'hybridant spécifiquement avec une base polymorphe ou une séquence nucléotidique polymorphe définissant un allèle d'un site polymorphe déterminé du gène Sh2.
Selon un troisième aspect du procédé ci-dessus, la caractérisation du site polymorphe est réalisée par élongation d'une amorce nucléotidique s'hybridant spécifiquement avec une séquence nucléotidique localisée en amont d'une forme allélique d'une base polymorphe ou d'une séquence nucléotidique polymorphe définissant un allèle d'un site polymorphe déterminé d'un gène Sh2.
Selon une caractéristique particulière de ce troisième aspect, la caractérisation de l'identité du site polymorphe est réalisée par hybridation d'une amorce nucléotidique s'hybridant spécifiquement avec la séquence située en amont, du côté 5' de la base polymorphe ou de la séquence nucléotidique polymorphe définissant un allèle donné d'un site polymorphe du gène Sh2 , puis élongation de l'amorce. La caractérisation de l'allèle polymorphe peut être réalisée par séquençage du produit de l'élongation de l'amorce. Dans un mode de réalisation particulier, le nucleotide situé à l'extrémité 3' de l'amorce hybride avec le nucleotide situé immédiatement en amont du côté 5' de la base polymorphe ou de la séquence nucléotidique polymorphe. Dans ce mode de réalisation particulier, l'identité de l'allèle du site polymorphe considéré peut être déterminé directement en réalisant l'étape d'élongation de l'amorce en présence de didéoxynucléotides fluorescents bloquant la réaction d'élongation. L'identité du didéoxynucléotide ajouté à la séquence de l'amorce, et donc l'identité de l'allèle du site polymorphe, est déterminée directement par analyse de fluorescence. Il s'agit de la technique de micro-séquençage, bien connue dans l'état de la technique.
L'amorce hybride avec le brin d'ADN comprenant la séquence codant le polypeptide SH2 (le brin+) ou avec le brin d'ADN complémentaire, qui porte une base complémentaire de la base correspondante portée par le brin « + » au site polymorphe. Selon un quatrième aspect, le procédé est caractérisé en ce que pour sélectionner une plante possédant un nombre modifié de graines, on détermine l'identité de la base ou d'une séquence de bases présentes à au moins une position nucléotidique dudit acide nucléique correspondant à au moins un des nucléotides en position -168, +1473, +1542 et +2983 du gène Sh2 de séquence SEQ ID N°1.
Selon un cinquième aspect, le procédé est caractérisé en ce que pour sélectionner une plante avec une masse modifiée de graine, on détermine l'identité de la base ou d'une séquence de bases présentes à au moins une position nucléotidique dudit acide nucléique correspondant à au moins un des nucléotides en position -168, +1473, +1542 et +2983 du gène Sh2 de séquence SEQ ID N°1.
Selon un sixième aspect, ce procédé est caractérisé en ce que pour sélectionner une plante ayant une teneur modifiée en protéines dans la graine, on détermine l'identité de la base ou d'une séquence de bases présentes à au moins une position nucléotidique dudit acide nucléique correspondant à au moins un des nucléotides en position -
168, +1473, +1542, +2983, -830 à -824, -362, -347, -296, -15, +515,
+587, +1068, +1505 et +2939 du gène Sh2 de séquence SEQ ID N°1.
Selon un septième aspect, ce procédé est caractérisé en ce que pour sélectionner une plante possédant une teneur modifiée en amidon dans la graine, on détermine l'identité de la base ou d'une séquence de bases présentes à au moins une position nucléotidique dudit acide nucléique correspondant à au moins un des nucléotides en position -830 à -824, -362, -347, -296, -15, +515, +587, +1068, +1505 et +2939 du gène S 72 de séquence SEQ ID N°1.
Selon un huitième aspect, ce procédé est caractérisé en ce que pour sélectionner une plante possédant une teneur modifiée en amylose dans les graines, on détermine l'identité de la base ou d'une séquence de bases présentes à au moins une position nucléotidique dudit acide nucléique correspondant à au moins un des nucléotides en position -
438, -266, +678, +960, -921 , -580 à -573, -277, +35, +304, +1059, +1081 , +1867, +2514, +2771 et +3123 du gène Sh2 de séquence SEQ ID N°1.
Selon un neuvième aspect, ce procédé est caractérisé en ce que pour sélectionner une plante possédant un rapport protéines/amidon modifié dans la graine, on détermine l'identité de la base ou d'une séquence de bases présentes à au moins une position nucléotidique dudit acide nucléique correspondant à au moins un des nucléotides en position -168, +1473, +1542, +2983, -830 à -824, -362, -347, -296, -15, +515, +587, +1068, +1505 et +2939 du gène Sh2 de séquence SEQ ID N°1.
Selon un dixième aspect, ledit procédé est caractérisé en ce qu'il est réalisé sur l'ADN prélevé à partir de plantes au stade plantule et/ou au stade précoce et/ou au stade végétatif. De préférence, la plante est une céréale, de préférence une céréale à paille.
Préférentiellement, la plante est choisie parmi le maïs et le sorgho.
Sondes et amorces nucléotidiques L'invention concerne également les amorces et les sondes obtenues à partir des séquences nucléotidiques décrites ci-dessus et spécifiques d'un allèle du gène Sh2. Une des applications de l'invention consiste à utiliser ces sondes et/ou amorces pour détecter le polymorphisme du gène Sh2 à au moins l'un des sites polymorphes tels qu'ils ont été définis ci-dessus. Les sondes et les amorces obtenues selon un des aspects de l'invention peuvent être employées comme marqueurs spécifiques d'un allèle du gène Sh2. Les amorces nucléotidiques spécifiques d'allèles, ou permettant de discriminer selon les allèles connus, sont constituées préférentiellement de 8 à 40 nucléotides, plus précisément de 17 à 25 nucléotides. La réalisation de telles amorces est connue de l'homme du métier. En général, de telles amorces comprennent une séquence entièrement complémentaire à la séquence définissant l'allèle de référence ou l'allèle « variant » associé à un caractère phénotypique de qualité améliorée de la graine, tel que défini précédemment dans la description. Les amorces objets de
l'invention ainsi réalisées portent un ou plusieurs marquages pour faciliter leur détection. Par exemple, le marquage peut être fluorimétrique (digoxygénine, fluoresceine, etc.), radioactif (par exemple 32P), enzymatique (peroxydase, phosphatase alkaline, etc.), ou réalisé par des microbilles d'or, de verre coloré ou de plastique.
Les acides nucléiques selon l'invention, et en particulier les séquences nucléotidiques SEQ ID N°2 à SEQ ID N°39, ainsi que les acides nucléiques de séquences complémentaires aux séquences SEQ ID N°2 à SEQ ID N°39, sont utiles pour la fabrication de sondes ou d'amorces permettant, lorsqu'elles sont mises en œuvre dans des réactions d'hybridation, d'élongation ou d'amplification, de discriminer entre eux les deux allèles d'un site polymorphe donné du gène Sh2 caractérisé selon l'invention.
Font également partie de l'invention les sondes et amorces nucléotidiques hybridant avec un acide nucléique choisi parmi les séquences SEQ ID N°2 à SEQ ID N°39, ou avec un acide nucléique de séquence complémentaire à l'une des séquences SEQ ID n°2 à SEQ ID N°39.
L'invention a aussi pour objet une sonde ou une amorce nucléotidique caractérisée en ce qu'elle permet de discriminer entre eux les différents allèles d'un site polymorphe à au moins l'une des positions-921 , -830 à
-824, -580 à -573, -438, -362, -347, -296, -277, -266, -168, -15, +35, +304, +515, +587, +678, +960, +1059, +1068, +1081 , +1473, +1505, +1542, +1867, +2514, +2771 , +2939, +2983 et +3123 du gène Sh2 de séquence SEQ ID N°1.
Elle est également relative à l'utilisation d'une sonde ou d'une amorce telle que définie ci-dessus comme marqueur d'au moins un site polymorphe du gène Sh2. L'invention concerne également les kits de diagnostic comportant des séquences nucléotidiques telles que définies ci-dessus, spécifiques de l'allèle favorable du gène Sh2 pour un ou plusieurs des caractères agronomiques choisis parmi le nombre de grains par épi, la masse du grain mûr, les teneurs en amidon, en amylose ou en protéines du grain.
Elle a aussi pour objet une trousse ou kit prédictif des caractéristiques phénotypiques de qualité d'une graine de plante, caractérisé en ce qu'il comprend : a) une sonde ou une pluralité de sondes ou d'amorces telles que définies ci-dessus ; b) le cas échéant, les réactifs nécessaires à la réalisation d'une réaction d'hybridation ou d'amplification.
Selon un premier aspect, le nécessaire ou kit de détection est caractérisé en ce que la ou les sondes sont immobilisées sur un support. Selon un second aspect, le nécessaire ou kit de détection est caractérisé en ce que les sondes oligonucléotidiques comprennent un marqueur détectable.
Une amorce ou une sonde nucléotidique selon l'invention peut être préparée par toute méthode adaptée bien connue de l'homme du métier, y compris par clonage et action d'enzymes de restriction ou encore par synthèse chimique directe selon des techniques telles que la méthode au phosphodiester de Narang et al. (1979) ou de Brown et al.
(1979), la méthode au diéthylphosphoramidites de Beaucage et al.
(1980) ou encore la technique sur support solide décrite dans le brevet européen n° EP-0.707.592. Chacun des acides nucléiques selon l'invention, y compris les sondes et amorces oligonucléotidiques décrites ci-dessus, peut être marqué, si désiré, en incorporant une molécule détectable, c'est-à-dire un marqueur détectable par des moyens spectroscopiques, photochimiques, biochimiques, immunochimiques ou encore chimiques.
Par exemple, de tels marqueurs peuvent consister en des isotopes radioactifs (32P 3H, 35S), des molécules fluorescentes (5- bromodéoxyuridine, fluoresceine, acétylaminofluorène) ou encore des ligands tels que la biotine. Le marquage des sondes est fait de préférence par incorporation de molécules marquées au sein des polynucléotides par extension d'amorces, ou bien par rajout sur les extrémités 5' ou 3'.
Des exemples de marquage non radioactif de fragments d'acides nucléiques sont décrits notamment dans le brevet français n° FR-
78.10975 ou encore dans les articles de Urdea et al. (1988) ou Sanchez
Pescador et al. (1988).
De manière avantageuse, les sondes selon l'invention peuvent avoir des caractéristiques structurelles de nature à permettre une amplification du signal, telles que les sondes décrites par Urdea et al;
(1991 ) ou encore dans le brevet européen n° EP-0.225.807 (Chiron).
Les sondes oligonucléotidiques selon l'invention peuvent être utilisées notamment dans des hybridations de type Southern à l'ADN du gène Sh2 ou encore dans des hybridations à l'ARN messager de ce gène lorsque l'expression du transcrit correspondant est recherchée dans un échantillon.
Les sondes selon l'invention peuvent aussi être utilisées pour la détection de produits d'amplification PCR ou encore pour la détection de mésappariements. Des sondes ou amorces nucléotidiques selon l'invention peuvent être immobilisées sur un support solide. De tels supports solides sont bien connus de l'homme du métier et englobent les surfaces des puits de plaques de micro-titration, les billes de polystyrène, les billes magnétiques, les bandes de nitrocellulose ou encore les microparticules telles que les particules de latex.
Moyens d'expression des acides nucléiques comprenant un site polymorphe du gène Sh2.
L'invention concerne également l'utilisation des méthodes décrites ci-dessus pour isoler et /ou cloner les formes alléliques particulières et/ou favorables du gène Sh2, notamment en combinaison avec des techniques de biologie moléculaire comme par exemple la PCR, la RT- PCR, le séquençage d'allèles (par exemple pyroséquençage,...). L'homme de l'art pourra trouver la description des principales techniques de clonage dans des ouvrages généraux tels que « Guide to Molecular Cloning Techniques » (Berger et Kimmel, ref), « Molecular Cloning A- laboratory manual » (Sambrook et al., 2001 ), « Current protocols in molecular biology » (Ausubel ét al., 1997).
Un acide nucléique comprenant la séquence complète d'un allèle déterminé du gène Sh2 et comprenant au moins une base polymorphe
d'un site polymorphe tel que défini dans la présente description, ou un acide nucléique comprenant l'ensemble des exons de cet allèle déterminé du gène Sh2, peut être obtenu selon des techniques bien connues de l'homme du métier, comme par exemple par la technique d'amplification PCR à l'aide d'amorces s'hybridant spécifiquement avec les extrémités nucléotidiques cibles choisies du gène Sh2, comme cela est décrit notamment dans les exemples.
Notamment, l'homme du métier peut se baser sur la séquence SEQ ID N°1 pour synthétiser des sondes et des amorces nucléotidiques permettant d'isoler et de cloner n'importe quel acide nucléique allélique du gène Sh2.
Par exemple, l'homme du métier peut obtenir un acide nucléique dérivé du gène Sh2 et comprenant au moins un allèle associé à une caractéristique phénotypique de quantité ou de qualité de la graine améliorée d'au moins un site polymorphe selon l'invention en amplifiant respectivement la partie 5' et la partie 3' du gène Sh2 en se basant sur la séquence nucléotidique SEQ ID N°1.
L'invention a aussi pour objet un vecteur recombinant dans lequel a été inséré un acide nucléique comprenant la séquence complète d'un allèle déterminé du gène Sh2 et comprenant au moins une base polymorphe d'un site polymorphe tel que défini dans la présente description, ou un acide nucléique comprenant l'ensemble des exons de cet allèle déterminé du gène Sh2.
De préférence, un tel acide nucléique est un acide nucléique dérivé du gène Sh2 de séquence SEQ ID N°1 et comprenant au moins une base polymorphe ou au moins une séquence nucléotidique polymorphe à au moins l'une des positions -921 ,-830 à -824,-580 à - 573, - 438, - 362, - 347, -296, -277, -266, -168, -15, +35, +304, +515, +587, +678, +960, +1059, +1068, +1081 , +1473, +1505, +1542, +1867, +2514, +2771 , +2939, +2983 et +3123 du gène Sh2 de séquence SEQ ID N°1.
Un premier acide nucléique objet de l'invention est un acide nucléique susceptible de conférer à une plante, de préférence une céréale, en particulier à un maïs, un nombre modifié de graines, par rapport au maïs de référence de la variété Black Mexican Sweet décrite
par Shaw et Hannah (1992), ledit acide nucléique comprenant la forme allélique associée à l'expression du caractère phénotypique modifié de qualité de la graine, tel que défini dans la présente description à au moins un site polymorphe choisi parmi les sites polymorphes - 168, + 1473, + 1542 et + 2983 du gène Sh2 de séquence SEQ ID N°1.
Un second acide nucléique objet de l'invention est un acide nucléique susceptible de conférer à une plante, de préférence une céréale, en particulier à un maïs, une masse modifiée de la graine par rapport au maïs de référence de la variété Black Mexican Sweet décrite par Shaw et Hannah (1992), ledit acide nucléique comprenant la forme allélique associée à l'expression du caractère phénotypique modifié de qualité de la graine, tel que défini dans la présente description, à au moins un site polymorphe choisi parmi les sites polymorphes - 168.+1473, + 1542 et + 2983 du gène Sh2 de séquence SEQ ID N°1. Un troisième acide nucléique objet de l'invention est un acide nucléique susceptible de conférer à une plante, de préférence une céréale en particulier à un maïs, une teneur modifiée en protéines dans les graines, par rapport au maïs de référence de la variété Black Mexican Sweet décrite par Shaw et Hannah (1992), ledit acide nucléique comprenant la forme allélique associée à l'expression du caractère phénotypique modifié de qualité de la graine, tel que défini dans la présente description, à au moins un site polymorphe choisi parmi les sites polymorphes - 168, + 1473, + 1542, + 2983, - 830 à - 824, - 362, - 347, - 296, - 15, + 515, + 1068, + 1505 et + 2939 du gène Sh2 de séquence SEQ ID N°1.
Un quatrième acide nucléique objet de l'invention est un acide nucléique susceptible de conférer à une plante, de préférence une céréale en particulier à un maïs, une teneur modifiée en amidon dans les graines, par rapport au maïs de référence de la variété Black Mexican Sweet décrite par Shaw et Hannah (1992), ledit acide nucléique comprenant la forme allélique associée à l'expression du caractère phénotypique modifié de qualité de la graine, tel que défini dans la présente description, à au moins un site polymorphe choisi parmi les sites polymorphes - 830 à - 824, - 362 , - 347, - 296, - 15, + 515, + 587, + 1068, + 1505 et + 2939 du gène Sh2 de séquence SEQ ID N°1.
Un cinquième acide nucléique objet de l'invention est un acide nucléique susceptible de conférer à une plante, de préférence une céréale, en particulier à un maïs, une teneur modifiée en amylose dans les graines, par rapport au maïs de référence de la variété Black Mexican Sweet décrite par Shaw et Hannah (1992), ledit acide nucléique comprenant la forme allélique associée à l'expression du caractère phénotypique modifié de qualité de la graine, tel que défini dans la présente description, à au moins un site polymorphe choisi parmi les sites polymorphes - 438, - 266, + 678 , + 960, - 921 , - 580 à - 573, - 277, + 35, + 304, + 1059, + 1081 , + 1867, + 2514, + 2771 et + 3123 du gène Sh2 de séquence SEQ ID N°1.
Un sixième acide nucléique objet de l'invention est un acide nucléique susceptible de conférer à une plante, de préférence une céréale en particulier à un maïs un rapport protéines/amidon modifié dans la graine, par rapport au maïs de référence de la variété Black Mexican Sweet décrite par Shaw et Hannah (1992), ledit acide nucléique comprenant la forme allélique associée à l'expression du caractère phénotypique modifié de qualité de la graine, tel que défini dans la présente description, à au moins un site polymorphe choisi parmi les sites polymorphes-168, + 1473, + 1542, + 2983, - 830 à - 824, - 362, - 347, - 296, - 15, + 515, + 587, + 1068, + 1505 et + 2939 du gène Sh2 de séquence SEQ ID N°1.
La variété de maïs Black Mexican Sweet décrite par Shaw et Hannah (1992), qui est la variété de référence, peut aussi être désignée variété de maïs « sauvage », aux fins de la présente description.
Les techniques de mesure du nombre de graines, de la masse de la graine, de la teneur en protéines de la graine, de la teneur en amidon dans la graine, de la teneur en amylose dans la graine et le calcul du rapport teneur en protéines/teneur en amidon font partie des connaissances générales techniques de l'homme du métier.
L'invention concerne aussi un vecteur recombinant, par exemple un vecteur recombinant de clonage ou un vecteur recombinant d'expression, dans lequel a été inséré un acide nucléique tel que défini ci-dessus.
Selon une des applications de l'invention, les séquences nucléotidiques constituant des formes alléliques particulières du gène Sh2 peuvent être clonées, transférées dans des cellules, en particulier pour produire des plantes transgéniques. Les séquences nucléotidiques des loci sélectionnés sont introduites dans les cellules végétales, soit en culture soit dans des organes de plantes comme par exemple les feuilles, les tiges, les graines, les racines, etc .. L'expression naturelle ou synthétique de ces séquences peut être réalisée en liant de manière opérationnelle ces séquences d'intérêts à un promoteur, en incluant le construit dans un vecteur et en introduisant le vecteur dans une cellule hôte. Un promoteur endogène lié à la séquence nucléotidique à introduire peut favorablement être employé. Les vecteurs habituellement utilisés comprennent des séquences initiatrices et terminatrices à la fois de transcription et de traduction, et des promoteurs permettant la régulation de l'expression de cette séquence nucléotidique particulière. Les vecteurs peuvent également comprendre des cassettes d'expression avec au moins une séquence terminatrice indépendante, des séquences permettant la replication de la cassette chez les eucaryotes ou les procaryotes ou les deux (vecteurs navettes) et un marqueur de sélection pour au moins l'un des deux systèmes procaryotiques ou eucaryotiques (Giliman et Smith, 1979 ; Roberts et al., 1987 ; Schneider et al., 1995 ; Sambrook et al., 2001 ; Ausubel et al., 1997).
Parmi les terminateurs de transcription pouvant être utilisés, on peut citer le terminateur polyA 35S du virus de la mosaïque du chou-fleur (Franck et al. 1980) ou le terminateur polyA NOS, qui correspond à la région en 3' non-codante du gène de la nopaline synthase du plasmide Ti û'Agrobacterium tumefaciens souche à nopaline.
Parmi les promoteurs de transcription pouvant être utilisés, on peut citer notamment les promoteurs dits constitutifs, les promoteurs dits inductifs ainsi que les promoteurs tissus spécifiques. Un promoteur constitutif permet une expression forte du transcrit dans l'ensemble des tissus de la plante régénérée et sera actif dans la plupart des conditions environnementales, et dans l'ensemble des étapes de transformation et de différentiation cellulaires. Par exemple, le promoteur 35S ou le promoteur double pd35S du CaMV décrit dans l'article de Kay et al.,
(1987), ou le promoteur de l'actine du riz suivi de l'intron actine de riz contenu dans le plasmide pAct1-F4 décrit par Me Elroy et al. 1991 ; ou encore le promoteur ubiquitine 1 de maïs (Christensen et al., 1996). Alternativement, il peut être intéressant d'utiliser une séquence promotrice de transcription inductible capable d'être contrôlée par les conditions environnementales ou le stade de développement, comme par exemple les promoteurs phénylalanine ammoniac lyase (PAL), d'HMG- CoA réductase (HMG), de chitinases, de glucanases, d'inhibiteurs de protéinase (PI), de gènes de la famille PR1 , de la nopaline synthase (nos) ou du gène vspB (US-5.670.349), tous ces promoteurs étant rappelés avec les références des publications correspondantes par le Tableau 3 du brevet US-5.670.349. Une autre catégorie de promoteurs pouvant être utilisée regroupe les promoteurs tissus spécifiques, comme par exemple les promoteurs tissus spécifiques des graines (Datla, R. et al., 1997), notamment les promoteurs de la napine (EP-0.255.378), de la glutenine, de l'héliantinine (WO-92/17580), de l'albumine (WO- 98/45460), de l'oléosine (WO-98/45461 ), de IΑTS1 ou de IΑTS3 (WO- 99/20775).
Les méthodes les plus répandues pour introduire des acides nucléiques dans des cellules bactériennes peuvent être utilisées dans le cadre de cette invention. Ce peut être la fusion de cellules réceptrices avec des protoplastes bactériens contenant l'ADN, l'électroporation, le bombardement par projectiles, l'infection par des vecteurs viraux, etc. Les cellules bactériennes sont souvent utilisées pour amplifier le nombre de plasmides contenant le construit comprenant la séquence nucléotidique, objet de l'invention. Les bactéries sont mises en culture et les plasmides sont ensuite isolés selon des méthodes bien connus de l'homme du métier (se reporter aux manuels de protocoles déjà cités), incluant les kits de purification de plasmides vendus dans le commerce comme par exemple EasyPrepI de Pharmacia Biotech ou QIAexpress Expression System de Qiagen. Les plasmides ainsi isolés et purifiés sont ensuite manipulés pour produire d'autres plasmides qui seront utilisés pour transfecter les cellules végétales.
La transformation de cellules végétales peut être réalisée par diverses méthodes telles que, par exemple, le transfert des vecteurs
susmentionnés dans les protoplastes végétaux après incubation de ces derniers dans une solution de polyéthylèneglycol en présence de cations divalents (Ca 2+), l'électroporation (Fromm et al. 1985), l'utilisation d'un canon à particules, ou la micro-injection cytoplasmique ou nucléaire (Neuhaus et al, 1987).
Une des méthodes de transformation de cellules végétales pouvant être utilisée dans le cadre de l'invention est l'infection des cellules végétales par un hôte cellulaire bactérien comprenant le vecteur contenant la séquence d'intérêt. L'hôte cellulaire peut être Agrobacterium tumefaciens (An et al. 1986), ou A. rhizogenes (Guerche et al. 1987).
De manière préférentielle, la transformation des cellules végétales est réalisée par le transfert de la région T du plasmide circulaire extrachromosomique inducteur de tumeurs Ti d'A tumefaciens, en utilisant un système binaire (Watson et al., 1994). Pour ce faire, deux vecteurs sont construits. Dans un de ces vecteurs, la région d'ADN-T a été éliminée par délétion, à l'exception des bords droit et gauche, un gène marqueur étant inséré entre eux pour permettre la sélection dans les cellules de plantes. L'autre partenaire du système binaire est un plasmide Ti auxiliaire, plasmide modifié qui n'a plus d'ADN-T mais contient toujours les gènes de virulence vir nécessaires à la transformation de la cellule végétale. Ce plasmide est maintenu dans Agrobacterium.
Selon un mode préféré, la méthode décrite par Ishida et al. (1996) peut être appliquée pour la transformation des monocotylédones, en particulier le maïs. Selon un autre protocole, la transformation est réalisée selon la méthode décrite par Finer et al. (1992) utilisant le canon à particules de tungstène ou d'or.
L'invention a aussi pour objet l'utilisation d'un acide nucléique dérivé du gène Sh2 de séquence SEQ ID N°1 tel que défini ci-dessus pour transformer une cellule hôte.
De préférence, la cellule hôte est une cellule hôte bactérienne, par exemple une cellule de Agrobacterium tumefaciens, ou une cellule végétale, de préférence une cellule de céréale, et de manière tout à fait préférée une cellule de maïs, de riz, de blé, de seigle ou d'orge.
L'invention concerne également les cellules transformées, avec les séquences nucléotidiques constituant des formes alléliques particulières du gène Sh2, y compris les micro-organismes (virus et bactéries) et les cellules végétales, en particulier des cellules de maïs. Elle a trait en particulier à une cellule hôte transformée par un acide nucléique dérivé du gène Sh2 ou par un vecteur recombinant, tels que définis ci-dessus.
L'invention concerne également les plantes régénérées à partir des cellules végétales transformées décrites ci-dessus, ainsi que les plantes dont au moins un des parents a été régénéré à partir d'une cellule végétale transformée comprenant au moins une des séquences nucléotidiques constituant une forme allélique particulière du gène Sh2.
L'invention concerne également l'utilisation d'un acide nucléique, ou d'un vecteur recombinant ou d'une cellule hôte transformée, définis selon l'invention, pour fabriquer une plante transformée capable de produire des graines à qualités industrielles ou agroalimentaires améliorées.
Rentre également dans le cadre de l'invention une plante transformée comprenant une pluralité de cellules hôtes transformées selon l'invention.
L'invention a également pour objet un procédé pour l'obtention d'une plante transformée susceptible de produire des graines à qualités industrielles ou agroalimentaires améliorées, caractérisé en ce qu'il comporte les étapes suivantes : a) transformation d'au moins une cellule végétale par un acide nucléique ou par un vecteur recombinant selon l'invention ; b) sélection des cellules transformées obtenues à l'étape a) ayant intégré dans leur génome au moins une copie d'un acide nucléique selon l'invention ; c) régénération d'une plante transformée à partir des cellules transformées obtenues à l'étape b). L'invention s'étend à une plante transformée ou toute partie d'une plante transformée telle que définie dans la présente description, telle que la racine, mais aussi les parties aériennes comme la tige, la feuille, la fleur et surtout la graine. L'invention a encore pour objet une semence
ou une graine de plante produite par une plante transformée telle que définie ci-dessus. Typiquement, une telle semence transformée ou un tel grain transformé comprend une ou plusieurs cellules comprenant dans leur génome une ou plusieurs copies d'un acide nucléique définie selon l'invention, le cas échéant de manière contrôlée et inductible.
Fait également partie de l'invention tout produit de transformation d'une semence telle que définie dans la présente description.
Anticorps dirigés spécifiquement contre les protéines SH2 produites par un acide nucléique comprenant un site dont le polymorphisme est décrit selon l'invention
L'invention concerne également les anticorps monoclonaux ou polyclonaux reconnaissant spécifiquement des polypeptides correspondant à des allèles du gène Sh2, ces allèles comprenant au moins l'une des formes décrites aux positions n°-921 , -830à-824, -580à- 573, -438, -362, -347, -296, -277, -266, -168, -15, 35, 304, 515, 587, 678, 960, 1059, 1068, 1081 , 1473, 1505, 1542, 1867, 2514, 2771 , 2939, 2983, 3123.
Des anticorps préférés selon l'invention sont les anticorps suivants :
- les anticorps reconnaissant spécifiquement la région d'acides aminés d'un polypeptide SH2 codée par les nucléotides localisés à proximité du site polymorphe +678, ces anticorps étant capables de discriminer entre la présence d'un résidu Alanine et la présence d'un résidu Thréonine codé par le codon comprenant la base polymorphe de ce site polymorphe ; et
- les anticorps reconnaissant spécifiquement la région d'acides aminés d'un polypeptide SH2 codée par les nucléotides localisés à proximité du site polymorphe +2983, ces anticorps étant capables de discriminer entre la présence d'un résidu Leucine et la présence d'un résidu Serine codé par le codon comprenant la base polymorphe de ce site polymorphe
L'invention concerne également le kit de diagnostic comportant un mélange de ces anticorps.
Les anticorps définis ci-dessus sont utiles notamment pour prédire les caractéristiques phénotypiques de quantité ou de qualité de la graine, sans nécessiter d'analyse directe, par exemple biochimique, longue et coûteuse de ces caractéristiques phénotypiques. Des anticorps contre les polypeptides SH2 définis ci-dessus peuvent être préparés selon les techniques classiques bien connues de l'homme du métier.
Par " anticorps " au sens de la présente invention, on entendra notamment des anticorps polyclonaux ou monoclonaux ou des fragments (par exemple les fragments F(ab)'2, F(ab)) ou encore tout polypeptide comprenant un domaine de l'anticorps initial reconnaissant le polypeptide ou le fragment de polypeptide cible selon l'invention.
Des anticorps monoclonaux peuvent être préparés à partir d'hybridomes selon la technique décrite par Kohler et Milstein (1975) La présente invention concerne également des anticorps dirigés contre un polypeptide tel que décrit ci-dessus ou un fragment ou un variant de ce dernier, tel que produit dans la technique du trioma ou encore la technique d'hybridome décrite par Kozbor et al. (1983).
L'invention a également trait à des fragments d'anticorps simple chaîne Fv (ScFv) tels que décrits dans le brevet US N°4,946,778 ou encore par Martineau et al. (1998).
Les anticorps selon l'invention comprennent également des fragments d'anticorps obtenus à l'aide de banques de phages telles que décrites par Ridder et al. (1995) ou encore des anticorps humanisés tels que décrits par Reinmann et al. (1997) et Léger et al. (1997). Les préparations d'anticorps selon l'invention sont utiles dans des tests de détection immunologiques destinés à l'identification de la présence et/ou de la quantité d'un polypeptide SH2 tel que défini ci-dessus ou d'un fragment peptidique de celui-ci, présent dans un échantillon. Un anticorps selon l'invention pourra comprendre en outre un marqueur détectable isotopique ou non isotopique, par exemple fluorescent, ou encore être couplé à une molécule telle que la biotine, selon des techniques bien connues de l'homme du métier.
Ainsi, l'invention a en outre pour objet un procédé pour détecter la présence d'un polypeptide conforme à l'invention dans un échantillon, ledit procédé comprenant les étapes de: a) mettre en contact l'échantillon à tester avec un anticorps tel que décrit ci-dessus; b) détecter le complexe antigène/anticorps formé.
L'invention est également relative à un nécessaire ou kit de diagnostic pour la détection de la présence d'un polypeptide conforme à l'invention dans un échantillon, ledit nécessaire comprenant: a) un anticorps tel que défini ci-dessus; b) le cas échéant, un ou plusieurs réactifs nécessaires à la détection du complexe antigène/anticorps formé.
De surcroît, l'invention a également pour objet une base de données comportant au moins l'une quelconque des séquences nucléotidiques décrites, obtenues, isolées ou identifiées dans au moins l'une des applications de l'invention.
La présente invention est en outre illustrée, sans pour autant être limitée, par les figures et les exemples suivants:
EXEMPLES
Exemple 1 : Identification de sites polymorphes dans le gène Sh2. 1.1 Matériel végétal
Au total, 33 lignées consanguines de maïs ont été analysées pour, d'une part, le séquençage du gène Sh2, et d'autre part les mesures de phénotypes du grain. Ces lignées sont d'origine européenne, américaine ou tropicale, et leur apparentement, sur la base de données RFLP, est faible (Dubreuil et al. 1996, et données non publiées). Les caractéristiques du grain des lignées A à Z et a à e sont présentées dans le tableau 1.
Tableau 1 : Caractéristiques des lignées
Tableau 1 : Caractéristiques des lignées (suite)
1.2 Détection du polymorphisme du gène Sh2
L'ADN a été isolé à partir de jeunes feuilles par une méthode décrite par Causse et al. (1995). Deux fragments chevauchants ont été amplifiés par PCR à l'aide de primers dessinés à partir de la séquence de référence du gène Sh2 chez la lignée Black Mexican Sweet SEQ ID N°1 (Shaw and Hannah, 1992). Le premier fragment (Sh2-I) de longueur voisine de 2653 bp couvre environ 1000bp en amont de la boite TATA supposée, les trois premiers introns, les trois premiers exons ainsi qu'une partie de l'exon 4. Le second fragment (SH2-II) a une longueur voisine de 2455 bp, et recouvre les introns 3 à 12, les exons 3 à 12 ainsi qu'environ 30 bases de l'exon 13. Les amorces utilisées sont les suivants (position sur la séquence de référence) : pour Sh2-I :
- 5'-CTGGGCAGGGAGAGCTAT (position -1008) (SEQ ID N° 40) - 3'-GGATATCAATAAGCCTGTAACAT (position 1623) (SEQ ID N°41) pour Sh2-ll :
- 5'-TGCAGCATTCTCAAACACAG (position 1197) (SEQ ID N°42)
- 3'-CGATGTTGCATTCTCTCAGTAA (position 3630) (SEQ ID N° 43) Pour les deux fragments et toutes les lignées, les amplifications par PCR ont été réalisées dans 100μl (environ 0.1 à 1.5μg d'ADN, 1.75u de taq polymérase Roche Expand High Fidelity, 0.5μM de chaque
amorce, 0.3μM de dNTP, 1.875 mM de Mg2+) dans les conditions suivantes :
- dénaturation à 94°C : 2 min
- 9 cycles : dénaturation à 94°C : 30 s hybridation de 60 à 52°C (diminution de 1°C par cycle) : 30 s élongation à 72°C : 2 min
- 25 cycles : dénaturation à 94°C : 30 s hybridation à 51 °C : 30 s élongation à 72°C : 2 à 10 min (augmentation de 20 s par cycle)
- élongation à 72°C : 7 min
Après purification sur gel grâce au kit QIAEX de Quiagen, les produits de PCR ont été séquences par les sociétés Génome Express ou Genaxis. Tout d'abord, les amorces de PCR ont été utilisées pour la séquence, puis la partie centrale des fragments a été séquencée grâce aux nouvelles amorces suivantes : - Pour Sh2-l :
5'-ATGTCCTGCACCTAGGGAGC (position -424), (SEQ ID N° 44) 5'-CCACCAGTATGCCCTCCTCA (position -58), (SEQ ID N° 45) 3'-GACCCTATTTGAACAAATCTT (position 852), (SEQ ID N° 46) 3'-GCAGCAACTCTAAGGTCTATTT (position 961 ), (SEQ ID N° 47)
5'-TTTGGGAGACTTCCAGTCAA (position 1503), (SEQ ID N° 48) - Pour Sh2-ll :
3'-CATCGTCCTCGACATGTTT (position 2365), (SEQ ID N° 49) 3'-GGAAAGCAGATTAGACCATAT (position 2486), (SEQ ID N° 50) 3'-TGGAAACTGGAAACAAAAACAAC (position 3098) (SEQ ID N° 51 )
Une première correction des séquences, les contigs et l'alignement des séquences ont été réalisés grâce aux logiciels
Sequencing Analysis et Séquence Navigator de ABI. Les séquences ont été alignées soit visuellement, soit en utilisant la procédure d'alignement
multiple Clustal du logiciel Séquence Navigator. Les fragments n'ont été séquences que sur un seul brin. Néanmoins, des vérifications ont été réalisées. Tout d'abord la partie chevauchante des fragments de séquences n'a jamais montré d'incohérence lors de la réalisation des contigs. De plus, l'amplification par PCR et le séquençage ont été répétés sur un total d'environ 10000bp afin de vérifier l'ensemble des polymorphismes singletons (cas où une seule lignée diffère de toutes les autres). Des résultats identiques ont toujours été obtenus pour les deux répétitions. Les sites pour lesquels des différences ont été observées parmi les séquences de Sh2 sont identifiés par leur position par rapport à la séquence de référence de la lignées Black Mexican Sweet SEQ ID N°1 (Shaw et Hannah, 1992). Sur l'ensemble de la région séquencée, 72 sites polymorphes ont été observés. Parmi ces polymorphismes, 19 présentent une différence pour une seule lignées, toutes les autres étant identiques. Ces singletons ne seront pas utilisables dans la recherche d'associations avec la variabilité phénotypique des grains. Parmi les 53 sites informatifs restants, certains sont parfaitement redondants entre eux, c'est à dire qu'ils apportent une information identique quant aux similarités entre lignées et permettent donc une discrimination identique en deux groupes de lignées. Parmi les 20 sites ou groupes de sites informatifs et non redondants, ceux trouvés statistiquement associés à des mesures phénotypiques sont indiqués dans la présentation détaillée de l'invention. Le tableau 2 présente la forme allélique de chaque lignée, ou groupe de lignées, pour ces polymorphismes.
Tableau 2 : formes alléliques aux 29 polymorphismes décrits, dont 20 SNP et 9 indels, nommés par leur position sur la séquence de référence SEQ ID N°1 de la lignée Black Mexican Sweet (BMS). Les notes 1 à indiquent les sites redondants: le site -168 est redondant avec les sites 1473, 1542 et 2983; l'indel -830à-824 est redondant avec les sites -362, -347, -296, -15, 515, 587, 1068, 1505 et 2939; le site -438 est redondant avec les sites -266, 678 et 960; le site -921 est redondant avec les sites -580à-573, -277, 35, 304, 1059, 1081 , 1867, 2514, 2771 et 3123. Les haplotypes H1 à H6 correspondent aux lignées suivantes :
Exemple 2 : Identification des associations statistiquement significatives entre un allèle donné des sites polymorphes du gène Sh2 et une ou plusieurs caractéristigues phénotypiques de la qualité de la graine.
2.1 Mesures phénotypiques du grain
Trois essais au champ ont été réalisés. La première année (année 1 ) 30 lignées ont été étudiées, c'est à dire les lignées présentées dans le tableau 1 à l'exception des lignées RX01 , RX02 et RX03. Pour les essais mis en place les années 2 et 3, les 33 lignées ont été randomisées et répétées dans trois blocs. Chaque lignée a été représentée, dans chaque bloc, par une à quatre plante semées côte à côte. Pour chacune des trois expérimentations, les plantes ont été autofécondées et les grains récoltés à maturité. Les analyses d'associations avec les polymorphismes moléculaires de Sh2 ont porté sur des valeurs moyennes de chaque caractère par expérimentation. Les teneurs en protéines, amidon et amylose de chaque lignée ont été dosées manuellement pour l'essai de l'année 1 (voir détail des méthodes dans Sene et al. 2000) et prédites par spectrométrie en réflectance dans le proche infrarouge (NIRS) au CIRAD-Montpellier par C. Mestres et F. Davrieux pour les essais des années 2 et 3. L'acquisition des spectres a été effectuée sur grains entiers par un appareil Nirsystem 6500. Les données spectrales, pour une gamme de longueurs d'onde de 400 à 2500 nm, ont été collectées et analysées grâce au logiciel NIRS 2 version 4.0 (Infrasoft Intemationnal). La gamme de valeurs prédites n'étant pas parfaitement superposable à la gamme de valeurs ayant permis le calibrage des équations, une trentaine d'échantillons issue de nos deux essais a été utilisée pour affiner le calibrage.
2.2 Associations entre polymorphismes du gène Sh2 et caractères phénotypiques d'intérêt.
Les polymorphismes décrits ci-dessus sont statistiquement associés à des caractères du grains tels que le nombre de grains par épi, la masse du grain mûr, la teneur en protéines, amidon et amylose du grain, et le
rapport de la teneur en protéines sur la teneur en amidon du grain. Ces associations ont été mises en évidence par des tests de régressions multiples grâce au logiciel SAS (1990). Lorsqu'un caractère est significativement associé à plusieurs sites, il est possible de définir la part de variabilité du caractère expliquée par l'ensemble des sites impliqués (R2τ, dernière colonne du Tableau 3). Par exemple, on peut noter que, dans l'expérimentation de la première année, la combinaison de l' Indel -830 à -824 et du SNP -168 permet d'expliquer 64% de la variance du rapport protéine/amidon parmi l'ensemble des lignées. La redondance des sites (voir tableau 2) rend l'interprétation de causalité fine entre un site et un caractère difficile. De plus, il est possible que des polymorphismes non décrits dans l'invention et présents à proximité de la région séquencée, soit dans la région promotrice soit dans la partie 3' non séquencée du gène, soient aussi redondants avec les sites décrits et donc associés aux mêmes caractères. Chez la pomme de terre, une zone importante pour la régulation de l'expression du gène se trouve à plus de 2kb en amont de la TATA box (Muller-Rober et al., 1994). Néanmoins, que la relation de causalité entre polymorphisme moléculaire et phénotypique soit connue ou non, les associations statistiques décrites dans l'invention permettent l'utilisation des SNP et indels décrits à des fins de prédiction phénotypique ou d'amélioration de la valeur génétique des grains de maïs.
Tableau 3 : résultats des tests d'associations par régressions multiples entre chaque caractère du grain et les sites polymorphes dans la séquence de Sh2 pour 25 à 33 lignées. Les sites indiqués sont en redondance totale avec d'autres sites le long de la séquence de Sh2 (voir Tableau 2). Les colonnes ni , moyl , n2, et moy2 contiennent les effectifs et les valeurs moyennes du caractère pour les deux groupes de lignées discriminées par les sites polymorphes correspondants. F: valeur du test de Fisher, P: degré de signification, R2: part de variation phénotypique expliquée par un site, R2γ: part de variation phénotypique expliquée par un groupe de sites combinés par régression multiple.
Tableau 3
REFERENCES
An ét al., (1986) Plant Physiol. 81 , 86-91 Ausubel et al., (1997) Current protocols in molecular biology
Bae et al. (1990) Maydica 35: 317-322.
Beaucage et al. (1981), Tetrahedron Lett., 22:1859-1862. Berger et Kimmel, Guide to Molecular Cloning Techniques
Bhave et al. (1990) The Plant Cell 2: 581-588. Bourdon et al., (2001 ) EMBO reports 2 (5) 394-398.
Brown et al. (1979), Methods Enzymol., 68:109-151. Causse et al. (1995) Molecular Breeding 1 : 259-272.
Christensen et al. (1996), Transgenic. Res., 5:213
Datla, R et al. (1997), Biotechnology Ann. Rev., 3:269-296 Dellaporta S.L., Wood J. and Hicks J.B, (1983), Plant Mol. Biol. Reporter 1 (4), 19-21.
Dubreuil et al. (1996) Crop Sci. 36: 790-799.
Finer et al. (1992) Plant Cell Report, 11 , 323-328
Franck et al., (1980) Cell, 21 , 285-294 Fromm et al., (1985) Proc. Noat. Acad. Sci. 82, 5824
Gibbs et al. (1989), Nuceic acids research, 17, 2347.
Giliman et Smith (1979), Gène 8, 81
Giroux et al., (1996), Proc. Natl. Acad. Sci. USA 93: 5824-5829.
Goldman et al. (1993) Theor. Appl. Genêt. 87: 217-224. Guerche et al. (1987), Mol Gen. Genêt 206, 382
Ishida et al. (1996) Nature biotechnology 14, 745-750
Kay et al., (1987) Science 236, 4805
Kohler G and Milstein C;, (1975), Nature, volume 256:495
Kozbor ét al., (1983), Hybridoma, vol.2 (1 ):7-16. Léger OJ ét al., (1997), Hum Antibodies, vol.8 (1 ):3-16 Lewin, (1999), Gènes VII
Martineau P et al., (1998), J. Mol. Biol. vol.280(1):117-127. Muller-Rober et al. (1994), The plant cell 6, 601-612.
Neuhaus et al., (1987).Theor. Appl. Genêt. 75(1 ), 30-36
Nyrèn et al. (1997), Anal. Biochem, 244, 367-373
Reinmann KA et al. (1997), Aids Res. Hum retroviruses, vol.13 (11 ):933- 943. Ridder R. et al., (1995), Biotechnology (NY), vol.13 (3):255-260. Roberts et al. (1987), Nature 328, 731
Sambrook et al., (2001 ), Molecular Cloning A-laboratory manual
Sanchez Pescador, (1988), J. Clin. Microbiol., 26 (10):1934-1938.
SAS (1990) SAS user guide: statistics. Version 6. SAS institute, Cary, North Carolina.
Schneider et al. (1995), Protein expr. Purif. 6435, 10
Séné et al. (2000) Plant Physiol. Biochem. 38: 459-472.
Shaw et Hannah (1992), Plant Physiol 98, 1214-1216
Urdea et al. (1988), Nucleic Acids Research, 11 :4937-4957. Watson et al. (1994) ADN recombinant, Ed. De Boek Université, 273-292