FR2876704A1 - PROCESS FOR PREPARING A BIOLOGICAL IDENTIFIER - Google Patents

PROCESS FOR PREPARING A BIOLOGICAL IDENTIFIER Download PDF

Info

Publication number
FR2876704A1
FR2876704A1 FR0410965A FR0410965A FR2876704A1 FR 2876704 A1 FR2876704 A1 FR 2876704A1 FR 0410965 A FR0410965 A FR 0410965A FR 0410965 A FR0410965 A FR 0410965A FR 2876704 A1 FR2876704 A1 FR 2876704A1
Authority
FR
France
Prior art keywords
algorithm
sample
specific identification
individual
identification means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR0410965A
Other languages
French (fr)
Inventor
Franck Robert
Marcel Deleeuw
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beckman Coulter Genomics SA
Original Assignee
Genome Express SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genome Express SA filed Critical Genome Express SA
Priority to FR0410965A priority Critical patent/FR2876704A1/en
Priority to PCT/EP2005/055312 priority patent/WO2006040356A1/en
Publication of FR2876704A1 publication Critical patent/FR2876704A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6879Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for sex determination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

L'invention concerne concerne un nouveau procédé de préparation d'un moyen d'identification biologique - ou identifiant biologique - et son utilisation pour la traçabilité de la matière biologique, préférentiellement des animaux, en particulier du bétail comme les bovins.Le procédé comprend les étapes suivantes de :- prélèvement de l'échantillon biologique à identifier,- isolation de l'ADN dudit échantillon,- amplification et analyse des fragments microsatellites de l'ADN isolé et/ou des polymorphismes ponctuels,- codification des longueurs de fragments microsatellites obtenues et/ou des séquences des combinaisons de polymorphismes ponctuels selon un algorithme approprié pour l'obtention du moyen d'identification spécifique à la composition génétique dudit échantillon.The invention relates to a novel method for preparing a biological identification means - or biological identifier - and its use for the traceability of biological material, preferably animals, in particular cattle such as cattle. following steps: - taking the biological sample to be identified, - isolation of the DNA from said sample, - amplification and analysis of the microsatellite fragments of the isolated DNA and / or point polymorphisms, - coding of the lengths of microsatellite fragments obtained and / or sequences of combinations of point polymorphisms according to an appropriate algorithm for obtaining the means of identification specific to the genetic composition of said sample.

Description

Procédé de Préparation d'un Identifiant BiologiqueProcess for preparing a biological identifier

La présente invention concerne un nouveau procédé de préparation d'un moyen d'identification biologique ou identifiant biologique et son utilisation pour la traçabilité de la matière biologique, préférentiellement des animaux, en particulier du bétail comme les bovins.  The present invention relates to a new method for preparing a biological identification means or biological identifier and its use for the traceability of the biological material, preferably animals, in particular cattle such as cattle.

Les impératifs de tracabilité et de contrôle dans le cadre des différentes filières agro-alimentaire ont conduit les industriels à développer des méthodes de suivi standards susceptibles d'être communes et partagées par tous.  The requirements of traceability and control in the context of the various agri-food sectors have led manufacturers to develop standard monitoring methods that can be common and shared by all.

Ces problématiques sont d'autant plus sensibles que les durées de suivi sont long, comme c'est le cas par exemple dans le domaine de l'élevage, ou la tracabilité doit pouvoir être assurée fidèlement de la naissance de l'animal jusque dans l'assiette du consommateur, soit plusieurs années.  These issues are all the more sensitive as the length of monitoring is long, as is the case for example in the field of breeding, or the traceability must be faithfully assured from the birth of the animal into the world. consumer's plate, ie several years.

Ces méthodes portent tout autant sur le support de codification et de suivi (norme EAN pour les codes à barre, normes RFID...) que sur l'information susceptible d'être codifiée au titre de la tracabilité (p.e. norme de codification de produit, n lots, n d'identification bovins...).  These methods are as much about the coding and monitoring medium (EAN standard for bar codes, RFID standards, etc.) as on the information likely to be coded for traceability (eg product coding standard). , n batches, cattle identification n ...).

Aucune de ces méthodes, quelque soit leur robustesse, ne permettent cependant d'assurer une tracabilité parfaite et exempte de tout risque d'erreur. En effet, quelque soit le support de tracabilité (code barre, étiquette électronique...) ou l'information codifiée (n de lot, date, provenance...) cette information est décorrélée du produit auquel elle s'applique. L'arrachage de l'étiquette ou la perte des données... induisent dès lors une rupture de la chaîne de la tracabilité et font échec à son fonctionnement.  None of these methods, whatever their robustness, however, allow to ensure perfect traceability and free from any risk of error. Indeed, whatever the traceability support (bar code, electronic label ...) or the codified information (lot n, date, source ...) this information is decorrelated from the product to which it applies. The uprooting of the label or the loss of the data ... induce therefore a rupture of the chain of the tracability and do failure to its operation.

Le seul moyen de garantir une tracabilité "indestructible" est d'utiliser comme source ET comme support de donnée le produit lui-même. C'est ainsi que les produits sont parfois "marqués" de manière inaltérable (encre indélébile et/ou marquée, poinçon...). Mais de tels procédés induisent très souvent une altération du produit qui peut être parfois dommageable, ou ne garantisse pas que le marquage ne soit désolidarisé du produit.  The only way to guarantee "indestructible" traceability is to use the product itself as a source AND as a data carrier. This is how products are sometimes "marked" in an unalterable way (indelible and / or marked ink, punch ...). But such processes very often induce an alteration of the product that can sometimes be harmful, or does not guarantee that the marking is separated from the product.

Dans le domaine des matières vivantes, il existe cependant un support d'information intrinsèque, fiable et extrêmement redondant: l'ADN L'ADN de chaque être vivant contient dans chacune des cellules qui les constituent un message unique et non équivoque qui le défini biologiquement.  In the field of living matter, however, there is an intrinsic, reliable and extremely redundant information medium: DNA The DNA of each living being contains in each of the cells that constitute them a unique and unambiguous message that defines it biologically. .

L'ADN contient donc certaines informations qui sont propre à l'individu et qui lui sont intrinsèquement attachées. Répondant aux exigences de la discrimination et de la quasi inaltérabilité, ces informations constituent donc un parfait support de tracabilité individuelle.  DNA thus contains certain information that is specific to the individual and that is intrinsically attached to it. Responding to the requirements of discrimination and near unalterability, this information is therefore a perfect medium for individual traceability.

L'ADN constitue également un reflet du relationnel entre un individu et ses parents biologiques, en effet son contenu est une combinaison de l'ADN de la mère et du père. A cet égard, l'ADN constitue donc également un support de tracabilité parentale.  DNA is also a reflection of the relationship between an individual and his biological parents, indeed its content is a combination of the DNA of the mother and the father. In this respect, the DNA therefore also constitutes a parental traceability support.

Les techniques existantes aujourd'hui ne permettent cependant pas de faire une lecture directe, rapide et in situ des informations contenues dans l'ADN. Le décryptage de ces informations nécessite la mise en oeuvre de techniques d'analyse de biologie moléculaire réservées à une utilisation en laboratoire spécifique et selon des délais qui ne vont actuellement pas en deçà de 24 heures. Il convient donc de transformer cette information biologique en une information directement accessible, mais dont la pertinence et la validité peut être vérifiée à tout instant par une analyse génétique du produit auquel elles s'appliquent.  Existing techniques today, however, do not allow a direct, rapid and in situ reading of the information contained in the DNA. The decryption of this information requires the implementation of molecular biology analysis techniques reserved for use in a specific laboratory and according to deadlines that currently do not go below 24 hours. It is therefore necessary to transform this biological information into information that is directly accessible, but whose relevance and validity can be verified at any time by a genetic analysis of the product to which they apply.

Le coeur de la technique présentement exposée est donc de transformer certaines informations individuelles contenues dans l'ADN en un identifiant numérique spécifique à chaque individu et représentatif de son individualité biologique. L'approche suivie est la même que dans la constitution du numéro de sécurité sociale, qui est représentatif des caractéristiques sociales de l'individu et qui le rendent socialement unique. Dans notre hypothèse notre "numéro d'identification biologique" est représentatif des caractéristiques biologiques/génétiques de l'individu et qui le rendent biologiquement/génétiquement unique.  The heart of the technique currently exposed is therefore to transform certain individual information contained in the DNA into a numerical identifier specific to each individual and representative of its biological individuality. The approach followed is the same as in the constitution of the social security number, which is representative of the social characteristics of the individual and makes him socially unique. In our hypothesis, our "biological identification number" is representative of the biological / genetic characteristics of the individual and makes it biologically / genetically unique.

Afin de garantir sa pertinence industrielle, cet identifiant doit, en plus de sa capacité à discriminer les individus, pouvoir s'intégrer dans les processus de tracabilité classiquement utilisés par les industriels des différentes filières. C'est pourquoi le choix s'est porté, dans sa réalisation préférée, sur un format de données susceptible d'être intégré dans un code à barre standard.  In order to guarantee its industrial relevance, this identifier must, in addition to its ability to discriminate against individuals, be able to integrate into the traceability processes conventionally used by the industrialists of the different sectors. Therefore, in its preferred embodiment, the choice has been made on a data format that can be integrated into a standard bar code.

La présente technique porte donc à la fois sur des techniques de mise en évidence des caractéristiques génétiques d'un individu, notamment chez les bovins mais pas uniquement, et sur les techniques de codification de ces informations permettant leur transmission, et leur portabilité optimale.  The present technique therefore relates both to techniques for demonstrating the genetic characteristics of an individual, particularly in cattle, but not only, and to the coding techniques of this information for their transmission and their optimal portability.

La présente invention concerne donc un procédé de préparation d'un moyen d'identification spécifique ou identifiant d'un échantillon biologique, caractérisé en ce qu'il comprend les étapes suivantes de: prélèvement de l'échantillon biologique à identifier, - isolation de l'ADN dudit échantillon, - amplification et analyse des fragments microsatellites de l'ADN isolé et/ou des polymorphismes ponctuels, codification des longueurs de fragments microsatellites obtenues et/ou des séquences des combinaisons de polymorphismes ponctuels selon un algorithme approprié pour l'obtention du moyen d'identification spécifique à la composition génétique dudit échantillon.  The present invention therefore relates to a method for preparing a specific identification means or identification of a biological sample, characterized in that it comprises the following steps of: sampling of the biological sample to be identified, - isolation of the DNA of said sample, amplification and analysis of the microsatellite fragments of the isolated DNA and / or point polymorphisms, codification of the lengths of microsatellite fragments obtained and / or sequences of the combinations of point polymorphisms according to an appropriate algorithm for obtaining the means of identification specific to the genetic composition of said sample.

Le moyen d'identification est spécifique en ce sens qu'il est directement lié à l'ADN de l'échantillon, lequel contient des informations qui sont propre à l'individu et qui lui sont intrinsèquement attachées, répondant aux exigences de discrimination et de quasi inaltérabilité.  The means of identification is specific in that it is directly related to the DNA of the sample, which contains information that is specific to the individual and intrinsically attached to it, meeting the requirements of discrimination and discrimination. almost unalterable.

L'amplification de l'ADN isolé est de préférence effectuée par PCR, selon les méthodes usuelles de la technique. L'analyse des fragments microsatellites et/ou des séquences de combinaisons de polymorphismes ponctuelles sont réalisées selon les techniques usuelles, notamment au moyen de kits disponibles dans le commerce.  The amplification of the isolated DNA is preferably carried out by PCR, according to the usual methods of the art. The analysis of microsatellite fragments and / or sequences of combinations of point polymorphisms are carried out according to the usual techniques, in particular by means of kits available commercially.

L'algorithme de codification est choisi parmi un algorithme de contrôle d'intégrité des données de type checksum , comme l'algorithme modulo 90, un algorithme de compression de données comme un algorithme de codage algoritmétique ou par exemple l'algorithme LZW.  The coding algorithm is chosen from a checksum type data integrity algorithm, such as the modulo 90 algorithm, a data compression algorithm such as an algorithm for algoritmetic coding or for example the LZW algorithm.

Des techniques pour représenter de manière condensée une liste de nombres entiers sont utilisées notamment dans les télécommunications de longue date, comme p.e. le calcul des checksums et CRCs (cyclic redundancy checks). Une liste d'entiers, dont les valeurs sont codées sur un nombre fixe M d'octets est ainsi représenté par un seul nombre, calculé sur la totalité de la liste et codé sur M octets. Pour assurer le contrôle du respect de l'intégrité d'un message durant sa transmission, l'émetteur calcule ce checksum et transmets la liste de valeurs plus son checksum à un récepteur. Le récepteur de son coté, dispose du même procédé de calcul du checksum et l'applique sur la liste de valeurs reçues. Si jamais durant la transmission, ne serait-ce qu'une seule des valeurs de la liste a été altéré, les checksums récepteur et émetteur seront différents, ce qui atteste de la modification du message durant sa transmission permet au récepteur d'en re-solliciter la retransmission.  Techniques for condensed representation of a list of integers are used in particular in long-standing telecommunications, such as the calculation of checksums and CRCs (cyclic redundancy checks). A list of integers whose values are encoded on a fixed number M bytes is thus represented by a single number, calculated over the entire list and coded on M bytes. To ensure that the integrity of a message is monitored during transmission, the sender calculates this checksum and transmits the list of values plus its checksum to a receiver. The receiver on its side, has the same method of calculating the checksum and applies it on the list of received values. If during the transmission, even if only one of the values of the list has been altered, the receiver and transmitter checksums will be different, which shows that the modification of the message during its transmission allows the receiver to retrieve it. solicit retransmission.

Il est à noter que la réduction d'une liste de valeurs à une seule valeur checksum constitue une compression de données avec forte perte d'information et une intolérance aux erreurs. Ainsi, deux émetteurs générant le même message utilisant un procédé pas complètement hermétique aux erreurs, génèreraient deux messages totalement différents si seul le checksum est comparé.  It should be noted that the reduction of a list of values to a single value checksum constitutes a data compression with great loss of information and an intolerance to errors. Thus, two transmitters generating the same message using a method not completely hermetic to errors, would generate two totally different messages if only the checksum is compared.

Dans l'invention, la perte et l'intolérance du système de codage sont diminuées en scindant la liste en plusieurs sous listes ou composants et en représentant chaque composant par une valeur checksum, au prix d'une compression de données moins importante.  In the invention, the loss and intolerance of the encoding system is decreased by splitting the list into sub-lists or components and representing each component by a checksum value, at the cost of less data compression.

Toujours dans l'invention, l'application du procédé checksum tel qu'utilisé dans les télécommunications consiste à comparer deux messages générés pour savoir s'ils peuvent avoir une même signification. On ne dispose pas des deux messages d'origine, seulement de deux suites de codes checksum, véhiculés p.e. par les digits d'un code barre.  Still in the invention, the application of the checksum method as used in telecommunications consists of comparing two messages generated to know if they can have the same meaning. The two original messages are not available, only two series of checksum codes, conveyed by the digits of a bar code.

Une modification importante du procédé checksum tel qu'utilisé dans les télécommunications, réside dans la non émission d'un composant, ce qui est effectué par l'émission d'un checksum avec un code réservé. Ce procédé est applicable si le processus générant les composants individuels du message est capable de mesurer le taux de confiance qu'on peut attribuer à chaque composant. Dans certains cas, ce taux peut être jugé insuffisant, ce qui équivaut à constater un échec partiel du processus de génération du message. Ainsi, plutôt que d'émettre une fausse information on émet une non information, dans le souci de pouvoir comparer le message avec un autre message généré ultérieurement, à travers des checksums.  An important modification of the checksum method as used in telecommunications, lies in the non-emission of a component, which is done by issuing a checksum with a reserved code. This method is applicable if the process generating the individual components of the message is able to measure the confidence rate that can be assigned to each component. In some cases, this rate may be considered insufficient, which is equivalent to noting a partial failure of the message generation process. Thus, rather than issuing false information, a non-information is emitted, in order to be able to compare the message with another message generated later, through checksums.

Une autre modification consiste à exploiter le fait que seul un nombre limité mais pas a priori connu de valeurs peuvent exister pour chaque composant du message. Un checksum est à la base un calcul reproductible et en général non-reversible. Un retour en arrière est rendu possible par le choix d'un mode de calcul simple et réversible du calcul checksum. Un calcul satisfaisant ces critères est par exemple un calcul modulo 99 qui retient le restant en tant que checksum. On ne sait pas ce qui a rendu le checksum 90, mais si on sait que 140 fait partie du composant et que la plage des valeurs possible va de 120 à 160, alors par extrapolation on sait que le composant était à deux valeurs et que 148 était la deuxième valeur du composant (140 + 148 % 99 = 90). D'autres calculs satisfaisant ces critères relèves du domaine de la compression de données plus que du contrôle d'intégrité de données. Les méthodes basés sur les dictionnaires comme le LZW [Unisys U.S. LZW Patent No. 4,558,302] et les méthodes statistiques basés sur les connaissances a priori comme le codage arithmétique [Witten, I.H., Neal, R.M., and Cleary, J.G. 1987, Communications of the ACM, vol. 30, pp. 520 40.] peuvent réaliser une compression suffisante des résultats d'analyse microsatellites pour qu'une représentation sous forme de code barre devienne possible. Un algorithme de compression sans perte représente un calcul de checksum 100% réversible.  Another modification consists in exploiting the fact that only a limited but not a priori known number of values can exist for each component of the message. A checksum is basically a reproducible and generally non-reversible calculation. Backtracking is made possible by the choice of a simple and reversible calculation mode of the checksum calculation. A calculation satisfying these criteria is for example a modulo calculus 99 which retains the remainder as a checksum. We do not know what made the checksum 90, but if we know that 140 is part of the component and that the range of possible values goes from 120 to 160, then by extrapolation we know that the component was at two values and that 148 was the second value of the component (140 + 148% 99 = 90). Other calculations satisfying these criteria are in the field of data compression rather than data integrity checking. Dictionary-based methods such as LZW [Unisys US LZW Patent No. 4,558,302] and statistical methods based on a priori knowledge such as arithmetic coding [Witten, IH, Neal, RM, and Cleary, JG 1987, Communications of the ACM, vol. 30, pp. 520 40.] can sufficiently compress the microsatellite analysis results for a bar code representation to become possible. A lossless compression algorithm represents a 100% reversible checksum calculation.

Le moyen d'identification spécifique ou identifiant - est avantageusement une chaîne alphanumérique de moins de 100 éléments (chiffres ou lettres), préférentiellement de moins de 30 éléments.  The specific identification means or identifier - is advantageously an alphanumeric string of less than 100 elements (numbers or letters), preferably less than 30 elements.

Le moyen d'identification spécifique est une chaîne numérique de moins de 30 20 chiffres, représentée sous forme de code barre.  The specific identification means is a numeric string of less than 30 digits, represented as a barcode.

L'usage du code barre comme moyen d'identification spécifique permet un usage de ces données à un niveau industriel.  The use of the barcode as a means of specific identification allows a use of these data at an industrial level.

L'échantillon biologique est prélevé sur un organisme vivant, de préférence un animal, plus préférentiellement un animal d'élevage, en particulier bovin.  The biological sample is taken from a living organism, preferably an animal, more preferably a farmed animal, in particular a bovine animal.

Enfin, le procédé selon l'invention comprend également une étape selon laquelle le moyen d'identification spécifique est comparé dans une banque de données comprenant des moyens d'identifications spécifiques préalablement rassemblés ou encore comparé à celui d'un autre échantillon biologique correspondant à un autre individu ou au même individu généré préalablement ou simultanément.  Finally, the method according to the invention also comprises a step according to which the specific identification means is compared in a database comprising means of specific identifications previously collected or compared with that of another biological sample corresponding to a other individual or to the same individual previously generated or simultaneously.

Le résultat d'une analyse portant sur l'amplification par PCR d'un microsatellite se présente comme une liste à une ou deux entrées de nombres entiers, représentant les tailles des fragments amplifiés. Les résultats d'un panel de N microsatellites se présente par conséquent comme une liste à N entrées de liste de tailles à une ou deux entrées.  The result of a PCR amplification assay of a microsatellite is a one- or two-integer list, representing the sizes of the amplified fragments. The results of a panel of N microsatellites therefore appear as a list of N entries in one or two entry size list.

Le processus d'amplification et d'analyse des microsatellite selon kit Applied Biosystem "StockMarks Animal Genotyping System" est représenté sur la figure 1.  The process of amplification and analysis of microsatellite Applied Biosystem Kit kit "StockMarks Animal Genotyping System" is shown in Figure 1.

Le résultat d'analyse des microsatellites selon kit Applied Biosystem "StockMarks Animal Genotyping System" et logiciel Genscan & Genmapper est représenté sur la figure 2.  The microsatellite analysis result according to Applied Biosystem kit "StockMarks Animal Genotyping System" and Genscan & Genmapper software is represented in FIG. 2.

La liste de microsatellites bovins selon kit Applied Biosystem "StockMarks Animal Genotyping System" est donnée sur la figure 3.  The list of bovine microsatellites according to Applied Biosystem kit "StockMarks Animal Genotyping System" is given in Figure 3.

En pratique, les entrées des listes de taille sont souvent des nombres à valeurs type', mais ceux-ci ne sont pas connus d'une manière exhaustive, ce qui limite les possibilités de représentation de l'information par les systèmes informatiques.  In practice, the entries of the size lists are often 'standard' numbers, but these are not known in an exhaustive manner, which limits the possibilities of representation of the information by the computer systems.

Deux individus appartenant à une même espèce possèdent pour un microsatellite donné souvent les mêmes tailles, en revanche, si on utilise un panel de microsatellites multiples, p.e. N = 10, la probabilité que deux individus, même appartenants à une même espèce voire race, possèdent les mêmes tailles pour tous les microsatellites, tend vers zéro. Ce principe est utilisé dans le cadre de la police scientifique pour comparer l'ADN de deux individus humains.  Two individuals belonging to the same species possess for a given microsatellite often the same sizes, on the other hand, if we use a panel of multiple microsatellites, pe N = 10, the probability that two individuals, even belonging to the same species or even race, possess the same sizes for all microsatellites, tends to zero. This principle is used as part of the forensic science to compare the DNA of two human individuals.

Lorsque le champs d'application de l'analyse microsatellite a été élargie à l'analyse des espèces, on s'est rendu compte que des espèces parfois éloignés pouvaient dans certain cas marginaux produire des résultats proche. Un complément à l'analyse microsatellite peut être constitué par une analyse des polymorphismes ponctuels codants (coding SNPs ou cSNPs). Contrairement aux microsatellites, ceux-ci sont liés aux fonctions biologiques et par conséquent reflètent certaines caractéristiques d'une espèce et d'un individu. Comme pour le microsatellite, le résultat d'une analyse SNP n'est pas une valeur simple mais une liste, dont le nombre d'entrées dépend de la région génomique amplifié et l'espèce. Les entrées dans la liste SNP sont des couples (position, base) et comme pour les microsatellites, chaque SNP peut avoir une ou deux valeurs simultanées, quand il s'agit d'une analyse d'un organisme diploïde, ayant deux copies de chaque chromosome dans chaque cellule.  When the scope of the microsatellite analysis was extended to species analysis, it was realized that sometimes distant species could in some cases marginal produce close results. An addition to the microsatellite analysis can be constituted by an analysis of the coding point polymorphisms (coding SNPs or cSNPs). Unlike microsatellites, these are related to biological functions and therefore reflect certain characteristics of a species and an individual. As for the microsatellite, the result of an SNP analysis is not a simple value but a list, whose number of inputs depends on the amplified genomic region and the species. The entries in the SNP list are pairs (position, base) and as for microsatellites, each SNP can have one or two simultaneous values, when it is an analysis of a diploid organism, having two copies of each chromosome in each cell.

Une telle méthode combinée microsatellite / SNP peut donc être performante sur le plan de l'identification individuelle mais l'identifiant généré est complexe et difficile à représenter et par conséquent difficile à traiter par un système informatique. Une façon simple de représenter ou coder de tels résultats est de les transformer en un identifiant représentable sous forme d'un code barre ou code matrice 2D.  Such a combined microsatellite / SNP method can therefore be effective in terms of individual identification but the generated identifier is complex and difficult to represent and therefore difficult to process by a computer system. A simple way to represent or encode such results is to transform them into a representable identifier in the form of a 2D bar code or matrix code.

Dans sa réalisation préférée appliquée à la tracabilité individuelle bovine, l'invention représente chaque fragment microsatellite par une seule valeur checksum entre 0 et 99. Ainsi, l'application d'un panel de 11 microsatellites connus et disponibles commercialement en kit pour les bovins TGLA227 FAM Blue 64 115 BM2113 FAM Blue 116 146 TGLA53 FAM Blue 147 197 ETH10 FAM Blue 198 234 SPS 115 FAM Blue 235 265 TGLAl26 JOE Green 104 131 TGLAl22 JOE Green 134 193 INRA23 JOE Green 193 235 ETH3 NED Yellow 90 135 ETH225 NED Yellow 135 165 BM1824 NED Yellow 170 218 génère 11 valeurs numériques, correspondant avec la codification CRC modulo 99' des longueurs mesurées des fragments microsatellites. En cas de pics trop faibles obtenus pour une microsatellite, le CRC affiche le code réservé 99 signifiant le blanc. Cette partie de l'identifiant est évolutive et rétro compatible; au fur et à mesure que le panel est élargie (N+l, N+2, .  In its preferred embodiment applied to individual bovine traceability, the invention represents each microsatellite fragment with a single checksum value between 0 and 99. Thus, the application of a panel of 11 microsatellites known and commercially available as a kit for cattle TGLA227 FAM Blue 64 115 BM2113 FAM Blue 116 146 TGLA53 FAM Blue 147 197 ETH10 FAM Blue 198 234 SPS 115 FAM Blue 235 265 TGLAl26 JOE Green 104 131 TGLAl22 JOE Green 134 193 INRA23 JOE Green 193 235 ETH3 NED Yellow 90 135 ETH225 NED Yellow 135 165 BM1824 NED Yellow 170 218 generates 11 numerical values, corresponding with the modulo 99 'CRC coding of the measured lengths of the microsatellite fragments. In case of too low peaks obtained for a microsatellite, the CRC displays the reserved code 99 meaning blank. This part of the identifier is scalable and retro compatible; as the panel is expanded (N + 1, N + 2,.

) l'identifiant devient plus long mais il reste possible de comparer des valeurs générées dans le passé avec des panels plus restreints...DTD: Pour l'espèce bovines ou pour d'autres espèces (ovin, porcin, cétacé, humain...), d'autres combinaisons de microsatellites pourront être sélectionnés, dès lors qu'elles répondent aux exigences de discrimination inter-individu posées par le procédé.  ) the identifier becomes longer but it remains possible to compare values generated in the past with smaller panels ... DTD: For the bovine species or for other species (ovine, porcine, cetacean, human .. .), other combinations of microsatellites can be selected, as long as they meet the requirements of inter-individual discrimination posed by the process.

Toujours à titre de réalisation préférée appliquée à la tracabilité individuelle bovine, l'invention consacre ensuite un certain nombre de valeurs à l'analyse SNP du deuxième exon du gène bovin BoLA-DRB3. Cet exon est amplifié par des amorces internes comme un fragment de 237 paires de bases, possédant 66 positions variables connues à ce jour, produisant 106 variations génétiques (allèles) connues à ce jour. Les bovins étant diploïdes, une analyse SNP par PCR et séquençage direct produira pour chaque position variable connue soit une des quatre bases A (Adenine), C (Cytosine), G (Guanosine), T (Thymidine), soit une des six combinaison de deux bases différentes, notés communément par les codes issues du standard IUPAC comme R (A+G, puRine), Y(C+T, pYrimidine), K (G+ T, Keto), M (A+C, aMino), S (G+C, Strong bond) et W(A+T, Weak bond). Une analyse SNP ainsi effectué produira une par mis dix valeurs possibles pour chaque position variable, soit à ce jour théoriquement 1 *E20 combinaisons, portant sur 66 positions.  Still as a preferred embodiment applied to the individual bovine traceability, the invention then dedicates a certain number of values to the SNP analysis of the second exon of the bovine BoLA-DRB3 gene. This exon is amplified by internal primers as a fragment of 237 base pairs, having 66 variable positions known to date, producing 106 genetic variations (alleles) known to date. With cattle being diploid, SNP PCR and direct sequencing analysis will produce for each known variable position one of the four bases A (Adenine), C (Cytosine), G (Guanosine), T (Thymidine), or one of six combinations of two different bases, commonly noted by codes from the IUPAC standard such as R (A + G, puRine), Y (C + T, pYrimidine), K (G + T, Keto), M (A + C, aMino), S (G + C, Strong bond) and W (A + T, Weak bond). An SNP analysis thus performed will produce one by ten possible values for each variable position, so far theoretically 1 * E20 combinations, covering 66 positions.

Dans la pratique, le nombre de combinaisons est limité par le nombre d'allèles connus. Sachant qu'un individu peut avoir jusqu'à deux allèles, le nombre de combinaisons est en pratique bien en dessous de 1 *E4 combinaisons. L'analyse SNP est représentée par deux valeurs numériques entre 0 et 99 représentant directement l'index de l'entrée dans le dictionnaire des combinaisons connues. Cette représentation possède comme la partie microsatellite une certaine tolérance à l'erreur, dans la mesure où nous sommes capable de calculer une distance pour chaque paire d'entrées dans le dictionnaire. Comme la partie microsatellite, la partie SNP de l'identifiant est rétro-compatible, le dictionnaire sera enrichi au fur et à mesure de l'avancée des connaissances dans le domaine.  In practice, the number of combinations is limited by the number of known alleles. Knowing that an individual can have up to two alleles, the number of combinations is in practice well below 1 * E4 combinations. The SNP analysis is represented by two numerical values between 0 and 99 directly representing the index of the entry in the dictionary of known combinations. This representation has a certain tolerance for error as the microsatellite part, since we are able to calculate a distance for each pair of entries in the dictionary. Like the microsatellite part, the SNP portion of the identifier is backward compatible, the dictionary will be enriched as the knowledge progresses in the field.

Des développements en cours permettront sans doute, à terme, par une combinatoire de marqueurs (SNPs, microsatellites...) dispersés dans le génome de l'individu de déterminer l'appartenance à une race, notamment dans le cas des bovins. Selon la méthode décrite ci-dessus, la création d'un dictionnaire de SNPs discriminants des races entre elles, pourra être utilisé pour générer un nouveau constituant de l'identifiant représentatif de cette caractéristique et également rétro-compatible.  Ongoing developments will undoubtedly eventually lead to a combination of markers (SNPs, microsatellites ...) scattered throughout the genome of the individual to determine race membership, particularly in the case of cattle. According to the method described above, the creation of a dictionary of SNPs that discriminate between races can be used to generate a new constituent of the identifier representative of this characteristic and also retro-compatible.

A titre de réalisation préférée, l'identifiant de 13 valeurs numériques (digits) entre 0 et 99 est représenté par une code barre Code 128 C' selon la norme EAN 128, permettant un codage de jusqu'à 30 digits entre 0 et 99, dans sa variante '90 usage interne ou accord bilatéral'. En complément, un test du sexe de l'animal est effectué et son résultat est représenté comme le 14'é11e digit du code barre.  As a preferred embodiment, the identifier of 13 numerical values (digits) between 0 and 99 is represented by a code bar code 128 C 'according to the EAN 128 standard, allowing coding of up to 30 digits between 0 and 99, in its variant '90 internal use or bilateral agreement '. In addition, a test of the sex of the animal is performed and its result is represented as the 14th digit of the bar code.

Un test d'identification par PCR d'un fragment spécifique à l'espèce analyse, peut permettre d'ajouter une information relative à l'espèce. A nouveau la codification sera préférentiellement faite par le recours à un dictionnaire des différentes espèces référencés.  A PCR identification test of a specific species-specific fragment may allow the addition of species-specific information. Again codification will preferably be done by the use of a dictionary of different species referenced.

Un exemple de code barre obtenu par le procédé selon l'invention est représenté sur la figure 4.  An example of a barcode obtained by the method according to the invention is shown in FIG. 4.

Dans le cadre de la traçabilité individuelle, deux codes barres sont comparés, reflétant les identifiants générés pour deux prélèvements génétiques, typiquement des cellules de tissues (oreille, viande). Comme la plupart des tests basés sur la statistique, cette comparaison établit une identité avec un certain taux de confiance entre deux prélèvements, ici en fonction de l'équivalence entre digits à positions identiques entre les deux codes. Un digit est dit équivalent si sa valeur est identique au digit à la même position dans l'autre code barre ou si un des deux digits affiche la valeur réservée de 99. Le taux de confiance dépend du nombre de digits équivalent et/ou identiques.  In the context of individual traceability, two barcodes are compared, reflecting the identifiers generated for two genetic samples, typically tissue cells (ear, meat). Like most tests based on statistics, this comparison establishes an identity with a certain confidence level between two samples, here according to the equivalence between digits with identical positions between the two codes. A digit is said to be equivalent if its value is identical to the digit at the same position in the other barcode or if one of the two digits displays the reserved value of 99. The confidence rate depends on the number of equivalent and / or identical digits.

Le principe de cette traçabilité individuelle est représenté sur la figure 5.  The principle of this individual traceability is shown in Figure 5.

Disposant d'un code barre identifiant la mère et/ou le père d'un bovin, ainsi que le code barre d'un descendent direct prétendant', cette descendance directe supposée peut être vérifiée moyennant comparaison des codes barres. Il est alors possible de dire si le code barre du prétendant peut être un code barre d'un descendant directe, avec une bonne confiance si l'on dispose simplement du code barre du père ou de la mère, avec une très bonne confiance si l'on dispose des deux. La réversibilité partielle du calcul de checksum et le calcul de distance entre entrées du dictionnaire SNP permettent ainsi d'explorer la transmission génétique entre parent et enfant. Il est même théoriquement possible d'effectuer un calcul exhaustif de tous les codes barres que peut avoir la descendance directe d'un père et d'une mère donnée.  Having a bar code identifying the mother and / or the father of a cattle, as well as the bar code of a direct descendant claiming, this supposed direct descendance can be verified by comparison of the bar codes. It is then possible to say whether the bar code of the suitor can be a barcode of a direct descendant, with a good confidence if one simply has the bar code of the father or the mother, with a very good confidence if the we have both. The partial reversibility of the checksum computation and the calculation of the distance between entries of the SNP dictionary make it possible to explore the genetic transmission between parent and child. It is even theoretically possible to make an exhaustive calculation of all the barcodes that the direct descendants of a given father and mother can have.

Claims (10)

Revendicationsclaims 1. Procédé de préparation d'un moyen d'identification spécifique d'un échantillon biologique, caractérisé en ce qu'il comprend les étapes suivantes de: - prélèvement de l'échantillon biologique à identifier, isolation de l'ADN dudit échantillon, - amplification et analyse des fragments microsatellites de l'ADN isolé et/ou des polymorphismes ponctuels, - codification des longueurs de fragments microsatellites obtenues et/ou des séquences des combinaisons de polymorphismes ponctuels selon un algorithme approprié pour l'obtention du moyen d'identification spécifique à la composition génétique dudit échantillon.  A method for preparing a specific identification means for a biological sample, characterized in that it comprises the following steps of: sampling of the biological sample to be identified, isolation of the DNA from said sample, amplification and analysis of microsatellite fragments of the isolated DNA and / or point polymorphisms, coding of the lengths of microsatellite fragments obtained and / or sequences of the combinations of point polymorphisms according to an appropriate algorithm for obtaining the specific identification means to the genetic composition of said sample. 2. Procédé selon la revendication 1, caractérisé en ce que l'amplification de l'ADN isolé est effectuée par PCR.  2. Method according to claim 1, characterized in that the amplification of the isolated DNA is carried out by PCR. 3. Procédé selon l'une des revendications 1 ou 2, caractérisé en ce que l'algorithme _de codification est choisi parmi un algorithme de contrôle d'intégrité des données de type checksum , ou un algorithme de compression de données.  3. Method according to one of Claims 1 or 2, characterized in that the coding algorithm is chosen from a checksum integrity algorithm, or a data compression algorithm. 4. Procédé selon la revendication 3, caractérisé en ce que l'algorithme contrôle d'intégrité des données est l'algorithme modulo 90.  4. Method according to claim 3, characterized in that the data integrity control algorithm is the modulo 90 algorithm. 5. Procédé selon la revendication 3, caractérisé en ce que l'algorithme de compression de données est un algorithme de codage algorithmique.  5. Method according to claim 3, characterized in that the data compression algorithm is an algorithmic coding algorithm. 6. Procédé selon l'une des revendications 1 à 5, caractérisé en ce que le moyen d'identification spécifique est une chaîne alphanumérique de moins de 100 éléments (chiffres ou lettres), préférentiellement de moins de 30 éléments.  6. Method according to one of claims 1 to 5, characterized in that the specific identification means is an alphanumeric string of less than 100 elements (numbers or letters), preferably less than 30 elements. 7. Procédé selon la revendication 6, caractérisé en ce que le moyen d'identification spécifique est une chaîne numérique de moins de 30 chiffres, représentée sous forme de code-barre.  7. Method according to claim 6, characterized in that the specific identification means is a numeric string of less than 30 digits, represented in the form of a barcode. 8. Procédé selon l'une des revendications 1 à 7, caractérisé en ce que l'échantillon biologique est prélevé sur un organisme vivant, de préférence un animal, plus 30 préférentiellement un animal d'élevage, en particulier bovin.  8. Method according to one of claims 1 to 7, characterized in that the biological sample is taken from a living organism, preferably an animal, more preferably a farm animal, in particular bovine. 9. Procédé selon l'une des revendications 1 à 8, caractérisé en ce que le moyen d'identification spécifique est comparé dans une banque de données comprenant des moyens d'identifications spécifiques préalablement rassemblés.  9. Method according to one of claims 1 to 8, characterized in that the specific identification means is compared in a database comprising means of specific identifications previously collected. 10. Procédé selon l'une des revendications 1 à 8, caractérisé en ce que le moyen d'identification spécifique d'un échantillon correspondant à un individu est comparé à celui d'un autre échantillon correspondant à un autre individu ou à un même individu, lequel est généré préalablement ou simultanément.  10. Method according to one of claims 1 to 8, characterized in that the means of specific identification of a sample corresponding to an individual is compared with that of another sample corresponding to another individual or to the same individual. which is generated before or simultaneously.
FR0410965A 2004-10-15 2004-10-15 PROCESS FOR PREPARING A BIOLOGICAL IDENTIFIER Withdrawn FR2876704A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
FR0410965A FR2876704A1 (en) 2004-10-15 2004-10-15 PROCESS FOR PREPARING A BIOLOGICAL IDENTIFIER
PCT/EP2005/055312 WO2006040356A1 (en) 2004-10-15 2005-10-17 Method for the preparation of a biological identifier

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0410965A FR2876704A1 (en) 2004-10-15 2004-10-15 PROCESS FOR PREPARING A BIOLOGICAL IDENTIFIER

Publications (1)

Publication Number Publication Date
FR2876704A1 true FR2876704A1 (en) 2006-04-21

Family

ID=34949740

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0410965A Withdrawn FR2876704A1 (en) 2004-10-15 2004-10-15 PROCESS FOR PREPARING A BIOLOGICAL IDENTIFIER

Country Status (2)

Country Link
FR (1) FR2876704A1 (en)
WO (1) WO2006040356A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1310917A2 (en) * 2001-09-28 2003-05-14 Siemens Dematic AG Method of providing mail piece franking
US20040157220A1 (en) * 2003-02-10 2004-08-12 Purnima Kurnool Methods and apparatus for sample tracking

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1310917A2 (en) * 2001-09-28 2003-05-14 Siemens Dematic AG Method of providing mail piece franking
US20040157220A1 (en) * 2003-02-10 2004-08-12 Purnima Kurnool Methods and apparatus for sample tracking

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CANGELOSI G A ET AL.: "Evaluation of a high-throughput repetitive-sequence-based PCR system for DNA fingerprinting of Mycobacterium tuberculosis and Mycobacterium avium complex strains", JOURNAL OF CLINICAL MICROBIOLOGY, vol. 42, no. 6, June 2004 (2004-06-01), pages 2685 - 2693, XP002337313 *
WITTEN I H ET AL: "ARITHMETIC CODING FOR DATA COMPRESSION", COMMUNICATIONS OF THE ASSOCIATION FOR COMPUTING MACHINERY, ASSOCIATION FOR COMPUTING MACHINERY. NEW YORK, US, vol. 30, no. 6, 1 June 1987 (1987-06-01), pages 520 - 540, XP000615171, ISSN: 0001-0782 *
XU HONGXIA ET AL: "Multiplexed SNP genotyping using the Qbead system: a quantum dot-encoded microsphere-based assay", NUCLEIC ACIDS RESEARCH, OXFORD UNIVERSITY PRESS, SURREY, GB, vol. 31, no. 8, 15 April 2003 (2003-04-15), pages e43, XP002308425, ISSN: 0305-1048 *

Also Published As

Publication number Publication date
WO2006040356A1 (en) 2006-04-20

Similar Documents

Publication Publication Date Title
Soubrier et al. Early cave art and ancient DNA record the origin of European bison
Bessey et al. Maximizing fish detection with eDNA metabarcoding
Shen et al. Large-scale phylogenomic analysis resolves a backbone phylogeny in ferns
Dallman et al. Whole-genome sequencing for national surveillance of Shiga toxin–producing Escherichia coli O157
CN108350494B (en) Systems and methods for genomic analysis
Shokralla et al. Next‐generation DNA barcoding: using next‐generation sequencing to enhance and accelerate DNA barcode capture from single specimens
Lanzén et al. Exploring the composition and diversity of microbial communities at the Jan Mayen hydrothermal vent field using RNA and DNA
Giongo et al. PANGEA: pipeline for analysis of next generation amplicons
Eaton et al. Barcoding bushmeat: molecular identification of Central African and South American harvested vertebrates
Gurfield et al. Endosymbiont interference and microbial diversity of the Pacific coast tick, Dermacentor occidentalis, in San Diego County, California
Kingston et al. Genetic differentiation among recently diverged delphinid taxa determined using AFLP markers
Fruciano et al. Genetic linkage of distinct adaptive traits in sympatrically speciating crater lake cichlid fish
Gowen et al. Speciation in Western Scrub-Jays, Haldane’s rule, and genetic clines in secondary contact
US20100049445A1 (en) Method and apparatus for sequencing data samples
D’Elía et al. Molecular systematics of South American marsh rats of the genus Holochilus (Muroidea, Cricetidae, Sigmodontinae)
Ereskovsky et al. Transcriptome sequencing and delimitation of sympatric Oscarella species (O. carmela and O. pearsei sp. nov) from California, USA
Moura et al. Hundreds of genetic barcodes of the species-rich hydroid superfamily Plumularioidea (Cnidaria, Medusozoa) provide a guide toward more reliable taxonomy
Baker et al. Phylogenomic analysis of velvet worms (Onychophora) uncovers an evolutionary radiation in the Neotropics
Timmers et al. Sponging up diversity: Evaluating metabarcoding performance for a taxonomically challenging phylum within a complex cryptobenthic community
Manzanilla et al. Using target capture to address conservation challenges: Population‐level tracking of a globally‐traded herbal medicine
Ratcliffe et al. Quantitative assessment of fish larvae community composition in spawning areas using metabarcoding of bulk samples
Shepherd et al. Hybridisation in kiwi (Apteryx; Apterygidae) requires taxonomic revision for the Great Spotted Kiwi
Ruane et al. The cat-eyed snakes of Madagascar: phylogeny and description of a new species of Madagascarophis (Serpentes: Lamprophiidae) from the Tsingy of Ankarana
Caballero et al. Mitochondrial genetic diversity, population structure and detection of Antillean and Amazonian manatees in Colombia: new areas and new techniques
Deng et al. The impact of sequencing depth and relatedness of the reference genome in population genomic studies: A case study with two caddisfly species (Trichoptera, Rhyacophilidae, Himalopsyche)

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20080630