RU2002109481A - Ways to create databases and databases for the identification of polymorphic genetic markers - Google Patents

Ways to create databases and databases for the identification of polymorphic genetic markers Download PDF

Info

Publication number
RU2002109481A
RU2002109481A RU2002109481/09A RU2002109481A RU2002109481A RU 2002109481 A RU2002109481 A RU 2002109481A RU 2002109481/09 A RU2002109481/09 A RU 2002109481/09A RU 2002109481 A RU2002109481 A RU 2002109481A RU 2002109481 A RU2002109481 A RU 2002109481A
Authority
RU
Russia
Prior art keywords
nucleic acid
data
samples
database
population
Prior art date
Application number
RU2002109481/09A
Other languages
Russian (ru)
Inventor
Андреас БРАУН (US)
Андреас БРАУН
Хьюберт КОСТЕР (US)
Хьюберт КОСТЕР
ДЕН БУМ Дирк ВАН (DE)
ДЕН БУМ Дирк ВАН
Юип ПИНГ (US)
Юип ПИНГ
Чарли РОДИ (US)
Чарли РОДИ
Ли н ХИ (US)
Лиян ХИ
Норман ЧИУ (US)
Норман ЧИУ
Кристиан ЮРИНКЕ (DE)
Кристиан ЮРИНКЕ
Original Assignee
Секвеном, Инк. (Us)
Секвеном, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/663,968 external-priority patent/US7917301B1/en
Application filed by Секвеном, Инк. (Us), Секвеном, Инк. filed Critical Секвеном, Инк. (Us)
Publication of RU2002109481A publication Critical patent/RU2002109481A/en

Links

Claims (100)

1. Подколлекция образцов из исследуемой популяции, содержащая множество образцов, причем образцы отобраны из группы, содержащей кровь, ткани, жидкости тела, клетки, семена, микробы, патогены и образцы репродуктивных тканей; символику на контейнерах, содержащих образцы, причем символика представляет источник и/или историю каждого образца, отличающаяся тем, что исследуемая популяция представляет собой здоровую популяцию, не отобранную по какому-либо болезненному состоянию; коллекция содержит образцы из здоровой популяции; и подколлекция получена сортировкой коллекции по специфическим параметрам.1. A subcollection of samples from the study population, containing many samples, the samples being selected from the group consisting of blood, tissues, body fluids, cells, seeds, microbes, pathogens and samples of reproductive tissues; symbolism on containers containing samples, the symbolism representing the source and / or history of each sample, characterized in that the studied population is a healthy population, not selected for any disease state; the collection contains samples from a healthy population; and the subcollection is obtained by sorting the collection by specific parameters. 2. Подколлекция по п.1, отличающаяся тем, что параметры отбирают из группы, включающей этническое происхождение, возраст, пол, рост, вес, употребление алкоголя, число беременностей, число нормальных родов, вегетарианство, тип физической активности, место проживания и/или длительность проживания в определенном месте, уровень образования, возраст смерти родителей, причина смерти родителей, курение в прошлом и в настоящий момент, стаж как курильщика, частота курения, наличие болезни у близких родственников (родители, братья и сестры, дети), употребление прописанных лекарств и/или причины для этого, длительность и/или число пребываний в больнице и контакты с факторами окружающей среды.2. The subcollection according to claim 1, characterized in that the parameters are selected from the group including ethnic origin, age, gender, height, weight, alcohol consumption, number of pregnancies, number of normal births, vegetarianism, type of physical activity, place of residence and / or length of residence in a particular place, level of education, age of death of parents, cause of death of parents, smoking in the past and present, length of service as a smoker, frequency of smoking, the presence of illness in close relatives (parents, brothers and sisters, children), occupation eblenie prescription drugs and / or the reasons for it, the duration and / or the number of hospital stays and contacts with environmental factors. 3. Подколлекция по п.1, отличающаяся тем, что символика представлена как штрих-код.3. The subcollection according to claim 1, characterized in that the symbolism is presented as a bar code. 4. Способ создания базы данных, включающий: идентификацию здоровых членов популяции, получение данных, включающих идентификационную информацию и получение исторической информации и данных, относящихся к идентифицированным членам популяции и их близким родственникам; ввод данных для каждого члена популяции в базу данных и установление связи между членом популяции и его данными через индексатор.4. A method of creating a database, including: the identification of healthy members of the population, obtaining data including identification information and obtaining historical information and data related to the identified members of the population and their close relatives; entering data for each member of the population into the database and establishing a connection between the member of the population and its data through the indexer. 5. Способ по п.4, отличающийся тем, что дополнительно получают образцы тканей или жидкостей тела; анализируют ткани или жидкости в образце; и вводят результаты анализа для каждого члена популяции в базу данных и устанавливают связь каждого результата с индексатором, характеризующим каждый член.5. The method according to claim 4, characterized in that it further obtains tissue samples or body fluids; analyze tissue or fluid in the sample; and enter the results of the analysis for each member of the population in the database and establish the relationship of each result with an indexer characterizing each member. 6. База данных, созданная согласно способу по п.4.6. The database created according to the method according to claim 4. 7. База данных, созданная согласно способу по п.5.7. The database created according to the method according to claim 5. 8. База данных, содержащая единицы данных, представляющие множество здоровых организмов, от которых получают биологические образцы, отличающаяся тем, что каждая единица данных связана с данными, характеризующими тип организма и с другой идентифицирующей информацией.8. A database containing data units representing many healthy organisms from which biological samples are obtained, characterized in that each data unit is associated with data characterizing the type of organism and with other identifying information. 9. База данных по п.8, отличающаяся тем, что единицы данных являются ответами на вопросы, касающиеся одного или более параметров, отобранных из группы, включающей этническое происхождение, возраст, пол, рост, вес, употребление алкоголя, число беременностей, число нормальных родов, вегетарианство, тип физической активности, место проживания и/или длительность проживания в определенном месте, уровень образования, возраст смерти родителей, причина смерти родителей, курение в прошлом и в настоящий момент, стаж как курильщика, частота курения, наличие болезни у близких родственников (родители, братья и сестры, дети), употребление прописанных лекарств и/или причины для этого, длительность и/или число пребываний в больнице и контакты с факторами окружающей среды.9. The database of claim 8, wherein the data units are answers to questions regarding one or more parameters selected from the group including ethnic origin, age, gender, height, weight, alcohol use, number of pregnancies, number of normal childbirth, vegetarianism, type of physical activity, place of residence and / or duration of residence in a particular place, level of education, age of death of parents, cause of death of parents, smoking in the past and present, length of service as a smoker, smoking frequency, Ichiye disease in close relatives (parents, siblings, children), the use of prescription drugs and / or the reasons for it, the duration and / or the number of hospital stays and contacts with environmental factors. 10. База данных по п.9, отличающаяся тем, что организмы являются животными, а образцы представляют собой жидкости или ткани тела.10. The database according to claim 9, characterized in that the organisms are animals, and the samples are fluids or tissues of the body. 11. База данных по п.9, отличающаяся тем, что образцы отобраны из крови, фракций крови, клеток и клеточных органелл.11. The database according to claim 9, characterized in that the samples are taken from blood, blood fractions, cells and cellular organelles. 12. База данных по п.8, отличающаяся тем, что дополнительно содержит фенотипические данные организма.12. The database according to claim 8, characterized in that it further comprises phenotypic data of the organism. 13. База данных по п.12, отличающаяся тем, что данные включают одну из физических характеристик, данные о происхождении, медицинские данные и исторические данные.13. The database according to item 12, wherein the data includes one of the physical characteristics, data on the origin, medical data and historical data. 14. База данных по п.8, отличающаяся тем, что дополнительно содержит генотипические данные по нуклеиновым кислотам, полученным из организма.14. The database of claim 8, characterized in that it further comprises genotypic data on nucleic acids obtained from the body. 15. База данных по п.14, отличающаяся тем, что генотипические данные включают генетические маркеры, некодирующие области, микросателлиты, полиморфизмы длины рестриктных фрагментов (ПДРФ), вариабельное число тандемных повторов (ВЧТП), исторические данные организма, историю болезни и фенотипическую информацию.15. The database of claim 14, wherein the genotypic data includes genetic markers, non-coding regions, microsatellites, restriction fragment length polymorphisms (RFLPs), variable number of tandem repeats (VChTP), historical body data, medical history and phenotypic information. 16. База данных по п.8, отличающаяся тем, что является реляционной базой данных.16. The database of claim 8, characterized in that it is a relational database. 17. База данных по п.16, отличающаяся тем, что данные соотносят с индексатором точек данных, характеризующим каждый организм, из которого данные получены.17. The database according to clause 16, wherein the data is correlated with an index of data points characterizing each organism from which the data are obtained. 18. Способ идентификации полиморфизмов, являющихся предполагаемыми генетическими маркерами, включающий идентификацию полиморфизма, и идентификацию какого-либо метаболического процесса или гена, связанного с полиморфным локусом, отличающийся тем, что полиморфизмы идентифицируют в образцах из исследуемой популяции, содержащей здоровые субъекты.18. A method for identifying polymorphisms that are putative genetic markers, including the identification of a polymorphism and the identification of a metabolic process or gene associated with a polymorphic locus, characterized in that the polymorphisms are identified in samples from the study population containing healthy subjects. 19. Способ по п.18, отличающийся тем, что полиморфизм идентифицируют путем выявления присутствия нуклеиновых кислот-мишеней в образце методом, включающим стадии: а) гибридизации первого олигонуклеотида с нуклеиновой кислотой-мишенью, б) гибридизации второго олигонуклеотида с прилегающей областью нуклеиновой кислоты-мишени, в) лигирования гибридизованных олигонуклеотидов, и г) определения первого гибрида зеванного олигонуклеотида путем масс-спектрометрии, что указывает на присутствие нуклеиновой кислоты-мишени.19. The method according to p. 18, characterized in that the polymorphism is identified by detecting the presence of target nucleic acids in the sample by a method comprising the steps of: a) hybridizing the first oligonucleotide with the target nucleic acid, b) hybridizing the second oligonucleotide with the adjacent region of the nucleic acid targets, c) ligating hybridized oligonucleotides, and d) determining the first hybrid of the yawned oligonucleotide by mass spectrometry, indicating the presence of a target nucleic acid. 20. Способ по п.18, отличающийся тем, что полиморфизм идентифицируют путем определения нуклеиновой кислоты-мишени в образце методом, включающим стадии: а) гибридизации первого олигонуклеотида с нуклеиновой кислотой мишенью и гибридизации второго олигонуклеотида с примыкающей областью нуклеиновой кислоты-мишени, б) контактирования гибридизованных первого и второго олигонуклеотидов с расщепляющим ферментом с образованием продукта расщепления, и в) определения продукта расщепления путем масс-спектрометрии, что указывает на присутствие нуклеиновой кислоты-мишени.20. The method according to p. 18, characterized in that the polymorphism is identified by determining the target nucleic acid in the sample by the method comprising the steps of: a) hybridizing the first oligonucleotide with the target nucleic acid and hybridizing the second oligonucleotide with the adjacent region of the target nucleic acid, b) contacting the hybridized first and second oligonucleotides with a cleavage enzyme to form a cleavage product, and c) determine the cleavage product by mass spectrometry, indicating the presence of kleinovoy acid target. 21. Способ по п.20, отличающийся тем, что образцы берут от субъектов, включенных в базу данных здоровых индивидуумов.21. The method according to claim 20, characterized in that the samples are taken from subjects included in the database of healthy individuals. 22. Способ по п.18, отличающийся тем, что полиморфизм идентифицируют путем определения нуклеиновых кислот-мишеней в образце посредством удлинения олигонуклеотидного праймера (PROBE).22. The method according to p. 18, characterized in that the polymorphism is identified by determining the nucleic acid target in the sample by extension of the oligonucleotide primer (PROBE). 23. Способ по п.22, отличающийся тем, что удлинение нуклеотидного праймера включает: а) получение молекул нуклеиновой кислоты, содержащих нуклеотид-мишень; б) иммобилизацию (по выбору) молекул нуклеиновой кислоты на твердой подложке для получения иммобилизованных молекул нуклеиновой кислоты; в) гибридизацию молекул нуклеиновой кислоты с олигонуклеотидным праймером, комплементарным молекулам нуклеиновой кислоты в сайте, соседствующим с нуклеотидом-мишенью; г) контактирование продукта, полученного на стадии в) со смесью дидезоксинуклеозидтрифосфата или 3'-дезоксинуклеозидтрифосфатов и полимеразы таким образом, чтобы только дидезоксинуклеозид или 3’-дезоксинуклеозидтрифосфат, комплементарный нуклеотиду-мишени, мог удлинять праймер; и д) определение удлиненного праймера и тем самым идентификация нуклеотида-мишени.23. The method according to item 22, wherein the extension of the nucleotide primer includes: a) obtaining nucleic acid molecules containing a target nucleotide; b) immobilizing (optionally) nucleic acid molecules on a solid support to obtain immobilized nucleic acid molecules; c) the hybridization of nucleic acid molecules with an oligonucleotide primer complementary to the nucleic acid molecules at a site adjacent to the target nucleotide; d) contacting the product obtained in stage c) with a mixture of dideoxynucleoside triphosphate or 3'-deoxynucleoside triphosphates and polymerase so that only dideoxynucleoside or 3'-deoxynucleoside triphosphate complementary to the target nucleotide can extend the primer; and e) determining an elongated primer and thereby identifying a target nucleotide. 24. Способ по п.23, отличающийся тем, что определение удлиненного праймера производят путем масс-спектрометрии, включающей: ионизацию и испарение продукта по стадии д); и определение удлиненного праймера путем масс-спектрометрии и тем самым идентификация нуклеотида-мишени.24. The method according to item 23, wherein the definition of the elongated primer is performed by mass spectrometry, including: ionization and evaporation of the product according to stage d); and determining the extended primer by mass spectrometry and thereby identifying the target nucleotide. 25. Способ по п.24, отличающийся тем, что образцы для масс-спектрометрии представляют собой матрицу на чипах; и каждый образец занимает объем, приблизительно равный диаметру луча, испускаемого лазером в масс-спектрометре, используемом при спектроскопии с матричной лазерной десорбцией/ионизацией из матрикса (MALDI).25. The method according to paragraph 24, wherein the samples for mass spectrometry are a matrix on chips; and each sample occupies a volume approximately equal to the diameter of the beam emitted by the laser in the mass spectrometer used in Matrix Laser Desorption / Ionization Spectroscopy (MALDI). 26. Система, содержащая базу данных, включающую параметры, связанные с точками данных, представляющими субъекты, от которых получены образцы, и индексированную коллекцию образцов, отличающаяся тем, что образцы получены от здоровых субъектов, и индекс идентифицирует субъект, от которого получен образец.26. A system containing a database including parameters associated with data points representing the subjects from which the samples were obtained, and an indexed collection of samples, characterized in that the samples are obtained from healthy subjects, and the index identifies the subject from which the sample was obtained. 27. Система по п.26, отличающаяся тем, что параметр отобран из группы, содержащей этническое происхождение, возраст, пол, рост, вес, употребление алкоголя, число беременностей, число нормальных родов, вегетарианство, тип физической активности, место проживания и/или длительность проживания в определенном месте, уровень образования, возраст смерти родителей, причина смерти родителей, курение в прошлом и в настоящий момент, стаж как курильщика, частота курения, наличие болезни у близких родственников (родители, братья и сестры, дети), употребление прописанных лекарств и/или причины для этого, длительность и/или число пребываний в больнице и контакты с факторами окружающей среды.27. The system according to p. 26, characterized in that the parameter is selected from the group containing ethnic origin, age, gender, height, weight, alcohol consumption, number of pregnancies, number of normal births, vegetarianism, type of physical activity, place of residence and / or length of residence in a particular place, level of education, age of death of parents, cause of death of parents, smoking in the past and present, length of service as a smoker, frequency of smoking, the presence of illness in close relatives (parents, brothers and sisters, children), used ie prescription drugs and / or the reasons for it, the duration and / or the number of hospital stays and contacts with environmental factors. 28. Система по п.26, отличающаяся тем, что база данных дополнительно содержит генотипические данные для каждого субъекта.28. The system of claim 26, wherein the database further comprises genotypic data for each subject. 29. Система по п.26, отличающаяся тем, что образцы представляют собой кровь.29. The system of claim 26, wherein the samples are blood. 30. Среда для хранения данных, содержащая базу данных по п.8.30. An environment for storing data containing a database according to claim 8. 31. Компьютерная система, содержащая базу данных по п.8.31. A computer system containing a database according to claim 8. 32. Система для высокопроизводительной обработки биологических образцов, включающая технологическую линию, содержащую множество постов обработки, каждый из которых предназначен для произведения действий с биологическим образцом, находящимся в реакционном сосуде; робототехническую систему, обеспечивающую транспортировку реакционного сосуда от одного поста на другой; систему анализа данных для восприятия результатов анализов на технологической линии и автоматической обработки результатов анализов с целью определения биологического образца в реакционном сосуде; контрольную систему, определяющую момент завершения анализа на каждом посту для перемещения реакционного сосуда на следующий пост при завершении анализа и непрерывной обработки реакционных сосудов одного за другим до получения контрольной системой стоп-инструкции; и базу данных по п.8, причем образцы, анализируемые автоматизированной технологической линией, содержат образцы от субъектов базы данных.32. A system for high-performance processing of biological samples, including a production line containing many processing stations, each of which is designed to perform actions with a biological sample in a reaction vessel; a robotic system for transporting a reaction vessel from one post to another; a data analysis system for perceiving analysis results on a production line and automatically processing analysis results to determine a biological sample in a reaction vessel; a control system that determines the moment of completion of the analysis at each post for moving the reaction vessel to the next post upon completion of the analysis and continuous processing of the reaction vessels one by one until the control system receives stop instructions; and the database according to claim 8, wherein the samples analyzed by the automated production line contain samples from database subjects. 33. Система по п.32, отличающаяся тем, что один из постов содержит масс-спектрометр.33. The system according to p, characterized in that one of the posts contains a mass spectrometer. 34. Система по п.32, отличающаяся тем, что система анализа данных предназначена для обработки результатов анализа путем получения результатов анализа от масс-спектрометра так, что результаты анализа биологического образца содержат один или более сигналов, по которым система анализа данных определяет площади под кривой каждого сигнала, нормирует результаты и получает по существу количественный результат, представляющий относительные количества компонентов в анализируемом образце.34. The system according to p. 32, characterized in that the data analysis system is designed to process the results of the analysis by obtaining the results of the analysis from the mass spectrometer so that the results of the analysis of the biological sample contain one or more signals by which the data analysis system determines the area under the curve each signal, normalizes the results and obtains essentially a quantitative result representing the relative amounts of components in the analyzed sample. 35. Способ высокопроизводительной обработки биологических образцов, включающий транспортировку реакционного сосуда по системе по п.32, содержащей технологическую линию, имеющую множество постов обработки, на каждом из которых производят действия с одним или более биологическим образцом, находящимся в реакционном сосуде; определение момента завершения анализа на каждом посту и, при завершении анализа, перемещение реакционного сосуда на следующий пост; получение результатов анализа на технологической линии и автоматизированную обработку результатов анализа для получения основанных на результатах анализа заключений, относящихся к биологическим образцам в реакционном сосуде; и непрерывную обработку одного за другим реакционных сосудов до получения стоп-инструкций, причем тестируемые на автоматизированной технологической линии образцы содержат образцы от субъектов базы данных.35. A method of high-performance processing of biological samples, including transporting the reaction vessel according to claim 32, comprising a processing line having a plurality of processing stations, each of which is operated with one or more biological samples located in the reaction vessel; determining the moment of completion of the analysis at each post and, upon completion of the analysis, moving the reaction vessel to the next post; obtaining analysis results on the production line and automated processing of analysis results to obtain conclusions based on the analysis results related to biological samples in the reaction vessel; and continuous processing of one after the other reaction vessels until stop instructions are obtained, the samples being tested on an automated production line containing samples from database subjects. 36. Способ по п.35, отличающийся тем, что один из постов содержит масс-спектрометр.36. The method according to clause 35, wherein one of the posts contains a mass spectrometer. 37. Способ по п.36, отличающийся тем, что образцы анализируют методом, включающим удлинение олигонуклеотидного праймера (PROBE).37. The method according to clause 36, wherein the samples are analyzed by a method including the extension of the oligonucleotide primer (PROBE). 38. Способ по п.37, отличающийся тем, что обрабатывают результаты анализа путем получения данных от масс-спектрометра таким образом, что результаты тестов для биологических образцов содержат один или более сигналов или цифровых значений, представляющих сигналы, по которым система анализа данных определяет площадь под кривой каждого сигнала, нормирует результаты и получает по существу количественный результат, представляющий относительные количества компонентов в анализируемом образце.38. The method according to clause 37, characterized in that they process the results of the analysis by receiving data from the mass spectrometer so that the test results for biological samples contain one or more signals or digital values representing signals by which the data analysis system determines the area beneath the curve of each signal, it normalizes the results and obtains an essentially quantitative result representing the relative amounts of components in the sample being analyzed. 39. Способ по п.37, отличающийся тем, что удлинение праймера включает а) получение молекулы нуклеиновой кислоты, содержащей нуклеотид-мишень; б) при желании иммобилизацию молекулы нуклеиновой кислоты на твердой подложке для получения иммобилизованной молекулы нуклеиновой кислоты; в) гибридизацию молекулы нуклеиновой кислоты с олигонуклеотидным праймером, комплементарным молекуле нуклеиновой кислоты в сайте, примыкающем к нуклеотиду-мишени; г) контактирование продукта по стадии в) со смесью, содержащей дидезоксинуклеозидтрифосфат или 3’-дезоксинуклеозидтрифосфаты и полимеразу таким образом, чтобы только один дидезоксинуклеозид или 3’- дезоксинуклеозидтри фосфат, который комплементарен нуклеотиду-мишени, удлиняет праймер; д) определение удлиненного праймера и тем самым идентификацию нуклеотида-мишени.39. The method according to clause 37, wherein the extension of the primer includes a) obtaining a nucleic acid molecule containing a target nucleotide; b) if desired, the immobilization of a nucleic acid molecule on a solid support to obtain an immobilized nucleic acid molecule; c) hybridization of a nucleic acid molecule with an oligonucleotide primer complementary to the nucleic acid molecule at a site adjacent to the target nucleotide; d) contacting the product according to step c) with a mixture containing dideoxynucleoside triphosphate or 3’-deoxynucleoside triphosphates and polymerase so that only one dideoxynucleoside or 3’ deoxynucleoside tri phosphate that is complementary to the target nucleotide extends the primer; d) determination of the elongated primer and thereby the identification of the target nucleotide. 40. Способ по п.39, отличающийся тем, что определение удлиненного праймера производят путем масс-спектрометрии, при этом способ включает ионизацию и испарение продукта по стадии д) и определение удлиненного праймера путем масс-спектрометрии, посредством чего производят идентификацию нуклеотида-мишени.40. The method according to § 39, wherein the determination of the extended primer is performed by mass spectrometry, the method comprising ionizing and vaporizing the product according to step e) and determining the extended primer by mass spectrometry, whereby the target nucleotide is identified. 41. Способ по п.36, отличающийся тем, что нуклеиновые кислоты-мишени в образце идентифицируют и/или определяют способом, включающим стадии а) гибридизации первого олигонуклеотида с нуклеиновой кислотой-мишенью; 6) гибридизации второго олигонуклеотида с примыкающей областью нуклеиновой кислоты-мишени; в) последующего лигирования гибридизованных олигонуклеотидов; и г) определения гибридизованного первого олигонуклеотида при помощи масс-спектрометрии, указывающей на присутствие нуклеиновой кислоты-мишени.41. The method according to clause 36, wherein the target nucleic acids in the sample are identified and / or determined by a method comprising the steps of a) hybridizing a first oligonucleotide with a target nucleic acid; 6) hybridization of the second oligonucleotide with the adjacent region of the target nucleic acid; c) subsequent ligation of hybridized oligonucleotides; and g) determining the hybridized first oligonucleotide using mass spectrometry indicating the presence of a target nucleic acid. 42. Способ по п.36, отличающийся тем, что нуклеиновые кислоты-мишени в образце идентифицируют и/или определяют способом, включающим стадии а) гибридизации первого олигонуклеотида с нуклеиновой кислотой-мишенью и гибридизации второго олигонуклеотида с примыкающей областью нуклеиновой кислоты-мишени; б) контактирования гибридизованных первого и второго олигонуклеотидов с расщепляющим ферментом с образованием продукта расщепления; и в) определения продукта расщепления при помощи масс-спектрометрии, указывающей на присутствие нуклеиновой кислоты-мишени.42. The method according to clause 36, wherein the target nucleic acids in the sample are identified and / or determined by the method comprising the steps of a) hybridizing the first oligonucleotide with the target nucleic acid and hybridizing the second oligonucleotide with the adjacent region of the target nucleic acid; b) contacting the hybridized first and second oligonucleotides with a cleavage enzyme to form a cleavage product; and c) determining the cleavage product by mass spectrometry indicating the presence of a target nucleic acid. 43. Способ создания базы данных, хранящейся в памяти компьютера, включающий идентификацию здоровых членов популяции; получение идентифицирующей и исторической информации и данных, относящихся к идентифицированным членам популяции; ввод относящихся к членам популяции данных для каждого идентифицированного члена популяции в компьютерную базу данных и установление связи члена популяции и данных через индексатор.43. The method of creating a database stored in computer memory, including the identification of healthy members of the population; obtaining identifying and historical information and data related to identified members of the population; entering population-related data for each identified member of the population into a computer database and linking the member of the population and data through an indexer. 44. Способ по п.43, отличающийся тем, что дополнительно получают образцы тканей или жидкостей тела от идентифицированного члена популяции; анализируют ткани или жидкости тела в образце; и вводят результаты анализа для каждого члена популяции в компьютерную базу данных и устанавливают связи каждого результата с индексатором, представляющим каждый член популяции.44. The method according to item 43, wherein additionally receive samples of tissue or body fluids from an identified member of the population; analyze tissue or body fluids in the sample; and enter the results of the analysis for each member of the population in a computer database and establish the relationship of each result with an indexer representing each member of the population. 45. База данных, созданная способом по п.43.45. The database created by the method according to item 43. 46. База данных, созданная способом по п.44.46. The database created by the method according to item 44. 47. База данных по п.8, отличающаяся тем, что организмы отбирают среди животных, бактерий, грибов, простейших и паразитов и каждый набор данных связывают с параметрами, представляющими тип организма, и идентифицирующей информацией.47. The database according to claim 8, characterized in that the organisms are selected among animals, bacteria, fungi, protozoa and parasites and each data set is associated with parameters representing the type of organism and identifying information. 48. База данных по п.47, отличающаяся тем, что дополнительно содержит фенотипические данные для каждого субъекта.48. The database according to item 47, wherein it further comprises phenotypic data for each subject. 49. База данных по п.47, отличающаяся тем, что представляет собой реляционную базу данных, параметрами которой являются ответы на вопросы анкеты.49. The database according to item 47, characterized in that it is a relational database, the parameters of which are the answers to the questionnaire. 50. База данных по п.8, отличающаяся тем, что дополнительно содержит данные генотипирования нуклеиновых кислот субъекта, причем данные генотипирования включают, но не ограничиваются только ими, генетические маркеры, некодирующие области, микросателлиты, полиморфизмы длины рестриктных фрагментов (ПДРФ), вариабельное число тандемных повторов (ВЧТП), дату рождения, историю болезни субъекта, фенотипическую информацию и другую информацию.50. The database according to claim 8, characterized in that it further comprises genotyping data of the subject's nucleic acids, the genotyping data including, but not limited to, genetic markers, non-coding regions, microsatellites, restriction fragment length polymorphisms (RFLPs), variable number tandem repeats (VChTP), date of birth, subject's medical history, phenotypic information, and other information. 51. База данных, содержащая записи данных, хранящиеся в памяти компьютера, отличающаяся тем, что записи данных содержат информацию, идентифицирующую здоровых членов популяции, и также содержат идентифицирующую и историческую информацию и данные, относящиеся к идентифицированным членам.51. A database containing data records stored in computer memory, characterized in that the data records contain information identifying healthy members of the population, and also contain identifying and historical information and data related to the identified members. 52. База данных по п.51, отличающаяся тем, что дополнительно содержит значение индекса для каждого идентифицированного члена, связывающее каждого члена популяции с идентифицирующей и исторической информацией и данными.52. The database according to paragraph 51, characterized in that it further comprises an index value for each identified member, linking each member of the population with identifying and historical information and data. 53. Компьютерная система, содержащая базу данных по п.51.53. A computer system containing a database according to paragraph 51. 54. Автоматизированная технологическая линия, содержащая базу данных по п.51.54. An automated production line containing a database according to paragraph 51. 55. Способ определения полиморфизма, коррелирующего с возрастом, этнической принадлежностью или полом, включающий идентификацию полиморфизма и определение частоты полиморфизма с увеличением возраста, в зависимости от этнической принадлежности или пола в популяции здоровых индивидуумов.55. A method for determining polymorphism that correlates with age, ethnicity, or gender, comprising identifying polymorphism and determining the frequency of polymorphism with increasing age, depending on ethnicity or gender in a population of healthy individuals. 56. Способ определения возможной корреляции полиморфизма с восприимчивостью к заболеваниям, ранней смертностью, или заболеваемостью и ранней смертностью, включающий идентификацию полиморфизма и определение частоты полиморфизма с увеличением возраста в популяции здоровых индивидуумов.56. A method for determining a possible correlation of polymorphism with susceptibility to diseases, early mortality, or morbidity and early mortality, comprising identifying polymorphism and determining the frequency of polymorphism with increasing age in a population of healthy individuals. 57. Высокопроизводительный способ определения частот генетических вариаций, включающий выбор популяции здоровых индивидуумов для исследования и выбор определяемой генетической вариации; объединение множества образцов биополимеров, полученных от членов популяции, определение или обнаружение биополимера, содержащего вариации, при помощи масс-спектрометрии; получение масс-спектра или его цифрового представления; и определение частоты вариации в популяции.57. A high-performance method for determining the frequencies of genetic variations, which includes selecting a population of healthy individuals for research and selecting a determined genetic variation; combining multiple samples of biopolymers obtained from members of the population, determining or detecting a biopolymer containing variations using mass spectrometry; obtaining a mass spectrum or its digital representation; and determining the frequency of variation in a population. 58. Способ по п.57, отличающийся тем, что вариации выбраны из группы, включающей аллельные вариации, посттрансляционные модификации, модификации нуклеиновых кислот, метки, модификации массы нуклеиновых кислот и метилирование; и/или биополимер представляет собой нуклеиновую кислоту, белок, полисахарид, липид, низкомолекулярный органический метаболит или интермедиат, причем концентрация интересующего биополимера одинакова для каждого из образцов; и/или частоту определяют путем применения метода, включающего определение площади под пиком в масс-спектре или его цифровом представлении, соответствующем массе биополимера, имеющего геномную вариацию.58. The method according to clause 57, wherein the variations are selected from the group comprising allelic variations, post-translational modifications, nucleic acid modifications, labels, nucleic acid mass modifications and methylation; and / or the biopolymer is a nucleic acid, protein, polysaccharide, lipid, low molecular weight organic metabolite or intermediate, wherein the concentration of the biopolymer of interest is the same for each of the samples; and / or the frequency is determined by applying a method that includes determining the area under the peak in the mass spectrum or its digital representation corresponding to the mass of a biopolymer having genomic variation. 59. Способ по п.58, отличающийся тем, что определение частоты производят путем определения отношения сигнала или его цифрового представления к суммарной площади всего масс-спектра после коррекции фона (базовой линии).59. The method according to p, characterized in that the frequency is determined by determining the ratio of the signal or its digital representation to the total area of the entire mass spectrum after correction of the background (baseline). 60. Способ обнаружения полиморфизма в популяции, включающий сортировку базы данных по п.8 по выбранному параметру для идентификации образцов, соответствующих выбранному параметру; выделение биополимера из каждого идентифицированного образца; по желанию объединение выделенных биополимеров; по желанию амплификацию некоторого количества биополимера; расщепление объединенных биополимеров с образованием фрагментов; получение масс-спектра образующихся фрагментов и сравнение масс-спектра с контрольным масс-спектром для идентификации различий между спектрами и, тем самым, идентификации какого-либо полиморфизма; при этом контрольный масс-спектр получают из неотсортированных образцов из коллекции или образцов, отобранных по другому параметру.60. A method for detecting polymorphism in a population, comprising sorting the database according to claim 8 by the selected parameter to identify samples corresponding to the selected parameter; isolation of the biopolymer from each identified sample; optionally combining selected biopolymers; optionally amplifying a certain amount of biopolymer; cleavage of the combined biopolymers with the formation of fragments; obtaining the mass spectrum of the resulting fragments and comparing the mass spectrum with the control mass spectrum to identify the differences between the spectra and, thereby, identify any polymorphism; while the control mass spectrum is obtained from unsorted samples from the collection or samples selected by another parameter. 61. Способ по п.60, отличающийся тем, что расщепление производят путем контактирования биополимера с ферментом.61. The method according to p. 60, characterized in that the cleavage is carried out by contacting the biopolymer with the enzyme. 62. Способ по п.61, отличающийся тем, что фермент выбирают из группы, включающей нуклеотидгликозилазу, никазу и рестрикционный фермент типа IIS.62. The method according to p, characterized in that the enzyme is selected from the group comprising nucleotide glycosylase, nikase and restriction enzyme type IIS. 63. Способ по п.60, отличающийся тем, что биополимер является нуклеиновой кислотой или белком.63. The method according to p, characterized in that the biopolymer is a nucleic acid or protein. 64. Способ по п.60, отличающийся тем, что масс-спектрометрический формат выбирают из следующих форматов: лазерная десорбция/ионизация из матрикса - время пролета (MALDI-TOF), электрораспыление (ЭР), IR-MALDI, ион-циклотронный резонанс (ИЦР), преобразование Фурье и их комбинации.64. The method according to p. 60, characterized in that the mass spectrometric format is selected from the following formats: laser desorption / ionization from the matrix - time of flight (MALDI-TOF), electrospray (ER), IR-MALDI, ion-cyclotron resonance ( ICR), Fourier transform and their combinations. 65. Способ обнаружения полиморфизма в популяции, включающий получение образцов тканей или жидкостей тела из множества организмов; выделение биополимера из каждого образца; объединение выделенных биополимеров; по желанию амплификацию некоторого количества биополимера; расщепление объединенных биополимеров с образованием фрагментов; получение масс-спектра образующихся фрагментов; сравнение частоты каждого фрагмента для идентификации фрагментов с частотой ниже средней, тем самым идентификацию любого полиморфизма.65. A method for detecting polymorphism in a population, comprising obtaining tissue samples or body fluids from multiple organisms; isolation of the biopolymer from each sample; Association of selected biopolymers; optionally amplifying a certain amount of biopolymer; cleavage of the combined biopolymers with the formation of fragments; obtaining a mass spectrum of the resulting fragments; comparing the frequency of each fragment to identify fragments with a frequency below the average, thereby identifying any polymorphism. 66 Способ по п.65, отличающийся тем, что расщепление производят путем контактирования биополимера с ферментом.66 The method according to claim 65, wherein the cleavage is carried out by contacting the biopolymer with an enzyme. 67. Способ по п.66, отличающийся тем, что фермент выбран из группы, включающей нуклеотидгликозилазу, никазу и рестрикционный фермент типа IIS.67. The method according to p, characterized in that the enzyme is selected from the group comprising nucleotide glycosylase, nikase and restriction enzyme type IIS. 68. Способ по п.65, отличающийся тем, что биополимер является нуклеиновой кислотой или белком.68. The method according to p, characterized in that the biopolymer is a nucleic acid or protein. 69. Способ по п.65, отличающийся тем, что масс-спектрометрический формат выбирают из следующих форматов: лазерная десорбция/ионизация из матрикса - время пролета (MALDI-TOF), электрораспыление (ЭР), IR-MALDI, ион-циклотронный резонанс (ИЦР), преобразование Фурье и их комбинации.69. The method according to p. 65, characterized in that the mass spectrometric format is selected from the following formats: laser desorption / ionization from the matrix - time of flight (MALDI-TOF), electrospray (ER), IR-MALDI, ion-cyclotron resonance ( ICR), Fourier transform and their combinations. 70. Способ по п.65, отличающийся тем, что образцы отбирают у здоровых субъектов.70. The method according to p, characterized in that the samples are taken from healthy subjects. 71. Способ коррелирования полиморфизма с параметром, включающий сортировку базы данных по п.8 по выбранному параметру для идентификации образцов, соответствующих выбранному параметру; выделение биополимера из каждого идентифицированного образца; объединение выделенных биополимеров; по желанию амплификацию некоторого количества биополимера; определение частоты полиморфизма в объединенных биополимерах, в котором изменение частоты полиморфизма по сравнению с контролем указывает на корреляцию полиморфизма с выбранным параметром; и контроль представляет собой частоту полиморфизма в объединенных биополимерах, полученных из образцов, выбранных из неотсортированной базы данных или из базы данных, отсортированной по другому параметру.71. A method for correlating polymorphism with a parameter, including sorting the database according to claim 8 by the selected parameter to identify samples corresponding to the selected parameter; isolation of the biopolymer from each identified sample; Association of selected biopolymers; optionally amplifying a certain amount of biopolymer; determining the frequency of polymorphism in the combined biopolymers, in which a change in the frequency of polymorphism compared to the control indicates a correlation of the polymorphism with the selected parameter; and the control is the frequency of polymorphism in the combined biopolymers obtained from samples selected from an unsorted database or from a database sorted by another parameter. 72. Способ по п.71, отличающийся тем, что параметр отбирают из группы, включающей этническую принадлежность, возраст, пол, рост, вес, употребление алкоголя, число беременностей, число нормальных родов, вегетарианство, тип физической активности, место проживания и/или длительность проживания в определенном месте, уровень образования, возраст смерти родителей, причина смерти родителей, курение в прошлом и в настоящий момент, стаж как курильщика, частота курения, наличие болезненного состояния или болезни у близких родственников (родители, братья и сестры, дети), употребление прописанных лекарств и/или причины для этого, длительность и/или число пребываний в больнице и контакты с факторами окружающей среды.72. The method according to p, characterized in that the parameter is selected from the group comprising ethnicity, age, gender, height, weight, alcohol consumption, number of pregnancies, number of normal births, vegetarianism, type of physical activity, place of residence and / or length of residence in a particular place, level of education, age of death of parents, cause of death of parents, smoking in the past and present, length of service as a smoker, frequency of smoking, the presence of a disease state or illness in close relatives (parents, brother I and sisters, children), the use of prescription drugs and / or the reasons for it, the duration and / or the number of hospital stays and contacts with environmental factors. 73. Способ по п.72, отличающийся тем, что параметром является наличие болезненного состояния или конкретной болезни у близких родственников, что устанавливает корреляцию полиморфизма с болезнью.73. The method according to claim 72, wherein the parameter is the presence of a disease state or a specific disease in close relatives, which establishes a correlation of polymorphism with the disease. 74. Способ по п.71, отличающийся тем, что объединенные биополимеры представляют собой объединенные молекулы нуклеиновых кислот.74. The method according to p, characterized in that the combined biopolymers are combined nucleic acid molecules. 75. Способ по п.74, отличающийся тем, что полиморфизм определяют путем удлинения олигонуклеотидного праймера (PROBE).75. The method according to p. 74, wherein the polymorphism is determined by lengthening the oligonucleotide primer (PROBE). 76. Способ по п.75, отличающийся тем, что удлинение нуклеотидного праймера содержит стадии а) иммобилизации по желанию молекул нуклеиновой кислоты на твердой подложке для получения иммобилизованных молекул нуклеиновой кислоты; б) гибридизации молекул нуклеиновой кислоты с олигонуклеотидным праймером, комплементарным молекулам нуклеиновой кислоты в сайте, примыкающем к нуклеотиду-мишени; в) контактирования продукта по стадии б) со смесью, содержащей дидезоксинуклеозидтрифосфат или 3’-дезоксинуклеозидтрифосфаты и полимеразу таким образом, чтобы только один дидезоксинуклеозид или 3’-дезоксинуклеозидтрифосфат, который комплементарен нуклеотиду-мишени, удлинял праймер; и г) определения удлиненного праймера и тем самым обнаружения полиморфизма в молекулах нуклеиновых кислот в объединенных образцах нуклеиновых кислот.76. The method according to claim 75, wherein the extension of the nucleotide primer comprises the steps of a) immobilizing, if desired, nucleic acid molecules on a solid support to obtain immobilized nucleic acid molecules; b) hybridization of nucleic acid molecules with an oligonucleotide primer complementary to the nucleic acid molecules at a site adjacent to the target nucleotide; c) contacting the product of step b) with a mixture containing dideoxynucleoside triphosphate or 3’-deoxynucleoside triphosphates and polymerase so that only one dideoxynucleoside or 3’-deoxynucleoside triphosphate that is complementary to the target nucleotide extends the primer; and d) determining an extended primer and thereby detecting polymorphism in nucleic acid molecules in the combined nucleic acid samples. 77. Способ по п.76, отличающийся тем, что определение проводят при помощи масс-спектрометрии.77. The method according to p, characterized in that the determination is carried out using mass spectrometry. 78. Способ по п.71, отличающийся тем. что частота представляет собой процент молекул нуклеиновых кислот в объединенном образце, содержащих полиморфизм.78. The method according to p, characterized in that. that frequency is the percentage of nucleic acid molecules in a pooled sample containing polymorphism. 79. Способ по п.78, отличающийся тем, что отношение определяют путем получения масс-спектра объединенных нуклеиновых кислот.79. The method according to p, characterized in that the ratio is determined by obtaining a mass spectrum of the combined nucleic acids. 80. Способ по п.72, отличающийся тем, что параметром является возраст, таким образом связывающий полиморфизм с восприимчивостью к заболеваниям, с ранней смертностью или с заболеваемостью и с ранней смертностью.80. The method according to p. 72, characterized in that the parameter is age, thus associating polymorphism with susceptibility to diseases, with early mortality or with morbidity and early mortality. 81. Способ гаплотипирования полиморфизмов в нуклеиновой кислоте, включающий а) сортировку базы данных по п.8 по выбранному параметру для идентификации образцов, соответствующих выбранному параметру; б) выделение нуклеиновой кислоты из каждого идентифицированного образца; в) объединение (по желанию) выделенных нуклеиновых кислот; г) амплификацию некоторого количества нуклеиновой кислоты; д) получение одноцепочечной нуклеиновой кислоты и помещение каждой цепи в отдельный реакционный сосуд; е) контактирование каждой одноцепочечной нуклеиновой кислоты с нуклеиновой кислотой-адаптером для образования адапторного комплекса; ж) контактирование адапторного комплекса с нуклеазой и лигазой; з) контактирование продуктов по стадии ж) со смесью, обеспечивающей амплификацию лигированного адаптера для получения удлиненного продукта; и) получение масс-спектра каждой нуклеиновой кислоты, образующейся на стадии з) и определение полиморфизма путем идентификации сигнала, соответствующего удлиненному продукту; к) повторение стадий с е) до и) включительно с использованием адапторной нуклеиновой кислоты, способной к гибридизации с другой адапторной нуклеиновой кислотой, гибридизующейся с другой последовательностью той же цепи; посредством чего полиморфизмы гаплотипируют путем определения более чем одного удлиненного продукта.81. A method for haplotyping polymorphisms in nucleic acid, comprising: a) sorting the database according to claim 8 by the selected parameter to identify samples corresponding to the selected parameter; b) isolation of nucleic acid from each identified sample; c) combining (optionally) isolated nucleic acids; d) amplification of a certain amount of nucleic acid; d) obtaining a single-stranded nucleic acid and placing each chain in a separate reaction vessel; f) contacting each single-stranded nucleic acid with an adapter nucleic acid to form an adapter complex; g) contacting the adapter complex with nuclease and ligase; h) contacting the products according to stage g) with a mixture that provides amplification of the ligated adapter to obtain an elongated product; i) obtaining the mass spectrum of each nucleic acid formed in step h) and determining the polymorphism by identifying the signal corresponding to the elongated product; k) repeating steps e) to i) inclusive using an adapter nucleic acid capable of hybridization with another adapter nucleic acid hybridizing with a different sequence of the same chain; whereby polymorphisms are haplotype by determining more than one elongated product. 82. Способ по п.81, отличающийся тем, что нуклеазой является Fen-1.82. The method according to p, characterized in that the nuclease is Fen-1. 83. Способ гаплотипирования полиморфизмов в популяции, включающий: сортировку базы данных по п.8 по выбранному параметру для идентификации образцов, соответствующих выбранному параметру; выделение нуклеиновой кислоты из каждого идентифицированного образца; объединение выделенной нуклеиновой кислоты; по желанию амплификацию некоторого количества нуклеиновой кислоты; контактирование нуклеиновой кислоты по крайней мере с одним ферментом для получения фрагментов; получение масс-спектра образующихся фрагментов; посредством чего: полиморфизмы обнаруживают путем определения сигналов, соответствующих полиморфизмам; и полиморфизмы гаплотипируют путем установления по масс-спектру, при этом полиморфизмы локализованы на одной и той же цепи нуклеиновой кислоты.83. A method for haplotyping polymorphisms in a population, including: sorting the database according to claim 8 by the selected parameter to identify samples corresponding to the selected parameter; nucleic acid isolation from each identified sample; combining isolated nucleic acid; optionally amplifying a certain amount of nucleic acid; contacting the nucleic acid with at least one enzyme to obtain fragments; obtaining a mass spectrum of the resulting fragments; whereby: polymorphisms are detected by determining signals corresponding to polymorphisms; and polymorphisms are haplotyped by mass spectral determination, wherein the polymorphisms are localized on the same nucleic acid chain. 84. Способ по п.83, отличающийся тем, что ферментом является никаза.84. The method according to p, characterized in that the enzyme is nickase. 85. Способ по п.84, отличающийся тем, что никазу выбирают из группы, включающей NY2A и NYS1.85. The method of claim 84, wherein the nikase is selected from the group consisting of NY2A and NYS1. 86. Способ определения метилированных нуклеотидов в образцах нуклеиновых кислот, включающий разделение образца нуклеиновой кислоты на порции в отдельных реакционных сосудах; контактирование нуклеиновой кислоты в одном из реакционных сосудов с бисульфитом; амплификацию нуклеиновой кислоты в каждом реакционном сосуде; расщепление нуклеиновых кислот в каждом реакционном сосуде с образованием фрагментов; получение масс-спектра фрагментов, образующихся в одном реакционном сосуде, и получение масс-спектра фрагментов, образующихся в другом реакционном сосуде, посредством чего: метилированный цитозин обнаруживают путем установления различия в сигналах масс-спектров.86. A method for determining methylated nucleotides in nucleic acid samples, comprising: dividing a nucleic acid sample into portions in separate reaction vessels; contacting a nucleic acid in one of the reaction vessels with bisulfite; amplification of a nucleic acid in each reaction vessel; cleavage of nucleic acids in each reaction vessel to form fragments; obtaining a mass spectrum of fragments formed in one reaction vessel and obtaining a mass spectrum of fragments formed in another reaction vessel, whereby: methylated cytosine is detected by establishing differences in the mass spectral signals. 87. Способ по п.86, отличающийся тем, что стадию амплификации проводят в присутствии урацила; и расщепление производят урацилгликозилазой.87. The method according to p, characterized in that the stage of amplification is carried out in the presence of uracil; and cleavage is performed with uracilglycosylase. 88. Способ идентификации биологического образца, включающий создание набора данных, указывающих на состав биологического образца; очистку набора данных от шума для получения очищенных от шума данных; удаление базовой линии из очищенных от шума данных для создания набора промежуточных данных; определение предполагаемых пиков биологического образца; использование предполагаемых пиков для генерирования остаточной базовой линии; удаление остаточной базовой линии из набора промежуточных данных для создания набора скорректированных данных; локализацию предполагаемых пиков в наборе корректированных данных с учетом удаленной базовой линии; и идентификацию биологического образца путем использования локализованных предполагаемых пиков; при этом созданный набор данных биологического образца включает данные из смысловых и антисмысловых цепей исследованных фрагментов.88. A method for identifying a biological sample, comprising creating a data set indicating the composition of the biological sample; purification of the data set from noise to obtain data cleared of noise; removing the baseline from noise-free data to create a set of intermediate data; determination of prospective peaks of a biological sample; using estimated peaks to generate a residual baseline; removing the residual baseline from the set of intermediate data to create a set of adjusted data; localization of estimated peaks in the set of corrected data taking into account the remote baseline; and identification of the biological sample using localized putative peaks; the created data set of the biological sample includes data from the sense and antisense chains of the studied fragments. 89. Способ по п.88, отличающийся тем, что идентификация включает комбинирование данных от смысловых и антисмысловых цепей и сравнение данных с ожидаемыми значениями для смысловой и антисмысловой цепей с целью идентификации биологического образца.89. The method according to p, characterized in that the identification includes combining data from sense and antisense chains and comparing data with expected values for sense and antisense chains in order to identify a biological sample. 90. Способ по п.88, отличающийся тем, что идентификация включает вычисление вероятности пика для предполагаемого пика в соответствии с тем, относится ли этот пик к данным по смысловой цепи, или к данных по антисмысловой цепи.90. The method according to p, characterized in that the identification includes calculating the probability of a peak for the estimated peak in accordance with whether this peak refers to data on the sense chain or data on the antisense chain. 91. Способ по п.88, отличающийся тем, что идентификация включает вычисление вероятности пика для предполагаемого пика и наложение аллельного штрафа, величина которого зависит от отношения рассчитанной площади под предполагаемым пиком к рассчитанной ожидаемой средней площади под всеми пиками в наборе данных.91. The method according to p, characterized in that the identification includes calculating the probability of a peak for the alleged peak and imposing an allelic penalty, the value of which depends on the ratio of the calculated area under the estimated peak to the calculated expected average area under all peaks in the data set. 92. Способ идентификации биологического образца, включающий создание набора данных, указывающих на состав биологического образца; очистку набора данных от шума для получения очищенных от шума данных; удаление базовой линии из очищенных от шума данных для создания набора промежуточных данных; определение предполагаемых пиков биологических образцов; использование предполагаемых пиков для генерирования остаточной базовой линии; удаление остаточной базовой линии из набора промежуточных данных для создания набора корректированных данных; локализацию предполагаемых пиков в наборе корректированных данных с учетом удаленной базовой линии; и идентификацию биологического образца путем использования локализованных предполагаемых пиков; при этом идентификация включает вычисление вероятности пика для предполагаемого пика и наложение аллельного штрафа, величина которого зависит от отношения рассчитанной площади под предполагаемым пиком к рассчитанной ожидаемой средней площади под всеми пиками в наборе данных.92. A method for identifying a biological sample, comprising creating a data set indicating the composition of the biological sample; purification of the data set from noise to obtain data cleared of noise; removing the baseline from noise-free data to create a set of intermediate data; determination of estimated peaks of biological samples; using estimated peaks to generate a residual baseline; removing the residual baseline from the set of intermediate data to create a set of adjusted data; localization of estimated peaks in the set of corrected data taking into account the remote baseline; and identification of the biological sample using localized putative peaks; in this case, identification includes calculating the probability of a peak for the alleged peak and imposing an allelic penalty, the value of which depends on the ratio of the calculated area under the estimated peak to the calculated expected average area under all peaks in the data set. 93. Способ по п.92, отличающийся тем, что идентификация включает сравнение данных от предполагаемых пиков без наложения аллельного штрафа при определении их масс в соответствии с биологическим данными олигонуклеотидов.93. The method according to p. 92, wherein the identification includes comparing data from the alleged peaks without imposing an allelic penalty in determining their masses in accordance with the biological data of the oligonucleotides. 94. Способ по п.92, отличающийся тем, что аллельный штраф не применяют к предполагаемым пикам, если отношение площади под пиком к ожидаемой площади больше 30%.94. The method according to paragraph 92, wherein the allelic penalty is not applied to the expected peaks if the ratio of the area under the peak to the expected area is more than 30%. 95. Способ определения полиморфизма в нуклеиновых кислотах, включающий амплификацию участка нуклеиновой кислоты с образованием ампликона, причем образующийся ампликон содержит один или более сайтов рестрикции; контактирование ампликона с рестриктазой для получения фрагментов; получение масс-спектра образующихся фрагментов и анализ сигналов в масс-спектре способом по п.88, при этом полиморфизмы выявляют по паттерну сигналов.95. A method for determining polymorphism in nucleic acids, comprising amplifying a portion of a nucleic acid to form an amplicon, the resulting amplicon containing one or more restriction sites; contacting the amplicon with restrictase to obtain fragments; obtaining the mass spectrum of the resulting fragments and analysis signals in the mass spectrum by the method of claim 88, wherein polymorphisms are detected by the signal pattern. 96. Подколлекция образцов из исследуемой популяции, содержащая множество образцов, причем образцы отбирают из группы, содержащей нуклеиновые кислоты, ткани плода, образцы белков; и символику на контейнерах, содержащих образцы, причем символика представляет источник и/или историю каждого образца, при этом исследуемая популяция представляет собой популяцию здоровых индивидуумов, не отобранную по какому-либо болезненному состоянию; коллекция содержит образцы из популяции здоровых индивидуумов; и подколлекцию получают сортировкой коллекции по специфическим параметрам.96. A subcollection of samples from the study population, containing many samples, the samples being taken from the group consisting of nucleic acids, fetal tissues, protein samples; and symbolism on containers containing samples, the symbolism representing the source and / or history of each sample, the population being studied being a population of healthy individuals not selected for any disease state; the collection contains samples from a population of healthy individuals; and the subcollection is obtained by sorting the collection by specific parameters. 97. Система по п.26, отличающаяся тем, что образцы отобраны из группы, содержащей нуклеиновые кислоты, ткани плода, белки, ткани, жидкости тела, клетки, семена, микробы, патогены и образцы репродуктивных тканей.97. The system of claim 26, wherein the samples are selected from the group consisting of nucleic acids, fetal tissues, proteins, tissues, body fluids, cells, seeds, microbes, pathogens, and reproductive tissue samples. 98. Система, включающая базу данных по п.8 и масс-спектрометр.98. A system including the database of claim 8 and a mass spectrometer. 99. Система по п.98, отличающаяся тем, что представляет собой автоматизированную технологическую линию для анализа биологических образцов.99. The system according to p, characterized in that it is an automated production line for the analysis of biological samples. 100. Система для высокопроизводительной обработки биологических образцов, включающая базу данных по п.8, причем образцы, анализируемые автоматизированной технологической линией, включают образцы от субъектов базы данных, с возможностью использования масс-спектрометрии для анализа биополимеров в образцах.100. A system for high-performance processing of biological samples, including a database according to claim 8, wherein the samples analyzed by the automated production line include samples from database subjects, with the possibility of using mass spectrometry to analyze biopolymers in the samples.
RU2002109481/09A 1999-10-13 2000-10-13 Ways to create databases and databases for the identification of polymorphic genetic markers RU2002109481A (en)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US15917699P 1999-10-13 1999-10-13
US60/159,176 1999-10-13
US21765800P 2000-07-10 2000-07-10
US60/217,658 2000-07-10
US60/217,251 2000-07-10
US09/663,968 2000-09-19
US09/663,968 US7917301B1 (en) 2000-09-19 2000-09-19 Method and device for identifying a biological sample

Publications (1)

Publication Number Publication Date
RU2002109481A true RU2002109481A (en) 2004-02-10

Family

ID=36294315

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2002109481/09A RU2002109481A (en) 1999-10-13 2000-10-13 Ways to create databases and databases for the identification of polymorphic genetic markers

Country Status (1)

Country Link
RU (1) RU2002109481A (en)

Similar Documents

Publication Publication Date Title
US11214798B2 (en) Methods and compositions for rapid nucleic acid library preparation
AU776811C (en) Methods for generating databases and databases for identifying polymorphic genetic markers
Buetow et al. High-throughput development and characterization of a genomewide collection of gene-based single nucleotide polymorphism markers by chip-based matrix-assisted laser desorption/ionization time-of-flight mass spectrometry
US7668658B2 (en) Methods for generating databases and databases for identifying polymorphic genetic markers
US6660229B2 (en) Use of nucleotide analogs in the analysis of oligonucleotide mixtures and in highly multiplexed nucleic acid sequencing
Lo Non-invasive prenatal testing using massively parallel sequencing of maternal plasma DNA: from molecular karyotyping to fetal whole-genome sequencing
Hitzemann et al. A strategy for the integration of QTL, gene expression, and sequence analyses
CN111073962A (en) Rapid aneuploidy detection
EP3323897A1 (en) Methods and devices for assessing risk to a putative offspring of developing a condition
US20090125246A1 (en) Method and Apparatus for the Determination of Genetic Associations
US11739315B2 (en) Genetic copy number determination using high throughput multiplex sequencing of smashed nucleotides
US20200199650A1 (en) Analysis system for peripheral blood-based non-invasive detection of lesion immune repertoire diversity and uses of system
Zafari et al. Non-invasive prenatal diagnosis of β-thalassemia by detection of the cell-free fetal DNA in maternal circulation: a systematic review and meta-analysis
Sauer Typing of single nucleotide polymorphisms by MALDI mass spectrometry: principles and diagnostic applications
Manco et al. Comparative analysis of genomic-and EST-SSRs in European plum (Prunus domestica L.): Implications for the diversity analysis of polyploids
EP3303624B1 (en) Methods for enhanced cgh analysis
US20180300451A1 (en) Techniques for fractional component fragment-size weighted correction of count and bias for massively parallel DNA sequencing
RU2002109481A (en) Ways to create databases and databases for the identification of polymorphic genetic markers
CN105986010B (en) Method and kit for detecting folate metabolism related gene
EP3988672B1 (en) Use of off-target sequences for dna analysis
US20080268442A1 (en) Method and system for preparing a blood sample for a disease association gene transcript test
Kobilinsky et al. Forensic DNA analysis
CN111197078A (en) Method for distinguishing nifedipine personalized medicine by mass spectrometry through product detection
Shimizu et al. A novel swab storage gel is superior to dry swab DNA collection, and enables long‐range high resolution next generation sequencing HLA typing from buccal cell samples
Treff et al. Preimplantation Genetic Testing for Polygenic Disorders

Legal Events

Date Code Title Description
FA93 Acknowledgement of application withdrawn (no request for examination)

Effective date: 20090320