Claims (11)
1. Способ неинвазивной пренатальной диагностики анеуплоидии плода, включающий:1. The method of non-invasive prenatal diagnosis of fetal aneuploidy, including:
a. выделение внеклеточной ДНК из образца крови, полученного у беременной женщины;a. the extraction of extracellular DNA from a blood sample obtained from a pregnant woman;
b. приготовление геномных библиотек с использованием выделенной на стадии а) внеклеточной ДНК;b. preparation of genomic libraries using extracellular DNA isolated in step a);
c. обогащение геномных библиотек фрагментами ДНК из набора регионов генома, характеризующихся открытостью хроматина между плацентой и клетками крови матери, отличающейся не менее чем на 20%;c. enrichment of genomic libraries with DNA fragments from a set of regions of the genome, characterized by the openness of chromatin between the placenta and the mother’s blood cells, which differs by at least 20%;
d. определение последовательности нуклеотидов (секвенирование) полученных геномных библиотек;d. determination of the nucleotide sequence (sequencing) of the resulting genomic libraries;
e. картирование полученных чтений на референсный геном или части генома - человека для определения их координат;e. mapping the readings to the reference genome or parts of the human genome to determine their coordinates;
f. определение значения покрытия для каждого региона генома из набора;f. determination of the coverage value for each region of the genome from the set;
g. корректировку полученного значения покрытия для каждого региона генома из набора на общее покрытие генома, с последующим сравнением скорректированного значения покрытия со значениями покрытий или их распределений, полученных для обучающей выборки образцов крови беременных женщин при эуплоидии и анеуплоидии плода и определение принадлежности исследуемого образца к одной из данных групп, по которому делают вывод о наличии анеуплоидии плода.g. adjustment of the obtained coverage value for each region of the genome from the set to the total coverage of the genome, followed by comparison of the adjusted coating value with the values of coatings or their distributions obtained for the training sample of pregnant women blood samples for euploidy and aneuploidy of the fetus and determining the belonging of the test sample to one of the data groups that conclude the presence of fetal aneuploidy.
2. Способ по п. 1, характеризующийся тем, что выбор регионов генома для обогащения геномных библиотек осуществляют из базы данных покрытий кандидатных регионов генома для образцов крови беременных женщин с эуплоидией и анеуплоидией при этом, вычисляют значимость отличия покрытия между образцами с эу- и анеуплоидией для каждого кандидатного региона, характеризующуюся значением p-value с учетом корректировки на общее покрытие образца, и выбирают из кандидатных регионов генома те регионы, которые характеризуются значением p-value не более 0,1, из которых составляют набор регионов генома для определения анеуплоидии плода.2. The method according to p. 1, characterized in that the selection of genome regions for enrichment of genomic libraries is carried out from the database of coatings of candidate genome regions for blood samples of pregnant women with euploidy and aneuploidy, and the significance of the difference in coverage between samples with eu- and aneuploidy is calculated for each candidate region, characterized by a p-value taking into account adjustments for the total coverage of the sample, and those regions that are characterized by a p-value of not more than 0.1 are selected from the candidate regions of the genome, from toryh constitute a set of regions of the genome to determine fetal aneuploidy.
3. Способ по п. 2, характеризующийся тем, что определение принадлежности образца к группе с эуплоидией или анеуплоидией плода осуществляют следующим образом:3. The method according to p. 2, characterized in that the determination of the belonging of the sample to the group with euploidy or aneuploidy of the fetus is as follows:
a. для каждого региона из набора вычисляют p-value, которое определяет вероятность наблюдать полученное значение покрытия или более экстремальное значение при условии, что данное значение соответствует распределению покрытий для беременности без анеуплоидий, и p-value того, что его покрытие получено из распределения покрытий для беременности с анеуплоидией по данной хромосоме по БД покрытий кандидатных регионов генома для образцов крови беременных женщин с эуплоидией и анеуплоидией;a. for each region from the set, a p-value is calculated that determines the probability of observing the obtained coverage value or a more extreme value, provided that this value corresponds to the distribution of coatings for pregnancy without aneuploidy, and p-value that its coverage is obtained from the distribution of coatings for pregnancy with aneuploidy on this chromosome according to the DB of coatings of candidate regions of the genome for blood samples of pregnant women with euploidy and aneuploidy;
b. вычисляют произведение по всем регионам полученных значений p-value для вычисления p-value того, что значения покрытия набора регионов получены из распределения покрытий для беременности без анеуплоидий, и p-value того, что значения покрытия набора регионов получены из распределения покрытий для беременности с анеуплоидией по данной хромосоме;b. calculate the product for all regions of the obtained p-values to calculate the p-value of the fact that the coverage values of a set of regions are obtained from the distribution of coatings for pregnancy without aneuploidy, and the p-value of the values of the coverage of a set of regions is obtained from the distribution of coatings for pregnancy with aneuploidy on this chromosome;
c. по полученным произведениям p-value и априорным вероятностям наличия анеуплоидий у плода (риск по популяции) вычисляют по теореме Байеса вероятности наличия анеуплоидий или эуплоидии в исследуемом образце.c. according to the obtained p-value products and the a priori probabilities of the presence of aneuploidy in the fetus (population risk), the probabilities of the presence of aneuploidy or euploidy in the test sample are calculated by the Bayes theorem.
4. Способ по п. 3, характеризующийся тем, что вывод о наличии или отсутствии анеуплоидий плода делают, если вероятность для одного из вариантов диагноза не превышает порог значимости из интервала 0.01-0.1, а вероятность для другого варианта превышает порог значимости, при этом диагноз ставится по наибольшему значению вероятности, и в случае, если оба p-value выше или оба ниже порога значимости, диагноз не ставится.4. The method according to p. 3, characterized in that the conclusion about the presence or absence of fetal aneuploidy is made if the probability for one of the diagnosis options does not exceed the significance threshold from the interval 0.01-0.1, and the probability for the other option exceeds the significance threshold, with the diagnosis is set at the highest probability value, and if both p-values are higher or both below the significance threshold, no diagnosis is made.
5. Способ по п. 1, характеризующийся тем, что к образцу крови, полученному у беременной женщины, непосредственно перед стадией выделения вкДНК добавляют молекулярную метку.5. The method according to claim 1, characterized in that a molecular label is added to the blood sample obtained from the pregnant woman immediately before the step of isolating the cfDNA.
6. Способ по п. 5, характеризующийся тем, что молекулярная метка представляет собой молекулу нуклеиновой кислоты, предпочтительно ДНК, имеющую степень гомологии с известными природными либо технологическими последовательностями ДНК не более 5%, при этом длина молекулярной метки составляет 30-400 нуклеотидов.6. The method according to p. 5, characterized in that the molecular tag is a nucleic acid molecule, preferably DNA, having a degree of homology with known natural or technological DNA sequences of not more than 5%, the length of the molecular tag is 30-400 nucleotides.
7. Набор регионов генома для определения анеуплоидий плода методом секвенирования, включающий записанные на машиночитаемый носитель не менее 10 регионов генома с указанием геномных координат каждого региона, для которых открытость хроматина между плацентой и клетками крови матери отличается не менее чем на 20%.7. A set of regions of the genome for determining fetal aneuploidy by sequencing, including at least 10 regions of the genome recorded on a machine-readable medium with the genomic coordinates of each region for which the chromatin openness between the placenta and the mother’s blood cells differs by at least 20%.
8. Набор по п. 7, характеризующийся тем, что для входящих в набор регионов генома значимо отличается покрытие между образцами с плодом без анеуплоидий и образцами с анеуплоидией плода по конкретной хромосоме, с учетом корректировки на общее покрытие образца.8. The kit according to claim 7, characterized in that for the genome regions included in the set, the coverage between the samples with the fetus without aneuploidy and the samples with aneuploidy of the fetus on a particular chromosome is significantly different, taking into account the adjustment for the total coating of the sample.
9. Способ получения набора регионов генома для неинвазивной пренатальной диагностики анеуплоидий плода по п. 1 по вкДНК крови матери методом секвенирования, включающий:9. A method of obtaining a set of regions of the genome for non-invasive prenatal diagnosis of fetal aneuploidy according to claim 1 for maternal blood cfDNA by sequencing, including:
a. получение данных секвенирования вкДНК крови матери, такого, что бы все кандидатные регионы генома, характеризующиеся открытостью хроматина между плацентой и клетками крови матери и отличающиеся не менее чем на 20%, были прочитаны для образцов крови нескольких беременных женщин без анеуплоидий плода и нескольких беременных женщин с анеуплоидией плода по конкретной;a. obtaining maternal blood cfDNA sequencing data such that all candidate regions of the genome, characterized by chromatin openness between the placenta and the mother’s blood cells and differing by at least 20%, were read for blood samples of several pregnant women without fetal aneuploidy and several pregnant women with fetal aneuploidy specific;
b. картирование полученных чтений на референсный геном человека для определения их координат;b. mapping readings to the reference human genome to determine their coordinates;
c. определение покрытия каждого кандидатного региона каждого полученного образца;c. determination of the coverage of each candidate region of each sample received;
d. вычисление для каждого региона значимости отличия, характеризующейся значением p-value покрытия между образцами с плодом без анеуплоидий и образцами с анеуплоидией плода по конкретной хромосоме, с учетом корректировки на общее покрытие образца;d. calculation for each region of the significance of the difference, characterized by the p-value of the coating between samples with the fetus without aneuploidy and samples with aneuploidy of the fetus on a particular chromosome, taking into account adjustments for the total coverage of the sample;
e. выбор из кандидатных регионов генома регионов, характеризующихся значением p-value не более 0,1, из которых составляют набор регионов генома для определения анеуплоидий плода.e. selection of candidate regions from the genome of the genome characterized by a p-value of not more than 0.1, of which a set of regions of the genome is used to determine fetal aneuploidy.
10. Способ по п. 9, характеризующийся тем, что этап d осуществляют в предположении отрицательного биномиального распределения покрытия региона в образце, например, с использованием программного обеспечения для определения дифференциальной экспрессии РНК DESeq.10. The method according to p. 9, characterized in that step d is carried out under the assumption of a negative binomial distribution of the region coverage in the sample, for example, using software for determining differential expression of DESeq RNA.
11. Способ по п. 9, характеризующийся тем, что для регионов, найденных в пункте d, аналогично пунктам b-е вычисляют покрытие прочтениями в образцах крови не менее 5 мужчин и для каждого региона определяют значимость, выражающуюся в виде p-value отличий между покрытием ДНК в образцах мужчин и беременных женщин с плодом без анеуплоидий, отбирают участки с p-value не более 0,1.
11. The method according to p. 9, characterized in that for the regions found in point d, similarly to points b-e, coverage of readings in blood samples of at least 5 men is calculated and for each region the significance expressed in the form of p-value differences between DNA coated in samples of men and pregnant women with a fetus without aneuploidy, sites with a p-value of not more than 0.1 are selected.