RU2743586C1 - Method of determining efficiency of enrichment of ngs library with exon sections for sequencing human exome - Google Patents

Method of determining efficiency of enrichment of ngs library with exon sections for sequencing human exome Download PDF

Info

Publication number
RU2743586C1
RU2743586C1 RU2020118092A RU2020118092A RU2743586C1 RU 2743586 C1 RU2743586 C1 RU 2743586C1 RU 2020118092 A RU2020118092 A RU 2020118092A RU 2020118092 A RU2020118092 A RU 2020118092A RU 2743586 C1 RU2743586 C1 RU 2743586C1
Authority
RU
Russia
Prior art keywords
enrichment
efficiency
library
ngs
qpcr
Prior art date
Application number
RU2020118092A
Other languages
Russian (ru)
Inventor
Андрей Анатольевич Кривой
Валерий Владимирович Черанев
Дмитрий Олегович Коростин
Original Assignee
Федеральное государственное автономное образовательное учреждение высшего образования "Российский национальный исследовательский медицинский университет имени Н.И. Пирогова" Министерства здравоохранения Российской Федерации (ФГАОУ ВО РНИМУ им. Н.И. Пирогова Минздрава России)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Федеральное государственное автономное образовательное учреждение высшего образования "Российский национальный исследовательский медицинский университет имени Н.И. Пирогова" Министерства здравоохранения Российской Федерации (ФГАОУ ВО РНИМУ им. Н.И. Пирогова Минздрава России) filed Critical Федеральное государственное автономное образовательное учреждение высшего образования "Российский национальный исследовательский медицинский университет имени Н.И. Пирогова" Министерства здравоохранения Российской Федерации (ФГАОУ ВО РНИМУ им. Н.И. Пирогова Минздрава России)
Priority to RU2020118092A priority Critical patent/RU2743586C1/en
Application granted granted Critical
Publication of RU2743586C1 publication Critical patent/RU2743586C1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

FIELD: biotechnology.SUBSTANCE: invention relates to biotechnology and can be used to check the quality of samples prepared for high-throughput DNA sequencing. To determine efficiency of NGS-library enrichment with exon sections for human exome sequencing qPCR with human DNA of the same NGS-library is performed before and after enrichment procedure. Each PCR reaction is carried out with at least 50 pg DNA of the NGS library. Efficiency of the qPCR reaction and the threshold cycles of the fluorescent signal of the NGS-library samples before and after the enrichment procedure are determined. Enrichment efficiency of the NGS library is then calculated using the given formula.EFFECT: technical result consists in improvement of NGS-library enrichment efficiency evaluation accuracy.1 cl, 2 ex, 4 dwg

Description

Изобретение относится к биотехнологии и может быть использовано для проверки качества образцов, подготавливаемых для высокопроизводительного секвенирования ДНК.The invention relates to biotechnology and can be used to check the quality of samples prepared for high-throughput DNA sequencing.

Известно, что высокопроизводительное секвенирование (NGS) требует подготовки т.н. NGS библиотеки - фрагментов ДНК типичной длины 200-500 п.н. исследуемого генома, фланкированных определенными последовательностями (адаптерами).It is known that high throughput sequencing (NGS) requires the preparation of the so-called. NGS libraries - DNA fragments with a typical length of 200-500 bp. of the investigated genome, flanked by certain sequences (adapters).

В ряде применений (секвенирование полного экзома, секвенирование транскриптома) NGS-библиотека подвергается «обогащению» конкретными участками генома, т.е. ее состав - относительная представленность участков генома - меняется. Так, для обогащения экзома человека, доля генома, включающая экзоны и их окружение, которые являются предметом обогащения, составляет 1-1.5%. Эти области, изначально равнопредставленные с другими участками, после обогащения представляют большую часть фрагментов (порядка 80%) в NGS-библиотеке.In a number of applications (complete exome sequencing, transcriptome sequencing), the NGS library is "enriched" with specific regions of the genome, i.e. its composition - the relative representation of genome regions - changes. So, for the enrichment of the human exome, the fraction of the genome, including exons and their surroundings, which are the subject of enrichment, is 1-1.5%. These regions, initially equal to other regions, after enrichment represent most of the fragments (about 80%) in the NGS library.

Успешность обогащения зависит от множества факторов и аккуратности проводимой процедуры, и может варьироваться (быть меньше целевого уровня). Существует определенная трудность в определении эффективности обогащения до непосредственного секвенирования.The success of enrichment depends on many factors and the accuracy of the procedure, and may vary (be less than the target level). There is some difficulty in determining the efficiency of enrichment prior to direct sequencing.

Во-первых, существует ограниченное количество методов, способных измерить саму эффективность обогащения. Во-вторых, количество обогащенной библиотеки, взятой на тест, должно быть небольшим (в пределах двух нг). Такое ограничение сопровождается общим небольшим количеством всей обогащенной библиотеки, так как наработки больших ее количеств, как правило, понижают качество библиотеки.First, there are a limited number of methods that can measure the efficiency of enrichment itself. Secondly, the amount of the enriched library taken for the test should be small (within two ng). This limitation is accompanied by a small total of the entire enriched library, since the production of large amounts of it, as a rule, lowers the quality of the library.

Метод кПЦР (ПЦР в режиме реального времени) был предложен для оценки эффективности обогащения при секвенировании экзома (Life tech TargetSeq™ Exome Enrichment System, Revision Date 15 July 2011, Publication Part Number MAN0004396). Метод предполагает вынесение суждения о степени обогащения путем измерения количества целевых фрагментов (экзонов) и фрагментов около экзонов (которые не обогащаются в NGS-библиотеке для секвенирования экзома человека, так называемые отрицательные тесты) методом кПЦР для образца до и после обогащения.The qPCR (real-time PCR) method has been proposed to evaluate the enrichment efficiency in exome sequencing (Life tech TargetSeq ™ Exome Enrichment System, Revision Date 15 July 2011, Publication Part Number MAN0004396). The method involves making a judgment about the degree of enrichment by measuring the number of target fragments (exons) and fragments near exons (which are not enriched in the NGS library for sequencing the human exome, the so-called negative tests) by qPCR for a sample before and after enrichment.

Однако описанный метод имеет несколько недостатков. Во-первых, протокол требует 500 пг ДНК библиотеки на каждую кПЦР реакцию до финальной концентрации в пробирке 25 пг/мкл. Кроме того, этот протокол не предполагает измерение эффективности одного цикла ПЦР реакции, а значит, не позволяет оценить разницу обогащения фрагментов, участвующих в ПЦР, количественно, а только лишь качественно оценить общий уровень обогащения.However, the described method has several disadvantages. First, the protocol requires 500 pg of library DNA for each qPCR reaction to a final in vitro concentration of 25 pg / μL. In addition, this protocol does not imply the measurement of the efficiency of one cycle of the PCR reaction, which means that it does not allow quantitative assessment of the difference in enrichment of the fragments involved in PCR, but only qualitatively assess the overall level of enrichment.

Описана похожая панель кЦПР реакций для оценки эффективности обогащения (NimbleGen SeqCap EZ Library SR User's Guide, 2011). Плюсом этой системы является определение эффективности каждой ПЦР реакции, что позволяет количественно оценить и скорректировать разные уровни обогащения для разных ПЦР-таргетов. К недостаткам можно отнести большое количество ДНК на каждую ПЦР реакцию (5 нг, до концентрации 333 пг/мкл в реакции); отсутствие ПЦР реакций на необогащаемые регионы (отрицательные тесты), а наличие кПЦР реакций только для участков экзонов.A similar panel of qPCR reactions has been described to assess enrichment efficiency (NimbleGen SeqCap EZ Library SR User's Guide, 2011). The advantage of this system is the determination of the effectiveness of each PCR reaction, which allows you to quantify and adjust different levels of enrichment for different PCR targets. The disadvantages include a large amount of DNA for each PCR reaction (5 ng, up to a concentration of 333 pg / μl in the reaction); the absence of PCR reactions for non-enriched regions (negative tests), and the presence of qPCR reactions only for regions of exons.

Таким образом, для всех подобных систем существует техническое ограничение: если использовать небольшое (~50 пг) количество ДНК на один тест ПЦР, то образец, обогащенный последовательностями экзома до уровня 80%, будет содержать в среднем всего 2 копии необогащенного участка теста. Так как NGS-библиотека представляет собой фрагменты ДНК длиной типично не более 400 н.п., вероятность того, что образец будет содержать хотя бы один фрагмент, полностью содержащий в себе последовательность ПЦР ампликона, значительно ниже 100%.Thus, for all such systems, there is a technical limitation: if you use a small (~ 50 pg) amount of DNA per PCR test, then a sample enriched with exome sequences to a level of 80% will contain, on average, only 2 copies of an unenriched test site. Since the NGS library consists of DNA fragments typically no more than 400 bp in length, the probability that a sample will contain at least one fragment that completely contains the amplicon PCR sequence is well below 100%.

Другими словами, с большой вероятностью, матрицы ДНК для ПЦР реакции в образце не окажется, и тест не состоится. Именно это обстоятельство и обязывает описанные протоколы использовать сравнительно большое кол-во ДНК на тест.In other words, there is a high probability that there will be no DNA template for the PCR reaction in the sample, and the test will not take place. It is this circumstance that obliges the described protocols to use a relatively large amount of DNA for the test.

Известен многоточечный тест на эффективность целевого обогащения (ММТЕ) с разделением на капиллярном электрофорезе (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5341873/). Несмотря на высокую точность самого метода, представленные в статье результаты имеют сильное расхождение с актуальными данными NGS секвенирования, что возможно вызвано необходимой в методе ПЦР амплификацией соединенного лигированием зонда. Также, этот метод предусматривает как покупку готовых наборов, то есть лимитирует адаптацию протоколов, так и требует наличия в лаборатории инструмента капиллярного электрофореза, значительно более дорогостоящего прибора, чем ПЦР амплификатор с детекцией сигнала в реальном времени.Known multipoint test for the efficiency of target enrichment (MMTE) with separation by capillary electrophoresis (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5341873/). Despite the high accuracy of the method itself, the results presented in the article have a strong discrepancy with the actual data of NGS sequencing, which is possibly caused by the amplification of the probe connected by ligation necessary in the PCR method. Also, this method provides for both the purchase of ready-made kits, that is, it limits the adaptation of protocols, and requires a capillary electrophoresis instrument in the laboratory, a much more expensive device than a PCR amplifier with real-time signal detection.

Описан способ, предполагающий проведение кПЦР системы для определения эффективности обогащения, в котором проводится селективное обогащение целевых участков (одного гена на выбор) методом гибридизации и их секвенирование (CN 103667254, В, SHAO YANG et al., 11.01.2017). Изобретение направлено на работу как с геномной ДНК, так и с транскриптомом (с переводом мРНК в кДНК). При этом оценка эффективности обогащения производится методом кПЦР на целевом гене.A method is described that involves a qPCR system to determine the efficiency of enrichment, in which selective enrichment of target regions (one gene of your choice) by hybridization and their sequencing is carried out (CN 103667254, B, SHAO YANG et al., January 11, 2017). The invention is aimed at working with both genomic DNA and transcriptome (with the translation of mRNA into cDNA). In this case, the assessment of the efficiency of enrichment is performed by qPCR on the target gene.

Недостаток способа состоит в том, что используемая система имеет только положительный тест на 1 ген (пр. K.RAS, EGFR, BRAF гены), не учитывая все остальные гены. Такой подход может давать неточную оценку обогащения, поскольку не каждый фрагмент библиотеки, содержащий целевой ген, будет иметь в себе последовательность кПЦР ампликона. Это, в свою очередь, вносит искажения в количественное определение эффективности обогащения.The disadvantage of this method is that the system used has only a positive test for 1 gene (eg K.RAS, EGFR, BRAF genes), not taking into account all other genes. This approach can give an inaccurate estimate of enrichment, since not every fragment of the library containing the target gene will contain the qPCR amplicon sequence. This, in turn, distorts the quantification of beneficiation efficiency.

Наиболее близким к патентуемому является способ оценки обогащения NGS-библиотеки целевыми участками (US 8663924, В2, AGILENT TECHNOLOGIES INC [US]; ONG JOSEPH HOANG HAI HAPPE SCOTT, 04.03.2014 - прототип). Используемая система подразумевает использование повторяющихся последовательностей как отрицательный контроль для определения общего уровня обогащения целевыми фрагментами. Для оценки эффективности обогащения предложено проводить кПЦР реакцию на образцах до и после обогащения, используя отрицательный тест на повторяющиеся последовательности. Используются стандартные кривые для калибровки и измерения эффективности ПЦР реакций для каждого ампликона.The closest to the patent is a method for assessing the enrichment of an NGS library with target sites (US 8663924, B2, AGILENT TECHNOLOGIES INC [US]; ONG JOSEPH HOANG HAI HAPPE SCOTT, 03/04/2014 - prototype). The system used involves the use of repetitive sequences as a negative control to determine the overall level of enrichment in target fragments. To assess the efficiency of enrichment, it was proposed to carry out a qPCR reaction on samples before and after enrichment, using a negative test for repeated sequences. Standard curves are used to calibrate and measure the efficiency of PCR reactions for each amplicon.

Недостаток состоит в том, что известный способ не предполагает конкретный расчет эффективности обогащения, а лишь описывает экспериментальную процедуру как общий принцип, предлагая самим переводить полученную разность циклов отрицательного теста в эффективность обогащения. Кроме того, система использует последовательности заранее неизвестной специфичности к человеку.The disadvantage is that the known method does not imply a specific calculation of the enrichment efficiency, but only describes the experimental procedure as a general principle, suggesting that the obtained difference between the cycles of the negative test should be converted into the enrichment efficiency. In addition, the system uses sequences of previously unknown human specificity.

Так, праймеры на SINE повторы могут также давать продукт ПЦР на повторах других видов, что понижает специфичность ПЦР реакции в случае контаминации ДНК. Система не демонстрирует лучшую работу на повторяющихся последовательностях, чем на встречающихся один раз в геноме, и не демонстрирует расширенный предел по концентрациям ДНК на один кПЦР тест.Thus, primers for SINE repeats can also give a PCR product on repeats of other species, which lowers the specificity of the PCR reaction in the case of DNA contamination. The system does not perform better on repetitive sequences than on those occurring once in the genome, and does not demonstrate an extended limit on DNA concentrations per qPCR test.

Настоящее изобретение направлено на решение проблемы повышения точности определения эффективности обогащения NGS-библиотек до непосредственного секвенирования. Это позволяет отсеять неудавшиеся обогащения и, таким образом, сэкономить ресурсы. Кроме того, оно позволяет рассчитать необходимое количество данных высокопроизводительного секвенирования на один образец с учетом количественного определения эффективности обогащения.The present invention is directed to solving the problem of improving the accuracy of determining the efficiency of enrichment of NGS libraries prior to direct sequencing. This allows you to weed out unsuccessful enrichments and, thus, save resources. In addition, it allows you to calculate the amount of HPP data you need per sample while quantifying the enrichment efficiency.

Технический результат, достигаемый при осуществлении изобретения, заключается в:The technical result achieved by the implementation of the invention consists in:

- повышении точности оценки эффективности обогащения NGS-библиотеки за счет использования оригинальных праймеров, комплементарных повторяющимся последовательностям генома человека, которые не являются экзонами;- increasing the accuracy of assessing the efficiency of NGS library enrichment through the use of original primers complementary to repeating sequences of the human genome that are not exons;

- возможности определения количества целевых фрагментов обогащения NGS-библиотеки для секвенирования экзома человека, измеряемого в процентах от общего числа фрагментов NGS-библиотеки;- the ability to determine the number of target fragments of NGS-library enrichment for sequencing of human exome, measured as a percentage of the total number of NGS-library fragments;

- снижении необходимого количества ДНК на тест, что позволяет сэкономить общее количество образца NGS-библиотеки и, таким образом, улучшить общее качество секвенирования.- reducing the required amount of DNA per test, which allows you to save the total amount of the NGS library sample and thus improve the overall quality of sequencing.

Предложен метод оценки эффективности обогащения NGS-библиотеки участками экзонов (для секвенирования экзома человека), который подходит по-новому к кПЦР тесту участков, которые не должны обогащаться: вместо ПЦР на уникальные участки генома, не подвергающиеся обогащению, патентуемое изобретение использует повторяющиеся участки генома (повторы, имеющие траспозонную природу). Такие участки из-за их частой представленности в геноме (до 11% генома занимают идентичные повторы Alu) с почти 100% вероятностью остаются в обогащенной библиотеке (даже в случае недостижимой эффективности обогащения 99,9%).A method for assessing the efficiency of the NGS library enrichment with exon regions (for sequencing the human exome) is proposed, which approaches in a new way to the qPCR test of regions that should not be enriched: instead of PCR for unique regions of the genome that are not subject to enrichment, the patent invention uses repeating regions of the genome repetitions of a transposon nature). Due to their frequent representation in the genome (up to 11% of the genome are occupied by identical Alu repeats), such regions are almost 100% likely to remain in the enriched library (even in the case of an unattainable enrichment efficiency of 99.9%).

Сущность изобретения заключается в следующем.The essence of the invention is as follows.

Для определения эффективности обогащения NGS-библиотеки участками экзонов для секвенирования экзома человека проводят кПЦР с ДНК человека одной и той же NGS-библиотеки до и после процедуры ее обогащения. При проведении кПЦР реакций используют праймеры 5'-GGTGAAACCCCGTCTCTACTA-3' и 5'-GGTTCAAGCGATTCTCCTGCC-3', комплементарные повторяющимся последовательностям генома человека, которые не являются экзонами.To determine the efficiency of enriching an NGS library with regions of exons for sequencing the human exome, qPCR is performed with human DNA of the same NGS library before and after its enrichment procedure. When carrying out qPCR reactions, primers 5'-GGTGAAACCCCGTCTCTACTA-3 'and 5'-GGTTCAAGCGATTCTCCTGCC-3' are used, which are complementary to repeating sequences of the human genome that are not exons.

Каждую кПЦР реакцию проводят, по меньшей мере, с 50 пг ДНК NGS-библиотеки. Определяют эффективность кПЦР реакции и пороговые циклы флуоресцентного сигнала образцов NGS-библиотеки до и после процедуры обогащения. Затем вычисляют эффективность обогащения Э (%) NGS-библиотеки по формуле:Each qPCR reaction is performed with at least 50 pg of NGS library DNA. The efficiency of the qPCR reaction and the threshold cycles of the fluorescent signal of the NGS library samples before and after the enrichment procedure are determined. Then the efficiency of enrichment E (%) of the NGS library is calculated by the formula:

Figure 00000001
Figure 00000001

где: Е - эффективность кПЦР реакции с парой указанных праймеров на повторяющиеся последовательности генома человека;where: E is the efficiency of the qPCR reaction with a pair of the indicated primers for repeating sequences of the human genome;

Ct1, Ct2 - значения порогового цикла флуоресцентного сигнала кПЦР реакции для образца NGS-библиотеки после обогащения и до обогащения, соответственно.Ct1, Ct2 - values of the threshold cycle of the fluorescent signal of the qPCR reaction for the NGS library sample after enrichment and before enrichment, respectively.

Способ осуществляют следующим образом.The method is carried out as follows.

ПЦР в режиме реального времени производится в любом кПЦР приборе, способном детектировать канал FAM (метод оптимизирован, но не лимитирован использованием интеркалирующего в ДНК красителя SYBR Green I, длина волны возбуждения - 497 нм, флуоресценции - 521 нм).Real-time PCR is performed in any qPCR device capable of detecting the FAM channel (the method is optimized but not limited by the use of the SYBR Green I dye intercalating in DNA, excitation wavelength - 497 nm, fluorescence - 521 nm).

В случае демонстрируемых результатов, объем каждой реакции составляет 40 мкл (для минимизации ошибок пипетирования и лучшей чувствительности сигнала). Однако изобретение распространяется и на любые другие объемы ПЦР смеси, так как его принцип от этого не меняется. Приготовление ПЦР смеси производится по принципу общего раствора для всех ПЦР реакций одной ДНК матрицы (одного образца).In case of results shown, the volume of each reaction is 40 μL (to minimize pipetting errors and better signal sensitivity). However, the invention extends to any other volumes of the PCR mixture, since its principle does not change from this. The PCR mixture is prepared according to the principle of a common solution for all PCR reactions of one DNA template (one sample).

Таким образом, достигается одинаковая концентрация всех составляющих ПЦР реакции, включая ПЦР буфер, ДНК, полимеразу, dNTP. Праймеры добавляются отдельно в каждую пробирку одно- или многоканальной пипеткой. Объем праймеров (и концентрация) подбираются таким образом, чтобы минимизировать ошибку пипетирования.Thus, the same concentration of all components of the PCR reaction is achieved, including PCR buffer, DNA, polymerase, dNTP. Primers are added separately to each tube using a single or multichannel pipette. The primer volume (and concentration) is adjusted to minimize pipetting error.

Прямым результатом измерения ПЦР реакции являются пороговые циклы (Ct) образца до и после обогащения (Фиг. 1) и контроль без ДНК матрицы. На фиг. 1 представлен пример результатов кПЦР реакции на паре праймеров для образцов до и после обогащения (по два технических повтора), а также на контроле без ДНК матрицы. Пересечение кривых флуоресцентного сигнала с пороговым уровнем флуоресценции определяет значение пороговых циклов Ct. Видна согласованность технических повторов и разница в средних значениях пороговых циклов для образцов до и после обогащения. Видно отсутствие сигнала для контроля без ДНК матрицы.The direct result of measuring the PCR reaction are the threshold cycles (Ct) of the sample before and after enrichment (Fig. 1) and control without template DNA. FIG. 1 shows an example of qPCR reaction results on a pair of primers for samples before and after enrichment (two technical replicates), as well as on a control without a DNA template. The intersection of the fluorescence signal curves with the threshold fluorescence level determines the value of the threshold cycles Ct. One can see the consistency of technical replicates and the difference in the mean values of the threshold cycles for the samples before and after enrichment. There is no signal for control without DNA template.

Для каждой ПЦР реакции строится стандартная прямая, для определения эффективности реакции в данных условиях, для пересчета разницы циклов в разницу концентраций конкретных участков генома в NGS-библиотеке.For each PCR reaction, a standard straight line is constructed to determine the efficiency of the reaction under these conditions, to recalculate the difference in cycles into the difference in the concentrations of specific regions of the genome in the NGS library.

Общим результатом работы системы является конечная оценка эффективности обогащения Э (%) по предложенной формуле.The overall result of the system is the final estimate of the efficiency of enrichment E (%) according to the proposed formula.

При этом использующиеся реакции на повторы Alu являются ключевыми для определения уровня необогащенной ДНК с высокой точностью.At the same time, the used reactions to Alu repeats are key for determining the level of unenriched DNA with high accuracy.

Промежуточный результат обогащения представлен в виде разницы циклов и абсолютной разницы (Фиг. 2 и Фиг. 3):The intermediate enrichment result is presented in the form of cycle difference and absolute difference (Fig. 2 and Fig. 3):

Figure 00000002
Figure 00000002

где Со - концентрация фрагментов, амплифицируемых в конкретной кПЦР реакции в обогащенном образце;where Co is the concentration of fragments amplified in a specific qPCR reaction in an enriched sample;

Сн - концентрация фрагментов, амплифицируемых в конкретной кПЦР реакции в образце до обогащения;Cn is the concentration of fragments amplified in a particular qPCR reaction in the sample before enrichment;

Еi - эффективность конкретной кПЦР реакции (для конкретной пары праймеров);E i - the efficiency of a specific qPCR reaction (for a specific pair of primers);

ΔCti - разность пороговых циклов флуоресцентного сигнала для обогащенного образца и образца до обогащения.ΔCt i is the difference between the threshold cycles of the fluorescent signal for the enriched sample and the sample before enrichment.

Пределы ошибок - это стандартное отклонение повторов образцов, пересчитанное в общий интервал стандартного отклонения их разности:The error limits are the standard deviation of the replicates of the samples, recalculated into the total interval of the standard deviation of their difference:

Figure 00000003
Figure 00000003

где: σ1 - стандартное отклонение технических повторов пороговых циклов образца до обогащения для конкретной ПЦР реакции;where: σ 1 is the standard deviation of technical repeats of the threshold cycles of the sample before enrichment for a particular PCR reaction;

σ2 - стандартное отклонение технических повторов пороговых циклов образца после обогащения для конкретной ПЦР реакции;σ 2 - standard deviation of technical repetitions of the threshold cycles of the sample after enrichment for a specific PCR reaction;

σΣ - суммарный предел погрешности для измерения разности пороговых циклов кПЦР реакции.σ Σ is the total error limit for measuring the difference in the threshold cycles of the qPCR reaction.

Предлагаемый способ включает следующие этапы:The proposed method includes the following steps:

1. Перед проведением обогащения NGS-библиотеки (или смеси библиотек) отбирается образец необогащенной библиотеки (или смеси библиотек), в количестве 100 пг или более.1. Before carrying out the enrichment of the NGS library (or mixture of libraries), a sample of the unenriched library (or mixture of libraries) is selected, in an amount of 100 pg or more.

2. После обогащения, та же библиотека (или смесь библиотек) отбирается в количестве 100 пг или более.2. After enrichment, the same library (or a mixture of libraries) is selected in an amount of 100 pg or more.

3. Приготавливается кПЦР реакция с использованием3. Prepared qPCR reaction using

5'-GGTGAAACCCCGTCTCTACTA-3' и 5'-GGTTCAAGCGATTCTCCTGCC-3'.5'-GGTGAAACCCCGTCTCTACTA-3 'and 5'-GGTTCAAGCGATTCTCCTGCC-3'.

Общий объем одной реакции 40 мкл. Реакция собирается по рецепту:The total volume of one reaction is 40 μl. The reaction is collected according to the recipe:

Figure 00000004
Figure 00000004

Все компоненты кПЦР реакции, кроме праймеров, добавляются сразу на все пробирки ПЦР реакций в технических повторах (не менее двух на один образец). Праймеры добавляются по 5 мкл в каждую пробирку (лунку планшета). V берется из того расчета, чтобы на весь раствор ПЦР реакции добавлялось не менее 3 мкл ДНК матрицы.All components of the qPCR reaction, except for the primers, are added immediately to all tubes of the PCR reactions in technical repeats (at least two per sample). Primers are added 5 μl to each tube (plate well). V is taken from the calculation that at least 3 μl of DNA template is added to the entire PCR reaction solution.

4. Заранее вычисляется эффективность реакции кПЦР по стандартной прямой:4. The efficiency of the qPCR reaction along the standard straight line is calculated in advance:

Figure 00000005
Figure 00000005

где: Е - эффективность кПЦР реакции (экспоненциальный множитель);where: E is the efficiency of the qPCR reaction (exponential factor);

К - коэффициент наклона прямой стандартной калибровочной прямой кПЦР реакции (логарифм концентрации ДНК матрицы по горизонтальной оси, средний пороговый цикл флуоресцентного сигнала по вертикальной оси).K is the slope coefficient of the straight line of the standard calibration straight line of the qPCR reaction (logarithm of the matrix DNA concentration along the horizontal axis, the average threshold cycle of the fluorescent signal along the vertical axis).

5. кПЦР реакция ставится на программу 95°С 5 минут; 40 циклов: 95°С 20 секунд, 59°С 15 секунд, 72°С 25 секунд; кривая плавления от 45°С до 95°С, повышение на 0.5°С за 15 секунд. Измерение флуоресценции производится после каждой фазы элонгации (72°С). Канал детекции флуоресцентного сигнала FAM.5. qPCR reaction is put on the 95 ° C program for 5 minutes; 40 cycles: 95 ° C 20 seconds, 59 ° C 15 seconds, 72 ° C 25 seconds; melting curve from 45 ° C to 95 ° C, an increase of 0.5 ° C in 15 seconds. The measurement of fluorescence is performed after each elongation phase (72 ° C). FAM fluorescent signal detection channel.

6. Интерпретация данных начинается с проверки кривых плавления, температура плавления ампликона каждой реакции проверяется с референсной, если температура плавления ниже на более чем 2 градуса, это говорит об амплификации праймер-димеров; если выше, это говорит об амплификации неспецифичного продукта большой длины. Отрицательные контроли ПЦР на повторы могут иметь ту же или большую температуру плавления.6. Data interpretation begins with checking the melting curves, the melting point of the amplicon of each reaction is checked against the reference, if the melting temperature is lower by more than 2 degrees, this indicates the amplification of primer-dimers; if higher, this indicates the amplification of a long non-specific product. Repeat negative PCR controls may have the same melting point or higher.

Пример референсных (определенных в заведомо корректной ПЦР реакции) температур плавления:An example of reference (determined in a knowingly correct PCR reaction) melting temperatures:

Figure 00000006
Figure 00000006

7. Проверка Ct пороговых циклов для тестов и отрицательных контролей (без матрицы ДНК для амплификации). Отрицательный контроль должен либо не выходить ни на каком цикле (не иметь Ct), либо иметь другую температуру плавления на анализе кривой плавления.7. Checking Ct threshold cycles for tests and negative controls (without DNA template for amplification). The negative control must either not come out on any cycle (have no Ct), or have a different melting point on melting curve analysis.

8. Пороговое значение флуоресценции для определения Ct выставляется из соображений выше фона, но на этапе экспоненциального роста сигнала для всех кПЦР реакций. Вычисляется стандартное отклонение каждой ПЦР реакции по техническим повторам, вычисляется разность пороговых циклов для необогащенного и обогащенного образцов и суммарное отклонение по формуле выше. На фиг. 2 представлен пример разностей в пороговых циклах кПЦР реакций в образцах до и после обогащения с диапазоном стандартного отклонения.8. The threshold value of fluorescence for determining Ct is set for reasons higher than the background, but at the stage of exponential growth of the signal for all qPCR reactions. The standard deviation of each PCR reaction is calculated by technical repeats, the difference between the threshold cycles for the unenriched and enriched samples and the total deviation are calculated using the formula above. FIG. 2 shows an example of the differences in the threshold cycles of qPCR reactions in the samples before and after enrichment with a standard deviation range.

9. Подсчитывается абсолютная разница в концентрации фрагментов по формуле, представленной выше. На фиг. 3 представлен пример отношения концентраций амплифицируемых в ходе кПЦР фрагментов в образцах до и после обогащения. Эти значения вычисляются в данном пункте описанной процедуры изобретения. Положительные значения указывают на увеличение концентрации фрагментов после обогащения, а отрицательные значения - на уменьшение.9. Calculate the absolute difference in the concentration of the fragments using the formula above. FIG. 3 shows an example of the ratio of the concentrations of fragments amplified during qPCR in samples before and after enrichment. These values are calculated in this clause of the described procedure of the invention. Positive values indicate an increase in the concentration of fragments after enrichment, while negative values indicate a decrease.

10. Вычисляется эффективность обогащения Э (%) по формуле:10. The efficiency of enrichment E (%) is calculated by the formula:

Figure 00000007
Figure 00000007

Пример 1Example 1

Пункты 1-3, 5-7 не отличаются от описанных выше. Результат 4 пункта:Items 1-3, 5-7 do not differ from those described above. Result 4 points:

Figure 00000008
Figure 00000008

Результат 8 пункта:Result of 8 points:

Figure 00000009
Figure 00000009

Результат 9 пункта:Result of 9 points:

Figure 00000010
Figure 00000010

Результат 10 пункта: эффективность равна 79%, Реальная эффективность, измеренная после высокопроизводительного секвенирования, равно 80%.10 point result: efficiency is 79%, Actual efficiency measured after high throughput sequencing is 80%.

Пример 2Example 2

Проведено сравнение патентуемого способа с уже существующими методами, описанными в аналогах. Для этого были использованы дополнительные кПЦР реакции с праймерами, амплифицирующими участки экзонов и участки около экзонов. Используемые для этого пары праймеров, дополнительные к описанным в изобретении:A comparison of the patented method with already existing methods described in analogues is carried out. For this, we used additional qPCR reactions with primers that amplify regions of exons and regions near exons. Used for this pair of primers, in addition to those described in the invention:

Figure 00000011
Figure 00000011

Пункты 1-3, 5-7 не отличаются от описанных выше. Результат 4 пункта:Items 1-3, 5-7 do not differ from those described above. Result 4 points:

Figure 00000012
Figure 00000012

Результат 8 пункта:Result of 8 points:

Figure 00000013
Figure 00000013

«Нет» в таблице означает, что реакция не прошла (флуоресцентный сигнал не превзошел пороговое значение за 40 циклов ПЦР). Как видно на фиг. 4, кПЦР на неповторяющиеся (и не являющиеся экзонами) последовательности не прошел для 50 пг ДНК на одну кПЦР реакцию на обогащенной библиотеке (Е2, Е3). Как уже отмечалось, вероятность того, что на 50 пг ДНК обогащенной библиотеки найдется хотя бы 1 фрагмент, содержащий эту область полностью, значительно меньше 100%. Это демонстрирует, что методы, описанные в уровне техники, действительно имеют ограничение по количеству входящего материала, тогда как настоящее изобретение работает при концентрациях 1.2 пг/мкл исходной ДНК в ПЦР смеси.“No” in the table means that the reaction did not go through (the fluorescent signal did not exceed the threshold value in 40 PCR cycles). As seen in FIG. 4, qPCR for non-repeating (and non-exons) sequences failed for 50 pg DNA per qPCR reaction on an enriched library (E2, E3). As already noted, the probability that for 50 pg of DNA from an enriched library there is at least 1 fragment containing this region completely is significantly less than 100%. This demonstrates that the methods described in the prior art are indeed limited in the amount of input material, whereas the present invention operates at concentrations of 1.2 pg / μl of starting DNA in a PCR mixture.

Результат 9 пункта:Result of 9 points:

Figure 00000014
Figure 00000014

Результат 10 пункта:Result of 10 points:

Эффективность равна 68%. Реальная эффективность, измеренная после высокопроизводительного секвенирования, равно 70%.The efficiency is 68%. The actual efficiency measured after high throughput sequencing is 70%.

Таким образом, представленные данные подтверждают достижение технического результата в части повышения точности оценки эффективности обогащения NGS-библиотеки, возможности определения количества целевых фрагментов обогащения NGS-библиотеки для секвенирования экзома человека и снижения необходимого количества ДНК на тест.Thus, the presented data confirm the achievement of the technical result in terms of increasing the accuracy of assessing the efficiency of NGS library enrichment, the possibility of determining the number of target fragments of NGS library enrichment for sequencing the human exome and reducing the required amount of DNA per test.

--->--->

Список нуклеотидных последовательностейList of nucleotide sequences

“Способ определения эффективности обогащения NGS-библиотеки участками“Method for determining the efficiency of enrichment of NGS-library by regions

экзонов для секвенирования экзома человека”exons for sequencing the human exome ”

Листов 3 Sheets 3

Правообладатель:Copyright holder:

- Федеральное государственное автономное образовательное учреждение высшего- Federal State Autonomous Educational Institution of Higher

образования «Российский национальный исследовательский медицинскийeducation "Russian National Research Medical

университет имени Н.И.Пирогова» Министерства здравоохранения РоссийскойPirogov University "of the Ministry of Health of the Russian

Федерации (ФГАОУ ВО РНИМУ им. Н.И.Пирогова Минздрава России);Federation (FGAOU VO RNIMU named after N.I. Pirogov of the Ministry of Health of Russia);

Авторы: Кривой А.А. Authors: Krivoy A.A.

Черанев В.В. Cheranev V.V.

Коростин Д.О. D.O. Korostin

Москва, 2020 г.Moscow, 2020

Список используемых ДНК праймеров 5' → 3':List of used DNA primers 5 '→ 3':

Alu_FAlu_F

GGTGAAACCCCGTCTCTACTA GGTGAAACCCCGTCTCTACTA

Alu_RAlu_R

GGTTCAAGCGATTCTCCTGCC GGTTCAAGCGATTCTCCTGCC

RUNX2_FRUNX2_F

CGCATTCCTCATCCCAGTATGCGCATTCCTCATCCCAGTATG

RUNX2_RRUNX2_R

AAAGGACTTGGTGCAGAGTTCAGAAAGGACTTGGTGCAGAGTTCAG

PRKG1_FPRKG1_F

CCCACCGCCTTCGACATCCCACCGCCTTCGACAT

PRKG1_RPRKG1_R

CCTGCTTACTGTGGGCTCTTGCCTGCTTACTGTGGGCTCTTG

SMG1_FSMG1_F

CTCGCTTAACCAGACTCATCTACTGTCTCGCTTAACCAGACTCATCTACTGT

SMG1_RSMG1_R

ACTTGGCTCAGCTGTATGAAGGTACTTGGCTCAGCTGTATGAAGGT

PLAU_FPLAU_F

GTGGCCAAAAGACTCTGAGGGTGGCCAAAAGACTCTGAGG

PLAU_RPLAU_R

CCTCCACACACGTAGGTGACCCTCCACACACGTAGGTGAC

PLAU 3' UTR_FPLAU 3 'UTR_F

CAAATCTCCCTGGTGCTTGTCAAATCTCCCTGGTGCTTGT

PLAU 3' UTR_RPLAU 3 'UTR_R

CCTGCCCTACAGCTCTCCTACCTGCCCTACAGCTCTCCTA

PLAU Promoter_FPLAU Promoter_F

AGCTGGGCGAGGTAGAGAGTAGCTGGGCGAGGTAGAGAGT

PLAU Promoter_RPLAU Promoter_R

CAGCGTCTGGACTGAGGAATCAGCGTCTGGACTGAGGAAT

LINE1_FLINE1_F

AAAGCCGCTCAACTACATGGAAAGCCGCTCAACTACATGG

LINE1_RLINE1_R

TGCTTTGAATGCGTCCCAGAGTGCTTTGAATGCGTCCCAGAG

Adapter_FAdapter_F

TGTGAGCCAAGGAGTTGTGTGAGCCAAGGAGTTG

Adapter_RAdapter_R

GAACGACATGGCTACGAGAACGACATGGCTACGA

<---<---

Claims (5)

Способ определения эффективности обогащения NGS-библиотеки участками экзонов для секвенирования экзома человека, включающий проведение ПЦР реакций в режиме реального времени (кПЦР) с ДНК человека одной и той же NGS-библиотеки до и после процедуры ее обогащения, отличающийся тем, что при проведении кПЦР реакций используют праймеры 5'-GGTGAAACCCCGTCTCTACTA-3' и 5'-GGTTCAAGCGATTCTCCTGCC-3', комплементарные повторяющимся последовательностям генома человека, которые не являются экзонами, причем каждую кПЦР реакцию проводят, по меньшей мере, с 50 пг ДНК NGS-библиотеки, определяют эффективность кПЦР реакции и пороговые циклы флуоресцентного сигнала образцов NGS-библиотеки до и после процедуры обогащения, после чего эффективность обогащения NGS-библиотеки вычисляют по формуле:A method for determining the efficiency of enriching an NGS library with sections of exons for sequencing the human exome, including carrying out real-time PCR reactions (qPCR) with human DNA of the same NGS library before and after the procedure for its enrichment, characterized in that when qPCR reactions are performed use primers 5'-GGTGAAACCCCGTCTCTACTA-3 'and 5'-GGTTCAAGCGATTCTCCTGCC-3', complementary to repeating sequences of the human genome, which are not exons, and each qPCR reaction is carried out with at least 50 pg DNA NGS library, determine the efficiency of qPCR reactions and threshold cycles of the fluorescent signal of the NGS library samples before and after the enrichment procedure, after which the efficiency of the NGS library enrichment is calculated by the formula:
Figure 00000015
Figure 00000015
где: Э - эффективность обогащения NGS-библиотеки в %;where: E - efficiency of NGS-library enrichment in%; Е - эффективность кПЦР реакции с парой праймеров на повторяющиеся последовательности генома человека;E - efficiency of qPCR reaction with a pair of primers for repeating sequences of the human genome; Ct1, Ct2 - значения порогового цикла флуоресцентного сигнала кПЦР реакции для образца NGS-библиотеки после обогащения и до обогащения, соответственно.Ct1, Ct2 - values of the threshold cycle of the fluorescent signal of the qPCR reaction for the NGS library sample after enrichment and before enrichment, respectively.
RU2020118092A 2020-04-30 2020-04-30 Method of determining efficiency of enrichment of ngs library with exon sections for sequencing human exome RU2743586C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2020118092A RU2743586C1 (en) 2020-04-30 2020-04-30 Method of determining efficiency of enrichment of ngs library with exon sections for sequencing human exome

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2020118092A RU2743586C1 (en) 2020-04-30 2020-04-30 Method of determining efficiency of enrichment of ngs library with exon sections for sequencing human exome

Publications (1)

Publication Number Publication Date
RU2743586C1 true RU2743586C1 (en) 2021-02-20

Family

ID=74665965

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2020118092A RU2743586C1 (en) 2020-04-30 2020-04-30 Method of determining efficiency of enrichment of ngs library with exon sections for sequencing human exome

Country Status (1)

Country Link
RU (1) RU2743586C1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2414510C2 (en) * 2007-06-14 2011-03-20 Институт биохимии и генетики Уфимского научного центра РАН Method of amplifying specific nucleic acid fragments through recurrent chain reaction
WO2018165366A1 (en) * 2017-03-08 2018-09-13 President And Fellows Of Harvard College Methods of amplifying dna to maintain methylation status

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2414510C2 (en) * 2007-06-14 2011-03-20 Институт биохимии и генетики Уфимского научного центра РАН Method of amplifying specific nucleic acid fragments through recurrent chain reaction
WO2018165366A1 (en) * 2017-03-08 2018-09-13 President And Fellows Of Harvard College Methods of amplifying dna to maintain methylation status

Similar Documents

Publication Publication Date Title
US20220282303A1 (en) Methods for standardized sequencing of nucleic acids and uses thereof
JP4022600B2 (en) Method for determining nucleic acid amplification efficiency
JP2001314195A (en) Method of real time determination for nucleic acid by corrected efficiency
Dong et al. Interlaboratory assessment of droplet digital PCR for quantification of BRAF V600E mutation using a novel DNA reference material
Etlik et al. Development and validation of a cost-effective in-house method, tetra-primer ARMS PCR assay, in genotyping of seven clinically important point mutations
CN111518887A (en) Primer group, kit and method for detecting HLA-B1502 allele
EP3411819A1 (en) Method for reducing noise level of data set for a target analyte
CN107254543B (en) PCR primer combination, kit and real-time fluorescent quantitative detection method for detecting RhD mRNA spliceosome
Jackson et al. qPCR-based mitochondrial DNA quantification: influence of template DNA fragmentation on accuracy
JP2010017127A (en) Method for estimating target nucleic acid ratio
CN110218772A (en) A kind of Primer composition, kit, detection method and its application detecting microsatellite instability
CN108165629B (en) DNA point mutation quantitative detection method
Vanhauwaert et al. RT-qPCR gene expression analysis in zebrafish: Preanalytical precautions and use of expressed repetitive elements for normalization
RU2743586C1 (en) Method of determining efficiency of enrichment of ngs library with exon sections for sequencing human exome
CN110408612B (en) Protective agent for low-concentration DNA standard substance, preservation method and application
WO2021047175A1 (en) Quantitative analysis of gene copy number
Wang et al. Establishment of primary reference measurement procedures and reference materials for EGFR variant detection in non-small cell lung cancer
CN111088328A (en) Kit and detection method for high-throughput sequencing library quantitative detection
CN116377083A (en) Human DNA sample quantitative amplification system and application thereof
Atsumi et al. Eprobe-mediated screening system for somatic mutations in the KRAS locus
CN112513291A (en) Reaction mixtures, methods and kits for performing quantitative real-time PCR
CN111286503B (en) Aptamer and application thereof in PDGF-BB detection kit
KR101334072B1 (en) Methods and kits for the quantification of nucleic acids
Du et al. Performing Quantitative PCR after Chromatin Immunoprecipitation (ChIP) of Drosophila Antennal and Brain Samples
CN108070657B (en) DNA point mutation quantitative determination kit