RU2017137401A - Подавление ошибок в секвенированных фрагментах днк посредством применения избыточных прочтений с уникальными молекулярными индексами (umi) - Google Patents

Подавление ошибок в секвенированных фрагментах днк посредством применения избыточных прочтений с уникальными молекулярными индексами (umi) Download PDF

Info

Publication number
RU2017137401A
RU2017137401A RU2017137401A RU2017137401A RU2017137401A RU 2017137401 A RU2017137401 A RU 2017137401A RU 2017137401 A RU2017137401 A RU 2017137401A RU 2017137401 A RU2017137401 A RU 2017137401A RU 2017137401 A RU2017137401 A RU 2017137401A
Authority
RU
Russia
Prior art keywords
umi
double
physical
stranded
dna fragments
Prior art date
Application number
RU2017137401A
Other languages
English (en)
Other versions
RU2704286C2 (ru
RU2017137401A3 (ru
Inventor
Санте ГНЕРРЕ
Бюнсок ЦЗЮН
Эмрах КОСТЕМ
Алекс АРАВАНИС
Алекс СО
Сюйюй ЦАЙ
Чжихун ЧЖАН
Original Assignee
Иллюмина, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=55910388&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RU2017137401(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Иллюмина, Инк. filed Critical Иллюмина, Инк.
Publication of RU2017137401A publication Critical patent/RU2017137401A/ru
Publication of RU2017137401A3 publication Critical patent/RU2017137401A3/ru
Application granted granted Critical
Publication of RU2704286C2 publication Critical patent/RU2704286C2/ru

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/119Double strand sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/514Detection characterised by immobilisation to a surface characterised by the use of the arrayed oligonucleotides as identifier tags, e.g. universal addressable array, anti-tag or tag complement array

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Claims (110)

1. Способ секвенирования молекул нуклеиновых кислот из образца с применением уникальных молекулярных индексов (UMI), где каждый уникальный молекулярный индекс (UMI) представляет собой олигонуклеотидную последовательность, которая может быть использована для идентификации индивидуальной молекулы фрагмента двухцепочечной ДНК, содержащейся в образце, включающий:
(a) прикрепление адапторов к обоим концам фрагментов двухцепочечной ДНК, находящейся в образце, где каждый из адапторов включает двухцепочечную гибридизованную область, одноцепочечное 5'-плечо, одноцепочечное 3'-плечо и физический UMI на одной цепочке или на каждой цепочке адапторов, в результате чего получают продукты присоединения адаптора к ДНК;
(b) амплификацию обеих цепочек продуктов присоединения адаптора к ДНК с образованием множества амплифицированных полинуклеотидов;
(c) секвенирование множества амплифицированных полинуклеотидов, в результате чего получают множество прочтений, каждое из которых ассоциировано с физическим UMI;
(d) идентификацию множества физических UMI, ассоциированных с множеством прочтений;
(e) идентификацию множества виртуальных UMI, ассоциированных с множеством прочтений, где каждый виртуальный UMI представляет собой последовательность, находящуюся во фрагменте ДНК в образце; и
(f) определение последовательностей фрагментов двухцепочечной ДНК, находящейся в образце, с использованием множества прочтений, полученных в этапе (с), множества физических UMI, идентифицированных при выполнении этапа (d), и множества виртуальных UMI, идентифицированных в этапе (е).
2. Способ по п. 1, где этап (f) включает:
для каждого из одного или более фрагментов двухцепочечной ДНК, находящейся в образце, объединение (i) прочтений, имеющих первый физический UMI и по меньшей мере один виртуальный UMI, и (ii) прочтений, имеющих второй физический UMI и по меньшей мере один виртуальный UMI, для определения консенсусной нуклеотидной последовательности; и
для каждого из одного или более фрагментов двухцепочечной ДНК, находящейся в образце, определение последовательности, исходя из консенсусной нуклеотидной последовательности.
3. Способ по п. 1, в котором множество физических UMI включает случайные UMI.
4. Способ по п. 1, в котором множество физических UMI включает неслучайные UMI.
5. Способ по п. 4, в котором каждый неслучайный UMI отличается от любого другого неслучайного UMI, находящихся в адапторах, по меньшей мере двумя нуклеотидами в соответствующих положениях последовательности неслучайных UMI.
6. Способ по п. 5, в котором множество физических UMI включает не более чем приблизительно 10000 уникальных неслучайных UMI.
7. Способ по п. 6, в котором множество физических UMI включает не более чем приблизительно 1000 уникальных неслучайных UMI.
8. Способ по п. 7, в котором множество физических UMI включает не более чем приблизительно 500 уникальных неслучайных UMI.
9. Способ по п. 8, в котором множество физических UMI включает не более чем приблизительно 100 уникальных неслучайных UMI.
10. Способ по п. 9, в котором множество физических UMI включает приблизительно 96 уникальных неслучайных UMI.
11. Способ по п. 1, в котором прикрепление адапторов к обоим концам фрагментов двухцепочечной ДНК включает связывание адапторов с обоими концами фрагментов двухцепочечной ДНК.
12. Способ по п. 1, в котором этап (f) включает применение прочтений, имеющих общий физический UMI и общий виртуальный UMI, для определения последовательности фрагмента ДНК образца.
13. Способ по п. 1, в котором множество физических UMI включает менее 12 нуклеотидов.
14. Способ по п. 13, в котором множество UMI включает не более 6 нуклеотидов.
15. Способ по п. 13, в котором множество UMI включает не более 4 нуклеотидов.
16. Способ по п. 1, в котором каждый из адапторов включает физический UMI на каждой цепочке адапторов в двухцепочечной гибридизованной области.
17. Способ по п. 16, в котором физический UMI находится на конце или вблизи конца двухцепочечной гибридизованной области, причем конец двухцепочечной гибридизованной области противоположен 3'-плечу или 5'-плечу.
18. Способ по п. 17, в котором физический UMI находится на конце двухцепочечной гибридизованной области или на расстоянии одного нуклеотида от конца двухцепочечной гибридизованной области.
19. Способ по п. 18, в котором каждый из адапторов включает в двухцепочечной гибридизованной области тринуклеотид 5'-TGG-3' или тринуклеотид 3-АСС-5', соседствующий с физическим UMI.
20. Способ по п. 19, в котором каждый из адапторов включает последовательность праймера прочтения на каждой цепочке двухцепочечной гибридизованной области.
21. Способ по п. 1, в котором каждый из адапторов включает физический UMI только на одной из цепочек адапторов на одноцепочечном 5'-плече или одноцепочечном 3'-плече.
22. Способ по п. 21, в котором этап (f) включает:
(i) объединение прочтений, имеющих один и тот же первый физический UMI, в первую группу с целью получения первой консенсусной нуклеотидной последовательности;
(ii) объединение прочтений, имеющих один и тот же второй физический UMI, во вторую группу с целью получения второй консенсусной нуклеотидной последовательности; и
(iii) определение из первой и второй консенсусных нуклеотидных последовательностей последовательности одного из фрагментов двухцепочечной ДНК, содержащихся в образце.
23. Способ по п. 22, в котором этап (iii) включает: (1) получение третьей консенсусной нуклеотидной последовательности из информации о местоположении и информации о последовательности первой и второй консенсусных нуклеотидных последовательностей, и (2) определение последовательности одного из фрагментов двухцепочечной ДНК из третьей консенсусной нуклеотидной последовательности.
24. Способ по п. 21, в котором этап (е) включает идентификацию множества виртуальных UMI, причем каждый из адапторов включает физический UMI только на одноцепочечном 5'-плече или одноцепочечном 3'-плече.
25. Способ по п. 24, в котором этап (f) включает:
(i) объединение прочтений, имеющих первый физический UMI и по меньшей мере один виртуальный UMI в направлении прочтения, и прочтений, имеющих второй физический UMI и по меньшей мере один виртуальный UMI в направлении прочтения, для определения консенсусной нуклеотидной последовательности; и
(ii) определение последовательности одного из фрагментов двухцепочечной ДНК, содержащихся в образце, на основании данных консенсусной нуклеотидной последовательности.
26. Способ по п. 1, в котором каждый из адапторов включает физический UMI на каждой цепочке адапторов в двухцепочечной области адапторов, причем физический UMI одной цепочки комплементарен физическому UMI другой цепочки.
27. Способ по п. 26, в котором этап (f) включает:
(i) объединение прочтений, имеющих первый физический UMI, по меньшей мере один виртуальный UMI и второй физический UMI в направлении 5'-3', и прочтений, имеющих второй физический UMI, по меньшей мере один виртуальный UMI и первый физический UMI в направлении 5'-3', для определения консенсусной нуклеотидной последовательности; и
(ii) определение последовательности одного из фрагментов двухцепочечной ДНК, содержащихся в образце, на основании данных консенсусной нуклеотидной последовательности.
28. Способ по п. 1, в котором каждый из адапторов включает первый физический UMI на 3'-плече адаптора и второй физический UMI на 5'-плече адаптора, причем первый физический UMI и второй физический UMI не комплементарны друг другу.
29. Способ по п. 28, в котором этап (f) включает:
(i) объединение прочтений, имеющих первый физический UMI, по меньшей мере один виртуальный UMI и второй физический UMI в направлении 5'-3', и прочтений, имеющих третий физический UMI, по меньшей мере один виртуальный UMI и четвертый физический UMI в направлении 5'-3', для определения консенсусной нуклеотидной последовательности; и
(ii) определение последовательности одного из фрагментов двухцепочечной ДНК, содержащихся в образце, на основании данных консенсусной нуклеотидной последовательности.
30. Способ по п. 1, в котором по меньшей мере некоторые из виртуальных UMI получены из подпоследовательностей, находящихся на концах или вблизи концов фрагментов двухцепочечной ДНК, содержащихся в образце.
31. Способ по п. 1, в котором один или более физических UMI и/или один или более виртуальных UMI уникальным образом ассоциированы с фрагментом двухцепочечной ДНК, содержащимся в образце.
32. Способ по п. 1, в котором фрагменты двухцепочечной ДНК, содержащиеся в образце, включают более приблизительно 1000 фрагментов ДНК.
33. Способ по п. 1, в котором множество виртуальных UMI включают UMI, содержащие от приблизительно 6 п.о. до приблизительно 24 п.о. (пар оснований).
34. Способ по п. 33, в котором множество виртуальных UMI включают UMI, содержащие от приблизительно 6 п.о. до приблизительно 10 п.о.
35. Способ по п. 1, в котором получение множества прочтений в операции (с) включает: получение двух прочтений парных концов от каждого из амплифицированных полинуклеотидов, где два прочтения парных концов включают длинное прочтение и короткое прочтение, причем длинное прочтение имеет большую длину, чем короткое прочтение.
36. Способ по п. 35, в котором этап (f) включает:
объединение пар прочтений, ассоциированных с первым физическим UMI, в первую группу и объединение пар прочтений, ассоциированных со вторым физическим UMI, во вторую группу, где первый и второй физические UMI уникальным образом ассоциированы с двухцепочечным фрагментом, находящимся в образце; и
определение последовательности двухцепочечного фрагмента, содержащегося в образце, на основании информации о последовательности длинных прочтений, имеющихся в первой группе, и информации о последовательности длинных прочтений, имеющихся во второй группе.
37. Способ по п. 35, в котором длина длинного прочтения составляет приблизительно 500 п.о. или более.
38. Способ по п. 35, в котором длина короткого прочтения составляет приблизительно 50 п.о. или менее.
39. Способ по п. 1, отличающийся тем, что способ включает подавление ошибок, возникающих при выполнении одной или более из следующих операций: ПЦР, создания библиотеки, объединения в кластеры и секвенирования.
40. Способ по п. 1, в котором амплифицированные полинуклеотиды включают аллели с аллельными частотами, составляющими приблизительно менее 1%.
41. Способ по п. 40, в котором амплифицированные полинуклеотиды включают молекулу внеклеточной ДНК, образованную в опухоли, и аллель является индикатором опухоли.
42. Способ по п. 1, в котором секвенирование множества амплифицированных полинуклеотидов включает получение прочтений, содержащих по меньшей мере приблизительно 100 п.о.
43. Способ получения дуплексного адаптора секвенирования, имеющего физический UMI на каждой цепочке, где способ включает:
предоставление предварительного адаптора секвенирования, включающего двухцепочечную гибридизованную область, два одноцепочечных плеча и липкий конец, включающий 5'-CCANNNNANNNNTGG-3' на конце двухцепочечной гибридизованной области, отстоящий еще дальше от двух одноцепочечных плеч;
достройку одной цепочки двухцепочечной гибридизованной области с использованием в качестве матрицы липкого конца, в результате чего образуется продукт достройки; и
применение рестрикционного фермента Хсm1 для расщепления двухцепочечного конца продукта достройки, в результате чего образуется дуплексный адаптор секвенирования, имеющий на каждой цепочке физический UMI.
44. Способ по п. 43, в котором предварительный адаптор секвенирования содержит на каждой цепочке последовательность праймера прочтения.
45. Компьютерный программный продукт, включающий энергонезависимый машиночитаемый носитель, на котором хранится программный код, выполнение которого одним или более процессорами компьютерной системы приводит к осуществлению компьютерной системой способа получения информации о строении интересующей последовательности, находящейся в образце; в способе применяют уникальные молекулярные индексы (UMI), которые представляют собой олигонуклеотидные последовательности, которые могут быть использованы для идентификации индивидуальных молекул фрагментов двухцепочечной ДНК, содержащихся в образце, причем программный код включает:
код для получения прочтений множества амплифицированных полинуклеотидов, где множество амплифицированных полинуклеотидов получено амплификацией фрагментов двухцепочечной ДНК, содержащейся в образце, содержащем интересующую последовательность, и присоединением адапторов к фрагментам двухцепочечной ДНК;
код для идентификации множества физических UMI в прочтениях множества амплифицированных полинуклеотидов, где каждый физический UMI находится в адапторе, присоединенном к одному из фрагментов двухцепочечной ДНК;
код для идентификации множества виртуальных UMI в прочтениях множества амплифицированных полинуклеотидов, где каждый виртуальный UMI находится в индивидуальной молекуле одного из фрагментов двухцепочечной ДНК; и
код для определения последовательностей фрагментов двухцепочечной ДНК на основании прочтений множества амплифицированных полинуклеотидов, множества физических UMI и множества виртуальных UMI, что приводит к уменьшению погрешностей в прочитанных последовательностях фрагментов двухцепочечной ДНК.
46. Компьютерный программный продукт по п. 45, в котором каждый из адапторов включает двухцепочечную гибридизованную область, одноцепочечное 5'-плечо, одноцепочечное 3'-плечо и физический уникальный молекулярный индекс (UMI) на одной цепочке или на каждой цепочке адапторов.
47. Компьютерный программный продукт по п. 45, в котором код для определения последовательностей фрагментов двухцепочечной ДНК включает:
(i) код для объединения прочтений, имеющих один и тот же первый физический UMI, в первую группу с целью получения первой консенсусной нуклеотидной последовательности;
(ii) код для объединения прочтений, имеющих один и тот же второй физический UMI, во вторую группу с целью получения второй консенсусной нуклеотидной последовательности; и
(iii) код для определения последовательности одного из фрагментов двухцепочечной ДНК, содержащихся в образце, на основании данных первой и второй консенсусных нуклеотидных последовательностей.
48. Компьютерный программный продукт по п. 45, в котором код для определения последовательностей фрагментов двухцепочечной ДНК включает:
(i) код для объединения прочтений последовательности, имеющих первый физический UMI, по меньшей мере один виртуальный UMI и второй физический UMI в направлении 5'-3', и прочтений последовательности, имеющих второй физический UMI, по меньшей мере один виртуальный UMI и первый физический UMI в направлении 5'-3', для определения консенсусной нуклеотидной последовательности; и
(ii) код для определения последовательности одного из фрагментов двухцепочечной ДНК, содержащихся в образце, на основании данных консенсусной нуклеотидной последовательности.
49. Компьютерная система, включающая:
один или более процессоров;
системную память; и
один или более машиночитаемых носителей для хранения информации, на которых хранятся инструкции, которые способен выполнять компьютер, при выполнении которых компьютерная система осуществляет способ получения информации о структуре интересующей последовательности, находящейся в образце, причем способ включает применение уникальных молекулярных индексов (UMI), которые представляют собой олигонуклеотидные последовательности, которые могут быть использованы для идентификации индивидуальных молекул фрагментов двухцепочечной ДНК, содержащихся в образце, где инструкции включают:
получение прочтений множества амплифицированных полинуклеотидов, где множество амплифицированных полинуклеотидов получено амплификацией фрагментов двухцепочечной ДНК, содержащейся в образце, содержащем интересующую последовательность, и присоединением адапторов к фрагментам двухцепочечной ДНК;
идентификацию множества физических UMI в полученных прочтениях множества амплифицированных полинуклеотидов, где каждый физический UMI находится в адапторе, присоединенном к одному из фрагментов двухцепочечной ДНК;
идентификацию множества виртуальных UMI в полученных прочтениях множества амплифицированных полинуклеотидов, где каждый виртуальный UMI находится в индивидуальной молекуле одного из фрагментов двухцепочечной ДНК; и
определение последовательностей фрагментов двухцепочечной ДНК с использованием последовательностей множества амплифицированных полинуклеотидов, множества физических UMI и множества виртуальных UMI, что приводит к уменьшению погрешностей в прочитанных последовательностях фрагментов двухцепочечной ДНК.
50. Компьютерная система по п. 49, в которой определение последовательностей фрагментов двухцепочечной ДНК включает:
(i) объединение прочтений, имеющих один и тот же первый физический UMI, в первую группу с целью получения первой консенсусной нуклеотидной последовательности;
(ii) объединение прочтений, имеющих один и тот же второй физический UMI, во вторую группу с целью получения второй консенсусной нуклеотидной последовательности; и
(iii) определение из первой и второй консенсусных нуклеотидных последовательностей последовательности одного из фрагментов двухцепочечной ДНК.
51. Компьютерная система по п. 49, в которой определение последовательностей фрагментов двухцепочечной ДНК включает:
(i) объединение прочтений, имеющих первый физический UMI, по меньшей мере один виртуальный UMI и второй физический UMI в направлении 5'-3', и прочтений, имеющих второй физический UMI, по меньшей мере один виртуальный UMI и первый физический UMI в направлении 5'-3', для определения консенсусной нуклеотидной последовательности; и
(ii) определение последовательности одного из фрагментов двухцепочечной ДНК из консенсусной нуклеотидной последовательности.
52. Способ секвенирования молекул нуклеиновых кислот из образца, включающий:
(a) присоединение адапторов к обоим концам фрагментов двухцепочечной ДНК, находящейся в образце,
где каждый из адапторов включает двухцепочечную гибридизованную область, одноцепочечное 5'-плечо, одноцепочечное 3'-плечо и физический уникальный молекулярный индекс (UMI) на одноцепочечном 5'-плече или одноцепочечном 3'-плече, и
где UMI представляет собой олигонуклеотидную последовательность, которая может быть использована для идентификации индивидуальной молекулы фрагмента двухцепочечной ДНК, содержащейся в образце;
(b) амплификацию обеих цепочек продуктов лигирования, полученных при выполнении этапа (а), в результате чего получают множество одноцепочечных амплифицированных полинуклеотидов;
(c) секвенирование множества амплифицированных полинуклеотидов, в результате чего получают множество прочтений, каждое из которых ассоциировано с физическим UMI;
(d) идентификацию множества физических UMI, ассоциированных с множеством прочтений; и
(e) определение последовательностей фрагментов двухцепочечной ДНК, находящейся в образце, с использованием множества последовательностей, полученных при выполнении этапа (с), и множества физических UMI, идентифицированных при выполнении этапа (d).
53. Способ секвенирования молекул нуклеиновых кислот из образца, включающий:
(а) присоединение адапторов к обоим концам фрагментов двухцепочечной ДНК, находящейся в образце,
где каждый из адапторов включает двухцепочечную гибридизованную область, одноцепочечное 5'-плечо, одноцепочечное 3'-плечо и физический уникальный молекулярный индекс (UMI), содержащий менее 12 нуклеотидов, на одной цепочке или на каждой цепочке адапторов,
где UMI представляет собой олигонуклеотидную последовательность, которая может быть использована для идентификации индивидуальной молекулы фрагмента двухцепочечной ДНК, содержащейся в образце;
(b) амплификацию обеих цепочек продуктов лигирования, полученных при выполнении этапа (а), в результате чего получают множество одноцепочечных амплифицированных полинуклеотидов, каждый из которых включает физический UMI;
(c) секвенирование множества амплифицированных полинуклеотидов, в результате чего получают множество прочтений, каждое из которых ассоциировано с физическим UMI;
(d) идентификацию множества физических UMI, ассоциированных с множеством прочтений; и
(e) определение последовательностей фрагментов двухцепочечной ДНК, находящейся в образце, с использованием множества прочтений, полученных при выполнении этапа (с), и множества физических UMI, идентифицированных при выполнении этапа (d).
RU2017137401A 2015-04-28 2016-04-20 Подавление ошибок в секвенированных фрагментах днк посредством применения избыточных прочтений с уникальными молекулярными индексами (umi) RU2704286C2 (ru)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201562153699P 2015-04-28 2015-04-28
US62/153,699 2015-04-28
US201562193469P 2015-07-16 2015-07-16
US62/193,469 2015-07-16
US201562269485P 2015-12-18 2015-12-18
US62/269,485 2015-12-18
PCT/US2016/028430 WO2016176091A1 (en) 2015-04-28 2016-04-20 Error suppression in sequenced dna fragments using redundant reads with unique molecular indices (umis)

Publications (3)

Publication Number Publication Date
RU2017137401A true RU2017137401A (ru) 2019-05-28
RU2017137401A3 RU2017137401A3 (ru) 2019-05-28
RU2704286C2 RU2704286C2 (ru) 2019-10-25

Family

ID=55910388

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017137401A RU2704286C2 (ru) 2015-04-28 2016-04-20 Подавление ошибок в секвенированных фрагментах днк посредством применения избыточных прочтений с уникальными молекулярными индексами (umi)

Country Status (20)

Country Link
US (3) US10844428B2 (ru)
EP (3) EP3736341B1 (ru)
JP (1) JP6685324B2 (ru)
KR (1) KR102091312B1 (ru)
CN (2) CN108138227B (ru)
AU (3) AU2016256351B2 (ru)
BR (1) BR112017024118A2 (ru)
CA (2) CA3109403A1 (ru)
DK (2) DK3289097T4 (ru)
ES (2) ES2961338T3 (ru)
FI (2) FI3289097T4 (ru)
HK (1) HK1244513A1 (ru)
IL (3) IL294600B2 (ru)
MX (3) MX2017013775A (ru)
MY (1) MY181983A (ru)
NZ (1) NZ736609A (ru)
RU (1) RU2704286C2 (ru)
SG (2) SG10202006185QA (ru)
WO (1) WO2016176091A1 (ru)
ZA (1) ZA201707231B (ru)

Families Citing this family (124)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US10083273B2 (en) 2005-07-29 2018-09-25 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
EP2473638B1 (en) 2009-09-30 2017-08-09 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
CA2798758C (en) 2010-05-18 2019-05-07 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
JP6328934B2 (ja) 2010-12-22 2018-05-23 ナテラ, インコーポレイテッド 非侵襲性出生前親子鑑定法
AU2011358564B9 (en) 2011-02-09 2017-07-13 Natera, Inc Methods for non-invasive prenatal ploidy calling
WO2012129363A2 (en) 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
CN110016499B (zh) 2011-04-15 2023-11-14 约翰·霍普金斯大学 安全测序系统
PT3363901T (pt) 2012-02-17 2021-01-22 Hutchinson Fred Cancer Res Composições e métodos para identificar mutações com precisão
EP4234713A3 (en) 2012-03-20 2024-02-14 University Of Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing
EP4036247B1 (en) 2012-09-04 2024-04-10 Guardant Health, Inc. Methods to detect rare mutations and copy number variation
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US11913065B2 (en) 2012-09-04 2024-02-27 Guardent Health, Inc. Systems and methods to detect rare mutations and copy number variation
CN104956225B (zh) 2012-10-29 2018-10-02 约翰·霍普金斯大学 卵巢和子宫内膜癌的帕帕尼科拉乌测试
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
US10767222B2 (en) 2013-12-11 2020-09-08 Accuragen Holdings Limited Compositions and methods for detecting rare sequence variants
US11286519B2 (en) 2013-12-11 2022-03-29 Accuragen Holdings Limited Methods and compositions for enrichment of amplification products
US11859246B2 (en) 2013-12-11 2024-01-02 Accuragen Holdings Limited Methods and compositions for enrichment of amplification products
ES2660989T3 (es) 2013-12-28 2018-03-27 Guardant Health, Inc. Métodos y sistemas para detectar variantes genéticas
CN106460070B (zh) 2014-04-21 2021-10-08 纳特拉公司 检测染色体片段中的突变和倍性
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
US11286531B2 (en) 2015-08-11 2022-03-29 The Johns Hopkins University Assaying ovarian cyst fluid
CA2999902A1 (en) 2015-10-09 2017-04-13 Accuragen Holdings Limited Methods and compositions for enrichment of amplification products
US11332784B2 (en) 2015-12-08 2022-05-17 Twinstrand Biosciences, Inc. Adapters, methods, and compositions for duplex sequencing
EP3390668A4 (en) 2015-12-17 2020-04-01 Guardant Health, Inc. METHODS OF DETERMINING THE NUMBER OF TUMOR GENE COPIES BY ACELLULAR DNA ANALYSIS
CN108474026A (zh) * 2016-01-29 2018-08-31 豪夫迈·罗氏有限公司 用于核酸测序的新的衔接子和使用方法
US11514289B1 (en) * 2016-03-09 2022-11-29 Freenome Holdings, Inc. Generating machine learning models using genetic data
US11384382B2 (en) 2016-04-14 2022-07-12 Guardant Health, Inc. Methods of attaching adapters to sample nucleic acids
EP3443066A4 (en) 2016-04-14 2019-12-11 Guardant Health, Inc. EARLY DETECTION METHODS FOR CANCER
EP3458586B1 (en) * 2016-05-16 2022-12-28 Accuragen Holdings Limited Method of improved sequencing by strand identification
US11708574B2 (en) 2016-06-10 2023-07-25 Myriad Women's Health, Inc. Nucleic acid sequencing adapters and uses thereof
EP3478856B1 (en) 2016-06-30 2021-01-27 Grail, Inc. Differential tagging of rna for preparation of a cell-free dna/rna sequencing library
CA3033749A1 (en) 2016-08-15 2018-02-22 Accuragen Holdings Limited Compositions and methods for detecting rare sequence variants
WO2018067517A1 (en) 2016-10-04 2018-04-12 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US10011870B2 (en) * 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
WO2018119399A1 (en) * 2016-12-23 2018-06-28 Grail, Inc. Methods for high efficiency library preparation using double-stranded adapters
CN110741096B (zh) 2016-12-28 2023-07-14 奎斯特诊断投资有限责任公司 用于检测循环肿瘤dna的组合物和方法
CN116497103A (zh) * 2017-01-18 2023-07-28 伊鲁米那股份有限公司 制备测序衔接子的方法和对核酸分子进行测序的方法
US10752946B2 (en) 2017-01-31 2020-08-25 Myriad Women's Health, Inc. Methods and compositions for enrichment of target polynucleotides
WO2018144216A1 (en) * 2017-01-31 2018-08-09 Counsyl, Inc. Methods and compositions for enrichment of target polynucleotides
WO2018144159A1 (en) * 2017-01-31 2018-08-09 Counsyl, Inc. Capture probes using positive and negative strands for duplex sequencing
US20180223350A1 (en) * 2017-02-08 2018-08-09 Integrated Dna Technologies, Inc. Duplex adapters and duplex sequencing
US10894976B2 (en) 2017-02-21 2021-01-19 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
WO2018183918A1 (en) * 2017-03-30 2018-10-04 Grail, Inc. Enhanced ligation in sequencing library preparation
WO2018183942A1 (en) * 2017-03-31 2018-10-04 Grail, Inc. Improved library preparation and use thereof for sequencing-based error correction and/or variant identification
US11118222B2 (en) 2017-03-31 2021-09-14 Grail, Inc. Higher target capture efficiency using probe extension
CA3060369A1 (en) 2017-05-01 2018-11-08 Illumina, Inc. Optimal index sequences for multiplex massively parallel sequencing
AU2018266377B2 (en) 2017-05-08 2024-06-20 Illumina, Inc. Universal short adapters for indexing of polynucleotide samples
US20200080143A1 (en) * 2017-05-14 2020-03-12 Foresee Genomic Ltd Dna construct for sequencing and method for preparing the same
US11702654B2 (en) * 2017-06-20 2023-07-18 Illumina, Inc. Methods and compositions for addressing inefficiencies in amplification reactions
CA3068273A1 (en) * 2017-06-21 2018-12-27 Bluedot Llc Systems and methods for identification of nucleic acids in a sample
EP3545106B1 (en) * 2017-08-01 2022-01-19 Helitec Limited Methods of enriching and determining target nucleotide sequences
CN111051511A (zh) 2017-08-04 2020-04-21 十亿至一公司 用于与生物靶相关的表征的靶相关分子
US11519024B2 (en) 2017-08-04 2022-12-06 Billiontoone, Inc. Homologous genomic regions for characterization associated with biological targets
CA3202766A1 (en) 2017-08-04 2019-02-07 Billiontoone, Inc. Sequencing output determination and analysis with target-associated molecules in quantification associated with biological targets
MX2020001575A (es) 2017-08-07 2020-11-18 Univ Johns Hopkins Materiales y métodos para evaluar y tratar el cáncer.
US11447818B2 (en) 2017-09-15 2022-09-20 Illumina, Inc. Universal short adapters with variable length non-random unique molecular identifiers
JP7208230B2 (ja) 2017-10-09 2023-01-18 プソマーゲン, インコーポレイテッド 核酸配列を特性決定するための単一分子シーケンシング及び固有の分子識別子
CN107604046B (zh) * 2017-11-03 2021-08-24 上海交通大学 用于微量dna超低频突变检测的双分子自校验文库制备及杂交捕获的二代测序方法
CA3202587A1 (en) * 2017-11-06 2019-05-09 Illumina, Inc Nucleic acid indexing techniques
SG11202003885UA (en) 2017-11-08 2020-05-28 Twinstrand Biosciences Inc Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
KR101967879B1 (ko) * 2017-11-30 2019-04-10 사회복지법인 삼성생명공익재단 핵산 서열분석에서 uid 핵산 서열의 순결도를 측정하는 방법
CN110870016A (zh) * 2017-11-30 2020-03-06 伊鲁米那股份有限公司 用于序列变体呼出的验证方法和系统
KR20200106179A (ko) 2018-01-05 2020-09-11 빌리언투원, 인크. 서열분석 기반 어세이의 유효성을 보장하기 위한 품질 관리 주형
US11203782B2 (en) 2018-03-29 2021-12-21 Accuragen Holdings Limited Compositions and methods comprising asymmetric barcoding
EP3781713A4 (en) * 2018-04-16 2022-01-12 Memorial Sloan-Kettering Cancer Center SYSTEMS AND METHODS FOR DETECTING CANCER THROUGH CFDNA SCREENING
EP3788170A1 (en) * 2018-05-03 2021-03-10 Becton, Dickinson and Company Molecular barcoding on opposite transcript ends
CN108642173B (zh) * 2018-05-18 2022-03-22 中国人民解放军陆军军医大学第一附属医院 一种无创检测slc26a4基因突变的方法和试剂盒
CN108531583B (zh) * 2018-05-18 2022-05-17 中国人民解放军陆军军医大学第一附属医院 用于无创检测mitf基因突变的引物组合及检测方法
CN108841946B (zh) * 2018-05-18 2022-03-22 中国人民解放军陆军军医大学第一附属医院 一种无创检测gjb2基因突变的方法,试剂盒及其制备方法
CN108949951B (zh) * 2018-05-18 2022-01-28 中国人民解放军陆军军医大学第一附属医院 一种同时无创检测gjb2和slc26a4基因突变的方法和试剂盒
CN108486230B (zh) * 2018-05-18 2022-02-08 中国人民解放军陆军军医大学第一附属医院 用于无创检测mitf基因突变的试剂盒及其制备方法
CN108753934B (zh) * 2018-05-18 2022-01-28 中国人民解放军陆军军医大学第一附属医院 一种检测基因突变的方法、试剂盒及其制备方法
CN108949941A (zh) * 2018-06-25 2018-12-07 北京莲和医学检验所有限公司 低频突变检测方法、试剂盒和装置
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
CN110669823B (zh) * 2018-07-03 2022-05-24 中国医学科学院肿瘤医院 一种同时检测多种肝癌常见突变的ctDNA文库构建和测序数据分析方法
GB201810901D0 (en) * 2018-07-03 2018-08-15 Ucb Biopharma Sprl Method
WO2020014693A1 (en) 2018-07-12 2020-01-16 Twinstrand Biosciences, Inc. Methods and reagents for characterizing genomic editing, clonal expansion, and associated applications
US20210317517A1 (en) * 2018-08-28 2021-10-14 Sophia Genetics S.A. Methods for asymmetric dna library generation and optionally integrated duplex sequencing
EP3856903A4 (en) 2018-09-27 2022-07-27 Grail, LLC METHYLATION MARKER AND TARGETED METHYLATION PROBE PANEL
EP3670670A1 (en) 2018-12-18 2020-06-24 Ricoh Company, Ltd. Nucleic acid analysis method, nucleic acid analysis program, and device for library preparation
CN109706219A (zh) * 2018-12-20 2019-05-03 臻和(北京)科技有限公司 构建测序文库的方法、试剂盒、上机方法及测序数据的拆分方法
EP3938505A4 (en) * 2019-02-25 2022-11-30 Twist Bioscience Corporation COMPOSITIONS AND METHODS FOR SEQUENCING THE NEXT GENERATION
WO2020226528A1 (ru) * 2019-05-08 2020-11-12 Общество с ограниченной ответственностью "ГЕНОТЕК ИТ" Способ определения кариотипа плода беременной женщины
CN110409001B (zh) * 2019-07-25 2022-11-15 北京贝瑞和康生物技术有限公司 一种构建捕获文库的方法和试剂盒
EP3795685A1 (en) * 2019-09-20 2021-03-24 Sophia Genetics S.A. Methods for dna library generation to facilitate the detection and reporting of low frequency variants
US10927409B1 (en) * 2019-10-14 2021-02-23 Pioneer Hi-Bred International, Inc. Detection of sequences uniquely associated with a dna target region
CN111073961A (zh) * 2019-12-20 2020-04-28 苏州赛美科基因科技有限公司 一种基因稀有突变的高通量检测方法
US20230129075A1 (en) * 2020-01-13 2023-04-27 St. Jude Children's Research Hospital Error suppression in genetic sequencing
EP3859012A1 (en) 2020-02-03 2021-08-04 Albert-Ludwigs-Universität Freiburg Methods for amplification of genomic dna and preparation of sequencing libraries
CN111304288A (zh) * 2020-02-18 2020-06-19 江苏先声医学诊断有限公司 特异性分子标签umi组及其应用
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
EP3892737A1 (en) * 2020-04-09 2021-10-13 Takeda Vaccines, Inc. Qualitative and quantitative determination of single virus haplotypes in complex samples
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
MX2023001400A (es) 2020-09-11 2023-04-25 Illumina Cambridge Ltd Metodos para enriquecer una secuencia diana a partir de una genoteca de secuenciación usando adaptadores de horquilla.
CA3198842A1 (en) 2020-10-21 2022-04-28 Illumina, Inc. Sequencing templates comprising multiple inserts and compositions and methods for improving sequencing throughput
WO2022109207A2 (en) 2020-11-19 2022-05-27 The United States Of America As Represented By The Secretary, Department Of Health And Human Services Massively paralleled multi-patient assay for pathogenic infection diagnosis and host physiology surveillance using nucleic acid sequencing
AU2021401369A1 (en) 2020-12-15 2023-07-27 Genodive Pharma Inc. Method for evaluating adaptor ligation efficiency in sequencing DNA sample
CN112687339B (zh) * 2021-01-21 2021-12-14 深圳吉因加医学检验实验室 一种统计血浆dna片段测序数据中序列错误的方法和装置
JP2024513187A (ja) 2021-03-29 2024-03-22 イルミナ インコーポレイテッド ライブラリー中のdna損傷を評価し、アンプリコンサイズバイアスを正規化するための組成物及び方法
EP4314282A1 (en) 2021-03-30 2024-02-07 Illumina, Inc. Improved methods of isothermal complementary dna and library preparation
BR112023019945A2 (pt) 2021-03-31 2023-11-14 Illumina Cambridge Ltd Métodos para a preparação de bibliotecas de sequenciamento por tagmentação direcional com o uso de tecnologia baseada em transposon com identificadores moleculares exclusivos para correção de erros
WO2022246062A1 (en) * 2021-05-19 2022-11-24 Illumina, Inc. Umi collapsing
CN117255857A (zh) * 2022-04-18 2023-12-19 京东方科技集团股份有限公司 接头、接头连接试剂及试剂盒和文库构建方法
WO2024015962A1 (en) 2022-07-15 2024-01-18 Pacific Biosciences Of California, Inc. Blocked asymmetric hairpin adaptors

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
ES2563643T3 (es) 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
US6159736A (en) 1998-09-23 2000-12-12 Wisconsin Alumni Research Foundation Method for making insertional mutations using a Tn5 synaptic complex
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
EP2100971A3 (en) 2000-07-07 2009-11-25 Visigen Biotechnologies, Inc. Real-time sequence determination
WO2002044425A2 (en) 2000-12-01 2002-06-06 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US20040018520A1 (en) 2002-04-22 2004-01-29 James Thompson Trans-splicing enzymatic nucleic acid mediated biopharmaceutical and protein
JP2006509040A (ja) 2002-08-23 2006-03-16 ソレックサ リミテッド 修飾されたヌクレオチド
EP3673986A1 (en) 2004-01-07 2020-07-01 Illumina Cambridge Limited Improvements in or relating to molecular arrays
US7315019B2 (en) 2004-09-17 2008-01-01 Pacific Biosciences Of California, Inc. Arrays of optical confinements and uses thereof
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
CN101460953B (zh) 2006-03-31 2012-05-30 索雷克萨公司 用于合成分析的序列的系统和装置
AU2007309504B2 (en) 2006-10-23 2012-09-13 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
EP2121983A2 (en) 2007-02-02 2009-11-25 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
AU2010330936B2 (en) * 2009-12-17 2014-05-22 Keygene N.V. Restriction enzyme based whole genome sequencing
US20110245085A1 (en) * 2010-01-19 2011-10-06 Rava Richard P Methods for determining copy number variations
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
WO2011139797A2 (en) 2010-04-27 2011-11-10 Spiral Genetics Inc. Method and system for analysis and error correction of biological sequences and inference of relationship for multiple samples
PT2623613T (pt) 2010-09-21 2016-10-11 Population Genetics Tech Ltd Aumento da confiança da designação de alelos por contagem molecular
EP2619329B1 (en) 2010-09-24 2019-05-22 The Board of Trustees of The Leland Stanford Junior University Direct capture, amplification and sequencing of target dna using immobilized primers
CN110016499B (zh) 2011-04-15 2023-11-14 约翰·霍普金斯大学 安全测序系统
JP6028025B2 (ja) * 2011-07-08 2016-11-16 キージーン・エン・フェー オリゴヌクレオチド・ライゲーション・アッセイに基づく配列ベースの遺伝子型決定
WO2013015793A1 (en) * 2011-07-26 2013-01-31 Verinata Health, Inc. Method for determining the presence or absence of different aneuploidies in a sample
WO2013062856A1 (en) 2011-10-27 2013-05-02 Verinata Health, Inc. Set membership testers for aligning nucleic acid samples
US20130267428A1 (en) 2012-02-10 2013-10-10 Washington University In St. Louis High throughput digital karyotyping for biome characterization
CA2867293C (en) 2012-03-13 2020-09-01 Abhijit Ajit PATEL Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
EP4234713A3 (en) 2012-03-20 2024-02-14 University Of Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing
WO2013173394A2 (en) 2012-05-14 2013-11-21 Cb Biotechnologies, Inc. Method for increasing accuracy in quantitative detection of polynucleotides
EP2852608A4 (en) 2012-05-21 2016-05-04 Distributed Bio Inc EPITOPIC CROPPING BY VARIABLE EFFECTIVE ANTIGEN SURFACE CONCENTRATION
EP2855707B1 (en) 2012-05-31 2017-07-12 Board Of Regents, The University Of Texas System Method for accurate sequencing of dna
US20140024541A1 (en) 2012-07-17 2014-01-23 Counsyl, Inc. Methods and compositions for high-throughput sequencing
WO2014142850A1 (en) 2013-03-13 2014-09-18 Illumina, Inc. Methods and compositions for nucleic acid sequencing
US9328382B2 (en) 2013-03-15 2016-05-03 Complete Genomics, Inc. Multiple tagging of individual long DNA fragments
CN113337604A (zh) 2013-03-15 2021-09-03 莱兰斯坦福初级大学评议会 循环核酸肿瘤标志物的鉴别和用途
US10468121B2 (en) 2013-10-01 2019-11-05 Complete Genomics, Inc. Phasing and linking processes to identify variations in a genome
WO2015058052A1 (en) * 2013-10-18 2015-04-23 The Broad Institute Inc. Spatial and cellular mapping of biomolecules in situ by high-throughput sequencing
ES2660989T3 (es) 2013-12-28 2018-03-27 Guardant Health, Inc. Métodos y sistemas para detectar variantes genéticas
US9677132B2 (en) 2014-01-16 2017-06-13 Illumina, Inc. Polynucleotide modification on solid support
US20170233727A1 (en) 2014-05-23 2017-08-17 Centrillion Technology Holdings Corporation Methods for generating and decoding barcodes
CN107075730A (zh) 2014-09-12 2017-08-18 利兰·斯坦福青年大学托管委员会 循环核酸的鉴定及用途
US11661597B2 (en) 2015-04-15 2023-05-30 The Board Of Trustees Of The Leland Stanford Junior University Robust quantification of single molecules in next-generation sequencing using non-random combinatorial oligonucleotide barcodes
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
US11332784B2 (en) 2015-12-08 2022-05-17 Twinstrand Biosciences, Inc. Adapters, methods, and compositions for duplex sequencing
US11708574B2 (en) 2016-06-10 2023-07-25 Myriad Women's Health, Inc. Nucleic acid sequencing adapters and uses thereof
CN109642219B (zh) 2016-08-05 2021-02-26 生物辐射实验室股份有限公司 第二链引导
CN116497103A (zh) 2017-01-18 2023-07-28 伊鲁米那股份有限公司 制备测序衔接子的方法和对核酸分子进行测序的方法
US20180223350A1 (en) 2017-02-08 2018-08-09 Integrated Dna Technologies, Inc. Duplex adapters and duplex sequencing
WO2018175997A1 (en) 2017-03-23 2018-09-27 University Of Washington Methods for targeted nucleic acid sequence enrichment with applications to error corrected nucleic acid sequencing
US11447818B2 (en) 2017-09-15 2022-09-20 Illumina, Inc. Universal short adapters with variable length non-random unique molecular identifiers
SG11202003885UA (en) 2017-11-08 2020-05-28 Twinstrand Biosciences Inc Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
WO2019160998A1 (en) 2018-02-13 2019-08-22 Twinstrand Biosciences, Inc. Methods and reagents for detecting and assessing genotoxicity
WO2019178577A1 (en) 2018-03-15 2019-09-19 Twinstrand Biosciences, Inc. Methods and reagents for enrichment of nucleic acid material for sequencing applications and other nucleic acid material interrogations
CN112218956A (zh) 2018-05-16 2021-01-12 特温斯特兰德生物科学有限公司 用于解析核酸混合物和混合细胞群体的方法和试剂及相关应用
WO2020014693A1 (en) 2018-07-12 2020-01-16 Twinstrand Biosciences, Inc. Methods and reagents for characterizing genomic editing, clonal expansion, and associated applications
SG11202103783XA (en) 2018-10-16 2021-05-28 Twinstrand Biosciences Inc Methods and reagents for efficient genotyping of large numbers of samples via pooling
CA3146435A1 (en) 2019-08-01 2021-02-04 Jesse J. SALK Methods and reagents for nucleic acid sequencing and associated applications

Also Published As

Publication number Publication date
ES2961338T3 (es) 2024-03-11
HK1244513A1 (zh) 2018-08-10
IL255187A0 (en) 2017-12-31
ES2799074T3 (es) 2020-12-14
CA2983935A1 (en) 2016-11-03
RU2704286C2 (ru) 2019-10-25
US10844428B2 (en) 2020-11-24
DK3736341T3 (da) 2023-09-18
AU2016256351B2 (en) 2019-07-18
EP3289097B2 (en) 2023-08-30
MY181983A (en) 2021-01-18
CA3109403A1 (en) 2016-11-03
IL255187B (en) 2021-10-31
EP4266314A2 (en) 2023-10-25
CN108138227B (zh) 2021-09-17
NZ736609A (en) 2020-06-26
IL285319B2 (en) 2023-02-01
AU2019250200A1 (en) 2019-11-07
DK3289097T4 (da) 2023-12-04
EP3289097A1 (en) 2018-03-07
BR112017024118A2 (pt) 2018-07-31
EP3736341A1 (en) 2020-11-11
KR102091312B1 (ko) 2020-03-19
ES2799074T5 (es) 2024-02-26
WO2016176091A1 (en) 2016-11-03
IL294600B2 (en) 2024-05-01
DK3289097T3 (da) 2020-06-02
FI3736341T3 (fi) 2023-09-21
MX2023004394A (es) 2023-05-04
CN108138227A (zh) 2018-06-08
US20210108262A1 (en) 2021-04-15
AU2022200179A1 (en) 2022-02-10
IL294600A (en) 2022-09-01
IL285319A (en) 2021-09-30
US20160319345A1 (en) 2016-11-03
WO2016176091A8 (en) 2017-12-21
CA2983935C (en) 2021-04-20
CN113832139A (zh) 2021-12-24
MX2017013775A (es) 2018-08-15
JP6685324B2 (ja) 2020-04-22
IL285319B (en) 2022-10-01
AU2019250200B2 (en) 2021-10-14
US11866777B2 (en) 2024-01-09
ZA201707231B (en) 2021-02-24
AU2016256351A1 (en) 2017-11-09
FI3289097T4 (fi) 2023-12-01
EP3289097B1 (en) 2020-03-18
EP3736341B1 (en) 2023-08-23
JP2018514207A (ja) 2018-06-07
MX2022008045A (es) 2022-07-27
US20240084376A1 (en) 2024-03-14
EP4266314A3 (en) 2024-01-24
KR20180020137A (ko) 2018-02-27
IL294600B1 (en) 2024-01-01
SG11201708859XA (en) 2017-11-29
SG10202006185QA (en) 2020-07-29
RU2017137401A3 (ru) 2019-05-28

Similar Documents

Publication Publication Date Title
RU2017137401A (ru) Подавление ошибок в секвенированных фрагментах днк посредством применения избыточных прочтений с уникальными молекулярными индексами (umi)
RU2022101605A (ru) Способы и системы для получения наборов уникальных молекулярных индексов с гетерогенной длиной молекул и коррекции в них ошибок
Elshire et al. A robust, simple genotyping-by-sequencing (GBS) approach for high diversity species
EP2663655B1 (en) Paired end random sequence based genotyping
ES2769241T3 (es) Sistemas y métodos para detectar variación en el número de copias
ES2877088T3 (es) Procedimiento para detectar cáncer
US10373705B2 (en) Providing nucleotide sequence data
RU2019108294A (ru) Способы обнаружения изменений количества геномных копий в образцах днк
JP6664575B2 (ja) 核酸分子数計測法
JP2010534069A5 (ru)
KR20200058457A (ko) 압축된 분자 태깅된 핵산 서열 데이터를 사용하여 융합을 검출하는 방법
CN108603190A (zh) 使用经破碎的核苷酸的高通量多重测序确定基因拷贝数
US20240096445A1 (en) Identification of traits associated with dna samples using epigenetic-based patterns detected via massively parallel sequencing
CN110622250A (zh) 用于检测插入和缺失的方法和系统
EP2636753B1 (en) Method and means for identification of animal species
US20150120204A1 (en) Transcriptome assembly method and system
US10214780B2 (en) Method and means for identification of animal species
CN101693918B (zh) 一种提高核酸内切酶v切割位置特异性的方法
JP2021502072A5 (ru)
EP3942557A1 (en) Methods for partner agnostic gene fusion detection
WO2020096691A2 (en) Methods and systems for detecting allelic imbalance in cell-free nucleic acid samples
CN111542616A (zh) 脱氨引起的序列错误的纠正
Tripathy et al. Massively parallel sequencing technology in pathogenic microbes
Mishra et al. Strategies and tools for sequencing and assembly of plant genomes
Bhattacharjee Advances of transcriptomics in crop improvement: A Review