UA126898C2 - Застосування розміру фрагмента безклітинної днк для визначення варіацій числа копій - Google Patents

Застосування розміру фрагмента безклітинної днк для визначення варіацій числа копій Download PDF

Info

Publication number
UA126898C2
UA126898C2 UAA201809058A UAA201809058A UA126898C2 UA 126898 C2 UA126898 C2 UA 126898C2 UA A201809058 A UAA201809058 A UA A201809058A UA A201809058 A UAA201809058 A UA A201809058A UA 126898 C2 UA126898 C2 UA 126898C2
Authority
UA
Ukraine
Prior art keywords
sequence
sample
interest
overlap
fragments
Prior art date
Application number
UAA201809058A
Other languages
English (en)
Inventor
Свен Дюнвальд
Девід А. Комсток
Дэвид А. Комсток
Каталін Барбациору
Каталин Барбациору
Дар'я І. Чудова
Дарья И. Чудова
Річард П. Рава
Ричард П. Рава
Кейт У. Джонс
Генсінь Чень
Генсинь Чень
Димитрій Скворцов
Димитрий Скворцов
Original Assignee
Веріната Хелс, Інк.
Bepihata Хелс, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Веріната Хелс, Інк., Bepihata Хелс, Инк. filed Critical Веріната Хелс, Інк.
Publication of UA126898C2 publication Critical patent/UA126898C2/uk

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/16Assays for determining copy number or wherein the copy number is of special importance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)

Abstract

Винахід стосується способу, реалізованого із застосуванням комп'ютерної системи, визначення варіації числа копій (ВЧК) послідовності нуклеїнової кислоти, що представляє інтерес, у досліджуваному зразку, що містить фрагменти безклітинної нуклеїнової кислоти, отримані з двох або більше геномів. Винахід також стосується системи для оцінки числа копій послідовності нуклеїнової кислоти, що представляє інтерес, у досліджуваному зразку.

Description

ПЕРЕХРЕСНЕ ПОСИЛАННЯ НА СПОРІДНЕНІ ЗАЯВКИ
ІО0ОО1| Дана заявка заявляє пріоритет відповідно до розділу 35 5 119(е) Зведення законів
США на основі попередньої заявки на патент США Мо 62/290,891, під назвою: ЗАСТОСУВАННЯ
РОЗМІРУ ФРАГМЕНТУ БЕЗКЛІТИННОЇ ДНК ДЛЯ ВИЗНАЧЕННЯ ВАРІАЦІЙ ЧИСЛА КОПІЙ, поданої З лютого 2016 року, та заявки на патент США Мо 15/382,508, під назвою:
ЗАСТОСУВАННЯ РОЗМІРУ ФРАГМЕНТУ БЕЗКЛІТИННОЇ ДНК ДЛЯ ВИЗНАЧЕННЯ ВАРІАЦІЙ
ЧИСЛА КОПІЙ, поданої 16 грудня 2016 року, які повністю включені у дану заявку шляхом посилання для всіх цілей.
РІВЕНЬ ТЕХНІКИ
ІЇО0ОО1| Одним з найважливіших починань у дослідженнях у галузі медицини людини є відкриття генетичних аномалій, що викликають несприятливі наслідки для здоров'я. У багатьох випадках були ідентифіковані конкретні гени та/або важливі діагностичні маркери у частинах геному, які присутні у абнормальних кількостях копій. Наприклад, у пренатальній діагностиці генетичними ураженнями, що часто зустрічаються, є додаткові або відсутні копії цілих хромосом. При раку частими подіями є делеція або множення копій цілих хромосом або сегментів хромосом та більш високий рівень ампліфікації певних областей геному.
ІЇ0002| Більша частина інформації про варіації числа копій (ВЧК) була отримана за допомогою цитогенетичного розділення, яке забезпечило розпізнавання структурних аномалій.
У загальноприйнятих процедурах генетичного скринінгу та біологічної дозиметрії з метою одержання клітин для каріотипового аналізу застосовують інвазивні процедури, наприклад, амніоцентез, кордоцентез або біопсію ворсин хоріону (БВХ). У зв'язку з усвідомленням потреби у більш швидких методах дослідження, для яких не потрібне культивування клітин, були розроблені флуоресцентна гібридизація іп 5йи (Поиогезсепсе іп 5йи пубргідігайоп, РІБН), кількісна флуоресцентна ПЛР (КФ-ПЛР) та матриксна порівняльна геномна гібридизація (агтау-
Сотрагайме Сепотіс Нубгіаігайоп, агтау-СОН) у якості молекулярно-цитогенетичних способів для аналізу варіацій числа копій.
ІО0О3| Одним з найважливіших починань у дослідженнях у галузі медицини людини є відкриття генетичних аномалій, що викликають несприятливі наслідки для здоров'я. У багатьох випадках були ідентифіковані конкретні гени та/або важливі діагностичні маркери у частинах геному, які присутні у абнормальних кількостях копій. Наприклад, у пренатальній діагностиці генетичними ураженнями, що часто зустрічаються, є додаткові або відсутні копії цілих хромосом. При раку частими подіями є делеція або множення копій цілих хромосом або сегментів хромосом та більш високий рівень ампліфікації певних областей геному.
ІЇ0004| Більша частина інформації про варіацію числа копій (ВЧК) була отримана за допомогою цитогенетичного розділення, яке забезпечило розпізнавання структурних аномалій.
У загальноприйнятих процедурах генетичного скринінгу та біологічної дозиметрії для одержання клітин для аналізу каріотипів застосовують інвазивні процедури, наприклад, амніоцентез, кордоцентез або біопсію ворсин хоріона (БВХ). У зв'язку з усвідомленням потреби у більш швидких методах дослідження, для яких не потрібне культивування клітин, були розроблені флуоресцентна гібридизація іп 5йи (Пиогезсепсе іп 5йи Пубгіаілацноп, РІЗН), кількісна флуоресцентна ПЛР (КФ-ПЛР) та матриксна порівняльна геномна гібридизація (агтау-
Сотрагаїйме Сепотіс Нубгіадігайоп, атау-СОН) у якості молекулярно-цитогенетичних способів для аналізу варіацій числа копій.
ІО005)| Поява технологій, що дозволяють проводити секвенування цілих геномів протягом відносно короткого періоду часу, та відкриття циркулюючої безклітинної ДНК (сеїІ-їеєе ОМА, вВЦДНК) забезпечило можливість порівнювати порівнюваний генетичний матеріал, отриманий з однієї хромосоми, з іншим матеріалом іншої хромосоми за відсутності ризиків, пов'язаних з інвазивними способами відбору зразку, що забезпечує інструмент для діагностики різних видів варіацій числа копій генетичних послідовностей, що представляють інтерес.
І0006| Обмеження існуючих способів неінвазивної пренатальної діагностики, що включають недостатню чутливість, яка є наслідком обмежених рівнів вуДНК, та похибку технологій секвенування, яка є наслідком природних властивостей геномної інформації, лежать у основі постійної потреби у неінвазивних способах, які забезпечили б усі або частину зі специфічності, чутливості та придатності для надійної діагностики змін числа копій у різних клінічних умовах.
Було показано, що у плазмі вагітних жінок середні довжини фрагментів вцДНК плода є більш короткими, ніж фрагментів материнської вцДНК. Цю різницю між материнською вцДНК та вцДНК плода використовують у запропонованому у даному документі варіанті для визначення ВЧК та/або фракції плода. Варіанти реалізації, розкриті у даному документі, задовольняють деякі із зазначених вище потреб. Деякі варіанти реалізації можна здійснити із застосуванням бібліотеки,
отриманої ПЛР, у комбінації із секвенуванням спарених кінців ДНК. Деякі варіанти реалізації забезпечують високу аналітичну чутливість та специфічність для неінвазивної пренатальної діагностики та діагностики багатьох захворювань.
КОРОТКИЙ ОПИС ВИНАХОДУ
І0007| Згідно з деякими варіантами реалізації запропоновані способи визначення варіації числа копій (ВЧК) будь-якої з анеуплоїдій плода та ВЧК, яка напевно або можливо пов'язана з безліччю медичних станів. ВЧК, які можна визначити згідно із даним способом, включають трисомії та моносомії будь-якої однієї або більше із хромосом 1 - 22, Х та У, інші полісомії хромосом та делеції та/або дуплікації сегментів будь-якої однієї або більше хромосом. Згідно з деякими варіантами реалізації способи включають ідентифікацію ВЧУЧК у послідовності нуклеїнової кислоти, що представляє інтерес, наприклад, клінічно значимої послідовності, у досліджуваному зразку. Спосіб дозволяє оцінити варіацію числа копій конкретної послідовності, що представляє інтерес.
ЇО00О8| Згідно з деякими варіантами реалізації спосіб реалізують із застосуванням комп'ютерної системи, яка містить один або більше процесорів та системну пам'ять для оцінки числа копій послідовності нуклеїнової кислоти, що представляє інтерес, у досліджуваному зразку, що містить нуклеїнові кислоти одного або більше геномів.
І0009| Один аспект даного винаходу відноситься до способу визначення варіації числа копій (ВЧК) послідовності нуклеїнової кислоти, що представляє інтерес, у досліджуваному зразку, що містить фрагменти безклітинної нуклеїнової кислоти, отримані із двох або більше геномів.
Спосіб включає: (а) приймання рідів (зчитувань) послідовності, отриманих у результаті секвенування фрагментів безклітинної нуклеїнової кислоти у досліджуваному зразку; (б) вирівнювання рідів послідовності фрагментів безклітинної нуклеїнової кислоти або вирівнювання фрагментів, що містять ріди послідовності, їз блоками (Ббіп5) референсного геному, що містить послідовність, що представляє інтерес, з одержанням, таким чином, міток досліджуваної послідовності, причому референсний геном розділений на безліч блоків; (с) визначення розміру фрагментів щонайменше деяких фрагментів безклітинної нуклеїнової кислоти, які присутні у досліджуваному зразку; (4) обчислення перекриттів міток послідовності для блоків референсного геному для кожного блоку за допомогою: (ї) визначення кількості міток послідовності, які вирівнюються із блоком, та (її) нормування кількості міток послідовності, які вирівнюються із блоком, за допомогою обчислення міжблокових варіацій, викликаних факторами, відмінними від варіації числа копій; (є) визначення і-статистики для послідовності, що представляє інтерес, із застосуванням перекриттів блоків у послідовності, що представляє інтерес, та перекриттів блоків у референсній області для послідовності, що представляє інтерес; та (Ї) визначення варіації числа копій у послідовності, що представляє інтерес, із застосуванням співвідношення правдоподібності, обчисленої за І-статистикою, та інформації відносно розміру фрагментів безклітинної нуклеїнової кислоти.
І0О0101 Згідно з деякими варіантами реалізації спосіб включає здійснення етапів (4) та (є) двічі, один раз для фрагментів у першому домені розмірів та повторно для фрагментів у другому домені розмірів. Згідно з деякими варіантами реалізації перший домен розмірів включає фрагменти безклітинної нуклеїнової кислоти по суті всіх розмірів у зразку, та другий домен розмірів включає тільки фрагменти безклітинної нуклеїнової кислоти, менші, ніж заданий розмір. Згідно з деякими варіантами реалізації другий домен розмірів включає тільки фрагменти безклітинної нуклеїнової кислоти, менші, ніж приблизно 150 п.о. Згідно з деякими варіантами реалізації відношення правдоподібності обчислюють за першою ІїІ-статистикою для послідовності, що представляє інтерес, із застосуванням міток послідовності для фрагментів у першому діапазоні розміру та із другої Ї-статистики для послідовності, що представляє інтерес, із застосуванням міток послідовності для фрагментів у другому діапазоні розміру.
ІОО11| Згідно з деякими варіантами реалізації відношення правдоподібності обчислюють у вигляді першої правдоподібності того, що досліджуваний зразок являє собою анеуплоїдний зразок, відносно другої правдоподібності того, що досліджуваний зразок являє собою еуплоїдний зразок.
І0012| Згідно з деякими варіантами реалізації відношення правдоподібності обчислюють за одним або більше значеннями фракції плода на додаток до і-статистики та інформації відносно розміру фрагментів безклітинної нуклеїнової кислоти.
ІЇО0О13| Згідно з деякими варіантами реалізації одне або більше значень фракції плода включають значення фракції плода, обчислене із застосуванням інформації стосовно розмірів фрагментів безклітинної нуклеїнової кислоти. Згідно з деякими варіантами реалізації значення фракції плода обчислюють шляхом: одержання розподілу частоти розміру фрагментів; та бо застосування розподілу частоти у моделі, що встановлює взаємозв'язок між фракцією плода та частотою розміру фрагмента, з одержанням значення фракції плода. Згідно з деякими варіантами реалізації модель, що встановлює взаємозв'язок між фракцією плода та частотою розміру фрагмента, включає звичайну лінійну модель, яка містить множину параметрів та коефіцієнтів для множини блоків.
І0014| Згідно з деякими варіантами реалізації одне або більше значень фракції плода включають значення фракції плода, обчислене із застосуванням інформації про перекриття для блоків референсного геному. Згідно з деякими варіантами реалізації значення фракції плода обчислюють за допомогою застосування значення перекриття множини блоків у моделі, що встановлює взаємозв'язок між фракцією плода та перекриттям блоку, з одержанням значення фракції плода. Згідно з деякими варіантами реалізації модель, що встановлює взаємозв'язок між фракцією плода та перекриттям блоку, включає звичайну лінійну модель, яка містить множину параметрів та коефіцієнтів для множини блоків. Згідно з деякими варіантами реалізації множина блоків характеризується високою кореляцією між фракцією плода та перекриттям у навчальних зразках. 00151) Згідно з деякими варіантами реалізації одне або більше значень фракції плода включають значення фракції плода, обчислене із застосуванням частот множини 8-мерів, виявлених у рідах. Згідно з деякими варіантами реалізації значення фракції плода обчислюють за допомогою: застосування частот множини 8-мерів у моделі, що встановлює взаємозв'язок між фракцією плода та частотою 8-мерів, з одержанням значення фракції плода. Згідно з деякими варіантами реалізації модель, що встановлює взаємозв'язок між фракцією плода та частотою 8-мерів, включає звичайну лінійну модель, яка містить множину параметрів та коефіцієнтів для множини 8-мерів. Згідно з деякими варіантами реалізації множина 8-мерів характеризується високою кореляцією між фракцією плода та частотою 8-мерів.
ІЇО0О16| Згідно з деякими варіантами реалізації одне або більше значень фракції плода включають значення фракції плода, обчислене із застосуванням інформації про перекриття для блоків статевої хромосоми.
І0017| Згідно з деякими варіантами реалізації відношення правдоподібності обчислюють за фракцією плода, І-статистикою коротких фрагментів та Ї-статистикою всіх фрагментів, причому короткі фрагменти являють собою фрагменти безклітинної нуклеїнової кислоти у першому діапазоні розміру, менші, ніж розмір-критерій, та всі фрагменти являють собою фрагменти безклітинної нуклеїнової кислоти, включаючи короткі фрагменти та фрагменти, більш довгі, ніж розмір-критерій. Згідно з деякими варіантами реалізації відношення правдоподібності (ВП) обчислюють як: (0018) вп- У, псумарно(й сумарн/)» Ри(Ткоротк» Тасії вир)
Ро (Ткоротю Тв сі)
ЇОО19| де рі. являє собою правдоподібність того, що дані отримані з багатомірного нормального розподілу, що представляє З-копійну або 1-копійну модель, ро являє собою правдоподібність того, що дані отримані з багатомірного нормального розподілу, що представляє 2-копійну модель, коротко всіх ЯВЛЯЮТЬ собою Т-показники, обчислені за перекриттям хромосом, отриманим з коротких фрагментів та всіх фрагментів, та діт сумарн) являє собою щільність розподілу фракції плода. 00201 Згідно з деякими варіантами реалізації відношення правдоподібності обчислюють за одним або більше значеннями фракції плода на додаток до і-статистики та інформації відносно розміру фрагментів безклітинної нуклеїнової кислоти.
І0021| Згідно з деякими варіантами реалізації відношення правдоподібності обчислюють для моносомії Х, трисомії Х, трисомії 13, трисомії 18 або трисомії 21.
І0022| Згідно з деякими варіантами реалізації нормування кількості міток послідовності включає: нормування з урахуванням вмісту С у зразку, нормування з урахуванням глобального хвильового профілю варіації навчальної множини та/або нормування з урахуванням одного або більше компонентів, отриманих з аналізу головних компонентів.
І00О23| Згідно з деякими варіантами реалізації послідовність, що представляє інтерес, являє собою хромосому людини, яка вибрана із групи, що складається із хромосоми 13, хромосоми 18, хромосоми 21, хромосоми Х та хромосоми У.
І0024| Згідно з деякими варіантами реалізації референсна область являє собою всі стійкі хромосоми, стійкі хромосоми, що не містять послідовність, що представляє інтерес, щонайменше хромосому за межами послідовності, що представляє інтерес, та/або підмножину хромосом, вибраних зі стійких хромосом. Згідно з деякими варіантами реалізації референсна область містить стійкі хромосоми, які були визначені для забезпечення найкращої здатності виявлення сигналу для множини навчальних зразків. 0025) Згідно з деякими варіантами реалізації спосіб також включає обчислення значень параметру розміру для блоків для кожного блоку за допомогою: (ї) визначення значення параметру розміру на підставі розмірів фрагментів безклітинної нуклеїнової кислоти у блоці та (ії) нормування значення параметру розміру за допомогою обчислення міжблокових варіацій, викликаних факторами, відмінними від варіації числа копій. Спосіб також включає визначення 1- статистики на підставі розміру для послідовності, що представляє інтерес, із застосуванням значень параметру розміру блоків у послідовності, що представляє інтерес, та значень параметру розміру блоків у референсній області для послідовності, що представляє інтерес.
Згідно з деякими варіантами реалізації відношення правдоподібності () обчислюють за 1- статистикою та Ї-статистикою на підставі розміру. Згідно з деякими варіантами реалізації відношення правдоподібності (Ж обчислюють за І-статистикою на підставі розміру та фракції плода. 0026) Згідно з деякими варіантами реалізації спосіб також включає порівняння відношення правдоподібності із критерієм рішення для визначення варіації числа копій у послідовності, що представляє інтерес. Згідно з деякими варіантами реалізації відношення правдоподібності перетворюють у логарифмічне відношення правдоподібності перед порівнянням із критерієм рішення. Згідно з деякими варіантами реалізації критерій рішення одержують за допомогою застосування різних критеріїв відносно навчальної множини навчальних зразків та вибору критерію, який забезпечує задану чутливість та задану селективність.
І0027| Згідно з деякими варіантами реалізації спосіб також включає одержання множини відношень правдоподібності та застосування множини відношень правдоподібності у дереві рішень для визначення випадку плоїдності для зразку. 0028) Згідно з деякими варіантами реалізації спосіб також включає одержання множини відношень правдоподібності та одного або більше значень перекриття послідовності, що представляє інтерес, та застосування множини відношень правдоподібності та одного або більше значень перекриття послідовності, що представляє інтерес, у дереві рішень для визначення випадку плоїдності для зразку. 0029) Інший аспект даного винаходу відноситься до способу визначення варіації числа копій (ВЧК) послідовності нуклеїнової кислоти, що представляє інтерес, у досліджуваному зразку, що містить фрагменти безклітинної нуклеїнової кислоти, отримані із двох або більше геномів.
Спосіб включає: (а) приймання рідів (зчитувань) послідовності, отриманих у результаті секвенування фрагментів безклітинної нуклеїнової кислоти у досліджуваному зразку; (Б) вирівнювання рідів послідовності фрагментів безклітинної нуклеїнової кислоти або вирівнювання фрагментів, що містять ріди послідовності, із блоками референсного геному, що містить послідовність, що представляє інтерес, з одержанням, таким чином, міток досліджуваної послідовності, причому референсний геном розділений на множину блоків; (с) обчислення перекриттів міток послідовності для блоків референсного геному для кожного блоку за допомогою: (ї) визначення кількості міток послідовності, які вирівнюються із блоком, та (ії) нормування кількості міток послідовності, які вирівнюються із блоком, за допомогою обчислення міжблокових варіацій, викликаних факторами, відмінними від варіації числа копій. Спосіб також включає: (4) визначення і-статистики для послідовності, що представляє інтерес, із застосуванням перекриттів блоків у послідовності, що представляє інтерес, та перекриттів блоків у референсній області для послідовності, що представляє інтерес; (є) оцінку одного або більше значень фракції плода фрагментів безклітинної нуклеїнової кислоти у досліджуваному зразку; та () визначення варіації числа копій у послідовності, що представляє інтерес, із застосуванням і-статистики та одного або більше значень фракції плода.
І0ОЗ30О| Згідно з деякими варіантами реалізації етап (її) включає обчислення відношення правдоподібності з ї-статистики та одного або більше значень фракції плода. Згідно з деякими варіантами реалізації відношення правдоподібності обчислюють для моносомії Х, трисомії Х, трисомії 13, трисомії 18 або трисомії 21.
ІООЗ1| Згідно з деякими варіантами реалізації нормування кількості міток послідовності включає: нормування з урахуванням вмісту 5С у зразку, нормування з урахуванням глобального хвильового профілю варіації навчальної множини та/"або нормування з урахуванням одного або більше компонентів, отриманих з аналізу головних компонентів.
І00З321| Згідно з деякими варіантами реалізації послідовність, що представляє інтерес, являє собою хромосому людини, яка вибрана з групи, яка складається з хромосоми 13, хромосоми 18, бо хромосоми 21, хромосоми Х та хромосоми У.
І0033)| Наступний аспект даного винаходу відноситься до способу визначення варіації числа копій (ВЧК) послідовності нуклеїнової кислоти, що представляє інтерес, у досліджуваному зразку, що містить фрагменти безклітинної нуклеїнової кислоти, отримані з двох або більше геномів. Спосіб включає: (а) приймання рідів (зчитувань) послідовності, отриманих у результаті секвенування фрагментів безклітинної нуклеїнової кислоти у досліджуваному зразку; (Б) вирівнювання рідів послідовності фрагментів безклітинної нуклеїнової кислоти або вирівнювання фрагментів, які містять ріди послідовності, з блоками референсного геному, який містить послідовність, що представляє інтерес, з одержанням, таким чином, міток досліджуваної послідовності, причому референсний геном розділений на множину блоків; (с) визначення розміру фрагментів для фрагментів безклітинної нуклеїнової кислоти, що існують у досліджуваному зразку; (4) обчислення перекриттів міток послідовності для блоків референсного геному із застосуванням міток послідовності для фрагментів безклітинної нуклеїнової кислоти, розміри яких відносяться до першого домену розмірів; (е) обчислення перекриттів міток послідовності для блоків референсного геному із застосуванням міток послідовності для фрагментів безклітинної нуклеїнової кислоти, розміри яких відносяться до другого домену розмірів, причому другий домен розмірів відрізняється від першого домену розмірів; (Її) обчислення характеристик розміру для блоків референсного геному із застосуванням розмірів фрагментів, визначених на етапі (с); та (9) визначення варіації числа копій у послідовності, що представляє інтерес, із застосуванням перекриттів, обчислених на етапах (9) та (є), та характеристик розміру, обчислених на етапі (б).
І0034| Згідно з деякими варіантами реалізації перший домен розмірів включає фрагменти безклітинної нуклеїнової кислоти по суті всіх розмірів у зразку, та другий домен розмірів включає тільки фрагменти безклітинної нуклеїнової кислоти, менші, ніж заданий розмір. Згідно з деякими варіантами реалізації другий домен розмірів включає тільки фрагменти безклітинної нуклеїнової кислоти, менші, ніж приблизно 150 п.о.
І0ОЗ5) Згідно з деякими варіантами реалізації послідовність, що представляє інтерес, являє собою хромосому людини, яка вибрана з групи, яка складається з хромосоми 13, хромосоми 18, хромосоми 21, хромосоми Х та хромосоми У.
І0ОЗ6)| Згідно з деякими варіантами реалізації етап (д) включає обчислення І-статистики для послідовності, що представляє інтерес, із застосуванням перекриттів блоків у послідовності, що представляє інтерес, обчислених на етапі (а) та/або (є). Згідно з деякими варіантами реалізації обчислення і-статистики для послідовності, що представляє інтерес, включає застосування перекриттів блоків у послідовності, що представляє інтерес, та перекриттів блоків у референсній області для послідовності, що представляє інтерес.
І0037| Згідно з деякими варіантами реалізації етап (д) включає обчислення і-статистики для послідовності, що представляє інтерес, із застосуванням характеристик розміру блоків у послідовності, що представляє інтерес, обчислених на етапі (). Згідно з деякими варіантами реалізації обчислення і-статистики для послідовності, що представляє інтерес, включає застосування характеристик розміру блоків у послідовності, що представляє інтерес, та характеристик розміру блоків у референсній області для послідовності, що представляє інтерес. 0038) Згідно з деякими варіантами реалізації характеристика розміру для блоку включає відношення фрагментів розміру, менших, ніж задане значення, до загальної кількості фрагментів у блоці.
ІЇ0О039| Згідно з деякими варіантами реалізації етап (ду) включає обчислення відношення правдоподібності з Ї-статистики. 0040) Згідно з деякими варіантами реалізації етап (ду) включає обчислення відношення правдоподібності з першої ї-статистики для послідовності, що представляє інтерес, із застосуванням перекриттів, обчислених на етапі (4), та другої Ї-статистики для послідовності, що представляє інтерес, із застосуванням перекриттів, обчислених на етапі (е).
І0041| Згідно з деякими варіантами реалізації етап (9) включає обчислення відношення правдоподібності з першої ї-статистики для послідовності, що представляє інтерес, із застосуванням перекриттів, обчислених на етапі (4), другої І-статистики для послідовності, що представляє інтерес, із застосуванням перекриттів, обчислених на етапі (є), та третьої 1- статистики для послідовності, що представляє інтерес, із застосуванням характеристик розміру, обчислених на етапі (б). 0042 Згідно з деякими варіантами реалізації відношення правдоподібності обчислюють за одним або більше значеннями фракції плода на додаток до щонайменше першої та другої 1- статистики. Згідно з деякими варіантами реалізації спосіб також включає обчислення одного або більше значень фракції плода із застосуванням інформації відносно розмірів фрагментів бо безклітинної нуклеїнової кислоти.
0043) Згідно з деякими варіантами реалізації спосіб також включає обчислення одного або більше значень фракції плода із застосуванням інформації про перекриття для блоків референсного геному. Згідно з деякими варіантами реалізації одне або більше значень фракції плода включають значення фракції плода, обчислене із застосуванням інформації про перекриття для блоків статевої хромосоми. Згідно з деякими варіантами реалізації відношення правдоподібності обчислюють для моносомії Х, трисомії Х, трисомії 13, трисомії 18 або трисомії 21. 0044) Згідно з деякими варіантами реалізації етап (4) та/або (є) включає: (ї) визначення кількості міток послідовності, які вирівнюються з блоком, та (ії) нормування кількості міток послідовності, які вирівнюються з блоком, шляхом обчислення міжблокових варіацій, викликаних факторами, відмінними від варіації числа копій. Згідно з деякими варіантами реалізації нормування кількості міток послідовності включає: нормування з урахуванням вмісту оС у зразку, нормування з урахуванням глобального хвильового профілю варіації навчальної множини та/або нормування з урахуванням одного або більше компонентів, отриманих з аналізу головних компонентів.
Ї0045| Згідно з деякими варіантами реалізації етап () включає обчислення значень параметру розміру для блоків для кожного блоку шляхом: (ї) визначення значення параметру розміру на підставі розмірів фрагментів безклітинної нуклеїнової кислоти у блоці, та (ії) нормування значення параметру розміру шляхом обчислення міжблокових варіацій, викликаних факторами, відмінними від варіації числа копій.
І0046| Інший аспект даного винаходу відноситься до системи для оцінки числа копій послідовності нуклеїнової кислоти, що представляє інтерес, у досліджуваному зразку, причому зазначена система містить: секвенатор для приймання фрагментів нуклеїнової кислоти з досліджуваного зразку та забезпечення інформації про послідовність нуклеїнової кислоти досліджуваного зразку; процесор; та один або більше машинозчитуваних носіїв для зберігання інформації, на яких зберігаються інструкції для виконання на зазначеному процесорі. Інструкції включають інструкції для: (а) приймання рідів (зчитувань) послідовності, отриманих у результаті секвенування фрагментів безклітинної нуклеїнової кислоти у досліджуваному зразку; (б) вирівнювання рідів послідовності фрагментів безклітинної нуклеїнової кислоти або вирівнювання фрагментів, які містять ріди послідовності, з блоками референсного геному, який містить послідовність, що представляє інтерес, з одержанням, таким чином, міток досліджуваної послідовності, причому референсний геном розділений на множину блоків; (с) визначення розмірів фрагменту щонайменше деяких фрагментів безклітинної нуклеїнової кислоти, які присутні у досліджуваному зразку; та (4) обчислення перекриттів міток послідовності для блоків референсного геному для кожного блоку шляхом: (ї) визначення кількості міток послідовності, які вирівнюються з блоком, та (ії) нормування кількості міток послідовності, які вирівнюються з блоком, шляхом обчислення міжблокових варіацій, викликаних факторами, відмінними від варіації числа копій. Спосіб також включає: (е) визначення І-статистики для послідовності, що представляє інтерес, із застосуванням перекриттів блоків у послідовності, що представляє інтерес, та перекриттів блоків у референсній області для послідовності, що представляє інтерес; та () визначення варіації числа копій у послідовності, що представляє інтерес, із застосуванням відношення правдоподібності, обчисленого за і-статистикою, та інформації відносно розміру фрагментів безклітинної нуклеїнової кислоти.
І0047| Згідно з деякими варіантами реалізації система спроектована для здійснення будь- якого зі способів, описаних вище. 0048) Додатковий аспект даного винаходу відноситься до продукту комп'ютерної програми, який містить один або більше машинозчитуваних носіїв, призначених для тривалого зберігання інформації, на яких зберігаються виконувані комп'ютером інструкції, при виконанні яких одним або більше процесорами комп'ютерної системи комп'ютерна система реалізує будь-який зі способів, описаних вище.
І0049| Незважаючи на те, що приклади у даному документі відносяться до людей, та опис переважно спрямований на проблеми людини, концепції, описані у даному документі, застосовні до геномів будь-якої рослини або тварини. Дані та інші об'єкти та властивості даного винаходу стануть більш очевидними на підставі наступного опису та прикладеної формули винаходу або можуть бути з'ясовані при реалізації даного винаходу на практиці, як представлено нижче по тексту.
ВКЛЮЧЕННЯ ШЛЯХОМ ПОСИЛАННЯ
І0ОО50) Усі патенти, заявки на патент та інші публікації, включаючи всі послідовності, розкриті у даних джерелах, згаданих у даному документі, явно включені у даний документ за допомогою бо посилання тією самою мірою, як якби кожна окрема публікація, патент або заявка на патент були конкретно та індивідуально зазначені як включені за допомогою посилання. Усі процитовані документи у відповідній частині повністю включені у даний документ за допомогою посилання для цілей, обумовлених контекстом цитування даних джерел у даному документі.
Однак цитування будь-якого документа не слід тлумачити як визнання того, що даний документ становить попередній рівень техніки стосовно даного винаходу.
КОРОТКИЙ ОПИС КРЕСЛЕНЬ
ІОО51) Фігура 1 являє собою структурну схему способу 100 для визначення присутності або відсутності варіації числа копій у досліджуваному зразку, що містить суміш нуклеїнових кислот.
І0О52) Фігура 2А тематично ілюструє, як секвенування спарених кінців можна застосовувати для визначення як розміру фрагменту, так і перекриття послідовності.
І0О53)| На фігурі 28 представлена структурна схема процесу для застосування перекриття на підставі розміру з метою визначення варіації числа копій послідовності нуклеїнової кислоти, що представляє інтерес, у досліджуваному зразку.
І0О54)| На фігурі 2С представлена структурна схема процесу для визначення параметру розміру фрагменту для послідовності нуклеїнової кислоти, що представляє інтерес, яку застосовували для оцінки числа копій.
І0055| На фігурі 20 представлена блок-схема двох проходів робочого процесу, що перекриваються.
І0О56) На фігурі 2Е представлена блок-схема трипрохідного процесу для оцінки числа копій.
І0057| На фігурі 2Е представлені варіанти реалізації, у яких застосовують ї-статистику для аналізу числа копій з метою поліпшення точності аналізу.
І0О58| На фігурі 25 представлений приклад процесу для визначення фракції плода на підставі інформації про перекриття згідно з деякими варіантами реалізації даного винаходу.
І0О59| На фігурі 2Н представлений процес для визначення фракції плода на підставі інформації про розподіл розміру згідно з деякими варіантами реалізації.
ІОО6О|Ї На фігурі 2І представлений приклад процесу для визначення фракції плода на підставі інформації про частоту 8-мерів згідно з деякими варіантами реалізації даного винаходу.
ЇОО61| На фігурі 29 представлений робочий процес для обробки інформації про ріди послідовності, який можна застосовувати для одержання оцінок фракції плода.
І0062| На фігурі ЗА представлена структурна схема прикладу процесу для зниження шуму у даних послідовності з досліджуваного зразку.
І0063| На фігурах 3В-З3К представлені аналізи даних, отриманих на різних етапах процесу, зображеного на фігурі ЗА.
І0064| На фігурі 4А представлена блок-схема процесу одержання маски послідовності для зниження шуму у даних послідовності.
І0065| Фігура 48 демонструє, що показник Маро характеризується стійкою монотонною кореляцією із КВ (коефіцієнтом варіації) нормованих кількостей перекриття. 0066) Фігура 5 являє собою блок-діаграму дисперсної системи для процесингу (обробки) досліджуваного зразку та, у остаточному підсумку, постановки діагнозу.
І0067| Фігура 6 схематично ілюструє, як різні операції при процесингу досліджуваних зразків можна згрупувати для маніпуляції різними елементами системи. 0068) Фігури 7А та 7В демонструють електрофореграми бібліотеки секвенування вуднК, отриманої згідно зі скороченим протоколом, описаним у прикладі Та (Фіг. 7А), та протоколом, описаним у прикладі 16 (Фіг. 7В).
І0069| На фігурі 8 представлений загальний робочий процес та часові рамки для нової версії
НІПТ (неінвазивного пренатального тестування) у порівнянні зі стандартним лабораторним робочим процесом.
І0070| На фігурі 9 представлений вихід з бібліотеки секвенування як функція екстрагованої вВЦДНК на вході, яка свідчить про стійку лінійну кореляцію концентрації бібліотеки та концентрації на вході з високою ефективністю перетворення.
І00О71| На фігурі 10 представлений розподіл розміру фрагментів вуДНК, вимірюваного у 324 зразках від вагітностей плодом чоловічої статі.
І0072| На фігурі 11 представлена відносна фракція плода за загальним підрахованим значенням картованих рідів спарених кінців у порівнянні із числом рідів спарених кінців, які становлять менше 150 п.о.
Ї0073| На фігурі 12 представлена об'єднана іІ-статистика показника анеуплоїдії для виявлення зразків трисомії 21 для (А) підрахованих значень усіх фрагментів; (В) підрахованих значень винятково коротких фрагментів («150 п.о0.); (С) фракції коротких фрагментів (підраховані значення від 80 до 150 п.о./підраховані значення «250 п.о.); (0) об'єднаної 1- бо статистики від (В) та (С); та (Е) результатів для тих же зразків, отриманих із застосуванням лабораторного процесу СА (Спеті І итіпевсепі Іттипо Авззау, імунохемілюмінесцентний аналіз) Шитіпа, Редвуд-сіті, із середнім значенням 16М підрахованих значень/зразок.
І0074| На фігурі 13 представлені фракції плода, оцінені у обраних блоках, у порівнянні з такими, вимірюваними з нормованими значеннями хромосом (референс, еталон), для хХ- хромосоми. Множину 1 застосовували для калібрування значення фракції плода, та незалежну множину 2 - для дослідження кореляції.
ДОКЛАДНИЙ ОПИС ВИНАХОДУ
Визначення 0075) Якщо не зазначене зворотне, реалізація на практиці способу та системи, розкритих у даному документі, включає загальноприйняті методики та апарати, звичайно застосовувані у молекулярній біології, мікробіології, очищенні білку, білкової інженерії, секвенуванні білку та
ДНК та у області рекомбінантної ДНК, які знаходяться у межах компетенції у даній галузі техніки. Такі методики та апарати відомі фахівцям у даній галузі техніки та описані у численних настановах та довідкових виданнях (Див. наприклад, ЗатбгоокК еї аї., "Моіесшаг СіІопіпд: А
ІГарогаогу Мапаиаї, " Тпіга Едйіоп (Соїа 5ргіпд Нагбог), (200111); та Аизибеї еї а!., "Ситепі Ргоїосої5 іп Моіесшіаг Віоіоду" (19871). 0076) Числові діапазони включають кількості, що визначають діапазон. Передбачається, що кожне максимальне кількісне обмеження, наведене по всій даній специфікації, включає кожне менше кількісне обмеження, як якби такі менші кількісні обмеження були явно зазначені у даному документі. Кожне мінімальне кількісне обмеження, наведене по всій даній специфікації, включає кожне більш високе кількісне обмеження, як якби такі більш високі кількісні обмеження були явно зазначені у даному документі. Кожен числовий діапазон, наведений по всій даній специфікації, включає кожен більш вузький числовий діапазон, який попадає у такий більш широкий числовий діапазон, як якби такі більш вузькі числові діапазони були явно зазначені у даному документі.
ІЇ0077| Заголовки, наведені у даному документі, не призначені для обмеження даного винаходу.
І0078| Якщо не зазначене зворотне, у даному документі всі технічні та наукові терміни, використовувані у даному документі, мають те ж значення, яке загальноприйнято розуміє середній фахівець у даній галузі техніки. Різні наукові словники, які включають терміни, наведені у даному документі, добре відомі та доступні фахівцям у даній галузі техніки.
Незважаючи на те, що будь-які способи та матеріали, аналогічні або еквівалентні таким, описаним у даному документі, знаходять застосування при реалізації на практиці або дослідженні варіантів реалізації, розкритих у даному документі, описані деякі способи та матеріали.
І0079| Терміни, визначення яких наведені безпосередньо нижче, більш повно описані за допомогою посилання на опис у цілому. Слід розуміти, що даний винахід не обмежений конкретними описаними методологією, протоколами та реактивами, оскільки всі вони можуть варіюватися залежно від контексту, у якому їх застосовує фахівець у даній галузі техніки. У даному документі терміни у однині включають згадування об'єктів у множині, якщо у контексті однозначно не зазначене зворотне.
ІОО80| Якщо не зазначене зворотне, нуклеїнові кислоти представлені зліва направо у напрямку від 5'- до 3-кінця, а послідовності амінокислот представлені зліва направо у орієнтації від аміно- до карбоксикінця, відповідно.
І0О0О81| Термін "параметр" у даному документі представляє фізичну властивість, значення або іншу характеристику, яка впливає на відповідний стан, такий як варіація числа копій. У деяких випадках термін "параметр" використовують відносно змінної, яка впливає на математичну залежність або модель на виході, причому дана змінна може бути незалежною змінною (тобто що вводиться у модель) або проміжною змінною, основаною на одній або більше незалежних змінних. Залежно від обсягу моделі дані на виході однієї моделі можуть стати даними на вході іншої моделі, за допомогою цієї ставши параметром для іншої моделі. (0082) Термін "параметр розміру фрагменту" означає параметр, який відноситься до розміру або довжини фрагменту або сукупності фрагментів, таких як фрагменти нуклеїнової кислоти; наприклад, фрагменти вуДНК, отримані з фізіологічної рідини. У даному документі параметр "зміщений убік розміру фрагменту або діапазону розміру", коли: 1) параметр сприятливо зважується за розміром фрагменту або діапазоном розміру, наприклад, обчислення має більшу вагу, коли пов'язаний із фрагментами розміру або діапазону розміру, ніж для інших розмірів або діапазонів; або 2) параметр отриманий зі значення, яке сприятливо зважується за розміром фрагменту або діапазоном розміру, наприклад, співвідношення отримане з підрахованого бо значення з більшою вагою, коли пов'язаний із фрагментами розміру або діапазону розміру.
Розмір фрагменту або діапазон розміру може бути характеристикою геному або його частини, коли геном утворює фрагменти нуклеїнової кислоти, які збагачені або містять більш високу концентрацію розміру або діапазону розміру, у порівнянні із фрагментами нуклеїнової кислоти з іншого геному або іншої частини того ж геному.
І0083| Термін "зважування" означає модифікацію кількості, такої як параметр або змінна, із застосуванням одного або більше значень або функцій, які вважаються "вагою". Згідно з певними варіантами реалізації параметр або змінну множать на вагу. Згідно з іншими варіантами реалізації параметр або змінну модифікують експоненціально. Згідно з деякими варіантами реалізації функція може являти собою лінійну або нелінійну функцію. Приклади застосовних нелінійних функцій включають, без обмеження, східчасті функції Хевісайда, функції вагону, східчасті функції або сигмоїдальні функції. Зважування вихідного параметру або змінної може системно збільшити або зменшити значення зваженої змінної. Згідно з різними варіантами реалізації зважування може привести до одержання позитивних, ненегативних або негативних значень.
І0084| Термін "варіація числа копій" у даному документі означає варіацію кількості копій послідовності нуклеїнової кислоти, що присутня у досліджуваному зразку, у порівнянні із числом копій послідовності нуклеїнової кислоти, що присутня у референсному зразку. Згідно з певними варіантами реалізації довжина послідовності нуклеїнової кислоти становить 1 т.о. (тисячу основ) або більше. У деяких випадках послідовність нуклеїнової кислоти являє собою цілу хромосому або значну її частину. "Варіант числа копій" означає послідовність нуклеїнової кислоти, у якій були виявлені відмінності числа копій за допомогою порівняння послідовності нуклеїнової кислоти, що представляє інтерес, у досліджуваному зразку з очікуваним рівнем послідовності нуклеїнової кислоти, що представляє інтерес. Наприклад, рівень послідовності нуклеїнової кислоти, що представляє інтерес, у досліджуваному зразку порівнюють із присутнім у кваліфікаційному зразку. Варіанти/варіації числа копій включають делеції, у тому числі мікроделеції, інсерції, у тому числі мікроінсерції, дуплікації множення та транслокації. ВЧК включає анеуплоїдії хромосом та часткові анеуплоїдії. (0085) Термін "анеуплоїдія" у даному документі означає дисбаланс генетичного матеріалу, викликаний втратою або додаванням цілої хромосоми або частини хромосоми.
І0086б| Терміни "анеуплоїдія хромосоми" та "повна анеуплоїдія хромосоми" у даному документі означають дисбаланс генетичного матеріалу, викликаний втратою або додаванням цілої хромосоми, та включають анеуплоїдію зародкової лінії та мозаїчну анеуплоїдію.
І0087| Терміни "часткова анеуплоїдія" та "часткова анеуплоїдія хромосоми" у даному документі означають дисбаланс генетичного матеріалу, викликаний втратою або додаванням частини хромосоми, наприклад, часткову моносомію та часткову трисомію, та включають дисбаланс, який є наслідком транслокації, делеції та інсерції.
І0088| Термін "множина" означає більше одного елементу. Наприклад, даний термін у даному документі застосовують до кількості молекул нуклеїнової кислоти або міток послідовності, достатньої для ідентифікації значних відмінностей варіацій числа копій у досліджуваних зразках та кваліфікаційних зразках, із застосуванням способів, розкритих у даному документі. Згідно з деякими варіантами реалізації для кожного досліджуваного зразку одержують щонайменше приблизно 3х102 міток послідовності довжиною від приблизно 20 до 40 п.о. Згідно з деякими варіантами реалізації кожен досліджуваний зразок забезпечує дані для щонайменше приблизно 5х102, 8х109, 10х109, 15х105, 20х105, 30х105, 40х105 або 50х105 міток послідовності, причому кожна мітка послідовності містить приблизно від 20 до 40 п.о.
І0089| Термін "ріди спарених кінців" означає ріди із секвенування спарених кінців, які одержують один рід з кожного кінця фрагменту нуклеїнової кислоти. Секвенування спарених кінців може включати фрагментацію ланцюгів полінуклеотидів на короткі послідовності, що називаються вставками. Фрагментація є необов'язковою або недоцільною для відносно коротких полінуклеотидів, таких як молекули безклітинної ДНК.
І0О090| Терміни "полінуклеотид", "нуклеїнова кислота" та "молекули нуклеїнової кислоти" використовуються взаємозамінно та означають ковалентним способом зв'язану послідовність нуклеотидів (тобто рибонуклеотидів для РНК та дезоксирибонуклеотидів для ДНК), у якій 3'- положення пентози одного нуклеотиду з'єднане за допомогою фосфодіефірної групи з 5'- положенням пентози наступного нуклеотиду. Нуклеотиди включають послідовності будь-якої форми нуклеїнової кислоти, включаючи, без обмеження, молекули РНК та ДНК, такі як молекули вуиДНК. Термін "полінуклеотид" включає, без обмеження, одно- та дволанцюговий полінуклеотид.
І0091| Термін "досліджуваний зразок" у даному документі означає зразок, як правило, бо отриманий з біологічної рідини, клітини, тканини, органу або організму, що містить нуклеїнову кислоту або суміш нуклеїнових кислот, яка містить щонайменше одну послідовність нуклеїнової кислоти, скринінг якої проводять відносно варіації числа копій. Згідно з певними варіантами реалізації зразок містить щонайменше одну послідовність нуклеїнової кислоти, число копій якої, як очікується, піддалося варіації. Такі зразки включають, без обмеження, мокротиння/рідину ротової порожнини, амніотичну рідину, кров, фракцію крові або зразки тонкоголкової біопсії (наприклад, хірургічної біопсії, тонкоголкової біопсії і т.д.), сечу, перитонеальну рідину, плевральну рідину і т.п. Незважаючи на те, що зразок часто відбирають у суб'єкта-людини (наприклад, пацієнта), аналізи можна застосовувати для оцінки варіацій числа копій (ВЧК) у зразках від будь-якого ссавця, включаючи, без обмеження, собак, кішок, коней, кіз, овець, велику рогату худобу, свиней і т.д. Зразок можна застосовувати безпосередньо у тому вигляді, у якому він був отриманий з біологічного джерела, або після попередньої обробки для модифікації характеру зразку. Наприклад, така попередня обробка може включати одержання плазми із крові, розведення в'язких рідин і т.д. Способи попередньої обробки можуть також включати, без обмеження, фільтрацію, преципітацію, розведення, дистиляцію, перемішування, центрифугування, заморожування, ліофілізацію, концентрування, ампліфікацію, фрагментацію нуклеїнової кислоти, інактивацію інтерферуючих сполук, додавання реактивів, лізис і т.д. Якщо такі способи попередньої обробки застосовують відносно зразку, такі способи попередньої обробки, як правило, є такими, при яких нуклеїнова кислота або кислоти, що представляють інтерес, залишаються у досліджуваному зразку, іноді у концентрації, яка пропорційна концентрації у необробленому досліджуваному зразку (наприклад, а саме, у зразку, який не піддавали якому-небудь із таких способів попередньої обробки). Такі "оброблені" або "процесовані" зразки усе ще вважають біологічними "досліджуваними" зразками стосовно способів, описаних у даному документі. 0092) Термін "кваліфікаційний зразок" або "неуражений зразок" у даному документі означає зразок, що містить суміш нуклеїнових кислот, які присутні у відомому числі копій, з якими будуть порівнювати нуклеїнові кислоти у досліджуваному зразку, та являє собою зразок, який є нормальним, тобто не анеуплоїдним, відносно послідовності нуклеїнової кислоти, що представляє інтерес. Згідно з деякими варіантами реалізації кваліфікаційні зразки застосовують у якості неуражених навчальних зразків навчальної множини для одержання масок послідовності або профілів послідовності. Згідно з певними варіантами реалізації кваліфікаційні зразки застосовують для ідентифікації однієї або більше нормуючих хромосом або сегментів для розглянутої хромосоми. Наприклад, кваліфікаційні зразки можна застосовувати для ідентифікації нормуючої хромосоми для хромосоми 21. У такому випадку кваліфікаційний зразок являє собою зразок, відмінний від зразку трисомії 21. Інший приклад включає застосування як кваліфікаційні зразки для хромосоми Х винятково зразків жіночої статі. Кваліфікаційні зразки можна також застосовувати для інших цілей, таких як визначення порогів для прийняття рішення про уражені зразки, ідентифікація порогів для визначення областей масок на референсній послідовності, визначення очікуваного перекриття кількостей для різних областей геному і т.п.
Ї0093| Термін "навчальна множина" у даному документі означає множину навчальних зразків, яка може містити уражені та/або неуражені зразки та яку застосовують для розробки моделі для аналізу досліджуваних зразків. Згідно з деякими варіантами реалізації навчальна множина містить неуражені зразки. Згідно з даними варіантами реалізації пороги для визначення ВЧК встановлюють із застосуванням навчальних множин зразків, які є неураженими відносно варіації числа копій, що представляє інтерес. Неуражені зразки у навчальній безлічі можна застосовувати як кваліфікаційні зразки для ідентифікації нормуючих послідовностей, наприклад, нормуючих хромосом, та дози хромосом неуражених зразків застосовують для встановлення порогів для кожної з послідовностей, наприклад, хромосом, що представляють інтерес. Згідно з деякими варіантами реалізації навчальна множина містить уражені зразки.
Уражені зразки у навчальній множині можна застосовувати для підтвердження того, що уражені досліджувані зразки можна з легкістю відрізнити від неуражених зразків.
Ї0094| Навчальна множина являє собою також статистичний зразок у популяції, що представляє інтерес, причому статистичний зразок не слід плутати з біологічним зразком.
Статистичний зразок часто містить зразки від декількох індивідуумів, та дані від цих індивідуумів застосовують для визначення одного або більше кількісних значень, що представляють інтерес, що узагальнюються на популяцію. Статистичний зразок являє собою підмножину індивідуумів у популяції, що представляє інтерес. Індивідууми можуть являти собою осіб, тварин, тканини, клітини, інші біологічні зразки (тобто статистичний зразок може включати декілька біологічних зразків) та інших індивідуальних суб'єктів, що забезпечують дані спостережень для бо статистичного аналізу.
І0095)| Звичайно навчальну множину застосовують у комбінації з валідаційною множиною.
Термін "валідаційна множина" застосовують для позначення множини індивідуумів у статистичному зразку, причому дані від цих індивідуумів застосовують для валідації або оцінки кількісних значень, що представляють інтерес, визначених із застосуванням навчальної множини. Згідно з деякими варіантами реалізації, наприклад, навчальна множина забезпечує дані для обчислення маски для референсної послідовності, тоді як валідаційна множина забезпечує дані для оцінки правильності або ефективності маски.
І0096| "Оцінку числа копій" використовують у даному документі стосовно статистичної оцінки статусу генетичної послідовності відносно числа копій послідовності. Наприклад, згідно з деякими варіантами реалізації оцінка включає визначення присутності або відсутності генетичної послідовності. Згідно з деякими варіантами реалізації оцінка включає визначення часткової або повної анеуплоїдії генетичної послідовності. Згідно з іншими варіантами реалізації оцінка включає встановлення відмінностей між двома або більше зразками на підставі числа копій генетичної послідовності. Згідно з деякими варіантами реалізації оцінка включає статистичні аналізи, наприклад, нормування та порівняння, на підставі числа копій генетичної послідовності.
І0097| Термін "кваліфікаційна нуклеїнова кислота" застосовують взаємозамінно з "кваліфікаційною послідовністю", яка являє собою послідовність, з якою порівнюють кількість послідовності або нуклеїнової кислоти, що представляє інтерес. Кваліфікаційна послідовність являє собою таку, що присутня у біологічному зразку, переважно, з відомою представленістю, тобто кількість кваліфікаційної послідовності відома. Як правило, кваліфікаційна послідовність являє собою послідовність, що присутня у "кваліфікаційному зразку". "Кваліфікаційна послідовність, що представляє інтерес", являє собою кваліфікаційну послідовність, кількість якої у кваліфікаційному зразку відома, та являє собою послідовність, яка пов'язана з відмінністю послідовності, що представляє інтерес, між контрольним суб'єктом та індивідуумом з медичним станом.
І0098| Термін "послідовність, що представляє інтерес", або "послідовність нуклеїнової кислоти, що представляє інтерес", у даному документі означає послідовність нуклеїнової кислоти, яка пов'язана з відмінністю у представленості послідовності між здоровими та захворілими індивідуумами. Послідовність, що представляє інтерес, може являти собою послідовність на хромосомі, яка при захворюванні або генетичному стані представлена у перекрученому вигляді, тобто надмірно або недостатньо представлена. Послідовність, що представляє інтерес, може являти собою частину хромосоми, тобто сегмент хромосоми, або цілу хромосому. Наприклад, послідовність, що представляє інтерес, може являти собою хромосому, яка надмірно представлена при стані анеуплоїдії, або ген, що кодує супресор пухлини, який недостатньо представлений при раку. Послідовності, що представляють інтерес, включають послідовності, які надмірно або недостатньо представлені у загальній популяції або субпопуляції клітин суб'єкта. "Кваліфікаційна послідовність, що представляє інтерес", являє собою послідовність, що представляє інтерес, у кваліфікаційному зразку. "Досліджувана послідовність, що представляє інтерес", являє собою послідовність, що представляє інтерес, у досліджуваному зразку.
І0099| Термін "нормуюча послідовність" у даному документі означає послідовність, яку застосовують для нормування кількості міток послідовності, картованих на послідовності, що представляє інтерес, пов'язаній з нормуючою послідовністю. Згідно з деякими варіантами реалізації нормуюча послідовність містить стійку хромосому. "Стійка хромосома" являє собою хромосому, яка з низкою часткою імовірності є анеуплоїдною. У деяких випадках, що відносяться до хромосоми людини, стійка хромосома являє собою будь-яку хромосому, відмінну від Х-хромосоми, у-хромосоми, хромосоми 13, хромосоми 18 та хромосоми 21. Згідно з деякими варіантами реалізації нормуюча послідовність демонструє варіабельність відносно кількості міток послідовності, які картуються на неї серед зразків та серій секвенування, яка апроксимує варіабельність послідовності, що представляє інтерес, для якої її застосовують як параметр нормування. Нормуюча послідовність може відрізнити уражений зразок від одного або більше неуражених зразків. Згідно з деякими варіантами реалізації нормуюча послідовність краще або більш ефективно відрізняє уражений зразок від одного або більше неуражених зразків у порівнянні з іншими потенційними нормуючими послідовностями, такими як інші хромосоми.
Згідно з деякими варіантами реалізації варіабельність нормуючої послідовності обчислюють як варіабельність дози хромосоми для послідовності, що представляє інтерес, серед зразків та серій секвенування. Згідно з деякими варіантами реалізації нормуючі послідовності ідентифікують у множині неуражених зразків. бо 00100) "Нормуюча хромосома", "нормуюча хромосома у знаменнику" або "послідовність нормуючої хромосоми" являє собою приклад "нормуючої послідовності". "Послідовність нормуючої хромосоми" може складатися з однієї хромосоми або з групи хромосом. Згідно з деякими варіантами реалізації нормуюча послідовність містить дві або більше стійких хромосом. Згідно з певними варіантами реалізації стійкі хромосоми являють собою усі аутосомні хромосоми, відмінні від хромосом Х, У, 13, 18 та 21. "Нормуючий сегмент" являє собою інший приклад "нормуючої послідовності". "Послідовність нормуючого сегмента" може складатися з одного сегмента хромосоми або може складатися з двох або більше сегментів однієї і тієї ж або різних хромосом. Згідно з певними варіантами реалізації нормуюча послідовність призначена для нормування у відношенні варіабельності, такої як зв'язана з процесом, міжхромосомна (у одній серії визначень) варіабельність та варіабельність між секвенуваннями (у декількох серіях визначень).
І0О0101) Термін "диференційованість" у даному документі означає характеристику нормуючої хромосоми, яка дозволяє відрізнити один або більше неуражених, тобто нормальних, зразків від одного або більше уражених, тобто анеуплоїдних, зразків. Нормуюча хромосома демонструє найбільшу "диференційованість" являє собою хромосому або групу хромосом, які забезпечують найбільшу статистичну відмінність між розподілом доз хромосом для хромосоми, що представляє інтерес, у множині кваліфікаційних зразків та дози хромосоми для тієї ж хромосоми, що представляє інтерес, у відповідній хромосомі у одному або більше уражених зразках.
І00102)| Термін "варіабельність" у даному документі означає іншу характеристику нормуючої хромосоми, яка дозволяє відрізнити один або більше неуражених, тобто нормальних, зразків від одного або більше уражених, тобто анеуплоїдних, зразків. Варіабельність нормуючої хромосоми, яку вимірюють у множині кваліфікаційних зразків, означає варіабельність кількості міток послідовності, які картуються на неї, яка апроксимує варіабельність кількості міток послідовності, які картуються на хромосому, що представляє інтерес, для якої вона виступає як параметр нормування.
І00103)| Термін "щільність мітки послідовності" у даному документі означає кількість рідів послідовності, які картуються на послідовність референсного геному, наприклад, щільність мітки послідовності для хромосоми 21 являє собою кількість рідів послідовності, отриманих за допомогою способу секвенування, які картуються на хромосому 21 референсного геному.
І00104) Термін "співвідношення щільності мітки послідовності" у даному документі означає співвідношення кількості міток послідовності, які картуються на хромосому референсного геному, наприклад, хромосому 21, та довжини хромосоми референсного геному.
ІЇОО10О5| Термін "доза послідовності" у даному документі означає параметр, який співвідносить кількість міток послідовності або інший параметр, ідентифікований для послідовності, що представляє інтерес, з кількістю міток послідовності або іншим параметром, ідентифікованим для нормуючої послідовності. У деяких випадках доза послідовності являє собою співвідношення перекриття мітки послідовності або іншого параметру для послідовності, що представляє інтерес, та перекриття мітки послідовності або іншого параметру для нормуючої послідовності. У деяких випадках доза послідовності означає параметр, який співвідносить щільність мітки послідовності для послідовності, що представляє інтерес, із щільністю мітки послідовності нормуючої послідовності. "Доза досліджуваної послідовності" являє собою параметр, який співвідносить щільність мітки послідовності або інший параметр послідовності, що представляє інтерес, наприклад, хромосоми 21, з щільністю нормуючої послідовності, наприклад, хромосоми 9, визначеної у досліджуваному зразку. Аналогічно, "доза кваліфікаційної послідовності" являє собою параметр, який співвідносить щільність мітки послідовності або інший параметр послідовності, що представляє інтерес, з щільністю нормуючої послідовності, визначеної у кваліфікаційному зразку.
І0О0106) Термін "перекриття" означає надлишок міток послідовності, картованих на задану послідовність. Перекриття можна кількісно визначити на підставі щільності мітки послідовності (або підрахунку міток послідовності), співвідношення щільності мітки послідовності, кількості нормованого перекриття, підігнаних значень перекриття і т.д.
І00107| Термін "кількість перекриття" означає модифікацію первинного перекриття та часто являє собою відносну кількість міток послідовності (що іноді називається результатами підрахунку) у області геному, такій як блок. Кількість перекриття можна одержати за допомогою нормування, припасування та/або виправлення первинного перекриття або підрахованого значення для області геному. Наприклад, нормовану кількість перекриття для області можна одержати діленням підрахованої кількості міток послідовності, картованих на області, на сумарну кількість міток послідовності, картованих на цілому геномі. Нормована кількість бо перекриття дозволяє проводити порівняння перекриття блоку між різними зразками, які можуть характеризуватися різними глибинами секвенування. Нормована кількість перекриття відрізняється від дози послідовності тим, що останню, як правило, одержують діленням на кількість міток, картованих на підмножину цілого геному. Підмножина являє собою один або більше нормуючих сегментів або хромосом. Кількості перекриття, чи то нормовані чи не нормовані, можна коректувати з урахуванням глобального профілю варіації від області до області у геномі, варіацій фракції 5-С, випадаючих показників у стійких хромосомах і т.д.
І00108) Термін "секвенування нового покоління (СНП)» у даному документі означає способи секвенування, що дозволяють проводити широкомасштабне паралельне секвенування клонально ампліфікованих молекул та окремих молекул нуклеїнової кислоти. Необмежуючі приклади СНІП включають секвенування за допомогою синтезу із застосуванням оборотних барвників-термінаторів та секвенування за допомогою лігування.
І00109)| Термін "параметр" у даному документі означає числове значення, яке характеризує властивість системи. Часто параметр чисельно характеризує множину кількісних даних та/або числовий взаємозв'язок між множинами кількісних даних. Наприклад, співвідношення (або функцію співвідношення) між кількістю міток послідовності, картованих на хромосому, та довжиною хромосоми, на яку картовані мітки, являє собою параметр.
І00110| Терміни "порогове значення" та "кваліфікаційне порогове значення" у даному документі означають будь-яке число, яке застосовують у якості межі для характеризації зразку, такого як досліджуваний зразок, що містить нуклеїнову кислоту з організму, який, як підозрюють, страждає від медичного стану. Поріг можна порівняти зі значенням параметру для визначення того, чи сприяє зразок виникненню такого значення параметру, який свідчить, що організм страждає від медичного стану. Згідно з певними варіантами реалізації кваліфікаційне порогове значення обчислюють із застосуванням множини кваліфікаційних даних, та кваліфікаційне порогове значення виступає як межа діагностики варіації числа копій, наприклад, анеуплоїдії, у організмі. Якщо результати, отримані у результаті способів, розкритих у даному документі, перевершують поріг, у суб'єкта можна діагностувати варіацію числа копій, наприклад, трисомію 21. Відповідні порогові значення для способів, описаних у даному документі, можна ідентифікувати за допомогою аналізу нормованих значень (наприклад, доз хромосоми, МСМ (погтаїїгед спготозоте маїЇше, нормованого значення хромосоми) або М5М (поптаїїеа зедтепі маїче, нормованого значення сегменту)), обчислених для навчальної множини зразків. Порогові значення можна ідентифікувати із застосуванням кваліфікаційних (тобто неуражених) зразків у навчальній множині, яка містить як кваліфікаційні (тобто неуражені) зразки, так і уражені зразки.
Зразки у навчальній множині, які встановлено містять анеуплоїдії хромосом (тобто уражені зразки), можна застосовувати для підтвердження того, що обрані пороги є підходящими для встановлення відмінності уражених від неуражених зразків у досліджуваній множині (див. приклади, представлені у даному документі). Вибір порогу залежить від рівня вірогідності, який вибирає користувач для проведення класифікації. Згідно з деякими варіантами реалізації навчальна множина, застосовувана для ідентифікації відповідних граничних значень, містить щонайменше 10, щонайменше 20, щонайменше 30, щонайменше 40, щонайменше 50, щонайменше 60, щонайменше 70, щонайменше 80, щонайменше 90, щонайменше 100, щонайменше 200, щонайменше 300, щонайменше 400, щонайменше 500, щонайменше 600, щонайменше 700, щонайменше 800, щонайменше 900, щонайменше 1000, щонайменше 2000, щонайменше 3000, щонайменше 4000 або більше кваліфікаційних зразків. Для поліпшення діагностичної значимості граничних значень може характеризуватися перевагою застосування більших множин кваліфікаційних зразків. 00111) Термін "блок" означає сегмент послідовності або сегмент геному. Згідно з деякими варіантами реалізації блоки є безперервними один відносно іншого у межах геному або хромосоми. Кожен блок може визначати послідовність нуклеотидів у референсному геномі.
Розміри блоку можуть становити 1 т.о., 100 т.о., 1 Мб (мегабазу) і т.д. залежно від аналізу, який потрібний для конкретних застосувань, та щільності мітки послідовності. На додаток до положень у межах референсної послідовності блоки можуть мати інші характеристики, такі як перекриття зразку та структурні характеристики послідовності, такі як фракція 5-0.
І00112) Термін "поріг маскування" у даному документі означає кількість, з якою порівнюють значення, основане на кількості міток послідовності, у блоці послідовності, причому блоки, які характеризуються значеннями, що перевершують поріг маскування, маскують. Згідно з деякими варіантами реалізації поріг маскування може являти собою процентильний ранг, абсолютна кількість, показник якості картування або інші підходящі значення. Згідно з деякими варіантами реалізації поріг маскування можна задати як процентильний ранг коефіцієнта варіації серед множини неуражених зразків. Згідно з іншими варіантами реалізації поріг маскування можна 60 задати як показник якості картування, наприклад, показник Маро, який відноситься до надійності вирівнювання рідів послідовності з референсним геномом. Відзначимо, що порогове значення маскування відрізняється від порогового значення варіації числа копій (ВЧК), причому останнє являє собою межу, що характеризує зразок, що містить нуклеїнову кислоту з організму, який, як підозрюють, страждає від медичного стану, пов'язаного із ВЧК. Згідно з деяким варіантом реалізації порогове значення ВЧК задають у порівнянні з нормованим значенням хромосоми (поптаїїйлей сПгото5зоте маше, МСМ) або нормованим значенням сегменту (погтаїї;ей зедтепі маІне, ММ), описаними у даному документі у іншому місці.
І00113) Термін "нормоване значення" у даному документі означає числове значення, яке співвідносить кількість міток послідовності, ідентифікованих для послідовності (наприклад, хромосоми або сегмента хромосоми), що представляє інтерес, з кількістю міток послідовності, ідентифікованих для нормуючої послідовності (наприклад, нормуючої хромосоми або нормуючого сегменту хромосоми). Наприклад, "нормоване значення" може являти собою дози хромосоми, описані у даному документі у іншому місці, або може являти собою МСУ, або може являти собою М5У, описані у даному документі у іншому місці. 00114) Термін "рід" означає послідовність, отриману із частини зразку нуклеїнової кислоти.
Як правило, хоча й не обов'язково, рід являє собою коротку послідовність безперервних пар основ у зразку. Рід може бути представлений символічно послідовністю пар основ (у А, Т, С або б) частини зразку. Рід може зберігатися на запам'ятовувальному пристрої та оброблятися відповідним чином для визначення того, чи відповідає він референсній послідовності або чи відповідає іншим критеріям. Рід можна одержати безпосередньо з апарату секвенування або опосередковано з інформації про послідовність зразку, що зберігається. У деяких випадках рід являє собою послідовність ДНК достатньої довжини (наприклад, щонайменше приблизно 25 п.о.), яку можна застосовувати для ідентифікації більшої послідовності або області, наприклад, яку можна вирівняти та специфічно віднести до хромосоми або геномної області або гену. 00115) Термін "геномний рід" використовують по відношенню до рідів будь-яких сегментів у цілому геномі індивідуума.
І00116) Термін "мітка послідовності" у даному документі використовується взаємозамінно з терміном "мітка картованої послідовності" та означає рід послідовності, який було специфічно віднесено, тобто картовано, до більшої послідовності, наприклад, референсного геному, за допомогою вирівнювання. Мітки картованої послідовності є унікально картованими на референсний геном, тобто вони віднесені до одного розташування у референсному геномі.
Якщо не зазначене зворотне, мітки, які картуються на ту саму послідовність на референсній послідовності, підраховують один раз. Мітки можуть бути запропоновані у вигляді структур даних або інших сукупностей даних. Згідно з певними варіантами реалізації мітка містить послідовність ріду та зв'язану інформацію для даного ріду, таку як розташування послідовності у геномі, наприклад, положення на хромосомі. Згідно з певними варіантами реалізації положення зазначене для позитивної орієнтації ланцюга. Можна задати мітку, щоб забезпечити обмежену кількість невідповідності при вирівнюванні з референсним геномом. Згідно з деякими варіантами реалізації мітки, які можна картувати на більш ніж одне розташування на референсному геномі, тобто мітки, які не картуються унікально, можна не включати у аналіз.
І00117| Термін "не повторювана мітка послідовності" означає мітки послідовності, які не картуються на той самий сайт, які підраховують із метою визначення нормованих значень хромосом (МСМ) згідно з деякими варіантами реалізації. Іноді декілька рідів послідовності вирівнюються з тими самими розташуваннями на референсному геномі з одержанням повторюваних або дубльованих міток послідовності. Згідно з деякими варіантами реалізації мітки послідовності, що дублюються, які картуються на те саме положення, опускають або підраховують як одну "не повторювану мітку послідовності" з метою визначення МСУ. Згідно з деякими варіантами реалізації не повторювані мітки послідовності, вирівняні з невиключеними сайтами, підраховують для одержання "підрахованого значення невиключених сайтів" (підрахованих значень МЕ5, поп-ехсіцаеєа 5ійе) для визначення МСМ.
ЇО0О118| Термін "сайт" означає унікальне положення (тобто ідентифікатор хромосоми, положення та орієнтацію хромосоми) на референсному геномі. Згідно з деякими варіантами реалізації сайт може забезпечити положення для залишку, мітки послідовності або сегменту на послідовності. 00119) "Виключені сайти" являють собою сайти, виявлені у областях референсного геному, які були виключені з підрахованого значення міток послідовності. Згідно з деякими варіантами реалізації виключені сайти виявлені у областях хромосом, які містять повторювані послідовності, наприклад, центромери та теломери, та у областях хромосом, які є загальними для більше однієї хромосоми, наприклад, у областях, що присутні на У-хромосомі, які також бо присутні на Х-хромосомі.
00120) "Невиключені сайти" (МЕ5) являють собою сайти, які не виключені у референсному геномі при підрахунку міток послідовності.
І00121) "Підраховані значення невиключених сайтів" (підраховані значення МЕ5) являють собою кількості міток послідовності, які картуються на МЕ5 на референсному геномі. Згідно з деякими варіантами реалізації МЕ5З являють собою кількості не повторюваних міток послідовності, картованих на МЕ5. Згідно з деякими варіантами реалізації перекриття та зв'язані параметри, такі як нормовані кількості перекриття, глобальний профіль із усуненням кількостей перекриття та доза хромосоми, основані на підрахованих значеннях МЕ5. У одному прикладі дозу хромосоми обчислюють як співвідношення підрахованого значення МЕ5 для хромосоми, що представляє інтерес, та підрахованого значення для нормуючої хромосоми.
І00122| Нормовані значення хромосоми (МСМ) являє собою співвідношення перекриття досліджуваного зразку та перекриттів множини навчальних/кваліфікаційних зразків. Згідно з деякими варіантами реалізації МСМ основане на дозі хромосоми. Згідно з деякими варіантами реалізації МСМ відноситься до відмінності між дозою хромосоми для хромосоми, що представляє інтерес, у досліджуваному зразку та середнім значенням відповідної дози хромосоми у множині кваліфікаційних зразків та може бути обчислене як: мем; - НІ, о) де В та б, являють собою обчислене середнє значення та стандартне відхилення, відповідно, для дози |-ої хромосоми у множині кваліфікаційних зразків, та Хі являє собою спостережуване співвідношення |-ої хромосоми (дози) для досліджуваного зразку і. 00123) Згідно з деякими варіантами реалізації МСМ може бути вирахувано "на ходу" шляхом співвіднесення дози хромосоми для хромосоми, що представляє інтерес, у досліджуваному зразку, до медіани відповідної дози хромосоми у мультиплексних зразках, секвенованих у одних і тих же проточних комірках, як:
Хії -М;
МОМ; --- 5) де М; являє собою вирахувану медіану для дози )-ої хромосоми у множині мультиплексних зразків, секвенованих у одній і тій же проточній комірці; б, являє собою стандартне відхилення для дози І-ої хромосоми у одній або більше множинах мультиплексних зразків, секвенованих у одній або більше проточних комірках, та Хі являє собою спостережувану дозу |-ої хромосоми для досліджуваного зразку і. Відповідно до даного варіанту реалізації досліджуваний зразок і являє собою один з мультиплексних зразків, секвенованих у одній і тій же проточній комірці, з якої визначають М; . 00124) Наприклад, для хромосоми 21, що представляє інтерес, у досліджуваному зразку А, який секвенований як один з 64 мультиплексних зразків у одній проточній комірці, МСМ для хромосоми 21 у досліджуваному зразку А обчислюють як дозу хромосоми 21 у зразку А мінус медіана дози для хромосоми 21, визначеної у 64 мультиплексних зразках, розділену на стандартне відхилення дози для хромосоми 21, визначеної для 64 мультиплексних зразків у проточній комірці 1 або у додаткових проточних комірках. 00125) У даному документі терміни "вирівняний" або "вирівнювання" означають процес порівняння ріду або мітки з референсною послідовністю та за допомогою цього визначення того, чи містить референсна послідовність послідовність ріду. Якщо референсна послідовність містить рід, рід можна картувати на референсну послідовність або згідно з певними варіантами реалізації на конкретне розташування у референсній послідовності. У деяких випадках вирівнювання просто показує, чи є рід членом конкретної референсної послідовності чи ні (тобто є присутнім або відсутнім рід у референсній послідовності). Наприклад, вирівнювання ріду з референсною послідовністю для хромосоми людини 13 продемонструє, чи є присутнім рід у референсній послідовності для хромосоми 13. Інструмент, який забезпечує дану інформацію, можна назвати визначником приналежності множині. У деяких випадках вирівнювання додатково вказує на розташування у референсній послідовності, на яке картується рід або мітка. Наприклад, якщо референсна послідовність являє собою послідовність цілого гену людини, вирівнювання може вказати на те, що рід є присутнім на хромосомі 13, та може також указати на те, що рід знаходиться на конкретному ланцюзі та/або сайті хромосоми 13.
І00126| Вирівняні ріди або мітки являють собою одну або більше послідовностей, які ідентифіковані як збіг стосовно порядку їх молекул нуклеїнової кислоти з відомою послідовністю з референсного геному. Вирівнювання можна виконати вручну, незважаючи на те, що вирівнювання, як правило, здійснюють за допомогою комп'ютерного алгоритму, оскільки для реалізації способів, розкритих у даному документі, неможливо вирівняти ріди протягом розумного періоду часу. Прикладом алгоритму для вирівнювання послідовностей є комп'ютерна програма Енйісіепі І оса! АІїдптепі ої Мисіеоїіде бага (ЕГАМО, Ефективне локальне вирівнювання нуклеотидних даних), яку поширюють як частину асортиментів програм Сепотіс5 Апаїувзів (Геномний аналіз) компанії Шитіпа. Альтернативно, для вирівнювання ріди з референсними геномами можна застосовувати фільтр Віоот або аналогічний визначник приналежності множині. Див. заявку на патент США Мо 61/552,374, подану 27 жовтня 2011 року, яка повністю включена у даний документ за допомогою посилання. Збіг послідовності ріди у вирівнюванні може становити 100 95 збігу послідовності або менше 100 95 (неідеальний збіг).
І00127| Термін "картування" у даному документі означає специфічне віднесення послідовності ріду до більшої послідовності, наприклад, референсного геному, за допомогою вирівнювання. 00128) У даному документі термін "референсний геном" або "референсна послідовність" означає будь-яку відому конкретну послідовність геному, чи то часткову чи повну, будь-якого організму або вірусу, яку можна застосовувати для порівняння з ідентифікованими послідовностями від суб'єкта. Наприклад, референсний геном, застосовуваний у випадку суб'єктів-людей, а також багатьох інших організмів, можна знайти у Національному центрі біотехнологічної інформації (Маїйопа! Сепієг їог Віоїесппоіоду Іптоптасйоп) за адресою пебі.піт.пій.дом. "Геном" означає повну генетичну інформацію організму або вірусу, виражену у послідовностях нуклеїнової кислоти. 001291 Згідно з різними варіантами реалізації референсна послідовність є значно більшою, ніж ріди, які з нею вирівнюють. Наприклад, референсна послідовність може бути щонайменше приблизно у 100 разів білошою, або щонайменше приблизно у 1000 разів більшою, або щонайменше приблизно у 10000 разів більшою, або щонайменше приблизно у 107 разів більшою, або щонайменше приблизно у 1059 разів більшою, або щонайменше приблизно у 107 разів більшою.
І0О0130) У одному прикладі референсна послідовність являє собою таку повної довжини гену людини. Такі послідовності можна назвати геномними референсними послідовностями. У іншому прикладі референсна послідовність обмежена конкретною хромосомою людини, такою як хромосома 13. Згідно з деякими варіантами реалізації референсна У-хромосома являє собою послідовність У-хромосоми з гену людини версії п919. Такі послідовності можна назвати референсними послідовностями хромосоми. Інші приклади референсних послідовностей включають геноми інших видів, а також хромосоми, субхромосомні області (такі як ланцюги) і т.д. будь-якого виду.
Ї0О0131| Згідно з різними варіантами реалізації референсна послідовність являє собою консенсусну послідовність або іншу комбінацію, отриману від декількох індивідуумів. Однак у певних варіантах застосування референсна послідовність може бути отримана від конкретного індивідуума. 00132) Термін "клінічно значима послідовність" у даному документі означає послідовність нуклеїнової кислоти, яка, як відомо або як припускають, пов'язана з генетичним станом або станом захворювання або залучена у такий стан. Визначення відсутності або присутності клінічно значимої послідовності може бути підходящим при визначенні діагнозу або при підтвердженні діагнозу медичного стану або при складанні прогнозу розвитку захворювання. 00133) Термін "отриманий" при використанні у контексті нуклеїнової кислоти або суміші нуклеїнових кислот у даному документі означає засоби, за допомогою яких нуклеїнову кислоту або кислоти одержують із джерела, з якого вони походять. Наприклад, відповідно до одного варіанту реалізації суміш нуклеїнових кислот, яка отримана із двох різних геномів, означає, що нуклеїнові кислоти, наприклад, виДНК, були природним шляхом вивільнені клітинами у результаті процесів, що зустрічаються у природі, таких як некроз або апоптоз. Згідно з іншим варіантом реалізації суміш нуклеїнових кислот, яка отримана із двох різних геномів, означає, що нуклеїнові кислоти були екстраговані із двох різних типів клітин від суб'єкта.
І00134| Термін "основане на" при використанні у контексті одержання конкретного кількісного значення у даному документі означає застосування іншої кількості як вхідних даних 60 для обчислення конкретного кількісного значення як вихідних даних.
ІЇО0135| Термін "зразок від пацієнта" у даному документі означає біологічний зразок, отриманий від пацієнта, тобто реципієнта медичного обслуговування, допомоги або лікування.
Зразок від пацієнта може являти собою будь-які зразки, описані у даному документі. Згідно з певними варіантами реалізації зразок від пацієнта отриманий у результаті неінвазивних процедур, наприклад, зразок периферичної крові або зразок випорожнення. Способи, описані у даному документі, не слід обмежувати людьми. Таким чином, передбачені різні ветеринарні варіанти застосування, у випадку яких зразок від пацієнта може являти собою зразок від ссавця, відмінного від людини (наприклад, кішок, свиней, коней, великої рогатої худоби і т.п.).
І00136| Термін "змішаний зразок" у даному документі означає зразок, що містить суміш нуклеїнових кислот, отриманих з різних геномів.
ІЇ00137| Термін "материнський зразок" у даному документі означає біологічний зразок, отриманий від вагітного суб'єкта, наприклад, жінки.
ІЇО0138| Термін "біологічна рідина" у даному документі означає рідину, відібрану з біологічного джерела, та включає, наприклад, кров, сироватку, плазму, мокротиння, промивну рідину, спинномозкову рідину, сечу, сім'яну рідину, піт, сльози, слину і т.п. У даному документі терміни "кров", "плазма" та "сироватка" однозначно включають фракції або їх оброблені частини. Аналогічно, коли зразок відбирають із біопсії, мазка, зіскрібка і т.д., "зразок" однозначно включає процесовану фракцію або частину, отриману з біопсії, мазка, зіскрібка і т.д.
І00139)| Терміни "материнські нуклеїнові кислоти" та "нуклеїнові кислоти плода" у даному документі означають нуклеїнові кислоти вагітного суб'єкта жіночої статі та нуклеїнові кислоти плода, виношуваного вагітним суб'єктом жіночої статі, відповідно. 00140) У даному документі термін "відповідний" іноді означає послідовність нуклеїнової кислоти, наприклад, ген або хромосому, яка присутня у геномі різних суб'єктів та яка необов'язково характеризуються однаковою послідовністю у всіх геномах, але яка виступає для забезпечення ідентичності замість генетичної інформації послідовності, що представляє інтерес, наприклад, гену або хромосоми. 00141) У даному документі термін "фракція плода" означає фракцію нуклеїнових кислот плода, що присутня у зразку, що містить нуклеїнові кислоти плода та матері. Фракції плода часто застосовують для характеризації вшциДНК у крові матері.
І00142| У даному документі термін "хромосома" означає носій генів живої клітини, що забезпечує спадковість, який отриманий з ланцюгів хроматину, що містять ДНК та білкові компоненти (зокрема, гістони). У даному документі застосовують загальноприйняту міжнародно визнану систему нумерації окремих хромосом гену людини. 00143) У даному документі термін "довжина полінуклеотиду" означає абсолютну кількість нуклеотидів у послідовності або у області референсного геному. Термін "довжина хромосоми" означає відому довжину хромосоми, наведену у парах основ, наприклад, представлену у зборці
МСВІЗ6/п1918 хромосом людини, яку можна знайти у мережі Інтернет за адресою: депоте|.|ис5с|Деди/сді-біп/пд Тгаско ?пдвіа-1671556138спготіпіоРаде-.
І00144| Термін "суб'єкт" у даному документі означає суб'єкта-людину, а також суб'єкта, відмінного від людини, такого як ссавець, безхребетна тварина, хребетна тварина, гриби, дріжджі, бактерії та вірус. Незважаючи на те, що приклади у даному документі відносяться до людей, та опис переважно спрямований на проблеми людини, концепції, розкриті у даному документі, застосовні до геномів будь-якої рослини або тварини та є підходящими у областях ветеринарної медицини, наук про тварин, у дослідницьких лабораторіях і т.п. 00145) Термін "стан" у даному документі означає "медичний стан" як широкий термін, який включає всі захворювання та розлади, але може включати ураження та нормальні стани здоров'я, такі як вагітність, які можуть впливати на здоров'я суб'єкта, одержувати користь від медичної допомоги або мати наслідки для медичного лікування. 00146) Термін "повна" при використанні по відношенню до анеуплоїдії хромосом у даному документі означає додавання або втрату цілої хромосоми.
І00147| Термін "часткова" при використанні по відношенню до анеуплоїдії хромосом у даному документі означає додавання або втрату частини, тобто сегмента, хромосоми. 00148) Термін "мозаїк" у даному документі означає присутність у одного індивідуума, який розвився з однієї заплідненої яйцеклітини, двох популяцій клітин з різними каріотипами.
Мозаїцизм може бути наслідком мутації у процесі розвитку, яка передалася винятково підмножині дорослих клітин. 001491) Термін "немозаїчний" у даному документі означає організм, наприклад, плід людини, що складається із клітин одного каріотипу. 00150) Термін "чутливість" у даному документі означає ймовірність того, що результати бо аналізу будуть позитивними, якщо є присутнім стан, що представляє інтерес. Чутливість можна обчислити як кількість істинно позитивних результатів, розділену на суму істинно позитивних та псевдо негативних результатів.
І0О0151) Термін "специфічність" у даному документі означає ймовірність того, що результати аналізу будуть негативними, якщо відсутній стан, що представляє інтерес. Специфічність можна обчислити як кількість істинно негативних результатів, розділену на суму істинно негативних та псевдо позитивних результатів. 00152) Термін "збагачувати" у даному документі означає процес ампліфікації поліморфних цільових нуклеїнових кислот, які містяться у частині материнського зразка, та об'єднання ампліфікованого продукту з материнським зразком, що залишився, з якого була відібрана частина. Наприклад, материнський зразок, що залишився, може являти собою вихідний материнський зразок. 00153) Термін "вихідний материнський зразок" у даному документі означає незбагачений біологічний зразок, отриманий від вагітного суб'єкта, наприклад, жінки, що виступає в якості джерела, від якого відбирають частину для ампліфікації поліморфних цільових нуклеїнових кислот. "Вихідний зразок" може являти собою будь-який зразок, отриманий від вагітного суб'єкта, та процесовані фракції даного зразку, наприклад, очищений зразок вуднК, екстрагований зі зразка материнської плазми.
І00154| Термін "праймер" у даному документі означає виділений олігонуклеотид, який здатний виступати у якості точки ініціації синтезу при поміщенні в умови, що викликають синтез продукту подовження (наприклад, умови включають нуклеотиди, індукуючий агент, такий як
ДНК-полімераза, та підходящі температуру та рН). Праймер переважно є одноланцюговим для максимальної ефективності при ампліфікації але, у якості альтернативи, може бути дволанцюговим. У випадку дволанцюгового праймеру праймер спочатку обробляють із метою розділення його ланцюгів перед застосуванням для одержання продуктів подовження.
Переважно, праймер являє собою олігодезоксирибонуклеотид. Праймер повинен бути досить довгим, щоб запускати синтез продуктів подовження у присутності індукуючого агенту. Точні довжини праймерів залежать від множини факторів, включаючи температуру, джерело праймеру, застосування способу та параметри, застосовувані для розробки праймеру.
Введення та контекст 00155) ВЧК у геномі людини у значній мірі впливає на етнічну різноманітність та схильність людини до захворювань (Кедоп еї аїЇ., Майте 23:444-454 |(2006), 5паїки еї а. Сепоте Нев5 19:1682-1690 (20091). Такі захворювання включають, без обмеження, рак, інфекційні та аутоїмунні захворювання, захворювання нервової системи, метаболічні та/або серцево-судинні захворювання і т.п. 00156) Відомо, що ВЧК сприяє генетичним захворюванням за допомогою різних механізмів, які приводять у більшості випадків до дисбалансу дози гену або до руйнування гену. Відомо, що на додаток до прямої кореляції з генетичними розладами ВЧК опосередковують фенотипові зміни, які можуть бути пагубними. Нещодавно у декількох дослідженнях було повідомлено про збільшене навантаження рідкісної ВЧК або ВЧК де помо при комплексних порушеннях, таких як аутизм, СДУГ (синдром дефіциту уваги при гіперактивності) та шизофренія, у порівнянні з нормальними контролями, що підкреслює потенційну патогенність рідкісної або унікальної ВЧК (Зебаї еї аї!., 316:445-449 (2007); УМаїви еї аї., Зсіепсе 320:539 - 543 (20081). ВЧК виникають у результаті геномних реаранжувань, переважно, внаслідок явищ делеції, дуплікації, вставки та незбалансованої транслокації.
І00157| Було показано, що фрагменти вцДНК плідного походження у середньому є більш короткими, ніж такі материнського походження. Успішно застосовували НІПТ (неінвазивне пренатальне тестування), основане на даних СНП. У застосовуваних на сьогоднішній день методологіях використовують секвенування материнських зразків із застосуванням коротких рідів (25 п.о. - 36 п.о.), вирівнювання з геномом, комп'ютеризоване обчислення та нормування субхромосомного перекриття та, нарешті, оцінку надмірної представленості цільових хромосом (13/18 / 21/ Х / ХУ) у порівнянні з очікуваним нормованим перекриттям, пов'язаним з нормальним диплоїдним геномом. Таким чином, традиційний аналіз та дослідження НІПТ основані на підрахованих значеннях або перекритті для оцінки правдоподібності анеуплоїдії плода.
І00158) Оскільки зразки материнської плазми являють собою суміш материнської та плідної
ВуЦДНК, успіх будь-якого даного способу НІПТ залежить від його чутливості для виявлення змін числа копій у незначних зразках фракції плода. Для способів, основаних на підрахованому значенні, чутливість визначається (а) глибиною секвенування та (Б) здатністю нормування даних знижувати технічну дисперсію. У даному винаході запропонована аналітична методологія для НІПТ та інших варіантів застосування за допомогою одержання інформації про розмір бо фрагмента з, наприклад, ріду спарених кінців, та застосування даної інформації у аналізі асортименту. Поліпшена аналітична чутливість забезпечує здатність застосовувати способи
НІПТ при зниженому перекритті (наприклад, зниженій глибині секвенування), що уможливлює застосування технології для недорого дослідження середнього ризику вагітностей. 00159) У даному документі розкриті способи, апарати та системи для визначення числа копій та варіацій числа копій (ВЧК) різних послідовностей, що представляють інтерес, у досліджуваному зразку, який містить суміш нуклеїнових кислот, отриману із двох або більше різних геномів, та який, як відомо або як припускають, відрізняється кількістю однієї або більше послідовностей, що представляють інтерес. Варіації числа копій, визначені із застосуванням способів та апаратів, розкритих у даному документі, включають додавання або втрати цілих хромосом, зміни, що зачіпають дуже великі сегменти хромосом, які є видимими під мікроскопом, та надлишок субмікроскопічних варіацій числа копій сегментів ДНК, що варіюються за розміром від одного нуклеотиду до тисяч основ (т.0.) та мегабаз (Мб).
І00160) Згідно з деякими варіантами реалізації запропоновані способи визначення варіації числа копій (ВЧК) плодів із застосуванням материнських зразків, що містять материнську та безклітинну ДНК плода. У деяких варіантах реалізації застосовують довжину фрагменту (або розмір фрагменту) вцДНК для поліпшення чутливості та специфічності з метою виявлення анеуплоїдії плода з вцДНК у материнській плазмі. Деякі варіанти реалізації здійснюють із одержанням бібліотек без застосування ПЛР у комбінації із секвенуванням спарених кінців ДНК.
Згідно з деякими варіантами реалізації для посилення виявлення анеуплоїдії плода застосовують як розмір фрагмента, так і перекриття. Згідно з деякими варіантами реалізації способи включають об'єднання незалежного підрахунку більш коротких фрагментів з відносною фракцією більш коротких фрагментів у блоках у межах геному.
І0О0161) У деяких варіантах реалізації, розкритих у даному документі, запропоновані способи поліпшення чутливості та/або специфічності аналізів даних послідовності за допомогою усунення внутрішньовибіркової похибки вмісту С. Згідно з деякими варіантами реалізації усунення внутрішньовибіркової похибки вмісту (С основане на даних послідовності, відкоректованих з урахуванням систематичної варіації, розповсюдженої у межах неуражених навчальних зразків.
ЇО0О162| У деяких розкритих варіантах реалізації запропоновані способи одержання параметрів з високим співвідношенням сигнал/шум із фрагментів безклітинної нуклеїнової кислоти для визначення різних генетичних станів, пов'язаних із числом копій та ВЧК, з поліпшеною чутливістю, селективністю та/або ефективністю у порівнянні із загальноприйнятими способами. Параметри включають, без обмеження, перекриття, зважене за розміром фрагменту перекриття, фракцію або відношення фрагментів у заданому діапазоні, рівень метилювання фрагментів, Ї-статистику, отриману з перекриття, оцінки фракції плода, отримані з інформації про перекриття, і т.д. Було встановлено, що представлений процес є особливо ефективним для поліпшення сигналу у зразках, що містять відносно низькі фракції ДНК із розглянутого геному (наприклад, геному плода). Приклад такого зразку являє собою зразок материнської крові від індивідуума, вагітного різнояйцевими близнюками, трійнею і т.д., при якому процес оцінює варіацію числа копій у геномі одного із плодів.
ІО0О163| Згідно з деякими варіантами реалізації високих аналітичних чутливостей та специфічностей можна досягти при простому одержанні бібліотеки із застосуванням дуже низької кількості вцДНК на вході, для якого не потрібно ПЛР-ампліфікації. Спосіб без застосування ПЛР спрощує робочий процес, поліпшує час обороту та усуває похибки, властиві способам на основі ПЛР. Згідно з деякими варіантами реалізації виявлення анеуплоїдії плода з материнської плазми можна провести за більш надійним та ефективним способом, ніж загальноприйняті способи, з потребою у меншій кількості унікальних фрагментів вуиДНК. У комбінації поліпшену аналітичну чутливість та специфічність досягають із дуже швидким часом обороту при значно меншій кількості фрагментів вц8ДНК. Це потенційно дозволяє проводити
НІПТ зі значно меншими витратами для полегшення застосування у загальній популяції вагітних. 00164) Згідно з різними варіантами реалізації за допомогою розкритих способів можливе одержання бібліотеки без застосування ПЛР. Деякі варіанти реалізації усувають похибки, властиві способам ПЛР, знижують складність аналізу, знижують необхідну глибину секвенування (у 2,5 рази), забезпечують більш швидкий час обороту, наприклад, оборот за один день, уможливлюють внутрішнє вимірювання фракції плода (ФП), полегшують встановлення відмінностей між материнською та плідною/плацентарною вцдДнНК із застосуванням інформації про розмір фрагменту.
Оцінка ВЧК бо Способи визначення ВЧК
00165) Із застосуванням значення перекриття послідовності, параметрів розміру фрагментів та/або рівнів метилювання, забезпечених у способах, розкритих у даному документі, можна визначити різні генетичні стани, пов'язані із числом копій та ВЧК послідовностей, хромосом або сегментів хромосом з поліпшеною чутливістю, селективністю та/або ефективністю у порівнянні із застосуванням значень перекриття послідовності, отриманих за загальноприйнятими способами. Наприклад, згідно з деякими варіантами реалізації для визначення присутності або відсутності будь-яких двох або більше різних повних анеуплоїдій хромосом плода у досліджуваному материнському зразку, що містить молекули плідної та материнської нуклеїнової кислоти, застосовують масковані референсні послідовності. У ілюстративних способах, запропонованих нижче, ріди вирівнюють із референсними послідовностями (включаючи референсні геноми). Вирівнювання можна здійснити з немаскованою або маскованою референсною послідовністю, за допомогою цього одержуючи мітки послідовності, картовані на референсній послідовності. Згідно з деякими варіантами реалізації для визначення варіації числа копій враховують винятково мітки послідовності, що попадають у немасковані сегменти референсної послідовності.
І00166| Згідно з деякими варіантами реалізації оцінка зразку нуклеїнової кислоти у відношенні ВЧК включає характеризацію статусу анеуплоїдії хромосом або анеуплоїдії сегменту за допомогою одного із трьох типів рішень: "нормальний" або "неуражений", "уражений" та "рішення відсутнє". Пороги для прийняття рішення про нормальні та уражені зразки, як правило, встановлені. У зразку вимірюють параметр, пов'язаний з анеуплоїдією або іншою варіацією числа копій, та вимірюване значення порівнюють із порогами. Для анеуплоїдій типу дуплікації рішення про уражений зразок приймають, якщо хромосома або доза сегмента (або інше вимірюване значення вмісту послідовності) перевищує певний поріг, заданий для уражених зразків. Для таких анеуплоїдій рішення про нормальні зразки приймають, якщо доза хромосоми або сегмента нижче порога, заданого для нормальних зразків. Навпаки, для анеуплоїдій типу делеції рішення про уражені зразки приймають, якщо доза хромосоми або сегмента нижче певного порогу для уражених зразків, та рішення про нормальні зразки приймають, якщо доза хромосоми або сегмента вище порога, заданого для нормальних зразків. Наприклад, у випадку присутності трисомії рішення "нормальний" визначають значенням параметру, наприклад, дози досліджуваної хромосоми, який нижче заданого користувачем порогу надійності, та рішення "уражений" визначають на підставі параметру, наприклад, дози досліджуваної хромосоми, який вище заданого користувачем порогу надійності. Результат "рішення відсутнє" визначають на підставі параметру, наприклад, дози досліджуваної хромосоми, який лежить між порогами для прийняття рішення "нормальний" або "уражений". Термін "рішення відсутнє" застосовують взаємозамінно з терміном "некласифікований".
ІЇ00167| Параметри, які можна застосовувати для визначення ВЧК, включають, без обмеження, перекриття, зміщене/зважене за розміром фрагменту перекриття, фракцію або відношення фрагментів у заданому діапазоні розміру та рівень метилювання фрагментів. Як обговорюється у даному документі, перекриття одержують із підрахованих значень рідів, вирівняних з областю референсного геному та необов'язково нормованих для одержання підрахованих значень мітки послідовності. Згідно з деякими варіантами реалізації підраховані значення мітки послідовності можна зважити за розміром фрагменту. 00168) Згідно з деякими варіантами реалізації параметр розміру фрагменту зміщений убік характеристики розміру фрагментів одного з геномів. Параметр розміру фрагменту являє собою параметр, який відноситься до розміру фрагмента. Параметр зміщений убік розміру фрагмента, коли: 1) параметр сприятливо зважується за розміром фрагменту, наприклад, обчислення має більшу вагу за розміром, ніж для інших розмірів; або 2) параметр отриманий зі значення, яке сприятливо зважується за розміром фрагменту, наприклад, співвідношення отримане з підрахованого значення, який має більшу вагу за розміром. Розмір являє собою характеристику геному, коли геном характеризується збагаченою або більшою концентрацією розміру нуклеїнової кислоти у порівнянні з іншим геномом або іншою частиною того ж геному.
ЇО0О169| Згідно з деякими варіантами реалізації спосіб визначення присутності або відсутності будь-яких повних анеуплоїдій хромосом плода у материнському досліджуваному зразку включає (а) приймання інформації про послідовність для нуклеїнових кислот плода та матері у материнському досліджуваному зразку; (б) застосування інформації про послідовність та способу, описаного вище, для ідентифікації кількості міток послідовності, кількості перекриття послідовності, параметру розміру фрагменту або іншого параметру для кожної із хромосом, що представляють інтерес, вибраних із хромосом 1 - 22, Х та У, та для ідентифікації кількості міток послідовності або іншого параметру для однієї або більше послідовностей нормуючої бо хромосоми; (с) застосування кількості міток послідовності або іншого параметру,
ідентифікованого для кожної із хромосом, що представляють інтерес, та кількості міток послідовності або іншого параметру, ідентифікованого для кожної із нормуючих хромосом, для обчислення дози однієї хромосоми для кожної із хромосом, що представляють інтерес; та (а) порівняння кожної дози хромосоми із пороговим значенням та за допомогою цього визначення присутності або відсутності будь-яких повних анеуплоїдій хромосом плода у материнському досліджуваному зразку.
І00170| Згідно з деякими варіантами реалізації етап (а), описаний вище, може включати секвенування щонайменше частини молекул нуклеїнової кислоти досліджуваного зразку для одержання зазначеної інформації про послідовність для молекул нуклеїнової кислоти плода та матері досліджуваного зразку. Згідно з деякими варіантами реалізації етап (с) включає обчислення дози однієї хромосоми для кожної із хромосом, що представляють інтерес, як співвідношення кількості міток послідовності або іншого параметру, ідентифікованого для кожної із хромосом, що представляють інтерес, та кількості міток послідовності або іншого параметру, ідентифікованого для послідовності або послідовностей нормуючої хромосоми.
Відповідно до деяких інших варіантів реалізації доза хромосоми основана на кількостях перекриття процесованої послідовності, отриманих з кількості міток послідовності або іншого параметру. Згідно з деякими варіантами реалізації для обчислення кількостей перекриття процесованої послідовності або іншого параметру застосовують винятково унікальні мітки послідовності, що не повторюються. Згідно з деякими варіантами реалізації кількість перекриттів процесованої послідовності являє собою співвідношення щільності мітки послідовності, яке являє собою кількість мітки послідовності, стандартизовану по довжині послідовності. Згідно з деякими варіантами реалізації кількість перекриття процесованої послідовності або інший параметр являє собою нормовану мітку послідовності або інший нормований параметр, який являє собою кількість міток послідовності або інший параметр послідовності, що представляє інтерес, розділений на такий усього геному або значної його частини. Згідно з деякими варіантами реалізації кількість перекриття процесованої послідовності або інший параметр, такий як параметр розміру фрагменту, підганяють відповідно до глобального профілю послідовності, що представляє інтерес. Згідно з деякими варіантами реалізації кількість перекриття процесованої послідовності або інший параметр підганяють відповідно до внутрішньовибіркової кореляції між вмістом СС та перекриттям послідовності для зразку, дослідження якого проводять. Згідно з деякими варіантами реалізації кількість перекриття процесованої послідовності або інший параметр одержують із комбінацій даних процесів, які додатково описані у даному документі у іншому місці.
ІЇ0О0171| Згідно з деякими варіантами реалізації дозу хромосоми обчислюють у вигляді співвідношення перекриття процесованої послідовності або іншого параметру для кожної із хромосом, що представляють інтерес, та такого для послідовності або послідовностей нормуючої хромосоми. 001721 Згідно з будь-яким з варіантів реалізації, описаних вище, повні анеуплоїдії хромосом вибрані з повних трисомій хромосом, повних моносомій хромосом та повних полісомій хромосом. Повні анеуплоїдії хромосом вибрані з повних анеуплоїдій будь-якої із хромосом 1 - 22, Х та У. Наприклад, зазначені різні повні анеуплоїдії хромосом плода вибрані із трисомії 2, трисомії 8, трисомії 9, трисомії 20, трисомії 21, трисомії 13, трисомії 16, трисомії 18, трисомії 22, 47 ХХХ, 47 ХУ та моносомії Х. 00173) Згідно з будь-яким з варіантів реалізації, описаних вище, етапи (а)-(4) повторюють для досліджуваних зразків від різних материнських суб'єктів, та спосіб включає визначення присутності або відсутності будь-яких двох або більше різних повних анеуплоїдій хромосом плода у кожному з досліджуваних зразків.
Ї00174| Згідно з будь-яким з варіантів реалізації описаних вище, спосіб може також включати обчислення нормованого значення хромосоми (МСМ), де МСМ являє собою відношення дози хромосоми до середнього значення відповідної дози хромосоми у множині кваліфікаційних зразків, обчислене як: мем; - ОМ, о) де В та бфявляють собою обчислене середнє значення та стандартне відхилення, відповідно, для дози І-ої хромосоми у багатьох кваліфікаційних зразках, та Хі являє собою спостережувану дозу |-0ої хромосоми для досліджуваного зразку і. 00175) Згідно з деякими варіантами реалізації МСМ може бути обчислене "на ходу" за допомогою співвіднесення дози хромосоми для хромосоми, що представляє інтерес, у досліджуваному зразку до медіани відповідної дози хромосоми у мультиплексних зразках, секвенованих у тих самих проточних комірках, як:
Хі - М,
МОМ; --- 5) де М; являє собою обчислену медіану для дози і-ої хромосоми у багатьох мультиплексних зразках, секвенованих у одній і тій же проточній комірці; б, являє собою стандартне відхилення для дози |-0ї хромосоми у одній або більше множинах мультиплексних зразків, секвенованих у одній або більше проточних комірках, та х; являє собою спостережувану дозу |-ої хромосоми для досліджуваного зразку і. Згідно з даним варіантом реалізації досліджуваний зразок і являє собою один з мультиплексних зразків, секвенованих у одній і тій же проточній комірці, для якої визначають М; .
Ї00176| Згідно з деякими варіантами реалізації запропонований спосіб визначення присутності або відсутності різних часткових анеуплоїдій хромосом плода у материнському досліджуваному зразку, що містить нуклеїнові кислоти плода та матері. Спосіб включає процедури, аналогічні способу виявлення повної анеуплоїдії, викладеному вище. Однак замість аналізу повної хромосоми аналізують сегмент хромосоми. Див. публікацію заявки на патент
США Ме 2013/0029852, яка включена у дану заявку за допомогою посилання.
І00177| На фігурі 1 представлений спосіб визначення присутності варіації числа копій згідно з деякими варіантами реалізації. У процесі 100, проілюстрованому на фігурі 1, для визначення
ВЧК застосовують перекриття мітки послідовності, основане на кількості міток послідовності (тобто на підрахованому значенні мітки послідовності). Однак аналогічно опису вище для визначення МСУ, замість перекриття можна застосовувати інші змінні або параметри, такі як розмір, співвідношення розміру та рівень метилювання. Згідно з деякими варіантами реалізації для визначення ВЧК поєднують дві або більше змінних. Більше того, перекриття та інші параметри можна зважити за розміром фрагментів, з яких були отримані мітки. Для зручності читання у процесі 100, проілюстрованому на фігурі 1, згадане винятково перекриття, але слід зазначити, що замість перекриття можна застосовувати інші параметри, такі як розмір, співвідношення розміру та рівень метилювання, підраховане значення, зважене за розміром, і т.д. 00178) У операціях 130 та 135 визначають перекриття кваліфікаційної мітки послідовності (або значення іншого параметру) та перекриття мітки досліджуваної послідовності (або значення іншого параметру). У даному винаході запропоновані процеси для визначення кількостей перекриття, які забезпечують поліпшену чутливість та селективність у порівнянні із загальноприйнятими способами. Операції 130 та 135 відзначені зірочками та виділені рамками з жирними лініями для вказівки на те, що дані операції сприяють поліпшенню у порівнянні з попереднім рівнем техніки. Згідно з деякими варіантами реалізації кількості перекриття мітки послідовності нормують, підганяють, цензурують та іншим способом процесують для поліпшення чутливості та селективності аналізу. Дані процеси додатково описані у даному документі у іншому місці. 00179) З погляду загального представлення у способі при визначенні ВЧК досліджуваних зразків застосовують нормуючі послідовності кваліфікаційних навчальних зразків. Згідно з деякими варіантами реалізації кваліфікаційні навчальні зразки є неураженими та характеризуються нормальним числом копій. Нормуючі послідовності забезпечують механізм для нормування вимірювань з метою визначення варіабельностей у одній серії визначень та у декількох серіях визначень. Нормуючі послідовності ідентифікують із застосуванням інформації про послідовність із множини кваліфікаційних зразків, отриманих від суб'єктів, які встановлено містять клітини, що характеризуються нормальним числом копій будь-якої однієї послідовності, що представляє інтерес, наприклад, хромосоми або її сегменту. Визначення нормуючих послідовностей презентовано на етапах 110, 120, 130, 145 та 146 варіанту реалізації способу, зображеного на фігурі 1. Згідно з деякими варіантами реалізації нормуючі послідовності застосовують для обчислення дози послідовності для досліджуваних послідовностей. Див. етап 150. Згідно з деякими варіантами реалізації, нормуючі послідовності також застосовують для обчислення порогу, з яким порівнюють дозу послідовності досліджуваних послідовностей. Див. етап 150. Інформацію про послідовність, отриману з нормуючої послідовності та досліджуваної послідовності, застосовують для визначення статистично значимої ідентифікації анеуплоїдій хромосом у досліджуваних зразках (етап 160). 00180) Переходячи до деталей способу визначення присутності варіації числа копій, згідно з деякими варіантами реалізації на фігурі 1 представлена блок-схема 100 варіанту реалізації для визначення ВЧК послідовності, що представляє інтерес, наприклад, хромосоми або її сегменту, у біологічному зразку. Згідно з деякими варіантами реалізації біологічний зразок отриманий від суб'єкта та містить суміш нуклеїнових кислот, отриманих з різних геномів. Різні геноми можуть бути внесені у зразок двома індивідуумами, наприклад, різні геноми були внесені плодом та матір'ю, що виношує плід. Також різні геноми можуть бути внесені у зразок трьома або більше індивідуумами, наприклад, різні геноми були внесені двома або більше плодами та матір'ю, що виношує плоди. У якості альтернативи, геноми внесені у зразок анеуплоїдними раковими клітинами та нормальними еуплоїдними клітинами від того ж суб'єкта, наприклад, зразок плазми від пацієнта, що страждає від раку.
І0ОО181) Крім аналізу досліджуваного зразку від пацієнта для кожної можливої хромосоми, що представляє інтерес, вибирають одну або більше нормуючих хромосом або один або більше сегментів нормуючих хромосом. Нормуючі хромосоми або сегменти ідентифікують асинхронно з нормального дослідження зразків від пацієнта, яке може проходити у клінічних умовах. Інакше кажучи, нормуючі хромосоми або сегменти ідентифікують перед дослідженням зразків від пацієнта. Взаємозв'язки між нормуючими хромосомами або сегментами та хромосомами або сегментами, що представляють інтерес, зберігають для використання у ході аналізу. Як пояснено нижче, такий взаємозв'язок, як правило, зберігається протягом періодів часу, які охоплюють дослідження багатьох зразків. Наступне обговорення торкається варіантів реалізації для вибору нормуючих хромосом або сегментів хромосоми для індивідуальних хромосом або сегментів, що представляють інтерес.
ІЇ00182| Множину кваліфікаційних зразків одержують для ідентифікації кваліфікаційних нормуючих послідовностей та для забезпечення значень дисперсії з метою застосування при визначенні статистично значимої ідентифікації ВЧК у досліджуваних зразках. На етапі 110 множину біологічних кваліфікаційних зразків одержують із множини суб'єктів, які встановлено містять клітини, що характеризуються нормальним числом копій будь-якої однієї послідовності, що представляє інтерес. Відповідно до одного варіанту реалізації кваліфікаційні зразки одержують від матерів, вагітних плодом, який, як було підтверджено із застосуванням цитогенетичних способів, характеризується нормальним числом копій хромосом. Біологічні кваліфікаційні зразки можуть являти собою біологічну рідину, наприклад, плазму, або будь-який підходящий зразок, описаний нижче. Згідно з деякими варіантами реалізації кваліфікаційний зразок містить суміш молекул нуклеїнової кислоти, наприклад, молекул вцДНК. Згідно з деякими варіантами реалізації кваліфікаційний зразок являє собою зразок материнської плазми, який містить суміш плідних та материнських молекул вцДНК. Інформацію про послідовність для нормуючих хромосом та/або їх сегментів одержують у результаті секвенування щонайменше частини нуклеїнових кислот, наприклад, нуклеїнових кислот плода та матері, із застосуванням будь-якого відомого способу секвенування. Переважно, у відношенні послідовності нуклеїнових кислот плода та матері у якості окремих або клонально ампліфікованих молекул застосовують будь-який зі способів секвенування нового покоління (СНП), описаних у даному документі у іншому місці. Згідно з різними варіантами реалізації кваліфікаційні зразки процесують, як розкрито нижче, перед та протягом секвенування. Кваліфікаційні зразки можна процесувати із застосуванням апарату, системи та наборів, розкритих у даному документі.
ІО0О183)| На етапі 120 щонайменше частину кожної із усіх кваліфікаційних нуклеїнових кислот, що містяться у кваліфікаційних зразках, секвенують для одержання мільйонів рідів послідовності, наприклад, рідів 36 п.о., які вирівнюють із референсним геномом, наприклад, по18. Згідно з деякими варіантами реалізації ріди послідовності містять приблизно 20 п.о., приблизно 25 п.о., приблизно 30 п.о., приблизно 35 п.о., приблизно 40 п.о., приблизно 45 п.о., приблизно 50 п.о., приблизно 55 п.о., приблизно 60 п.о., приблизно 65 п.о., приблизно 70 п.о., приблизно 75 п.о., приблизно 80 п.о., приблизно 85 п.о., приблизно 90 п.о., приблизно 95 п.о., приблизно 100 п.о., приблизно 110 п.о., приблизно 120 п.о., приблизно 130, приблизно 140 п.о., приблизно 150 п.о., приблизно 200 п.о., приблизно 250 п.о., приблизно 300 п.о., приблизно 350 п.о., приблизно 400 п.о., приблизно 450 п.о. або приблизно 500 п.о. Очікують, що технологічні переваги уможливлять одержання рідів одиночних кінців довжиною більше 500 п.о., що уможливить одержання ріду довжиною більше приблизно 1000 п.о., коли одержують ріди спарених кінців. Відповідно до одного варіанту реалізації картовані ріди послідовності містять 36 п.о. Згідно з іншим варіантом реалізації картовані ріди послідовності містять 25 п.о. бо 00184) Ріди послідовності вирівнюють із референсним геномом, та ріди, які унікально картуються на референсний геном, відомі як мітки послідовності. Мітки послідовності, що попадають на масковані сегменти маскованої референсної послідовності, не підраховують для аналізу ВЧК.
Ї00185| Відповідно до одного варіанту реалізації щонайменше приблизно 3х109 кваліфікаційних міток послідовності, щонайменше приблизно 5х109 кваліфікаційних міток послідовності, щонайменше приблизно 8х1059 кваліфікаційних міток послідовності, щонайменше приблизно 10х109 кваліфікаційних міток послідовності, щонайменше приблизно 15х105 кваліфікаційних міток послідовності, щонайменше приблизно 20х109 кваліфікаційних міток послідовності, щонайменше приблизно 30х105 кваліфікаційних міток послідовності, щонайменше приблизно 40х109 кваліфікаційних міток послідовності або щонайменше приблизно 50х105 кваліфікаційних міток послідовності, які містять ріди довжиною від 20 до 40 п.о., отримують з ріду, який унікально картується на референсному геномі.
І00186| На етапі 130 усі мітки, отримані із секвенування нуклеїнових кислот у кваліфікаційних зразках, підраховують для одержання перекриття мітки кваліфікаційної послідовності. Аналогічно, у операції 135 усі мітки, отримані з досліджуваного зразку, підраховують для одержання перекриття мітки досліджуваної послідовності. У даному винаході запропоновані процеси для визначення кількостей перекриття, які забезпечують поліпшені чутливість та селективність у порівнянні із загальноприйнятими способами. Операції 130 та 135 відзначені зірочками та виділені рамками з жирними лініями для вказівки на те, що дані операції сприяють поліпшенню у порівнянні з попереднім рівнем техніки. Згідно з деякими варіантами реалізації кількості перекриття мітки послідовності нормують, підганяють, цензурують та іншим способом процесують для поліпшення чутливості та селективності аналізу. Дані процеси додатково описані у даному документі у іншому місці.
І00187| Після того як усі кваліфікаційні мітки послідовності були картовані та підраховані у кожному із кваліфікаційних зразків, визначають перекриття мітки послідовності для послідовності, що представляє інтерес, наприклад, клінічно значимої послідовності, у кваліфікаційних зразках, так само як і перекриття мітки послідовності для додаткових послідовностей, з яких потім ідентифікують нормуючі послідовності.
І001881| Згідно з деякими варіантами реалізації послідовність, що представляє інтерес, являє собою хромосому, яка пов'язана з повною анеуплоїдією хромосом, наприклад, хромосому 21, та кваліфікаційна нормуюча послідовність являє собою повну хромосому, яка не пов'язана з анеуплоїдією хромосом та варіація якої у перекритті мітки послідовності приблизно дорівнює такій послідовності (тобто хромосоми), що представляє інтерес, наприклад, хромосоми 21.
Обрана нормуюча хромосома або хромосоми можуть являти собою одну хромосому або групу
З5 хромосом, які найкращим способом приблизно рівні варіації у перекритті мітки послідовності для послідовності, що представляє інтерес. Будь-яка одна або більше із хромосом 1 - 22, Х та
М може являти собою послідовність, що представляє інтерес, та одну або більше хромосом можна ідентифікувати як нормуючу послідовність для кожної з будь-якої із хромосом 1 - 22, Х та
У у кваліфікаційних зразках. Нормуюча хромосома може являти собою окрему хромосому або може являти собою групу хромосом, як описано у даному документі у іншому місці.
І00189| Згідно з іншим варіантом реалізації послідовність, що представляє інтерес, являє собою сегмент хромосоми, пов'язаний із частковою анеуплоїдією, наприклад, делецією або вставкою хромосоми, або незбалансованою хромосомною транслокацією та нормуюча послідовність являє собою сегмент хромосоми (або групу сегментів), який не пов'язаний із частковою анеуплоїдією та варіація якого у перекритті мітки послідовності приблизно рівна такій сегмента хромосоми, пов'язаного із частковою анеуплоїдією. Обраний сегмент або сегменти нормуючої хромосоми можуть являти собою один або більше сегментів, які найкращим способом приблизно рівні варіації у перекритті мітки послідовності для послідовності, що представляє інтерес. Будь-який один або більше сегментів будь-якої однієї або більше із хромосом 1 - 22, Х та У може являти собою послідовність, що представляє інтерес.
І00190) Згідно з іншими варіантами реалізації послідовність, що представляє інтерес, являє собою сегмент хромосоми, пов'язаний із частковою анеуплоїдією, та нормуюча послідовність являє собою цілу хромосому або хромосоми. Згідно з ще одним варіантом реалізації послідовність, що представляє інтерес, являє собою цілу хромосому, пов'язану з анеуплоїдією, та нормуюча послідовність являє собою сегмент або сегменти хромосоми, які не пов'язані з анеуплоїдією. 00191) Незалежно від того, одну послідовність або групу послідовностей ідентифікують у кваліфікаційних зразках послідовність як нормуючу послідовність або послідовності для будь- якої однієї або більше послідовностей, що представляють інтерес, можна вибрати бо кваліфікаційну нормуючу послідовність таким чином, щоб вона характеризувалася варіацією перекриття мітки послідовності або параметру розміру фрагмента, яка найкращим або найбільш ефективним способом приблизно дорівнює такій послідовності, що представляє інтерес, як визначено у кваліфікаційних зразках. Наприклад, кваліфікаційна нормуюча послідовність являє собою послідовність, яка викликає найменшу варіабельність серед кваліфікаційних зразків при застосуванні для нормування послідовності, що представляє інтерес, тобто варіабельність нормуючої послідовності є найбільш близькою до такої послідовності, що представляє інтерес, визначеної у кваліфікаційних зразках. Говорячи інакше, кваліфікаційна нормуюча послідовність являє собою послідовність, вибрану для утворення найменшої варіації у дозі послідовності (для послідовності, що представляє інтерес) у межах кваліфікаційних зразків. Таким чином, у процесі вибирають послідовність, яка при застосуванні у якості нормуючої хромосоми, як очікують, утворює найменшу варіабельність у дозі хромосоми від серії до серії для послідовності, що представляє інтерес.
І00192| Нормуюча послідовність ідентифікована у кваліфікаційних зразках для будь-якої однієї або більше послідовностей, що представляють інтерес, залишається нормуючою послідовністю, що є кращою для визначення присутності або відсутності анеуплоїдії у досліджуваних зразках протягом днів, тижнів, місяців і, можливо, років, за умови, що процедури, необхідні для одержання бібліотек секвенування та секвенування зразків, по суті не міняються із часом. Як описано вище, нормуючі послідовності для визначення присутності анеуплоїдій вибирають для забезпечення (можливо, також серед інших причин) варіабельності кількості міток послідовності або значень параметру розміру фрагмента, які картуються на послідовність серед зразків, наприклад, різних зразків, та серій секвенування, наприклад, серій секвенування, які відбуваються у той самий день і/або у різні дні, які найкращим способом приблизно рівні варіабельності послідовності, що представляє інтерес, для якої її застосовують як нормуючий параметр. Істотні зміни у даних процедурах будуть впливати на кількість міток, які картуються на всі послідовності, що, у свою чергу, буде визначати, яка одна послідовність або група послідовностей буде характеризуватися варіабельністю серед зразків у одній і тій же та/або у різних серіях секвенування, у той же день або у різні дні, яка найбільш точно приблизно рівна такій послідовності або послідовностям, що представляють інтерес, для чого буде вимагатися, щоб множина нормуючих послідовностей була повторно визначена. Істотні зміни у процедурах включають зміни у лабораторному протоколі, застосовуваному для одержання бібліотеки секвенування, які включають зміни відносно одержання зразків для мультиплексного секвенування замість синглплексного секвенування та зміни платформ секвенування, які включають зміни у хімії, застосовуваній для секвенування.
ЇО0193| Згідно з деякими варіантами реалізації нормуюча послідовність, вибрана для нормування конкретної послідовності, що представляє інтерес, являє собою послідовність, яка найкращим способом дозволяє відрізнити один або більше кваліфікаційних зразків від одного або більше уражених зразків, що має на увазі, що нормуюча послідовність являє собою послідовність, яка характеризується найвищою диференційованістю, тобто диференційованість нормуючої послідовності є такою, що вона забезпечує оптимальне встановлення відмінностей послідовності, що представляє інтерес, в ураженому досліджуваному зразку, щоб з легкістю відрізнити уражений досліджуваний зразок від інших неуражених зразків. Згідно з іншими варіантами реалізації нормуюча послідовність являє собою послідовність, яка характеризується комбінацією найменшої варіабельності та найбільшої диференційованості.
І00194| Рівень диференційованості можна визначити як статистичну відмінність між дозами послідовності, наприклад, дозами хромосоми або дозами сегмента, у популяції кваліфікаційних зразків та дозою або дозами хромосом у одному або більше досліджуваних зразках, як описано нижче та показано у прикладах. Наприклад, диференційованість можна чисельно представити як значення і-критерію, яке представляє статистичну відмінність між дозами хромосоми у популяції кваліфікаційних зразків та дозою або дозами хромосоми у одному або більше досліджуваних зразках. Аналогічно, диференційованість може бути основана на дозах сегмента замість доз хромосом. У якості альтернативи, диференційованість можна представити чисельно як нормоване значення хромосоми (МСУМ), яке являє собою 7-показник для доз хромосоми, за умови, що розподіл для МСМУ є нормальним. Аналогічно, у випадку, коли сегменти хромосоми є послідовностями, що представляють інтерес, диференційованість доз сегмента можна чисельно представити як нормоване значення сегменту (ММ), яке являє собою 7-показник для доз сегмента хромосоми за умови, що розподіл для МОМ є нормальним. При визначенні 27- показника можна застосовувати середнє значення та стандартне відхилення доз хромосоми або сегмента у множині кваліфікаційних зразків. У якості альтернативи, можна застосовувати середнє значення та стандартне відхилення доз хромосоми або сегмента у навчальній множині, бо що містить кваліфікаційні зразки та уражені зразки. Згідно з іншими варіантами реалізації нормуюча послідовність являє собою послідовність, яка характеризується найменшою варіабельністю та найвищою диференційованістю або оптимальною комбінацією низької варіабельності та високої диференційованості.
ЇО0195| Спосіб ідентифікує послідовності, які за своєю природою мають аналогічні характеристики та які схильні до аналогічних варіацій серед зразків та серій секвенування, та які є підходящими для визначення доз послідовності у досліджуваних зразках.
Визначення доз послідовності 00196) Згідно з деякими варіантами реалізації дози хромосоми або сегменту для однієї або більше хромосом або сегментів, що представляють інтерес, визначають у всіх кваліфікаційних зразках, як описано на етапі 146, представленому на фігурі 1, та послідовність нормуючої хромосоми або сегменту ідентифікують на етапі 145. Деякі нормуючі послідовності запропоновані до того, як обчислюють дози послідовності. Потім одну або більше нормуючих послідовностей ідентифікують згідно з різними критеріями, які додатково описані нижче, див. етап 145. Згідно з деякими варіантами реалізації, наприклад, ідентифікована нормуюча послідовність приводить до найменшої варіабельності дози послідовності для послідовності, що представляє інтерес, серед усіх кваліфікаційних зразків.
І00197| На етапі 146 на підставі обчислених щільностей кваліфікаційної мітки визначають дозу кваліфікаційної послідовності, тобто дозу хромосоми або дозу сегмента, для послідовності, що представляє інтерес, у вигляді співвідношення перекриття мітки послідовності для послідовності, що представляє інтерес, та перекриття мітки кваліфікаційної послідовності для додаткових послідовностей, з яких потім на етапі 145 ідентифікують нормуючі послідовності.
Після цього ідентифіковані нормуючі послідовності застосовують для визначення доз послідовності у досліджуваних зразках.
І00198| Відповідно до одного варіанту реалізації доза послідовності у кваліфікаційних зразках являє собою дозу хромосоми, яку обчислюють як співвідношення кількості міток послідовності або параметру розміру фрагмента для хромосоми, що представляє інтерес, та кількості міток послідовності для послідовності нормуючої хромосоми у кваліфікаційному зразку.
Послідовність нормуючої хромосоми може являти собою одну хромосому, групу хромосом, сегмент однієї хромосоми або групу сегментів від різних хромосом. Відповідно, дозу хромосоми для хромосоми, що представляє інтерес, визначають у кваліфікаційному зразку як співвідношення кількості міток для хромосоми, що представляє інтерес, та кількості міток для (Її) послідовності нормуючої хромосоми, що складається з однієї хромосоми, (ії) послідовності нормуючої хромосоми, що складається з двох або більше хромосом, (ії) послідовності нормуючої хромосоми, що складається з одного сегменту хромосоми, (ім) послідовності нормуючої хромосоми, що складається з двох або більше сегментів з однієї хромосоми, або (м) послідовності нормуючої хромосоми, що складається з двох або більше сегментів двох або більше хромосом. Приклади для визначення дози хромосоми для хромосоми 21, що представляє інтерес, згідно (і)-(м) є наступними: дози хромосом для хромосоми, що представляє інтерес, наприклад, хромосоми 21, визначають як співвідношення перекриття мітки послідовності хромосоми 21 та одного з наступних перекриттів міток послідовності: (і) кожна із усіх хромосом, що залишилися, тобто хромосом 1 - 20, хромосоми 22, хромосоми Х та хромосоми У; (ії) усі можливі комбінації двох або більше хромосом, що залишилися; (ії) сегмент іншої хромосоми, наприклад, хромосоми 9; (ім) два сегменти іншої хромосоми, наприклад, два сегменти хромосоми 9; (у) два сегменти двох різних хромосом, наприклад, сегмент хромосоми 9 та сегмент хромосоми 14. 00199) Згідно з іншим варіантом реалізації доза послідовності у кваліфікаційних зразках являє собою дозу сегмента замість дози хромосоми, причому дозу сегмента обчислюють як співвідношення кількості міток послідовності для сегмента, що представляє інтерес, який не являє собою цілу хромосому, та кількості міток послідовності для послідовності нормуючого сегменту у кваліфікаційному зразку. Послідовність нормуючого сегменту може являти собою будь-яку з послідовностей нормуючої хромосоми або сегменту, які обговорюються вище.
Ідентифікація нормуючих послідовностей
І00200| На етапі 145 ідентифікують нормуючу послідовність для послідовності, що представляє інтерес. Згідно з деякими варіантами реалізації наприклад, нормуюча послідовність являє собою послідовність на підставі обчислених доз послідовності, наприклад, яка приводить до найменшої варіабельності дози послідовності для послідовності, що представляє інтерес, серед усіх кваліфікаційних навчальних зразків. Спосіб ідентифікує послідовності, які за своєю природою мають аналогічні характеристики та схильні до аналогічних варіацій серед зразків та серій секвенування, та які є підходящими для визначення бо доз послідовності у досліджуваних зразках.
002011) Нормуючі послідовності для однієї або більше послідовностей, що представляють інтерес, можна ідентифікувати у множині кваліфікаційних зразків, та потім послідовності, які ідентифіковані у кваліфікаційних зразках, застосовують для обчислення доз послідовностей для однієї або більше послідовностей, що представляють інтерес, у кожному з досліджуваних зразків (етап 150) для визначення присутності або відсутності анеуплоїдії у кожному з досліджуваних зразків. Нормуюча послідовність, ідентифікована для хромосом або сегментів, що представляють інтерес, може відрізнятися, якщо застосовують різні платформи секвенування, та/або якщо існують відмінності у очищенні нуклеїнової кислоти, яка підлягає секвенуванню та/або одержанню бібліотеки секвенування. Застосування нормуючих послідовностей згідно зі способами, описаними у даному документі, забезпечує специфічний та чутливий критерій варіації числа копій хромосоми або її сегменту незалежно від одержання зразку та/або платформи секвенування, яку застосовують.
І00202| Згідно з деякими варіантами реалізації ідентифікують більше однієї нормуючої послідовності, тобто для однієї послідовності, що представляє інтерес, можна визначити різні нормуючі послідовності та для однієї послідовності, що представляє інтерес, можна визначити декілька доз послідовності. Наприклад, варіація, наприклад, коефіцієнт варіації (КВ - стандартне відхилення/середнє значення) дози хромосоми для хромосоми 21, що представляє інтерес, є найменшою, коли застосовують перекриття мітки послідовності хромосоми 14. Однак можна ідентифікувати дві, три, чотири, п'ять, шість, сім, вісім або більше нормуючих послідовностей для застосування при визначенні дози послідовності для послідовності, що представляє інтерес, у досліджуваному зразку. Як приклад, другу дозу для хромосоми 21 у будь-якому досліджуваному зразку можна визначити із застосуванням хромосоми 7, хромосоми 9, хромосоми 11 або хромосоми 12 у якості послідовності нормуючої хромосоми, оскільки всі дані хромосоми характеризуються КВ, близьким до такого для хромосоми 14.
Ї0020О3| Згідно з деякими варіантами реалізації коли одну хромосому вибрали як послідовність нормуючої хромосоми для хромосоми, що представляє інтерес, послідовність нормуючої хромосоми буде являти собою хромосому, яка приводить до одержання доз хромосоми для хромосоми, що представляє інтерес, які характеризуються найменшою варіабельністю серед усіх досліджених зразків, наприклад, кваліфікаційних зразків. У деяких випадках найкраща нормуюча хромосома може не характеризуватися найменшою варіацією, але може характеризуватися розподілом кваліфікаційних доз, яке найкращим способом дозволяє відрізнити досліджуваний зразок або зразки від кваліфікаційних зразків, тобто найкраща нормуюча хромосома може не характеризуватися найменшою варіацією, але може характеризуватися найбільшою диференційованістю.
І00204| Згідно з деякими варіантами реалізації нормуючі послідовності включають одну або більше послідовностей стійких аутосом або їх сегментів. Згідно з деякими варіантами реалізації стійкі аутосоми включають усі аутосоми, за винятком хромосоми або хромосом, що представляють інтерес. Згідно з деякими варіантами реалізації стійкі аутосоми включають усі аутосоми, за винятком хромосом Х, У, 13, 18 та 21. Згідно з деякими варіантами реалізації стійкі аутосоми включають усі аутосоми, за винятком тих, які, як було визначено у зразку, відхиляються від нормального диплоїдного стану, що може бути корисним при визначенні геномів раку, які характеризуються аномальним числом копій у порівнянні з нормальним диплоїдним геномом.
Визначення анеуплоїдій у досліджуваних зразках
Ї00205| На підставі ідентифікації нормуючої послідовності або послідовностей у кваліфікаційних зразках визначають дозу послідовності для послідовності, що представляє інтерес, у досліджуваному зразку, що містить суміш нуклеїнових кислот, отриманих з геномів, які відрізняються однією або більше послідовностями, що представляють інтерес. 00206) На етапі 115 досліджуваний зразок одержують від суб'єкта, який, як підозрюють або як відомо, несе клінічно значимі ВЧК послідовності, що представляє інтерес. Досліджуваний зразок може являти собою біологічну рідину, наприклад, плазму, або будь-який підходящий зразок, як описано нижче. Як пояснено, зразок можна одержати із застосуванням неінвазивної процедури, такої як простий забір крові. Згідно з деякими варіантами реалізації досліджуваний зразок містить суміш молекул нуклеїнової кислоти, наприклад, молекул вцДНК. Згідно з деякими варіантами реалізації досліджуваний зразок являє собою зразок материнської плазми, який містить суміш молекул вцДНК плода та матері.
І00207| На етапі 125 щонайменше частину досліджуваних нуклеїнових кислот у досліджуваному зразку секвенують, як описано для кваліфікаційних зразків, з метою одержання мільйонів рідів послідовності, наприклад, рідів довжиною 36 п.о. Згідно з різними варіантами бо реалізації ріди спарених кінців 2х36 п.о. застосовують для секвенування спарених кінців. Як на етапі 120, ріди, отримані за допомогою секвенування нуклеїнових кислот у досліджуваному зразку, унікально картують або вирівнюють із референсним геномом для одержання міток. Як описано на етапі 120, ріди щонайменше приблизно 3х105 кваліфікаційних міток послідовності, щонайменше приблизно 5х105 кваліфікаційних міток послідовності, щонайменше приблизно 8х105 кваліфікаційних міток послідовності, щонайменше приблизно 10х105 кваліфікаційних міток послідовності, щонайменше приблизно 15х105 кваліфікаційних міток послідовності, щонайменше приблизно 20х105 кваліфікаційних міток послідовності, щонайменше приблизно 30х105 кваліфікаційних міток послідовності, щонайменше приблизно 40х105 кваліфікаційних міток послідовності або щонайменше приблизно 50х105 кваліфікаційних міток послідовності, що містять від 20 до 40 п.о., одержують із рідів, які унікально картуються на референсний геном.
Згідно з певними варіантами реалізації ріди, утворені за допомогою апарату секвенування, запропоновані у електронному форматі. Вирівнювання здійснюють із застосуванням комп'ютерного апарату, як обговорюється нижче. Окремі ріди порівнюють із референсним геномом, який часто є великим (мільйони пар основ), для ідентифікації сайтів, у яких ріди унікально відповідають референсному геному. Згідно з деякими варіантами реалізації процедура вирівнювання забезпечує обмежену невідповідність між рідами та референсним геномом. У деяких випадках допускається, що 1, 2 або 3 пари основ у ріді не відповідають відповідним парам основ у референсному геномі, та при цьому однаково проводять картування.
ІЇ00208| На етапі 135 усі або більшість міток, отриманих у результаті секвенування нуклеїнових кислот у досліджуваних зразках, підраховують для визначення перекриття мітки досліджуваної послідовності із застосуванням комп'ютерного апарата, як описано нижче. Згідно з деякими варіантами реалізації кожен рід вирівнюють із конкретною областю референсного геному (у більшості випадків, хромосомою або сегментом), та рід перетворюють у мітку за допомогою додавання до ріду інформації про сайт. У міру того як протікає даний процес, комп'ютерний апарат може проводити безперервне обчислення кількості картування міток/рідів на кожну область референсного геному (у більшості випадків, хромосому або сегмент).
Підраховані значення зберігають для кожної хромосоми або сегмента, що представляють інтерес, та для кожної відповідної нормуючої хромосоми або сегменту. (002091 Згідно з певними варіантами реалізації референсний геном містить одну або більше виключених областей, які є частиною справжнього біологічного геному, але не включені у референсний геном. Ріди, що потенційно вирівнюються з даними виключеними областями, не підраховують. Приклади виключених областей включають області довгих повторюваних послідовностей, області подібності між Х- та У-хромосомами і т.д. Із застосуванням маскованої референсної послідовності, отриманої за допомогою методик маскування, описаних вище, для аналізу ВЧК враховують винятково мітки на немаскованих сегментах референсної послідовності.
І00210| Згідно з деякими варіантами реалізації спосіб визначає, чи слід підраховувати мітку більше одного разу при вирівнюванні множинних рідів з тим самим сайтом на референсному геномі або послідовності. Існують випадки, коли дві мітки містять ту саму послідовність, та внаслідок цього вирівнюються з ідентичним сайтом на референсній послідовності. Спосіб, застосовуваний для обчислення міток, може при певних обставинах виключати з підрахунку ідентичні мітки, отримані з того самого секвенованого зразку. Якщо у даному зразку непропорційна кількість міток є ідентичною, це свідчить про те, що існує значна похибка або інший дефект процедури. Внаслідок цього згідно з певними варіантами реалізації у способі підрахунку не враховують мітки з даного зразку, ідентичні міткам зі зразку, які були підраховані раніше. 00211) Для вибору ситуації, коли слід не враховувати ідентичну мітку з одного зразку, можна задати різні критерії. Згідно з певними варіантами реалізації заданий відсоток міток, які підраховують, повинен бути унікальним. Якщо більше, ніж даний поріг, число міток не є унікальними, ними нехтують. Наприклад, якщо заданий відсоток вимагає, щоб щонайменше 50 95 були унікальними, ідентичні мітки не підраховують доти, поки відсоток унікальних міток не перевищить 5095 для зразку. Згідно з іншими варіантами реалізації порогова кількість унікальних міток становить щонайменше приблизно 60 95. Згідно з іншими варіантами реалізації пороговий відсоток унікальних міток становить щонайменше приблизно 75 95, або щонайменше приблизно 90 95, або щонайменше приблизно 95 95, або щонайменше приблизно 98 95, або щонайменше приблизно 99 95. Поріг може бути задано на рівні 90 95 для хромосоми 21. Якщо
ЗОМ міток вирівнюються із хромосомою 21, тоді щонайменше 27М з них повинні бути унікальними. Якщо ЗМ підрахованих міток не є унікальними, та перша після 30 мільйонів мітка не є унікальною, її не підраховують. Вибір конкретного порогу або іншого критерію, бо використовуваного для визначення ситуації, коли слід знехтувати підрахунком наступних ідентичних міток, можна здійснити із застосуванням відповідного статистичного аналізу. Одним з факторів, що впливають на даний поріг або інший критерій, є відносна кількість секвенованого зразку відносно розміру геному, з яким можна вирівняти мітки. Інші фактори включають розмір рідів та аналогічні міркування. (002121) Відповідно до одного варіанту реалізації кількість міток досліджуваної послідовності, картованих на послідовність, що представляє інтерес, нормують до відомої довжини послідовності, що представляє інтерес, на яку вони картуються, для одержання співвідношення щільності мітки досліджуваної послідовності. Як описано для кваліфікаційних зразків, нормування до відомої довжини послідовності, що представляє інтерес, не потрібно, та може бути включене як етап для зниження кількості цифр у числі для спрощення інтерпретації людиною. Після того як у досліджуваному зразку підраховують усі картовані мітки досліджуваної послідовності, визначають перекриття мітки послідовності для послідовності, що представляє інтерес, наприклад, клінічно значимої послідовності, у досліджуваних зразках, так само як і перекриття мітки послідовності для додаткових послідовностей, які відповідають щонайменше одній нормуючій послідовності, ідентифікованої у кваліфікаційних зразках.
ІО0О213) На етапі 150 на підставі ідентичності щонайменше однієї нормуючої послідовності у кваліфікаційних зразках визначають дозу досліджуваної послідовності для послідовності, що представляє інтерес, у досліджуваному зразку. Згідно з різними варіантами реалізації дозу досліджуваної послідовності визначають комп'ютерним способом із застосуванням перекриттів мітки послідовності для послідовності, що представляє інтерес, та відповідної нормуючої послідовності, як описано у даному документі. Комп'ютерний апарат, що призначений для даної процедури, електронним способом оцінює взаємозв'язок між послідовністю, що представляє інтерес, та пов'язаною з нею нормуючою послідовністю, яка може зберігатися у базі даних, таблиці, графіку або може бути включена як код у інструкції програми.
ІЇ00214| Як описано у даному документі у іншому місці щонайменше одна нормуюча послідовність може являти собою одну послідовність або групу послідовностей. Доза послідовності для послідовності, що представляє інтерес, у досліджуваному зразку являє собою співвідношення перекриття мітки послідовності, визначене для послідовності, що представляє інтерес, у досліджуваному зразку, та перекриття мітки послідовності щонайменше однієї нормуючої послідовності, визначеної у досліджуваному зразку, причому нормуюча послідовність у досліджуваному зразку відповідає нормуючій послідовності, ідентифікованій у кваліфікаційних зразках для конкретної послідовності, що представляє інтерес. Наприклад, якщо нормуюча послідовність, ідентифікована у кваліфікаційних зразках для хромосоми 21, як визначено, є хромосомою, наприклад, хромосомою 14, тоді дозу досліджуваної послідовності для хромосоми 21 (послідовності, що представляє інтерес) визначають у вигляді співвідношення перекриття мітки послідовності для хромосоми 21 та перекриття мітки послідовності для хромосоми 14, кожне з яких визначають у досліджуваному зразку. Аналогічно визначають дози хромосом для хромосом 13, 18, Х, М та інших хромосом, пов'язаних з анеуплоїдіями хромосом. Нормуюча послідовність для хромосоми, що представляє інтерес, може являти собою одну хромосому або групу хромосом, або один сегмент або групу сегментів хромосоми. Як описано раніше, послідовність, що представляє інтерес, може являти собою частину хромосоми, наприклад, сегмент хромосоми. Відповідно, дозу для сегмента хромосоми можна визначити у вигляді співвідношення перекриття мітки послідовності, визначеного для сегмента у досліджуваному зразку, та перекриття мітки послідовності для сегмента нормуючої хромосоми у досліджуваному зразку, причому нормуючий сегмент у досліджуваному зразку відповідає нормуючому сегменту (одному сегменту або групі сегментів), ідентифікованому у кваліфікаційних зразках для конкретного сегмента, що представляє інтерес. Розмір сегментів хромосоми може варіюватися від кілобаз (кб), тобто тисячі пар основ (т.0о.), до мегабаз (Мб), тобто мільйону пар основ або (м.0о.) (наприклад, приблизно від 1 т.о. до 10 т.о., або приблизно від 10 т.о. до 100 т.о., або приблизно від 100 т.о. до 1 Мб).
І00215| На етапі 155 зі значень стандартного відхилення, встановлених для доз кваліфікаційної послідовності, визначених у множині кваліфікаційних зразків, та доз послідовності, визначених для зразків, які встановлено є анеуплоїдними для послідовності, що представляє інтерес, одержують граничні значення. Відзначимо, що дану операцію, як правило, здійснюють асинхронно з аналізом досліджуваних зразків від пацієнта. Дану операцію можна здійснити, наприклад, одночасно з вибором нормуючих послідовностей із кваліфікаційних зразків. Точна класифікація залежить від відмінностей між розподілами ймовірностей для різних класів, тобто типу анеуплоїдії. У деяких прикладах пороги вибирають із емпіричного розподілу для кожного типу анеуплоїдії, наприклад, трисомії 21. Можливі порогові значення, які були бо встановлені для класифікації анеуплоїдій трисомії 13, трисомії 18, трисомії 21 та моносомії Х,
описані у прикладах, у яких описано застосування способу для визначення анеуплоїдій хромосом за допомогою секвенування вцДнНК, екстрагованої з материнського зразка, що містить суміш нуклеїнових кислот плода та матері. Порогове значення, яке визначають, щоб відрізнити зразки, уражені анеуплоїдією хромосоми, може бути таким же або може відрізнятися від порога для іншої анеуплоїдії. Як показано у прикладах, порогове значення для кожної хромосоми, що представляє інтерес, визначають із варіабельності дози хромосоми, що представляє інтерес, серед зразків та серій секвенування. Чим менш варіабельна доза хромосоми для будь-якої хромосоми, що представляє інтерес, тим вужче поширення дози хромосоми, що представляє інтерес, серед усіх неуражених зразків, які застосовують, щоб задати поріг для визначення різних анеуплоїдій. (00216) Вертаючись до потоку процесу, пов'язаного із класифікацією досліджуваного зразку пацієнта, на етапі 160 визначають варіацію числа копій послідовності, що представляє інтерес, у досліджуваному зразку за допомогою порівняння дози досліджуваної послідовності для послідовності, що представляє інтерес, із щонайменше одним пороговим значенням, встановленим з доз кваліфікаційної послідовності. Дану операцію можна здійснити за допомогою того ж комп'ютерного апарату, що застосовувався для вимірювання перекриттів мітки послідовності, та/або обчислення доз сегмента.
І00217| На етапі 160 обчислену дозу для досліджуваної послідовності, що представляє інтерес, порівнюють із такою, заданою у якості порогових значень, які обрані відповідно до заданого користувачем "порогу надійності" для класифікації зразка як "нормального", "ураженого" або "рішення відсутнє". Зразки "рішення відсутнє" являють собою зразки, для яких остаточний діагноз не може бути поставлений з надійністю. Кожен тип ураженого зразку (наприклад, трисомія 21, часткова трисомія 21, моносомія Х) характеризується своїми власними порогами, одним - для прийняття рішення про нормальні (неуражені) зразки та іншим - для прийняття рішення про уражені зразки (незважаючи на те, що у деяких випадках два пороги збігаються). Як описано у даному документі у іншому місці, у деяких обставинах результат "рішення відсутнє" можна перетворити у рішення (уражений або нормальний), якщо фракція нуклеїнової кислоти плода у досліджуваному зразку є у достатньому ступені високою.
Класифікація досліджуваної послідовності може повідомлятися комп'ютерним апаратом, застосовуваним у інших операціях даного потоку процесу. У деяких випадках класифікацію повідомляють у електронному форматі, та класифікація може бути виведена на екран, відправлена по електронній пошті, представлена у текстовому вигляді і т.д. зацікавленим особам. 00218) Згідно з деякими варіантами реалізації визначення ВЧК включає обчислення МСМУ або М5У, які являють собою відношення дози хромосоми або сегмента до середнього значення відповідної дози хромосоми або сегмента у множині кваліфікаційних зразків, як описано вище.
Потім можна визначити ВЧК за допомогою порівняння МОСМ/М5М з визначеним раніше пороговим значенням для оцінки числа копій.
ІЇ00219| Поріг для оцінки числа копій можна вибрати для оптимізації частки псевдо позитивних та псевдо негативних результатів. Чим вище поріг оцінки числа копій, тим менш імовірна поява псевдо позитивних результатів. Аналогічно, чим нижче поріг, тим менш імовірна поява псевдо негативних результатів. Таким чином, існує компроміс між першим ідеальним порогом, вище якого класифікують винятково істинно позитивні результати, та другим ідеальним порогом, нижче якого класифікують винятково істинно негативні результати. 00220) Пороги задають, головним чином, залежно від варіабельності доз хромосом для конкретної хромосоми, що представляє інтерес, яка визначена у множині неуражених зразків.
Варіабельність залежить від великої кількості факторів, включаючи фракцію кКДНК плода, що присутня у зразку. Варіабельність (КВ) визначають за середнім значенням або медіаною та стандартним відхиленням для доз хромосоми серед популяції неуражених зразків. Таким чином, у порозі (5) для класифікації анеуплоїдії використовують МОМ згідно з рівнянням: (0221) мом; - 5, о) (де В таб; являють собою обчислене середнє значення та стандартне відхилення, відповідно, для дози |-ої хромосоми у множині кваліфікаційних зразків, та Хі являє собою спостережувану дозу |-ої хромосоми для досліджуваного зразку і.) зі зв'язаною фракцією плода у вигляді: о
Кі
І00223| Таким чином, для кожної МСМ хромосоми, що представляє інтерес, очікувана фракція плода, пов'язана з даним значенням МСМ, може бути обчислена за КВ на підставі середнього значення та стандартного відхилення співвідношення хромосоми для хромосоми, що представляє інтерес, серед популяції неуражених зразків. 00224) Потім на підставі взаємозв'язку між фракцією плода та значеннями МСМ можна вибрати границю прийняття рішення, вище якої зразки визначають як позитивні (уражені), на підставі квантилів нормального розподілу. Як описано вище, згідно з деякими варіантами реалізації задають поріг для оптимального компромісу між виявленням істинно позитивних та часток псевдо негативних результатів. А саме, вибирають поріг для максимізації суми істинно позитивних та істинно негативних результатів або мінімізації суми псевдо позитивних та псевдо негативних результатів. 00225) У певних варіантах реалізації запропонований спосіб забезпечення пренатальної діагностики анеуплоїдії хромосоми плода у біологічному зразку, що містить молекули нуклеїнової кислоти плода та матері. Діагноз ставлять на підставі одержання інформації про послідовність із щонайменше частини суміші молекул нуклеїнової кислоти плода та матері, отриманих з біологічного досліджуваного зразку, наприклад, зразку материнської плазми, комп'ютеризованого обчислення з даних секвенування дози нормуючої хромосоми для однієї або більше хромосом, що представляють інтерес, та/або дози нормуючого сегмента для одного або більше сегментів, що представляють інтерес, та визначення статистично значимої відмінності між дозою хромосоми для хромосоми, що представляє інтерес, та/або дозою сегмента для сегмента, що представляє інтерес, відповідно, у досліджуваному зразку та пороговим значенням, встановленим у множині кваліфікаційних (нормальних) зразків, та забезпечення пренатальної діагностики на підставі статистичної відмінності. Як описано на етапі 160 способу, ставлять діагноз нормальних або уражених зразків. Результат "рішення відсутнє" запропонований у випадку, якщо діагноз нормальних або уражених зразків не може бути поставлений із упевненістю. (00226) Згідно з деякими варіантами реалізації можна вибрати два пороги. Перший поріг вибирають для мінімізації частки псевдо позитивних результатів, вище якого зразки будуть класифіковані як "уражені", та другий поріг вибирають для мінімізації частки псевдо негативних результатів, нижче якого зразки будуть класифіковані як "неуражені". Зразки з МСМ вище другого порогу, але нижче першого порогу можна класифікувати як зразки "з підозрою на анеуплоїдію" або "рішення відсутнє", для яких присутність або відсутність анеуплоїдії можна підтвердити незалежними способами. Область між першим та другим порогами можна позначити як область "рішення відсутнє".
І00227| Згідно з деякими варіантами реалізації пороги підозри та результату "рішення відсутнє" представлено у таблиці 1. Як видно, пороги МСМ варіюють між різними хромосомами.
Згідно з деякими варіантами реалізації пороги варіюють залежно від ФП для зразку, як пояснено вище. Методики порога, застосовувані у даному документі, сприяють поліпшенню чутливості та селективності згідно з деякими варіантами реалізації.
ТАБЛИЦЯ 1
Пороги МСМ підозри та ураження, що визначають діапазони результату "рішення відсутнє" 11111111 Підора//// | / Уражен/7/ (Хр. М(ХХупорівнянніз ХУ) /////ї1ї77777777171601111111Ї1111111160сСс1
Аналізи розміру фрагменту та перекриття послідовності
ІЇ00228| Як згадано вище, для оцінки ВЧК можна застосовувати параметри розміру фрагментів, а також перекриття. Розмір фрагмента для фрагмента безклітинної нуклеїнової кислоти, наприклад, фрагмента вцДНК, можна одержати за допомогою секвенування спарених кінців, електрофорезу (наприклад, капілярного електрофорезу на основі мікрочипів) та інших способів, відомих у даній галузі техніки. На фігурі 2А тематично проілюстровано, як секвенування спарених кінців можна застосовувати для визначення як розміру фрагмента, так і перекриття послідовності. 00229) У верхній половині фігури 2А представлена діаграма фрагмента безклітинної ДНК плода та фрагмента материнської безклітинної ДНК, що забезпечує матрицю для процесу секвенування спарених кінців. Звичайно довгі послідовності нуклеїнової кислоти фрагментують на більш короткі послідовності для ріда у процесі секвенування спарених кінців. Такі фрагменти також називають вставками. Фрагментація є недоцільною для безклітинної ДНК, оскільки безклітинна ДНК уже існує у вигляді фрагментів, здебільшого більш коротких, ніж 300 пар основ.
Було показано, що фрагменти безклітинної ДНК плода у материнській плазмі є більш довгими, ніж фрагменти материнської безклітинної ДНК. Як показано у верхній частині фігури 2А, безклітинні ДНК плодового походження характеризуються середньою довжиною приблизно 167 пар основ, у той час як безклітинна ДНК материнського походження характеризуються середньою довжиною приблизно 175 пар основ. При секвенуванні спарених кінців на певних платформах, таких як платформа Шитіпа для секвенування за допомогою синтезу, як описано докладніше нижче по тексту, із двома кінцями фрагмента лігують адаптерні послідовності, індексні послідовності та/або праймерні послідовності (не показано на фігурі 2А). Фрагмент спочатку прочитують у одному напрямку, одержуючи рід 1 з одного кінця фрагмента. Потім починають другий рід із протилежного кінця фрагмента, одержуючи послідовність ріду 2.
Відповідність між рідом 1 та рідом 2 можна ідентифікувати за допомогою їхніх координат у проточній комірці. Потім рід 1 та рід 2 картують на референсну послідовність у вигляді пари міток, які знаходяться поблизу одна від іншої, як показано у нижній половині фігури 2А. Згідно з деякими варіантами реалізації, якщо ріди є досить довгими, два ріди можуть перекриватися у середній частині вставки. Після того як пари вирівнюють із референсною послідовністю, відносну відстань між двома рідами та довжину фрагмента можна визначити на підставі положень двох рідів. Оскільки ріди спарених кінців забезпечують у два рази більше пар основ, ніж ріди одиночних кінців при тій же довжині ріду, вони сприяють поліпшенню якості вирівнювання, особливо для послідовностей з багатьма повторами або для неунікальних послідовностей. Згідно із багатьма варіантами реалізації референсну послідовність підрозділяють на блоки, такі як блоки по 100 тисяч пар основ. Після того як ріди спарених кінців вирівнюють із референсною послідовністю, можна визначити кількість рідів, вирівняних із блоком. Також для блоку можна визначити кількість, а також довжини вставок (наприклад, фрагментів вуДНК). Згідно з деякими варіантами реалізації, якщо вставка одночасно попадає у два блоки, половини вставки можна віднести до кожного блоку.
І00230| На фігурі 28 представлений варіант реалізації, що забезпечує процес 220 для застосування перекриття на підставі розміру з метою визначення варіації числа копій послідовності нуклеїнової кислоти, що представляє інтерес, у досліджуваному зразку, що містить фрагменти безклітинної нуклеїнової кислоти, отримані із двох або більше геномів. Як розкрито у даному документі, параметр "зміщений убік розміру фрагменту або діапазону розміру", коли: 1) параметр сприятливо зважується за розміром фрагмента або діапазоном розміру, наприклад, обчислення має більшу вагу, коли пов'язаний із фрагментами розміру або діапазоном розміру, ніж для інших розмірів або діапазонів; або 2) параметр отриманий зі значення, яке сприятливо зважується за розміром фрагменту або діапазоном розміру, наприклад, співвідношення отримане з підрахунку, який має більшу вагу, коли пов'язаний із фрагментами розміру або діапазону розміру. Розмір фрагменту або діапазон розміру може бути характеристикою геному або його частини, коли геном утворює фрагменти нуклеїнової кислоти, які збагачені або містять більш високу концентрацію розміру або діапазону розміру у порівнянні із ррагментами нуклеїнової кислоти з іншого геному або іншої частини того ж геному.
І00231| Процес 220 починається з одержання рідів послідовності, отриманих у результаті секвенування фрагментів безклітинної нуклеїнової кислоти у досліджуваному зразку. Див. блок 222. Два або більше геномів у досліджуваному зразку можуть являти собою геном вагітної матері та геном плода, виношуваного вагітною матір'ю. У інших варіантах застосування досліджуваний зразок включає безклітинну ДНК із пухлинних клітин та неуражених клітин.
Згідно з деякими варіантами реалізації у зв'язку з високим співвідношенням сигнал/шум, забезпеченим перекриттям на підставі розміру, секвенування фрагментів безклітинної нуклеїнової кислоти проводять без необхідності у ампліфікації фрагментів нуклеїнової кислоти із застосуванням ПЛР. Процес 200 також включає вирівнювання рідів послідовності фрагментів безклітинної нуклеїнової кислоти з референсним геномом, який містить послідовність, що представляє інтерес, та розділений на множину блоків. Успішне вирівнювання приводить до бо одержання міток досліджуваної послідовності, які включають послідовність та її розташування на референсній послідовності. Див. блок 224. Потім процес 220 продовжується визначенням розмірів фрагментів безклітинної нуклеїнової кислоти, що існують у досліджуваному зразку.
Деякі варіанти реалізації, у яких застосовують секвенування спарених кінців, забезпечують довжину вставки, пов'язаної із міткою послідовності. Див. блок 226. Терміни "розмір" та "довжина" використовуються взаємозамінно, коли їх використовують по відношенню до послідовностей або фрагментів нуклеїнової кислоти. Згідно з варіантом реалізації, проілюстрованим у даному документі, процес 220 також включає зважування міток досліджуваної послідовності на підставі розмірів фрагментів безклітинної нуклеїнової кислоти, з яких одержують мітки. Див. блок 228. У даному документі "зважування" означає модифікацію кількості із застосуванням однієї або більше змінних або функцій. Одну або більше змінних або функцій вважають "вагою". Згідно із багатьма варіантами реалізації змінну множать на вагу.
Згідно з іншими варіантами реалізації змінну можна модифікувати експоненціально або іншим способом. Згідно з деякими варіантами реалізації зважування міток досліджуваної послідовності здійснюють за допомогою зсуву перекриттів убік міток досліджуваної послідовності, отриманих із фрагментів безклітинної нуклеїнової кислоти розміру або діапазону розміру, характерного для одного геному у досліджуваному зразку. Як розкрито у даному документі, розмір являє собою характеристику геному, коли геном містить збагачену або більш високу концентрацію нуклеїнової кислоти зазначеного розміру у порівнянні з іншим геномом або іншою частиною того ж геному.
І00232| Згідно з деякими варіантами реалізації функція зважування може являти собою лінійну або нелінійну функцію. Приклади застосовних нелінійних функцій включають, без обмеження, східчасті функції Хевісайда, функції вагона, східчасті функції або сигмоїдальні функції. Згідно з деякими варіантами реалізації використовують функцію Хевісайда або функцію вагона, у результаті чого мітку у конкретному діапазоні розміру множать на вагу 1, та мітки за межами діапазону множать на вагу 0. Згідно з деякими варіантами реалізації фрагментам від 80 до 150 пар основ привласнюють вагу 1, тоді як фрагментам за межами даного діапазону привласнюють вагу 0. У даних прикладах зважування є дискретним, представляючи собою нуль або одиницю залежно від того, чи попадає параметр усього значення у межі або за межі конкретного діапазону. У якості альтернативи, вагу обчислюють як безперервну функцію розміру фрагмента або іншого аспекту зв'язаного значення параметру.
І00233| Згідно з деякими варіантами реалізації вага для фрагментів у одному діапазоні розміру є позитивною, та вага у іншому діапазоні є негативною. Даний факт можна застосовувати, щоб сприяти посиленню сигналу, коли напрямки відмінності між двома геномами характеризуються протилежними знаками. Наприклад, підраховані значення ріда мають вагу 1 для вставки 80 - 150 пар основ та вагу -1 для вставки 160 - 200 пар основ. 00234) Вага може бути привласнена підрахункам, а також іншим параметрам. Наприклад, зважування можна також застосовувати відносно дробових параметрів або параметрів співвідношення, у яких використовується розмір фрагменту. Наприклад, співвідношення може привласнювати фрагментам у певних піддіапазонах більшу вагу, ніж фрагментам та блокам іншого розміру. 00235) Потім обчислюють перекриття для блоків на підставі зважених міток досліджуваної послідовності. Див. блок 230. Такі перекриття вважають зміщеними убік розміру. Як пояснено вище, значення зміщене убік розміру фрагмента або діапазону розміру, якщо параметр сприятливо зважується за розміром фрагменту або діапазону розміру. Процес 200 також включає ідентифікацію варіації числа копій у послідовності, що представляє інтерес, з обчислених перекриттів. Див. блок 232. Згідно з деякими варіантами реалізації, як докладніше пояснене нижче по тексту стосовно до фігур 2С, ЗА-ЗК та 4, перекриття можна підігнати або відкоригувати для видалення шуму у даних, та за допомогою цього збільшити співвідношення сигнал/шум. У деяких варіантах застосування перекриття на підставі зважених міток, отриманих у процесі 220, забезпечує більш високу чутливість талабо більш високу селективність у порівнянні з незваженими перекриттями при визначенні варіації числа копій. У деяких варіантах застосування, приклад робочого процесу, запропонований нижче, може додатково поліпшити чутливість та селективність аналізу ВЧК.
Приклад робочого процесу для аналізу розміру фрагменту та/або перекриття послідовності
І00236| У деяких розкритих варіантах реалізації запропоновані способи визначення кількостей перекриття послідовності з низьким шумом та/або високим сигналом, які забезпечують дані для визначення різних генетичних станів, пов'язаних із числом копій та ВЧК, з поліпшеною чутливістю, селективністю та/або ефективністю у порівнянні з кількостями перекриття послідовності, отриманими загальноприйнятими способами. Згідно з певними бо варіантами реалізації послідовності з досліджуваного зразку процесують для одержання кількостей перекриття послідовності.
І00237| У процесі застосовують певну інформацію, доступну з інших джерел. Згідно з деякими варіантами реалізації всю дану інформацію одержують із навчальної множини зразків, які встановлено є неураженими (наприклад, не анеуплоїдними). Згідно з іншими варіантами реалізації деяку частину або всю інформацію одержують від інших досліджуваних зразків, які можуть бути запропоновані "на ходу", оскільки у тому самому процесі аналізують декілька зразків. 00238) Згідно з певними варіантами реалізації для зниження шуму даних застосовують маски послідовності. Згідно з деякими варіантами реалізації як послідовність, що представляє інтерес, так і її нормуючі послідовності є маскованими. Згідно з деякими варіантами реалізації можна застосовувати різні маски, коли розглядають різні хромосоми або сегменти, що представляють інтерес. Наприклад, одну маску (або групу масок) можна застосовувати, коли хромосома 13 являє собою хромосому, що представляє інтерес, та відмінну маску (або групу масок) можна застосовувати, коли хромосома 21 являє собою хромосому, що представляє інтерес. Згідно з певними варіантами реалізації маски задають при розділі блоків. Внаслідок цього у одному прикладі розділ маски становить 100 т.о. Згідно з деякими варіантами реалізації відносно хромосоми У можна застосовувати окрему маску. Масковані області виключення можуть бути запропоновані для хромосоми У при більш високому розділенні (1 т.0.), ніж для інших хромосом, що представляють інтерес, як описано у попередній заявці на патент США Мо 61/836,057, поданій 17 червня 2013 року (номер патентного реєстру АКТЕРООВРІ. Маски запропоновані у формі файлів, що ідентифікують виключені геномні області. (002391 Згідно з певними варіантами реалізації для усунення міжблокової варіації у профілі послідовності, що представляє інтерес, у процесі застосовують очікуване значення нормованого перекриття, причому варіація є неінформативною для визначення ВЧК для досліджуваного зразку. Процес підганяє нормовані кількості перекриття відповідно до очікуваного значення нормованого перекриття для кожного блоку по всьому геному або щонайменше для блоків стійких хромосом у референсному геномі (для застосування у операції 317 нижче). У ході даного процесу також можна поліпшити параметри, відмінні від перекриття.
Очікуване значення можна визначити з навчальної множини неуражених зразків. Як приклад, очікуване значення може являти собою медіанне значення у межах зразків навчальної множини. Очікувані значення перекриття зразків можна визначити як кількість унікальних не повторюваних міток, вирівняних із блоком, розділену на сумарну кількість унікальних не повторюваних міток, вирівняних з усіма блоками у стійких хромосомах референсного геному.
І00240| На фігурі 2С представлена структурна схема процесу 200 для визначення параметру розміру фрагменту для послідовності, що представляє інтерес, причому параметр застосовують для оцінки числа копій послідовності, що представляє інтерес, у досліджуваному зразку у блоці 214. Даний процес усуває систематичну варіацію, загальну серед неуражених навчальних зразків, причому варіація збільшує шум у аналізі для оцінки ВЧК. Даний процес також усуває похибки С, властиві досліджуваному зразку, за допомогою цього збільшуючи співвідношення сигнал/шум у даних аналізу. Слід зазначити, що процес 200 можна також застосовувати відносно перекриття незалежно від того, чи зміщене перекриття убік розміру чи ні. Аналогічно, процеси на фігурах 20, З та 4 є рівною мірою застосовними до перекриття, зваженого за розміром фрагменту перекриття, розміру фрагмента, фракції або співвідношення фрагментів у заданому діапазоні розміру, рівню метилювання фрагментів і т.д.
І00241| Процес 200 починається із забезпечення рідів послідовності досліджуваного зразку, як зазначено у блоці 202. Згідно з деякими варіантами реалізації ріди послідовності одержують у результаті секвенування сегментів ДНК, отриманих із крові вагітної жінки, включаючи вцДднкК матері та плода. Процес продовжується вирівнюванням рідів послідовності з референсним геномом, що містять послідовність, що представляє інтерес, із забезпеченням міток досліджуваної послідовності. Блок 204. Згідно з деякими варіантами реалізації ріди, які вирівнюються з більш ніж одним сайтом, виключають. Згідно з деякими варіантами реалізації декілька рідів, які вирівнюються з тим самим сайтом, виключають або знижують до підрахунку одиничного ріду. Згідно з деякими варіантами реалізації ріди, які вирівнюються з виключеними сайтами, також виключають. Внаслідок цього згідно з деякими варіантами реалізації для забезпечення підрахунку невиключених сайтів (підрахунку МЕ5) з метою визначення перекриття або інших параметрів кожного блоку підраховують винятково унікально вирівняні не повторювані мітки, вирівняні з невиключеними сайтами. 00242) Процес 200 забезпечує розміри фрагментів безклітинної нуклеїнової кислоти, що існують у досліджуваному зразку. Згідно з деякими варіантами реалізації із застосуванням бо секвенування спарених кінців можна одержати розмір/довжину вставки з розташувань пари рідів на кінцях вставки. Для визначення розміру фрагмента можна застосовувати інші методики. Див. блок 205. Потім у блоках референсного геному, включаючи блоки у послідовності, що представляє інтерес, процес 200 визначає значення параметру розміру фрагменту, зміщеного убік характеристики розмірів фрагменту одного з геномів. Термін "параметр розміру фрагменту" означає параметр, який відноситься до розміру або довжини фрагменту або сукупності фрагментів для фрагментів нуклеїнової кислоти; наприклад, фрагментів вцДНК, отриманих з фізіологічної рідини. У даному документі параметр "зміщений убік розміру фрагменту або діапазону розміру", коли: 1) параметр сприятливо зважується за розміром фрагменту або діапазоном розміру, наприклад, обчислення має більшу вагу, коли пов'язаний із фрагментами розміру або діапазону розміру, ніж для інших розмірів або діапазонів; або 2) параметр отриманий зі значення, яке сприятливо зважується за розміром фрагменту або діапазоном розміру, наприклад, співвідношення отримане з підрахунку, який має більшу вагу, коли пов'язаний із фрагментами розміру або діапазону розміру. Розмір фрагменту або діапазон розміру може бути характеристикою геному або його частини, коли геном утворює фрагменти нуклеїнової кислоти, які збагачені або містять більш високу концентрацію розміру або діапазону розміру, у порівнянні із фрагментами нуклеїнової кислоти з іншого геному або іншої частини того ж геному. (00243) Згідно з деякими варіантами реалізації параметр розміру фрагменту являє собою зважений за розміром підрахунок. Згідно з деякими варіантами реалізації фрагмент важить 1 у діапазоні та 0 за межами діапазону. Згідно з іншими варіантами реалізації параметр розміру фрагменту являє собою фракцію або відношення фрагментів у діапазоні розміру. Див. блок 206.
Згідно з деякими варіантами реалізації значення параметру розміру фрагменту (або перекриття, як відзначено вище) кожного блоку ділять на значення параметру нормуючої послідовності у тому самому зразку, одержуючи нормований параметр.
І00244| Після цього процес 200 забезпечує глобальний профіль послідовності, що представляє інтерес. Глобальний профіль містить значення очікуваного параметру у кожному блоці, отримане з навчальної множини неуражених навчальних зразків. Блок 208. Процес 200 усуває варіацію, звичайну для навчального зразку, за допомогою припасування значень нормованого параметру міток досліджуваної послідовності відповідно до очікуваних значень параметру для одержання відкоректованих з урахуванням глобального профілю значень параметру для послідовності, що представляє інтерес. Блок 210. Згідно з деякими варіантами реалізації очікуване значення параметру, отримане з навчальної множини, забезпеченого у блоці 208, являє собою медіану серед навчальних зразків. Згідно з деякими варіантами реалізації операція 2010 підганяє нормоване значення параметру за допомогою вирахування очікуваного значення параметру з нормованого значення параметру. Згідно з іншими варіантами реалізації операція 210 ділить нормоване значення параметру на очікуване значення параметру кожного блоку для одержання відкоректованого з урахуванням глобального профілю значення параметру. 00245) На додаток до коректування з урахуванням глобального профілю або замість нього процес 200 усуває похибки СС, властиві досліджуваному зразку, за допомогою припасування значення параметру. Як показано у блоці 212, процес підганяє відкоректоване з урахуванням глобального профілю значення параметру на підставі взаємозв'язку між рівнем вмісту С та відкоректованим з урахуванням глобального профілю перекриттям, що існує у досліджуваному зразку, за допомогою цього одержуючи відкоректоване з урахуванням С у зразку значення параметру розміру фрагменту. Після припасування з урахуванням систематичної варіації, звичайної для неуражених навчальних зразків, та внутрішньосуб'єктних похибок С процес забезпечує значення розміру фрагмента, відкоректоване з урахуванням глобального профілю та/або дисперсії С, причому значення застосовують для оцінки ВЧК зразка з поліпшеною чутливістю та специфічністю. Згідно з деякими варіантами реалізації значення розміру фрагменту можна підігнати із застосуванням способу аналізу головних компонентів для усунення компонентів дисперсії, не пов'язаних з варіацією числа копій послідовності, що представляє інтерес, як далі описано стосовно блоку 719 фігури 2Е. Згідно з деякими варіантами реалізації значення розміру фрагмента можна підібрати за допомогою усунення випадаючих значень блоків у межах зразку, як описано відносно блоку 321 фігури ЗА.
Багатопрохідний процес для визначення числа копій із застосуванням декількох параметрів (00246) Як підкреслено вище, процеси, розкриті у даному документі, є підходящими для визначення ВЧК із застосуванням декількох параметрів, включаючи, без обмеження, перекриття, зважене за розміром фрагменту перекриття, розмір фрагменту, фракцію або відношення фрагментів у заданому діапазоні розміру, рівень метилювання фрагментів і т.д. бо Кожен з даних параметрів можна окремо процесувати, щоб параметр індивідуально вніс внесок у визначення підсумкової варіації числа копій. 00247) Згідно з деякими варіантами реалізації аналогічні процеси можна застосовувати відносно аналізу зваженого за розміром перекриття та аналізу розміру фрагменту, обидва з яких є параметрами розміру фрагментів. На фігурі 20 представлена блок-схема двох перекриванних проходів робочого процесу 600, прохід 1 для зваженого за розміром перекриття та прохід 2 для аналізу розміру фрагменту. Згідно з іншим варіантом реалізації, не показаним у даному документі, рівень метилювання можна процесувати у одному додатковому проході. Два проходи можуть включати порівнянні операції для одержання підігнаної інформації про перекриття, на якій основане визначення ВЧК.
І00248| Вихідна однопрохідна частина процесу починається з одержання даних секвенування, див. блок 602, та продовжується комп'ютеризованим обчисленням підрахованих значень, як описано вище, див. блок 612. Після даної точки зображений процес розділяється на два проходи, як описано вище. Вертаючись до початкової частини процесу, робочий процес перетворює дані секвенування у ріди послідовності. Якщо дані секвенування отримані з мультиплексного секвенування, ріди послідовності також демультиплексують для ідентифікації джерела даних. Див. блок 604. Потім ріди послідовності вирівнюють із референсною послідовністю, причому вирівняні ріди послідовності запропоновані у вигляді міток послідовності. Див. блок 606. Після цього мітки послідовності фільтрують для одержання невиключених сайтів (МЕ5), які являють собою однозначно картовані мітки послідовності, що не дублюються. Мітки послідовності організовані у блоки конкретної довжини послідовності, такої як 1 т.о., 100 т.о. або 1 Мб. Див. блок 610. Згідно з деякими варіантами реалізації, що включають аналіз синдром-специфічних областей, довжина блоків становить 100 т.о. Згідно з деякими варіантами реалізації блоки, що демонструють високу варіабельність, можна маскувати із застосуванням маски послідовності, отриманої з множини неуражених зразків за способом, описаним на фігурі ЗА, блок 313. Потім мітки у МЕЗ підраховують для одержання перекриттів, що підлягають нормуванню та припасуванню для аналізу ВЧК. Див. блок 612.
І00249| Згідно із представленим варіантом реалізації операції 604, 606, 610 та 612 здійснюють один раз, та більшість з інших операцій здійснюють двічі, один раз для аналізу зваженого за розміром перекриття (прохід 1) та один раз для аналізу розміру фрагменту (прохід 2). Згідно з іншими варіантами реалізації одну або більше операцій, які показані як здійснювані у двох проходах, здійснюють винятково один раз, та результати використовують у обох процесах.
Приклади таких спільно використовуваних операцій включають операції 614, 616 та 618. 00250 Згідно із представленими варіантами реалізації отримані перекриття (зважені за розміром підраховані значення) або параметр розміру фрагменту (фракції або співвідношення розміру) МЕЗ нормують за допомогою, наприклад, ділення значення МЕ5 блоку на сумарні МЕ5 геному або множини нормуючих хромосом. Згідно з деякими варіантами реалізації нормують винятково перекриття, у той час як немає необхідності нормувати параметр розміру фрагменту, оскільки глибина секвенування не впливає на нього у такий же спосіб, як на перекриття. Див. блок 614. Потім згідно з деякими варіантами реалізації усувають дисперсію, загальну для навчальної множини, включаючи неуражені зразки, причому дисперсія не пов'язана із ВЧК, що представляє інтерес. Згідно із представленим варіантом реалізації загальна дисперсія представлена як глобальний хвильовий профіль, отриманий з неуражених зразків за способом, аналогічним одержанню глобального хвильового профілю, описаного вище. Згідно з деякими варіантами реалізації, як проілюстровано на фігурі 6, неуражені зразки, застосовувані для одержання глобального хвильового профілю, включають зразки з однієї і тієї ж проточної комірки або процесованої партії. Див. блок 616. Обчислення глобальної хвилі, специфічної до проточної комірки, докладніше пояснене нижче по тексту. Згідно із представленим варіантом реалізації після того, як був усунутий глобальний хвильовий профіль, перекриття коректують із урахуванням рівня С зразок-специфічним чином. Див. блок 616. Деякі алгоритми корекції С описані більш докладно нижче по тексту у описі, пов'язаному з фігурою ЗА, блок 319.
І0О0251| Згідно із представленим варіантом реалізації як у проході 1 для аналізу зваженого перекриття, так і у проході 2 для аналізу розміру фрагменту потім дані можна відфільтрувати із урахуванням шуму, специфічного індивідуальному зразку, наприклад, з аналізу можна видалити дані блоків, що різко відхиляються, які характеризуються перекриттями, що надзвичайно відрізняються від інших блоків, причому відмінність не можна віднести до варіації числа копій, що представляє інтерес. Див. блок 622. Дана операція внутрішньовибіркового фільтрування може відповідати блоку 321 на фігурі ЗА. 002521 Згідно з деякими варіантами реалізації після фільтрування одного зразку зважені значення перекриття проходу 1 та параметру розміру фрагменту проходу 2 збагачують у бо цільовий сигнал у порівнянні з референсним. Див. блоки 624 та 628. Потім перекриття та параметр розміру фрагмента для хромосоми застосовують для обчислення дози хромосоми та нормованого значення хромосоми (МС), як описано вище. Після цього МСМ можна зрівняти із критерієм для визначення показника, що свідчить про ймовірність ВЧК. Див. блоки 626 та 630.
Потім показники із двох проходів можна об'єднати з одержанням комплексного підсумкового показника, який визначає, чи слід прийняти рішення про анеуплоїдію. Згідно з деякими варіантами реалізації показники 626 та 630 являють собою статистичні дані І-критерію або 2- значення. Згідно з деякими варіантами реалізації підсумковий показник являє собою значення хі-квадрат. Згідно з іншими варіантами реалізації підсумковий показник являє собою середнє квадратичне значення двох Іі-значень або 7-показників. Інший спосіб об'єднання двох показників від двох проходів можна застосовувати для поліпшення загальної чутливості та селективності при виявленні ВЧК. У якості альтернативи, можна об'єднати два показники із двох проходів за допомогою логічних операції, наприклад, операції ТА або операції АБО. Наприклад, коли для забезпечення низької частки псевдо негативних результатів кращою є висока чутливість, рішення про ВЧК можна прийняти, коли показник із проходу 1 АБО проходу 2 відповідає критерію рішення. З іншого боку, якщо для забезпечення низької частки псевдо позитивних результатів бажаною є висока селективність, рішення про ВЧК можна прийняти винятково якщо показник проходу 1 ТА проходу 2 відповідає критерію рішення. 00253) Примітно, що існує компроміс між чутливістю та селективністю із застосуванням таких логічних операцій, описаних вище. Згідно з деякими варіантами реалізації застосовують підхід двоетапного секвенування, щоб подолати компроміс, як далі описано нижче по тексту.
Коротко, вихідне визначення показника для зразку порівнюють із відносно низьким першим порогом, призначеним для збільшення чутливості, та, якщо показник зразку перевищує перший поріг, його направляють на другий раунд секвенування, який є більш глибоким, ніж перший.
Такий зразок потім повторно процесують та аналізують у робочому процесі, аналогічному процесу, описаному вище. Потім отриманий у результаті показник порівнюють із відносно високим другим порогом, призначеним для поліпшення чутливості. Згідно з деякими варіантами реалізації зразки, які піддають другому раунду секвенування, характеризуються показником відносно більш низьким серед зразків, показник яких перевищує перший поріг, за допомогою чого знижується кількість зразків, які необхідно повторно секвенувати.
ІЇ00254| Згідно з деякими варіантами реалізації можна застосовувати 3-ій прохід із застосуванням 3-ого параметру. Прикладом даного 3-ого проходу є метилювання.
Метилювання можна визначити прямо за допомогою вимірювання метилювання нуклеїнових кислот зі зразку або опосередковано як параметр, який корелює з розміром фрагменту безклітинних нуклеїнових кислот.
І00255| Згідно з деякими варіантами реалізації даний 3-ий параметр являє собою 2-е перекриття або параметр на підставі підрахунку, причому підраховані значення основані на розмірі фрагментів за межами розміру первинного фрагменту, який використовували у першому параметрі на підставі підрахунку. Коли для одержання підрахунку або параметру перекриття застосовують фрагменти від 80 до 150 пар основ, вони виключають приблизно 70 95 рідів із секвенування. У тому ступені, у якому дані виключені ріди усе ще характеризуються деяким потенційно підходящим сигналом, їх можна застосовувати у 3-ому параметрі, який включає виключені ріди або ріди у фракції на підставі розміру, що знаходиться за межами або перекривається із фракцією на підставі розміру, використаною у першому параметрі. У цьому зв'язку рідам та зв'язаним значенням перекриття, узятим з виключених фрагментів, може бути привласнена менша вага. Інакше кажучи, параметру варіації числа копій, обчисленому із застосуванням даних рідів, можна приписати меншу важливість при прийнятті підсумкового рішення про варіацію числа копій. У якості альтернативи, як описано вище, мітки за межами діапазону розміру у першому параметрі можуть приймати негативне значення, коли два геноми мають протилежні характеристики у двох діапазонах розміру. 00256) Згідно з різними варіантами реалізації перекриття у процесах 200, 220 та 600 зміщені убік міток із фрагментів на більш короткій границі спектру розміру фрагменту. Згідно з деякими варіантами реалізації перекриття зміщені убік міток із фрагментів розмірів, більш коротких, ніж зазначене значення. Згідно з деякими варіантами реалізації перекриття зміщені убік міток із фрагментів у діапазоні розмірів фрагменту, та верхня границя діапазону становить приблизно 150 пар основ або менше.
І00257| Згідно з різними варіантами реалізації процесів 200, 220 та 600 ріди послідовності одержують у результаті секвенування фрагментів безклітинної нуклеїнової кислоти без первісного застосування ПЛР для ампліфікації нуклеїнових кислот фрагментів безклітинної нуклеїнової кислоти. Згідно з різними варіантами реалізації ріди секвенування одержують у бо результаті секвенування фрагментів безклітинної нуклеїнової кислоти до глибини не більше ніж приблизно 6 М фрагментів на зразок.
Згідно з деякими варіантами реалізації глибина секвенування становить не більш ніж приблизно 1 М фрагментів на зразок.
Згідно з деякими варіантами реалізації ріди секвенування одержують за допомогою мультиплексного секвенування, та кількість мультиплексованих зразків становить щонайменше приблизно 24.
00258) Згідно з різними варіантами реалізації процесів 200, 220 та 600 досліджуваний зразок містить плазму від індивідуума.
Згідно з деякими варіантами реалізації процеси також включають одержання безклітинної нуклеїнової кислоти з досліджуваного зразку.
Згідно з деякими варіантами реалізації процеси також включають секвенування фрагментів безклітинної нуклеїнової кислоти, отриманих із двох або більше геномів.
00259) Згідно з різними варіантами реалізації процесів 200, 220 та 600 два або більше геномів включають геноми матері та плода.
Згідно з деякими варіантами реалізації варіація числа копій у послідовності, що представляє інтерес, включає анеуплоїдію у геномі плода.
00260) Згідно з деякими варіантами реалізації процесів 200, 220 та 600 два або більше геномів включають геноми ракових та соматичних клітин.
Згідно з деякими варіантами реалізації процеси включають застосування варіації числа копій у раковому геномі для діагностики раку, контролю прогресування раку та/або визначення лікування раку.
Згідно з деякими варіантами реалізації варіація числа копій викликає генетичну аномалію.
00261) Згідно з деякими варіантами реалізації процесів 200, 220 та 600 перекриття зміщені убік міток із фрагментів на більш довгій границі спектру розміру фрагментів.
Згідно з деякими варіантами реалізації перекриття зміщені убік міток з розмірів фрагментів, більш довгих, ніж зазначене значення.
Згідно з деякими варіантами реалізації перекриття зміщені убік міток із фрагментів у діапазоні розмірів фрагментів, причому більш низька границя діапазону становить приблизно 150 пар основ або більше.
(00262) Згідно з деякими варіантами реалізації процесів 200, 220 та 600 процеси також включають: визначення у блоках референсного геному, що містять послідовність, що представляє інтерес, рівнів метилювання фрагментів безклітинної нуклеїнової кислоти. у зазначених блоках та застосування рівнів метилювання на додаток до обчислених перекриттів або значень параметру розміру фрагменту або замість них для ідентифікації варіації числа копій.
Згідно з деяким варіантом реалізації застосування рівнів метилювання для ідентифікації варіації числа копій включає забезпечення глобального профілю метилювання для блоків послідовності, що представляє інтерес.
Глобальний профіль метилювання включає очікувані рівні метилювання щонайменше у блоках послідовності, що представляє інтерес.
Згідно з деякими варіантами реалізації очікувані рівні метилювання одержують із довжин фрагментів безклітинної нуклеїнової кислоти у навчальній множині неуражених навчальних зразків, що містять нуклеїнові кислоти, секвеновані та вирівняні по суті тим же способом, що і фрагменти нуклеїнової кислоти досліджуваного зразку, причому очікувані рівні метилювання демонструють міжблокову варіацію.
Згідно з деякими варіантами реалізації процеси включають припасування значення рівнів метилювання із застосуванням очікуваних рівнів метилювання у блоках щонайменше послідовності, що представляє інтерес, та за допомогою цього одержання відкоректованих з урахуванням глобального профілю значень рівнів метилювання для послідовності, що представляє інтерес.
Процеси також включають ідентифікацію варіації числа копій із застосуванням відкоректованих з урахуванням глобального профілю перекриттів та відкоректованих з урахуванням глобального профілю рівнів метилювання.
Згідно з деякими варіантами реалізації ідентифікація варіації числа копій із застосуванням відкоректованих з урахуванням глобального профілю перекриттів та відкоректованих з урахуванням глобального профілю рівнів метилювання також включає: припасування відкоректованих з урахуванням глобального профілю перекриттів та відкоректованих з урахуванням глобального профілю рівнів метилювання, основане на рівні вмісту С, та за допомогою цього одержання відкоректованих з урахуванням ОС перекриттів та відкоректованих з урахуванням ОС значень рівнів метилювання для послідовності, що представляє інтерес; та ідентифікацію варіації числа копій із застосуванням відкоректованих з урахуванням С перекриттів та відкоректованих з урахуванням СОС рівнів метилювання.
00263) Згідно з деякими варіантами реалізації процесів 200, 220 та 600 параметр розміру фрагменту включає фракцію або співвідношення, включаючи частину фрагментів безклітинної нуклеїнової кислоти у досліджуваному зразку, розмір фрагментів яких є більш коротким або більш довгим, ніж порогове значення.
Згідно з деякими варіантами реалізації параметр розміру фрагменту включає фракцію, що містить (ї) кількість фрагментів у досліджуваному зразку у межах першого діапазону розміру, що містить 110 пар основ, та (ії) кількість фрагментів у досліджуваному зразку у межах другого діапазону розміру, що містить перший діапазон розміру бо та розміри за межами першого діапазону розміру.
Визначення числа копій із застосуванням трипрохідного процесу, відношень правдоподібності, Ї-статистики та/або фракцій плода
І00264| На фігурі 2Е представлена блок-схема трипрохідного процесу для оцінки числа копій. Даний процес включає три перекриванні проходи робочого процесу 700, який включає прохід 1 (або 713А) аналізу перекриття рідів, пов'язаних із фрагментами всіх розмірів, прохід 2 (або 7138) аналізу перекриття рідів, пов'язаних з більш короткими фрагментами, та прохід З (або 713С) аналізу відносної частоти більш коротких рідів у порівнянні з усіма рідами. (00265) Процес 700 аналогічний процесу 600 за своєю загальною організацією. Операції, зазначені у блоках 702, 704, 706, 710, 712, можна здійснити тим же або аналогічним способом, як і операції, зазначені у блоках 602, 604, 606 та 610 та 612. Після одержання підрахованих значень рідів визначають перекриття із застосуванням рідів із фрагментів усіх розмірів у проході 713А. Перекриття визначають із застосуванням рідів з коротких фрагментів у проході 7138.
Частоту рідів з коротких фрагментів у порівнянні з усіма рідами визначають у проході 713.
Відносну частоту у іншому місці у даному документі також називають співвідношенням розміру або фракцією розміру. Відносна частота являє собою приклад характеристики розміру фрагменту. Згідно з деякими варіантами реалізації короткі фрагменти являють собою фрагменти, більш короткі, ніж приблизно 150 пар основ. Згідно з різними варіантами реалізації короткі фрагменти можуть знаходитися у діапазонах розміру приблизно 50 - 150, 80 - 150 або 110 - 150 пар основ. Згідно з деякими варіантами реалізації третій прохід, або прохід 713С, є необов'язковим. 00266) Усі дані із трьох проходів 713А, 713В та 713С піддають операції нормування 714, 716, 718, 719 та 722 для усунення дисперсії, не пов'язаної із числом копій послідовності, що представляє інтерес. Дані операції нормування обмежені у блоці 723. Операція 714 включає нормування проаналізованої кількості послідовності, що представляє інтерес, за допомогою ділення проаналізованої кількості на сумарне значення кількості референсної послідовності. На даному етапі нормування використовують значення, отримані з досліджуваного зразку.
Аналогічно, операції 718 та 722 нормують проаналізовану кількість із застосуванням значень, отриманих з досліджуваного зразку. У операціях 716 та 719 використовують значення, отримані з навчальної множини неуражених зразків.
І00267| Операція 716 усуває глобальну хвильову дисперсію, отриману з навчальної множини неуражених зразків, у яких використовують ті ж або аналогічні способи, описані по відношенню до блоку 616. Операція 718 усуває дисперсію специфічної для індивідуума дисперсії С із застосуванням того ж або аналогічних способів, описаних по відношенню до блоку 618.
ІЇ00268| Операція 719 усуває додаткову дисперсію із застосуванням способу аналізу головних компонентів (АГК). Дисперсія, що усувається методами АГК, обумовлена факторами, не пов'язаними із числом копій послідовності, що представляє інтерес. Проаналізована кількість у кожному блоці (перекриття, співвідношення розміру фрагменту і т.д.) забезпечує незалежну змінну для АГК, та зразки неураженої навчальної множини забезпечують значення для даних незалежних змінних. Усі зразки навчальної множини включають зразки, які характеризуються тим же числом копій послідовності, що представляє інтерес, наприклад, двома копіями соматичної хромосоми, однією копією Х-хромосоми (коли у якості неуражених зразків застосовують зразки чоловічої статі) або двома копіями Х-хромосоми (коли у якості неуражених зразків застосовують зразки жіночої статі). Таким чином, дисперсія у зразках не є наслідком анеуплоїдії або іншої відмінності у числі копій. АГК навчальної множини дозволяє одержати головні компоненти, які не пов'язані із числом копій послідовності, що представляє інтерес.
Потім головні компоненти можна використовувати для усунення дисперсії у досліджуваному зразку, не пов'язаної із числом копій послідовності, що представляє інтерес.
І00269| Згідно з певними варіантами реалізації дисперсію одного або більше головних компонентів усувають із даних досліджуваного зразку із застосуванням коефіцієнтів, обчислених з даних неуражених зразків у області за межами послідовності, що представляє інтерес. Згідно з деякими варіантами реалізації область являє собою всі стійкі хромосоми.
Наприклад, АГК здійснюють на нормованих даних перекриття блоку навчальних нормальних зразків з одержанням, таким чином, головних компонентів, що відповідають розмірам, при яких може бути зафіксована найбільша дисперсія у даних. Дисперсія, зафіксована таким чином, не пов'язана з варіацією числа копій у послідовності, що представляє інтерес. Після того як з навчальних нормальних зразків були отримані головні компоненти, їх застосовують у відношенні досліджуваних даних. У межах блоків з області за межами послідовності, що представляє інтерес, одержують модель лінійної регресії з досліджуваним зразком у якості бо змінної відповіді та з головними компонентами у якості залежних змінних. Отримані у результаті коефіцієнти регресії застосовують для нормування перекриття блоку області, що представляє інтерес, за допомогою вирахування лінійної комбінації головних компонентів, заданих за допомогою обчислених коефіцієнтів регресії. Це дозволяє усунути дисперсію, не пов'язану із
ВЧК, з послідовності, що представляє інтерес. Див. блок 719. Для наступного аналізу застосовують залишкові дані. Додатково, операція 722 усуває значення даних спостережень, що різко відхиляються, із застосуванням способів, описаних по відношенню до блоку 622. (00270) Після проведення операцій нормування у блоці 723 значення перекриття всіх блоків були "нормовані" для усунення джерел варіації, відмінних від анеуплоїдії або інший варіацій числа копій. У деякому сенсі блоки послідовності, що представляє інтерес, збагачені або змінені у порівнянні з іншими блоками з метою виявлення варіації числа копій. Див. блок 724, який являє собою не операцію, але представляє отримані у результаті значення перекриття.
Операції нормування у великому блоці 723 можуть збільшити сигнал та/або знизити шум для кількості, яку аналізують. Аналогічно, значення перекриття коротких фрагментів для блоків нормували з метою усунення джерел варіації, відмінної від анеуплоїдії або інших варіацій числа копій, як показано у блоці 728, та відносну частоту коротких фрагментів (або співвідношення розміру) для блоків нормували за аналогічним способом для усунення джерел варіації, відмінних від анеуплоїдії, або інших варіацій числа копій, як показано у блоці 732. Як і у випадку блоку 724, блоки 728 та 732 являють собою не операції, але представляють перекриття та значення відносної частоти після обробки великого блоку 723. Слід розуміти, що операції у великому блоці 723 можна модифікувати, реорганізувати або вилучити. Наприклад, згідно з деякими варіантами реалізації операцію АГК 719 не здійснюють. Згідно з іншими варіантами реалізації операцію коректування з урахуванням ОС 718 не здійснюють. Згідно з іншими варіантами реалізації порядок операцій змінений; наприклад, операцію АГК 719 здійснюють перед операцією коректування з урахуванням ОС 718.
ІЇ00271| Перекриття всіх фрагментів після нормування та усунення дисперсії, представленого у блоці 724, застосовують для одержання І1І-статистики у блоці 726. Аналогічно, перекриття коротких фрагментів після нормування та усунення дисперсії, представленого у блоці 728, застосовують для одержання Іі-статистики у блоці 730, та відносну частоту коротких фрагментів після нормування та видалення дисперсії, представленого у блоці 732, застосовують для одержання і-статистики у блоці 734. 002721 На фігурі 2Е представлене, чому застосування Іі-статистики відносно аналізу числа копій може сприяти поліпшенню точності аналізу. На фігурі 2Е представлені, на кожному кресленні, розподіли частоти нормованого перекриття блоку послідовності, що представляє інтерес, та референсної послідовності, причому розподіл послідовності, що представляє інтерес, перекриває та обмежує розподіл референсної послідовності. На верхньому кресленні представлене перекриття блоку для зразку, який характеризується більш високим перекриттям та який містить понад 6 мільйонів рідів; на нижньому кресленні представлене перекриття блоку для зразку, який характеризується більш низьким перекриттям та який містить менше 2 мільйонів рідів. На горизонтальній осі зазначене перекриття, нормоване у порівнянні із середнім значенням перекриття референсної послідовності. На вертикальній осі зазначена відносна щільність імовірності відносно кількостей блоків, які характеризуються середніми значеннями перекриття. Таким чином, фігура 2Е являє собою різновид гістограми. Розподіл для послідовності, що представляє інтерес, представлений попереду, та розподіл для референсної послідовності презентовано позаду. Середнє значення розподілу послідовності, що представляє інтерес, є більш низьким, ніж таке для референсної послідовності, що свідчить про менше число копій у зразку. Середнє значення різниці між послідовністю, що представляє інтерес, та референсною послідовністю аналогічне для зразку з високим перекриттям на верхньому кресленні та для зразку з низьким перекриттям на нижньому кресленні. Таким чином, згідно з деякими варіантами реалізації можна використовувати відмінність середнього значення для ідентифікації варіації числа копій у послідовності, що представляє інтерес. Відзначимо, що розподіли зразку з високим перекриттям характеризуються дисперсіями, меншими, ніж розподіли зразку з низьким перекриттям. Застосування винятково середнього значення для встановлення відмінності між двома розподілами не фіксує відмінність між двома розподілами, а також застосування середнього значення та дисперсії. Т-статистика може відображати як середнє значення, так і дисперсію розподілу.
ІЇ00273| Згідно з деякими варіантами реалізації операція 726 обчислює І-статистику наступним чином:
(ро274рі-- Ха, ів
Пі по
І00275| де хі являє собою перекриття блоку послідовності, що представляє інтерес, х» являє собою перекриття блоку референсної області/послідовності, 51: являє собою стандартне відхилення перекриттів послідовності, що представляє інтерес, 52 являє собою стандартне відхилення перекриттів референсної області, пі являє собою кількість блоків послідовності, що представляє інтерес; та по являє собою кількість блоків референсної області.
І00276| Згідно з деякими варіантами реалізації референсна область містить усі стійкі хромосоми (наприклад, хромосоми, відмінні від хромосом, які, найбільш ймовірно, несуть анеуплоїдію). Згідно з деякими варіантами реалізації референсна область містить щонайменше одну хромосому за межами послідовності, що представляє інтерес. Згідно з деякими варіантами реалізації референсна область містить стійкі хромосоми, що не містять послідовність, що представляє інтерес. Згідно з іншими варіантами реалізації референсна область містить множину хромосом (наприклад, підмножину хромосом, вибраних зі стійких хромосом), які були визначені для забезпечення найкращої здатності виявлення сигналу для множини навчальних зразків. Згідно з деякими варіантами реалізації здатність виявлення сигналу основана на здатності референсної області встановлювати відмінність між блоками, які несуть варіації числа копій, та блоками, які не несуть варіації числа копій. Згідно з деякими варіантами реалізації референсну область ідентифікують за способом, аналогічним такому, який застосовують для визначення "нормуючої послідовності" або "нормуючої хромосоми", як описано у розділі, озаглавленому "Ідентифікація нормуючих послідовностей".
І00277| Повертаючись до фігури 2Е, одну або більше оцінок фракції плода (блок 735) можна об'єднати з будь-якою і-статистикою у блоці 726, 730 та 734 з метою одержання оцінки правдоподібності для випадку плоїдності. Див. блок 736. Згідно з деякими варіантами реалізації одну або більше фракцій плода блоку 740 одержують за допомогою будь-якого із процесу 800 на фігурі 255, процесу 900 на фігурі 2Н або процесу 1000 на фігурі 2І. Процеси можна здійснювати паралельно із застосуванням робочого процесу, такого як робочий процес 1100 на фігурі 2). 002781) На фігурі 25 представлений приклад процесу 800 для визначення фракції плода з інформації про перекриття згідно з деякими варіантами реалізації даного винаходу. Процес 800 починається з одержання інформації про перекриття (наприклад, значень дози послідовності) навчальних зразків з навчальної множини. Див. блок 802. Кожен зразок навчальної множини отриманий від вагітної жінки, яка встановлено виношує плід чоловічої статі. А саме, зразок містить ВЧІДНК плода чоловічої статі. Згідно з деякими варіантами реалізації операція 802 може одержати перекриття послідовності, нормоване способами, відмінними від дози послідовності, як описано у даному документі, або може одержати інші значення перекриття.
І00279| Потім процес 800 включає обчислення фракцій плода навчальних зразків. Згідно з деякими варіантами реалізації фракції плода можна обчислити за значеннями дози послідовності:
Ах; - медіана(Ах;) (ро280| ФП, --2Х-- - - -ю -- З - медіана(Вх; ) 002811) де Ах; являє собою дозу послідовності для зразку чоловічої статі, медіана (Ях;) являє собою медіану доз послідовності для зразків жіночої статі. Відповідно до інших варіантів реалізації можна застосовувати середнє значення або інший показник головної тенденції. Згідно з деякими варіантами реалізації ФП можна отримати за іншими способами, такими як відносна частота Х- та У-хромосоми. Див. блок 804. (002821) Процес 800 також включає розділення референсної послідовності на декілька блоків субпослідовностей. Згідно з деякими варіантами реалізації референсна послідовність являє собою повний геном. Згідно з деякими варіантами реалізації блоки являють собою блоки довжиною 100 т.о. Згідно з деякими варіантами реалізації геном розділяють на приблизно 25000 блоків. Після цього процес одержує перекриття блоків. Див. блок 806. Згідно з деякими варіантами реалізації перекриття, використовувані у блоці 806, одержують після здійснення операцій нормування, продемонстрованих у блоці 1123 фігури 2. Згідно з іншими варіантами реалізації можна застосовувати перекриття з відмінного діапазону розміру.
А
І00283| Кожен блок пов'язаний з перекриттями зразків у навчальній множині. Внаслідок цього для кожного блоку можна одержати кореляцію між перекриттям зразків та фракціями плода зразків. Процес 800 включає одержання кореляцій між фракцією плода та перекриттям для всіх блоків. Див. блок 808. Потім процес вибирає блоки, значення кореляції яких перевищують поріг. Див. блок 810. Згідно з деякими варіантами реалізації вибирають блоки, які характеризуються 6000 найвищими значеннями кореляції. Метою є ідентифікація блоків, які демонструють високу кореляцію між перекриттям та фракцією плода у навчальних зразках.
Потім блоки можна застосовувати для прогнозування фракції плода у досліджуваному зразку.
Незважаючи на те, що навчальні зразки являють собою зразки чоловічої статі, можна узагальнити кореляцію між фракцією плода та перекриттям на досліджувані зразки чоловічої та жіночої статі.
І00284| Із застосуванням обраних блоків, які характеризуються високими значеннями кореляції, процес дозволяє одержати лінійну модель, що встановлює взаємозв'язок між фракцією плода та перекриттям. Див. блок 812. Кожен обраний блок забезпечує незалежну змінну для лінійної моделі. Внаслідок цього отримана лінійна модель також включає параметр або вагу для кожного блоку. Вагу блоків підганяють для апроксимації моделі до даних. Після одержання лінійної моделі процес 800 включає застосування даних перекриття досліджуваного зразку у моделі для визначення фракції плода для досліджуваного зразку. Див. блок 814.
Застосовувані дані перекриття досліджуваного зразку призначені для блоків, які характеризуються високими кореляціями між фракціями плода та перекриттям. 00285) На фігурі 2) представлений робочий процес 1100 для обробки інформації про ріди послідовності, який можна застосовувати для одержання оцінок фракції плода. Робочий процес 1100 характеризується аналогічними етапами процесингу, що і робочий процес 600 на фігурі 20. Блоки 1102, 1104, 1106, 1110, 1112, 1123, 1114, 1116, 1118 та 1122, відповідно, відповідають блокам 602, 604, 606, 610, 612, 623, 614, 616, 618 та 622. Згідно з деякими варіантами реалізації одна або більше операцій нормування у блоці 123 є необов'язковими.
Прохід 1 забезпечує інформацію про перекриття, яку можна застосовувати у блоці 806 процесу 800, представленого на фігурі 205. Процес 800 потім може дозволити одержати оцінку фракції плода 1150 на фігурі 2). (00286) Згідно з деякими варіантами реалізації можна об'єднати множину оцінок фракції плода (наприклад, 1150 та 1152 на фігурі 27) з одержанням комплексної оцінки фракції плода (наприклад, 1154). Для одержання оцінок фракції плода можна застосовувати різні способи.
Наприклад, фракцію плода можна одержати з інформації про перекриття. Див. блок 1150 фігури 2.) та процес 800 фігури 25. Згідно з деякими варіантами реалізації фракцію плода можна також обчислити за розподілом розміру фрагментів. Див. блок 1152 фігури 2) та процес 900 фігури 2Н. Згідно з деякими варіантами реалізації фракцію плода можна також обчислити за розподілом частоти 8-мерів. Див. блок 1152 фігури 27 та процес 1000 фігури 21.
І00287| У досліджуваному зразку, що містить вцДНК плода чоловічої статі, фракцію плода можна також розрахувати з перекриття У-хромосоми та/або Х-хромосоми. Згідно з деякими варіантами реалізації комплексну оцінку фракції плода (див., наприклад, блок 1155) для плода передбачувано чоловічої статі одержують за допомогою застосування інформації, яка обрана із групи, що складається з: фракції плода, отриманої з інформації про перекриття блоків, фракції плода, отриманої з інформації про розмір фрагменту, фракції плода, отриманої з перекриття хУ- хромосоми, фракції плода, отриманої з Х-хромосоми, та будь-якої комбінації зазначених фракцій плода. Згідно з деякими варіантами реалізації передбачувану стать плода визначають за допомогою застосування перекриття У-хромосоми. Дві або більше фракцій плода (наприклад, 1150 та 1152) можна об'єднати різними способами з одержанням комплексної оцінки фракції плода (наприклад, 1155). Наприклад, можна застосовувати підхід середнього або зваженого середнього згідно з деякими варіантами реалізації, при якому зважування може бути основане на статистичній вірогідності оцінки фракції плода. (00288) Згідно з деякими варіантами реалізації комплексну оцінку фракції плода для плода передбачувано жіночої статі одержують за допомогою застосування інформації, вибраної із групи, що складається з: фракції плода, отриманої з інформації про перекриття блоків, фракції плода, отриманої з інформації про розмір фрагменту, та будь-якої комбінації зазначених фракцій плода.
І00289| На фігурі 2Н представлений процес для визначення фракції плода з інформації про розподіл розміру згідно з деякими варіантами реалізації. Процес 900 починається з одержання інформації про перекриття (наприклад, значень дози послідовності) навчальних зразків чоловічої статі з навчальної множини. Див. блок 902. Процес 900 потім включає обчислення бо фракцій плода навчальних зразків із застосуванням способів, описаних вище по відношенню до блоку 804. Див. блок 904.
І00290| Процес 900 продовжується розділенням діапазону розміру на множину блоків для забезпечення блоків на підставі розміру фрагменту та для визначення частот рідів для блоків на підставі розміру фрагменту. Див. блок 906. Згідно з деякими варіантами реалізації частоти блоків на підставі розміру фрагменту одержують без нормування з урахуванням факторів, продемонстрованих у блоці 1123. Див. шлях 1124 фігури 29. Згідно з деякими варіантами реалізації частоти блоків на підставі розміру фрагменту одержують після необов'язкового здійснення операції нормування, продемонстрованої у блоці 1123 фігури 2. Згідно з деякими варіантами реалізації діапазон розміру розділяють на 40 блоків. Згідно з деякими варіантами реалізації блок на нижній границі містить фрагменти розміру, менші, ніж приблизно 55 пар основ. Згідно з деякими варіантами реалізації блок на нижній границі містить фрагменти розміру у діапазоні приблизно 50 - 55 пар основ, що виключає інформацію для рідів більш коротких, ніж 50 п.о. Згідно з деякими варіантами реалізації блок на верхній границі містить фрагменти розміром більш ніж приблизно 245 пар основ. Згідно з деякими варіантами реалізації блок на верхній границі містить фрагменти розміром у діапазоні приблизно 245 - 250 пар основ, що виключає інформацію для рідів більш довгих, ніж 250 п.о.
І00291| Процес 900 продовжується одержанням лінійної моделі, що встановлює взаємозв'язок між фракцією плода та частотами рідів для блоків на підставі розміру фрагмента, із застосуванням даних навчальних зразків. Див. блок 908. Отримана лінійна модель включає незалежні змінні для частот рідів блоків на підставі розміру. Модель також включає параметр або вагу для кожного блоку на підставі розміру. Вагу блоків підганяють для апроксимації моделі до даних. Після одержання лінійної моделі процес 900 включає застосування даних про частоту ріду досліджуваного зразку у моделі для визначення фракції плода для досліджуваного зразку.
Див. блок 910.
І00292| Згідно з деякими варіантами реалізації для обчислення фракції плода можна застосовувати частоту 8-мерів. На фігурі 2І представлений приклад процесу 1000 для визначення фракції плода з інформації про частоту 8-мерів згідно з деякими варіантами реалізації даного винаходу. Процес 1000 починається з одержання інформації про перекриття (наприклад, значень дози послідовності) навчальних зразків чоловічої статі з навчальної множини. Див. блок 1002. Потім процес 1000 включає обчислення фракцій плода навчальних зразків із застосуванням будь-якого зі способів, описаних для блоку 804. Див. блок 1004.
І00293| Процес 1000 також включає одержання частот 8-мерів (наприклад, усі можливі пермутації 4 нуклеотидів у 8 положеннях) з рідів кожного навчального зразку. Див. блок 1006.
Згідно з деякими варіантами реалізації одержують аж до 65536 або приблизно дану кількість 8- мерів та їх частот. Згідно з деякими варіантами реалізації частоти 8-мерів одержують без нормування з урахуванням факторів, продемонстрованих у блоці 1123. Див. шлях 1124 фігури 2у. Згідно з деякими варіантами реалізації частоти 8-мерів одержують після необов'язкового здійснення операції нормування, продемонстрованої у блоці 1123 фігури 29. (00294) Кожен 8-мер пов'язаний із частотами зразків у навчальній множині. Внаслідок цього для кожного 8-меру можна одержати кореляцію між частотою 8-меру зразків та фракціями плода зразків. Процес 1000 включає одержання кореляцій між фракцією плода та частотами 8- мерів для всіх 8-мерів. Див. блок 1008. Потім процес дозволяє вибрати 8-мери, які характеризуються значеннями кореляції вище порогу. Див. блок 1010. Метою є ідентифікація 8- мерів, які демонструють високу кореляцію між частотою 8-меру та фракцією плода у навчальних зразках. Потім можна застосовувати блоки для прогнозування фракції плода у досліджуваному зразку. Незважаючи на те, що навчальні зразки являють собою зразки чоловічої статі, кореляцію між фракцією плода та частотою 8-меру можна узагальнити на досліджувані зразки чоловічої та жіночої статі. 00295) Із застосуванням вибраних 8-мерів, які характеризуються високими значеннями кореляції, процес дозволяє одержати лінійну модель, що встановлює взаємозв'язок фракції плода із частотою 8-меру. Див. блок 1012. Кожен обраний блок забезпечує незалежну змінну для лінійної моделі. Внаслідок цього отримана лінійна модель також включає параметр або вагу для кожного блоку. Після одержання лінійної моделі процес 1000 включає застосування даних про частоту 8-мерів досліджуваного зразку у моделі для визначення фракції плода для досліджуваного зразку. Див. блок 1014.
І00296| Повертаючись до фігури 2Е, згідно з деякими варіантами реалізації процес 700 включає одержання підсумкової правдоподібності плоїдності у операції 736 із застосуванням 1- статистики на підставі перекриття всіх фрагментів, забезпечених операцією 726, оцінки фракції плода, забезпеченої операцією 726, та І-статистики на підставі перекриття коротких фрагментів, бо забезпечених операцією 730. У даних варіантах реалізації поєднують результати проходу 1 та проходу 2 із застосуванням багатомірних нормальних моделей. Згідно з деякими варіантами реалізації для оцінки ВЧК правдоподібність плоїдності являє собою правдоподібність анеуплоїдії, яка являє собою правдоподібність моделі, яка характеризується анеуплоїдним допущенням (наприклад, трисомія або моносомія) мінус правдоподібність моделі, яка характеризується еуплоїдним допущенням, причому модель використовує на вході І-статистику на підставі перекриття всіх фрагментів, оцінку фракції плода та і-статистику на підставі перекриття коротких фрагментів, та видає правдоподібність.
І00297| Згідно з деякими варіантами реалізації правдоподібність плоїдності виражають у вигляді відношення правдоподібності. Згідно з деякими варіантами реалізації відношення правдоподібності моделюють у вигляді:
Х ПН сумарн дії сумарн)" Рі (Ткоротк, Твсіій розрах. (00298) ВП - ; ро(Ткоротк,Твсіх)
Ї00299| де рі являє собою правдоподібність того, що дані отримані з багатомірного нормального розподілу, що представляє 3-копійну або 1-копійну модель, ро являє собою правдоподібність того, що дані отримані з багатомірного нормального розподілу, що представляє 2-копійну модель, Ткоротк., Твсіх являють собою Т-показники, обчислені за хромосомним перекриттям, отриманим з коротких та всіх фрагментів, тоді як діт сумарн) являє собою щільність розподілу фракції плода (обчисленого з навчальних даних) з урахуванням помилки, пов'язаної з оцінкою фракції плода. Модель поєднує у собі перекриття, отримане з коротких фрагментів, з перекриттям, отриманим із усіх фрагментів, що допомагає поліпшити розділення між показниками перекриття уражених та неуражених зразків. Згідно із представленим варіантом реалізації модель також використовує фракцію плода, у результаті чого додатково поліпшується здатність встановлювати відмінність між ураженими та неураженими зразками. У даному документі відношення правдоподібності обчислюють із застосуванням і-статистики, основаної на перекритті всіх фрагментів (726), І-статистики, основаної на перекритті коротких фрагментів (730), та оцінки фракції плода, забезпеченої процесами 800 (або блоком 726), 900 або 1000, як описано вище. Згідно з деякими варіантами реалізації дане відношення правдоподібності застосовують для аналізу хромосом 13, 18 та 21.
І0ОЗ300| Відповідно до деякого варіанту реалізації правдоподібність плоїдності, отримана за допомогою операції 736, використовує винятково І-статистику, отриману на підставі відносної частоти коротких фрагментів, забезпечених операцією 734 проходу 3, та оцінку фракції плода, забезпечену операцією 726 процесів 800, 900 або 1000. Відношення правдоподібності можна обчислити згідно з наступним рівнянням: (00301) вп- У сумарн дій сумарн)" РіТчаст. коротк Й розрах. )
Ро (Тчаст. коротк )
ЇОО302| де рі являє собою правдоподібність того, що дані отримані з багатомірного нормального розподілу, що представляє 3-копійну або 1-копійну модель, ро являє собою правдоподібність того, що дані отримані з багатомірного нормального розподілу, що представляє 2-копійну модель, Туаст короткявляє собою Т-показник, обчислений з відносної частоти коротких фрагментів, тоді як діт сумарн являє собою розподіл щільності фракції плода (обчисленої з навчальних даних) з урахуванням помилки, пов'язаної з оцінкою фракції плода. У даному документі відношення правдоподібності обчислюють із застосуванням і-статистики, основаної на відносній частоті коротких фрагментів (734), та оцінки фракції плода, забезпеченої процесами 800 (або блок 726), 900 або 1000, як описано вище. Згідно з деякими варіантами реалізації дане відношення правдоподібності застосовують для аналізу хромосоми Х. 00303) Відповідно до деяких варіантів реалізації відношення правдоподібності обчислюють із застосуванням іІ-статистики, основаної на перекритті всіх фрагментів (726), Ї-статистики, основаної на перекритті коротких фрагментів (730), та відносної частоти коротких фрагментів (734). Більше того, фракцію плода, отриману, як описано вище, можна об'єднати з Її-статистикою для обчислення відношення правдоподібності. Розпізнавальну здатність оцінки плоїдності можна поліпшити за допомогою об'єднання інформації з будь-якого із трьох проходів 713А, 7138 та 713С. Див., наприклад, приклад 2 та фігуру 12. Згідно з деякими варіантами реалізації для одержання відношень правдоподібності для хромосоми можна застосовувати різні комбінації, наприклад, Ї-статистику із усіх трьох проходів, ї-статистику з першого та другого проходів, фракцію плода та три параметри і-статистики, фракцію плода та один параметр /- статистики і т.д. Потім на підставі робочих характеристик моделей можна вибрати оптимальну комбінацію.
Ї00304| Згідно з деякими варіантами реалізації для оцінки аутосом змодельоване відношення правдоподібності представляє правдоподібність змодельованих даних, які були отримані зі зразка трисомії або моносомії, у порівнянні із правдоподібністю змодельованих даних, які були отримані з диплоїдного зразку. Таке відношення правдоподібності можна застосовувати для визначення трисомії або моносомії аутосом згідно з деякими варіантами реалізації.
І0ООЗ3О5І Згідно з деякими варіантами реалізації для оцінки статевої хромосоми оцінюють відношення правдоподібності для моносомії Х та відношення правдоподібності для трисомії Х.
Більше того, також оцінюють вимірювання перекриття хромосоми (наприклад, ВЧК або 7- показник перекриття) для хромосоми Х та одне - для хромосоми У. Згідно з деякими варіантами реалізації для визначення числа копій статевої хромосоми оцінюють чотири значення із застосуванням дерева рішень. Згідно з деякими варіантами реалізації дерево рішень дозволяє визначити випадок плоїдності ХХ, ХУ, Х, ХХУ, ХХХ або ХУ.
І00306) Згідно з деякими варіантами реалізації відношення правдоподібності перетворюють у логарифм відношення правдоподібності, та критерій або поріг для прийняття рішення про анеуплоїдію або варіації числа копій можна задати емпірично для одержання конкретної чутливості та селективності. Наприклад, для прийняття рішення про трисомію 13 або трисомію 18 можна задати логарифм відношення правдоподібності 1,5 на підставі чутливості та селективності моделі при використанні відносно навчальної множини. Більше того, наприклад, у деяких варіантах застосування для трисомії хромосоми 21 можна задати значення критерію рішення 3.
Деталі ілюстративного процесу для визначення перекриття послідовності
І00307| На фігурі ЗА представлений приклад процесу 301 для зниження шуму у даних послідовності з досліджуваного зразку. На фігурах 38-33 представлені дані аналізів на різних етапах процесу. На фігурі представлений приклад потоку процесу, який можна застосовувати у багатопрохідному процесі, такому як представлений на фігурі 20.
І0ОЗ3О8) У процесі 301, проілюстрованому на фігурі ЗА, для оцінки числа копій застосовують перекриття мітки послідовності, основане на кількості міток послідовності. Однак аналогічно опису, наведеному вище відносно процесу 100 для визначення ВЧК відносно фігури 1, для процесу 400 замість перекриття можна застосовувати інші змінні або параметри, такі як розмір, співвідношення розміру та рівень метилювання. Згідно з деякими варіантами реалізації дві або більш змінних можна окремо піддавати одному процесу для одержання двох показників, що свідчать про ймовірність ВЧК, як показано вище по відношенню до фігури 20. Потім два показники можна об'єднати для визначення ВЧК. Більше того, перекриття та інші параметри можна зважити за розміром фрагментів, з яких були отримані мітки. Для зручності читання у процесі 300 згадане виняткове перекриття, але слід зазначити, що замість перекриття можна застосовувати інші параметри, такі як розмір, співвідношення розміру та рівень метилювання, підрахунок, зважений за розміром, і т.д. 00309) Як презентовано на фігурі ЗА, зображений процес починається з екстракції вцДНК із одного або більше зразків. Див. блок 303. Підходящі процеси та апарати для екстракції описані у іншому місці у даному документі. Згідно з деякими варіантами реалізації вцДНК екстрагують у процесі, описаному у заявці на патент США Мо 61/801,126, поданій 15 березня 2013 року (повністю включена у даний документ за допомогою посилання). Згідно з деякими варіантами реалізації апарат процесує вуцДНК із декількох зразків у сукупності для забезпечення мультиплексних бібліотек та даних послідовності. Див. блоки 305 та 307 на фігурі ЗА. Згідно з деякими варіантами реалізації апарат процесує вцДНК із восьми або більше досліджуваних зразків паралельно. Як описано у даному документі у іншому місці, система секвенування може процесувати екстраговану вцДНК для одержання бібліотеки кодованих (наприклад, штриховим кодом) фрагментів вцДНК. Секвенатор секвенує бібліотеку виДНК для одержання дуже великої кількості рідів послідовності. Кодування на зразок дозволяє демультиплексувати ріди у мультиплексних зразках. Кожен з восьми або більше зразків може характеризуватися сотнями тисяч або мільйонами рідів. Процес може фільтрувати ріди перед додатковими операціями на фігурі ЗА. Згідно з деякими варіантами реалізації фільтрування ріду являє собою процес фільтрування якості, здійснюваний програмами системи програмного забезпечення, вбудованими у секвенатор, для відфільтровування помилкових та низькоякісних рідів. бо Наприклад, програмне забезпечення Зедцепсіпд Сопігої Зоїймаге (505, програмне забезпечення для контролю секвенування) та Сопзепзи5 А55зез55тепі ої Зедиепсе апа Магіайоп (консенсусна оцінка послідовності та варіації) програм системи ПШитіпа відфільтровує помилкові та низькоякісні ріди за допомогою перетворення первинних даних зображень, отриманих за допомогою реакцій секвенування, у показники інтенсивності, основні відгуки, оцінені за якістю вирівнювання, та додаткові формати для забезпечення біологічно значимої інформації для наступного аналізу.
ЇООЗ310| Після того як секвенатор або інший апарат одержує ріди для зразку, елемент системи комп'ютерним способом вирівнює ріди з референсним геномом. Див. блок 309.
Вирівнювання описане у іншому місці у даному документі. Вирівнювання дозволяє одержати мітки, які містять ріди послідовностей з анотованою інформацією про розташування, що вказує на унікальні положення у референсному геномі. Згідно з певним варіантом реалізації система проводить перший прохід вирівнювання без урахування рідів, що дублюються, - двох або більше рідів, які містять ідентичні послідовності, - а потім усуває ріди, що дублюються, або підраховує ріди, що дублюються, як один рід для одержання міток послідовності, що не дублюються. Згідно з іншими варіантами реалізації система не усуває ріди, що дублюються.
Згідно з деякими варіантами реалізації процес усуває з розгляду ріди, які вирівнюються з декількома розташуваннями у геномі, для одержання унікально вирівняних міток. Згідно з деякими варіантами реалізації унікально вирівняні мітки послідовності, що не повторюються, картовані на невиключені сайти (МЕ5), підраховують для одержання підрахунку невиключених сайтів (підрахованих значень МЕ5), які забезпечують дані для оцінки перекриття. 00311) Як пояснено у іншому місці, виключені сайти являють собою сайти, виявлені у областях референсного геному, які були виключені з метою підрахунку міток послідовності.
Згідно з деякими варіантами реалізації виключені сайти виявлені у областях хромосом, які містять повторювані послідовності, наприклад, центромери та теломери, та у областях хромосом, які є загальними для більш ніж однієї хромосоми, наприклад, області, що присутні на
У-хромосомі, які також присутні на Х-хромосомі. Невиключені сайти (МЕ5) являють собою сайти, які не виключені у референсному геномі з метою підрахунку міток послідовності.
І00312) Потім система розділяє вирівняні мітки на блоки у референсному геномі. Див. блок 311. Блоки розташовані по всій довжині референсного геному. Згідно з деякими варіантами реалізації весь референсний геном розділяють на безперервні блоки, які можуть характеризуватися заданим рівним розміром (наприклад, 100 т.0.). У якості альтернативи, блоки можуть характеризуватися довжиною, визначеною динамічно, можливо, для кожного зразку.
Глибина секвенування впливає на вибір оптимального розміру блоку. Блоки з динамічно визначеними розмірами можуть характеризуватися розміром, обумовленим розміром
З5 бібліотеки. Наприклад, можна визначити розмір блоку, який являє собою довжину послідовності, необхідну, у середньому, для розміщення 1000 міток.
І00О313) Кожен блок містить деяку кількість міток з розглянутого зразку. Дана кількість міток, яка відображує "перекриття" вирівняної послідовності, виступає у якості вихідної точки для фільтрування та очищення даних зразку іншим способом для достовірного визначення варіації числа копій у зразку. На фігурі ЗА представлені операції очищення у блоках 313 - 321. 00314) Згідно з варіантом реалізації, зображеним на фігурі ЗА, у процесі застосовують маску відносно блоків референсного геному. Див. блок 313. Система може виключати з розгляду перекриття у маскованих блоках у деяких або всіх з наступних операцій процесу. У багатьох випадках у кожній з операцій на фігурі ЗА, що залишилися, не враховують значення перекриття з маскованих блоків.
І00315) Згідно з різними варіантами реалізації для усунення блоків з областей геному, які, як було виявлено, демонструють високу внутрішньовибіркову варіабельність, застосовують одну або більше масок. Такі маски запропоновані як для хромосоми, що представляє інтерес (наприклад, хр13, 18 та 21), так і для інших хромосом. Як пояснено у іншому місці, хромосома, що представляє інтерес, являє собою хромосому, розглянуту як потенційно несучу варіацію числа копій або іншу аберацію.
І0О0О316) Згідно з деякими варіантами реалізації маски ідентифікують із навчальної множини кваліфікаційних зразків із застосуванням наступного підходу. Спочатку кожен зразок навчальної множини процесують та фільтрують згідно з операціями з 315 по 319 на фігурі ЗА. Потім нормовані та відкоректовані кількості перекриття відзначають для кожного блоку, та для кожного блоку обчислюють статистику, таку як стандартне відхилення, медіана абсолютного відхилення та/або коефіцієнт варіації. Різні комбінації фільтру можна оцінити для кожної хромосоми, що представляє інтерес. Комбінації фільтру забезпечують один фільтр для блоків хромосоми, що представляє інтерес, та відмінний фільтр для блоків усіх інших хромосом. бо ІЇ00317| Згідно з деякими варіантами реалізації вибір нормуючої хромосоми (або групи хромосом) переглядають після одержання масок (наприклад, за допомогою вибору меж для хромосоми, що представляє інтерес, як описано вище). Після застосування маски послідовності можна здійснити процес вибору нормуючої хромосоми або хромосом, як описано у іншому місці у даному документі. Наприклад, усі можливі комбінації хромосом оцінюють як нормуючі хромосоми та ранжирують залежно від їхньої здатності розрізняти уражені та неуражені зразки.
У ході даного процесу можна знайти (або можна не знаходити) різні оптимальні нормуючі хромосоми або групу хромосом. Згідно з іншими варіантами реалізації нормуючі хромосоми являють собою такі, які приводять до найменшої варіабельності у дозі послідовності для послідовності, що представляє інтерес, серед усіх кваліфікаційних зразків. Якщо ідентифікують відмінну нормуючу хромосому або групу хромосом, процес необов'язково виконує вищеописану ідентифікацію блоків для фільтрування. Можливо, нова нормуюча хромосома або хромосоми приведуть до відмінних меж.
І00З318)| Згідно з певними варіантами реалізації для хромосоми У застосовують відмінну маску. Приклад підходящої маски для хромосоми У описаний у попередній заявці на патент
США Мо 61/836,057, поданій 17 червня 2013 року (номер патентного реєстру АКТЕРООВРІ, яка включена у даний документ за допомогою посилання для всіх цілей.
ІЇ0О0319| Після того як система комп'ютерним способом маскує блок, вона комп'ютерним способом нормує значення перекриття у блоках, які не виключені масками. Див. блок 315.
Згідно з певними варіантами реалізації система нормує значення перекриття досліджуваного зразку у кожному блоці (наприклад, підраховані значення МЕЗ на блок) до більшості або всіх перекриттів у референсному геномі або його частині (наприклад, перекриття у стійких хромосомах референсного геному). У деяких випадках система нормує значення перекриття досліджуваного зразку (на блок) ділення підрахунку для розглянутого блоку на сумарну кількість усіх невиключених сайтів, вирівняних з усіма стійкими хромосомами у референсному геномі.
Згідно з деякими варіантами реалізації система нормує значення перекриття досліджуваного зразку (на блок) за допомогою здійснення лінійної регресії. Наприклад, система спочатку обчислює перекриття для підмножини блоків у стійких хромосомах як уа - відрізок, що відтинається, ж нахил " дм/ра, де уа являє собою перекриття для блоку а, та дм'ра являє собою глобальний профіль для цього ж блоку. Потім система обчислює нормовані перекриття 7ь як: ль-уь «відрізок, що відтинається, ж нахил " джурь) - 1.
ІЇ00320| Як пояснено вище, стійка хромосома являє собою хромосому, яка навряд чи є анеуплоїдною. Згідно з певними варіантами реалізації стійкі хромосоми являють собою всі аутосомні хромосоми, відмінні від хромосом 13, 18 та 21. Згідно з деякими варіантами реалізації стійкі хромосоми являють собою усі аутосомні хромосоми, відмінні від хромосом, які, як було визначено, відхиляються від нормального диплоїдного геному.
Ї00321| Значення трансформованого підрахунку блоку або перекриття називають "нормованою кількістю перекриття" для наступного процесингу. Нормування здійснюють із застосуванням інформації, унікальної для кожного зразку. Як правило, не застосовують інформацію з навчальної множини. Нормування дозволяє забезпечити кількості перекриття зі зразків, які характеризуються різними розмірами бібліотеки (та, отже, різними кількостями рідів та міток), які підлягають обробці у рівних умовах. У деяких з наступних операцій процесу застосовують кількості перекриття, отримані з навчальних зразків, які можуть бути секвеновані з бібліотек, які є більшими або меншими, ніж бібліотеки, застосовувані для розглянутого досліджуваного зразку. Згідно з деякими варіантами реалізації без нормування, основаного на кількості рідів, вирівняних з усім референсним геномом (або щонайменше зі стійкими хромосомами), обробка із застосуванням параметрів, отриманих з навчальної множини, може бути ненадійною або такою, що не піддається узагальненню. 00322 Фігура ЗВ ілюструє перекриття у межах хромосом 21, 13 та 18 для багатьох зразків.
Деякі зразки процесували відмінно один від іншого. Як наслідок, у будь-якому даному геномному положенні спостерігається широка внутрішньовибіркова варіація. Нормування усуває деяку частину внутрішньовибіркової варіації. На лівому кресленні фігури зЗС представлені нормовані кількості перекриття по всьому геному. 003231) Згідно з варіантом реалізації фігури ЗА система усуває або знижує "глобальний профіль" з нормованих кількостей перекриття, отриманих у операції 315. Див. блок 317. Дана операція усуває систематичні похибки у нормованих кількостях перекриття, що виникають внаслідок структури геному, процесу одержання бібліотеки та процесу секвенування. Крім цього, дана операція призначена для коректування з урахуванням будь-якого систематичного лінійного відхилення від очікуваного профілю у будь-якому даному зразку.
І00324| Згідно з деякими варіантами реалізації усунення глобального профілю включає бо ділення нормованої кількості перекриття кожного блоку на відповідне очікуване значення кожного блоку. Згідно з іншими варіантами реалізації усунення глобального профілю включає вирахування очікуваного значення кожного блоку з нормованої кількості перекриття кожного блоку. Очікуване значення може бути отримане з навчальної множини неуражених зразків (або неуражених зразків жіночої статі для Х-хромосоми). Неуражені зразки являють собою зразки від індивідуумів, які встановлено не характеризуються анеуплоїдією по хромосомі, що представляє інтерес. Згідно з деякими варіантами реалізації усунення глобального профілю включає вирахування очікуваного значення кожного блоку (отриманого з навчальної множини) з нормованого кількості перекриття кожного блоку. Згідно з деякими варіантами реалізації процес застосовує медіанні значення нормованих кількостей перекриття для кожного блоку, як визначено із застосуванням навчальної множини. Інакше кажучи, медіанні значення являють собою очікувані значення.
І00325) Згідно з деякими варіантами реалізації усунення глобального профілю здійснюють із застосуванням лінійного коректування для залежності перекриття зразку від глобального профілю. Як зазначено, глобальний профіль являє собою очікуване значення для кожного блоку, як визначено з навчальної множини (наприклад, медіанне значення для кожного блоку).
У даних варіантах реалізації можна застосовувати стійку лінійну модель, отриману за допомогою апроксимації нормованих кількостей перекриття досліджуваного зразку до медіани глобального профілю, отриманої для кожного блоку. Згідно з деякими варіантами реалізації лінійну модель одержують за допомогою регресування спостережуваних нормованих кількостей перекриття зразку у порівнянні із глобальною медіаною (або іншим очікуваним значенням) профілю.
І00326| Лінійна модель основана на припущенні, що кількості перекриття зразку характеризуються лінійним взаємозв'язком зі значеннями глобального профілю, причому лінійний взаємозв'язок повинен зберігатися як для стійких хромосом/областей, так і для послідовності, що представляє інтерес. Див. фігуру ЗО. У такому випадку регресія нормованих кількостей перекриття зразку на очікувані кількості перекриття глобального профілю дозволить одержати лінію, яка характеризується нахилом та відрізком, що відтинається. Згідно з певними варіантами реалізації нахил та відрізок такої лінії що відтинається, застосовують для обчислення "прогнозованої" кількості перекриття зі значення глобального профілю для блоку.
Згідно з деякими варіантами реалізації коректування з урахуванням глобального профілю включає моделювання нормованої кількості перекриття кожного блоку за допомогою прогнозованих кількостей перекриття для блоку. Згідно з деякими варіантами реалізації перекриття міток досліджуваної послідовності підганяють за допомогою: (і) одержання математичної залежності між перекриттям міток досліджуваної послідовності у порівнянні з очікуваним перекриттям у множині блоків у одній або більше стійких хромосомах або областях, та (ії) застосування математичної залежності відносно блоків у послідовності, що представляє інтерес. Згідно з деякими варіантами реалізації перекриття у досліджуваному зразку є відкоректованими з урахуванням варіації із застосуванням лінійного взаємозв'язку між очікуваними значеннями перекриття з неуражених навчальних зразків та значеннями перекриття для досліджуваного зразку у стійких хромосомах або інших стійких областях геному.
Припасування приводить до одержання перекриттів, відкоректованих з урахуванням глобального профілю. У деяких випадках припасування включає одержання перекриттів для досліджуваного зразку для підмножини блоків у стійких хромосомах або областях у такий спосіб: уа : відрізок, що відтинається ж нахил " дм/ра, де уз являє собою перекриття блоку а для досліджуваного зразку у одній або більше стійких хромосомах або областях, та дмура являє собою глобальний профіль для блоку а для неуражених навчальних зразків. Потім процес обчислює відкоректоване з урахуванням глобального профілю перекриття 7ь для послідовності або області, що представляє інтерес, як: 7ь-уь / (відрізок, що відтинається жк нахил 7 дмурь) - 1, де уь являє собою спостережуване перекриття блоку р для досліджуваного зразку у послідовності, що представляє інтерес (яка може розташовуватися за межами стійкої хромосоми або області), та дрь являє собою глобальний профіль для блоку б для неуражених навчальних зразків. Знаменник (відрізок, що відтинається - нахил " Омурь) являє собою перекриття для блоку б, яке, як було прогнозовано, спостерігається у неуражених досліджуваних зразках на підставі взаємозв'язку, обчисленого зі стійких областей геному. У випадку послідовності, що представляє інтерес, що несе варіацію числа копій, спостережуване перекриття та, отже, відкоректоване з урахуванням глобального профілю значення перекриття для блоку Б буде у значній мірі відхилятися від перекриття неураженого зразку. Наприклад, у бо випадку трисомічного зразку відкоректоване перекриття 7ь буде пропорційним фракції плода для блоків на ураженій хромосомі. Даний процес проводить нормування у межах зразку за допомогою комп'ютеризованого обчислення відрізку, що відтинається, та нахилу на стійких хромосомах, а потім оцінює, як геномна область, що представляє інтерес, відхиляється від взаємозв'язку (що описується нахилом та відрізком, що відтинається), справедливого для стійких хромосом у межах одного зразку.
І00327| Нахил та відрізок, що відтинається, одержують із лінії, як презентована на фігурі 30.
Приклад усунення глобального профілю представлено на фігурі ЗС. На лівому кресленні представлена висока міжблокова варіація у нормованих кількостях перекриття серед множини зразків. На правому кресленні представлені ті ж нормовані кількості перекриття після усунення глобального профілю, як описано вище. 00328) Після того як система усуває або знижує глобальний профіль варіацій у блоці 317, вона проводить коректування з урахуванням варіацій вмісту С (гуанін-цитозин) у зразку. Див. блок 319. Кожен блок характеризується своїм власним відносним внеском у С. Фракцію визначають діленням кількості нуклеотидів з та С у блоці на сумарну кількість нуклеотидів у блоці (наприклад, 100000). Деякі блоки будуть характеризуватися більшими фракціями СС, ніж інші. Як презентовано на фігурах ЗЕ та ЗЕ, різні зразки демонструють різні похибки С. Дані відмінності та їх коректування додатково пояснені нижче. На фігурах ЗЕ-б представлена відкоректована з урахуванням глобального профілю нормована кількість перекриття (на блок) як функція від фракції С (на блок). Неочікувано було встановлено, що різні зразки демонструють різну зС-залежність. Деякі зразки демонструють залежність, що монотонно убуває (як на фігурі ЗЕ), тоді як інші демонструють залежність у вигляді коми (як на фігурі ЗЕ та 30). Оскільки дані профілі можуть бути унікальними для кожного зразку, корекцію, описану на даному етапі, здійснюють окремо та унікально для кожного зразку.
ЇО0329| Згідно з деякими варіантами реалізації система комп'ютерним способом упорядковує блоки залежно від фракції СС, як проілюстровано на фігурах ЗЕ-5. Потім система коректує відкоректовану з урахуванням глобального профілю нормовану кількість перекриття блоку із застосуванням інформації від інших блоків з аналогічним вмістом С. Дану корекцію застосовують у відношенні кожного немаскованого блоку.
І00330) У деяких процесах кожен блок коректують із урахуванням вмісту СС у такий спосіб.
Система комп'ютерним способом вибирає блоки, які характеризуються фракціями СС, аналогічними таким розглянутого блоку, а потім визначає параметр корекції з інформації у обраних блоках. Згідно з деякими варіантами реалізації ті блоки, які характеризуються аналогічними фракціями С, вибирають із застосуванням довільно заданого значення межі подібності. У одному прикладі вибирають 2 95 усіх блоків. Дані блоки являють собою 2 95 блоків, які характеризуються вмістом С, максимально аналогічним розглянутому блоку. Наприклад, вибирають 1 95 блоків, які характеризуються незначно більшим вмістом СС, та 1 95, які характеризуються незначно меншим вмістом с.
ЇО0О331| Із застосуванням обраних блоків система комп'ютерним способом визначає параметр корекції У одному прикладі параметр корекції являє собою репрезентативне значення нормованих кількостей перекриття (після усунення глобального профілю) у обраних блоках. Приклади такого репрезентативного значення включають медіану або середнє значення нормованих кількостей перекриття у обраних блоках. Система застосовує обчислений параметр корекції для розглянутого блоку відносно нормованої кількості перекриття (після усунення глобального профілю) для розглянутого блоку. Згідно з деякими варіантами реалізації репрезентативне значення (наприклад, медіанне значення) віднімають із нормованої кількості перекриття розглянутого блоку. Згідно з деякими варіантами реалізації медіанне значення (або інше репрезентативне значення) нормованих кількостей перекриття вибирають винятково із застосуванням кількостей перекриття для стійких аутосомних хромосом (усіх аутосом, відмінних від хромосом 13, 18 та 21). 00332) У одному прикладі із застосуванням, наприклад, блоків довжиною 100 т.о. кожен блок буде характеризуватися унікальним значенням фракції С, та блоки розділяють на групи залежно від вмісту у них фракції (зС. Наприклад, блоки розділяють на 50 груп, причому границі груп відповідають (0, 2, 4, 6, ... та 100) квантилям розподілу 905С. Медіанну нормовану кількість перекриття обчислюють для кожної групи блоків з картування стійких аутосом на ту ж групу ОС (у зразку), а потім з нормованих кількостей перекриття віднімають медіанне значення (для всіх блоків по всьому геному у тій же групі С). При цьому застосовують корекцію СС, обчислену зі стійких хромосом у межах будь-якого даного зразку, відносно потенційно уражених хромосом у межах того ж зразку. Наприклад, усі блоки на стійких хромосомах, які характеризуються вмістом
СС від 0,338660 до 0,344720, групують, обчислюють медіану для даної групи та віднімають із бо нормованого перекриття блоків у межах даного діапазону С, причому блоки можуть бути виявлені будь-де у геномі (за винятком хромосом 13, 18, 21 та Х). Згідно з певними варіантами реалізації хромосому У виключають із даного процесу корекції з урахуванням ОС.
І00333| На фігурі Зб представлене використання корекції з урахуванням ОС із застосуванням медіани нормованих кількостей перекриття як параметру корекції, яка була тільки що описана. На лівому кресленні представлені невідкоректовані кількості перекриття у порівнянні із профілем фракції С. Як показано, профіль характеризується нелінійною формою.
На правому кресленні представлені відкоректовані кількості перекриття. На фігурі ЗН представлені нормовані перекриття для багатьох зразків до корекції з урахуванням фракції С (ліве креслення) та після корекції з урахуванням фракції С (праве креслення). На фігурі ЗІ представлений коефіцієнт варіації (КВ) нормованих перекриттів для багатьох досліджуваних зразків до корекції з урахуванням фракції С (червоний) та після корекції з урахуванням фракції
ОС (зелений), причому корекція з урахуванням фракції С приводить до по суті меншої варіації у нормованих перекриттях.
Ї00334| Описаний вище процес є відносно простим варіантом реалізації корекції з урахуванням С. У альтернативних підходах для корекції похибки С застосовують сплайн- функцію або іншу нелінійну методику апроксимації, яку можна застосовувати у безперервному просторі С та яка не включає сортування кількостей перекриття по вмісту зС. Приклади підходящих методик включають безперервну корекцію локальних поліноміальних регресій (0е55) та гладку сплайн-корекцію. Функцію апроксимації можна одержати з нормованої від блоку до блоку кількості перекриття у порівнянні зі вмістом С для розглянутого зразку.
Корекцію для кожного блоку обчислюють за допомогою застосування вмісту ОС для розглянутого блоку відносно функції апроксимації. Наприклад, нормовану кількість перекриття можна підігнати за допомогою вирахування очікуваного значення перекриття сплайну при вмісті
ОС розглянутого блоку. У якості альтернативи, припасування можна забезпечити за допомогою ділення очікуваного значення перекриття згідно з апроксимацією за допомогою сплайн-функції.
І00335) Після коректування СС-залежності у операції 319 система комп'ютерним способом усуває блоки, що різко відхиляються, у розглянутому зразку - див. блок 321. Дану операцію можна назвати фільтруванням або цензуруванням одиничного зразку. Фігура 3) демонструє, що навіть після корекції з урахуванням С перекриття усе ще характеризується зразок- специфічною варіацією у межах невеликої області. Див., наприклад, перекриття у положенні 1.1 е8 на хромосомі 12 з неочікувано високим відхиленням від очікуваних результатів значення.
Можливо, дане відхилення є наслідком невеликої варіації числа копій у материнському геномі. У якості альтернативи, відхилення може бути обумовлене технічними причинами при секвенуванні, не пов'язаними з варіацією числа копій. Як правило, дану операцію застосовують винятково відносно стійких хромосом. 00336) Як приклад, системи комп'ютерним способом фільтрують будь-які блоки, які містять відкоректовану з урахуванням С нормовану кількість перекриття, що становить більше ніж З медіани абсолютних відхилень від медіани відкоректованої з урахуванням С нормованої кількості перекриття, по всіх блоках у хромосомі, що несе розглянутий блок, для фільтрування.
У одному прикладі граничне значення задають як З медіани абсолютних відхилень, яке підганяють для відповідності стандартному відхиленню, тому фактично межа становить 1,4826"медіану абсолютних відхилень від медіани. Згідно з певними варіантами реалізації дану операцію застосовують відносно всіх хромосом у зразку, включаючи як стійкі хромосоми, так і хромосоми, для яких підозрюють анеуплоїдію.
Ї00337| Згідно з певними варіантами реалізації здійснюють додаткову операцію, яку можна охарактеризувати як контроль якості. Див. блок 323. Згідно з деякими варіантами реалізації метрика контролю якості включає виявлення того, чи є які-небудь потенційні хромосоми у знаменнику, тобто "нормуючі хромосоми" або "стійкі хромосоми", анеуплоїдними або з іншої причини не відповідними для визначення того, чи характеризується досліджуваний зразок варіацією числа копій у послідовності, що представляє інтерес. Коли процес визначає, що стійка хромосома є не відповідною, процес може знехтувати досліджуваним зразком та видати результат "рішення відсутнє". У якості альтернативи, неспроможність даної метрики КЯ (контролю якості) може сприяти застосуванню альтернативної множини нормуючих хромосом для прийняття рішення. У одному прикладі спосіб контролю якості порівнює фактичні нормовані значення перекриття для стійких хромосом з очікуваними значеннями для стійких аутосомних хромосом. Очікувані значення можна одержати за допомогою апроксимації багатомірної нормальної моделі до нормованих профілів неуражених навчальних зразків, вибору найкращої структури моделі згідно із правдоподібністю даних або байєсовського критерію (наприклад, модель обрана із застосуванням інформаційного критерію Акаїке або, можливо, байєсовського бо інформаційного критерію), та фіксації найкращої моделі для застосування у КЯ. Нормальні 5О0 моделі стійких хромосом можна одержати за допомогою, наприклад, застосування прийомів групування, що ідентифікують функцію ймовірності, яка характеризується середнім значенням та стандартним відхиленням для перекриттів хромосоми у нормальних зразках. Зрозуміло, можна застосовувати інші форми моделі. Процес оцінює правдоподібність спостережуваного нормованого перекриття у будь-якому досліджуваному зразку на вході, беручи до уваги параметри фіксованої моделі. Процес може виконувати дану функцію за допомогою оцінки кожного досліджуваного зразку на вході з моделлю для одержання правдоподібності та за допомогою цього ідентифікувати показники, що різко відхиляються, у порівнянні 3 множиною нормальних зразків. Відхилення правдоподібності досліджуваного зразку від таких навчальних зразків може свідчити про аномалію у нормуючих хромосомах або артефакті при роботі зі зразком/при підготовці до аналізу, який може привести до неправильної класифікації зразку.
Дану метрику КЯ можна застосовувати для зниження помилок у класифікації, пов'язаних з будь- яким з даних артефактів зразку. На фігурі ЗК, праве креслення, на осі х представлена кількість хромосом, а на осі у представлене нормоване перекриття хромосом, основане на порівнянні з моделлю КЯ, отриманою, як описано вище. Графіки демонструють один зразок з надлишковим перекриттям для хромосоми 2 та інший зразок з надлишковим перекриттям для хромосоми 20.
Дані зразки будуть усунуті із застосуванням метрики КЯ, описаної у даному документі, або відхилені для застосування альтернативної множини нормуючих хромосом. На лівому кресленні фігури ЗК представлене МСУ у порівнянні із правдоподібністю для хромосоми. 00338) Послідовність, представлену на фігурі ЗА, можна застосовувати для всіх блоків усіх хромосом у геномі. Згідно з певними варіантами реалізації для хромосоми У застосовують відмінний процес. Для обчислення дози хромосоми або сегмента МСМ та/або М5М застосовують відкоректовані нормовані кількості перекриття (як визначено на фігурі ЗА) із блоків у хромосомах або сегментах, використаних у виразах для дози, МСМ та/або М5МУ. Див. блок 325.
Згідно з певними варіантами реалізації середнє значення нормованої кількості перекриття обчислюють по всіх блоках у хромосомі, що представляє інтерес, нормуючій хромосомі, сегменті, що представляє інтерес, та/або для обчислення дози послідовності, МСМ та/або ММ, застосовують нормуючий сегмент, як описано у іншому місці у даному документі. 00339) Згідно з певними варіантами реалізації хромосому ХУ обробляють іншим способом.
Хромосому У можна фільтрувати за допомогою маскування множини блоків, унікальних для У- хромосоми. Згідно з деякими варіантами реалізації фільтр Х-хромосоми визначають згідно із процесом, описаним у попередній заявці на патент США Ме 61/836,057, раніше включеній у даний документ за допомогою посилання. Згідно з деякими варіантами реалізації фільтр маскує блоки, які є меншими, ніж такі у фільтрі іншої хромосоми. Наприклад, маска У-хромосоми може фільтрувати на рівні 1 т.о., тоді як маски іншої хромосоми можуть фільтрувати на рівні 100 т.о.
Незважаючи на це, У-хромосому можна нормувати у тому ж блоці розміру, що й інші хромосоми (наприклад, 100 т.о.). 00340) Згідно з певними варіантами реалізації відфільтровану У-хромосому нормують, як описано вище у операції 315 фігури ЗА. Однак, на відміну від зазначеної операції, Х-хромосому додатково не коректують. Таким чином, у блоках ХУ-хромосоми не усувають глобальний профіль. Аналогічно, блоки Х-хромосоми не піддають корекції з урахуванням С або іншим етапам фільтрування, які виконують згодом. Це обумовлене тим, що, коли зразок процесують, процесу не відомо, чи є зразок зразком чоловічої або жіночої статі. Зразок жіночої статі не повинен характеризуватися рідами, що вирівнюються з референсною У-хромосомою.
Створення маски послідовності
І0О0341) У деяких варіантах реалізації, розкритих у даному документі, застосовують стратегію фільтрування (або маскування) недискримінантних рідів послідовності на послідовності, що представляє інтерес, із застосуванням масок послідовності, що приводить до збільшення сигналу та зниження шуму у порівнянні зі значеннями, обчисленими загальноприйнятими способами, у значеннях перекриття, застосовуваних для оцінки ВЧК. Такі маски можна ідентифікувати за допомогою різних методик. Відповідно до одного варіанту реалізації маску ідентифікують із застосуванням методики, проілюстрованої на фігурах 4А-4В, як пояснено більш докладно нижче.
Ї00342| Згідно з деякими варіантами реалізації маску ідентифікують із застосуванням навчальної множини репрезентативних зразків, які встановлено містять нормальне число копій послідовності, що представляє інтерес. Маски можна ідентифікувати із застосуванням методики, яка спочатку нормує навчальну множину зразків, потім проводить коректування з урахуванням систематичної варіації у діапазоні послідовності (наприклад, профілю), а потім коректує їх з урахуванням варіабельності (С, як описано нижче. Нормування та корекцію бо здійснюють відносно зразків з навчальної множини, а не досліджуваних зразків. Маску ідентифікують один раз, а потім застосовують відносно множини досліджуваних зразків. 00343) На фігурі 4А представлена блок-схема процесу 400 для створення такої маски послідовності, яку можна застосовувати у відношенні одного або більше досліджуваних зразків для усунення з розгляду блоків на послідовності, що представляє інтерес, при оцінці числа копій. Процес 400, проілюстрований на фігурі 4, застосовує перекриття мітки послідовності, основане на кількості міток послідовності, для одержання маски послідовності. Однак аналогічно наведеному вище опису процесу 100 для визначення ВЧК стосовно фігури 1, для процесу 400 на додаток до перекриття або замість нього можна застосовувати інші змінні або параметри, такі як розмір, співвідношення розміру та рівень метилювання. Згідно з деякими варіантами реалізації для кожного із двох або більше параметрів одержують одну маску. Більше того, перекриття та інші параметри можна зважити за розміром фрагментів, з яких були отримані мітки. Для зручності читання у процесі 400 згадане винятково перекриття, але слід зазначити, що замість перекриття можна застосовувати інші параметри, такі як розмір, співвідношення розміру та рівень метилювання, підрахунок, зважений за розміром, і т.д.
І00344| Процес 400 починається із забезпечення навчальної множини, що містить ріди послідовності з множини неуражених навчальних зразків. Блок 402. Потім процес вирівнює ріди послідовності навчальної множини з референсним геномом, що містить послідовність, що представляє інтерес, з одержанням, таким чином, міток навчальної послідовності для навчальних зразків. Блок 404. Згідно з деякими варіантами реалізації для наступного аналізу застосовують винятково унікально вирівняні не повторювані мітки, картовані з невиключеними сайтами. Процес включає розділення референсного геному на множину блоків та визначення для кожного неураженого навчального зразку перекриття міток навчальної послідовності у кожному блоці для кожного навчального зразку. Блок 406. Процес також визначає для кожного блоку очікуване перекриття міток навчальної послідовності серед усіх навчальних зразків. Блок 408. Згідно з деякими варіантами реалізації очікуване перекриття кожного блоку являє собою медіану або середні значення у межах навчальних зразків. Очікувані перекриття становлять глобальний профіль. Потім процес підганяє перекриття міток навчальної послідовності у кожному блоці для кожного навчального зразку за допомогою усунення варіації у глобальному профілі, та за допомогою цього одержує відкоректовані з урахуванням глобального профілю перекриття міток навчальної послідовності у блоках для кожного навчального зразку. Потім процес створює маску послідовності, що містить немасковані та масковані блоки у межах референсного геному. Кожен маскований блок має характеристику розподілу, що перевищує поріг маскування. Характеристика розподілу запропонована для підігнаних перекриттів міток навчальної послідовності у блоці у межах навчальних зразків. Згідно з деякими варіантами реалізації поріг маскування може відноситися до спостережуваної варіації нормованого перекриття у блоці у межах навчальних зразків. Блоки з високими коефіцієнтами варіації або медіаною абсолютного відхилення нормованого перекриття серед зразків можна ідентифікувати на підставі емпіричного розподілу відповідних метрик. Відповідно до деяких альтернативних варіантів реалізації поріг маскування може відноситися до спостережуваної варіації у нормованому перекритті у блоці у межах навчальних зразків. Блоки з високими коефіцієнтами варіації або медіаною абсолютного відхилення нормованого перекриття серед зразків можна маскувати на підставі емпіричного розподілу відповідних метрик. 00345) Згідно з деякими варіантами реалізації для хромосоми, що представляє інтерес, та для всіх інших хромосом задають окремі межі для ідентифікації маскованих блоків, тобто пороги маскування. Також можна задати окремі пороги маскування для кожної хромосоми, що представляє інтерес, окремо, та один поріг маскування для множини всіх неуражених хромосом. Як приклад для хромосоми 13 задають маску на підставі певного порогу маскування, та з метою визначення маски для інших хромосом застосовують інший поріг маскування.
Неуражені хромосоми можуть також характеризуватися своїми порогами маскування, заданими для хромосоми.
Ї00346| Можна оцінити різні комбінації порогу маскування для кожної хромосоми, що представляє інтерес. Комбінації порогу маскування забезпечують одну маску для блоків хромосоми, що представляє інтерес, та відмінну маску для блоків усіх інших хромосом.
І00347| Відповідно до одного підходу діапазон значень для коефіцієнта варіації (КВ) або критерій меж розподілу зразку задають у вигляді процентилів (наприклад, 95, 96, 97, 98, 99) емпіричного розподілу значень КВ блоку, та дані значення межі застосовують у відношенні всіх аутосом, за винятком хромосом, що представляють інтерес. Також задають діапазон процентилю значень межі для КВ для емпіричного розподілу КВ, та дані значення межі застосовують відносно хромосоми, що представляє інтерес (наприклад, хр. 21). Згідно з бо деякими варіантами реалізації хромосоми, що представляють інтерес, являють собою Х-
хромосому та хромосоми 13, 18 та 21. Зрозуміло, можна брати до уваги інші підходи; наприклад, для кожної хромосоми можна здійснити окрему оптимізацію. Узяті разом, діапазони, які підлягають оптимізації паралельно (наприклад, один діапазон для розглянутої хромосоми, що представляє інтерес, та інший діапазон для всіх інших хромосом), визначають мережу комбінацій межі КВ. Див. фігуру 48. Робочі характеристики системи відносно навчальної множини оцінюють у двох межах (один - для нормуючих хромосом (або аутосом, відмінних від хромосоми, що представляє інтерес) та другий - для хромосоми, що представляє інтерес), та для підсумкової конфігурації вибирають комбінацію, що демонструє найкращі робочі характеристики. Дана комбінація може бути відмінною для кожної із хромосом, що представляють інтерес. Згідно з певними варіантами реалізації робочі характеристики оцінюють на валідаційній множині замість навчальної множини, а саме, для оцінки робочих характеристик застосовують перехресну валідацію. 00348) Згідно з деякими варіантами реалізації робочі характеристики, оптимізовані для визначення діапазонів межі, являють собою коефіцієнт варіації доз хромосом (оснований на експериментальному виборі нормуючих хромосом). Процес вибирає комбінацію меж, яка мінімізує КВ дози хромосоми (наприклад, співвідношення) для хромосоми, що представляє інтерес, із застосуванням обраної на сьогоднішній день нормуючої хромосоми (або хромосом).
Відповідно до одного підходу процес досліджує робочі характеристики кожної комбінації меж у мережі у такий спосіб: (1) застосовує комбінацію меж для визначення масок для всіх хромосом та застосовує дані маски для фільтрації міток навчальної множини; (2) обчислює нормовані перекриття у межах навчальної множини неуражених зразків за допомогою застосування процесу фігури ЗА відносно відфільтрованих міток; (3) визначення репрезентативного нормованого перекриття на хромосому за допомогою, наприклад, підсумовування нормованих перекриттів блоку для розглянутої хромосоми; (4) обчислює дози хромосом із застосуванням обраних на сьогоднішній день нормуючих хромосом, та (5) визначення КВ доз хромосом.
Процес може оцінювати робочі характеристики обраних фільтрів за допомогою застосування їх відносно досліджуваних зразків, відділених від вихідної частини навчальної множини. Тобто, процес розділяє вихідну навчальну множину на навчальну та досліджувану підмножини.
Навчальну підмножину застосовують для визначення меж маски, як описано вище.
Ї00349| Згідно з альтернативними варіантами реалізації замість визначення масок, основаного на КВ перекриттів, маски можна задати за допомогою розподілу показників якості картування з результатів вирівнювання у межах навчальних зразків у блоках. Показник якості картування відображує унікальність, з якою рід картується на референсний геном. Інакше кажучи, показники якості картування кількісно визначають імовірність того, що рід неправильно вирівняний. Низький показник якості картування пов'язаний з низькою унікальністю (високою ймовірністю неправильного вирівнювання). Унікальність відповідає одній або декільком помилкам у ріді послідовності (отриманій за допомогою секвенатору). Докладний опис показників якості картування можна знайти у публікації Гі Н, Киап У, Юигріп К. (2008) Марріпд 5погі ОМА зедпепсіпду геаде апа саїпд магіапі5 ивіпд тарріпо диаІйу 5соге5. Сепоте Незеагсп 18:1851-8, яка повністю включена у даний документ за допомогою посилання. Згідно з деяким варіантом реалізації показник якості картування у даному документі називають показником
Маро. Фігура 48 демонструє, що показник Маро характеризується стійкою монотонною кореляцією із КВ процесованих перекриттів. Наприклад, блоки із КВ вище 0,4 практично повністю групуються у лівій частині графіка на фігурі 48, характеризуючись показниками Маро нижче приблизно 4. Внаслідок цього, маскування блоків з невеликим Маро може дозволити одержати маску, цілком аналогічну такій, заданій за допомогою маскування блоків з високим КВ.
Зразки та процесинг зразків
Зразки
ІООЗ50| Зразки, які застосовують для визначення ВЧК, наприклад, анеуплоїдій хромосом, часткових анеуплоїдій і т.п., можуть включати зразки, відібрані від будь-якої клітини, тканини або органу, у яких необхідно визначити варіації числа копій для однієї або більше послідовностей, що представляють інтерес. Переважно, зразки містять нуклеїнові кислоти, які присутні у клітинах, та/або нуклеїнові кислоти, які є "безклітинними" (наприклад, вшцДНК).
ЇОО351| Згідно з деякими варіантами реалізації кращим є одержання безклітинних нуклеїнових кислот, наприклад, безклітинної ДНК (вцДНК). Безклітинні нуклеїнові кислоти, включаючи безклітинну ДНК, можна одержати за різними способами, відомими у даній галузі техніки, з біологічних зразків, включаючи, без обмеження, плазму, сироватку та сечу (див., наприклад, публікації Рап еї аї., Ргос Маї! Асай 5сі 105:16266-16271 (20081; Коїде еї аї., Ргепаїйа!
Оіадповів 25:604-607 (20051; Спеп еї аї., Маїшге Мед. 2: 1033-1035 (19961); Го еї аї., Їапсеї 350: 60 485-487 (1997); Воїегайи еї а!., Сііп Спет. 46: 1078-1084, 2000; і Би еї аї., У Мої. Оіадп. 6: 101-107
(20041). Для відділення безклітинної ДНК від клітин у зразку можна застосовувати різні способи, включаючи, без обмеження, фракціонування, центрифугування (наприклад, центрифугування у градієнті щільності), ДНК-специфічну преципітацію або високопродуктивне сортування клітин та/або інші способи розділення. Існують комерційно доступні набори для ручного та автоматичного розділення вцдДНК (Коспе біадповійсв5, Індіанаполіс, Індіана, Оіадеп, Валенсія,
Каліфорнія, Маспегеу-МадеІ, Дюрен, Делавер). Біологічні зразки, що містять вуднК, застосовували у аналізах для визначення присутності або відсутності аномалій хромосом, наприклад, трисомії 21, за допомогою аналізів секвенування, які можуть виявити анеуплоїдії та/або різні поліморфізми хромосом.
ІЇ00352| Згідно з різними варіантами реалізації вцДНК, що присутня у зразку, перед застосуванням можна збагатити, специфічно або неспецифічно (наприклад, перед одержанням бібліотеки секвенування). Неспецифічне збагачення зразку ДНК означає ампліфікацію цілого геному фрагментів геномної ДНК зразку, яку можна застосовувати для збільшення рівня зразка
ДНК перед одержанням бібліотеки секвенування вцДНК. Неспецифічне збагачення може являти собою селективне збагачення одного із двох геномів, що присутні у зразку, який містить більше одного геному. Наприклад, неспецифічне збагачення може бути селективним відносно геному плода у материнському зразку, яке можна одержати за відомими способами для збільшення відносної частки ДНК плода у порівнянні з материнською ДНК у зразку. У якості альтернативи, неспецифічне збагачення може являти собою неселективну ампліфікацію обох геномів, що присутні у зразку. Наприклад, можна здійснити неспецифічну ампліфікацію ДНК плода та материнської ДНК у зразку, що містить суміш ДНК із геномів плода та матері. Способи ампліфікації цілого геному відомі у даній галузі техніки. ПЛР із дегенеративними олігонуклеотидними праймерами (Оеєдепегаїе оЇїдописіІеоїіде-ргітеайа РСК, СОР), методика ПЛР із добудовуванням праймеру (ргітег ехіепзіоп РСК, РЕР) та ампліфікація із множинним витисненням ланцюгу (птийіріе аїізріасетепі апптрійїсайоп, МОА) є прикладами способів ампліфікації цілого геному. Згідно з деякими варіантами реалізації зразок, що містить суміш
ВуЦДНК із різних геномів, є незбагаченим вуДНК геномів, що присутні у суміші. Згідно з іншими варіантами реалізації зразок, що містить суміш вуДНК із різних геномів, неспецифічно збагачений будь-яким з геномів, що присутні у зразку.
І00353| Зразок, що містить нуклеїнову кислоту або кислоти, у відношенні яких застосовують способи, описані у даному документі, як правило, включає біологічний зразок ("досліджуваний зразок"), наприклад, як описано вище. Згідно з деякими варіантами реалізації нуклеїнову кислоту або кислоти, скринінг яких проводять у відношенні однієї або більше ВЧК, очищають або виділяють за будь-яким з множини добре відомих способів.
І00354| Відповідно, згідно з певними варіантами реалізації зразок містить або складається з очищеного або виділеного полінуклеотиду або може включати зразки, такі як зразок тканини, зразок біологічної рідини, зразок клітини і т.п. Підходящі зразки біологічної рідини включають, без обмеження, кров, плазму, сироватку, піт, сльози, мокротиння, сечу, слину, вушну рідину, лімфу, слину, спинномозкову рідину, рідину після лаважу, суспензію кісткового мозку, піхвову рідина, рідину після трансцервікального лаважу, рідину головного мозку, асцит, молоко, секрети дихальних, кишкових та сечостатевих шляхів, амніотичну рідину, молоко та зразки лейкаферезу. Згідно з деякими варіантами реалізації зразок являє собою зразок, який з легкістю одержують у результаті неінвазивних процедур, наприклад, кров, плазму, сироватку, піт, сльози, мокротиння, сечу, мокротиння, вушну рідину, слину або фекалії. Згідно з певними варіантами реалізації зразок являє собою зразок периферичної крові або фракцію плазми та/або сироватки зразку периферичної крові. Згідно з іншими варіантами реалізації біологічний зразок являє собою мазок або зіскрібок, зразок біопсії або культуру клітин. Згідно з іншим варіантом реалізації зразок являє собою суміш двох або більше біологічних зразків, наприклад, біологічний зразок може містити два або більше зразків біологічної рідини, зразків тканини та зразків культури клітин. У даному документі терміни "кров", "плазма" та "сироватка" однозначно включають фракції або процесовані частини зазначених зразків. Аналогічно, коли зразок відбирають із біопсії, мазку, зіскрібка і т.д., "зразок" однозначно включає процесовану фракцію або частину, отриману з біопсії, мазку, зіскрібку і т.д.
ІЇ0О355| Згідно з певними варіантами реалізації зразки можна одержати із джерел, включаючи, без обмеження, зразки від різних індивідуумів, зразки від різних етапів розвитку того самого або різних індивідуумів, зразки від різних страждаючих від захворювання індивідуумів (наприклад, індивідуумів, що страждають від раку, або індивідуумів, які, як підозрюють, страждають від генетичного розладу), від нормальних індивідуумів, зразки, отримані на різних стадіях захворювання індивідуума, зразки, отримані від індивідуума, який одержує різні варіанти бо лікування захворювання, зразки від індивідуумів, які зазнають впливу різних факторів навколишнього середовища, зразки від індивідуумів зі схильністю до патології, зразки від індивідуумів, які зазнають впливу збудника інфекційного захворювання (наприклад, ВІЛ), і т.п.
І00356) Відповідно до одного ілюстративного, але необмежуючого варіанту реалізації зразок являє собою материнський зразок, який одержують від вагітного суб'єкта жіночої статі, наприклад, вагітної жінки. У цьому випадку зразок можна аналізувати із застосуванням способів, описаних у даному документі, із забезпеченням пренатальної діагностики потенційних хромосомних аномалій у плода. Материнський зразок може являти собою зразок тканини, зразок біологічної рідини або зразок клітини. Біологічна рідина включає, у якості необмежуючих прикладів, кров, плазму, сироватку, піт, сльози, мокротиння, сечу, мокротиння, вушну рідину, лімфу, слину, спинномозкову рідину, рідину після лаважу, суспензію кісткового мозку, піхвову рідину, рідину після трансцервікального лаважу, рідину головного мозку, асцит, молоко, секрети дихальних, кишкових та сечостатевих шляхів та зразки лейкаферезу.
ІЇ00357| Відповідно до іншого ілюстративного, але необмежуючого варіанту реалізації материнський зразок являє собою суміш двох або більше біологічних зразків, наприклад, біологічний зразок може містити два або більше зразків біологічної рідини, зразків тканини та зразків культури клітин. Згідно з деякими варіантами реалізації зразок являє собою зразок, який з легкістю одержують у результаті неінвазивних процедур, наприклад, кров, плазму, сироватку, піт, сльози, мокротиння, сечу, молоко, мокротиння, вушну рідину, слину та фекалії. Згідно з деякими варіантами реалізації біологічний зразок являє собою зразок периферичної крові та/або фракцію плазми та сироватки зазначеного зразку. Згідно з іншими варіантами реалізації біологічний зразок являє собою мазок або зіскрібок, зразок біопсії або зразок культури клітин. Як розкрито вище, "кров", "плазма" та "сироватка" однозначно включають фракції або процесовані частини зазначених зразків. Аналогічно, коли зразок відбирають із біопсії, мазку, зіскрібку і т.д., "зразок" однозначно включає процесовану фракцію або частину, отриману з біопсії, мазку, зіскрібку і т.д.
ІЇ00358| Згідно з певними варіантами реалізації зразки також можна одержати з культивованих іп мйго тканин, клітин або інших джерел, що містять полінуклеотиди.
Культивовані зразки можуть бути отримані із джерел, включаючи, без обмеження, культури (наприклад, тканини або клітин), підтримувані у різних середовищах та умовах (наприклад, рн, тиск або температура), культури (наприклад, тканини або клітин), підтримувані протягом різних періодів часу, культури (наприклад, тканини або клітин), оброблені різними факторами або реактивами (наприклад, потенційним лікарським засобом або модулятором), або культури різних типів тканини та/або клітин. 00359) Способи виділення нуклеїнових кислот з біологічних джерел добре відомі та будуть відрізнятися залежно від природи джерела. Фахівець у даній галузі техніки може з легкістю виділити нуклеїнову кислоту або кислоти із джерела, як потрібно для способу, описаного у даному документі У деяких випадках може характеризуватися перевагою фрагментація молекули нуклеїнової кислоти у зразку нуклеїнової кислоти. Фрагментація може бути випадковою або специфічною, яку досягають, наприклад, із застосуванням розщеплення рестрикційними ендонуклеазами. Способи випадкової фрагментації добре відомі у даній галузі техніки та включають, наприклад, обмежене розщеплення ДНКазою, обробку лугом та фізичне розрізання. Відповідно до одного варіанту реалізації зразок нуклеїнових кислот одержують зі
ВиЦДНК, яку не піддають фрагментації.
Одержання бібліотеки секвенування
І00360)| Відповідно до одного варіанту реалізації у способах, описаних у даному документі, можна застосовувати технології секвенування нового покоління (СНП), що дозволяють секвенувати множину зразків окремо у вигляді геномних молекул (тобто синглплексне секвенування) або у вигляді об'єднаних зразків, що містять індексовані геномні молекули (наприклад, мультиплексне секвенування), у ході однієї серії секвенування. Дані способи можуть дозволити одержати аж до декількох сотень мільйонів рідів послідовностей ДНК. Згідно з різними варіантами реалізації послідовності геномних нуклеїнових кислот та/або індексованих геномних нуклеїнових кислот можна визначити із застосуванням, наприклад, технологій секвенування нового покоління (СНІП), описаних у даному документі. Згідно з різними варіантами реалізації аналіз значної кількості даних послідовності, отриманих із застосуванням
СНП, можна здійснити із застосуванням одного або більше процесорів, як описано у даному документі.
І0ОЗ61| Згідно з різними варіантами реалізації застосування таких технологій секвенування не включає одержання бібліотек секвенування.
І00362| Однак згідно з певними варіантами реалізації способи секвенування, передбачені у бо даному документі, включають одержання бібліотек секвенування. Відповідно до одного ілюстративного підходу одержання бібліотеки секвенування включає одержання випадкового набору модифікованих адаптерами фрагментів ДНК (наприклад, полінуклеотидів), уже готових до секвенування. Бібліотеки секвенування полінуклеотидів можна одержати із ДНК або РНК, включаючи еквіваленти, аналоги ДНК або кДНК, наприклад, ДНК або кДНК, яка є комплементарною або являє собою копію ДНК, отриманої з матриці РНК під дією зворотної транскриптази. Полінуклеотиди можна одержати у дволанцюговій формі (наприклад, дсДНК, така як фрагменти геномної ДНК, кКДНК, продукти ПЛР-ампліфікації і т.п.), або згідно з певними варіантами реалізації полінуклеотиди можна одержати у одноланцюговій формі (наприклад,
ОоСДНК, РНК їі т.д.) та можна перетворити у форму доДНК. Як приклад, згідно з певними варіантами реалізації одноланцюгові молекули мРНК можна копіювати у дволанцюгові кДНК, що підходять для застосування при одержанні бібліотеки секвенування. Точна послідовність первинних полінуклеотидних молекул, як правило, не має значення для способу одержання бібліотеки та може бути відомою або не відомою. Відповідно до одного варіанту реалізації полінуклеотидні молекули являють собою молекули ДНК. Більш конкретно, згідно з певними варіантами реалізації полінуклеотидні молекули представляють весь генетичний набір організму або по суті весь генетичний набір організму та являють собою геномні молекул ДНК (наприклад, клітинну ДНК, безклітинні ДНК (вцДНК) і т.д.), які, як правило, включають як послідовність інтрону, так і послідовність екзону (кодуючу послідовність), а також некодуючі регуляторні послідовності, такі як послідовності промотору та енхансеру. Згідно з певними варіантами реалізації первинні полінуклеотидні молекули містять молекули ДНК гену людини, наприклад, молекули вушДНК, присутні у периферичній крові вагітного суб'єкта.
Ї00363| Одержання бібліотек секвенування для деяких платформ секвенування. СНП полегшується за допомогою застосування полінуклеотидів, що містять конкретний діапазон розмірів фрагментів. Одержання таких бібліотек, як правило, включає фрагментацію великих полінуклеотидів (наприклад, клітинної геномної ДНК) для одержання полінуклеотидів бажаного діапазону розміру.
ІЇ00364| Фрагментацію можна забезпечити за будь-яким із множини способів, відомих фахівцям у даній галузі техніки. Наприклад, фрагментацію можна забезпечити механічними способами, включаючи, без обмеження, пульверизацію, обробку ультразвуком та гідрозсув.
Однак механічна фрагментація, як правило, розщеплює скелет ДНК по зв'язках С-О, Р-О та С-
С, що приводить до одержання гетерогенної суміші тупих та 3- та 5-виступаючих кінців з розірваними зв'язками С-О, Р-О та С-С (див., наприклад, публікації АІпетгі апа І їм"аск, У Віої.
Спет 265:17323-17333 (1990); Віспагах апа Воуетг, У Мої Вісо! 11:327-240 (19651), які, можливо, необхідно відновити, оскільки у них може бути відсутній необхідний для наступних ферментативних реакцій 5'--фосфат, наприклад, для лігування адаптерів секвенування, які необхідні для підготовки ДНК до секвенування. 00365) Навпаки, вуднНК, як правило, існує у вигляді фрагментів розміром менше приблизно 300 пар основ та, отже, для одержання бібліотеки секвенування із застосуванням зразків виіДднК фрагментація, як правило, не потрібна. 00366) Як правило, незалежно від того, чи були полінуклеотиди фрагментовані примусово (наприклад, фрагментовані іп мйго), або існують у природі у вигляді фрагментів, їх перетворюють у ДНК із тупими кінцями, що містить 5-фосфати та 3'-гідроксильну групу.
Стандартні протоколи, наприклад, протоколи для секвенування із застосуванням, наприклад, платформи ПШитіпа, описані у іншому місці у даному документі, інструктують користувачів відновлювати кінці зразку ДНК, очищати продукти з відновленими кінцями перед приєднанням дА-«хвоста" та очищати продукти із приєднанням дА-«хвоста" перед етапами лігування адаптерів для одержання бібліотеки.
І00367| У різних варіантах реалізації способів одержання бібліотеки послідовності, описаних у даному документі, уникають необхідності здійснювати один або більше етапів, як правило, що пропонуються стандартними протоколами для одержання модифікованого продукту ДНК, який можна секвенувати за допомогою СНП. Скорочений (абьбгеміаїеа, АВВ) спосіб, 1-етапний спосіб та 2-етапний спосіб є прикладами способів одержання бібліотеки секвенування, які можна знайти у заявці на патент 13/555,037, поданій 20 липня 2012 року, яка повністю включена у даний документ за допомогою посилання.
Маркерні нуклеїнові кислоти для відстежування та підтвердження цілісності зразку
І0О368| Згідно з різними варіантами реалізації підтвердження цілісності зразків та відстеження зразку можна здійснити за допомогою секвенування сумішей зразку геномних нуклеїнових кислот, наприклад, вуДНК, та супровідних маркерних нуклеїнових кислот, які були введені у зразки, наприклад, перед процесингом. бо І00369| Маркерні нуклеїнові кислоти можна об'єднати з досліджуваним зразком (наприклад,
зразком з біологічного джерела) та піддати процесам, які включають, наприклад, один або більше етапів фракціонування зразку з біологічного джерела, наприклад, одержання по суті безклітинної фракції плазми зі зразку цільної крові, очищення нуклеїнових кислот із фракціонованого зразку, наприклад, плазми, або нефракціонованого зразку з біологічного джерела, наприклад, зразка тканини, та секвенування. Згідно з деякими варіантами реалізації секвенування включає одержання бібліотеки секвенування. Послідовність або комбінацію послідовностей маркерних молекул, які поєднують зі зразком із джерела, вибирають таким чином, щоб вона була унікальною відносно зразку із джерела. Згідно з деякими варіантами реалізації всі унікальні маркерні молекули у зразку містять ту саму послідовність. Згідно з іншими варіантами реалізації унікальні маркерні молекули у зразку являють собою множину послідовностей, наприклад, комбінацію двох, трьох, чотирьох, п'яти, шести, семи, восьми, дев'яти, десяти, п'ятнадцяти, двадцяти або більше різних послідовностей.
І00370| Відповідно до одного варіанту реалізації цілісність зразку можна підтвердити із застосуванням множини маркерних молекул нуклеїнової кислоти, які містять ідентичні послідовності. У якості альтернативи, дійсність зразку можна підтвердити із застосуванням множини маркерних молекул нуклеїнової кислоти, які містять щонайменше дві, щонайменше три, щонайменше чотири, щонайменше п'ять, щонайменше шість, щонайменше сім, щонайменше вісім, щонайменше дев'ять, щонайменше десять, щонайменше 11, щонайменше 12, щонайменше 13, щонайменше 14, щонайменше 15, щонайменше 16, щонайменше 17, щонайменше 18, щонайменше 19, щонайменше 20, щонайменше 25, щонайменше 30, щонайменше 35, щонайменше 40, щонайменше 50 або більше різних послідовностей. Для підтвердження цілісності множини біологічних зразків, тобто двох або більше біологічних зразків, потрібно, щоб кожен із двох або більше зразків був маркірований маркерними нуклегсновими кислотами, які містять послідовності, унікальні для кожного 3 множини досліджуваних зразків, які є маркірованими. Наприклад, перший зразок може бути маркірований маркерною нуклеїновою кислотою, що містить послідовність А, та другий зразок може бути маркірований маркерною нуклеїновою кислотою, що містить послідовність В. У якості альтернативи, перший зразок може бути маркірований молекулами маркерної нуклеїнової кислоти, усі з яких містять послідовність А, та другий зразок може бути маркірований сумішшю послідовностей В та С, причому послідовності А, В та С являють собою маркерні молекули, що містять різні послідовності.
І00371| Маркерну нуклеїнову кислоту або кислоти можна додати до зразку на будь-якому етапі одержання зразку, який відбувається перед одержанням бібліотеки (якщо необхідно одержати бібліотеки) та секвенування. Відповідно до одного варіанту реалізації маркерні молекули можна об'єднати з непроцесованим зразком із джерела. Наприклад, маркерна нуклеїнова кислота може бути забезпечена у пробірці для збору зразків, яку застосовують для забору зразку крові. У якості альтернативи, маркерні нуклеїнові кислоти можна додати до зразку крові після забору крові. Відповідно до одного варіанту реалізації маркерну нуклеїнову кислоту додають у посудину, яку застосовують для збору зразку біологічної рідини, наприклад, маркерну нуклеїнову кислоту або кислоти додають у пробірку для забору крові, яку застосовують для забору зразку крові. Згідно з іншим варіантом реалізації маркерну нуклеїнову кислоту або кислоти додають у фракцію зразку біологічної рідини. Наприклад, маркерну нуклеїнову кислоту додають у фракцію плазми та/або сироватки зразку крові, наприклад, у зразок материнської плазми. Згідно з ще одним варіантом реалізації маркерні молекули додають у очищений зразок, наприклад, зразок нуклеїнових кислот, які були очищені з біологічного зразку. Наприклад, маркерні нуклеїнові кислоти додають у зразок очищеної материнської та плідної виДНК.
Аналогічно, маркерні нуклеїнові кислоти можна додати у зразок біопсії перед процесуванням зразку. Згідно з деякими варіантами реалізації маркерні нуклеїнові кислоти можна об'єднати з носієм, який доставляє маркерні молекули у клітини біологічного зразку. Носії для доставки клітин включають рН-чутливі та катіонні ліпосоми.
І00372| Згідно з різними варіантами реалізації маркерні молекули містять антигеномні послідовності, які являють собою послідовності, відсутні у геномі зразку з біологічного джерела.
Згідно з ілюстративним варіантом реалізації маркерні молекули, які застосовують для підтвердження цілісності зразку з біологічного джерела людини, містять послідовності, відсутні у гені людини. Згідно з альтернативним варіантом реалізації маркерні молекули містять послідовності, які відсутні у зразку із джерела та у будь-якому одному або більше інших відомих геномів. Наприклад, маркерні молекули, які застосовують для підтвердження цілісності зразку з біологічного джерела людини, містять послідовності, відсутні у гені людини та у геномі миші.
Альтернативний варіант дозволяє підтверджувати цілісність досліджуваного зразку, який бо містить два або більше геномів. Наприклад, цілісність зразку безклітинної ДНК людини,
отриманого від суб'єкта, ураженого патогеном, наприклад, бактерією, можна підтвердити із застосуванням маркерних молекул, які містять послідовності, відсутні як у гені людини, так і у геномі уражаючої бактерії. Послідовності геномів численних патогенів, наприклад, бактерій, вірусів, дріжджів, грибів, найпростіших і т.д., є загальнодоступними у мережі Інтернет за адресою: пебі.піт.піпй.дом/депотев5. Згідно з іншим варіантом реалізації маркерні молекули являють собою нуклеїнові кислоти, які містять послідовності, відсутні у будь-якому відомому геномі. Послідовності маркерних молекул можна одержати випадковим чином алгоритмічно. 00373) Згідно з різними варіантами реалізації маркерні молекули можуть являти собою рибонуклеїнові кислоти, дезоксирибонуклеїнові кислоти (ДНК), що зустрічаються у природі, або штучні аналоги нуклеїнової кислоти (міметики нуклеїнової кислоти), включаючи пептидні нуклеїнові кислоти (ПНК), морфолінові нуклеїнові кислоти, замкнені нуклеїнові кислоти, гліколеві нуклеїнові кислоти та треозні нуклеїнові кислоти, які відрізняються від ДНК або РНК, що зустрічаються у природі, змінами у скелеті молекули, або міметики ДНК, які не містять фосфодіефірний скелет. Дезоксирибонуклеїнові кислоти можуть походити з геномів, що зустрічаються у природі, або можуть бути отримані у лабораторії за допомогою застосування ферментів або за допомогою твердофазного хімічного синтезу. Хімічні способи також можна застосовувати для одержання міметиків ДНК, не виявлених у природі. Доступні похідні ДНК, у яких фосфодіефірний зв'язок був замінений, але у яких збережена дезоксирибоза, та які включають, без обмеження, міметики ДНК, що містять скелети, утворені тріоформацетальним або карбоксамідним зв'язком, які, як було показано, є гарними структурними міметиками ДНК.
Інші міметики ДНК включають морфолінові похідні та пептидні нуклеїнові кислоти (ПНК), які містять псевдопептидний скелет на основі М-(2-аміноетил)гліцину (Апп Кем Віорпу5 Віотої
Бігисі 24:167-183 (19951). ПНК являє собою надзвичайно гарний структурний міметик ДНК (або рибонуклеїнової кислоти |РНКІ), та олігомери ПНК здатні утворювати досить стабільні дуплексні структури з комплементарними згідно із принципом Уотсона-Крика олігомерами ДНК та РНК (або ПНК), та можуть також зв'язуватися з мішенями у дуплексній ДНК за допомогою включення у спіраль (Мої Віоїесппої 26:233-248 (2004). Інший гарний структурний міметик/(аналог ДНК, який можна застосовувати у якості маркерної молекули, являє собою фосфотіоатну ДНК, у якій один з немісткових киснів замінений сіркою. Дана модифікація знижує дію ендо- та екзонуклеаз 2, включаючи від 5" - 3" та 3" - 5" ДНК РОЇ 1 екзонуклеазу, нуклеази 51 та Р11, РНКази, сироваткові нуклеази та фосфодіестеразу зміїної отрути.
Ї00374| Довжина маркерних молекул може бути відмінною або такою ж, як довжина нуклеїнових кислот зразку, тобто довжина маркерних молекул може бути аналогічною такій геномних молекул зразку або може бути більшою або меншою, ніж така геномних молекул зразку. Довжину маркерних молекул вимірюють за кількістю основ нуклеотидів або аналогів нуклеотидів, які складають маркерну молекулу. Маркерні молекули, довжини яких відрізняються від таких геномних молекул зразку, можна відрізнити від нуклеїнових кислот із джерела із застосуванням способів розділення, відомих у даній галузі техніки. Наприклад, відмінності у довжині молекул маркерних нуклеїнових кислот та нуклеїнових кислот зразку можна визначити за допомогою електрофоретичного розділення, наприклад, капілярного електрофорезу.
Встановлення відмінностей у розмірі може характеризуватися перевагою для кількісного визначення та оцінки якості маркера та нуклеїнових кислот зразку. Переважно, маркерні нуклеїнові кислоти є більш короткими, ніж геномні нуклеїнові кислоти, та характеризуються достатньою довжиною, щоб виключити їх з картування на геном зразку. Наприклад, необхідна послідовність людини довжиною 30 основ, щоб унікально картувати її на ген людини.
Відповідно, згідно з певними варіантами реалізації маркерні молекули, які застосовують у біоаналізах секвенування зразків людини, повинні становити щонайменше 30 п.о. у довжину.
ІЇ00375| Вибір довжини маркерної молекули визначають переважно із застосуванням технології секвенування, яку використовують для підтвердження цілісності зразку із джерела.
Також можна брати до уваги довжину геномних нуклеїнових кислот зразку, секвенування якого проводять. Наприклад, у деяких технологіях секвенування застосовують клональну ампліфікацію полінуклеотидів, для якої може вимагатися, щоб геномні полінуклеотиди, які необхідно клонально ампліфікувати, характеризувалися мінімальною довжиною. Наприклад, секвенування із застосуванням аналізатору послідовностей Шитіпа СА! включає клональну ампліфікацію іп мійго методом місткової ПЛР (також відома як кластерна ампліфікація) полінуклеотидів, які характеризуються мінімальною довжиною 110 п.о., з якими лігують адаптери з одержанням нуклеїнової кислоти розміром щонайменше 200 п.о. та менше 600 п.о., яку можна клонально ампліфікувати та секвенувати. Згідно з деякими варіантами реалізації довжина лігованої з адаптерами маркерної молекули становить від приблизно 200 п.о. до 60 приблизно 600 п.о., від приблизно 250 п.о. до 550 п.о., від приблизно 300 п.о. до 500 п.о. або від приблизно 350 до 450. Згідно з іншими варіантами реалізації довжина лігованої з адаптерами маркерної молекули становить приблизно 200 п.о. Наприклад, при секвенуванні вцДНК плода, яка присутня у материнському зразку, довжину маркерної молекули можна вибрати таким чином, щоб вона була аналогічною такій молекул вцДНК плода. Таким чином, відповідно до одного варіанту реалізації довжина маркерної молекули, застосовуваної у аналізі, який включає широкомасштабне паралельне секвенування вцДНК у материнському зразку для визначення присутності або відсутності анеуплоїдії хромосоми плода, може становити приблизно 150 п.о., приблизно 160 п.о., 170 п.о., приблизно 180 п.о., приблизно 190 п.о. або приблизно 200 п.о.; переважно, довжина маркерної молекули становить приблизно 170 п.о. У інших підходах секвенування, наприклад, секвенування 5ОГ 0, полоні-секвенування та секвенування 454, для клональної ампліфікації молекул ДНК із метою секвенування застосовують емульсійну ПЛР, та кожна технологія диктує мінімальну та максимальну довжину молекул, які необхідно ампліфікувати. Довжина маркерних молекул, секвенування яких проводять у вигляді клонально ампліфікованих нуклеїнових кислот, може становити аж до приблизно 600 п.о. Згідно з деякими варіантами реалізації довжина маркерних молекул, секвенування яких проводять, може становити більше 600 п.о.
І00376| У випадку технологій одномолекулярного секвенування, у яких не застосовують клональну ампліфікацію молекул та які здатні до секвенировання нуклеїнових кислот у межах дуже широкого діапазону довжин матриць, у більшості ситуацій не потрібно, щоб молекули, секвенування яких проводять, характеризувалися будь-якою конкретною довжиною. Однак вихід послідовностей на одиницю маси залежить від кількості 3'-кінцевих гідроксильних груп і, таким чином, наявність відносно коротких матриць для секвенування є більш ефективною, ніж наявність довгих матриць. Якщо починати з нуклеїнових кислот, більш довгих, ніж 1000 нуклеотидів, як правило, рекомендують розрізати нуклеїнові кислоти до середньої довжини 100 - 200 нуклеотидів для того, щоб за допомогою тієї ж маси нуклеїнових кислот можна було одержати більше інформації про послідовність. Таким чином, довжина маркерної молекули може варіюватися від десятків основ до тисяч основ. Довжина маркерних молекул, застосовуваних для одномолекулярного секвенування, може становити аж до приблизно 25 п.о., аж до приблизно 50 п.о., аж до приблизно 75 п.о., аж до приблизно 100 п.о., аж до приблизно 200 п.о., аж до приблизно 300 п.о., аж до приблизно 400 п.о., аж до приблизно 500 п.о., аж до приблизно 600 п.о., аж до приблизно 700 п.о., аж до приблизно 800 п.о., аж до приблизно 900 п.о., аж до приблизно 1000 п.о. або більше, у довжину.
І00377| Довжина, обрана для маркерної молекули, також визначається довжиною геномної нуклеїнової кислоти, секвенування якої проводять. Наприклад, вцДНК циркулює у судинному руслі людини у вигляді геномних фрагментів клітинної геномної ДНК. Молекули вцДНК плода, виявлені у плазмі вагітних жінок, як правило, більш короткі, ніж молекули материнської вц0іднК (Спап еї аї., Сіп Спет 50:8892 (20041). Фракціонування циркулюючої ДНК плода за розміром підтвердило, що середня довжина фрагментів циркулюючої ДНК плода становить «300 п.о., тоді як довжина материнської ДНК, згідно з оцінками, становить приблизно від 0,5 до 1 т.о. (Іі еї аї.,
СіІїп Спет, 50: 1002-1011 (20041). Дані результати узгоджуються з результатами Рап еї аї., які визначили із застосуванням СНП, що довжина виДНК плода рідко перевищує 340 п.о. (Рап еї аї.,
СіІп Спет 56:1279-1286 |20101). ДНК, виділена із сечі стандартним способом на основі діоксиду кремнію, складається із двох фракцій, високомолекулярної ДНК, яка походить із виділених клітин, та низькомолекулярної (150 - 250 пар основ) фракції трансренальної ДНК (Тг-ОМА) (Воїелай еї аї., Сіпй Спет. 46: 1078-1084, 2000; та 5и еї аї., У Мої. Оіадп. 6: 101-107, 2004).
Застосування нещодавно розробленої методики для виділення безклітинних нуклеїнових кислот з рідин для виділення трансренальних нуклеїнових кислот дозволило виявити присутність у сечі фрагментів ДНК та РНК у значній мірі більш коротких, ніж 150 пар основ (публікація заявки на патент США Мо 20080139801). Згідно з варіантами реалізації, у яких вцДНК являє собою геномну нуклеїнову кислоту, яку секвенують, обрана довжина маркерних молекул може становити аж до приблизно довжини вцИиДНК. Наприклад, довжина маркерних молекул, застосовуваних у зразках материнської вциДНК, секвенування яких проводять у вигляді одиничних молекул нуклеїнової кислоти або у вигляді клонально ампліфікованих нуклеїнових кислот, може становити від приблизно 100 п.о. до 600. Згідно з іншими варіантами реалізації геномні нуклеїнові кислоти зразку являють собою фрагменти більших молекул. Наприклад, геномна нуклеїнова кислота зразку, яку секвенують, являє собою фрагментовану клітинну ДНК.
Згідно з варіантами реалізації у яких секвенують фрагментовану клітинну ДНК, довжина маркерних молекул може становити аж до довжини фрагментів ДНК. Згідно з деякими варіантами реалізації довжина маркерних молекул становить щонайменше мінімальну довжину, бо необхідну для унікального картування ріду послідовності на відповідний референсний геном.
Згідно з іншими варіантами реалізації довжина маркерної молекули становить мінімальну довжину, необхідну для виключення маркерної молекули з картування на референсний геном зразку. 003781 Крім цього, маркерні молекули можна застосовувати для підтвердження зразків, які не аналізують за допомогою секвенування нуклеїнової кислоти та які можна підтвердити за допомогою загальноприйнятих біологічних методик, відмінних від секвенування, наприклад,
ПЛР у режимі реального часу.
Контрольні зразки (наприклад, внутрішні позитивні контролі для секвенування та/або аналізу).
І00379| Згідно з різними варіантами реалізації маркерні послідовності, що вводяться у зразки, наприклад, як описано вище, можуть виступати у якості позитивних контролів для підтвердження точності та ефективності секвенування та наступного процесингу та аналізу.
ІЇОО380| Відповідно, запропоновані композиції та спосіб забезпечення внутрішнього позитивного контролю (ВПК) для секвенування ДНК у зразку. Згідно з певними варіантами реалізації запропоновані позитивні контролі для секвенування виДнНК у зразку, що містить суміш геномів. ВПК можна застосовувати для встановлення зв'язку зсувів базової лінії у інформації про послідовність, отриману з різних множин зразків, наприклад, зразків, які секвенують у різні часи у різних серіях секвенування. Таким чином, наприклад, ВПК може встановлювати зв'язок інформації про послідовність отриману для материнського досліджуваного зразку, з інформацією про послідовність, отриману з множини кваліфікаційних зразків, які секвенували у відмінний час.
І00381| Аналогічно, у випадку аналізу сегментів ВПК може встановлювати зв'язок між інформацією про послідовність, отриману від суб'єкта для конкретного сегменту або сегментів, з інформацією про послідовність, отриману з множини кваліфікаційних зразків (аналогічних послідовностей), які секвенували у відмінний час. Згідно з певними варіантами реалізації ВПК може встановлювати зв'язок інформації про послідовність, отриману від суб'єкта для конкретного пов'язаного з раком локусу, з інформацією про послідовність, отриману з множини кваліфікаційних зразків (наприклад, з відомої ампліфікації/делеції і т.п).
І003821 Крім цього, ВПК можна застосовувати у якості маркерів для відстеження зразку або зразків протягом процесу секвенування. ВПК можуть також забезпечити якісне значення позитивної дози послідовності, наприклад, МСУ, для однієї або більше анеуплоїдій хромосом, що представляють інтерес, наприклад, трисомії 21, трисомії 13, трисомії 18, для забезпечення належної інтерпретації та для гарантування вірогідності та точності даних. Згідно з певними варіантами реалізації можна створити ВПК, які містять нуклеїнові кислоти із чоловічого та жіночого геномів, з метою забезпечення доз для хромосом Х та У у материнському зразку для визначення того, чи є плід плодом чоловічої статі. 00383) Тип та кількості внутрішніх контролів залежать від типу або природи необхідного аналізу. Наприклад, для аналізу, для якого потрібно секвенування ДНК зі зразку, що містить суміш геномів, з метою визначення присутності анеуплоїдії хромосоми, внутрішній контроль може містити ДНК, отриману зі зразку, який встановлено містить ту ж хромосомну анеуплоїдію, дослідження якої проводять. Згідно з деякими варіантами реалізації ВПК містить ДНК зі зразку, який встановлено містить анеуплоїдію хромосоми, що представляє інтерес. Наприклад, ВПК для аналізу з метою визначення присутності або відсутності трисомії у плода, наприклад, трисомії 21, у материнському зразку містить ДНК, отриману від індивідуума із трисомією 21.
Згідно з деякими варіантами реалізації ВПК містить суміш ДНК, отриманої від двох або більше індивідуумів з різними анеуплоїдіями. Наприклад, для аналізу з метою визначення присутності або відсутності трисомії 13, трисомії 18, трисомії 21 та моносомії Х ВПК містить комбінацію зразків ДНК, отриманої від вагітних жінок, кожна з яких виношує плід з однією із трисомій, дослідження якої проводять. На додаток до повних анеуплоїдій хромосом можна створити ВПК для забезпечення позитивних контролів для аналізів з метою визначення присутності або відсутності часткових анеуплоїдій.
І00384| ВПК, який виступає як контроль для виявлення одиничної анеуплоїдії, можна створити із застосуванням суміші клітинної геномної ДНК, отриманої із двох суб'єктів, один з яких є джерелом анеуплоїдного геному. Наприклад, ВПК, який створюють як контроль для аналізу з метою визначення трисомії у плода, наприклад, трисомії 21, можна створити за допомогою об'єднання геномної ДНК із чоловічого або жіночого суб'єкта, що несе трисомічну хромосому, з геномною ДНК суб'єкта жіночої статі, яка встановлено не несе трисомічну хромосому. Геномну ДНК можна екстрагувати із клітин обох суб'єктів та розрізати для забезпечення фрагментів довжиною від приблизно 100 - 400 п.о., від приблизно 150 - 350 п.о. бо або від приблизно 200 - 300 п.о. для імітації циркулюючих фрагментів вцДНК у материнських бо зразках. Частку фрагментованої ДНК із суб'єкта, що несе анеуплоїдію, наприклад, трисомію 21, вибирають для імітації частки циркулюючої вцДНК плода, виявленої у материнських зразках, з одержанням ВІК, що містить суміш фрагментованої ДНК, яка містить приблизно 5 95, приблизно 10 95, приблизно 15 95, приблизно 20 95, приблизно 25 95, приблизно 30 95 ДНК від суб'єкта, що несе анеуплоїдію. ВПК може містити ДНК від різних суб'єктів, кожен з яких несе відмінну анеуплоїдію. Наприклад, ВПК може містити приблизно 80 95 неураженої жіночої ДНК та 20 965, що залишилися, можуть являти собою ДНК від трьох різних суб'єктів, кожен з яких несе трисомічну хромосому 21, трисомічну хромосому 13 та трисомічну хромосому 18. Для секвенування готують суміш фрагментованої ДНК. Процесинг суміші фрагментованої ДНК може включати одержання бібліотеки секвенування, яку можна секвенувати із застосуванням будь- якого широкомасштабного паралельного способу у синглплексному або мультиплексному режимі. Базові розчини геномного ВПК можна зберігати та застосовувати у множині діагностичних аналізів.
І00385) У якості альтернативи, можна створити ВПК із застосуванням вцшДнНК, отриманої від матері, яка встановлено виношує плід з відомою анеуплоїдією хромосоми. Наприклад, вцднкК можна одержати від вагітної жінки, яка виношує плід із трисомією 21. вцДНК екстрагують із материнського зразку та клонують у бактеріальному векторі та вирощують у бактеріях з одержанням постійного джерела ВПК. ДНК можна екстрагувати з бактеріального вектору із застосуванням рестрикційних ферментів. У якості альтернативи, клоновану вцДНК можна ампліфікувати за допомогою, наприклад, ПЛР. ДНК ВПК можна процесувати для секвенування у одній і тій же серії, що і виДНК із досліджуваних зразків, які аналізують відносно присутності або відсутності анеуплоїдій хромосом.
І00386| Незважаючи на те, що створення ВПК описане вище стосовно до трисомії, слід приймати до уваги, що ВПК можна створити для відображення інших часткових анеуплоїдій, включаючи, наприклад, різні ампліфікації та/(або делеції сегментів. Таким чином, наприклад, коли відомо, що різні типи раку пов'язані з конкретними ампліфікаціями (наприклад, рак молочної залози, пов'язаний з 20013), можна створити ВПК, які містять дані відомі ампліфікації.
Способи секвенування
ЇО0387| Як зазначено вище, отримані зразки (наприклад, бібліотеки секвенування) секвенують як частину процедури ідентифікації варіації або варіацій числа копій. Можна застосовувати будь-яку з множини технологій секвенування. 00388) Деякі технології секвенування доступні комерційно, такі як платформа секвенування за допомогою гібридизації від компанії АПутеїгіх Іпс. (Саннівейл, Каліфорнія) та платформи для секвенування за допомогою синтезу від компаній 454 І їїе бсіепсе5 (Бредфорд, Коннектикут),
ПШитіпа/Зоїеха (Хейвард, Каліфорнія) та Неїїсо5 Віозсіепсе5 (Кембридж, Массачусетс), а також платформа для секвенування за допомогою лігування від компанії Арріїеа Віозухіетв5 (Фостер
Сіті, Каліфорнія), описана нижче. На додаток до одномолекулярного секвенування, яке здійснюють із застосуванням секвенування за допомогою синтезу від компанії Неїїсо5
Віозсіепсе5, інші технології одномолекулярного секвенування включають, без обмеження, технологію ЗМК "М від компанії Расійс Віозсіепсез5, технологію ІОМ ТОККЕМТТМ та нанопорове секвенування, розроблене, наприклад, компанією Охіога Мапороге Тесппо!одіев.
І00389| Незважаючи на те, що автоматизований спосіб Сенджера вважають технологією "першого покоління", секвенування за Сенджером, включаючи автоматизоване секвенування за
Сенджером, можна також застосовувати у способах, описаних у даному документі. Додаткові підходящі способи секвенування включають, без обмеження, технології візуалізації нуклеїнової кислоти, наприклад, атомно-силову мікроскопію (АСМ) або трансмісійну електронну мікроскопію (ТЕМ). Ілюстративні технології секвенування більш докладно описані нижче.
Ї00390| Відповідно до одного ілюстративного, але необмежуючого варіанту реалізації способи, описані у даному документі, включають одержання інформації про послідовність нуклеїнових кислот у досліджуваному зразку, наприклад, вцДНК у материнському зразку, в6ДНК або клітинної ДНК у суб'єкта, скринінг якого проводять відносно раку, і т.п., із застосуванням секвенування за допомогою синтезу Шитіпа та хімії секвенування на основі оборотного термінатора (наприклад, як описано у публікації Вепіеу еї аї., Майшге 6:53-59 (20091). Матриця
ДНК може являти собою геномну ДНК, наприклад, клітинну ДНК або вуднНК. Згідно з деякими варіантами реалізації як матриці застосовують геномну ДНК із виділених клітин, та її фрагментують на довжини у декілька сотень пар основ. Згідно з іншими варіантами реалізації вВЦДНК застосовують у якості матриці, та фрагментація не потрібна, оскільки вцДНК існує у вигляді коротких фрагментів. Наприклад, вцДНК плода циркулює у судинному руслі у вигляді фрагментів довжиною приблизно 170 пар основ (п.о.) (Рап еї аї., Сіїп Спет 56:1279-1286 (20101), бо та перед секвенуванням фрагментація ДНК не потрібна. Технологія секвенування Шитіпа основана на приєднанні фрагментованої геномної ДНК до плоскої, оптично прозорої поверхні, з якою зв'язують олігонуклеотидні якорі. У матриці ДНК відновлюють кінці для одержання 5'- фосфорильованих тупих кінців, та полімеразну активність фрагмента Кленова застосовують для додавання однієї основи А до 3'-кінця тупих фосфорильованих фрагментів ДНК. Дане додавання підготовляє фрагменти ДНК до лігування з олігонуклеотидними адаптерами, які містять виступ однієї основи Т на 3'-кінці для збільшення ефективності лігування. Адаптерні олігонуклеотиди комплементарні якірним олігонуклеотидам проточної комірки (не плутати з якірними/заякореними рідами у аналізі експансії повторів). В умовах серійних розведень модифіковану адаптерами одноланцюгову матрицю ДНК додають у проточну комірку та імобілізують за допомогою гібридизації з якірними олігонуклеотидами. Приєднані фрагменти
ДНК подовжують та ампліфікують за допомогою місткової ампліфікації для одержання секвенування надвисокої щільності проточної комірки із сотнями мільйонів кластерів, кожен з яких містить приблизно 1000 копій однієї і тієї ж матриці. Відповідно до одного варіанту реалізації випадковим чином фрагментовану геномну ДНК ампліфікують із застосуванням ПЛР до того, як її піддадуть кластерній ампліфікації. У якості альтернативи, застосовують одержання геномної бібліотеки без ампліфікації (наприклад, без застосування ПЛР), та випадковим чином фрагментовану геномну ДНК збагачують із застосуванням кластерної ампліфікації самої по собі (Когагема еї а!., Маште Меїподз» 6:291-295 (20091). Матриці секвенують із застосуванням стійкої чотириколірної технології секвенування ДНК за допомогою синтезу, у якій застосовують оборотні термінатори із флуоресцентними барвниками, що видаляються. Високочутливе флуоресцентне виявлення забезпечують із застосуванням збудження лазером та оптики повного внутрішнього відбиття. Короткі ріди послідовності довжиною приблизно від десяти до декількох сотень пар основ вирівнюють із референсним геномом, та унікальні картування коротких рідів послідовності на референсний геном ідентифікують із застосуванням спеціально розробленого асортименту програмного забезпечення для аналізу даних. Після завершення першого ріду матриці можна регенерувати іп зйш, що уможливлює одержання другого ріду із протилежних кінців фрагментів. Таким чином, можна застосовувати секвенування одиночних кінців або спарених кінців фрагментів ДНК.
І00О391) У різних варіантах реалізації даного винаходу можна застосовувати секвенування за допомогою синтезу, що дозволяє проводити секвенування спарених кінців. Згідно з деякими варіантами реалізації платформа Шитіпа для секвенування за допомогою синтезу включає кластеризацію фрагментів. Кластеризація являє собою процес, у якому кожну молекулу фрагмента ізотермічно ампліфікують. Згідно з деякими варіантами реалізації як приклад, описаний у даному документі, фрагмент містить два різні адаптери, приєднані до двох кінців фрагменту, причому адаптери дозволяють фрагменту гібридизуватися із двома різними олігонуклеотидами на поверхні доріжки проточної комірки. Фрагмент також містить на двох своїх кінцях дві індексні послідовності або приєднаний до них, причому індексні послідовності забезпечують мітки для ідентифікації різних зразків у мультиплексному секвенуванні. У деяких платформах секвенування фрагмент, секвенування якого проводять, також називають вставкою.
І00392| Згідно з деяким варіантом реалізації проточна комірка для кластеризації у платформі Шитіпа являє собою скляну пластинку з доріжками. Кожна доріжка являє собою скляний канал, на який нанесено покриття із двох типів олігонуклеотидів. Гібридизація забезпечується завдяки першому із двох типів олігонуклеотидів на поверхні. Даний олігонуклеотид комплементарний першому адаптеру на одному кінці фрагменту. Полімераза створює комплементарний ланцюг гібридизованого фрагменту. Дволанцюгову молекулу денатурують, та ланцюг вихідної матриці змивають. Ланцюг, що залишився, паралельно з багатьма іншими ланцюгами, що залишилися, клонально ампліфікують за допомогою місткової ампліфікації.
І00393| При містковій ампліфікації ланцюг згортається, та друга адаптерна область на другому кінці ланцюга гібридизується із другим типом олігонуклеотидів на поверхні проточної комірки. Полімераза створює комплементарний ланцюг, утворюючи дволанцюгову місткову молекулу. Дану дволанцюгову молекулу денатурують, що приводить до одержання двох одноланцюгових молекул, приєднаних до проточної комірки за допомогою двох різних олігонуклеотидів. Потім процес повторюють знову і знову, та він відбувається одночасно для мільйонів кластерів, що приводить до клональної ампліфікації всіх фрагментів. Після місткової ампліфікації зворотні ланцюги відщеплюють та змивають, залишаючи виключно прямі ланцюги. 3'-кінці блокують для запобігання небажаного праймування.
І00394| Після кластеризації секвенування починають із подовження першого праймеру бо секвенування для одержання першого ріду. З кожним циклом флуоресцентно мічені нуклеотиди конкурують за додавання до зростаючого ланцюгу. На підставі послідовності матриці вбудовується винятково один нуклеотид. Після додавання кожного нуклеотиду кластер збуджують джерелом світла, та випромінюється характерний флуоресцентний сигнал. Кількість циклів визначає довжину ріду. Довжина хвилі випромінювання та інтенсивність сигналу визначають основний відгук Для даного кластера всі ідентичні ланцюги прочитуються одночасно. Сотні мільйонів кластерів секвенують широкомасштабним паралельним способом.
Після завершення першого ріду прочитаний продукт змивають.
І00395| На наступному етапі протоколів, що включають два індексні праймери, праймер індекс 1 вводять та гібридизують з областю індекс 1 на матриці. Індексні області забезпечують ідентифікацію фрагментів, які є підходящими для демультиплексування зразків у процесі мультиплексного секвенування. Рід індекс 1 одержують аналогічно першому ріду. Після завершення ріду індекс 1 прочитаний продукт змивають, та з 3'-кінця ланцюгу знімають захист.
Потім ланцюг матриці згортається та зв'язується із другим олігонуклеотидом на проточній комірці. Послідовність індекс 2 прочитують тим же способом, що і індекс 1. Потім прочитаний продукт індекс 2 змивають після завершення етапу.
І00396| Після прочитування двох індексів починають рід 2 за допомогою застосування полімераз для подовження олігонуклеотидами другої проточної комірки з утворенням дволанцюгового містка. Дану дволанцюгову ДНК денатурують, та 3'-кінець блокують. Вихідний прямий ланцюг відщеплюють та змивають, залишаючи зворотний ланцюг. Рід 2 починають із введення праймера секвенування ріду 2. Як і у випадку ріду 1, етапи секвенування повторюють до досягнення бажаної довжини. Продукт ріду 2 змивають. Увесь даний процес дозволяє одержати мільйони рідів, які представляють усі фрагменти. Послідовності з бібліотек об'єднаних зразків розділяють на підставі унікальних індексів, введених у процесі одержання зразку. Для кожного зразку ріди аналогічних довжин основних відгуків локально кластеризують. Прямі та зворотні ріди мають у своєму розпорядженні пари, створюючи безперервні послідовності. Дані безперервні послідовності вирівнюють із референсним геномом для ідентифікації варіанту.
І00397| Приклад секвенування за допомогою синтезу, описаний вище, включає ріди спарених кінців, які застосовують у множині варіантів реалізації розкритих способів.
Секвенування спарених кінців включає 2 ріди із двох кінців фрагменту. Коли пари рідів картують на референсну послідовність, можна визначити відстань між парами основ між двома рідами, та потім дану відстань можна застосовувати для визначення довжини фрагментів, з яких були отримані ріди. У деяких випадках у фрагмента, розташованого у двох блоках, один з рідів парних кінців буде вирівняно з одним блоком, а інший - із прилеглим блоком. Це відбувається рідше у міру того як блоки стають більш довгими або ріди стають більш короткими. Для визначення приналежності даних фрагментів до блоків можна застосовувати різні способи.
Наприклад, фрагменти можна вилучити при визначенні частоти розміру фрагменту блоку; можна обчислити для обох із прилеглих блоків; можна віднести до блоку, який охоплює більшу кількість пар основ, із двох блоків; або фрагменти можна віднести до обох блоків з вагою відносно частини пар основ у кожному блоці.
І00398) У рідах спарених кінців можна застосовувати вставки різних довжин (тобто різний розмір фрагменту, секвенування якого проводять). У якості значення за замовчуванням у даному винаході застосовують ріди спарених кінців для позначення рідів, отриманих від різних довжин вставок. У деяких випадках, щоб розрізнити ріди спарених кінців короткої вставки від рідів спарених кінців довгої вставки, останню також називають рідами сполученої пари. Згідно з деякими варіантами реалізації, що включають ріди сполученої пари, спочатку до двох кінців відносно довгої вставки (наприклад, декілька т.о.) приєднують два сполучні адаптери на основі біотину. Після цього сполучні адаптери на основі біотину з'єднують із двома кінцями вставки з утворенням циркуляризованої молекули. Потім можна одержати субфрагмент, що містить сполучні адаптери на основі біотину, за допомогою наступної фрагментації циркуляризованої молекули. Після цього можна секвенувати субфрагмент, що містить два кінці вихідного фрагменту у протилежному порядку послідовності, за допомогою тієї ж процедури, що і для секвенування спарених кінців короткої вставки, описаної вище. Додаткові подробиці секвенування сполученої пари із застосуванням платформи Питіпа представлені у онлайн- публікації за наступною електронною адресою, яка повністю включена у даний документ за допомогою посилання: геб|ДНШитіпа| |сот/доситепів/ргодисізЛесппоїезЛесппоїе пехіега таїераїг даїа ргосеввіпо.
Додаткову інформацію відносно секвенування спарених кінців можна знайти у патенті США Ме 7601499 та публікації патенту США Мо 2012/0,053,063, які включені у даний документ за допомогою посилання по відношенню до матеріалів про способи та апарати для секвенування бо спарених кінців.
І00399| Після секвенування фрагментів ДНК ріди послідовності заздалегідь визначеної довжини, наприклад, 100 п.о., картують або вирівнюють із відомим референсним геномом.
Картовані або вирівняні ріди та їх відповідні розташування на референсній послідовності також називають мітками. Відповідно до одного варіанту реалізації послідовність референсного геному являє собою послідовність МСВІЗ6/п918, яка доступна у мережі Інтернет за адресою: депоте дої исес дої еди/сді-біпЛлдсаїеулау?огд-Нитапаав-поа1885озій-166260105). У якості альтернативи, послідовність референсного геному являє собою СКСПЗ37/п919, яка доступна у мережі Інтернет за адресою: депоте йдої цис5с йдої еди/сді-біп/плдСагеумау. Інші джерела загальнодоступної інформації про послідовність включають СепВапк, ЗБЕ5Т, 0575, ЕМВІ. (Енгореап Моїесшаг Віоіоду ІГарогаїогу, Європейська лабораторія молекулярної біології) та рову (ОМА БОаїарапк ої дарап, База даних ДНК Японії). Для вирівнювання послідовностей доступна безліч комп'ютерних алгоритмів, включаючи, без обмеження, ВІ АБТ (Айвбспиі еї аї., 1990), ВІІ/Т2 (МеРвегси) (СіштоскК й СоПпб5, 1993), ЕАБТА (Регзоп 8 Ііртап, 1988), ВОМ/ТІЕ (апдтеадй еї аїІ., бепоте Віоіоду 10:825.1-К25.10 (20091) або ЕГАМО (Питіпа, Іпс., Сан-Дієго,
Каліфорнія, США). Відповідно до одного варіанту реалізації один кінець клонально подовжених копій молекул вцДНК плазми секвенують та процесують за допомогою аналізу біоінформатичного вирівнювання для геномного аналізатору Сепоте Апаїугег Шитіпа, у якому використовується програмне забезпечення ЕйПісіепі Іагде-Зсаіе АїЇйдптепі ої Мисіеоііде рагарахзе5 (Ефективне великомасштабне вирівнювання нуклеотидних даних, ЕГАМО).
Ї00400| Відповідно до одного ілюстративного, але необмежуючого варіанту реалізації способи, описані у даному документі, включають одержання інформації про послідовність для нуклеїнових кислот у досліджуваному зразку, наприклад, вцДНК у материнському зразку, видНК або клітинної ДНК у суб'єкта, скринінг якого проводять відносно раку, і т.п., із застосуванням методу одномолекулярного секвенування на основі технології дійсного одномолекулярного секвенування (Тгие 5іпдіеє Моїесше 5едшпепсіпод, 5М5) компанії Неїїсо5 (наприклад, як описано у публікації Наїгті5 Т.О. еї аїЇ., Зсіепсе 320:106-109 |20081Ї). У методиках ІЗМ5 зразок ДНК розщеплюють на ланцюзі довжиною приблизно від 100 до 200 нуклеотидів, та до 3'-кінця кожного ланцюгу ДНК додають послідовність роїуА. Кожен ланцюг мітять за допомогою додавання флуоресцентно міченого нуклеотиду аденозину. Потім ланцюги ДНК гібридизують із проточною коміркою, що містить мільйони захоплюючих сайтів олігонуклеотид-Т, які імобілізують на поверхні проточної комірки. Згідно з певними варіантами реалізації матриці можуть характеризуватися щільністю приблизно 100 мільйонів матриць/см?. Потім проточну комірку поміщають у прилад, наприклад, секвенатор Неїїзсоре "М, та лазер освітлює поверхню проточної комірки, дозволяючи визначити положення кожної матриці. Камера на ПЗ3З3З (приладах із зарядовим зв'язком) може картувати положення матриць на поверхні проточної комірки. Потім флуоресцентну мітку матриці відщеплюють та змивають. Реакцію секвенування починають за допомогою введення ДНК-полімерази та флуоресцентно міченого нуклеотиду. Нуклеїнова кислота олігонуклеотид-Т виступає як праймер. Полімераза вбудовує мічені нуклеотиди до праймеру керованим матрицею способом. Полімеразу та невбудовані нуклеотиди видаляють.
Матриці, які направляли вбудовування флуоресцентно міченого нуклеотиду, розпізнають за допомогою візуалізації поверхні проточної комірки. Після візуалізації на етапі відщіплення видаляють флуоресцентну мітку, та процес повторюють із іншими флуоресцентно міченими нуклеотидами до досягнення бажаної довжини ріду. Інформацію про послідовність збирають для кожного етапу додавання нуклеотиду. При секвенуванні цілого геному за допомогою технологій одномолекулярного секвенування виключають або, як правило, уникають ампліфікації на основі ПЛР при одержанні бібліотек секвенування, та способи дозволяють проводити пряме вимірювання зразку замість вимірювання копій даного зразку.
І00401| Відповідно до іншого ілюстративного, але необмежуючого варіанту реалізації способи, описані у даному документі, включають одержання інформації про послідовність для нуклеїнових кислот у досліджуваному зразку, наприклад, вуДНК у материнському досліджуваному зразку, вцДНК або клітинної ДНК у суб'єкта, скринінг якого проводять відносно раку, і т.п., із застосуванням секвенування 454 (Коспе) (наприклад, як описано у публікації
Магоцшііев5, М. еї аЇ. Майте 437:376-380 (20051). Секвенування 454, як правило, включає два етапи. На першому етапі ДНК розрізають на фрагменти довжиною приблизно 300 - 800 пар основ, причому фрагменти містять тупі кінці. Потім олігонуклеотидні адаптери лігують з кінцями фрагментів. Адаптери виступають у якості праймерів для ампліфікації та секвенування фрагментів. Фрагменти можна приєднати до бусин, що захоплюють ДНК, наприклад, бусин, покритих стрептавідином, із застосуванням, наприклад, Адаптера В, який містить 5'-біотинову мітку. Фрагменти, приєднані до бусин, ПЛР-ампліфікують у краплях емульсії "масло у воді". бо Результат являє собою множину копій клонально ампліфікованих фрагментів ДНК на кожній бусині. На другому етапі бусини захоплюють у лунки (наприклад, лунки піколітрового об'єму).
Піросеквенування здійснюють на кожному фрагменті ДНК паралельно. Додавання одного або більше нуклеотидів дозволяє одержати світловий сигнал, який записує камера на ПЗ33 у приладі для секвенування. Сила сигналу пропорційна кількості вбудованих нуклеотидів. При піросеквенуванні застосовують пірофосфат (РРі), який вивільняється після додавання нуклеотиду. РРі перетворюється у АТФ під дією АТФ-сульфурилази у випадку присутності аденозин-5'і-фосфосульфату. Люцифераза використовує АТФ для перетворення люциферину у оксилюциферин, та дана реакція дозволяє одержати світло, яке вимірюють та аналізують.
І00402| Відповідно до іншого ілюстративного, але необмежуючого варіанту реалізації способи, описані у даному документі, включають одержання інформації про послідовність для нуклеїнових кислот у досліджуваному зразку, наприклад, вуДНК у материнському досліджуваному зразку, вцДНК або клітинної ДНК у суб'єкта, скринінг якого проводять відносно раку, і т.п., із застосуванням технології ЗОМ (Арріїєй Віозузіет5). У секвенуванні за допомогою лігування ЗОГіЮО7М геномну ДНК розрізають на фрагменти, та до 5'- та 3'-кінців фрагментів приєднують адаптери для одержання бібліотеки фрагментів. У якості альтернативи, внутрішні адаптери можна ввести за допомогою лігування адаптерів з 5- та 3-кінцями фрагментів, циркуляризації фрагментів, розщеплення циркуляризованого фрагменту для одержання внутрішнього адаптеру та приєднання адаптерів до 5- та 3-кінців отриманих у результаті фрагментів для одержання бібліотеки сполученої пари. Потім у мікрореакторах, що містять бусини, праймери, матрицю та компоненту ПЛР, одержують популяції клональних бусин. Після проведення ПЛР матриці денатурують, та бусини збагачують окремими бусинами з подовженими матрицями. Матриці на обраних бусинах піддають 3'-модифікації, яка забезпечує утворення зв'язків зі скляною пластинкою. Послідовність можна визначити за допомогою наступної гібридизації та лігування частково випадкових олігонуклеотидів із центральною певною основою (або парою основ), які ідентифікують за допомогою специфічного флуорофору.
Після реєстрації кольору лігований олігонуклеотид відщеплюють та видаляють, а потім повторюють процес.
Ї00403| Відповідно до іншого ілюстративного, але необмежуючого варіанту реалізації способи, описані у даному документі, включають одержання інформації про послідовність для нуклеїнових кислот у досліджуваному зразку, наприклад, вуДНК у материнському досліджуваному зразку, вцДНК або клітинної ДНК у суб'єкта, скринінг якого проводять відносно раку, і т.п., із застосуванням технології одномолекулярного секвенування у режимі реального часу (зіпдіе тоїесшіе, геаІ--те, ЗМК М) від компанії Расіїс Віозсіепсе5. У секвенуванні ЗХМКТ безперервне вбудовування мічених барвником нуклеотидів візуалізують протягом синтезу ДНК.
Одно-ДНК-полімеразні молекули приєднують до дна поверхні окремих детекторів довжини хвилі нуль-режиму (2ММУ, 2его-тоде уамеїІепдій), які одержують інформацію про послідовність, коли фосфозв'язані нуклеотиди вбудовуються у зростаючий ланцюг праймеру. Детектор 2МУМ містить розмежовані структури, які дозволяють проводити спостереження за вбудовуванням окремого нуклеотиду ДНК-полімеразою у порівнянні із фоном флуоресцентних нуклеотидів, які швидко дифундують у 2ММУМ та з нього (наприклад, за мікросекунди). Як правило, для вбудовування нуклеотиду у зростаючий ланцюг потрібно декілька мілісекунд. Протягом даного часу флуоресцентна мітка збуджується та утворює флуоресцентний сигнал, та флуоресцентну мітку відщдеплюють. Вимірювання відповідної флуоресценції барвнику вказує на те, яка основа була вбудована. Процес повторюють із одержанням послідовності.
І00404| Відповідно до іншого ілюстративного, але необмежуючого варіанту реалізації способи, описані у даному документі, включають одержання інформації про послідовність для нуклеїнових кислот у досліджуваному зразку, наприклад, вуДНК у материнському досліджуваному зразку, вцДНК або клітинної ДНК у суб'єкта, скринінг якого проводять відносно раку, і т.п., із застосуванням нанопорового секвенування (наприклад, як описано у публікації бБопі ЯМ апа Мейег А. Сіп Спет 53: 1996-2001 (2007Ї). Методики аналізу нанопорового секвенування ДНК розроблені багатьма компаніями, включаючи, наприклад, Охіога Мапороге
ТесппоЇодіе5 (Оксфорд, Великобританія), Зедоепот, МАВзуз та т.п. Нанопорове секвенування являє собою технологію одномолекулярного секвенування, за допомогою якої одну молекулу
ДНК секвенують прямо у міру того як вона проходить через нанопору. Нанопора являє собою невеликий отвір, як правило, порядку 1 нанометру у діаметрі. Занурення нанопори у проводильну рідину та накладення на неї потенціалу (напруги) приводить до появи невеликого електричного струму завдяки провідності іонів через нанопору. Кількість струму, яка протікає, чутлива до розміру та форми нанопори. У міру того як молекула ДНК проходить через нанопору, кожен нуклеотид на молекулі ДНК у різному ступені перегороджує нанопору, у бо різному ступені змінюючи магнітуду струму через нанопору. Таким чином, дана зміна струму у міру того як молекула ДНК проходить через нанопору забезпечує прочитування послідовності
ДНК.
ІЇ00405| Відповідно до іншого ілюстративного, але необмежуючого варіанту реалізації способи, описані у даному документі, включають одержання інформації про послідовність для нуклеїнових кислот у досліджуваному зразку, наприклад, вуДНК у материнському досліджуваному зразку, вцДНК або клітинної ДНК у суб'єкта, скринінг якого проводять відносно раку, і т.п., із застосуванням матриці хімічно--утливого польового транзистору (спетісаї|- зепзйіме Пед епесі їгапвізіог, спетЕЕТ) (наприклад, як описано у публікації заявки на патент
США Мо 2009/0026082). У одному прикладі даної методики молекули ДНК можна помістити у реакційні камери, та молекули матриці можна гібридизувати із праймером секвенування, пов'язаним з полімеразою. Вбудовування одного або більше трифосфатів у новий ланцюг нуклеїнової кислоти на 3-кінці праймеру секвенування можна виявити за допомогою спетЕЕТтТ як зміну струму. Матриця може містити безліч сенсорів спетЕЕТ. У іншому прикладі окремі нуклеїнові кислоти можна приєднати до бусин, та нуклеїнові кислоти можна ампліфікувати на бусині, та окремі бусини можна перенести у окремі реакційні камери на матриці спетЕЕТ, причому кожна камера містить сенсор спетЕЕТ, та можна секвенувати нуклеїнові кислоти. (00406) Згідно з іншим варіантом реалізації даний спосіб включає одержання інформації про послідовність для нуклеїнових кислот у досліджуваному зразку, наприклад, вуДНК у материнському досліджуваному зразку, із застосуванням способу трансмісійної електронної мікроскопії (ТЕМ). Спосіб, що називають швидким нанопереносом положення окремої молекули (Іпдімідца! Моїесше Ріасетепі Карій Мапо Тгапв5їег, ІМРАКМТ), включає візуалізацію із застосуванням трансмісійного електронного мікроскопу з одноатомним розділенням високомолекулярної (150 т.о. або більше) ДНК, селективно міченої маркерами важких металів, та впорядковування даних молекул на ультратонких плівках у надщільних (відстань від ланцюга до ланцюга З нм) паралельних матрицях з послідовним розташуванням від основи до основи.
Для візуалізації молекул на плівках з метою визначення положення маркерів важких атомів та одержання інформації про послідовність основ із ДНК застосовують електронний мікроскоп.
Спосіб додатково описаний у публікації патенту РСТ УМО 2009/046445. Спосіб дозволяє секвенувати повні гени людини менше ніж за десять хвилин.
ІЇ00407| Згідно з іншим варіантом реалізації технологія секвенування ДНК являє собою одномолекулярне секвенування оп Тоггепі, яке поєднує напівпровідникову технологію із простою хімією секвенування, щоб прямо транслювати закодовану хімічним способом інформацію (А, С, с, Т) у цифрову інформацію (0, 1) на напівпровідниковому чипі. У природі, коли нуклеотид вбудовується полімеразою у ланцюг ДНК, у якості побічного продукту вивільняється іон водню. У технології оп Тоїтепі для здійснення даного біохімічного процесу широкомасштабним паралельним способом застосовують матрицю мікрооброблених лунок високої щільності. Кожна лунка містить відмінну молекулу ДНК. Нижче лунок розташований іон- чутливий шар, а нижче його - іонний сенсор. Коли до матриці ДНК додають нуклеотид, наприклад, С, а потім нуклеотид вбудовується у ланцюг ДНК, вивільняється іон водню. Заряд даного іону змінить рН розчину, що може виявити іонний сенсор оп Тоїітепі. Секвенатор - по суті, найменший у світу твердофазний рН-метр - називає основу, переходячи безпосередньо від хімічної інформації до цифрової інформації. Потім секвенатор оп регзопа! Сепоте Маспіпе (РОМ'"М) послідовно заливає чип нуклеотидами один за іншим. Якщо наступний нуклеотид, який заливають на чип, не відповідає, не буде зафіксовано якої-небудь зміни напруги, та яка-небудь основа не буде визначена. Якщо на ланцюзі ДНК присутні дві ідентичні основи, напруга збільшиться вдвічі, та чип зафіксує визначення двох ідентичних основ. Пряме виявлення дозволяє реєструвати вбудовування нуклеотиду протягом секунд. (00408) Згідно з іншим варіантом реалізації даний спосіб включає одержання інформації про послідовність для нуклеїнових кислот у досліджуваному зразку, наприклад, вИиДНК у материнському досліджуваному зразку, із застосуванням секвенування за допомогою гібридизації. Секвенування за допомогою гібридизації включає здійснення контакту множини полінуклеотидних послідовностей з множиною полінуклеотидних зондів, причому кожен з множини полінуклеотидних зондів може бути необов'язково приєднаний до субстрату. Субстрат може являти собою плоску поверхню, що містить матрицю відомих нуклеотидних послідовностей. Характер гібридизації з матрицею можна використовувати для визначення полінуклеотидних послідовностей, що присутні у зразку. Згідно з іншими варіантами реалізації кожен зонд приєднаний до бусини, наприклад, магнітної бусини або т.п. Гібридизацію до бусин можна визначити та використовувати для ідентифікації множини полінуклеотидних послідовностей у зразку. бо Ї00409| Згідно з деякими варіантами реалізації способів, описаних у даному документі,
картовані мітки послідовності містять ріди послідовності довжиною приблизно 20 п.о., приблизно 25 п.о., приблизно 30 п.о., приблизно 35п.0о., приблизно 40 п.о., приблизно 45 п.о., приблизно 50 п.о., приблизно 55 п.о., приблизно 60 п.о., приблизно 65 п.о., приблизно 70 п.о., приблизно 75 п.о., приблизно 80 п.о., приблизно 85 п.о., приблизно 90 п.о., приблизно 95 п.о., приблизно 100 п.о., приблизно 110 п.о., приблизно 120 п.о., приблизно 130, приблизно 140 п.о., приблизно 150 п.о., приблизно 200 п.о., приблизно 250 п.о., приблизно 300 п.о., приблизно 350 п.о., приблизно 400 п.о., приблизно 450 п.о. або приблизно 500 п.о. Очікують, що технологічні переваги зроблять можливими ріди одиночних кінців довжиною більше 500 п.о., що зробить можливими ріди довжиною більше приблизно 1000 п.о. при одержанні рідів спарених кінців.
Відповідно до одного варіанту реалізації картовані мітки послідовності містять послідовності рідів, які становлять 36 п.о. Картування міток послідовності досягають за допомогою порівняння послідовності мітки з послідовністю референсу для визначення хромосомного походження молекули секвенованої нуклеїнової кислоти (наприклад, вуДНК), та конкретна генетична інформація про послідовність не є необхідною. Можна допустити невеликий ступінь невідповідності (0 - 2 розбіжності на мітку послідовності), яка припадає на мінімальні поліморфізми, які можуть існувати між референсним геномом та геномами у змішаному зразку. 00410) На зразок, як правило, одержують багато міток послідовності. Згідно з деякими варіантами реалізації з картування рідів з референсним геномом одержують щонайменше приблизно 3х105 міток послідовності, щонайменше приблизно 5х109 міток послідовності, щонайменше приблизно 8х1095 міток послідовності, щонайменше приблизно 10х105 міток послідовності, щонайменше приблизно 15х109 міток послідовності, щонайменше приблизно 20х105 міток послідовності, щонайменше приблизно 30х105 міток послідовності, щонайменше приблизно 40х102 міток послідовності або щонайменше приблизно 50х1059 міток послідовності, що містять ріди довжиною від 20 до 40 п.о., наприклад, 36 п.о., на зразок. Відповідно до одного варіанту реалізації всі ріди послідовності картують на всі області референсного геному.
Відповідно до одного варіанту реалізації підраховують мітки, які були картовані на всі області, наприклад, усі хромосоми, референсного геному, та визначають ВЧК, тобто надмірну або недостатню представленість послідовності, що представляє інтерес, наприклад, хромосоми або її частини, у змішаному зразку ДНК. Способу не потрібне встановлення відмінностей між двома
Зо геномами. 00411) Точність, необхідна для правильного визначення того, є присутнім або відсутнім
ВЧК, наприклад, анеуплоїдія, у зразку, грунтується на варіації кількості міток послідовності, які картуються на референсний геном, серед зразків у межах серії секвенування (внутрішньохромосомна варіабельність) та варіації кількості міток послідовності, які картуються на референсний геном, у різних серіях секвенування (варіабельність між секвенуваннями).
Наприклад, варіації можуть бути особливо яскраво вираженими для міток, які картуються на сС-збагачені або СС-збіднені референсні послідовності. Інші варіації можуть бути наслідком застосування різних протоколів для екстракції та очищення нуклеїнових кислот, одержання бібліотек секвенування та застосування різних платформ секвенування. У даному способі застосовують дози послідовностей (дози хромосоми або дози сегмента) на підставі знання нормуючих послідовностей (послідовностей нормуючої хромосоми або послідовностей нормуючого сегмента), щоб у дійсності врахувати накопичену варіабельність, яка є наслідком міжхромосомної варіабельності (у одній серії визначень) та варіабельності між секвенуваннями (у декількох серіях визначень) та залежної від платформи варіабельності. Дози хромосом основані на знанні послідовності нормуючої хромосоми, яка може складатися з однієї хромосоми або двох або більше хромосом, вибраних із хромосом 1 - 22, Х та У. У якості альтернативи, послідовності нормуючої хромосоми можуть складатися з одного сегменту хромосоми або двох або більше сегментів однієї хромосоми або двох або більше хромосом.
Дози сегмента основані на знанні послідовності нормуючого сегменту, яка може складатися з одного сегменту будь-якої однієї хромосоми або двох або більше сегментів будь-яких двох або більше із хромосом 1 - 22, Х та У.
ВЧК та пренатальна діагностика
І00412| Безклітинну ДНК та РНК плода, що циркулює у материнській крові, можна застосовувати для ранньої неінвазивної пренатальної діагностики (НПД) зростаючої кількості генетичних станів як для ведення вагітності, так і для сприяння прийняттю рішень у області репродукції. Про присутність безклітинної ДНК, що циркулює у судинному руслі, стало відомо більше 50 років тому. Зовсім недавно у материнському судинному руслі протягом вагітності була виявлена присутність невеликих кількостей циркулюючої ДНК плода (Го еї аї., І апсеї 350:485-487 |1997|). Було показано, що безклітинна ДНК плода (вцДНК), як вважають, що бо походить з плацентарних клітин, що гинуть, складається з коротких фрагментів, як правило,
менше 200 п.о. у довжину (Спап еї аї., Сіп Спет 50:88-92 (20041), які можна виявити ще на 4 тижні гестації (Шапез еї аІ., Еапу Нитап Оем 83:563-566 20071) та які встановлено виводяться з материнського судинного русла протягом годин після появи (Го еї аЇ., Ат у) Нит Сепеї 64:218- 224 (19991). На додаток до вцДНК, у материнському судинному руслі також можна розпізнати фрагменти безклітинної РНК плода (СІКМА), отримані з генів, які транскрибуються у плоді або плаценті. Екстракція та наступний аналіз даних генетичних елементів плода з материнського зразку крові надає нові можливості для НПД.
І00413)| Даний спосіб являє собою незалежний від поліморфізму спосіб, який призначений для застосування у НПД та для якого не потрібно встановлення відмінностей в6цДНК плода від материнської вцДНК, що уможливлює визначення анеуплоїдії плода. Згідно з деякими варіантами реалізації анеуплоїдія являє собою повну трисомію або моносомію хромосоми або часткову трисомію або моносомію. Часткові анеуплоїдії викликані втратою або набуттям частини хромосоми та включають хромосомний дисбаланс, який є наслідком незбалансованої транслокації, незбалансованих інверсій, делецій та інсерцій. Безумовно, найпоширеніша відома анеуплоїдія, сумісна з життям, являє собою трисомію 21, тобто синдром Дауна (СД), викликаний присутністю частини або всієї хромосоми 21. Рідко СД може бути викликаний уродженим або спорадичним дефектом, у результаті якого до іншої хромосоми (звичайно хромосоми 14) приєднується додаткова копія всієї або частини хромосоми 21 з утворенням однієї аберантної хромосоми. СД пов'язаний з розумовим розладом, серйозними утрудненнями у навчанні та підвищеною смертністю, викликаною тривалими розладами стану здоров'я, такими як захворювання серця. Інші анеуплоїдії з відомою клінічною значимістю включають синдром
Едвардса («трисомію 18) та синдром Патау (трисомію 13), які часто є смертельними протягом перших декількох місяців життя. Аномалії, пов'язані з кількостями статевих хромосом, також відомі та включають моносомію Х, наприклад, синдром Тернера (ХО) та синдром потрійний Х (ХХХ) у немовлят жіночої статі та синдром Клайнфельтера (ХХУ) та синдром ХУУ у немовлят чоловічої статі, усі з яких пов'язані з різними фенотипами, включаючи безпліддя та зниження інтелектуальних здатностей. Моносомія Х І|45, Х) є частою причиною ранньої втрати вагітності, на яку доводиться приблизно 7 95 самовільних абортів. На підставі частоти живонароджених з 45,Х (також називається синдромом Тернера) 1 - 2/10000, згідно з оцінками, менше 1 95 запліднених яйцеклітин 45,Х виживуть до терміну. Приблизно 30 95 пацієнтів із синдромом
Тернера являють собою мозаїки з лінією клітин 45,Х та лінією клітин 46,ХХ або однією лінією клітин, що містить реорганізовану Х-хромосому (НооК апа Муагригоп 1983). Фенотип у живонароджених дітей є відносно помірним, враховуючи високу смертність плодів, та було висловлене припущення, що, можливо, усі живонароджені діти жіночої статі із синдромом
Тернера несуть лінію клітин, що містять дві статеві хромосоми. Моносомія Х може виникнути у суб'єктів жіночої статі у вигляді 45,Х або у вигляді 45,Х/46ХХ, та у суб'єктів чоловічої статі - у вигляді 45,Х/46ХУ. Аутосомні моносомії у людини, як правило, вважають несумісними з життям; однак існує досить багато цитогенетичних повідомлень, у яких описана повна моносомія однієї хромосоми 21 у живонароджених дітей (Мозгапома І|еї аІ., Моїесшаг Суодеп. 1:13 (20081; дооіеп ей аїЇ., Ргепаїаї Оіади. 17:271-5 (1997). Спосіб, описаний у даному документі, можна застосовувати для діагностики даних та інших аномалій хромосом пренатальним способом. (00414) Згідно з деякими варіантами реалізації способи, розкриті у даному документі, можуть визначити присутність або відсутність трисомій хромосом будь-якої однієї із хромосом 1 - 22, Х та У. Приклади трисомій хромосом, які можна виявити згідно із даним способом, включають, без обмеження, трисомію 21 (121; синдром Дауна), трисомію 18 (Т18; синдром Едвардса), трисомію 16 (116), трисомію 20 (120), трисомію 22 (122; синдром котячого ока), трисомію 15 (Т15; синдром Прадера-Віллі), трисомію 13 (Т13; синдром Патау), трисомію 8 (Т8; синдром Варкані), трисомію 9 та ХХУ (синдром Клайнфельтера), трисомію ХУУ або ХХХ. Повні трисомії інших аутосом, що існують у немозаїчному стані, є смертельними, але можуть бути сумісні з життям, коли присутні у мозаїчному стані. Слід приймати до уваги, що різні повні трисомії, будь то існуючі у мозаїчному або немозаїчному стані, та часткові трисомії можна визначити у виДНК плода відповідно до ідей, представлених у даному документі. 00415) Необмежуючі приклади часткових трисомій, які можна визначити даним способом, включають, без обмеження, часткову трисомію 1432-44, трисомію 9р, трисомію 4 з мозаїцизмом, трисомію 17р, часткову трисомію 4д26-діег, часткову трисомію 2р, часткову трисомію 14 та/або часткову трисомію бр/моносомію ба. 00416) Способи, розкриті у даному документі, також можна застосовувати для визначення моносомії хромосоми Х, моносомії хромосоми 21 та часткової моносомії, такої як моносомія 13, моносомія 15, моносомія 16, моносомія 21 та моносомія 22, які встановлено пов'язані з бо викиднем при вагітності. Часткову моносомію хромосом, яка, як правило, причетна до повної анеуплоїдії, можна також визначити за способом, описаним у даному документі. Необмежуючі приклади синдромів делеції, які можна визначити згідно із даним способом, включають синдроми, викликані частковими делеціями хромосом. Приклади часткових делецій, які можна визначити згідно зі способами, описаними у даному документі, включають, без обмеження, часткові делеції хромосом 1, 4, 5, 7, 11, 18, 15, 13, 17, 22 та 10, які описані нижче.
І00417| Синдром делеції 1421.1 або мікроделеції 1421.1 (рецидивуючий) являє собою рідку аберацію хромосоми 1. Разом із синдромом делеції, існує також синдром дуплікації 1421.1.
Хоча існує частина ДНК, що не містить синдром делеції у конкретній точці, існує дві або три копії аналогічної частини ДНК у тій же точці із синдромом дуплікації.
Джерела інформації відносять як делецію, так і дуплікацію до варіацій числа копій (ВЧК) 1421.1. Делеція 1421.1 може бути пов'язана із синдромом ТАК (Тпготросуїорепіа у/їй Абзепі гадіих5, тромбоцитопенія з відсутністю променевої кістки).
ІЇ00418| Синдром Вольфа-Хиршхорна (УМо-Ніг5сппогп 5упаготе, УУН5) (ОМІМ (Опіїпе
Мепаеїіап Іпрепіапсе іп Мап, онлайн-каталог фенетичних маркерів у людини) Ме194190) являє собою синдром суцільної делеції гену, пов'язаний з гемізиготною делецією хромосоми 4р16.3.
Синдром Вольфа-Хиршхорна являє собою синдром вродженої вади розвитку, який характеризується пре- та постнатальною недостатністю росту, розладом розвитку різного ступеню важкості, характерними черепно-мозковими рисами (зовнішній вигляд носа по типу "шолома грецького воїна", високе чоло, виразна глабела, гіпертелоризм, високі дугоподібні брови, опуклі очі, епікантальні складки, короткий підносовий жолобок, чітко обкреслений рот з опущеними вниз куточками та мікрогнатія) та епілепсією.
І00419| Часткова делеція хромосоми 5, також відома як 5р- або 5р мінус та названа синдромом Стгіз ди Спаї (ОМІММе 123450), викликана делецією короткого плеча (р-плеча) хромосоми 5 (5р15.3-р15.2). У дітей з даним станом часто спостерігається пронизливий крик, який часто схожий на лемент кішки. Розлад характеризується розумовою відсталістю та затримкою розвитку, невеликим розміром голови (мікроцефалія), низькою масою тіла при народженні та слабким тонусом м'язів (гіпотонія) у дитячому віці, характерними рисами обличчя та, можливо, вадами серця. 00420) Синдром Уільямса-Бойрена, також відомий як синдром делеції хромосоми 7411.23 (ОМІМ 194050), являє собою синдром суцільної делеції гену, який приводить до мультисистемного розладу, викликаного гемізиготною делецією розміром від 1,5 до 1,8 Мб на хромосомі 7411.23, яка містить приблизно 28 генів.
ІЇ00421| Синдром Якобсена, також відомий як розлад, викликаний делецією 114, являє собою рідкий вроджений порок розвитку, який є наслідком делеції кінцевої області хромосоми 11, що містить смугу 11424.1. Даний синдром може викликати розумову відсталість, характерні риси обличчя та множину фізичних розладів, включаючи вади серця та розлад згортання крові. 00422) Часткова моносомія хромосоми 18, відома як моносомія 18р, являє собою рідкісний хромосомний розлад, при якому уся хромосома 18 або частина її короткого плеча (р) делетовані (моносомічний). Розлад, як правило, характеризується низьким ростом, різним ступенем затримки розумового розвитку, затримкою розвитку мовлення, вродженими вадами черепа та області обличчя (черепно-лицьової області) та/"або додатковими фізичними аномаліями.
Зв'язані черепно-лицьові дефекти можуть у значній мірі варіювати час від часу по діапазону та важкості. 00423) Стани, викликані змінами структури або кількості копій хромосоми 15, включають синдром Ейнджелмена та синдром Прадера-Віллі, які включають втрату активності гена у одній і тій же частині хромосоми 15, області 15411-413. Слід приймати до уваги, що у батька-носія декількох транслокацій та мікроделецій можуть бути безсимптомними, та при цьому вони можуть викликати значне генетичне захворювання у потомства. Наприклад, здорова мати, яка несе мікроделецію 15411-д413, може народити дитину із синдромом Ейнджелмена, важким нейродегенеративним розладом. Таким чином, способи, апарати та системи, описані у даному документі, можна застосовувати для ідентифікації такої часткової делеції та інших делецій у плода. (00424) Часткова моносомія 134 являє собою рідкісний хромосомний розлад, який виникає, коли втрачається частина довгого плеча (4) хромосоми 13 (моносомічний). Діти, народжені із частковою моносомією 134, можуть демонструвати низьку масу тіла при народженні, вроджені вади голови та обличчя (черепно-лицьової області), аномалії скелета (особливо, рук та стоп) та інші фізичні аномалії. Для даного стану характерні затримки розумового розвитку. Серед індивідуумів, народжених з даним розладом, високий рівень смертності у дитинстві. Практично всі випадки часткової моносомії 134 виникають випадковим чином з незрозумілих причин бо (спорадично).
ІЇ00425| Синдром Сміта-Магеніса (Зтйй-Мадепіє в5упдготе, 5М5 - ОМІМ Ме182290) викликаний делецією або втратою генетичного матеріалу на одній копії хромосоми 17. Даний добре відомий синдром пов'язаний із затримкою у розвитку, затримкою розумового розвитку, вродженої вади розвитку, такими як вада серця та нирок, та нейроповедінковими аномаліями, такими як важкі порушення сну та самотравмуюча поведінка. Синдром Сміта-Магеніса (5М5) у більшості випадків (90 95) викликаний внутрішньою делецією розміром 3,7 Мб у хромосомі 17р11.2.
ІЇ00426| Синдром делеції 22411.2, також відомий як синдром Ди Георге, являє собою синдром, викликаний делецією невеликого фрагменту хромосоми 22. Делеція (22 а11.2) виникає біля середини хромосоми на довгому плечі однієї з пари хромосом. Ознаки даного синдрому широко варіюються навіть серед членів однієї родини та торкаються багато частин тіла. Характерні риси та симптоми можуть включати вроджені вади розвитку, такі як вроджені захворювання серця, патології піднебіння, найбільш часто, у відношенні нейром'язових порушень змикання (піднебінно-глоткова недостатність), порушення навчання, незначні відмінності рис обличчя та рецидивуючі інфекції. Мікроделеції у хромосомній області 22411.2 пов'язані з у 20 - 30 разів збільшеним ризиком шизофренії.
І00427| Делеції у короткому плечі хромосоми 10 пов'язані з фенотипом, подібним синдрому
Ди Георге. Часткова моносомія хромосоми 10р є рідкою, але властивою частині пацієнтів, у яких спостерігалися риси синдрому Ди Георге. (00428) Відповідно до одного варіанту реалізації способи, апарати та системи, описані у даному документі, застосовують для визначення часткової моносомії, включаючи, без обмеження, часткову моносомію хромосом 1, 4, 5, 7,11, 18, 15, 13, 17, 22 та 10, наприклад, часткову моносомію 1421.11, часткову моносомію 4р16б.3, часткову моносомію 5р15.3-р15.2, часткову моносомію 7411.23, часткову моносомію 11424.1, часткову моносомію 18р, часткову моносомію хромосоми 15 (15411-д13), часткову моносомію 13д, часткову моносомію 17р11.2, часткову моносомію хромосоми 22 (22411.2), та часткову моносомію 1О0р також можна визначити із застосуванням даного способу. 004291) Інші часткові моносомії, які можна визначити згідно зі способами, описаними у даному документі, включають незбалансовану транслокацію (8;11)(р23.2;р15.5); мікроделецію 11423; делецію 17р11.2; делецію 22413.3; мікроделецію Хр22.3; делецію 10р14; мікроделецію 20р, (|Іде(22)(411.2911.23)Ї, делецію 7411.23 і 7436; делецію 1рзіб; мікроделецію 2р; нейрофіброматоз типу 1 (мікроделецію 17411.2), делецію МУд; мікроделецію 4р16.3; мікроделецію 1р3і3б.2; делецію 11414; мікроделецію 19413.2; синдром Рубінштейна-Тейбі (мікроделецію 16 р13.3); мікроделецію 7р21; синдром Міллера-Дікера (17р13.3); та мікроделецію 2437. Часткові делеції можуть являти собою невелику делецію частини хромосоми або можуть являти собою мікроделеції хромосоми, коли може виникнути делеція одного гену. 004301 Було ідентифіковано декілька синдромів дуплікації, викликаних дуплікаціями частини плечей хромосоми (див. ОМІМ |Опіїпе Мепаеїїап Іппегйапсе іп Мап, онлайн-каталог фенетичних маркерів у людини, доступний онлайн за адресою: пебі.піт.піп.дом/отіті). Відповідно де одного варіанту реалізації даний спосіб можна застосовувати для визначення присутності або відсутності дуплікації талабо множення сегментів будь-якої із хромосом 1 - 22, Х та У.
Необмежуючі приклади синдромів дуплікації, які можна визначити згідно із даним способом, включають дуплікації частини хромосом 8, 15, 12 та 17, які описані нижче. 004311) Синдром дуплікації 8р23.1 являє собою рідкісний генетичний розлад, викликаний дуплікацією області хромосоми 8 людини. Даний синдром дуплікації характеризується оцінюваною поширеністю 1 на 64000 народжень та протилежний синдрому делеції 8ра23.1.
Дуплікація 8р23.1 пов'язана з різними фенотипами, включаючи один або більше фенотипів, які вибрані із затримки розвитку мовлення, затримки у розвитку, помірного дисморфізму з опуклим чолом та вигнутими бровами та вродженого захворювання серця (ВЗ3С). 00432) Синдром дуплікації хромосоми 154 (Оир154) являє собою ідентифікований клінічним способом синдром, який є наслідком дуплікації хромосоми 15411-13.1 Немовлята з Юирі5а звичайно характеризуються гіпотонією (слабким тонусом м'язів), відставанням у рості; вони можуть народитися з розщепленою губою та/або піднебінням або з вродженими вадами серця, нирок або інших органів; у них спостерігається деякий ступінь затримки розвитку когнітивних функцій/обмеження когнітивних функцій (затримки розумового розвитку), затримки розвитку мовлення та розуміння мовлення та дисфункція сенсорної інтеграції. 00433) Синдром Паллістера-Кілліана є наслідком додаткового матеріалу хромосоми Ме12.
Звичайно існує суміш клітин (мозаїцизм), деякі з яких містять додатковий матеріал Ме12, а деякі є нормальними (46 хромосом без додаткового матеріалу Ме12). Діти з даним синдромом 60 характеризуються багатьма розладами, включаючи важкі затримки розумового розвитку,
слабкий тонус м'язів, "грубі" риси обличчя та опукле чоло. У них спостерігається тенденція мати дуже тонку верхню губу з більш товстою нижньою губою та коротким носом. Інші розлади здоров'я включають епілепсію, погане засвоєння харчування, оніміння суглобів, катаракту у дорослому віці, втрату слуху та вади серця. Особи із синдромом Паллістера-Кілліана характеризуються скороченою тривалістю життя. 00434) Індивідууми з генетичним станом, позначуваним як дир(17)(р11.2р11.2) або дир 17р, несуть додаткову генетичну інформацію (відома як дуплікація) на короткому плечі хромосоми 17. Дуплікація хромосоми 17р11.2 лежить в основі синдрому Потоцкі-Лупскі (Роїоскі-І ирекКі вупаготе, РТІ 5), який являє собою нещодавно виявлений генетичний стан з винятково декількома десятками випадків, про які повідомлялося у медичній літературі. Пацієнти, у яких є присутня дана дуплікація, часто характеризуються низьким тонусом м'язів, поганим засвоєнням харчування та відсутністю збільшення у масі у дитинстві, а також характеризуються затримкою розвитку моторних та вербальних показників розвитку. Багато індивідуумів з РТІ 5 страждають від труднощів з вимовою та з обробкою лінгвістичної інформації. Крім цього, пацієнти можуть характеризуватися поведінковими характеристиками, аналогічними таким, спостережуваним у осіб з аутизмом або порушеннями аутичного спектру. Індивідууми з РТІ5 можуть характеризуватися вадами серця та апное у сні. Дуплікація великої області у хромосомі 17р12, яка містить ген РМР22, як відомо, викликає захворювання Шарко-Марі- Тута.
І00435| ВЧК пов'язана з народженням мертвого плода. Однак у зв'язку з обмеженнями, властивими загальноприйнятій цитогенетиці, внесок ВЧК у народження мертвого плода, як вважають, є недостатньо представленим (Наїті5 еї аї., РгепаїаІ ОСіадп 31:932-944 (20111). Як показано у прикладах та описано у іншому місці у даному документі, даний спосіб дозволяє визначати присутність часткових анеуплоїдій, наприклад, делецій та множень сегментів хромосоми, та даний спосіб можна застосовувати для ідентифікації та визначення присутності або відсутності ВЧК, які пов'язані з народженням мертвого плода.
Визначення ВЧК при клінічних розладах 00436) На додаток до раннього визначення вроджених вад розвитку способи, описані у даному документі, можна застосовувати для визначення будь-яких аномалій представлення генетичних послідовностей у геномі. Багато аномалій представлення генетичних послідовностей у геномі пов'язані з різними патологіями. Такі патології включають, без обмеження, рак, інфекційні та аутоїмунні захворювання, захворювання нервової системи, метаболічні та/або серцево-судинні захворювання і т.п.
І00437| Відповідно, згідно з різними варіантами реалізації передбачене застосування способів, описаних у даному документі, при діагностиці та/або моніторингу та/або лікуванні
З5 таких патологій. Наприклад, способи можна застосовувати для визначення присутності або відсутності захворювання, для контролю прогресування захворювання та/або ефективності режиму лікування, для визначення присутності або відсутності нуклеїнових кислот патогену, наприклад, вірусу; для визначення хромосомних аномалій, пов'язаних з реакцією "трансплантат проти хазяїна" (РТПХ), та для визначення причетності індивідуумів у криміналістичних аналізах.
ВЧК при раку 00438) Було показано, що ДНК плазми та сироватки крові від пацієнтів, що страждають від раку, містить кількості пухлинної ДНК, що піддаються вимірюванню, яку можна відновити та застосовувати у якості замінника джерела пухлинної ДНК, та пухлини характеризуються анеуплоїдією або невідповідними кількостями послідовностей гену або навіть цілих хромосом.
Таким чином, визначення відмінності кількості даної послідовності, тобто послідовності, що представляє інтерес, у зразку від індивідуума можна застосовувати при прогнозуванні або діагностиці медичного стану. Згідно з деякими варіантами реалізації даний спосіб можна застосовувати для визначення присутності або відсутності анеуплоїдії хромосом у пацієнта, який, як підозрюють або як відомо, страждає від раку. 004391) Згідно з деякими варіантами реалізації у даному документі запропоновані способи виявлення раку, відстеження терапевтичної відповіді та мінімального залишкового захворювання на підставі зразків циркулюючої вцДНК із застосуванням неглибокого секвенування зразків за допомогою методології спарених кінців та із застосуванням інформації про розмір фрагмента, доступної з рідів спарених кінців, для ідентифікації присутності вибірково метильованої апоптотичної ДНК із ракових клітин на фоні нормальних клітин. Було показано, що при деяких типах раку отримана з пухлини вцДНК є більш короткою, ніж вциДНК, отримана не з пухлини. Внаслідок цього спосіб на підставі розміру, описаний у даному документі, можна застосовувати для визначення ВЧК, включаючи анеуплоїдії, пов'язані з даними типами раку, який уможливлює (а) виявлення пухлини, що присутня в умовах скринінгу або діагностики; (Б) бо контроль відповіді на терапію; (с) контроль мінімального залишкового захворювання.
І00440| Згідно з певними варіантами реалізації анеуплоїдія є характерною для геному суб'єкта та приводить, як правило, до збільшеної схильності до раку. Згідно з певними варіантами реалізації анеуплоїдія є характерною для конкретних клітин (наприклад, пухлинних клітин, передпухлинних неопластичних клітин і т.д.), які є або характеризуються збільшеною схильністю до неоплазії. Конкретні анеуплоїдії пов'язані з конкретними типами раку або зі схильністю до конкретних типів раку, як описано нижче. Згідно з деякими варіантами реалізації для виявлення/контролю присутності раку економічно вигідним способом можна застосовувати підхід дуже неглибокого секвенування спарених кінців.
І00441| Відповідно, різні варіанти реалізації способів, описаних у даному документі, забезпечують визначення варіації числа копій послідовності або послідовностей, що представляють інтерес, наприклад, клінічно значимої послідовності або послідовностей, у досліджуваному зразку від суб'єкта, причому певні варіації числа копій забезпечують свідчення присутності та/або схильності до раку. Згідно з певними варіантами реалізації зразок містить суміш нуклеїнових кислот, отриманих із двох або більше типів клітин. Відповідно до одного варіанту реалізації суміш нуклеїнових кислот отримана з нормальних та ракових клітин, отриманих від суб'єкта, що страждає від медичного стану, наприклад, раку.
І00442| Розвиток раку часто супроводжується зміною кількості цілих хромосом, тобто повною анеуплоїдією хромосом, та/або зміною кількості сегментів хромосом, тобто частковою анеуплоїдією, викликаною процесом, відомим як нестабільність хромосом (НХ) (Пота еї аї).,
Змі55 Мей УУееКіу 2011:141:м/13170). Вважають, що багато солідних пухлин, такі як рак молочної залози, прогресують від виникнення до метастазування внаслідок накопичення декількох генетичних аберацій. За еї а!., Сапсег Кев., 50: 7184-7189 11990); допд5та вї аї., у
СіІїп Раїйо!: Мої Рай 55:305-309 (|20021)). Такі генетичні аберації, у міру того як вони накопичуються, можуть забезпечити проліферативні переваги, генетичну нестабільність та супутню здатність швидко розвивати стійкість до лікарських засобів та посилений ангіогенез, протеоліз та метастазування. Генетичні аберації можуть торкатися рецесивних "тгенів- онкосупресорів" або домінантно функціонуючих онкогенів. Делеції та рекомбінація, що приводять до втрати гетерозиготності (ВГ), як вважають, відіграють основну роль у прогресуванні пухлини у результаті виявлення мутованих алелів онкосупресору.
ІЇ00443| вцДНК була виявлена у судинному руслі пацієнтів, у яких були діагностовані злоякісні новоутворення, включаючи, без обмеження, рак легенів (Раїйак еї аї. Сіп Спет 52:1833-1842 І20061), рак передміхурової залози (Зспуагі7епрасі еї а!. Сіїп Сапсег Ке5 15:1032- 8 (20091) та рак молочної залози (Зспу/лагі7епрасі еї а!., публікація доступна онлайн за адресою:
Бгеаві-сапсег-гезеагсп.сопт/сопіепі/11/5/К71 (20091). Ідентифікація геномних нестабільностей, пов'язаних з типами раку, які можна визначити у циркулюючій вциДНК у пацієнтів, що страждають від раку, є перспективним діагностичним та прогностичним інструментом.
Відповідно до одного варіанту реалізації способи, описані у даному документі, застосовують для визначення ВЧК однієї або більше послідовностей, що представляють інтерес, у зразку, наприклад, зразку, що містить суміш нуклеїнових кислот, отриманих від суб'єкта, який, як припускають або як відомо, страждає від раку, наприклад, карциноми, саркоми, лімфоми, лейкозу, герміногенних пухлин та бластоми. Відповідно до одного варіанту реалізації зразок являє собою зразок плазми, отриманий (процесований) з периферичної крові, який може містити суміш вцДНК, отриманої з нормальних та ракових клітин. Згідно з іншим варіантом реалізації біологічний зразок, необхідний для визначення присутності ВЧК, отриманий із клітин, які у випадку присутності раку, включають суміш ракових та неракових клітин від інших біологічних тканин, включаючи, без обмеження, біологічні рідини, такі як сироватка, піт, сльози, мокротиння, сеча, мокротиння, вушна рідина, лімфа, слина, спинномозкова рідина, рідина після лаважу, суспензія кісткового мозку, піхвова рідина, рідина після трансцервікального лаважу, рідина головного мозку, асцит, молоко, секрети дихальних, кишкових та сечостатевих шляхів та зразки лейкаферезу, або у біопсіях тканини, мазках або зіскрібках. Згідно з іншими варіантами реалізації біологічний зразок являє собою зразок випорожнення (фекалій). 00444) Способи, описані у даному документі, не обмежені аналізом вшиДНК. Слід розуміти, що аналогічні аналізи можна проводити відносно зразків клітинної ДНК.
І00445| Згідно з різними варіантами реалізації послідовність або послідовності, що представляють інтерес, містять послідовність нуклеїнової кислоти або кислот, які, як відомо або як припускають, відіграють роль у розвитку та/або прогресуванні раку. Приклади послідовності, що представляє інтерес, включають послідовності нуклеїнових кислот, наприклад, повних хромосом та/або сегментів хромосом, які ампліфіковані або делетовані у ракових клітинах, як описано нижче. бо Сумарна кількість ВЧК та ризик розвинення раку.
(00446) Кожні із загальних ОНП (однонуклеотидних поліморфізмів) раку - та за аналогією загальних ВЧК раку - можуть викликати винятково незначне підвищення ризику розвитку захворювання. Однак у сукупності ОНП та ВЧК можуть викликати по суті підвищений ризик типів раку. У цьому зв'язку слід зазначити, що додавання та втрати великих сегментів ДНК зародкової лінії, як повідомлялося, є факторами, які роблять індивідуумів схильними до нейробластоми, раку передміхурової залози та товстої та прямої кишок, раку молочної залози та ВКСА1- асоційованого раку яєчників (див., наприклад, публікації Кгерізспі еї аі!. Вгеах5і Сапсег Нев., 14:
В24 (20121; Оіз5Кіп еї а. Мате 2009, 459:987-991; Пи еї аІ. Сапсег Нез 2009, 69: 2176-2179; І спо еї а. Сапсег Віої Тег 2007, 6:1592-1599; Тпеап евї аІ. Сепе5 Спготобзотев Сапсег 2010, 49:99- 106; МепКаїаспаіат еї а). Іпї 9 Сапсег 2011, 129:1635-1642; та МУо5пійага еї аЇ. Сепе5
Спготовотев Сапсег 2011, 50:167-177). Слід зазначити, що ВЧК, що часто виявляються у здоровій популяції (загальні ВЧК), як вважають, відіграють роль у етіології раку (див., наприклад, публікацію ЗПіІєп апа Маїкіп (2009) Сепоте Меадісіпе, 1(6): 62). У одному дослідженні, у якому вивчали припущення, що загальні ВЧК пов'язані зі злоякісним новоутворенням (5пПіїєп еї аІ. Ргос Май Асай 5сі ОБА 2008, 105:11264-11269), одержали карту кожної відомої ВЧК, локус якої збігається з таким справжніх пов'язаних з раком генів (каталог яких складений у публікації Ніддіп5 еї аІ. Мисівеіс Асіах Кез 2007, 35:0721-726). Дані ВЧК були названі "ВЧК раку". У вихідному аналізі (Зпіієеп еї аїЇ. Ргос Майї! Асай 5сі ОБА 2008, 105:11264- 11269) 770 здорових геномів оцінювали із застосуванням набору матриць Айутеїйгіх 5О00К, які характеризуються середньою відстанню між зондами 5,8 т.о. Оскільки вважають, що ВЧК, як правило, виснажені у областях генів (Кедоп еї аїЇ. (2006) Маїшгте 2006, 444:444-454), були неочікувано виявлені 49 ракових генів, які були безпосередньо включені у ВЧК або перекривалися ВЧК, у більше ніж однієї особи у великій референсній популяції. Серед перших десяти генів ВЧК раку можна було виявити у чотирьох або більше людей.
І00447| Таким чином, вважають, що частоту ВЧК можна застосовувати у якості критерію ризику розвинення раку (див., наприклад, публікацію патенту США Ме 2010/0261183 АТ).
Частоту ВЧК можна визначити простим способом на підставі конститутивного геному організму, або вона може представляти фракцію, отриману з однієї або більше пухлин (неопластичних клітин), якщо такі присутні.
І00448| Згідно з певними варіантами реалізації кількість ВЧК у досліджуваному зразку (наприклад, зразку, що містить конститутивні (зародкової лінії) нуклеїнові кислоти) або суміші нуклеїнових кислот (наприклад, нуклеїнова кислота зародкової лінії та нуклеїнова кислота або кислоти, отримані з неопластичних клітин) визначають із застосуванням способів, описаних у даному документі для варіацій числа копій. Ідентифікація збільшеної кількості ВЧК у досліджуваному зразку, наприклад, у порівнянні з референсним значенням, свідчить про ризик або схильність до раку у суб'єкта. Слід звернути увагу, що референсне значення у даній популяції може варіюватися. Також слід звернути увагу, що абсолютне значення збільшення частоти ВЧК буде варіюватися залежно від розділення способу, застосовуваного для визначення частоти ВЧК, та інших параметрів. Як правило, збільшення частоти ВЧК щонайменше приблизно у 1,2 рази у порівнянні з референсним значенням буде визначено як таке, що свідчить про ризик розвитку раку (див., наприклад, публікацію патенту США Мо 2010/0261183 АТ), наприклад, збільшення частоти ВЧК щонайменше або приблизно у 1,5 рази у порівнянні з референсним значенням або більше, таке як збільшення у 2 - 4 рази у порівнянні з референсним значенням, є свідченням підвищеного ризику розвитку раку (наприклад, у порівнянні з нормальною здоровою референсною популяцією).
І00449| Вважають, що визначення структурної варіації у геномі ссавця у порівнянні з референсним значенням також свідчить про ризик розвитку раку. У даному контексті відповідно до одного варіанту реалізації термін "структурна варіація" можна позначити як частоту ВЧК у ссавця, помножену на середній розмір ВЧК (у п.о.) у ссавця. Таким чином, високі показники структурної варіації будуть наслідком збільшення частоти ВЧК та/або виникнення великих делецій або дуплікацій геномної нуклеїнової кислоти. Відповідно, згідно з певними варіантами реалізації кількість ВЧК у досліджуваному зразку (наприклад, зразку, що містить конститутивну (зародкової лінії) нуклеїнову кислоту) визначають із застосуванням способів, описаних у даному документі для визначення розміру та кількості варіацій числа копій. Згідно з певними варіантами реалізації сумарний показник структурної варіації у геномній ДНК більше приблизно 1 мегабази, або більше приблизно 1,1 мегабази, або більше приблизно 1,2 мегабаз, або більше приблизно 1,3 мегабаз, або більше приблизно 1,4 мегабаз, або більше приблизно 1,5 мегабаз, або більше приблизно 1,8 мегабаз або більше приблизно 2 мегабаз ДНК свідчить про ризик розвитку раку. 00450) Вважають, що дані способи забезпечують критерій ризику розвитку будь-якого раку, бо включаючи, без обмеження, гострий та хронічний лейкози, лімфоми, численні солідні пухлини мезенхімальної або епітеліальної тканини, рак головного мозку, молочної залози, печінки, шлунку, товстої кишки, В-клітинну лімфому, рак легенів, рак бронхів, рак товстої та прямої кишок, рак передміхурової залози, рак молочної залози, рак підшлункової залози, рак шлунку, рак яєчників, рак сечового міхура, рак головного мозку або центральної нервової системи, рак периферичної нервової системи, рак стравоходу, рак шийки матки, меланому, рак матки або ендометрію, рак ротової порожнини або гортані, рак печінки, рак нирок, рак жовчних шляхів, рак тонкого кишечнику або апендикса, рак слинних залоз, рак щитовидної залози, рак надниркової залози, остеосаркому, хондросаркому, ліпосаркому, рак яєчок та злоякісну фіброзну гістіоцитому, а також інші типи раку.
Анеуплоїдії цілих хромосом 00451) Як зазначено вище, при раку спостерігається висока частота анеуплоїдії. У певних дослідженнях, у яких вивчали поширеність змін соматичного числа копій (зотаїйіс сору питбег анегайоп5, ЗСМА) при раку, було виявлено, що одна чверть геному типової ракової клітини уражена ЗСМА цілого плеча або анеуплоїдією 5СМА цілої хромосоми (див., наприклад, публікацію ВегоиКпіт еї а). Маїшге 463: 899-905 (20101). Зміни цілої хромосоми періодично спостерігають при декількох типах раку. Наприклад, у 10 - 20 95 випадків гострого мієлоїдного лейкозу (ГМЛ), а також деяких солідних пухлин, включаючи саркому Юінга та десмоїдні пухлини, спостерігається додавання хромосоми 8 (див., наприклад, публікації Вагпагіа еї аї.
Ї енкетіа 10:5-12 (1996); Машгісі еї а. Сапсег Сбепеї. Суїодепеї. 100: 106-110 (1998); ОЇ еї аї.
Сапсег Сепеї. Суюдепеї. 92: 147-149 (1996); Ватага, 0. В. еї а. Віоса 100: 427-434 (20021, і т.п.
Ілюстративний, але необмежуючий перелік додавань та втрат хромосом при типах раку людини представлено у таблиці 2.
ТАБЛИЦЯ 2
Ілюстративні специфічні рецидивуючі додавання та втрати хромосом при раку людини (див., наприклад, публікацію согадоп еї аї!. (2012) Маїиге Кеум. Ссепеїісв, 13: 189-203).
Тип раку Тип раку
Аденокарцинома (молочної залози) 72 (шен 12 О А
Саркома Юінга
Дифузна В-великоклітинна лімфома | Аденокарцинома (нирок) з ню с 0000000
Аденокарцинома (нирок) яопекевн еюенннннню
Пухлина Вільмса ц й
Гострий мієлоїдний лейкоз
Аденокарцинома (кишечнику) в лейкоз
Гострий мієлоїдний лейкоз
Хронічний мієлоїдний лейкоз Аденокарцинома (нирок)
Саркома Юінга 7 (Ши ою 2 ОЛО
Справжня поліцитемія
Аденокарцинома (матки) Множинна мієлома 11101011 |Множиннамієломад/////777777777/Ї1111111111111111111111111111сСсСсСсС
Пухлина Вільмса
Пухлина Вільмса
Менінгіома 0110101015 |Множиннамієлома.їд//-/:/КН.С:(К«ЯЇ.СССССССССССССС777777сссгсгсИс2ш
ТАБЛИЦЯ 2
Ілюстративні специфічні рецидивуючі додавання та втрати хромосом при раку людини (див., наприклад, публікацію согадоп еї аї!. (2012) Маїиге Кеум. Ссепеїісв, 13: 189-203).
Тип раку Тип раку шли у ут аа
Гострий лімфобластний лейкоз
Хронічний мієлоїдний лейкоз Менінгіома шли успі
Аденокарцинома (нирок) ово (Госомймениаосластнийле | 0000
Гострий мегакаріобластний лейкоз ох дн 000
Фолікулярна лімфома нини (004521 Згідно з різними варіантами реалізації способи, описані у даному документі, можна застосовувати для виявлення та/або кількісного визначення анеуплоїдій цілої хромосоми, які пов'язані з раком у цілому та/або які пов'язані з конкретними типами раку. Таким чином, наприклад, згідно з певними варіантами реалізації передбачене виявлення та/або кількісне визначення анеуплоїдій цілої хромосоми, які характеризуються додаванням або втратою, представленою у таблиці 2.
Варіації числа копій сегментів хромосоми на рівні плеча. 00453) У багатьох дослідженнях повідомлялося про паттерни варіацій числа копій на рівні плеча у межах великої кількості зразків раку (іп еї аІ. Сапсег Кез5 68, 664-673 (2008); Сеогодє єї а! Ріо ОМЕ 2, е255 (2007); Оетіспеїї5 еї ам. Сепе5 Спготозотев Сапсег 48: 366-380 (2009);
ВегошикКпіт еї а. Мате. 463(7283): 899-905 (2010). Додатково спостерігали, що частота варіацій числа копій на рівні плеча знижується зі зменшенням довжини плечей хромосом. З урахуванням даної тенденції для більшості плечей хромосом спостерігається вагомий доказ переважного додавання або втрати, але рідко і того, і іншого, у межах множини ліній раку (див., наприклад, публікацію ВегоциКпіт еї аЇ. Масиге. 463(7283): 899-905 (20101). (00454) Відповідно, згідно з одним варіантом реалізації способи, описані у даному документі, застосовують для визначення ВЧК на рівні плеча (ВЧК, що включають одне плече хромосоми або по суті одне плече хромосоми) у зразку. ВЧК можна визначити у ВЧК у досліджуваному зразку, що містить конститутивну (зародкової лінії) нуклеїнову кислоту, та ВЧК на рівні плеча можна ідентифікувати у таких конститутивних нуклеїнових кислотах. Згідно з певними варіантами реалізації ВЧК на рівні плеча ідентифікують (у випадку наявності) у зразку, що містить суміш нуклеїнових кислот (наприклад, нуклеїнові кислоти, отримані з нормальних, та нуклеїнові кислоти, отримані з неопластичних клітин). Згідно з певними варіантами реалізації зразок одержують від суб'єкта, який, як припускають або як відомо, страждає від раку, наприклад, карциноми, саркоми, лімфоми, лейкозу, герміногенних пухлин, бластоми і т.п.
Відповідно до одного варіанту реалізації зразок являє собою зразок плазми, отриманий (процесований) з периферичної крові, який може містити суміш вшиДНК, отриманої з нормальних та ракових клітин. Згідно з іншим варіантом реалізації біологічний зразок, який застосовують для визначення присутності ВЧК, одержують із клітин, які, якщо рак присутній, містять суміш ракових та неракових клітин з інших біологічних тканин, включаючи, без обмеження, біологічні рідини, такі як сироватка, піт, сльози, мокротиння, сеча, мокротиння, вушна рідина, лімфа, слина, спинномозкова рідина, рідина після лаважу, суспензія кісткового мозку, піхвова рідина, рідина після трансцервікального лаважу, рідина головного мозку, асцит, молоко, секрети дихальних, кишкових та сечостатевих шляхів та зразки лейкаферезу, або у біопсіях тканини, мазках або зіскрібках. Згідно з іншими варіантами реалізації біологічний зразок являє собою зразок випорожнення (фекалій). 00455) Згідно з різними варіантами реалізації ВЧК, ідентифіковані як такі, що свідчать про присутність раку або про підвищений ризик розвитку раку, включають, без обмеження, ВЧК на рівні плеча, перераховані у таблиці 3. Як проілюстровано у таблиці 3, певні ВЧК, які включають істотне додавання на рівні плеча, свідчать про присутність раку або про підвищений ризик розвитку певних типів раку. Таким чином, наприклад, додавання у 14 свідчить про присутність або підвищений ризик розвитку гострого лімфобластного лейкозу (ГЛЛ), раку молочної залози,
ШКСП (шлунково-кишкової стромальної пухлини), ПКК (печінковоклітинної карциноми), НПК (неплоскоклітинної карциноми) легенів, медулобластоми, меланоми, МшШс (мієлопроліферативного синдрому), раку яєчників та/або раку передміхурової залози.
Додавання у З4 свідчить про присутність або підвищений ризик розвитку плоскоклітинного раку стравоходу, ПК (плоскоклітинної карциноми) легенів талабо МШС. Додавання у 74 свідчить про присутність або підвищений ризик розвитку раку товстої та прямої кишок, гліоми, ПКК, НПК легенів, медулобластоми, меланоми, раку передміхурової залози та/(або ренального раку.
Додавання у 7р свідчить про присутність або підвищений ризик розвитку раку молочної залози, раку товстої та прямої кишок, аденокарциноми стравоходу, гліоми, ПКК, НПК легенів, медулобластоми, меланоми та/або ренального раку. Додавання у 204 свідчить про присутність або підвищений ризик розвитку раку молочної залози, раку товстої та прямої кишок, дедиференційованої ліпосаркоми, аденокарциноми стравоходу, плоскоклітинного раку стравоходу, раку гліоми, ПКК, НПК легенів, меланоми, раку яєчників та/або ренального раку і т.д. (00456) Аналогічно, як проілюстровано у таблиці 3, певні ВЧК, які включають істотну втрату на рівні плеча, свідчать про присутність та/або про підвищений ризик розвитку певних типів раку. Таким чином, наприклад, втрата у 1р свідчить про присутність або підвищений ризик розвитку шлунково-кишкової стромальної пухлини. Втрата у 44 свідчить про присутність або підвищений ризик розвитку раку товстої та прямої кишок, аденокарциноми стравоходу, ПК легенів, меланоми, раку яєчників та/або ренального раку. Втрата у 17р свідчить про присутність або підвищений ризик розвитку раку молочної залози, раку товстої та прямої кишок, аденокарциноми стравоходу, ПКК, НПК легенів, ПК (плоскоклітинної карциноми) легенів та/або раку яєчників і т.п.
ТАБЛИЦЯ З
Значні зміни числа копій сегментів хромосом на рівні плеча у кожному з 16 підтипів раку (рак молочної залози, товстої та прямої кишок, дедиференційована ліпосаркома, аденокарцинома стравоходу, плоскоклітинний рак стравоходу, ШКСП (шлунково-кишкова стромальна пухлина), гліома, ПКК (печінковоклітинна карцинома), НПК легень, ПК легень, медулобластома, меланома,
МП (мієлопроліферативний синдром), рак яєчників, передміхурової залози, гострий лімфобластний лейкоз (ОЛЛ) та ренальний рак) (див., наприклад, публікацію ВегоиКпіт еї а).
Маїшге (2010) 463(7283): 899-905) пе зейнну 00 аєбтМе 0сет,
Плече онкоген/ген-
Значне додавання у Значна втрата у онкосупресор 1в 11111111 - ШК!
ГЛЛ, молочної залози, ШКСП,
ПКК, НПК легень, 1а медулобластома, меланома,
МПС, яєчників, передміхурової залози
Плоскоклітинний стравоходу,
Зр НПК / легень, ПК легень, УНГ ренальний о що 000 легень, МПС
Молочної залози, ар ГЛлЛ аденокарцинома стравоходу, ренальний аденокарцинома стравоходу, 4а ГлЛлЛ ПК : легень, меланома, яєчників, ренальний
ТАБЛИЦЯ З
Значні зміни числа копій сегментів хромосом на рівні плеча у кожному з 16 підтипів раку (рак молочної залози, товстої та прямої кишок, дедиференційована ліпосаркома, аденокарцинома стравоходу, плоскоклітинний рак стравоходу, ШКСП (шлунково-кишкова стромальна пухлина), гліома, ПКК (печінковоклітинна карцинома), НПК легень, ПК легень, медулобластома, меланома,
МП (мієлопроліферативний синдром), рак яєчників, передміхурової залози, гострий лімфобластний лейкоз (ОЛЛ) та ренальний рак) (див., наприклад, публікацію ВегоиКпіт еї а).
Майте (2010) 463(7283): 899-905)
Типи раку Типи раку Відомий
Плече Значне додавання у Значна втрата у онкоген/ген- онкосупресор
Плоскоклітинний стравоходу,
Бр ПКК, НІК легень, ПК легень, ТЕВТ ренальний - Аденокарцинома стравоходу, бо мелаюа 10001 меланома ба (ЛЯ |Меланомаренальний.д/7/ЗГ/ | ./С:х/:З: СС: « фЖ
Молочної залози, товстої та прямої кишок, аденокарцинома 7р стравоходу, гліома, ПКК, НПК ЕСЕВ легень, медулобластома, меланома, ренальний
Товстої та прямої кишок, гліома,
ПКК, НПК легень, 74 медулобластома, меланома, ВААРЕ, МЕТ передміхурової залози, ренальний
Молочної залози, ПКК, НПК глл, МПС легень, медупобластома, передміхурової залози, ренальний
ГЛЛ, молочної залози, товстої та прямої кишок, аденокарцинома стравоходу, плоскоклітинний стравоходу, ПКК, НПК легень, Медулобластома мус
МПС, яєчників, передміхурової залози
ГЛЛ, молочної залози, аденокарцинома стравоходу,
Мпе НПК легень, меланома, СОКмМгл/В яєчників, ренальний ззтяне 00000 яєчників, ренальний
Лор (гля |ГліомаПКлегеньомеланома | //:Х/:////С:( ВЗ медулобластома, меланома лів ЇЇ - 111111 |Медулобластома./7.7.:/;;.:/ М.Н | - Ул
Дедиференційована 114 ліпосаркома, медулобластома, АТМ меланома се шт роя ренальний 12 о (Ренальний./:/ /(//Ї.77777777777117--311Ї1
ТАБЛИЦЯ З
Значні зміни числа копій сегментів хромосом на рівні плеча у кожному з 16 підтипів раку (рак молочної залози, товстої та прямої кишок, дедиференційована ліпосаркома, аденокарцинома стравоходу, плоскоклітинний рак стравоходу, ШКСП (шлунково-кишкова стромальна пухлина), гліома, ПКК (печінковоклітинна карцинома), НПК легень, ПК легень, медулобластома, меланома,
МП (мієлопроліферативний синдром), рак яєчників, передміхурової залози, гострий лімфобластний лейкоз (ОЛЛ) та ренальний рак) (див., наприклад, публікацію ВегоиКпіт еї а).
Майте (2010) 463(7283): 899-905)
Типи раку Типи раку Відомий
Плече Значне додавання у Значна втрата у онкоген/ген- онкосупресор
Молочної залози, . . дедиференційована 1за Товстої та прямої кишок ліпосаркома, гліома, НПК ВВ1/ВАСАг легень, яєчників я (перодміуровоїзадови 00 ШКО меланома, ренальй 7 передміхурової залози 1-0 бе 11 яєчників о16ро |Молочнотзалози.///:///|Ї.7777777771111-1Ї1
Молочної залози, ПКК, 16ба медулобластома, яєчників, передміхурової залози
Молочної залози, товстої та прямої кишок, аденокарцинома 17р глл стравоходу, ПКК, НПК легень, ТРОЗ
ПК легень, яєчників че флжененсти ее ник легень
Товстої та прямої кишок, 18а ГЛЛ, медулобластома аденокарцинома стравоходу) 5МАЮО2, 5МАЮ4
НПК легень
Аденокарцинома стравоходу, 19р Гліома НПК легень, меланома, яєчників . Аденокарцинома стравоходу, тя |яонлкююте 0 доня сееню
Молочної залози, товстої та прямої кишок, аденокарцинома гор стравоходу, плоскоклітинний стравоходу, ШКСП, гліома, ПКК,
НПК легень, меланома, ренальний
Молочної залози, товстої та прямої КИШОК, дедиференційована 204 ліпосаркома, аденокарцинома стравоходу, плоскоклітинний стравоходу, гліома, ПКК, НПК легень, меланома, яєчників, ренальний 2 (гллішкКоп Мас С/Г! -1111
ТАБЛИЦЯ З
Значні зміни числа копій сегментів хромосом на рівні плеча у кожному з 16 підтипів раку (рак молочної залози, товстої та прямої кишок, дедиференційована ліпосаркома, аденокарцинома стравоходу, плоскоклітинний рак стравоходу, ШКСП (шлунково-кишкова стромальна пухлина), гліома, ПКК (печінковоклітинна карцинома), НПК легень, ПК легень, медулобластома, меланома,
МП (мієлопроліферативний синдром), рак яєчників, передміхурової залози, гострий лімфобластний лейкоз (ОЛЛ) та ренальний рак) (див., наприклад, публікацію ВегоиКпіт еї а).
Маїшге (2010) 463(7283): 899-905)
І ДЕ
Плече онкоген/ген-
Значне додавання у Значна втрата у онкосупресор
Молочної залози, товстої та прямої КИШОК) дедиференційована 224 Меланома ліпосаркома, аденокарцинома МЕг2 стравоходу, ШКСП, НПК легень, пк легень, яєчників ) передміхурової залози
І00457| Приклади взаємозв'язку між варіаціями числа копій на рівні плеча є ілюстративними, а не обмежуючими. Фахівцям у даній галузі техніки відомі інші варіації числа копій на рівні плеча та їх взаємозв'язки з раком.
Менші, наприклад, фокальні, варіації числа копій.
ІЇ00458| Як зазначено вище, згідно з певними варіантами реалізації способи, описані у даному документі, можна застосовувати для визначення присутності або відсутності ампліфікації хромосом. Згідно з деякими варіантами реалізації ампліфікація хромосом являє собою додавання однієї або більше цілих хромосом. Згідно з іншими варіантами реалізації ампліфікація хромосом являє собою додавання одного або більше сегментів хромосоми. Згідно із третім варіантом реалізації ампліфікація хромосом являє собою додавання двох або більше сегментів двох або більше хромосом. Згідно з різними варіантами реалізації ампліфікація хромосом може включати додавання одного або більше онкогенів.
І00459| Домінантно функціонуючі гени, пов'язані із солідними пухлинами людини, як правило, виявляють свій вплив за допомогою надекспресії або зміни експресії. Ампліфікація гену є частим механізмом, що приводить до підвищувальної регуляції експресії гену. Докази, отримані у цитогенетичних дослідженнях, вказують на те, що при більше 50 95 типів раку молочної залози людини спостерігається значна ампліфікація. Головним чином, ампліфікація протоонкогену рецептору епідермального фактору росту 2 (НЕК2) людини, розташованого на хромосомі 17 (17(17421-д22)), приводить до надекспресії рецепторів НЕКЗ на поверхні клітин, що приводить до надмірної та некерованої передачі сигналів при раку молочної залози та інших злоякісних новоутвореннях (Рагк еї аї., Сіїіпіса! Вгеах5і Сапсег 8:392-401 І20081). Було виявлено, що багато онкогенів ампліфікуються при інших злоякісних новоутвореннях людини. Приклади ампліфікації клітинних онкогенів у пухлинах людини включають ампліфікації с-тус у лінії клітин промієлоцитарного лейкозу НІ 60 та у лініях клітин дрібноклітинної карциноми легенів, М-тус у первинних нейробластомах (стадії ПШ та ІМ), лініях клітин нейробластоми, лініях клітин ретинобластоми та первинних пухлин та лініях та пухлинах дрібноклітинної карциноми легенів,
Ї-тус у лініях клітин та пухлинах дрібноклітинної карциноми легенів, с-тур у лініях клітин гострого мієлоїдного лейкозу та карциноми товстої кишки, с-егрор у клітинах епідермоїдної карциноми та первинних гліомах, с-К-гає-2 у первинних карциномах легенів, товстої кишки, сечового міхура та прямої кишки, М-гах у лінії клітин карциноми молочної залози (Мапгтиз Н.,
Апп Вем Сепеїісв 18: 553-612 (1984) (по даним Умаїзоп еї а!., МоІесшаг ВіоІоду ої (Ше Сепе (4 ед.; Вепіатіп/Ситтіпов Рибіїзпіпо Со. 1987)|. 00460) Дуплікації онкогенів є розповсюдженою причиною багатьох типів раку, як і у випадку ампліфікації Р7О-56 кінази 1 та раку молочної залози. У таких випадках генетична дуплікація виникає у соматичній клітині та вражає винятково геном ракових клітин самих по собі, але не всього організму, а тим більше якого-небудь наступного потомства. Інші приклади онкогенів, які ампліфікуються при типах раку людини, включають МУС, ЕКВВ2 (ЕБСОК), ССМО1 (циклін 01),
ЕСЕК'І та ЕОЕКЗ2 при раку молочної залози, МУС та ЕКВВ2 при раку шийки матки, НКА5, ККА5 та МУВ при раку товстої та прямої кишок, МУС, ССМО1 та МОМ2 при раку стравоходу, ССМЕ,
ККА5 та МЕТ при гастричному раку, ЕКВВІ1 та СОКА при гліобластомі, ССМО1, ЕКВВІ та МУС при раку голови та шиї, ССМО1 при печінковоклітинному раку, МУСВ при нейробластомі, МУС,
ЕКВВ2 та АКТ2 при раку яєчників, МОМ2 та СОКА при саркомі та МУС при дрібноклітинному раку легенів. Відповідно до одного варіанту реалізації даний спосіб можна застосовувати для визначення присутності або відсутності ампліфікації онкогену, пов'язаного з раком. Згідно з деякими варіантами реалізації ампліфікується онкоген, пов'язаний з раком молочної залози, раком шийки матки, раком товстої та прямої кишок, раком стравоходу, гастричним раком, гліобластомою, раком голови та шиї, печінковоклітинним раком, нейробластомою, раком яєчників, саркомою та дрібноклітинним раком легенів.
І00461| Відповідно до одного варіанту реалізації даний спосіб можна застосовувати для визначення присутності або відсутності делеції хромосоми. Згідно з деякими варіантами реалізації делеція хромосоми являє собою втрату однієї або більше цілих хромосом. Згідно з іншими варіантами реалізації делеція хромосоми являє собою втрату одного або більше сегментів хромосоми. Згідно із третім варіантом реалізації делеція хромосоми являє собою втрату двох або більше сегментів двох або більше хромосом. Делеція хромосоми може включати втрату одного або більше генів-онкосупресорів. (004621 Делеції хромосом, у яких беруть участь гени-онкосупресори, як вважають, відіграють важливу роль у розвитку та прогресуванні солідних пухлин. Ген-онкосупресор ретинобластоми (АБ-1), розташований у хромосомі 13д14, являє собою найбільш повно охарактеризований ген- онкосупресор. Продукт гену КБ-1, ядерний фосфопротеїн 105 кДа, очевидно, відіграє важливу роль у регуляції клітинного циклу (Ноуе еї аї., Ргос Маї! Асай 5сі (О5А) 87:5883-5887 (19901).
Зміну або втрату експресії білку КО викликає інактивація обох алелів гену у результаті точкової мутації або делеції хромосоми. Було виявлено, що зміни гену Кб-і спостерігаються не тільки у ретинобластомах, але також у інших злоякісних новоутвореннях, таких як остеосаркоми, дрібноклітинний рак легенів (Кудаага еї аї., Сапсег Ке5 50: 5312-5317 (1990))) та рак молочної залози. У дослідженнях поліморфізму довжини фрагментів рестрикції (Кезігісбоп їгадтепі Іепдій роїутогріпі5т, КР Р) було встановлено, що такі типи пухлин часто втратили гетерозиготність по 134; це свідчить, що один з алелів гену КБ-1 був втрачений у зв'язку з великою делецією хромосоми (Вом'соск еї аіЇ., Ат У Нит Сепеї, 46:12 (19901). Аномалії хромосоми 1, включаючи дуплікації, делеції та незбалансовані транслокації, за участю хромосоми 6 та іншої хромосоми- партнера, свідчать, що області хромосоми 1, зокрема, 1421-1432 та 1р11-13, можуть нести онкогени або гени-онкосупресори, які є значимими з патогенетичної точки зору як на хронічній, так і на прогресуючій стадіях мієлопроліферативних новоутворень (Сагата7а еї аї., Еиг У
Нетаїйос! 84:191-200 (20101). Мієлопроліферативні новоутворення також пов'язані з делеціями хромосоми 5. Повна втрата або внутрішні делеції хромосоми 5 є найбільш частими аномаліями каріотипу при мієлодиспластичних синдромах (МДС). Пацієнти з виділеним аеї(54)/54- МДС характеризуються більш сприятливим прогнозом, ніж такі з додатковими дефектами каріотипу, у яких спостерігається тенденція до розвитку мієлопроліферативних новоутворень (МПН) та гострого мієлоїдного лейкозу. Частота незбалансованих делецій хромосоми 5 привела до виникнення думки, що 54 несе один або більше генів-онкосупресорів, які відіграють фундаментальні ролі у контролі росту гематопоетичних стовбурових клітин/клітин попередників (ГСК/ГКП). Цитогенетичне картування часто делетованих областей (сотітпопіу аеїеїей гедіопв,
СОК) зосередилося на ідентифікованих кандидатах 5431 та 5432 генів-онкосупресорів, включаючи рибосомальну субодиницю КРБ14, фактор транскрипції Едг1/Ктох20 та білок ремоделювання цитоскелету, альфа-катенін (Еізептапп еї аІ., Опсодепе 28:3429-3441 І20091).
Цитогенетичні дослідження та дослідження з алелетипування свіжих пухлин та пухлинних ліній клітин продемонстрували, що втрата алелей з декількох різних областей на хромосомі Зр, включаючи Зр25, Зр21-22, Зрг1.3, Зр12-13 та Зр14, являє собою самі ранні та найбільш часті геномні аномалії, залучені у широкий спектр більшості епітеліальних типів раку легенів, молочної залози, нирок, голови та шиї, яєчників, шейки матки, товстої кишки, підшлункової залози, стравоходу, сечового міхура та інших органів. Кілька генів-онкосупресорів було картовано на області Зр хромосоми, та вважають, що внутрішні делеції або гіперметилювання промотору передують втраті Зр або цілої хромосоми З при розвитку карцином (Апдеїопі О.,
Вгієїїпо5 Гипсіїопа! Сепотісв 6:19-39 (20071).
ІЇ00463| У немовлят та дітей із синдромом Дауна (СД) часто спостерігається вроджений транзиторний лейкоз, та такі немовлята та діти характеризуються підвищеним ризиком розвитку гострого мієлоїдного лейкозу та гострого лімфобластного лейкозу. Хромосома 21, що несе приблизно 300 генів, може бути залучена у численні структурні аберації, наприклад, транслокації, делеції та ампліфікації, при лейкозах, лімфомах та солідних пухлинах. Більше бо того, були ідентифіковані гени, розташовані на хромосомі 21, які відіграють важливу роль у онкогенезі. Соматичні чисельні, а також структурні аберації хромосоми 21 пов'язані з лейкозами, та конкретні гени, включаючи КОМХІ, ТМРАЗ52, та ТЕР, які розташовані у 214, відіграють роль у онкогенезі (Гопаїбзсп С бепе Спготозотез Сапсег 49:497-508 (20101). (00464) З урахуванням вищевикладеного, згідно з різними варіантами реалізації способи, описані у даному документі, можна застосовувати для визначення ВЧК сегменту, який, як відомо, містить один або більше онкогенів або генів-онкосупресорів, та/або, як відомо, пов'язаний з раком або зі збільшеним ризиком розвитку раку. Згідно з певними варіантами реалізації ВЧК можна визначити у досліджуваному зразку, що містить конститутивну (зародкової лінії) нуклеїнову кислоту, та сегмент можна ідентифікувати у даних конститутивних нуклеїнових кислотах. Згідно з певними варіантами реалізації ВЧК сегменту ідентифікують (у випадку наявності) у зразку, що містить суміш нуклеїнових кислот (наприклад, нуклеїнові кислоти, отримані з нормальних, та нуклеїнові кислоти, отримані з неопластичних клітин). Згідно з певними варіантами реалізації зразок одержують від суб'єкта, який, як припускають або як відомо, страждає від раку, наприклад, карциноми, саркоми, лімфоми, лейкозу, герміногенних пухлин, бластоми і т.п. Відповідно до одного варіанту реалізації зразок являє собою зразок плазми, отриманий (процесований) з периферичної крові, який може містити суміш вуднК, отриманої з нормальних та ракових клітин. Згідно з іншим варіантом реалізації біологічний зразок, який застосовують для визначення присутності ВЧК, одержують із клітин, які, якщо рак присутній, містять суміш ракових та неракових клітин з інших біологічних тканин, включаючи, без обмеження, біологічні рідини, такі як сироватка, піт, сльози, мокротиння, сеча, мокротиння, вушна рідина, лімфа, слина, спинномозкова рідина, рідина після лаважу, суспензія кісткового мозку, піхвова рідина, рідина після трансцервікального лаважу, рідина головного мозку, асцит, молоко, секрети дихальних, кишкових та сечостатевих шляхів та зразки лейкаферезу, або у біопсіях тканини, мазках або зіскрібках. Згідно з іншими варіантами реалізації біологічний зразок являє собою зразок випорожнення (фекалій).
І00465| ВЧК, яку використовують для визначення присутності раку та/або підвищеного ризику розвитку раку, може включати ампліфікацію або делеції. (00466) Згідно з різними варіантами реалізації ВЧК, ідентифіковані як такі, що свідчать про присутність раку або про підвищений ризик розвитку раку, включають одну або більше ампліфікацій, представлених у таблиці 4.
ТАБЛИЦЯ 4
Ілюстративні, але необмежуючі сегменти хромосом, які характеризуються ампліфікаціями, пов'язаними з типами раку. Перераховані типи раку являють собою такі, ідентифіковані у публікації ВегоиКпіт еї аї. Маїиге 18: 463: 899-905 не у попередніх публікаціях
Молочної залози, дедиференційована , ліпосаркома, аденокарцинома стравоходу, спг1:148661965-149063439 0,35 печінковоклітинний, ПК легень, меланома, яєчників, передміхурової залози, ренальний
Дедиференційована ліпосаркома, спи1:158317017-159953843 1,627 аденокарцинома стравоходу, передміхурової залози, ренальний , Товстої та прямої кишок, дедиференційована , Гострий лімфобластний лейкоз, молочної , Молочної залози, дедиференційована
ТАБЛИЦЯ 4
Ілюстративні, але необмежуючі сегменти хромосом, які характеризуються ампліфікаціями, пов'язаними з типами раку. Перераховані типи раку являють собою такі, ідентифіковані у публікації ВегоиКпіт еї аї. Маїиге 18: 463: 899-905
Довжина (Мб) Типи раку, ідентифіковані у даному аналізі, але не у попередніх публікаціях спг4:54471680-55980061 1,449 спг5:1212750-1378766 0,115 Дедиференційована ліпосаркома спг5:174477192-180857866 6,124 Молочної залози, НПК легень спг5:45312870-49697231 4,206 спг6:1-23628840 23,516 Аденокарцинома стравоходу спг6:135561194-135665525 0,092 Молочної залози, аденокарцинома стравоходу спив:43556800-44361368 Аденокарцинома стравоходу, печінковоклітинний, яєчників спт6:63255006-65243766 1,988 Аденокарцинома стравоходу, НПК легень
СПг7:115981465-116676953 ве Аденокарцинома стравоходу, НПК легень, меланома, яєчників
Спг7:54899301-55275419 0,363 Аденокарцинома стравоходу, плоскоклітинний стравоходу , . Молочної залози, аденокарцинома стравоходу, спг7:89924533-98997268 9,068 плоскоклітинний стравоходу, яєчників спг8:101163387-103693879 2,516 спг8:116186189-120600761 Молочної залози, печінковоклітинний, НІК легень, яєчників
Аденокарцинома стравоходу, плоскоклітинний , . стравоходу, печінковоклітинний, ПК легень, спг8128774432-128849112 0,009 медулобластома, мієлопроліферативний розлад, яєчників спг8:140458177-146274826 5,784 НИК легень, медулобластома, меланома, , . Товстої та прямої кишок, аденокарцинома спг8:38252951-38460772 0,167 стравоходу, плоскоклітинний стравоходу , . Аденокарцинома стравоходу, НПК легень, ПК спг8:42006632-42404492 0,257 легень, яєчників, передміхурової залози спг8:81242335-81979194 0,717 спг9:137859478-140273252 Товстої та прямої кишок, дедиференційована ліпосаркома спг10:74560456-82020637 7455 Молочної залози, яєчників, передміхурової спи11:101433436-102134907 0,683 НПК легень, ПК легень спг11:32027116-37799354 5,144 ліпосаркома, НПК легень, ПК легень
Дедиференційована ліпосаркома, спи11:69098089-69278404 0,161 аденокарцинома стравоходу, печінковоклітинний, ПК легень, яєчників
Дедиференційована ліпосаркома, спи11:76699529-78005085 1,286 аденокарцинома стравоходу, ПК легень, яєчників спг12:1-1311104 Т271
Гострий лімфобластний лейкоз, сп12:25189655-25352305 0,112 аденокарцинома стравоходу, плоскоклітинний стравоходу, яєчників
Гострий лімфобластний лейкоз, товстої та , . прямої кишок, аденокарцинома стравоходу, спп2:30999223-32594050 1577 плоскоклітинний стравоходу, НПК легень, ПК легень
ТАБЛИЦЯ 4
Ілюстративні, але необмежуючі сегменти хромосом, які характеризуються ампліфікаціями, пов'язаними з типами раку. Перераховані типи раку являють собою такі, ідентифіковані у публікації ВегоиКпіт еї аї. Маїиге 18: 463: 899-905
Довжина (Мб) Типи раку, ідентифіковані у даному аналізі, але не у попередніх публікаціях
Молочної залози, товстої та прямої кишок, , . дедиференційована ліпосаркома, спп2:38788913-42596599 3,779 плоскоклітинний стравоходу, НПК легень, ПК легень спг12:56419524-56488685 0,021 Дедиференційована ліпосаркома, меланома, ренальний спі12:64461446-64607139 0,041 Дедиференційована ліпосаркома, ренальний , . Дедиференційована ліпосаркома, спг12:66458200-66543552 0,058 плоскоклітинний стравоходу, ренальний
Молочної залози, дедиференційована спі12:67440273-67566002 0,067 ліпосаркома, плоскоклітинний стравоходу, меланома, ренальний
Молочної залози, дедиференційована спі12:68249634-68327233 ліпосаркома, плоскоклітинний стравоходу, ренальний спи12:70849987-70966467 0,036 Дедиференційована ліпосаркома, ренальний спи2:72596017-73080626 сп12:76852527-77064746 0,158 Дедиференційована ліпосаркома сп12:85072329-85674601 0,272 Дедиференційована ліпосаркома сп12:95089777-95350380 0,161 Дедиференційована ліпосаркома , . Молочної залози, аденокарцинома стравоходу, спг13:108477140-110084607 1,6 НПК легень, ПК легень 4. Гострий лімфобластний лейкоз, спг13:1-40829685 22,132 аденокарцинома стравоходу спг13:89500014-93206506 3,597 Молочної залози, аденокарцинома стравоходу, медулобластома спг14:106074644-106368585 0,203
Гострий лімфобластний лейкоз, спг14:1-23145193 3,635 плоскоклітинний стравоходу, печінковоклітинний, ПК легень
Молочної залози, аденокарцинома стравоходу, спі14:35708407-36097605 0,383 плоскоклітинний стравоходу, печінковоклітинний, передміхурової залози
Молочної залози, товстої та прямої кишок, спг15:96891354-97698742 0,778 аденокарцинома стравоходу, НПК легень, медулобластома, меланома спг17:18837023-19933105 0,815 спі17:22479313-22877776 0,382 Молочної залози, НПК легень спг17:24112056-24310787 0,114 Молочної залози, НПК легень , . Товстої та прямої кишок, аденокарцинома спг17:35067383-35272328 0,149 стравоходу, плоскоклітинний стравоходу спг17:44673157-45080263 0,351
САГ17:55144989-55540417 НПК легень, медулобластома, меланома, яєчників
Спи17:62318152-63890591 1519 Молочної залози, НПК легень, меланома, яєчників спг17:70767943-71305644 0,537 Молочної залози, НПК легень, меланома, яєчників
Спг18:17749667-22797232 5,029 Товстої та прямої кишок, аденокарцинома стравоходу, яєчників
ТАБЛИЦЯ 4
Ілюстративні, але необмежуючі сегменти хромосом, які характеризуються ампліфікаціями, пов'язаними з типами раку. Перераховані типи раку являють собою такі, ідентифіковані у публікації ВегоиКпіт еї аї. Маїиге 18: 463: 899-905
Довжина (Мб) Типи раку, ідентифіковані у даному аналізі, але не у попередніх публікаціях
Спг19:34975531-35098303 0,096 Молочної запози, аденокарцинома стравоходу, плоскоклітинний стравоходу спг19:43177306-45393020 спг19:59066340-59471027 0,321 Молочної залози, НПК легень, яєчників спгг:15977811-16073001 0,056 спг20:29526118-29834552 0,246 спг20:51603033-51989829 0,371 Печінковоклітинний, НПК легень, яєчників спг20:61329497-62435964 0,935 Печінковоклітинний, НПК легень спгг2:19172385-19746441 0,487 сих :152729030-154913754 1,748 Молочної залози, НПК легень, ренальний сиг Хх:66436234-67090514 0,267 Яєчників, передміхурової залози
І00467| Згідно з певними варіантами реалізації у комбінації з ампліфікаціями, описаними вище (у даному документі), або окремо від них ВЧК, ідентифіковані як такі, що свідчать про присутність раку або про підвищений ризик розвитку раку, включають одну або більше делецій, представлених у таблиці 5.
ТАБЛИЦЯ 5
Ілюстративні, але необмежуючі сегменти хромосом, які характеризуються делеціями, пов'язаними з типами раку. Перераховані типи раку являють собою такі, ідентифіковані у публікації ВегоиКпіт еї аї. Маїиге 18: 463: 899-905
Довжина (Мб) Типи раку, ідентифіковані у даному аналізі, але не у попередніх публікаціях
Гострий лімфобластний лейкоз, аденокарцинома спи1:110339388-119426489 Тр13.2 стравоходу, НПК легень, ПК легень, меланома, яєчників, передміхурової залози , . Гострий лімфобластний лейкоз, молочної залози, сп с2г23876038-247249719 1943 ПК легень, меланома, передміхурової залози
Молочної залози, аденокарцинома стравоходу, , . плоскоклітинний стравоходу, НПК легень, ПК спг1:26377344-27532551 1р36.11 легень, медулобластома, мієлопроліферативний розлад, яєчників, передміхурової залози
Гострий лімфобластний лейкоз, молочної залози, плоскоклітинний стравоходу, печінковоклітинний, спи1:3756302-6867 390 Трз6.31 НПК легень, ПК легень, медулобластома, мієлопроліферативний розлад, яєчників, передміхурової залози, ренальний
Молочної залози, аденокарцинома стравоходу, спі1:71284749-74440273 1ра31.1 гліома, печінковоклітинний, НПК легень, ПК легень, меланома, яєчників, ренальний спгг:1-15244284 гре5.3
Молочної залози, товстої та прямої кишок, , . аденокарцинома стравоходу, плоскоклітинний спгг:138479322-143365272 гдгг стравоходу, печінковоклітинний, НПК легень, яєчників, передміхурової залози, ренальний , . Аденокарцинома стравоходу, печінковоклітинний, спгг:204533830-206266883 29332 НПК легень, медулобластома, ренальний
ТАБЛИЦЯ 5
Ілюстративні, але необмежуючі сегменти хромосом, які характеризуються делеціями, пов'язаними з типами раку. Перераховані типи раку являють собою такі, ідентифіковані у публікації ВегоиКпіт еї аї. Маїиге 18: 463: 899-905 у попередніх публікаціях
Молочної залози, дедиференційована ліпосаркома, аденокарцинома стравоходу, спг2:241477619-242951149 2а37.3 плоскоклітинний стравоходу, печінковоклітинний,
НПК легень, ПК легень, медулобластома, меланома, яєчників, ренальний
Дедиференційована ліпосаркома, , аденокарцинома стравоходу, печінковоклітинний, спг3:116900556-120107320 За13.31 НПК легень, меланома, мієлопроліферативний розлад, передміхурової залози
Товстої та прямої кишок, дедиференційована спг3:1-2121282 Зреб.З ліпосаркома, аденокарцинома стравоходу, НПК легень, меланома, мієлопроліферативний розлад
Гострий лімфобластний лейкоз, дедиференційована ліпосаркома, спг3:175446835-178263192 Здеб.31 аденокарцинома стравоходу, НПК легень, меланома, мієлопроліферативний розлад, передміхурової залози
Молочної залози, товстої та прямої кишок, дедиференційована ліпосаркома, аденокарцинома стравоходу, плоскоклітинний спі3:58626894-61524607 Зр14.2 стравоходу, печінковоклітинний, НПК легень, ПК легень, медулобластома, меланома, мієлопроліферативний розлад, яєчників, передміхурової залози, ренальний
Молочної залози, аденокарцинома стравоходу, , плоскоклітинний стравоходу, НПК легень, спг4:186684565-191273063 4435.2 медулобластома, меланома, передміхурової залози, ренальний
Гострий лімфобластний лейкоз, аденокарцинома спг4:91089383-93486891 4д2г21 стравоходу, печінковоклітинний, НПК легень, ренальний
Молочної залози, НПК легень,
Молочної залози, товстої та прямої кишок, дедиференційована ліпосаркома, , аденокарцинома стравоходу, плоскоклітинний спг5:57754754-59053198 5а11.2 стравоходу, ПК легень, меланома, мієлопроліферативний розлад, яєчників, передміхурової залози
Товстої та прямої кишок, дедиференційована спг5:85837489-133480433 Бд21.1 ліпосаркома, НПК легень, ПК легень, мієлопроліферативний розлад, яєчників
Товстої та прямої кишок, дедиференційована , ліпосаркома, аденокарцинома стравоходу, НПК спгв:1543157-2570302 брг5.3 легень, ПК легень, яєчників, передміхурової залози
Товстої та прямої кишок, аденокарцинома , стравоходу, плоскоклітинний стравоходу, НПК спгв:161612277-163134099 бдгб легень, ПК легень, яєчників, передміхурової залози
ТАБЛИЦЯ 5
Ілюстративні, але необмежуючі сегменти хромосом, які характеризуються делеціями, пов'язаними з типами раку. Перераховані типи раку являють собою такі, ідентифіковані у публікації ВегоиКпіт еї аї. Маїиге 18: 463: 899-905
Довжина (Мб) Типи раку, ідентифіковані у даному аналізі, але не у попередніх публікаціях спгв:76630464-105342994 ватв.1 певсто та прямої кишок, печінковоклітинний, НПК.
Молочної залози, товстої та прямої кишок, , Й аденокарцинома стравоходу, плоскоклітинний спг/:141592807-142264966 таза стравоходу, печінковоклітинний, НПК легень, яєчників, передміхурової залози, ренальний
Молочної залози, аденокарцинома стравоходу, , . плоскоклітинний стравоходу, НПК легень, спг7144118814-148066271 таЗ5 меланома, мієлопроліферативний розлад, яєчників
Молочної залози, аденокарцинома стравоходу, , . плоскоклітинний стравоходу, НПК легень, спг7:156893473-158821424 7азв.3 меланома, мієлопроліферативний розлад, яєчників, передміхурової залози спг7:3046420-4279470 7рг2.2 Меланома, мієлопроліферативний розлад, яєчників , Молочної залози, медулобластома, меланома, спг7:65877239-79629882 тал мієлопроліферативний розлад, яєчників 4. Гострий лімфобластний лейкоз, молочної залози, спг8:1-392555 Врг3.З мієлопроліферативний розлад
Гострий лімфобластний лейкоз, дедиференційована ліпосаркома, спг8:2053441-6259545 8раг3.2 аденокарцинома стравоходу, плоскоклітинний стравоходу, печінковоклітинний, НПК легень, мієлопроліферативний розлад
Гострий лімфобластний лейкоз, , . дедиференційована ліпосаркома, спг8:22125332-30139123 Врг12 печінковоклітинний, мієлопроліферативний розлад, яєчників, ренальний
Гострий лімфобластний лейкоз, молочної залози, дедиференційована ліпосаркома, спт8:39008109-41238710 8р11.22 плоскоклітинний стравоходу, печінковоклітинний,
НПК легень, мієлопроліферативний розлад, ренальний
Молочної залози, дедиференційована , . ліпосаркома, плоскоклітинний стравоходу, спг8:42971602-72924037 ва11.22 печінковоклітинний, НПК легень, мієлопроліферативний розлад, ренальний
Гострий лімфобластний лейкоз, молочної залози, спг9:1-708871 9ргі.3 НПК легень, мієлопроліферативний розлад, яєчників, передміхурової залози
Товстої та прямої кишок, аденокарцинома спг9:21489625-22474701 9раг1.3 стравоходу, плоскоклітинний стравоходу, мієлопроліферативний розлад, яєчників спг9:36365710-37139941 Ор13.2 Мієлопроліферативний розлад
Гострий лімфобластний лейкоз, молочної залози, товстої та прямої кишок, аденокарцинома , Й стравоходу, печінковоклітинний, ПК легень, спг9:7161607-12713130 9рга1 медулобластома, меланома, мієлопроліферативний розлад, яєчників, передміхурової залози, ренальний
ТАБЛИЦЯ 5
Ілюстративні, але необмежуючі сегменти хромосом, які характеризуються делеціями, пов'язаними з типами раку. Перераховані типи раку являють собою такі, ідентифіковані у публікації ВегоиКпіт еї аї. Маїиге 18: 463: 899-905
Довжина (Мб) Типи раку, ідентифіковані у даному аналізі, але не у попередніх публікаціях 4. Товстої та прямої кишок, НПК легень, ПК легень, спг10:1-1042949 1ор15.3 яєчників, передміхурової залози, ренальний , Молочної залози, товстої та прямої кишок, гліома, спт10:129812260- 1Од2г6.3 НПК легень, ПК легень, меланома, яєчників, 135374737 - ренальний
Спи10:52313829-53768264 10911.23 Товстої та прямої кишок, НПК легень, ПК легень, яєчників, ренальний спі10:89467202-90419015 1бд23.31 Молочної залози, ПК легень, яєчників, ренальний спи11:107086196- 114231 Аденокарцинома стравоходу, медулобластома, 116175885 де. ренальний
Молочної залози, дедиференційована спи11:1-1391954 11р15.5 ліпосаркома, аденокарцинома стравоходу, НПК легень, медулобластома, яєчників , . Аденокарцинома стравоходу, плоскоклітинний спг11130280899 11д25 стравоходу, печінковоклітинний, НПК легень, 134452384 - медулобластома, ренальний спг11:82612034-85091467 119141
Молочної залози, печінковоклітинний, сп12:11410696-12118386 12р13.2 мієлопроліферативний розлад, передміхурової залози сп12:131913408- 1242433 Дедиференційована ліпосаркома, НПК легень, 132349534 дет. мієлопроліферативний розлад
Молочної залози, товстої та прямої кишок, спі12:97551177-99047626 12да23.1 плоскоклітинний стравоходу, НПК легень, мієлопроліферативний розлад спг13:111767404- . . . о 114142980 1Заз4 Молочної залози, печінковоклітинний, НПК легень спг13:1-23902184 13д12.11
Печінковоклітинний, ПК легень, спг13:46362859-48209064 13д14.2 мієлопроліферативний розлад, передміхурової залози спи13:92308911-94031607 139313 Молочної залози, печінковоклітинний, НПК легень, ренальний спи14:1-29140968 149112 Гострий лімфобластний лейкоз, аденокарцинома стравоходу, мієлопроліферативний розлад , . Дедиференційована ліпосаркома, спг14:65275722-67085224 14д23.3 мієлопроліферативний розлад
Гострий лімфобластний лейкоз, спі14:80741860-106368585 14аз2.12 дедиференційована ліпосаркома, меланома, мієлопроліферативний розлад
Гострий лімфобластний лейкоз, молочної залози, спг15:1-24740084 15411.2 аденокарцинома стравоходу, НПК легень, мієлопроліферативний розлад, яєчників , . Аденокарцинома стравоходу, НПК легень, спг15:35140533-43473382 15415.1 мієлопроліферативний розлад 4. Аденокарцинома стравоходу, печінковоклітинний, спг16:1-359092 16р13.3 НПК легень, ренальний , Молочної залози, печінковоклітинний, НПК
ТАБЛИЦЯ 5
Ілюстративні, але необмежуючі сегменти хромосом, які характеризуються делеціями, пов'язаними з типами раку. Перераховані типи раку являють собою такі, ідентифіковані у публікації ВегоиКпіт еї аї. Маїиге 18: 463: 899-905
Довжина (Мб) Типи раку, ідентифіковані у даному аналізі, але не у попередніх публікаціях
Печінковоклітинний, НПК легень, , . медулобластома, меланома, спг16:5062786-7709383 16р13.3 мієлопроліферативний розлад, яєчників, ренальний
Молочної залози, товстої та прямої кишок, , . аденокарцинома стравоходу, печінковоклітинний, спг16:76685816-78205652 16д23 НПК легень, ПК легень, медулобластома, ренальний ренальний , . Товстої та прямої кишок, печінковоклітинний, НПК спг16:88436931-88827254 1баг24.3 легень, передміхурової залози, ренальний
Спи17:10675416-12635879 17р12 ов ПК легень, мієлопроліферативний
Молочної залози, товстої та прямої кишок, , . дедиференційована ліпосаркома, НПК легень, ПК спгл17:26185485-27216066 17911.2 легень, меланома, мієлопроліферативний розлад, яєчників
Молочної залози, товстої та прямої кишок, , . дедиференційована ліпосаркома, ПК легень, спг17:37319013-37988602 17921.2 меланома, мієлопроліферативний розлад, яєчників спг17:7471230-7717938 17р13.1 спи17:78087533-78774742 17995.3 розлад та прямої кишок, мієлопроліферативний спи18:1-587750 18р11.32 Мієлопроліферативний розлад спг18:46172638-49935241 18д21.2 Аденокарцинома стравоходу, НПК легень
Товстої та прямої кишок, аденокарцинома спи18:75796373-76117153 1823 стравоходу, плоскоклітинний стравоходу, яєчників, передміхурової залози спг19:1-526082 19р13.3 Печінковоклітинний, НПК легень, ренальний спі19:21788507-34401877 19р12 Печінковоклітинний, НПК легень, ренальний , Молочної залози, печінковоклітинний, НПК
Молочної залози, товстої та прямої кишок, , . дедиференційована ліпосаркома, спг19:63402921-63811651 19413.43 печінковоклітинний, НПК легень, медулобластома, яєчників, ренальний 4. Молочної залози, дедиференційована спгг011-З25978 горіз ліпосаркома, НПК легень
Аденокарцинома стравоходу, НПК легень, , . медулобластома, меланома, спг20:14210829-15988895 гор1і2г1 мієлопроліферативний розлад, передміхурової залози, ренальний спг21:38584860-42033506 21422.2 спг22:20517661-21169423 22411.22 Гострий лімфобластний лейкоз, аденокарцинома стравоходу спг22:45488286-49691432 2241333 Молочної залози, печінковоклітинний, НПК легень, ПК легень
Сп: 1-3243111 Хр2г2.33 Аденокарцинома стравоходу, НПК легень, ПК легень
ТАБЛИЦЯ 5
Ілюстративні, але необмежуючі сегменти хромосом, які характеризуються делеціями, пов'язаними з типами раку. Перераховані типи раку являють собою такі, ідентифіковані у публікації ВегоиКпіт еї аї. Маїиге 18: 463: 899-905 у попередніх публікаціях стравоходу, гліома
І00468| Анеуплоїдії, ідентифіковані як характерні для різних типів раку (наприклад, анеуплоїдії, ідентифіковані у таблицях 4 та 5), можуть містити гени, які, як відомо, залучені у етіологію раку (наприклад, онкосупресори, онкогени та т.д.). Дані анеуплоїдії можна також аналізувати для ідентифікації значимих, але раніше не відомих генів.
І00469| Наприклад, у публікації ВегоиКпіт еї аЇ., посилання вище, оцінювали потенційні викликаючі рак гени при змінах числа копій із застосуванням алгоритму ОКАЇЇ. (бепе
Кеїанопо5пір5 Атопо Ітріїсаїей Госі20, взаємозв'язок генів серед залученого локусу 20), який проводить пошук у відношенні функціональних взаємозв'язків серед геномних областей. ОКАЇЇ. підраховує кожен ген у сукупності геномних областей у відношенні його "зв'язаності" з генами у іншій області на підставі текстової подібності між опублікованими тезисами всіх наукових статей, у яких згадуються гени, на підставі того, що деякі цільові гени будуть функціонувати у загальних шляхах. Дані способи дозволяють проводити ідентифікацію/характеризацію генів, раніше не зв'язаних з конкретними типами раку, про які йде мова.
Таблиця 6 ілюструє цільові гени, які, як відомо, знаходяться у межах ідентифікованого ампліфікованого сегменту та прогнозованих генів, а таблиця 7 ілюструє цільові гени, які, як відомо, знаходяться у межах ідентифікованого делетованого сегменту та прогнозованих генів.
ТАБЛИЦЯ 6
Ілюстративні, але необмежуючі сегменти хромосом та гени, які, як відомо або як прогнозують, присутні у областях, які характеризуються ампліфікацією при різних типах раку (див., наприклад, публікацію ВегоиКніт еї аЇ. посилання вище) смуга мішень ОКАЇЇ. 17412 |спл735067383-352072328 | 6 | ЕВВВ2 |ЕВВВа2,С17оп37 о ла2і2 сп 48661965-149063439Ї.4.Й.ШЮСЮН-Я | МС! (МОЛ 12415 |спл2гбво49634-68327239| .-: 2 | (дІвВСю
Хаг8 0000 |спіх52729030-154913754. 53 | - І5РВУЗ3 ///: о 2ба13.2 |спг0:51603033-519899829 | .-: 1 | -(."у:ГИр0Й (йМЕ217 о врії21 |спв4200663242404492, |. в | -( (РІАТГ//::ИО о 17921.33 |спл1744673157-45060263| 4 | (МОВ РНВ З
ТАБЛИЦЯ 6
Ілюстративні, але необмежуючі сегменти хромосом та гени, які, як відомо або як прогнозують, присутні у областях, які характеризуються ампліфікацією при різних типах раку (див., наприклад, публікацію ВегоиКпіт еї аЇ. посилання вище) смуга мішень СКАЇЇ. спг13:108477140- тва бродют 00010040 о лта14.1 0 |сплл1у6699529-78005085| 14 | ..ЙюЮК/О (Аг о 20а13.33 |спе061329497-62435964 | 38 | |ВІВС7 о 17а23.1 |спл755144989-55540417 | 5 | 0 (АРОбБКВІ ГГ: 1 лрТ2 (сп лт19996566-120303234|їдЇ./ 5 | о |8Еб4 о 8агіл13 |сп81242335-81979194 | 3 | ТИ МЕ704, 7ВТВІо о вреї.1 |спеба3556800-44361368 | 18 | -// ОО 0УБОРА//:
ОБРІЇ 0 |спем5312870-49697231 | 0 | 7771 1 1а44 0 |сплсе41364021-247249719|...ДГДГДЮИ71 | ....юЮюЮ/Ю/Ю/ЮОС ФАКТ о 5аЗ5.3 |спт174477192-180857866|Ї.Ї..922 2 | ОО (РлЛ4 о 18а11.2 |спл817749667-22797232 | 21 | .-.// О |САВІЕБ! о 17а25.1 |спл7:70767943-71305641 | 13 | фовВаіТоВ:
ОНАБбІ13, РОТ, звис (витанооюаюют 51 НН о л7ріт.2 |спл7л8837023-19933105| 12 | -./У:И/ 0 ЇМАРК7Ї //::Г АБ о 8деалі1 |спл16186189-120600761|.Ї 13 | (МОМ леді 0 |сплгбб458200-66543552 |. ./-:/ 0 | | 9 о л9а13.2 |спл943177306-45393020| 60 | (СО ОАг57,ОУВКІВ спг11:101433436- я Поммею. 00000000 | ВІВСА вс о лерії.21 |сплгі30999223-32594050 | .-:/ (9 | -////// ТООХ11, РАМбОА о лрУЄЗЗ (сп с-51605667 | 777 | 77777777 0(тРУЯЗГГ/: о л7агаа |спл7бва318152-63890591,|..ЙЮю12 | -.-./|( |ВРТЕ о лаг33 |спг158317017-159953843|Ї 52 2 | -.-/"-/// О|РЕАТ5Ї о лагаЗ |спл169549478-170484405|6 6 | .-./"НК/"/ |ВАТ2О1 МОСС о 8аг23 |спп01163387-103693879|. 14 | -.-./У/ (ввМев/ 7/7 о 13а31.3 (|спл389500014-93206506| 3 | (ОРО5 -Г Ф (/ о л2агт1 0 |сплг0849987-70966467 |.ЦГ.0 | ЇЇ о лері3.33 |сплал-1311104.|771о |! 0МК77/7/77/У о лрагте |сплгб85о527-77064746 |, ..-Ц/- «00 | її о 19413.42 |спл959066340-59471027 | 19 2 | | РАКСО, Т5ЕМ34А леді |сплг8788913-42596599| 12 | -- ЩЇАСАМТ52О 124231 |сплго5089777-95350380| 2 | (БЕЖ о леде1.32 |сплгв5О72329-85674601 |. 0 | її о лбд22.3 0 |спло74560456-82020637 | 46 | ОО |5ЕТРАІВ/:- о Зрії.1 0 |спе:8б250885-95164178 | 8 | 0 (РОЛК З ла. |спл7е2479313-22877776 |, ...Ц.1..ЮЮ.|...ЮЙЮюИЙ1 МВ
РТР4АЗ, МАРКА, ва салюти: 7000000
І бат2 0 |спебб3255006-65243766 | З | -/| М |РТРЯАТЇГ//:ГО
ТАБЛИЦЯ 6
Ілюстративні, але необмежуючі сегменти хромосом та гени, які, як відомо або як прогнозують, присутні у областях, які характеризуються ампліфікацією при різних типах раку (див., наприклад, публікацію ВегоиКпіт еї аЇ. посилання вище) смуга мішень СКАЇЇ. ладі |сплал-е3і451939,.77..77.|..ЮюЮюю95 2 Ю Ю | щ ІВСІ2І2 С
МААВР, МАРІ 41, оовааз |спелауевоятелабатааг! 76 10000000 два о бргд1 |спб-е36288407 |. 95 | 2 щ-Б (ЕБ2З о л3а12.2 |сплЗи-408296865...... | 110 | 7 РОХОТСГ//Г/:Д о леагтї 0 |спл2т2596017-73080606|..Й.ЧЦДЦЙ0 | її спі14:106074644- оомаваза ва: 0000011
Го лтріЗ (сп із2о2и116-37799354 |... 35 | (Мп 4
ТАБЛИЦЯ 7
Ілюстративні, але необмежуючі сегменти хромосом та гени, які, як відомо або як прогнозують, присутні у областях, які характеризуються ампліфікацією при різних типах раку (див., наприклад, публікацію ВегошиКпіїт еї аЇ., посилання вище) смуга генів мішень ОКАЇЇ. 13ЗД14.2 (спи 34636285948209064 |. 8 | вв |В 4435.2 |спас186684565-191273063) 15 | (гВО2, ТОВВАО 2437.3 (|спесе41477619-2429511491.Й 19 | | ТМЕМІ6О, ІМО5 я аджиі 5- тво воюн
РРАР2С, С19оп20 орли
АЧАРІ1 4де2.1 0 |спес91089383-93486891. | 2 | (| мМосС48628.707ШГЧУ 8д23 0000000 |спл875796373-76117153 |. 4 | -(Х |РАНОвОдГ//З/ЗГоО бра5.3 0000 |спбіи543157-2570302. | 2 | ( |РОСТ С: 19413.43 |спле63402921-63811651 | 17 | -:Х |иМЕ3а4 134452384
Зат2.11 0 |спи3л-23902184.777 1771129. | 2 .-.юЙ7/ АТС 22913.33 |спте2:45488286-49691432 | 38 | | ТОвВасРЄ 5ЯТ.2 0 |спи5л-24740084. |. 20 | 2 .-:.:ир.рррр/р/р/С/СОФ|А26ВІСС ггдії22 |спе220517661-21169423 |. З | (М ЇУРВЕВІЇ //-: ( яви 5-1 и 135374737
ТАБЛИЦЯ 7
Ілюстративні, але необмежуючі сегменти хромосом та гени, які, як відомо або як прогнозують, присутні у областях, які характеризуються ампліфікацією при різних типах раку (див., наприклад, публікацію ВегошиКпіїт еї аЇ., посилання вище) смуга генів мішень СКАЇЇ. бра3.3 00000 |спеи-392555.........Ю.1..Ю.2 | 77171711 |ЯМЕ5У6 лрУб.ЛІ 0 |сплс26377344-27532551 | 24 | |ЗМ щ
Лт1рі5.5 0 |спитл-1391954.77777777.17.ЙЮю49 | щБ |ВАЗЗРЕГ,; /::( КІ 116175885
Зраї.3 00 |спе-708871.77777 17115 | щБ« |РОХОЄ С/Г 15415.1 (сп 5:3514053343473382 | 109 | | тТОвоСРА;
Трі32 0 |спло110339388-1194264891... 81 | -:М |МАСЗ - Ф
Храг.33 0 |спебт-ЗаЯз! 7777/1721 77171711 |5НОХЙССсСшС
Зраб.3 00000 |спел-21212827 1712 | 77717111 (сн т о одшдеі яте - 132349534 ідіЛИНН сій ідіовіаноннй НОВІ НИМИ соні
Сбоп162, СОЧШАТО
Врії.22 (|сп:39008109-41238710 | 7 | -(хФБ |СВой4, 7МАТА:С 19а13.32 (|спл952031294-53331283 | 25 | |ВВОЗ3 С:
Орі5.3 |сплол-1042949,.4.7.7..ю.ююЮЙ.|1.ЮКХМ(Й | щ (тов СГС ваїї.2 0 |сплб31854743-53525739 | 37 | - |В: гОоріз 0 |спеОй-325978 |. 10 | 7777 |80Х12СС 5аЗ5.3 000000 |спе177541057-1808578661 43 | |5СОВЗАї ШО брі3.3 |сплби-359092.77.7.....ЙЮЙ.1.ЙЮЙМ16 | 2 щ-Б.:КУМУ:.ЙМЙ |НВИС/С/:/(: З 17д2і2 0 |спл737319013-37988602 | 22 | -( |СМР. СГС гра5.3 00000 |спе-15244284. |. 51 | 77777777 Мить
За13.31 (|спел16900556-1201073201.. 1 | - (ДІ5АМР/Г//::Г/ 14943212 |спла80741860-1063685851 154 | -- |РВІМАТГ///:Г 1баг4.3 |сплб88436931-88827254 |...Й9 | -: |Сібо З 17925.3 (|спл778087533-78774742 | 8 | -(|:БЙМУ |ИМЕ750О лУрі2 0 |спле21788507-34401877 | 12 | -( (и Меа92, 2МЕ99 4ріб.3 0 |спап-435799.77..СК,/ХЇ | 4 | 7777777 (МИ 18рії.32 0 |спл81-587750.7.7.....Ю.ЙЩЛЙ.ї.Ю..4 6 Ю | Ж щ |СОЕС2 враї.2 0 |спбегі25332-30139123 | 63 | щ- ГО РУБІ2, 5БТММА вн ДЕ Я
ВВ1СсС1
ТАБЛИЦЯ 7
Ілюстративні, але необмежуючі сегменти хромосом та гени, які, як відомо або як прогнозують, присутні у областях, які характеризуються ампліфікацією при різних типах раку (див., наприклад, публікацію ВегошиКпіїт еї аЇ., посилання вище) смуга генів мішень СКАЇЇ. 114141 спи11:82612034-85091467 рісг ССос89,
ССоС9оВ,
ТМЕМ12бА 14423.3 (|сплаб5275722-67085224 |. 7 | -( | ОРНМ.ОМРР5:Щ/ и дян 5 кю ор 114142980
ТМРАБЗЗ2/ЕНО ню пО51 лядіт.2 0 |сплал-291409686,77777 | 140 | -:Н (Я Мег219, МОНО
ІЇ00470| Згідно з різними варіантами реалізації передбачене застосування способів, розглянутих у даному документі, для ідентифікації ВЧК сегментів, що містять ампліфіковані області або гени, зазначені у таблиці 6, та/або застосування способів, розглянутих у даному документі, для ідентифікації ВЧК сегментів, що містять делетовані області або гени, ідентифіковані у таблиці 7.
І00471| Відповідно до одного варіанту реалізації способи, описані у даному документі, забезпечують засоби для оцінки взаємозв'язку між ампліфікацією гену та ступенем розвинення пухлини. Кореляція між ампліфікацією та/або делецією та стадією або ступенем злоякісності раку може бути важливою із прогностичної точки зору, оскільки така інформація може сприяти визначенню ступеня злоякісності пухлини на генетичній основі, яка краще передбачить майбутній перебіг захворювання, причому більш прогресуючі пухлини будуть характеризуватися найгіршим прогнозом. Крім цього, інформація відносно подій ранньої ампліфікації та/або делеції може бути підходящою при співвіднесенні даних подій як провісників наступного прогресування захворювання. (00472) Ампліфікація та делеції гену, ідентифіковані даним способом, можуть бути пов'язані з іншими відомими параметрами, такими як ступінь злоякісності пухлини, гістологія, рівень включення мітки Вга/Ога, гормональний статус, ураження лімфовузлів, розмір пухлини, тривалість виживання та інші властивості пухлини, доступні з епідеміологічних та біостатистичних досліджень. Наприклад, ДНК пухлини, яку досліджують даним способом, може включати атипову гіперплазію, протокову карциному іп 5йи, рак І-Ш стадії та метастатичні лімфатичні вузли для того, щоб забезпечити ідентифікацію взаємозв'язків між ампліфікаціями та делеціями та стадією. Встановлені взаємозв'язки можуть уможливити ефективне терапевтичне втручання. Наприклад, систематично ампліфіковані області можуть містити надекспресований ген, на продукт якого можна впливати терапевтичним способом (наприклад, рецепторною тирозинкіназою фактору росту, р'ВБНЕКЗ). (00473) Згідно з різними варіантами реалізації способи, описані у даному документі, можна застосовувати для ідентифікації подій ампліфікації та/або делеції, зв'язаних зі стійкістю до лікарських засобів, за допомогою визначення варіації числа копій послідовностей нуклеїнової кислоти з первинних типів раку у відношенні таких клітин, які метастазували у інші ділянки.
Якщо ампліфікація та/або делеція гену являє собою маніфестацію каріотипової нестабільності, що забезпечує швидкий розвиток стійкості до лікарських засобів, можна чекати більше ампліфікацій та/"або делецій у первинних пухлинах від не сприйнятливих до хіміотерапії пацієнтів, ніж у пухлинах сприйнятливих до хіміотерапії пацієнтів. Наприклад, якщо ампліфікація конкретних генів відповідає за розвиток стійкості до лікарських засобів, області, що оточують дані гени, як очікується, будуть систематично ампліфіковані у пухлинних клітинах від плеврального випоту не сприйнятливих до хіміотерапії пацієнтів, але не у первинних пухлинах.
Відкриття взаємозв'язків між ампліфікацією та/або делецією гену та розвиненням стійкості до лікарських засобів може дозволити ідентифікувати пацієнтів, які одержать або не одержать користь від ад'ювантної терапії. 00474) За аналогією з описаними для визначення присутності або відсутності повних та/або часткових анеуплоїдій хромосом плода у материнському зразку, способи, апарати та системи, описані у даному документі, можна застосовувати для визначення присутності або відсутності повних та/або часткових анеуплоїдій хромосом у будь-якому зразку від пацієнта, що містить нуклеїнові кислоти, наприклад, ДНК або вцДНК (включаючи зразки пацієнта, які не являють собою материнські зразки). Зразок від пацієнта може являти собою будь-який тип біологічного зразку, як описано у іншому місці у даному документі. Переважно, зразок одержують у результаті неінвазивних процедур. Наприклад, зразок може являти собою зразок крові або фракцію сироватки та плазми крові. У якості альтернативи, зразок може являти собою зразок сечі або зразок фекалій. Згідно із третіми варіантами реалізації зразок являє собою зразок біопсії тканини. У всіх випадках зразок містить нуклеїнові кислоти, наприклад, вціДНК або геномну ДНК, яку очищають та секвенують із застосуванням будь-якого зі способів секвенування СНП, описаних раніше. 00475) Згідно із даним способом можна визначити як повні, так і часткові анеуплоїдії хромосом, пов'язані з виникненням та прогресуванням раку. (00476) Згідно з різними варіантами реалізації при застосуванні способів, описаних у даному документі, для визначення присутності та/"або підвищеного ризику розвитку раку можна здійснити нормування даних у відношенні хромосоми або хромосом, для яких визначають ВЧК.
Згідно з певними варіантами реалізації нормування даних можна здійснити у відношенні плеча або плечей хромосоми, для якої визначають ВЧК. Згідно з певними варіантами реалізації нормування даних можна здійснити у відношенні конкретного сегмента або сегментів, для яких визначають ВЧК.
ІЇ00477| На додаток до ролі ВЧК при раку ВЧК пов'язані із зростаючою кількістю розповсюджених комплексних захворювань, включаючи вірус імунодефіциту людини (ВІЛ), аутоїмунні захворювання та спектр нейропсихіатричних розладів.
ВЧК при інфекційних та аутоїмунних захворюваннях 00478) На сьогоднішній день у багатьох дослідженнях повідомлялося про взаємозв'язок між
ВЧК у генах, зв'язаних із запаленням та імунною відповіддю, та ВІЛ, астмою, хворобою Крона та іншими аутоїмунними розладами (Рапсішції єї а!., Сп Сепеї 77:201-213 (20101). Наприклад, ВЧК у
ССІЗ311 була залучена у схильність до ВІЛ/СНІДу (ССІ 311, делеція 17411.2), ревматоїдного артриту (ССІ 311, делеція 17411.2) та хвороби Кавасакі (ССІ 311, дуплікація 17д4д11.2); ВЧК у
НВО-2, як повідомлялося, робить схильним до хвороби Крона товстого кишечнику (НОВ-2, делеція 8р23.1) та псоріазу (НОВ-2, делеція 8р23.1); ВЧК у ЕСОКЗВ, як показано, робить схильним до гломерулонефриту при системному червоному вовчаку (ЕСОКЗВ, делеція 1423, дуплікація 1д23), васкуліту, асоційованого з антитілами проти цитоплазми нейтрофілів (апії- пешгорпі! суоріазтіс апіроду, АМСА) (ЕСОКЗВ, делеція 1423), та підвищує ризик розвитку ревматоїдного артриту. Існує щонайменше два запальних або аутоїмунних захворювання, які, як було показано, пов'язані із ВЧК у різних локусах гену. Наприклад, хвороба Крона пов'язана з низьким числом копій у НОВ-2, але також із загальним делеційним поліморфізмом вище від гену
ІЗАКМ, який кодує члена сімейства зв'язаних з імунітетом р47 ГТІФаз. На додаток до взаємозв'язку із числом копій ЕСОКЗВ також повідомлялося про у значній мірі підвищену схильність до СЧВ (системного червоного вовчаку) серед суб'єктів з більш низькою кількістю копій компоненту комплементу Са.
І00479| У багатьох незалежних дослідженнях повідомлялося про взаємозв'язки між геномними делеціями у локусах 55ТМ1 (З5ТМІ1, делеція 1423) та 51711 (51711, делеція 22411.2) та підвищеним ризиком розвитку атопічної бронхіальної астми. Згідно з деякими варіантами реалізації способи, описані у даному документі, можна застосовувати для визначення присутності або відсутності ВЧК, пов'язаної із запаленням та/або аутоїмунними захворюваннями. Наприклад, дані способи можна застосовувати для визначення присутності
ВЧК у пацієнта, який, як підозрюють, страждає від ВІЛ, астми або хвороби Крона. Приклади
ВЧК, пов'язаної з такими захворюваннями, включають, без обмеження, делеції у 17411.2, 8р23.1, 1423 та 22911.2 та дуплікації у 17411.2 та 1д23. Згідно з деякими варіантами реалізації даний спосіб можна застосовувати для визначення присутності ВЧК у генах, включаючи, без обмеження, ССІ ЗІ 1, НВО-2, ЕСОКЗВ, О5ТМ, О5111, С4 та ІКОМ.
Захворювання ВЧК нервової системи
І00480| Повідомлялося про взаємозв'язки між де помо та вродженою ВЧК та декількома розповсюдженими неврологічними та психіатричними захворюваннями при аутизмі, шизофренії 60 та епілепсії та деяких випадках нейродегенеративних захворювань, таких як хвороба
Паркінсона, аміотрофічний латеральний склероз (АЛС) та аутосомна домінантна хвороба
Альцгеймера (Рапсішії ей а)., Сіп бепеї 77:201-213 120101). Цитогенетичні аномалії спостерігалися у пацієнтів з аутизмом та розладами аутичного спектру (РАС) з дуплікаціями у 15411-413. Згідно з Консорціумом Геномного проекту аутизму (Ашіб5хт Сепоте рго)есі
Сбопвопіцт) 154 ВЧК, включаючи декілька рецидивуючих ВЧК, на хромосомі 15411-д13 або у новому геномному розташуванні, включаючи хромосому 2р1іб, 1421 та у 17р12, у області, пов'язаній із синдромом Сміта-Магеніса, перекриваються з РАС. Рецидивуючі мікроделеції або мікродуплікації на хромосомі 16р11.2 підкреслили спостереження про те, що ВЧК дае помо виявлені у локусах генів, таких як ЗНАМКЗ (делеція 22413.3), нейрексину 1 (МЕХМ/І1, делеція 2р16.3) та нейроглінів (МіОМ4, делеція Хр22.33), які, як відомо, регулюють синаптичну диференціацію та регулюють вивільнення глутамінергічного нейротрансміттеру. Шизофренія також пов'язана з безліччю ВЧК де помо. Мікроделеції та мікродуплікації, пов'язані із шизофренією, включають надмірну представленість генів, що належать до нейроонтогенетичного та глутамінергічного шляхів; це свідчить, що безліч ВЧК, що вражають дані гени, можуть прямо сприяти патогенезу шизофренії, наприклад, ЕКВВА4, делеція 2434,
ЗІ С1ТАЗ, делеція 5р13.3; КАРЕСБН4, делеція 2431.1; СІТ, делеція 12.24; та безліч генів з ВЧК де помо. ВЧК також були пов'язані з іншими неврологічними розладами, включаючи епілепсію (СНАЕМА?7, делеція 15413.3), хворобу Паркінсона (5МСА, дуплікація 4422) та АЛС (5ММІ, делеція 5412.2.-Д13.3; та делеція 5ММ2). Згідно з деякими варіантами реалізації способи, описанні у даному документі, можна застосовувати для визначення присутності або відсутності
ВЧК, пов'язаної із захворюваннями нервової системи. Наприклад, дані способи можна застосовувати для визначення присутності ВЧК у пацієнта, який, як підозрюють, страждає від аутизму, шизофренії, епілепсії, нейродегенеративних захворювань, таких як хвороба
Паркінсона, аміотрофічний латеральний склероз (АЛС) або аутосомна домінантна хвороба
Альцгеймера. Данні способи можна застосовувати для визначення ВЧК генів, пов'язаних із захворюваннями нервової системи, включаючи, без обмеження, будь-який з розладів аутичного спектру (РАС), шизофренію та епілепсію, та ВЧК генів, пов'язаних з нейродегенеративними розладами, такими як хвороба Паркінсона. Приклади ВЧК, пов'язаних 3 такими захворюваннями, включають, без обмеження, дуплікації у 15411-д13, 2гр16, Тд21, 17р12, 16р11.2 та 4422 та делеції у 22413.3, 2р16.3, Хр22.33, 2434, 5р13.3, 2431.1, 12.24, 154д13.3 та 5412.2.
Згідно з деякими варіантами реалізації дані способи можна застосовувати для визначення присутності ВЧК у генах, включаючи, без обмеження, ЗНАМКЗ, МІ (М4, МАХМ1І, ЕКВВА, 5І С1АЗ, КАРСЕНА, СІТ, СНКМА?7, 5МСА, ЗММІ та 5ЗММ2.
ВЧК та метаболічні або серцево-судинні захворювання 00481) У багатьох дослідженнях повідомлялося про взаємозв'язок між метаболічними та серцево-судинними характеристиками, такими як сімейна гіперхолестеринемія (СГ), атеросклероз та захворювання коронарної артерії, та ВЧК (Рапсіші еї а!., Сп Сепеї 77:201-213
І2010Ї). Наприклад, реаранжування зародкової лінії, головним чином, делеції, спостерігалися у гені ГОЇ К (СОЇ К, делеція/дуплікація 19р13.2) у деяких пацієнтів зі СГ, які не несли інші мутації
ГОГК. Інший приклад являє собою ген І РА, що кодує аполіпопротеїн(а) (Апо(а)), концентрація якого у плазмі пов'язана з ризиком захворювання коронарної артерії, інфаркту міокарда (ІМ) та інсульту. Концентрації Апо(а), що містить ліпопротеїн Гра), у плазмі відрізняються у 1000 разів серед індивідуумів, та 90 95 даної варіабельності генетично визначене у локусі ІРА, причому концентрація у плазмі та розмір ізоформ І р(а) пропорційні у високому ступені варійованій кількості послідовностей повтору "Кгіпдіе 4" (діапазон 5-50). Ці дані свідчать, що ВЧК у щонайменше двох генах може бути пов'язана з ризиком розвитку серцево-судинних захворювань. Способи, описані у даному документі, можна застосовувати у великих дослідженнях для специфічного пошуку взаємозв'язку ВЧК із серцево-судинними розладами.
Згідно з деякими варіантами реалізації даний спосіб можна застосовувати для визначення присутності або відсутності ВЧК, пов'язаної з метаболічним або серцево-судинним захворюванням. Наприклад, даний спосіб можна застосовувати для визначення присутності
ВЧК у пацієнта, який, як підозрюють, страждає від сімейної гіперхолестеринемії. Способи, описані у даному документі, можна застосовувати для визначення ВЧК генів, пов'язаних з метаболічним або серцево-судинним захворюванням, наприклад, гіперхолестеринемією.
Приклади ВЧК, пов'язаної з такими захворюваннями, включають, без обмеження, делецію/дуплікацію 19р13.2 гену І 0 К та множення у гені І РА.
Апарати та системи для визначення ВЧК
І00482| Аналіз даних секвенування та діагнозу, поставленого на основі цих даних, як правило, проводять із застосуванням різних виконуваних комп'ютером алгоритмів та програм. бо Внаслідок цього у певних варіантах реалізації застосовують процеси з використанням даних, які зберігають у одній або більше комп'ютерних системах або інших системах обробки інформації або передають за допомогою даних систем. Варіанти реалізації, розкриті у даному документі, також відносяться до апарату для здійснення даних операцій. Даний апарат може бути спеціально сконструйований для потрібних цілей або він може являти собою комп'ютер загального призначення (або групу комп'ютерів), вибірково активований або реконфігурований комп'ютерною програмою та/або структурою даних, які зберігають на комп'ютері. Згідно з деякими варіантами реалізації група процесорів здійснює деякі або всі із перерахованих аналітичних операцій спільно (наприклад, за допомогою мережі або комп'ютеризованого обчислення у хмарі) талабо паралельно. Процесор або група процесорів для здійснення способів, описаних у даному документі, можуть відноситися до різних типів, включаючи мікроконтролери та мікропроцесори, такі як програмоване обладнання (наприклад, СРІО,
Сотрієх Ргодгаттабіе І одіс ЮОемісе5, складне обладнання із програмувальною логікою, та
ЕРСА, Рієїй Ргодгаттабріеє Сае Аггтау, програмувальна логічна інтегральна схема) та непрограмоване обладнання, такі як логічна матриця АБІС (Арріїсайоп 5ресіїйс Іпіедгатей Сігсий, спеціалізована замовна інтегральна схема), або мікропроцесори загального призначення.
Ї00483| Крім цього, певні варіанти реалізації відносяться до матеріального та/або енергонезалежного машинозчитуваного носія інформації або продуктів комп'ютерної програми, які включають інструкції тал"або дані програми (включаючи структури даних) для здійснення різних комп'ютеризованих операцій. Приклади машинозчитуваних носіїв інформації включають, без обмеження, напівпровідникові запам'ятовувальні пристрої, магнітні носії інформації, такі як дискові накопичувачі, магнітну стрічку, оптичні носії інформації, такі як СО, магнітооптичні носії інформації та електронні пристрої, які спеціальним чином конфігуровані для зберігання та виконання програмних інструкцій, такі як постійно запам'ятовувальні пристрої (Кеаа-Опіу
Метогу Оемісе5, КОМ) та запам'ятовувальний пристрій з довільним порядком вибірки (Капдот
Ассе5з5 Метогу, КАМ). Кінцевий користувач може контролювати машинозчитуваний носій інформації прямо або кінцевий користувач може контролювати носій інформації опосередковано. Приклади носіїв інформації із прямим контролем включають носій інформації, розташований на користувацькому обладнанні, та/або носій інформації, який не є загальним з іншими структурами. Приклади носія інформації з опосередкованим контролем включають носій інформації, який є опосередковано доступним для користувача через зовнішню мережу та/або за допомогою загальних ресурсів, що забезпечують сервіс, таких як "хмара". Приклади програмних інструкцій включають як машинний код, такий як утворений за допомогою компілятора, так і файли, що містять код більш високого рівня, який може бути виконаний комп'ютером із застосуванням інтерпретатора.
І00484| Згідно з різними варіантами реалізації дані або інформація, застосовувані у розкритих способах та апаратах, запропоновані у електронному форматі. Такі данні або інформація можуть включати ріди та мітки, отримані зі зразку нуклеїнової кислоти, підраховані значення або щільності таких міток, які вирівнюються з конкретними областями референсної послідовності (наприклад, які вирівнюються із хромосомою або сегментом хромосоми), референсні послідовності (включаючи референсні послідовності, що забезпечують винятково або переважно поліморфізми), дози хромосоми та сегменту, рішення, такі як рішення про анеуплоїдію, нормовані значення хромосоми та сегментів, пари хромосом або сегментів та відповідних нормуючих хромосом або сегментів, консультаційні рекомендації, діагнози і т.п. У даному документі дані або інша інформація, надана у електронному форматі, доступна для зберігання у машині та для передачі між машинами. Звичайно дані у електронному форматі запропоновані у цифровій формі та можуть зберігатися у вигляді бітів та/або байтів у різних структурах даних, переліках, базах даних і т.д. Дані можна реалізувати електронним, оптичним способом і т.д.
ІЇ00485| У одному варіанті реалізації забезпечений продукт комп'ютерної програми для одержання вихідного сигналу, що свідчить про присутність або відсутність анеуплоїдії, наприклад, анеуплоїдії плода або раку, у досліджуваному зразку. Комп'ютерний продукт може містити інструкції для здійснення будь-якого одного або більше описаних вище способів для визначення хромосомної аномалії. Як пояснено, комп'ютерний продукт може містити енергонезалежний та/або матеріальний машинозчитуваний носій, що містить виконувану або компільовану комп'ютером логічну схему (наприклад, інструкції), записану на ньому для включення процесору для визначення дози хромосом та, у деяких випадках, присутності або відсутності анеуплоїдії плода. У одному прикладі комп'ютерний продукт містить машинозчитуваний носій, що містить виконувану або компільовану комп'ютером логічну схему (наприклад, інструкції), записану на ньому, для включення процесору для діагностики бо анеуплоїдії плода, що включає: процедуру одержання для одержання даних секвенування із щонайменше частини молекул нуклеїнової кислоти з материнського біологічного зразку, причому зазначені дані секвенування містять обчислену дозу хромосоми та/або сегменту; комп'ютеризовану логічну схему для аналізу анеуплоїдії плода на основі зазначених отриманих даних; та процедури на виході для одержання вихідного сигналу, що свідчить про присутність, відсутність або тип зазначеної анеуплоїдії плода.
І00486| Інформацію про послідовність із розглянутого зразку можна картувати на референсні послідовності хромосоми для ідентифікації кількості міток послідовності для кожної з будь-якої однієї або більше хромосом, що представляють інтерес, та для ідентифікації кількості міток послідовності для послідовності нормуючого сегмента для кожної із зазначених будь-якої однієї або більше хромосом, що представляють інтерес. Згідно з різними варіантами реалізації референсні послідовності зберігають у базі даних, такій як, наприклад, реляційна або об'єктна база даних.
І00487| Слід розуміти, що у більшості випадків для людини непрактично або навіть неможливо без сторонньої допомоги здійснити комп'ютерні операції способів, розкритих у даному документі. Наприклад, для картування одного ріду довжиною 30 п.о. зі зразку на будь- яку із хромосом людини без допомоги комп'ютерного апарату можуть знадобитися роки зусиль.
Зрозуміло, проблема збільшується тим, що для прийняття надійних рішень про анеуплоїдію, як правило, потрібно картування тисяч (наприклад, щонайменше приблизно 10000) або навіть мільйонів рідів на одну або більше хромосом. 00488) Способи, розкриті у даному документі, можна здійснити із застосуванням системи для оцінки числа копій генетичної послідовності, що представляє інтерес, у досліджуваному зразку. Система містить: (а) секвенатор для одержання нуклеїнових кислот з досліджуваного зразку, який забезпечує інформацію про послідовність нуклеїнової кислоти зі зразку; (б) процесор; та (с) один або більше машинозчитуваних носіїв інформації, на яких зберігаються інструкції для виконання на зазначеному процесорі з метою здійснення способу для ідентифікації будь-якої ВЧК, наприклад, анеуплоїдій хромосом або часткових анеуплоїдій. (004891 Згідно з деякими варіантами реалізації способи інструктуються машинозчитуваним носієм, на якому зберігаються машинозчитувані інструкції для здійснення способу з метою ідентифікації будь-якої ВЧК, наприклад, анеуплоїдій хромосом або часткових анеуплоїдій.
Таким чином, у одному варіанті реалізації запропонований продукт комп'ютерної програми, що містить один або більше машинозчитуваних носіїв, призначених для довготривалого зберігання інформації, на яких зберігаються виконувані комп'ютером інструкції, які при виконанні одним або більше процесорами комп'ютерної системи змушують комп'ютерну систему реалізувати спосіб для оцінки числа копій послідовності, що представляє інтерес, у досліджуваному зразку, що містить плідні та материнські безклітинні нуклеїнові кислоти. Спосіб включає: (а) приймання рідів (зчитувань) послідовності, отриманих у результаті секвенування фрагментів безклітинної нуклеїнової кислоти у досліджуваному зразку; (Б) вирівнювання рідів послідовності фрагментів безклітинної нуклеїнової кислоти з референсним геномом, що містить послідовність, що представляє інтерес, з одержанням, таким чином, міток досліджуваної послідовності, причому референсний геном розділений на множину блоків; (с) визначення розмірів фрагментів безклітинної нуклеїнової кислоти, що існують у досліджуваному зразку; (4) зважування міток досліджуваної послідовності на основі розмірів фрагментів безклітинної нуклеїнової кислоти, з яких одержують мітки; (е) обчислення перекриттів для блоків на основі зважених міток (а); та () ідентифікацію варіації числа копій у послідовності, що представляє інтерес, з обчислених перекриттів. Згідно з деякими варіантами реалізації зважування міток досліджуваної послідовності включає зсув перекриттів у бік міток досліджуваної послідовності, отриманої із фрагментів безклітинної нуклеїнової кислоти розміру або діапазону розміру, характерного для одного геному у досліджуваному зразку. Згідно з деякими варіантами реалізації зважування міток досліджуваної послідовності включає присвоєння значення 1 міткам, отриманим із фрагментів безклітинної нуклеїнової кислоти розміру або діапазону розміру, та присвоєння значення 0 іншим міткам. Згідно з деякими варіантами реалізації спосіб також включає визначення у блоках референсного геному, що містять послідовність, що представляє інтерес, значень параметру розміру фрагменту, включаючи кількість фрагментів безклітинної нуклеїнової кислоти у досліджуваному зразку, розмір фрагментів яких є більш коротким або більш довгим, ніж граничне значення. У даному документі ідентифікація варіації числа копій у послідовності, що представляє інтерес, включає застосування значень параметру розміру фрагмента, а також перекриттів, обчислених на етапі (є). Згідно з деякими варіантами реалізації система спроектована для оцінки числа копій у досліджуваному зразку із застосуванням різних способів та процесів, які Обговорюються вище. бо (00490) Згідно з деякими варіантами реалізації інструкції можуть також містити автоматично реєстровану інформацію, що відноситься до способу, таку як дози хромосом та присутність або відсутність анеуплоїдії хромосоми плода у медичній карті пацієнта для суб'єкта-людини, від якої був отриманий материнський досліджуваний зразок. Медична карта пацієнта може зберігатися, наприклад, у лабораторії, кабінеті лікаря, лікарні, організації медичного забезпечення, страховій компанії або на веб-сайті з персональними медичними картами. Також на основі результатів здійснюваного процесором аналізу спосіб може додатково включати призначення, початок та/або зміну лікування суб'єкта-людини, від якої був отриманий материнський досліджуваний зразок. Спосіб може включати здійснення одного або більше додаткових досліджень або аналізів додаткових зразків, відібраних від суб'єкта. 00491) Розкриті способи можна також здійснювати із застосуванням системи комп'ютерної обробки інформації, яка пристосована або сконфігурована для здійснення способу з метою ідентифікації будь-якої ВЧК, наприклад, анеуплоїдій хромосом або часткових анеуплоїдій. У одному варіанті реалізації запропонована система комп'ютерної обробки інформації, яка пристосована або сконфігурована для здійснення способу, як описано у даному документі.
Відповідно до одного варіанту реалізації апарат містить обладнання для секвенування, пристосоване або сконфігуроване для секвенування щонайменше частини молекул нуклеїнової кислоти у зразку для одержання типу інформації про послідовність, описану у іншому місці у даному документі. Апарат може також містити компоненти для процесингу зразку. Такі компоненти описані у іншому місці у даному документі.
І00492| Послідовність або інші дані можна вводити у комп'ютер або зберігати на машинозчитуваному носії прямо або опосередковано. Відповідно до одного варіанту реалізації комп'ютерна система прямо з'єднана з обладнанням для секвенування, яке прочитує та/або аналізує послідовності нуклеїнових кислот зі зразків. Послідовності або іншу інформацію від таких інструментів одержують через інтерфейс комп'ютерної системи. У якості альтернативи, послідовності, процесовані системою, одержують із джерела зберігання послідовностей, такого як база даних або інший репозиторій. Після того як запам'ятовувальний пристрій або обладнання пам'яті великої ємності стає доступним апарату для обробки інформації, запам'ятовувальний пристрій зберігає у буфері або зберігає щонайменше тимчасово послідовності нуклеїнових кислот. Крім цього, запам'ятовувальний пристрій може зберігати підраховані значення міток для різних хромосом або геномів і т.д. Пам'ять може також зберігати різні послідовності команд та/або програми для аналізу представленої послідовності або картованих даних. Такі програми/послідовності команд можуть включати програми для здійснення статистичних аналізів і т.д. 00493) У одному прикладі користувач вносить зразок у апарат для секвенування. Апарат
З5 для секвенування, який приєднаний до комп'ютера, збирає та/або аналізує дані. Програмне забезпечення на комп'ютері дозволяє збирати та/або аналізувати дані. Дані можна зберігати, демонструвати (за допомогою монітора або іншого аналогічного обладнання) та/або направляти у інше місце розташування. Комп'ютер може бути приєднаний до інтернету, який застосовують для передачі даних на кишенькове обладнання, використовуване віддаленим користувачем (наприклад, лікарем, дослідником або аналітиком). Слід розуміти, що перед передачею дані можна зберігати та/або аналізувати. Згідно з деякими варіантами реалізації первинні дані збирають та відправляють віддаленому користувачеві або апарату, який буде аналізувати та/або зберігати дані. Передачу можна здійснити через Інтернет, але можна також здійснити через супутник або інше з'єднання. У якості альтернативи, дані можна зберігати на машинозчитуваному носії, та носій можна доставити кінцевому користувачеві (наприклад, поштою). Віддалений користувач може бути у тому ж або у відмінному географічному місцерозташуванні, включаючи, без обмеження, будинок, місто, штат, країну або континент. (00494) Згідно з деякими варіантами реалізації дані способи також включають збір даних щодо множини полінуклеотидних послідовностей (наприклад, рідів, міток та/або послідовностей референсних хромосом) та відправлення даних на комп'ютер або іншу комп'ютерну систему.
Наприклад, комп'ютер може бути приєднаний до лабораторного устаткування, наприклад, апарату для збору зразку, апарату для ампліфікації нуклеотидів, апарату для секвенування нуклеотидів або апарату для гібридизації. Потім комп'ютер може збирати застосовувані дані, отримані лабораторним обладнанням. Дані можна зберігати на комп'ютері на будь-якому етапі, наприклад, протягом збору у режимі реального часу, перед відправленням, протягом або у поєднанні з відправленням або після відправлення. Дані можна зберігати на машинозчитуваному носії, який можна відокремити від комп'ютера. Зібрані або збережені дані можна передати від комп'ютера у віддалене місце розташування, наприклад, через локальну мережу або мережу зв'язку для великої області, таку як Інтернет. У віддаленому бо місцерозташуванні можна здійснити різні операції з переданими даними, як описано нижче.
ІЇ00495| Серед типів форматованих електронним способом даних, які можна зберігати, передавати, аналізувати та/або з якими можна маніпулювати у системах, апаратах та способах, розкритих у даному документі, присутні наступні:
Ріди, отримані у результаті секвенування нуклеїнових кислот у досліджуваному зразку,
Мітки, отримані за допомогою вирівнювання рідів з референсним геномом або іншою референсною послідовністю або послідовностями,
Референсний геном або послідовність,
Щільність мітки послідовності - Підраховані значення або кількості міток для кожної із двох або більше областей (як правило, хромосом або сегментів хромосом) референсного геному або інших референсних послідовностей,
Ідентичності нормуючих хромосом або сегментів хромосом для конкретних хромосом або сегментів хромосом, що представляють інтерес,
Дози хромосом або сегментів хромосом (або інших областей), отримані із хромосом або сегментів, що представляють інтерес, та відповідні нормуючі хромосоми або сегменти,
Пороги для прийняття рішення про дози хромосом як уражені, неуражені або "рішення відсутнє",
Фактичні рішення про дози хромосом,
Діагнози (клінічний стан, пов'язаний із прийнятим рішенням),
Рекомендації щодо наступних досліджень, отримані з рішень та/або діагнозів,
Плани лікування та/або спостереження, отримані з рішень та/або діагнозів. (00496) Ці різні типи даних можна одержати, зберігати, передавати, аналізувати та/або маніпулювати з ними у одному або більше місцях розташування із застосуванням різних апаратів. Варіанти обробки даних охоплюють широкий спектр. На одному кінці спектру всю або більшу частину даної інформації зберігають та застосовують у місцерозташуванні, у якому процесують досліджуваний зразок, наприклад, у кабінеті лікаря або інших клінічних умовах. У іншому протилежному варіанті зразок одержують у одному місцерозташуванні, процесують та необов'язково секвенують у відмінному місцерозташуванні, ріди вирівнюють та рішення приймають у одному або більше відмінних місцях розташування, та діагнози, рекомендації та/або плани готують у третьому місцерозташуванні (яке може являти собою місце розташування, у якому був отриманий зразок).
І00497| Згідно з різними варіантами реалізації ріди одержують за допомогою апарату для секвенування, а потім передають у віддалений пункт, у якому їх процесують для прийняття рішень про анеуплоїдії. У даному віддаленому місцерозташуванні, як приклад, ріди вирівнюють із референсною послідовністю для одержання міток, які підраховують та відносять до хромосом або сегментів, що представляють інтерес. Також у віддаленому місцерозташуванні підраховані значення перетворюють у дози із застосуванням зв'язаних нормуючих хромосом або сегментів.
У ще більш віддаленому місцерозташуванні дози використовують для прийняття рішень про анеуплоїдії. (00498) Серед операцій процесингу, які можна застосовувати у різних місцях розташування, виділяють наступні:
Збір зразку
Процесинг зразку до секвенування
Секвенування
Аналіз даних послідовності та прийняття рішень про анеуплоїдії
Діагностика
Надання звіту про діагноз та/або рішення пацієнтові або медичному працівникові
Розробка плану наступного лікування, дослідження та/або спостереження
Виконання плану
Консультування 00499) Будь-яку одну або більше із даних операцій можна автоматизувати, як описано у іншому місці у даному документі. Як правило, секвенування та аналіз даних послідовності та прийняття рішень про анеуплоїдії будуть здійснювати комп'ютерним способом. Інші операції можна здійснювати вручну або автоматично. 00500) Приклади місць розташування, у яких можна здійснювати збір зразку, включають кабінети практикуючих лікарів, клініки, будинки пацієнтів "у яких забезпечений інструмент або набір для збору зразку) та мобільний медичний автотранспорт. Приклади місць розташування, у яких можна здійснювати процесинг зразку перед секвенуванням, включають кабінети практикуючих лікарів, клініки, будинки пацієнтів "у яких забезпечений апарат або набір для процесингу зразку), мобільний медичний автотранспорт та приміщення постачальників послуг з бо аналізу анеуплоїдії. Приклади місць розташування, у яких можна здійснювати секвенування,
включають кабінети практикуючих лікарів, клініки, кабінети практикуючих лікарів, клініки, будинки пацієнтів (у яких забезпечений апарат або набір для секвенування зразку), мобільний медичний автотранспорт та приміщення постачальників послуг з аналізу анеуплоїдії. Може бути запропоноване місце розташування, у якому проводять секвенування, з'єднане з виділеною мережею для передачі даних послідовності (як правило, рідів) у електронному форматі. Таке з'єднання може бути дротовим або бездротовим та може бути конфігуроване для відправлення даних у пункт, у якому дані можна обробляти та/або агрегувати перед передачею у пункт процесингу. Агрегацію даних можуть проводити організації охорони здоров'я, такі як організації медичного забезпечення (ОМ3).
І0ОО501| Операції аналізу та/"або одержання можна здійснити у будь-якому з вищезгаданих місць розташування або, у якості альтернативи, у ще одній віддаленій ділянці, призначеній для обчислення та/або проведення аналізу даних про послідовність нуклеїнової кислоти. Такі місця розташування включають, наприклад, кластери, такі як парки серверів загального призначення, приміщення підприємств-постачальників послуг з аналізу анеуплоїдії і т.п. Згідно з деякими варіантами реалізації комп'ютерний апарат, застосовуваний для здійснення аналізу, беруть у тимчасове користування або оренду. Комп'ютерні ресурси можуть бути частиною доступної через Інтернет сукупності процесорів, такі ресурси для обробки інформації у розмовній мові відомі як "хмара". У деяких випадках обчислення здійснюють за допомогою паралельної або широкомасштабної паралельної групи процесорів, які зв'язані або не зв'язані один з іншим.
Обробку даних можна здійснювати із застосуванням розподіленої обробки даних, такий як кластерне комп'ютеризоване обчислення, мережне комп'ютеризоване обчислення і т.п. Згідно з такими варіантами реалізації кластер або мережа комп'ютерних ресурсів у сукупності утворюють віртуальний суперкомп'ютер, що складається з безлічі процесорів або комп'ютерів, які спільно функціонують для здійснення аналізу та/або одержання, описаних у даному документі. Дані технології а також більш загальноприйняті суперкомп'ютери, можна застосовувати для обробки даних послідовності, як описано у даному документі. Кожен з них являє собою форму паралельного комп'ютеризованого обчислення, основаного на процесорах або комп'ютерах. У випадку мережного комп'ютеризованого обчислення дані процесори (часто цілі комп'ютери) з'єднані мережею (приватною, суспільною або Інтернет) за допомогою загальноприйнятого мережного протоколу, такого як ЕШегпеї. Навпаки, суперкомп'ютери містять безліч процесорів, з'єднаних локальною високошвидкісною комп'ютерною шиною.
І0О5021 Згідно з певними варіантами реалізації діагноз (наприклад, що плід страждає від синдрому Дауна або що пацієнт страждає від конкретного типу раку) ставлять у тому ж місцерозташуванні, де проводять операцію аналізу. Згідно з іншими варіантами реалізації діагноз ставлять у відмінному місцерозташуванні. У деяких прикладах надання звіту про діагноз здійснюють у місцерозташуванні, у якому був отриманий зразок, незважаючи на те, що це не завжди повинно обов'язково виконуватися на практиці. Приклади місць розташування, у яких можна поставити або надати звіт про діагноз та/"або у яких здійснюють розробку плану, включають кабінети практикуючих лікарів, клініки, інтернет-сайти, доступні на комп'ютері, та кишенькові обладнання, такі як мобільні телефони, планшетні обладнання, смартфони і т.д., які мають дротове або бездротове з'єднання з мережею. Приклади місць розташування, у яких здійснюють консультування, включають кабінети практикуючих лікарів, клініки, інтернет-сайти, доступні на комп'ютері, кишенькові обладнання і т.д. 005031) Згідно з деякими варіантами реалізації збір зразка, процесинг зразку та операції секвенування здійснюють у першому місцерозташуванні, та операції аналізу та одержання здійснюють у другому місцерозташуванні. Однак у деяких випадках збір зразку здійснюють у одному місцерозташуванні (наприклад, кабінеті практикуючого лікаря або у клініці), а процесинг і секвенування зразку здійснюють у відмінному місцерозташуванні, яке необов'язково являє собою те ж місце розташування, у якому відбувається аналіз та прийняття рішення. (00504) Згідно з різними варіантами реалізації послідовність перерахованих вище операцій може запускатися користувачем або суб'єктом, що починає збір зразку, процесинг та/або секвенування зразку. Після того як одна або більше із даних операцій були початі, виконання іншої операції може піти природним чином. Наприклад, операція секвенування може викликати автоматичний збір рідів та їх відправлення у апарат для обробки інформації, який потім проводить, часто автоматично та, можливо, без додаткового втручання користувача, аналіз послідовності та операцію прийняття рішення про анеуплоїдію. Згідно з деякими варіантами реалізації результат даної операції обробки даних потім автоматично передають, можливо, з переформатуванням у вигляді діагнозу, у компонент системи або установу, яка обробляє та повідомляє інформацію медичному фахівцеві та/або пацієнтові. Як пояснено, така інформація 60 також може бути автоматично оброблена для одержання плану лікування, дослідження та/або спостереження, можливо, разом з консультаційною інформацією. Таким чином, початок операції ранньої стадії може запустити безперервну послідовність, у якій медичному фахівцеві, пацієнтові або іншій зацікавленій стороні буде забезпечений діагноз, план, консультування та/або інша інформація, що підходить для впливу на фізичний стан. Процес здійснюють, навіть якщо частини загальної системи фізично розділені та, можливо, віддалені від місця розташування, наприклад, апарату для зразку та послідовності.
І0О50О5| На фігурі 5 представлений один варіант реалізації дисперсної системи для одержання рішення або діагностики досліджуваного зразку. Місце розташування для збору зразку 01 використовують для одержання досліджуваного зразку від пацієнта, такого як вагітний суб'єкт жіночої статі або передбачуваний пацієнт, що страждає від раку. Потім зразки направляють у місце розташування для процесингу та секвенування 03, де досліджуваний зразок може бути процесований та секвенований, як описано вище. Місце розташування 03 містить апарат для процесингу зразку, а також апарат для секвенування процесованого зразку.
Результатом секвенування, як описано у іншому місці у даному документі, є сукупність рідів, які, як правило, запропоновані у електронному форматі та які направляють у мережу, таку як
Інтернет, відмічену обліковим номером 05 на фігурі 5.
І0ОО506) Данні про послідовність направляють у віддалене місце розташування 07, у якому здійснюють аналіз та прийняття рішення. Дане місце розташування може містити одне або більше потужних комп'ютерних обладнань, таких як комп'ютери або процесори. Після того як комп'ютерні ресурси у місцерозташуванні 07 завершили аналіз та одержали з отриманої інформації про послідовність рішення, це рішення передають назад у мережу 05. Згідно з деякими варіантами реалізації у місцерозташуванні 07 одержують не тільки рішення, але також ставлять зв'язаний діагноз. Потім рішення та/або діагноз передають по мережі назад у місце розташування для збору зразку 01, як проілюстровано на фігурі 5. Як пояснено, описана процедура є лише одним з багатьох варіантів того, як різні операції, зв'язані з одержанням рішення або діагнозу, можуть бути розділені на різні місця розташування. Один розповсюджений варіант включає проведення збору та процесингу та секвенування зразку у одному місцерозташуванні. Інший варіант включає проведення процесингу та секвенування у тому самому місцерозташуванні, що і аналіз і прийняття рішення.
І00507| Фігура б конкретизує варіанти для здійснення різних операцій у різних місцях розташування. У найбільш деталізованому випадку, представленому на фігурі 6, кожну наступну операцію здійснюють у окремому місцерозташуванні: збір зразку, процесинг зразку, секвенування, вирівнювання рідів, прийняття рішення, діагностику та надання звіту та/або розробку плану. 00508) Відповідно до одного варіанту реалізації, який поєднує деякі з даних операцій, процесинг та секвенування зразку здійснюють у одному місцерозташуванні, а вирівнювання рідів, прийняття рішення та діагностику здійснюють у окремому місцерозташуванні. Див. частину фігури 6, відмічену умовною позначкою А. Згідно з іншим варіантом реалізації, який позначено на фігурі Є символом В, збір зразку, процесинг та секвенування зразку здійснюють у тому самому місцерозташуванні. Згідно з даним варіантом реалізації вирівнювання рідів та прийняття рішення здійснюють у другому місцерозташуванні. Нарешті, діагностику та надання звіту та/лабо розробку плану здійснюють у третьому місцерозташуванні. Згідно з варіантом реалізації позначеному на фігурі б символом С, збір зразку здійснюють у першому місцерозташуванні, процесинг зразку, секвенування, вирівнювання рідів, прийняття рішення та діагностику здійснюють спільно у другому місцерозташуванні, та надання звіту та/або розробку плану здійснюють у третьому місцерозташуванні. Нарешті, згідно з варіантом реалізації, позначеному на фігурі 6 символом 0, збір зразку здійснюють у першому місцерозташуванні, процесинг зразку, секвенування, вирівнювання рідів та прийняття рішення здійснюють у другому місцерозташуванні, та діагностику та надання звіту та/"або керування планом здійснюють у третьому місцерозташуванні.
ІЇ0О0509| У одному варіанті реалізації запропонована система для застосування при визначенні присутності або відсутності будь-якої однієї або більше різних повних анеуплоїдій хромосом плода у материнському досліджуваному зразку, що містить нуклеїнові кислоти плода і матері, причому зазначена система містить секвенатор для одержання зразку нуклеїнової кислоти та забезпечення інформації про послідовність нуклеїнової кислоти плода та матері зі зразку; процесор; та машинозчитуваний носій для зберігання інформації, що містить інструкції для виконання на зазначеному процесорі, причому зазначені інструкції містять: (а) код для одержання інформації про послідовність для зазначених нуклеїнових кислот плода та матері у зразку; бо (б) код для застосування зазначеної інформації про послідовність для ідентифікації комп'ютерним способом кількості міток послідовності з нуклеїнових кислот плода та матері для кожної будь-якої однієї або більше хромосом, що представляють інтерес, які обрано із хромосом 1 - 22, Х та У, та для ідентифікації кількості міток послідовності для щонайменше однієї послідовності нормуючої хромосоми або послідовності нормуючого сегмента хромосоми для кожної із зазначеної будь-якої однієї або більше хромосом, що представляють інтерес; (с) код для застосування зазначеної кількості міток послідовності, ідентифікованих для кожної із зазначених будь-якої однієї або більше хромосом, що представляють інтерес, та зазначеної кількості міток послідовності, ідентифікованих для кожної послідовності нормуючої хромосоми або послідовності нормуючого сегмента хромосоми, для обчислення одиничної дози хромосоми для кожної з будь-якої однієї або більше хромосом, що представляють інтерес; та (4) код для порівняння кожної з одиничних доз хромосом для кожної з будь-якої однієї або більше хромосом, що представляють інтерес, з відповідним граничним значенням для кожної з однієї або більше хромосом, що представляють інтерес, та за допомогою цього визначення присутності або відсутності будь-якої однієї або більше повних різних анеуплоїдій хромосом плода у зразку.
ЇОО510| Згідно з деякими варіантами реалізації код для обчислення одиничної дози хромосоми для кожної з будь-якої однієї або більше хромосом, що представляють інтерес, містить код для обчислення дози хромосоми для обраної однієї із хромосом, що представляють інтерес, у вигляді співвідношення кількості міток послідовності, ідентифікованих для вибраної хромосоми, що представляє інтерес, та кількості міток послідовності, ідентифікованих для відповідної послідовності щонайменше однієї нормуючої хромосоми або послідовності нормуючого сегменту хромосоми для вибраної хромосоми, що представляє інтерес.
ЇОО511| Згідно з деякими варіантами реалізації система також містить код для повторюваного обчислення дози хромосоми для кожного з будь-яких сегментів хромосоми, що залишилися, будь-якого одного або більше сегментів будь-якої однієї або більше хромосом, що представляють інтерес.
ЇОО512| Згідно з деякими варіантами реалізації одна або більше хромосом, що представляють інтерес, вибраних із хромосом 1 - 22, Х та У, містить щонайменше двадцять хромосом, вибраних із хромосом 1 - 22, Х та У, та причому інструкції містять інструкції для визначення присутності або відсутності щонайменше двадцяти різних повних анеуплоїдій хромосом плода.
І0ОО513) Згідно з деякими варіантами реалізації щонайменше одна послідовність нормуючої хромосоми являє собою групу хромосом, вибраних із хромосом 1 - 22, Х та У. Згідно з іншими варіантами реалізації щонайменше одна послідовність нормуючої хромосоми являє собою одну хромосому, яка вибрана із хромосом 1 - 22, Х та У.
І00О514| Згідно з іншим варіантом реалізації запропонована система для застосування при визначенні присутності або відсутності будь-якої однієї або більше різних часткових анеуплоїдій хромосом плода у материнському досліджуваному зразку, що містить нуклеїнові кислоти плода та матері, причому зазначена система містить: секвенатор для одержання зразку нуклеїнової кислоти та забезпечення інформації про послідовність нуклеїнової кислоти плода та матері зі зразку; процесор; та машинозчитуваний носій для зберігання, що містить інструкції для виконання на зазначеному процесорі, причому зазначені інструкції містять: (а) код для одержання інформації про послідовність для зазначених нуклеїнових кислот плода та матері у зазначеному зразку; (Б) код для застосування зазначеної інформації про послідовність для ідентифікації комп'ютерним способом кількості міток послідовності з нуклеїнових кислот плода та матері для кожного з будь-якого одного або більше сегментів будь-якої однієї або більше хромосом, що представляють інтерес, вибраних із хромосом 1 - 22, Х та У, та для ідентифікації кількості міток послідовності для щонайменше однієї послідовності нормуючого сегменту для кожного з зазначених будь-якого одного або більше сегментів будь-якої однієї або більше хромосом, що представляють інтерес; (с) код із застосуванням зазначеної кількості міток послідовності, ідентифікованих для кожного з зазначених будь-якого одного або більше сегментів будь-якої однієї або більше хромосом, що представляють інтерес, та зазначеної кількості міток послідовності, ідентифікованих для зазначеної послідовності нормуючого сегмента для обчислення одиничної дози сегмента хромосоми для кожного з зазначених будь-якого одного або більше сегментів будь-якої однієї або більше хромосом, що представляють інтерес; та (4) код для порівняння кожної з зазначених одиничних доз сегмента хромосоми для кожного із зазначеного будь-якого одного або більше сегментів будь-якої однієї або більше хромосом, бо що представляють інтерес, з відповідним граничним значенням для кожного із зазначеного будь-якого одного або більше сегментів хромосоми будь-якої однієї або більше хромосом, що представляють інтерес, та за допомогою цього визначення присутності або відсутності однієї або більше різних часткових анеуплоїдій хромосом плода у зазначеному зразку.
І00О515) Згідно з деякими варіантами реалізації код для обчислення одиничної дози сегмента хромосоми містить код для обчислення дози сегмента хромосоми для обраного одного із сегментів хромосоми як співвідношення кількості міток послідовності, ідентифікованих для обраного сегмента хромосоми, та кількості міток послідовності, ідентифікованих для послідовності відповідного нормуючого сегмента для обраного сегменту хромосоми.
І0О516) Згідно з деякими варіантами реалізації система також містить код для повторення обчислення дози сегмента хромосоми для кожного з будь-яких сегментів хромосоми, що залишилися, будь-якого одного або більше сегментів будь-якої однієї або більше хромосом, що представляють інтерес.
І00О517| Згідно з деякими варіантами реалізації система також містить (ї) код для повторення етапів (а)-(4) для досліджуваних зразків від різних материнських суб'єктів, та (ії) код для визначення присутності або відсутності будь-якої однієї або більше різних часткових анеуплоїдій хромосом плода у кожному із зазначених зразків.
І00О518) Згідно з іншими варіантами реалізації будь-якої із систем, запропонованих у даному документі, код також містить код для автоматичної реєстрації присутності або відсутності анеуплоїдії хромосоми плода, яку визначають на етапі (4), у медичній карті пацієнта для суб'єкта-людини, від якого був отриманий материнський досліджуваний зразок, причому зазначену реєстрацію здійснюють із застосуванням процесора.
І005191| Згідно з деякими варіантами реалізації будь-якої із систем, запропонованих у даному документі, секвенатор спроектований для здійснення секвенування нового покоління (СНІП).
Згідно 3 деякими варіантами реалізації секвенатор спроектований для здійснення широкомасштабного паралельного секвенування із застосуванням секвенування за допомогою синтезу із оборотними барвниками-термінаторами. Згідно з іншими варіантами реалізації секвенатор спроектований для здійснення секвенування за допомогою лігування. Згідно із третіми варіантами реалізації секвенатор спроектований для здійснення одномолекулярного секвенування. о ПРИКЛАДИ
Приклад 1 Одержання та секвенування первинних та збагачених бібліотек секвенування а. Одержання бібліотек секвенування - скорочений протокол (АВВ) 00520) Усі бібліотеки секвенування, тобто первинні та збагачені бібліотеки, одержували із приблизно 2 нг очищеної вцДНК, яку екстрагували з материнської плазми. Одержання бібліотеки здійснювали із застосуванням набору реактивів МЕВвМехі М ОМА Затріє Ргер ОМА
Кеадепі 5еї 1 (номер за каталогом ЕбО0ООЇ Мем Епдіапа Віоїаб5, Іпсвич, Массачусетс) для
Шитіпаф у такий спосіб. Оскільки безклітинна ДНК плазми у природі є фрагментованою, яку- небудь додаткову фрагментацію зразків ДНК плазми за допомогою пульверизації або обробки ультразвуком не проводили. Виступаючі кінці приблизно 2 нг очищених фрагментів вшцДНК у 40 мкл перетворювали у фосфорильовані тупі кінці згідно з модулем МЕВМехке Епа Кераїг Моаше за допомогою інкубації вциДНК у мікроцентрифужній пробірці об'ємом 1,5 мл з 5 мкл Т0Х буферу для фосфорилювання, 2 мкл суміші дезоксинуклеотидів у розчині (10 мМ кожного дНТФ), 1 мкл
ДНК-полімерази І у розведенні 1:5, 1 мкл ДНК-полімерази ТА та 1 мкл полінуклеотидкінази ТА з набору реактивів МЕВвМехі м ОМА бЗатріеє Ргер ОМА Кеадепі Зеї 1 протягом 15 хвилин при температурі 20 "С. Потім ферменти інактивували нагріванням за допомогою інкубації реакційної суміші при температурі 75 "С протягом 5 хвилин. Суміш охолоджували до температури 4 "С, та проводили приєднання аА-«хвоста" до тупих кінців ДНК із застосуванням 10 мкл майстер-мікс для приєднання дА-«хвоста", що містить фрагмент Кленова (від 3'- до 5'-екзо мінус) (МЕВвМехі тм
ОМА бЗатріє Ргер ОМА Кеадепі зеї 1), та інкубації протягом 15 хвилин при температурі 37 "С.
Потім фрагмент Кленова інактивували нагріванням за допомогою інкубації реакційної суміші при температурі 75"С протягом 5 хвилин. Після інактивації фрагмента Кленова 1 мкл суміші
Сепотіс Адаріог ОЇїдо Міх (номер за каталогом 1000521; ПШитіпа Іпс., Хейвард, Каліфорнія)
Шитіпа у розведенні 1:5 застосовували для лігування адаптерів Шитіпа (неіндексні У-адаптери) із ДНК із приєднаним аА-«хвостом" із застосуванням 4 мкл ДНК-лігази Т4 з набору реактивів
МЕВМехі м ОМА Затріе Ргер ОМА Кеадепі Зеї 1 за допомогою інкубації реакційної суміші протягом 15 хвилин при температурі 25"7С. Суміш охолоджували до температури 4 "С, та ліговану з адаптерами вцДНК очищали від нелігованих адаптерів, димерів адаптерів та інших реактивів із застосуванням магнітних бусин із системи для очищення продуктів ПЛР Адепсоипгі
АМРиге ХР (номер за каталогом Аб6Є3881; Весктап Сошіег Сепотіс5, Денверс, Массачусетс). бо Для селективного збагачення лігованої з адаптерами вшцДНК (25 мкл) проводили вісімнадцять циклів ПЛР із застосуванням майстер-мікс РпизіопФ Нідп-Рідеїйу Мазіег Міх (25 мкл; Ріппгутев,
Уоберн, Массачусетс) та праймерів для ПЛР Шитіпа (0,5 мкМ кожного), комплементарних адаптерам (номер за каталогом 1000537 та 1000537). Проводили ПЛР лігованої з адаптерами
ДНК (98 "С протягом 30 секунд; 18 циклів 98 "С протягом 10 секунд, 65 "С протягом 30 секунд та 72 7С протягом 30; кінцева елонгація при температурі 72 "С протягом 5 хвилин, зберігання при температурі 4 "С) із застосуванням праймерів Сепотіс РСК Ргїтег5 (МоМе за каталогом 100537 та 1000538) Шитіпа та майстер-мікс Рпизіоп НЕ РСК Мазєвіег Міх з набору реактивів МЕВвМехі М
ОМА Затріє Ргер ОМА Кеадепі зЗеї 1 у відповідності з інструкціями виробника. Ампліфікований продукт очищали із застосуванням системи для очищення продуктів ПЛР Адепсошгі АМРиге ХР (Адепсошгі Віозсіепсе Согрогайоп, Беверлі, Массачусетс) у відповідності з інструкціями виробника, доступними за адресою: млуимі. ресктапдепотісв.сопт/ргодисів/Атригехрргоїосої 000387У001. ра". Очищений ампліфікований продукт елюювали у 40 мкл буферу ЕВ Оіадеп, та концентрацію та розмір розподілу ампліфікованих бібліотек аналізували із застосуванням набору Адіїепі ОМА 1000 Кії для біоаналізатору 2100 Віоапаїугег (Адіепі Тесппоіодієз Іпс., Санта-Клара, Каліфорнія). р. Одержання бібліотек секвенування - повний протокол 00521) Повний протокол, описаний у даному документі, являє собою по суті стандартний протокол, запропонований компанією Шитіпа, та відрізняється від протоколу Шитіпа винятково очищенням ампліфікованої бібліотеки. Протокол Шитіпа інформує, що очищення ампліфікованої бібліотеки проводять із застосуванням гель-електрофорезу, у той час як у протоколі, описаному у даному документі, для даного етапу очищення застосовують магнітні бусини. Для одержання первинної бібліотеки секвенування із застосуванням набору реактивів
МЕВМехі м ОМА Затріє Ргер ОМА Кеадепі Зеї 1 (номер по каталогу ЕбОООІ: Мем Епдіапа
Віоїар5, Іпсвич, Массачусетс) для ПШиптіпафФ по суті у відповідності з інструкціями виробника застосовували приблизно 2 нг очищеної вцДНК, екстрагованої з материнської плазми. Усі етапи, за винятком підсумкового очищення лігованих з адаптерами продуктів, що здійснювали із застосуванням магнітних бусин та реактивів Адепсоцйгі замість колонки для очищення, проводили згідно із протоколом, що супроводжує реактиви МЕВМех! М Кеадепів Тог Затріє
Ргерагайоп для бібліотеки геномної ДНК, яку секвенують із застосуванням САЇЇ Шитіпаф)
Протокол МЕВМех! "М по суті відповідає протоколу, запропонованому ІПШитіпа, який доступний за адресою: дгеї.|пІтпіІ.еди/пі5/ргоїосоіІ5/11257047 Спір Затріє Ргер.раї.
ІЇ00522| Виступаючі кінці приблизно 2 нг очищених фрагментів вуиДНК у 40 мкл перетворювали у фосфорильовані тупі кінці згідно з модулем МЕВМехів Епа Кераїг Модше за допомогою інкубації 40 мкл вуцДНК із 5 мкл Т0Х буферу для фосфорилювання, 2 мкл суміші дезоксинуклеотидів у розчині (10 мМ кожного дНТФ), 1 мкл ДНК-полімерази І у розведенні 1:5, 1 мкл ДНК-полімерази Т4 та 1 мкл полінуклеотидкінази Т4 з набору реактивів МЕвМмМехі М ОМА
Затріє Ргер ОМА Кеадепі 5еї 1 у мікроцентрифужній пробірці об'ємом 200 мкл у термоциклері протягом 30 хвилин при температурі 20 С. Зразок охолоджували до температури 4 "С та очищали із застосуванням колонки ОЇІДОціск з набору ОІДОцісСК РСК Ригійсайоп КИ (СОІАСЕМ
Іпс., Валенсія, Каліфорнія) у такий спосіб. 50 мкл реакційної суміші переносили у мікроцентрифужну пробірку об'ємом 1,5 мл та додавали 250 мкл буферу РВ Оіадеп. Отримані у результаті 300 мкл переносили на колонку ОІіІАдиіскК, яку центрифугували у мікроцентрифузі при 13000 об./хвил. протягом 1 хвилини. Колонки промивали 750 мкл буферу РЕ Оіадеп та повторно центрифугували. Залишковий етанол видаляли за допомогою додаткового центрифугування протягом 5 хвилин при 13000 об./хвил. ДНК елюювали у 39 мкл буферу ЕВ Оіадеп за допомогою центрифугування. Приєднання аА-«хвоста" до 34 мкл ДНК із тупими кінцями проводили із застосуванням 16 мкл майстер-мікс для приєднання дА-«хвоста", що містить фрагмент Кленова (від 3'- до 5'-екзо мінус) (МЕВвМехі м ОМА Затріе Ргер ОМА Кеадепі зеї 1), та інкубації протягом 30 хвилин при температурі 37 "С згідно з інструкцією виробника модуля
МЕВМехке адА-Таййпу Моаше. Зразок охолоджували до температури 4"С та очищали із застосуванням колонки з набору МіпЕІше РСК Ритгійсайоп Кий (СОІАСЕМ Іпс., Валенсія,
Каліфорнія) у такий спосіб. 50 мкл реакційної суміші переносили у мікроцентрифужну пробірку об'ємом 1,5 мл та додавали 250 мкл буферу РВ Оіадеп. 300 мкл переносили на колонку
МіпЕІше, яку центрифугували у мікроцентрифузі при 13000 об./хвил. протягом 1 хвилини.
Колонки промивали 750 мкл буферу РЕ Оіадеп та повторно центрифугували. Залишковий етанол видаляли за допомогою додаткового центрифугування протягом 5 хвилин при 13000 об./хвил. ДНК елюювали у 15 мкл буферу ЕВ Оіадеп за допомогою центрифугування. Десять мікролітрів елюату ДНК інкубували з 1 мкл суміші Сепотіс Адаріег ОїЇїдо Міх (номер за каталогом 1000521) Шитіпа у розведенні 1:5, 15 мкл 2Х буферу ОпіскК І ідайоп Кеасіїоп Виїег та бо 4 мкл ДНК-лігази Оціск Т4 ОМА Гідазе протягом 15 хвилин при температурі 25 "С згідно з інструкцією модуля МЕВвМехке ОпціскК І ідайоп Модиіе. Зразок охолоджували до температури 4 "С та очищали із застосуванням колонки МіпЕІше у такий спосіб. До 30 мкл реакційної суміші додавали сто п'ятдесят мікролітрів буферу РЕ Оіадеп, та весь об'єм переносили на колонку
МіпЕІше переносили на колонку МіпЕІше, яку центрифугували у мікроцентрифузі при 13000
Б об./хвил. протягом 1 хвилини. Колонкові промивали 750 мкл буферу РЕ Оіадеп та повторно центрифугували. Залишковий етанол видаляли за допомогою додаткового центрифугування протягом 5 хвилин при 13000 об./хвил. ДНК елюювали у 28 мкл буферу ЕВ Оіадеп за допомогою центрифугування. Двадцять три мікролітри елюату лігованої з адаптерами ДНК піддавали 18 циклам ПЛР (98 "С протягом 30 секунд; 18 циклів 98 "С протягом 10 секунд, 6570 протягом 30 секунд та 72 "С протягом 30; кінцева елонгація при температурі 72 "С протягом 5 хвилин, зберігання при температурі 4 "С) із застосуванням праймерів бсепотіс РОК Ргїтег5
Шитіпа (МоМо за каталогом 100537 та 1000538) та майстер-мікс Рпизіоп НЕ РСК Мазвієг Міх з набору реактивів МЕвМехі М ОМА Затріє Ргер ОМА Кеадепі 5еї 1 у відповідності з інструкціями виробника. Ампліфікований продукт очищали із застосуванням системи для очищення продуктів
ПЛР Адепсоші АМРиге ХР (Адепсошгі Віозсіепсе Согрогайоп, Беверлі, Массачусетс) у відповідності З інструкціями виробника, доступними за адресою млимі.ресктапдепотісв.сот/ргодисів/Атригехрргоїосої 000387У001.раї. Система для очищення продуктів ПЛР Адепсошгі АМРиге ХР видаляє невбудовані дНТФ, праймери, димери праймерів, солі та інші забруднюючі речовини та відновлює амплікони розміром більше 100 п.о. Очищений ампліфікований продукт елюювали з бусин Адепсошгї у 40 мкл буферу ЕВ Оіадеп, та розподіл розміру бібліотек аналізували із застосуванням набору Адіїепі ОМА 1000 Кії для біоаналізатору 2100 Вісапа!їулег (Адіїепі Тесппоіодіез5 Іпс., Санта-Клара, Каліфорнія). с. Аналіз бібліотек секвенування, отриманих згідно з скороченим (а) та повним (Б) протоколом
І00523| Електрофореграми, отримані за допомогою приладу Віоапаїугег, представлено на фігурах 7А та 7В. На фігурі 7А представлена електрофореграма бібліотеки ДНК, отриманої зі
ВЦДНК, очищеної зі зразку плазми М24228 із застосуванням повного протоколу, описаного у пункті (а), та на фігурі 7В представлена електрофореграма бібліотеки ДНК, отриманої зі виДНК, очищеної зі зразку плазми М24228, із застосуванням повного протоколу, описаного у пункті (Б).
На обох фігурах піки 1 та 4 представляють нижній маркер 15 п.о. та верхній маркер 1500, відповідно; числа над піками вказують часи міграції фрагментів бібліотеки; та горизонтальні лінії вказують заданий поріг для інтегрування. На електрофореграмі на фігурі 7А представлений другорядний пік фрагментів 187 п.о. та основний пік фрагментів 263 п.о., тоді як електрофореграма на фігурі 7В демонструє винятково один пік при 265 п.о. Інтегрування площ піків дозволило розрахувати концентрацію 0,40 нг/мкл для ДНК піку 187 п.о. на фігурі 7А, концентрацію 7,34 нг/мкл для ДНК піка 263 п.о. на фігурі 7А та концентрацію 14,72 нг/мкл для
ДНК піку 265 п.о. на фігурі 7В. Адаптери Шитіпа, які лігували зі вцДНК, як відомо, становлять 92 п.о. у довжину, що після вирахування з 265 п.о. дозволило визначити, що розмір піку ваДНК становить 173 п.о. Можливо, що другорядний пік при 187 п.о. являє собою фрагменти двох праймерів, які були ліговані кінець до кінця. Лінійні фрагменти двох праймерів видаляли з підсумкової бібліотеки продукту, коли застосовували скорочений протокол. У скороченому протоколі також видаляли інші менші фрагменти, довжина яких становила менше 187 п.о. У даному прикладі концентрація очищеної лігованої з адаптерами вцДНК у два рази перевищує таку лігованої з адаптерами вуДНК, отриманої із застосуванням повного протоколу. Було відзначено, що концентрація лігованих з адаптерами фрагментів вцДНК завжди перевищувала таку, отриману із застосуванням повного протоколу (дані не показані).
Ї00524| Таким чином, перевага одержання бібліотеки секвенування із застосуванням скороченого протоколу полягає у тому, що отримана бібліотека систематично містить винятково один основний пік у діапазоні 262 - 267 п.о., у той час як якість бібліотеки, отриманої із застосуванням повного протоколу, варіюється, що відображене кількостями та рухливістю піків, відмінних від таких, що представляють вцДНК. Продукти, відмінні від ВІЦДНК, займуть простір у проточній комірці та знизять якість кластерної ампліфікації та наступної візуалізації реакцій секвенування, що лежить у основі загальної оцінки статусу анеуплоїдії. Скорочений протокол, як було показано, не впливає на секвенування бібліотеки.
І00525) Інша перевага одержання бібліотеки секвенування із застосуванням скороченого протоколу полягає у тому, що три ферментативні етапу - додавання тупих кінців, приєднання а-
А-«хвоста" та лігування з адаптерами, - завершуються протягом менше години, що сприяє валідації та впровадженню швидкого сервісу щодо діагностики анеуплоїдії.
І00526)| Інша перевага полягає у тому, що три ферментативні етапи - додавання тупих бо кінців, приєднання а-А-«хвоста" та лігування з адаптерами, - здійснюють у одній реакційній пробірці, таким чином, уникаючи численних переносів зразку, які потенційно можуть привести до втрати матеріалу та, що більш важливо, до можливого переплутування зразків та забруднення зразку.
Приклад 2 Неінвазивне пренатальне тестування із застосуванням розміру фрагменту
Введення
Ї00527| З моменту комерційного впровадження наприкінці 2011 - початку 2012 року неінвазивне пренатальне тестування (НІПТ) безклітинної ДНК (вцДНК) у материнській плазмі швидко стало способом, кращим для скринінгу вагітних жінок, що мають високий ризик анеуплоїдій плода. Способи переважно основані на виділенні та секвенуванні вуцДНК у плазмі вагітних жінок та підрахунку кількості фрагментів вуДНК, які вирівнюються з конкретною областю референсного гену людини (джерела: Рап еї аї., Го еї аіІ.). Дані способи секвенування
ДНК та молекулярного підрахунку забезпечують високоточне визначення відносного числа копій для кожної із хромосом у межах геному. Високі чутливості та специфічності виявлення трисомії 21, 18 та 13 були відтворюваним чином досягнуті у багатьох клінічних дослідженнях (посилання, цитата метааналіз СІЇ/Місоїаідев).
І00528| Зовсім нещодавно додаткові клінічні дослідження продемонстрували, що даний підхід можна поширити на загальну популяцію вагітних. Між популяціями високого та середнього ризику, що піддаються виявленню, відмінності у фракціях плода відсутні (посилання). Результати клінічних досліджень демонструють, що НіІПТ із застосуванням молекулярного підрахунку за допомогою секвенування вцДНК здійснюється однаково у обох популяціях. Було продемонстровано статистично значиме поліпшення позитивної прогностичної значимості (розійме ргедісіме маше, РРМ) у порівнянні зі стандартним скринінгом сироватки (посилання). Більш низька частка псевдо позитивних результатів аналізу у порівнянні з біохімічним аналізом сироватки та вимірюванням товщини коміркового простору у значній мірі знизила потребу у інвазивних діагностичних процедурах (див. публікацію І агіоп еї аЇ., посилання із групи Абипатад).
І00529| Враховуючи гарні робочі характеристики НІПТ у загальній популяції вагітних, на сьогоднішній день простота та вартість робочого процесу стали основним міркуванням для впровадження секвенування вциДНК із метою виявлення анеуплоїдії цілої хромосоми у загальній популяції вагітних (посилання: ІРО Оебаїе 1, Вгізрапе). У більшості лабораторних способів
НІПТ застосовують етап ампліфікації за допомогою полімеразної ланцюгової реакції (ПЛР) після одержання бібліотеки та секвенування одиночних кінців, для якого потрібно 10 - 20 мільйонів унікальних фрагментів вцДНК для досягнення прийнятної чутливості з метою виявлення анеуплоїдії. Складність робочого процесу на основі ПЛР та потреба у більш глибокому секвенуванні обмежували потенціал аналізу НІПТ та привели до збільшення витрат.
І0О530| У даному документі продемонстровано, що високих аналітичних чутливостей та специфічностей можна досягти при простому одержанні бібліотеки із застосуванням дуже низької кількості вцДНК на вході, для якого не потрібно ПЛР-ампліфікації. Спосіб без застосування ПЛР спрощує робочий процес, поліпшує час обороту та усуває похибки, властиві способам на основі ПЛР. Робочий процес без ампліфікації можна поєднувати із секвенуванням спарених кінців для забезпечення визначення довжини фрагменту для кожної мітки та для сумарної фракції плода у кожному зразку. Оскільки фрагменти вуцДНК плода є більш короткими, ніж материнські фрагменти (посилання Оцаке 2010, також слід процитувати статтю Го 5сіепсе
Сіїп Тгапзіайоп)|, виявлення анеуплоїдії плода з материнської плазми можна здійснити значно більш надійним та ефективним способом, для чого буде потрібна менша кількість унікальних фрагментів вциДНК. У сполученні покращена аналітична чутливість та специфічність досягаються з дуже швидким часом обороту при у значній мірі меншій кількості фрагментів
ВЦДНК. Це потенційно дозволяє проводити НІПТ зі значно меншими витратами для полегшення застосування у загальній популяції вагітних. 5О0 Способи
І00531| Зразки периферичної крові поміщали у пробірки ВСТ (5ігескК, Омаха, Небраска,
США) та перевозили у лабораторію СА Шитіпа у Редвуд-Сіті для комерційного дослідження
НІПТ. Підписані форми згоди пацієнта дозволяли деідентифікувати другі аліквоти плазми та застосовувати для клінічного дослідження, за винятком зразків від пацієнта, відправлених зі штату Нью-Йорк. Зразки плазми для даної роботи вибирали таким чином, щоб вони включали як неуражені, так і анеуплоїдні плоди з діапазоном концентрацій вшциДНК та фракцій плода.
Спрощення процесингу бібліотеки 00532) вцдДНК екстрагували з 900 мкл материнської плазми із застосуванням 96-лункового набору для очищення крові Мисіеобріп (Маспегеу-Маде!, Дюрен, Німеччина) з незначними бо змінами для використання більшої кількості лізату на вході. Виділену вцДНК безпосередньо поміщали у процес бібліотеки секвенування без якого-небудь нормування вциДНК на вході.
Бібліотеки секвенування готували за допомогою набору для бібліотеки Ттибзед РОК Егее ОМА (Шитіпа, Сан-Дієго, Каліфорнія, США) з подвійними індексами для штрих-кодування фрагментів
ВуЦДНК із метою ідентифікації зразків. Наступні зміни у протоколі бібліотеки використовували для поліпшення сумісності одержання бібліотеки з низькою концентрацією вцДНК на вході.
Обсяг матриці на вході збільшували, тоді як обсяг майстер-мікс для відновлення кінця, приєднання А-«хвоста" та лігування та концентрації адаптеру знижували. Додатково, після відновлення кінців вводили етап знищення нагріванням для деактивації ферментів, видаляли етап очищення після відновлення кінців за допомогою бусин 5РКЇ (постачальник послуг), та елюювання протягом етапу очищення після лігування бусин ЗРК проводили із застосуванням буферу НТІ1 (Питіпа).
І00533| Один рідинний маніпулятор МІСКОГАВФ ТАК (Натійоп, Рино, Невада, США), конфігурований з 96б-канальною голівкою та 8 каналами для піпетування об'ємом 1 мл, застосовували для обробки 96 зразків плазми партіями протягом часу. Рідинний маніпулятор процесував кожен індивідуальний зразок плазми за допомогою екстракції ДНК, одержання бібліотеки секвенування та кількісного визначення. Бібліотеки індивідуальних зразків кількісно визначали за допомогою АссисСієаг (Віоїйшт, Хейвард, Каліфорнія, США) та одержували об'єднані 48 зразків з нормованими кількостями на вході, що приводило до одержання кінцевої концентрації 32 пМ для секвенування.
Секвенування спарених кінців
І00534| Секвенування ДНК проводили на приладі МехіЗед 500 Шитіпа із застосуванням секвенування спарених кінців 2х36 п.о., плюс додаткові 16 циклів для секвенування штрих-кодів зразків. У сумі у 8 незалежних партіях секвенування аналізували 364 зразки.
І0О535)| Парні послідовності ДНК демультиплексували із застосуванням брсі2газід (Шитіпа) та картували на референсний геном людини (п919) із застосуванням алгоритму вирівнювання роуліе2 (посилання Іапатеавд|. Парні ріди повинні були відповідати прямому та зворотному ланцюгам для їхнього підрахунку. Усі підраховані картовані пари, що перевищували показник якості картування 10 (Киап еї аІ), з глобально унікальними перш рідами відносили до неперекриванних послідовних геномних блоків фіксованої ширини розміром 100 т.о. Приблизно 2 У геному продемонструвало у високому ступені варіююче перекриття серед незалежної множини зразків НІПТ, та їх виключали з наступного аналізу. 00536) Із застосуванням інформації про геномне розташування та розміри фрагменту, доступної з картованих розташувань кожного із двох кінців секвенованих фрагментів вшиДНК, одержували дві змінні для кожного вікна 100 т.о.: (а) загальні підраховані значення коротких фрагментів менше 150 пар основ у довжину, та (б) фракцію фрагментів від 80 до 150 пар основ у межах множини всіх фрагментів довжиною менше 250 пар основ. Обмеження розміру фрагментів менше 150 пар основ збагачує фрагментами, отриманими із плаценти, які є замінником ДНК плода. Фракція коротких фрагментів характеризує відносні кількості вицдНнК плода у суміші плазми. вцДНК із трисомічного плода, як очікується, буде містити більшу фракцію коротких рідів, що картуються на трисомічну хромосому, у порівнянні з еуплоїдним плодом, який є дисомічним по даній хромосомі.
І00537| Підраховані значення та фракції коротких фрагментів незалежно нормували для усунення систематичних похибок аналізу та зразок-специфічних варіацій, властивих геномному вмісту гуаніну та цитозину (С), із застосуванням процесу, представленого на фігурі 20.
Нормовані значення цензурували за допомогою видалення блоків, що відхилялися від медіани цілої хромосоми на більш ніж З стійких вимірювань стандартного відхилення. Нарешті, для кожної із двох змінних цензуровані нормовані значення, пов'язані із цільовою хромосомою, порівнювали з такими нормуючих референсних хромосом для складання і-статистики.
ІОО538) Дані від кожної серії секвенування спарених кінців проходили чотири етапи аналізу: 1) перетворення ріду, 2) розділення характеристик на блоки при розділенні 100 т.о., 3) нормування кожної характеристики (підраховані значення та фракція) при розділенні 100 т.о. та 4) об'єднання характеристик та визначення показників для виявлення анеуплоїдії. На етапі 1 дані зразку демультиплексували з індивідуальних штрих-кодів, вирівнювали з геномом та фільтрували для якості послідовності. На етапі 2 проводили загальне обчислення коротких фрагментів менше 150 пар основ у довжину та визначали фракції фрагментів від 80 до 150 пар основ у межах множини всіх фрагментів довжиною менше 250 пар основ для кожного блоку.
Похибки аналізу та зразок-специфічні варіації усували на етапі 3. Нарешті, визначали збагачення у порівнянні з референсом та визначали показник із застосуванням І-критерію для кожного з підрахованих значень та фракції та поєднували для одержання підсумкового 10) показника з метою виявлення анеуплоїдії.
Виявлення анеуплоїдії цілої хромосоми у плода
ІЇ00539| Автори даного винаходу провели дослідження, чи можна об'єднати підраховані значення та фракцію даних для посилення здатності виявлення трисомії 21 у плода.
Шістнадцять зразків плазми від вагітних жінок, що виношують плоди з каріотипово підтвердженою трисомією 21, та 294 зразків від неуражених вагітностей випадковим чином розподіляли у партії процесингу, що дозволило одержати дев'ять проточних комірок для секвенування. Кожен етап алгоритму досліджували окремо для визначення здатності кожного етапу та комбінації етапів виявляти анеуплоїдію. Підсумковий показник для виявлення анеуплоїдії плода у об'єднаному випадку задавали як квадратний корінь із суми квадратів двох індивідуальних ї-статистик, та одиничний поріг застосовували для одержання рішення "анеуплоїдія виявлена" у порівнянні з "анеуплоїдія не виявлена".
Обчислення фракції плода
І00540| Для кожного зразку фракцію плода оцінювали із застосуванням співвідношення загальної кількості фрагментів розміру (111136 п.о0о.| до загальної кількості фрагментів розміру (165175 п.о.| у межах підмножини геномних блоків 100 т.о. Із застосуванням зразків від жінок, що виношують плід відомої чоловічої статі, визначали перші 1095 геномних блоків, які характеризувалися найвищими кореляціями із фракцією плода, отриманою з кількості копій Х- хромосоми |посилання Кама|. Кореляцію між оцінками фракції плода на основі розміру фрагмента та такими, отриманими з Х-хромосоми у плодах відомої чоловічої статі, обчислювали комп'ютерним способом із застосуванням аналізу перехресної валідації з виключенням по одному (|посилання|,; який включав як вибір блоку, так і оцінку параметру регресійної моделі. Потім обчислену фракцію плода одержували зі співвідношень розміру фрагмента із застосуванням моделі лінійної регресії.
Результати
Спрощення процесингу бібліотеки
І0О541|) На фігурі 8 представлений загальний робочий процес та часові рамки даної нової версії НІПТ у порівнянні зі стандартним лабораторним робочим процесом. Весь робочий процес одержання 96 зразків для виділення плазми, екстракції вцДНК, конструювання бібліотеки, кількісного визначення та об'єднання дозволив процесувати зразки протягом загального часу менше 6 годин на одній системі Натійоп 5ТАК. Це значно відрізняється від 9 годин на двох системах Натійоп ЗТАК із застосуванням способів на основі ПЛР, які використовували у лабораторії СПА. Кількість вцДНК, екстрагованої на зразок, у середньому склало 60 пг/мкл, та вихід бібліотеки секвенування на виході демонстрував лінійну кореляцію (22-0,94) зі виДНК на вході, як презентовано на фігурі 9. Середнє відновлення склало більше 70 95 (додати діапазон), що свідчить про високоефективне відновлення вцДНК після очищення на бусинах 5РКІ.. У кожній серії секвенування застосовували нормовані кількості 48 мультиплексованих зразків, та для завершення серії було потрібно приблизно 14 годин. Медіанна кількість унікально картованих парних рідів склала ХХХ М, та для 95 95 зразків - вище УУУ.
Секвенування спарених кінців
І00542| Загальний час секвенування партії з 48 зразків на секвенаторі Мехібзед 500 склав менше 14 годин. Це значно відрізняється від 40 годин (1 проточна комірка, 96 зразків) або 50 годин (2 проточні комірки, 192 зразків) для лабораторного процесу на секвенаторі Нізед 2500.
Картовані геномні розташування обох кінців фрагментів вц8ДНК забезпечили інформацію про розмір фрагментів вцДНК. На фігурі 10 представлений розподіл розміру фрагменту виДдНК, вимірюваного з 324 зразків від вагітностей плодом чоловічої статі. Розмір фрагментів, які картувались на аутосомні хромосоми, які встановлено є еуплоїдними та переважно представляють материнські хромосоми, представлений тонкою кривою. Середній розмір вставки становив 175 п.о. причому ХХ9У» фрагментів були виміряні від 100 п.о. до 200 п.о. Товста крива представляє розмір фрагмента, який виникає винятково з У-хромосоми, представляючи собою тільки фрагменти вуДНК плода. Розподіл розміру специфічних по МУ-хромосомі послідовностей був меншим, у середньому становив 167 п.о. з періодичністю основ 10 при більш коротких розмірах фрагменту. 00543) Оскільки більш короткі фрагменти вцДНК збагачені ДНК плода, селективний аналіз із застосуванням винятково більш коротких фрагментів, як очікується, збільшить відносне представлення плода у зв'язку з переважним вибором рідів плода. На фігурі 11 представлена відносна фракція плода із загального підрахунку картованих рідів спарених кінців у порівнянні з підрахунком від рідів спарених кінців, які становлять менше 150 п.о. У цілому, медіана фракції плода збільшується у 2 рази у порівнянні із загальним підрахунком, хоч і з деяким збільшенням дисперсії. Було встановлено, що межа розміру 150 п.о. забезпечувала оптимальний компроміс бо для обчислення зі збільшенням представленості плода у порівнянні з дисперсією у підрахунках.
Виявлення анеуплоїдії цілої хромосоми у плода 00544) Кожну з доступних метрик, загальний підрахунок, підраховані значення менше 150 п.о., фракції підрахованих значень, збагачених вуДНК плода (підраховані значення від 80 до 150 п.о./ підраховані значення «250 п.о.), та комбінацію підрахованих значень більш коротких фрагментів із фракцією досліджували у відношенні здатності встановлювати відмінності зразків із трисомією 21 від зразків, еуплоїдних по хромосомі 21. На фігурі 12 представлені результати для кожної з даних метрик. Загальні підраховані значення характеризувалися медіаною ХХ підрахованих значень, тоді як підраховані значення менше 150 п.о. характеризувалися медіаною УУ підрахованих значень. Ще, як видно з Фіг. 4А та 4В, менші підраховані значення продемонстрували кращий розподіл між трисомією 21 та еуплоїдією, переважно, оскільки дана метрика збагачена вшиДНК плода. Фракція сама по собі була приблизно так само ефективною, як і загальний підрахунок, для відмінності анеуплоїдії (Фіг. 4С), але при застосуванні у комбінації з підрахунками коротких фрагментів (Фіг. 40) забезпечувала поліпшене встановлення відмінностей у порівнянні з підрахунками коротких фрагментів самими по собі. Це вказує на те, що фракція забезпечує незалежну інформацію, яка поліпшує виявлення трисомії 21. У порівнянні з використовуваним на сьогоднішній день робочим процесом лабораторії СЦІА із застосуванням одержання бібліотеки із ПЛР-ампліфікацією та медіани 16 М підрахованих значень/зразок, робочий процес на основі секвенування без застосування ПЛР спарених кінців демонструє еквівалентні робочі характеристики з у значній мірі меншою кількістю підрахованих значень/зразок (наприклад, 6 М підрахованих значень/зразок або менше) та більш простий, більш короткий робочий процес одержання зразку.
Обчислення фракції плода 00545) Із застосуванням результатів для Х-хромосоми від вагітностей плодом чоловічої статі можна використовувати нормовані значення хромосом з метою визначення фракцій плода для підрахованих значень (посилання СііпСпет) та проводити порівняння для різних розмірів фрагментів вудДНК. Фракції плода, отримані з Х-хромосоми, використовували для калібрування співвідношень для множини з 140 зразків та оцінювали робочі характеристики із застосуванням перехресної валідації з виключенням по одному. На фігурі 13 представлені результати перехресно валідованих передбачень фракції плода та кореляція між двома даними множинами, яка свідчить, що оцінки фракції плода можна одержати з будь-яких зразків, включаючи такі від жінок, що виношують плід жіночої статі, після того як була виміряна калібрована множина.
Обговорення
І00546| Було продемонстровано, що можна досягти високої аналітичної чутливості та специфічності виявлення анеуплоїдії плода зі вц4ДНК у материнській плазмі при одержанні бібліотеки без застосування ПЛР у сполученні із секвенуванням спарених кінців ДНК. Даний спосіб спрощує робочий процес, поліпшує час обороту (фігура 8) та повинен усунути деякі погрішності, властиві способам на основі ПЛР. Секвенування спарених кінців дозволяє визначити розміри довжини фрагмента та фракцію плода, які потім можна застосовувати для посилення виявлення анеуплоїдії при значно меншому підрахунку мітки у порівнянні із застосовуваними на сьогоднішній день комерційними способами. Робочі характеристики варіанту реалізації спарених кінців без застосування ПЛР, як представляється, аналогічні способам секвенування одиночних кінців, у яких застосовують аж до трьох разів більшу кількість міток.
Спрощення процесингу бібліотеки
Ї00547| Робочий процес без застосування ПЛР характеризується декількома перевагами для клінічних лабораторій. Завдяки високому виходу та лінійним законам одержання бібліотеки нормовані пули зразків для секвенування можна одержати безпосередньо з концентрацій бібліотеки індивідуального зразку. У результаті цього усуваються похибки, властиві ПЛР- ампліфікації процесу одержання бібліотеки. Крім цього, відсутня потреба у виділенні окремих рідинних маніпуляторів для активностей до та після ПЛР, що знижує матеріальне навантаження на лабораторію. Це спрощує робочий процес, дозволяє готовити партії зразків у клінічній лабораторії у одну зміну, а потім секвенувати та аналізувати протягом ночі. У цілому, зниження капіталізованих витрат, зменшення часу "роботи руками" та швидкий обіг потенційно дозволяють у значній мірі знизити вартість та, у цілому, стійкість НІПТ.
Секвенування спарених кінців
Ї00548| Застосування секвенування спарених кінців на системі МехіЗед 500 характеризується декількома перевагами при підрахунку фрагментів вцДНК. По-перше, із застосуванням подвійних індексних штрих-кодів зразки можна мультиплексувати на високому бо рівні, що дозволяє проводити нормування та корекцію варіації від серії до серії з високою статистичною вірогідністю. Крім цього, оскільки на серію мультиплексують 48 зразків, та кількість, необхідна для кластеризації на проточній комірці, обмежена, вимога до зразку на вході у значній мірі знижується, що дозволяє використовувати робочий процес бібліотеки без застосування ПЛР. При типовому виході вцДНК приблизно 5 нг на зразок дослідникам вдалося одержати 2 - З серії секвенування на зразок навіть без застосування ПЛР-ампліфікації. Це у значній мірі відрізняється від інших підходів, для яких потрібні значні кількості плазми на вході з множини пробірок для збору крові з метою одержання виходу достатньої кількості виДНК для визначення анеуплоїдії (посилання). Нарешті, секвенування спарених кінців дозволяє проводити визначення розміру фрагменту вцДНК та аналітичне збагачення вшиДНК плода.
Виявлення анеуплоїдії цілої хромосоми у плода
І00549| Результати, отримані авторами даного винаходу, демонструють, що підраховані значення фрагментів вцДНК менше 150 п.о. здатні краще встановити відмінності анеуплоїдії від еуплоїдних хромосом, ніж загальні підраховані значення. Дане спостереження відрізняється від результатів Рап еї аї., які припустили, що при застосуванні більш коротких фрагментів точність статистики підрахунку буде знижена (Бап еї аЇ.) внаслідок зниження кількості доступних підрахованих значень. Фракція коротких фрагментів також забезпечує встановлення деяких відмінностей для виявлення трисомії 21, як було встановлено Хи еї аіЇ., хоча і з меншим динамічним діапазоном, ніж підраховані значення. Однак об'єднання підрахунку та метрик фракції приводить до найкращого відділення зразків трисомії 21 від еуплоїдних та має на увазі, що дві дані метрики є комплементарними вимірюваннями для представленості хромосоми. Інші біологічні метрики, наприклад, метилювання, можуть також забезпечити ортогональну інформацію, яка може підсилити співвідношення сигнал/шум для виявлення анеуплоїдії.
Обчислення фракції плода
ІЇ00550| Способи, представлені у даному документі, також дозволяють оцінити фракцію плода у кожному зразку без проведення додаткової лабораторної роботи. Із застосуванням множини зразків у кожній проточній комірці, приблизно половина з яких є зразками чоловічої статі, можна одержати точну оцінку фракції плода для всіх зразків за допомогою калібрування вимірювання фракції плода з інформації про розмір фрагменту з такою, визначеною для чоловічих зразків. У комерційних умовах клінічний досвід дослідників продемонстрував, що стандартні способи підрахунку із застосуванням більшої кількості міток одиночних кінців привели до дуже низької частки псевдо негативних результатів навіть за відсутності специфічних вимірювань Фракції плода (КЕР). З урахуванням аналогічної межі виявлення, що спостерігається у даному документі, розраховують одержати еквівалентні робочі характеристики тестування.
Висновок
ІЇ0О0551| Було продемонстровано, що високої аналітичної чутливості та специфічності виявлення анеуплоїдії плода зі вцДНК у материнській плазмі можна досягти з одержанням бібліотеки без застосування ПЛР у сполученні із секвенуванням спарених кінців ДНК. Даний спрощений робочий процес характеризується дуже швидким часом обороту, який потенційно дозволяє проводити НІПТ зі значно меншими фінансовими витратами для застосування у загальній популяції вагітних. Крім цього, методики секвенування спарених кінців характеризуються потенціалом вимірювати інший біологічний феномен, а також забезпечувати інші клінічні варіанти застосування. Наприклад, інформація про розмір з метильованих конкретних областей геному або Сро-острівців може забезпечити іншу ортогональну метрику для посилення виявлення варіантів числа копій у межах геному. 00552) Даний винахід можна реалізувати у інших конкретних формах, не виходячи за межі духу або суттєвих характеристик винаходу. Описані варіанти реалізації слід вважати у всіх відношеннях винятково ілюстративними, а не обмежуючими. Внаслідок цього обсяг даного винаходу визначений прикладеною формулою винаходу, а не згаданим вище описом. Усі зміни, які попадають у значення та діапазон еквівалентності формули винаходу, підлягають охопленню її обсягом.

Claims (7)

ФОРМУЛА ВИНАХОДУ
1. Спосіб, реалізований із застосуванням комп'ютерної системи, визначення варіації числа копій (ВЧК) послідовності нуклеїнової кислоти, що представляє інтерес, у досліджуваному зразку, що містить фрагменти безклітинної нуклеїнової кислоти, отримані з двох або більше геномів, причому зазначений спосіб включає: (а) приймання рідів послідовності, отриманих у результаті секвенування фрагментів бо безклітинної нуклеїнової кислоти у досліджуваному зразку;
(Б) вирівнювання рідів послідовності фрагментів безклітинної нуклеїнової кислоти або вирівнювання фрагментів, які містять ріди послідовності, з блоками референсного геному, який містить послідовність, що представляє інтерес, з одержанням, таким чином, міток досліджуваної послідовності, причому референсний геном розділений на множину блоків; (с) визначення розмірів фрагмента щонайменше деяких фрагментів безклітинної нуклеїнової кислоти, які присутні у досліджуваному зразку; (4) обчислення перекриттів міток послідовності для блоків референсного геному шляхом виконання для кожного блока: (ї) визначення кількості міток послідовності, які вирівнюються із блоком, та (і) нормування цієї кількості міток послідовності, які вирівнюються з цим блоком шляхом підрахунку міжблокових варіацій, викликаних факторами, відмінними від варіації числа копій; (е) визначення і-статистики для послідовності, що представляє інтерес, із застосуванням перекриттів блоків у послідовності, що представляє інтерес, та перекриттів блоків у референсній області для послідовності, що представляє інтерес; та (0 визначення варіації числа копій у послідовності, що представляє інтерес, із застосуванням відношення правдоподібності, обчисленого з ї-статистики, та інформації відносно розмірів фрагментів безклітинної нуклеїнової кислоти, де спосіб включає здійснення етапів (а) та (є) двічі, один раз для фрагментів у першому домені розмірів із застосуванням міток послідовності для фрагментів безклітинної нуклеїнової кислоти, розміри яких належать до першого домену розмірів, та повторно для фрагментів у другому домені розмірів із застосуванням міток послідовності для фрагментів безклітинної нуклеїнової кислоти, розміри яких належать до другого домену розмірів, причому другий домен розмірів відрізняється від першого домену розмірів, таким чином отримуючи першу Ї-статистику для послідовності, що представляє інтерес, із застосуванням міток послідовності у першому домені розмірів, та другу статистику для послідовності, що представляє інтерес, із застосуванням міток послідовності у другому домені розмірів, у якому зазначений етап (Її) включає: обчислення відношення правдоподібності за першою 1- статистикою та другою і-статистикою, й визначення варіації числа копій у послідовності, що представляє інтерес, із застосуванням співвідношення правдоподібності, й у якому зазначене відношення правдоподібності обчислюють за першою 1- статистикою та другою І-статистикою й обчислюють як першу правдоподібність того, що досліджуваний зразок є анеуплоїдним зразком, відносно другої правдоподібності того, що досліджуваний зразок є еуплоїдним зразком.
2. Спосіб за п. 1, який відрізняється тим, що зазначений перший домен розмірів містить фрагменти безклітинної нуклеїнової кислоти по суті всіх розмірів у зразку, та зазначений другий домен розмірів містить тільки фрагменти безклітинної нуклеїнової кислоти, менші, ніж заданий розмір.
3. Спосіб за п. 1, який відрізняється тим, що зазначений другий домен розмірів містить тільки фрагменти безклітинної нуклеїнової кислоти, менші ніж приблизно 150 п.о.
4. Спосіб за п. 1, який відрізняється тим, що зазначене відношення правдоподібності обчислюють за одним або більше значеннями фракції плода на додаток до і-статистики та інформації відносно розмірів фрагментів безклітинної нуклеїнової кислоти.
5. Спосіб за п. 4, який відрізняється тим, що зазначене одне або більше значень фракції плода включають значення фракції плода, обчислене із застосуванням інформації відносно розмірів фрагментів безклітинної нуклеїнової кислоти.
6. Спосіб за п. 5, який відрізняється тим, що зазначене значення фракції плода обчислюють шляхом: одержання розподілу частоти розмірів фрагментів; та застосування розподілу частоти у моделі, що встановлює взаємозв'язок між фракцією плода та частотою розміру фрагмента, з одержанням значення фракції плода.
7. Спосіб за п. 5, який відрізняється тим, що зазначена модель, що встановлює взаємозв'язок між фракцією плода та частотою розміру фрагмента, включає звичайну лінійну модель, яка містить множину параметрів та коефіцієнтів для множини розмірів фрагмента.
8. Спосіб за п. 4, який відрізняється тим, що зазначене одне або більше значень фракції плода включають значення фракції плода, обчислене із застосуванням інформації про перекриття для блоків референсного геному.
9. Спосіб за п. 8, який відрізняється тим, що зазначене значення фракції плода обчислюють шляхом застосування значень перекриття множини блоків у моделі, яка встановлює взаємозв'язок між фракцією плода та перекриттям блока, з одержанням значення фракції плода.
10. Спосіб за п. 9, який відрізняється тим, що зазначена модель, що встановлює взаємозв'язок між фракцією плода та перекриттям блока, включає звичайну лінійну модель, яка містить множину параметрів та коефіцієнтів для множини блоків.
11. Спосіб за п. 10, який відрізняється тим, що зазначена множина блоків характеризується високою кореляцією між фракцією плода та перекриттям у навчальних зразках.
12. Спосіб за п. 4, який відрізняється тим, що зазначене одне або більше значень фракції плода включають значення фракції плода, обчислене із застосуванням частот множини 8-мерів, виявлених у рідах.
13. Спосіб за п. 12, який відрізняється тим, що зазначене значення фракції плода обчислюють шляхом застосування частот множини 8-мерів у моделі, яка встановлює взаємозв'язок між фракцією плода та частотою 8-мерів, з одержанням значення фракції плода.
14. Спосіб за п. 13, який відрізняється тим, що зазначена модель, що встановлює взаємозв'язок між фракцією плода та частотою 8-мерів, включає звичайну лінійну модель, яка містить множину параметрів та коефіцієнтів для множини 8-мерів.
15. Спосіб за п. 14, який відрізняється тим, що зазначена множина 8-мерів характеризується високою кореляцією між фракцією плода та частотою 8-меру.
16. Спосіб за п. 4, який відрізняється тим, що зазначене одне або більше значень фракції плода включають значення фракції плода, обчислене із застосуванням інформації про перекриття для блоків статевої хромосоми.
17. Спосіб за п. 4, який відрізняється тим, що зазначене відношення правдоподібності обчислюють з фракції плода, І-статистики коротких фрагментів та І-статистики всіх фрагментів, причому зазначені короткі фрагменти являють собою фрагменти безклітинної нуклеїнової кислоти у першому діапазоні розміру, меншому, ніж розмір-критерій, та всі фрагменти являють собою фрагменти безклітинної нуклеїнової кислоти, включаючи зазначені короткі фрагменти та фрагменти, довші, ніж розмір-критерій.
18. Спосіб за п. 17, який відрізняється тим, що зазначене відношення правдоподібності обчислюють за формулою: о вп У, сумарної сумарн)" ра(Ткоротк» Твій вир Ро (Ткоротю Тв сіх) де рі являє собою правдоподібність того, що дані отримані з багатомірного нормального розподілу, що представляє З3-копійну або 1-копійну модель, ро являє собою правдоподібність того, що дані отримані з багатомірного нормального розподілу, що представляє 2-копійну модель, Ткоротк» всіх ЯВЛЯЮТЬ Собою Т-показники, обчислені за хромосомним перекриттям, отриманим за допомогою коротких фрагментів та всіх фрагментів, та «(її сумарн.) являє собою щільність розподілу фракції плода.
19. Спосіб за п. 1, який відрізняється тим, що зазначене відношення правдоподібності обчислюють за одним або більше значеннями фракції плода на додаток до і-статистики та інформації відносно розміру фрагментів безклітинної нуклеїнової кислоти.
20. Спосіб за п. 1, який відрізняється тим, що зазначене відношення правдоподібності обчислюють для моносомії Х, трисомії Х, трисомії 13, трисомії 18 або трисомії 21.
21. Спосіб за п. 1, який відрізняється тим, що нормування кількості міток послідовності включає: нормування з урахуванням вмісту С у зразку, нормування з урахуванням глобального хвильового профілю варіації навчальної множини та/або нормування з урахуванням одного або більше компонентів, отриманих з аналізу головних компонент.
22. Спосіб за п. 1, який відрізняється тим, що зазначена послідовність, що представляє інтерес, являє собою хромосому людини, яка вибрана з групи, яка складається з хромосоми 13, хромосоми 18, хромосоми 21, хромосоми Х та хромосоми У.
23. Спосіб за п. 1, який відрізняється тим, що зазначена референсна область вибрана з групи, яка складається з: всіх стійких хромосом, стійких хромосом, які не містять послідовності, що представляє інтерес, щонайменше хромосоми за межами послідовності, що представляє інтерес, та підмножини хромосом, вибраних зі стійких хромосом.
24. Спосіб за п. 23, який відрізняється тим, що зазначена референсна область містить стійкі хромосоми, які були визначені для забезпечення найкращої здатності виявлення сигналу для множини навчальних зразків.
25. Спосіб за п. 1, який додатково включає: обчислення значень параметра розміру для блоків для кожного блока шляхом: () визначення значення параметра розміру на підставі розмірів фрагментів безклітинної нуклеїнової кислоти у блоці, та (і) нормування значення параметра розміру шляхом підрахунку міжблокових варіацій, викликаних факторами, відмінними від варіації числа копій; та визначення і-статистики на підставі розміру для послідовності, що представляє інтерес, із застосуванням значень параметра розміру блоків у послідовності, що представляє інтерес, та значень параметра розміру блоків у референсній області для послідовності, що представляє інтерес.
26. Спосіб за п. 25, який відрізняється тим, що зазначене відношення правдоподібності (ї) обчислюють за І-статистикою та І-статистикою на підставі розміру.
27. Спосіб за п. 25, який відрізняється тим, що зазначене відношення правдоподібності (ї) обчислюють за І-статистикою на підставі розміру та фракції плода.
28. Спосіб за п. 1, який додатково включає порівняння зазначеного відношення правдоподібності з критерієм рішення для визначення варіації числа копій у послідовності, що представляє інтерес.
29. Спосіб за п. 28, який відрізняється тим, що зазначене відношення правдоподібності перетворюють у логарифм відношення правдоподібності до порівняння з критерієм рішення.
30. Спосіб за п. 28, який відрізняється тим, що зазначений критерій рішення отримують шляхом застосування різних критеріїв відносно навчальної множини навчальних зразків та вибору критерію, який забезпечує задану чутливість та задану селективність.
31. Спосіб за п. 1, який додатково включає одержання множини відношень правдоподібності та застосування множини відношень правдоподібності у дереві рішень для визначення випадку плоїдності для зразка.
32. Спосіб за п. 1, який додатково включає одержання множини відношень правдоподібності та одного або більше значень перекриття послідовності, що представляє інтерес, та застосування множини відношень правдоподібності та одного або більше значень перекриття послідовності, що представляє інтерес, у дереві рішень для визначення випадку плоїдності для зразка.
33. Система для оцінки числа копій послідовності нуклеїнової кислоти, що представляє інтерес, у досліджуваному зразку, причому зазначена система містить: процесор; та один або більше машинозчитуваних носіїв для зберігання інформації, на яких зберігаються інструкції для виконання на зазначеному процесорі, для: (а) приймання ррідів послідовності, отриманих у результаті секвенування фрагментів безклітинної нуклеїнової кислоти у досліджуваному зразку; (Б) вирівнювання рідів послідовності зазначених фрагментів безклітинної нуклеїнової кислоти або вирівнювання фрагментів, які містять ріди послідовності, з блоками референсного геному, який містить послідовність, що представляє інтерес, з одержанням, таким чином, міток досліджуваної послідовності, причому референсний геном розділений на множину блоків; (с) визначення розмірів фрагмента щонайменше деяких фрагментів безклітинної нуклеїнової кислоти, які присутні у досліджуваному зразку; (4) обчислення перекриттів міток послідовності для блоків референсного геному для кожного блока шляхом: (ї) визначення кількості міток послідовності, які вирівнюються з блоком, та (і) нормування кількості міток послідовності, які вирівнюються з блоком, шляхом підрахунку міжблокових варіацій, викликаних факторами, відмінними від варіації числа копій; (е) визначення і-статистики для послідовності, що представляє інтерес, із застосуванням перекриттів блоків у послідовності, що представляє інтерес, та перекриттів блоків у референсній області для послідовності, що представляє інтерес; та (0 визначення варіації числа копій у послідовності, що представляє інтерес, із застосуванням відношення правдоподібності, обчисленого з і-статистики, та інформації відносно розміру фрагментів безклітинної нуклеїнової кислоти, де інструкції включають інструкції для здійснення етапів (а) та (є) двічі, один раз для фрагментів у першому домені розмірів із застосуванням міток послідовності для фрагментів безклітинної нуклеїнової кислоти, розміри яких належать до першого домену розмірів, та повторно для фрагментів у другому домені розмірів із застосуванням міток послідовності для фрагментів безклітинної нуклеїнової кислоти, розміри яких належать до другого домену розмірів, причому другий домен розмірів відрізняється від першого домену розмірів, таким чином отримуючи бо першу і-статистику для послідовності, що представляє інтерес, із застосуванням міток послідовності у першому домені розмірів, та другу їстатистику для послідовності, що представляє інтерес, із застосуванням міток послідовності у другому домені розмірів, у якому зазначений етап (Її) включає: обчислення відношення правдоподібності за першою 1- статистикою та другою і-статистикою й визначення варіації числа копій у послідовності, що представляє інтерес, із застосуванням співвідношення правдоподібності, й у якому зазначене відношення правдоподібності обчислюють за першою ї- статистикою та другою І-статистикою й обчислюють як першу правдоподібність того, що досліджуваний зразок є анеуплоїдним зразком, відносно другої правдоподібності того, що досліджуваний зразок є еуплоїдним зразком. шк 7 сиудтя якорів зясла Ї копа ЕчЧК юс аоВНИйя Тк Ма КахуКИМЕтВ ХАЛЕМХя ЦІНІ чав ї ца пре еи ЛОВ ЕННЕ ЗяЗОК, ше зрязкіх, й вакстать. елек : : заст нт» КУКЛИТЧОВУ НК лОТУ змотиУву Е : певен витТИ ІНН Заст Сехваневатя ІонаКМеНи ЧЕЄТИНУ увалнкаційннк чукливновня Бислх люислуджувакнх кемпеїняни кногЕ Бмавячите перекииєтя міт ! У Вкуначнтн порекроптя тик кеньлефікаційнох лослідоенхсті З досліпжувнної посрідавчості о 00 Здентьфкевки кеалеоацену кормуючу послідовних Ї ння ! 159 Що : ВихоштИ позу постдковнинї З Ірен Е вда вет ВИХОдичИ я пе КИКУ те Жду: ля яейлНВхацнеМ я мітки послюювнокті ана Кт (ден х зоТЕК» ся 0 поспідовності, 33 предулавняє песундовностюти о інтереб, т явної нормуючої : песпіднаності ЕМ З ТИ пороком от Укроп Опору КЕ НТ Виснимкти БЖ Т5 мвлосуванням ЧЕ ох ДОС иеаиНя! ЛоОхЦДКОСТі Е дннаеитннни вна вх Фігура 1
Зчитуаання З сонник Шо шнкки вованя девжука: 387 берчаня довжица: 187 го. ження Зчетування й Зчитувзини 1 пе
Зх. -к дерюдня довжина. ЗО, жд Зчитування 2 Бик їмюок» й ди х У й т Й я дина Й КИ пуд М - дош КІ й . і шотдуии ий і і 7 ве Ж Референсна посвідонняях 00000000 пиши ше ! тестова ' ОВД кни то ВВ вет Фігура 2А
: ї Визначити варіаціючнола її й копій із застосуванням ї ї зміщеного за рекшром ї : перекриття ; ха у Отримати зчитування посвідовності від фраєментів безкпітинної З ї нуклеїнової кноплоти в доспіджуваному зразку ; Зою, у ; Вирівняти зчитування послідавності з резреренсним геномом, який ! в містить послідовність, що представляє інтерес, для забезпечення г ї 0 міток досліджувавої послідовностіності, причему реферономий З ; геном розділений на множину блоків ; дов У ТТ Визначити розміри фрагментів безклітинної муклеїнавої кислоти, Е що присутні у досліджуваному зразку ; ЗАВ, пень еолатомюовоговот нова оногихалооеннноооаніьннмнавоитьннй Я оокіматвоменновооасоео м оотобановасивнвнторогонано й Зважити мітки доспіджуваної послідовності на соснові розмірів і ; фрагментів безкпітиннаї нуклеїнової кислоти і ; ї 230 . З Розрахувати перекриття для блоків на основі зважених міток ; здат ; Ідентифкувати варіацію чиспа копій у поспідовності, що З пу представняє інтереб, на основі розрахонаних перекриттів, ;
ха Визначити ВЧК із ФЕХМАКЕ я й 7 б застобуванням параметру ж розміру фрагмента з корекцією з урахуванням глобального профілю і корекцією з урахуванням ОС а Отримати зчитування паслідовності від фрагментів безклітинної нуклеїнової кислоти у доспіджуваному зразку Об ї Бирівняти зчитування послідовності з референсним геномом, який містить послідовність, що представляє інтерес, для забезпечення міток досліджуваної послідовності, причому референсений теном розділений на множину блоків 2057 ІЗ Визначити розміри фрагментів безклітинної нуклеїнової киспоти, що присутні у доспіджуваному зразку Ор ек щу Визначити у блоках реєверенсного генома. включаючи блоки у послідовності, що представляє імтерес, значення параметру розміру фрагменту, зміщені у бік розмірів фрагмента, характерних дия одного з геномів о ї Забвзпачити глобальний профіль дня блоків послідовності, що представляє інтерве, причому глобальний профіль включає очікувані зназення параметра у блоках послідовності, що представляє інтерес, та причому очікуване значення параметру отримують з навчальної множини неуражених навчальних зразків са І Схорегувати значення параметру із застосуванням очікуваного значення параметру у блоках щонайнменшє послідовності, що представляє інтерес, за допомогою цього дтримавизи відеориговані з урахуванням глобального профілю значення параметру розміру фрагменту дня послідовності, що представляє інтерес Скорегувати значення парвметру із застосуванням співвідвошення міх рівнями вмісту СС та аначеннями параметру у досліджуваному зразку, за допомогою цього отримавии відвориговаві 5 урахуванням «3 значення параметру розміру фрагменту для поспідовності, що предотавпяє інтерес 2 г Оцінити чибпо копій послідовності, що представляє інтерес; у досліджуваному зразку на осмоні відкоригованих з урахуванням глобального профілю або відкоригованих з урахуванням (5 значень параметру дов ав Прохід 1для Прохід 2 для м реа я перекриття розміру орі фрагментів Дані секвенування аа те р : бохо ж і
54. х Перетворення | В Е і дамульти» і Нормувати розділемий на блоки і 14 плексування сяакщо орму розд, ТЕ я. , ки прийнятної сайт до загального значення МЕ5 ї т Їде і я: ве ї : у я тв Вирівнювання усунути глобальну хвилю: ; специфічну проточній комірці / і : партії і ; ві ; " : З х їх Фільтрація міток та . ке пер 18 роздітення на бланки Відкоригувати з урахуванням рівня | в се в- ! Ї : я Я - ; Комп'ютеризоване : обчиспення потен : » і 825 ; й : оба підрахунив я і Відфільтрувати одиничний зразок т Ї 2 Ф ! ; Е - Прохід 1 дня перекриття . . - рохід для перекр 8 і Прохід 2 для розміру фрагментів да - : І ол Збагачення и Збагачення в2в че ЦЧутьового сиг. цільового сиг» шк Я налу у порівнянні вавпу у порівнямні з референсом з веференсом 7 ;
З. БВ ї : 35 спсінінінкя : зо ; Визначення Визначення к-й показника показника нвяліи - 5 І Прохід 1 для анапізу 5 зввженоко за розміром вовною 5 ? перекриття З ие ФУ шин у 33 . ще шкет 0 Підсумковий Прохід 2 дя вналізу м показник ВОЗМІру фрагментів дю схо семою з мех знеуплоїдії 7 попвечклеіпжжтечтікневтик ко окт ж коомнвк пече ціатккевчкочвецнечняек» п и ї . щю ТЕ 1713д уз г. 71 ММ я т Шо й у 700 Дані тех І перекриття перекриття Відносна венув ; лот частоте та "ж, Оеквенування -- | всі фрагменти короткі час ста 723 и фрагменти каротких : фрагментів ; той ; - ї Перетворемня і ! : с демультиплекоу- і ! і ? 14 ди ! ле жкже жит Ж пдхпужтжетюює ке пжи жуки жи уж тжт ду «Жду «уче таке тт дк жи же чаю мк Ж ке тує пе ух жжлакльту вання іяюде І Нормувати розділений на блоки сайт до загального ій і рин ! і значення МЕ5 |і : ; У ше ! тех | | дні пункти петанк істотні, г Вирівнювання і Усунути глобальну хвилю: специфічну проточній 1 ; ! комірці/ партії г і т ! ; : ї . і ; в : Ш і тів Фільтрування МІТОК ! Відкоригувати з урахуванням рівня 3 І розділення на блоки і і 1 кекс тесті сне те снення -я анна нано внновнанновя . трі ; | : Де Комптотериаоваця ! Дналіз головних компонентів пібчислення і : підрахунків і ї . 732 , сплатити накантю раю нати жир лк АНІАКн опклєплттж нат ІА кн нок ть бунт і Відфільтрувати одиничний зразок і і | і і 1 , і і і і в детокс пктттттттнн ся з Тв Те тка Збагачення Збагачення Збагачення цільового сиг цільового сиг- цільового сиг напу у порівнянні налу у поренянні налу у порівнянні 735 з референсом з референсом з референсом поненнннннянднни нення ру перетне пуд пдетяннкя тре | р у й ; ; з ай гг 1 ' опеклиткляАй Ф й т : і Одна або більше Що фстатистика «0 статистика со вотатистика ї фракцій плода і і : п т ГУ 535 джин Прохід 1: я пк павекриття «всі фрагменти (777 Правдоподібність тож а анауппозідії я Прохід 2: Пн перекриття «короткі фрагменти прохід З Фігура 2Е чвстота коротких фрагментів п
Розподіл переквиття блоків для г зразку з високим перекриттям - З Я - 4 ох "ВМ злитувань 1 ЗМК ДО КЗ» 8 ї сх 5 ЗЕ щЕ Ї ЗЕ ші 1 ке МОЖ МО КО, нн НН г 5 Ід З їй референе 7 с - 7 ! Розподіл перекриття бпоків для зразку з низьким перекриттям І БА чо о о Уа : ої й ж і БО «ОМ зчитувань с хх в ОО : ох 2 : ММ «У ВО і МОМ А 3 ПО и хо ДК КИ М А КК А А КМ ит хро аж та їв що референе ч та фо нетуумевсях їх т ги о шт т точ чтояюодяотя няня ууолжоти т я може лиже нота чт чне те песто чя что чеояя Б - Ж Же перекриття блоків дпя хромосоми, що ; Їж - І і з ї з в представляє інтерес / й їз ке Ж іх з перекриття блоків референсної області ж дом ик пит Мол ОМ м мов ВМ М ММ МУ ' Фігура 2Е
У КЕ о Бизначити фракцію плода із в застосуванням перекриття й ; досліджуваного зразку З ше ОСтримати навчальні зразки, кожен з яких містить ВиДНК пподу чоповічої статі Розрахувати фракції пледу навчальних зразків Роздіпити референову послідовність на блоки сублоєвідовностен та отримати перекриття блоків.
ВО н Отримати кореляції між фракцією пподу та перекриттям для йлеків І, І.
Бибрати йлпоки 3 високими значеннями кореляції 813 їй Отримати пінійну модель, яка встановлює взаємозаязок мок фракцією плоду і перекриттям В застосуванням даних вибраних блоків навчальних зразків вафлі ФК СОН ОФЮ ою Ко ооснейкю 0 ХлфоюМ пРою ОЛИЙО ХЛ ллФФШЮХ «ФОТИХТ ЧКККЖ ИКЙКК ФОФИККМК ни.
Лю 0 АРатгочих Застосувати дані про перекриття доспіджуваного зразку відносно моделі для визначання Фракції пнподу доспіджузаного зразку ще Ї Визначити фракцію плодуіз З застосуванням розміру ; і фрагменту досліджуваного : зразку ; вон сСутримати навчальні зразки, кожен з-яких містить видНК плоду чоловічої статі о ; - х з і Резрахувати фракції плоду навчальних зразків ОО Роздіпити діапахюон розміру ва поки для забезпечення блоків на основі розміру фрагменту та визначити частоти зчитувань для блоків на основі розміру фрагменту в у Отримати лінійну модепь, яка встановлює взаємозв'язок між фракцією пладу та частотою із застосуванням даних блоків на основі возміру фрагменту навчальних зразків 1 в Застосувати дані про частоту досліджуваного зразку відносно моделі для вканачення фракції плоду досліджуваного зразку
1 у 1 Визначити фракцію плоду ії і застосуванням я ; частоти З-меру і і У о бтримати навчальні зразки, кожен з яких містить виДНК плоду д чаповічої статі І, З Розрахувати фракції плоду навчальних зразків 160063 ст тт б тт пт І Отримати частоти всіх можливих б5-мерів для кожного навчального ! зразку 1005 че І І Отримати кореляції між фракцією плоду та частотою 8-меру для ! кожного можливого 8-меру 119 і Енбрати д-мери з високими значеннями кореляції дя і Отримати лінійну модель, яка встановлює взаємозв'язок між фракцією плоду та частотою В-меру в застосуванням даних вибраних блоків навчальних зразків ом , Застосувати дані про перекриття доспіджуваного зразку відносно моделі для визначення Фракції плоду доспіджуваного зразку інюЮ 4349 рф див Гір З дик зно млн педаержути разкаае р Ян фумасмямине «7 дані Ше збо меру зн 131 ш рас ок ШИ у че з Док «е Бкжижж. к Жкщжжи жижкни Б жЕЖЖЖЕ Оп ж Шиджщи в 1 з З і , ! - 153 : 4 - : рило вже тя ; К Геретноуання і і І демельтиплакоування апа 3 інки» пок МатТеоХ | Нермувяти пизда ве ун КВТ і 154 о, ди загин знанянкя МЕ ши ! і і З ятЕ : 1 З ТБ ; т і й с поп пссккюєктнннкн сенннннюнтню Ко ссненнннннннннтчння ппнетенннння З я і ренхаання 1 Улумути пла дю кал: опювнонеми Кз Я прютчемій ківі парт нн а ! МІ Я 3 ї в | роеспотеосвгроосооогресротеотвгоотсооосеогесоеосто і т з І . уккюхюпогогмоосвоесеххююкютст й 3 х І х ЯК нміружання мескі ї по и З 1418 З ї 1 . у - З ж іх о рлздівений му люки: | Ї Бідноритуве тк з урахуавжням сіна ЗИ | я і " ї " т ; З - ї ах : КУ ; па, і ; | І соенеткчмя піддахичка сей ! є | 437о І Бідфвльтрува ть одини рак фе « й З І х ; ХЕ ше
Е . Парох З для паумцх ск пахв З для паУмах Праска З для поемоадитт Ж ТД ж для ваз трас х для пеки : датунчія ЯбО чУхВу ' і рення рою осо ; я З кАйЗкЯ фракції Ї синю ювЕц з св : чу ре : - пІКДУ пихи фе зенкююохояой : Е ! : Е са Її Е Я ї і: с я дае З Бе 2 х дже ; 1154 Фанні ще тІдекМ кова дика жооя тож, ПраКВІ ЕКО сект Пд Підемо діенючикьтю жкчя т тре х дя поезміре «фрагмент века В-меру тевоє хожежюо волає х
01 І й іо Робочий процес для оцінки числа : 303 ; копій у доспіджуваному зразку ; і Екстрагувати безклітинну ДНК з досліджуваного зразку 3 Створити бібліотеку штрих-кодованих зчитувань для кожного зразку і Зал Секвенувати штрих-кодовані зразки мупьтиплексним чином для отримання зчитувань послідовності д і Вирівняти зчитування від кожного зразку з референсним геномом для отримання 309 у невиключених сайтів «МЕЗ), які являють собою однозначно картовані мітки і | поспідовності, що не дублюються Е ЗП тоди ; т ; ' : Розділити вирівняні МЕ5 на блоки референеного геному Маскувати блоки, що демонструють високу варіабельність перекриття, із 313 і застосуванням маски послідовності, отриманої з множини неуражених зразків Її Нормувати перекриття із застосуванням перекриття референсного геному З Усунути гпюбальний профіль у межах геному з. нормованого перекриття 319 ! Відкоригувати з урахуванням внутрішньовибіркової похибки 50 ; 321 і Цензурувати значення перекриття, що надмірно відхиляються Х 323 о Процес контролю якості ! Вт юю Оцінити число копій послідовності, що представляє інтерес, у досліджуваному І " зразку на основі цензурованого перекриття « т СЯ
Дт ї нут нн ння г : : пдв тя с : : : Фі і : : і НВ : і : г : КІ :
ФІ.000045 и в, і, г ще ! : п нн 1 - й Б: КО 15 ї ОТ Не ще тс пов, Е і 1; що рю лі т т ОО пн ст щі , зі п : І: рій ий г. рі і я юЮ 1 ув І: тов. МА фі ЖЕ х РЕ ше Й ід, що: пов пе 10, г хх еко а, ві; іш шо - ОБО аа А ваш В, і то ша й с в о Е г пов ! 0 ВЕ Я о ІЙ ик о. Ії офі ї па вх і р и ЕНН.
в. в: і: й І ї. шен 7 - сніп т шо п хну ЩІ им пу в А ше нн НО ши ші ше ши ши нн в поши ше Фі Б чо Ер ОТ р: у в. НЯ ої щі Фі. 24 оф. КО. : ДО ру тт тт ин Я В ОО: с й Фет у і: БЕ: ; НИ КО о: гі :
Е. ЦЕ БИ. о ї г ро: ' : Гея І ух | Я Щі ! ; ї : НЕ І с : : Я оф. . ' а : тех ї : : ! 51 и Б Вт ! шк ОО їв? дек Зев/ 4втнї бен/ Овен ге дев беж беж? Чен Обов 47 Вез7 Ве-7 Геномне положення Хр 21 Геномне положення Хр 13 Геномне: положення Хр 18 Я ння трон нта інтен пні ен нн нн нн ЕЕ: : : : : і р: : ві її г : : - 3 і 5 30 я ЕЕ: : : : : : : фут тит тн І дб Р: : : : : ї Н - Я Вибр с ня КК РІ : й : : я Ж і 1: з БВ я и жі. ; : : : ; БЕ. Я яке й с ж Фг : : : : вин і п Я
1. : : : : д й пн ша а Ні НІ : : : : с ії ЖЖ сзі НИ В Е г : : З з з АБ т: дя 5 Вин чи є І ши я і ще ЕНН лиш т М. ож: виш. в Ас ши і; ши ша Фобос ДИ р кА п А т Ге й і ши 7 :
В. І, о ! кої Ф го ! : п Вс . . 4. т НЯ г : Ще г : Ж і і с о - : : . чіа КЕ. и І т Щи ї : : : 81 ЕЕ. : З в ОЖ од. : 0 Б жі ще І ! т, | г ХЕ г. | : : : | Ї І: І : : ЩЕ ГЩ ; : : : : ! ія : ще Фі: : ! : : в | і Щур сексніяняй 4. о. бічними Фі ї фиіпр они аннодхппідшитіяия ї ФВ Бинти тн інтен тонні бен ітнонінтт віді пквакінкт Декіннйаті винний Б гниттю под ротою інт тні поетів шнй Геномне розташування Геномне розташування і 1 з Ф во ! Ка т в як і з я ІЗ : зх У " І ж я І яв І з» » я : - р г ї як й ! Ж ! з я ; я нт » і я : ті Я - і 2 » а щі е Б бод е щі що - з пі » я 2 Е ї з из жі в м »
В. я » щі 2 г і Ки » ті 2 м ! і Ж Ї » - » і иа і Я ж Бо м . і ! і Меююююнючннд вд овдню тв неті тіноетечючі попою поні піччю конічною те дпідпю че пін под не тор тю ж печене одно т подо пеею чі печі печін попе нс тіж не піде часно т дню попе подаюдню тіднекеотюдно де етоднені нн пічюччі пн чоднічкчні іч Озікуване перекриття глобального префілю НБН КО | Сем АСХХ | СЛАВІ сі " Ії. : : ї ож : : ї Е й ще пк кс т : : ї : : : Ро і 2 п ді ик - : і Ф ох Й . мом т . і КЕ Ії : у Код у Вот и і : : 1 і - : . ОМ лу ит я : НН іст Її ох А « пи и ЕМ : ї с Е ї . кож Ку МКК вх : , з х Е м п ють я - : ї ш Е ох » : - в ЛИ М ух : 1 5: : 2 осо ж ше т 7 свя уже кю тує нт ік к жжтютя у ятки жетют няню т іх Тетік тик Жежкх ПИТИ ВОВК тт ето ш ї х . й м ОН ННЯ г я . : ОО шк
Вор. ї І си ТК ! ! 21 : з бою ОВК, в я- і ; : Є й «а СТЕ МОДАОКНЯ НИ ро : : лк, 1 : ї : : : й ; Не 5 : . . : 7 . І фетр тфеннт тт тет рнютютяття тюнер тенти Ол п.АВ 950 0.55 060 065 07 100 то. С наз ЕовІсСтВсАСХХіСМаАХЯ і : : : : їі і : і : : : і Б : ' 1 ї : з Н : ! ї ї т : : : і : ' : ї Бо : ; й і щ не | ! щі Фр : : : : : :
1. : : : : : з і м : 7 : і ї « : : ї І « я : ї і ї : - : - тт Шк я ї І і : : х. . ! гою Х а АИКЕВ ни мо ї ' є : ще р. о В, що ко : | и АН Ву вх ШЕ БО | ' сови ЩЕ : І : х ї 22 ви С, я ся АНУ кити - ї що Зернятко ннтінчикнт пенні коні по Ну адек нкенний ситне кто ї й т : . я пдЙоХ м У ев а вої х ! " ; . нен я і й БО : и Но м а а і Ф Бо: : бою Ки и і Кк о: - т Оз МТ 7 і і : : . тд ди кв КК ох : : ї З Рок , е х : в А Не т НИ : : бий : ще т ро: ше пи ВЕУ Ин 1 ШЕ: е тих і : - вх І « 7 7 злу Ще ха кт І І : : : ї я. х -7 : о ну з. Го я Х ї ї : І : Ж ї ть БЖ 5 х і : : І: ї р В Кун г. й : ї : а ток. ж ї : Н : ї : У й! ак Ї : ! : і
: . : : х І ! : ! і і В й і ер: : : З : і тот : : : : : 040 045 050 щоб 050 ще5 0.70 М то, С Фігура ЗЕ Запишково у порівнявні з 95 СС да коригування нари тет тент тететотте того тету кет опе т тутедутт сторо текст ет ст а г ї -. . хх 4 ї : - ит 1 я : З : мн ПИ г - пре : Коул ЩЕ ант, і Фора т мин я ет у зу Ко я ши мо хро ВУ ; ще ! . оч в : - пе у и ЖДЕ и Ми т ї г, : . зі лотаср еф в: і їх хм у у йди о о Н т Іо х ; іх ОМ Ос От суку в в що ли з ИЙ м п о і ях у ве НК КВ ВЕ р хі хто яю тки Оу о я 5 - її поту у мо Кр КУМ ООМЕМ ух ОЇ В : 3 «й стю Ко ую мн де и . ШЕ: 7 Под же о ул вм ня у Я ст Зняти ннтиктнетатя тт уник тент етан тати ткати дип ери телят ктдетекик текст пл па п Зб О.Л Залишков. у порівнянні з Зо С після коригування др фунт тт ті тт т тет тт ні Кн т акт ет тт ту тт тот отит т х З . : шк пак от х " 4 КО т у М НМТ, ко. ї сі хх 2 Ко тяю Пи о ВІ Ак и ї ШК ренту нини ян и у В уд я 7 ее : х АН В ОК з 07 - : В а и а АК КО НИ ї і : АК ду пи 5 ОН ; ун ВКА по Ех. і і Я ож, І ЕТ осо ви о в НО З пе Попик р ОА і Її г її З - 67 ще КОТА ВІ ІТ АН и М я ї - І Ве ОХ АВ АХ ДОА Я я ї хуя е ПИ ху В ЖУК Ж ПК ОХ ї нини нин З зх п о и о о в ИН з с ! . ий и ех пу КК А й ка , : од гу и ; . . : . - х с, их. У ї р о а м а а а м п а а
З 0.4 05 пе 0.7 м : : : кі І | : | 5
5. . . ік Й : ві ві : : г яння би мі митно я. ве : діду ож дню т ж х : : ПІ : ши щі нан ЕНН г ' ши | : щ Е : сю МУК ся ВО я жо ОВ му і 7 : РК Е ді іо со в на виш а я БФ ня. баня ши нн в : я - Вени нн ин і : : ше: НЕ Ж Ж : у КЕ. ; : ї 5 В п в : : : ше фо. ши Б в, ї Й п.
В 1. шт я Я | ра Фати» бюл ня вою ня нн оф ня Я
Фо. Е шк НТ В ще ин : І ш чі : : пої і ЕЕ . 5 из й: бцівси й 3.
0. і . . п й Ф 7 ЗЕД Ок и иа Й Фе Ши і | : : Я ж ов шо вв кн й НИ бо 90005 пгт: ДОН и.
в. І В ши км НН я | ше ах. ши наш ши Є Фон вння фі пнів пня мн в й ОЙ ТЕТ дя ос ї : : ЕЕ : : що г : Ж що: : її : ; : с НИ Ех т. : : л ВІ . . з : Же
ФІ. ; : : 1 | . : : : 4 У ОД В ОО о В Геномне розташування Геномне розташування з ! ! н : : ШЕ рр рн пеня дн нн кни пеня ' І : гі : : ' й ще г : 5 : Не : ї ж : гй : і : : її : й : ШЕ : ! Еї в ; ши і Щі г шш : : т, я : и ше їн : Кя : і Бі 1 : і : я : У : ошта : : : с ще : т : : ще 8 ї НИ сту : ву як о м, : ШИ: : ях, : , ол йо я Й ши ; шо ; Е Ж. ко: Кн сш, в БІ: : ЖИ; ай і зу я, щи щу ох я Фіто я в во я о Ми Як я и : Ока рин о Ж ни а де, й ру жо ЯЗ я Я ї : Я шани о нн ан і и но я ! бе ген й бе7 Ве? 1-8 Геномне положення Хр 13
ПеРКАСХХ | ЗЕ0БЯЗ | крі? ! : : : : , : х 1 : : : ї я ї те - 1 : ї : сх й ї ж і Шорти ння Пднеян я пеня не тихо - ї І ї т : ї : Ф : : : : : й : т т х : : : : : : Ф ї : ї : : : з й : : : : ї ї о : т т : : ї ї Ф З : : : : : є : ж : : : : : : ; -Е ; ! ї : : ї ї й я : прати нн ення НН Енн чн ві песня певен пит Я одні тя пня ння лЕ : : : ' ! : : т : й хх : : й ї т : . : я: я : : : Об аи ект ння 7 порт де юн З : Р а Я а гає й ню нд х би вк ок ден дя я х ад неви Дурні Ві; ак а я і гу ТО а та сне и па вир ев в хе в . їх - я жк ви вояж х х Е т Ж . ж й : кв х ві я : ? : т за жк і Я болить их мА Дитя т вит виттевитя я кн тн дряни ут Пяні ен те йхунню мсчнуття В ляти ин - : Е 7 я: : : І е ; : : : : : Оле вдо? 4 8.деої вен? 1.белов ідезої Положення хромосоми Хр 13 5, : : : ; Не -- рт : че ши ще пиши ші : - : ще я р : : : БІ : : : | : з З. Доборе ння ВДВ : : ; а ! г НН : : БЕйнй
0 т. В : : : ' із і ТМ, : Бр: : : : : : ПАК Но : з : : : є ЧО вних тен ВДЕ Няня І : ї и г ї : : : ПО Щі : : : : і. Жов: Щи я питво В і шим нн рес : | ! ся Іжа; за д : : : : 2 . й Ти гі - - т й т а в і, ї и : : : ' | Ф пли : : М щи ; ; : : йо є. рі : й : ще . Б : ; : ' о | Фо ши не шо: ше я В УМ Ффроюю нн дну : М прі й : : ше г : : АНЯ : : : й. р й : А : : ї : г НН : : - : ТЕ Я : я Ф. пиши | Еш : : : бу вия бан зних 2 хонннтн ння ВО : ! : я є ЕР. : я -200 -150 -0 -Б0 б 357 8 1 14 16 18 22 кк Мсор Фі Аутосома ігура ЗК
00 т ! Отримати маску ! ; послідовності ; забезпечити геномні зчитування множини неуражених навчальних зразків ДЯ 4 Вирівняти тгеномні зчитування з референсним геномом, який містить послідовність, що представляє інтерес, для отримання міток навчальної послідовності для навчальних зразків 406 І Визначити для кожного навчального зразку значення параметру міток Я навчальної поспідовності, розташованих у кожному з множини блоків, і на які поділено референсний геном 408 Визначити очікуване значення параметру серед навчальних зразків для кожного блоку ато бСкорегувати значення параметру у кожному блоці для кожного навчального зразку відповідно до очікуваного перекриття у кожному блоці, при цьому отримавши значення параметру з усуненим глобапьним профілем для кожного навчального зразку ЕЕ т - 412-- Скорагувати лерекриття з усуненим глобальним профілем для кожного навчапьного зразку на основі взаємозв'язку між рівнем вмісту ОС та перекриттям з усуненим глобальним профілем, що присутній у хожному навчальному зразку, при цьому отримавши перекриття, відкориговані з урахуванням С у зразку, міток навчальної послідовності для кожного навчального зразку м . с : г Створити маску послідовності, яка містить немасковані та масковані блоки, причому кожному маскованому блоку властива характеристика розподілу, що перевищує поріг маскування
ФУ печити нн ннетн нене ен пні нні е ення нік нн ее тн н енер, і ! : ше ї ї і : ! : : і бю, ! : ! ше ЕК | | Б ! : : ше ох : ! ! ше хе и : : :
ря . . : ї " Ї їх, : ! : і жо : : : : !
що . Ж х Я - : і 80 о, і. ще Бе т пиши ш тд р: трав, жде вміти юю ж тох кую ші їх 2 Е : ши й св Петр я То Мед тетеежежя Ж вдо Я сі ходи тут «фр дух Вк ТЯ Перетин ПВ ер ан нн а то 20 Зо зо таро Фігура 488 кн, Рішення 7 Діягноз я Мережа Хмара : я длякн пкнчнкч нюенаккнчеованен (наприклад, інтернех) і у СУ Х У що КЗ. Кон ї 7 нь Я З З з У Є 7 Шо ШКШЗ8Ш----..08 х Збір зразку . ї Процесине та ння осо сбокня фекаоеюінм ЗХ : " Секвенування ; Аналіз та ; нн ; Прийняття З ; ; рішення ; я й У
' . - Фігура 5 07 пивної одне ака од і ін новю но о нс інно нини сн нон ноя кт нано іч ніна кн новні.
Звір зразк її Вирівню. 5 і 5 Підготовка хОЗНв су зразку | Севвенування Яви ня | 5 Рішення | , Діагноз І звіту та/або З | З Мо с х Розробка : ЖЖ охоюоюкюмовюккхх Зчитувань і : о бовкіююя у кюкнонннвя З плавну ше т) Фігура б ФІ ЗАЗ з в 43.00 ! «ее 2 В Гі ї Х ї сеї М 5 Ге ї ; в де 406 дО до За а 500 лю зпаро 1500 . (фо - Фігура 7А ФІ я130о Ф : с 48209 : х «З В с В ге | Ти.В2 ; с з " те Зооже 7 ж у м о кис і лох кет опннниннннчнн нн япнннна нн ння яп нн кн Ап кя ннт як Кт пня т кн тА на яння нка як» 15 50 300 150 203 Зо ой ще М СННХ КОЮ ; іп.
Фігура 7В перо Ї Попередня ПЛрР 5 000 Кінцевапле 80000 Нібе2500 000100 Аналізпідрахунків 5 і «щ З МІСВОЇАВ()ЗТАК Я МІСКОГ АВ) БАК 5 Секвенування З Результат З застосовується на | екстракція ДНК і З ПЛРіоб'єднання 8 одиночних кінців 5 ї і сьогоднішній день |З ск ; Я ; у вз-б3години 000 Отримання бібліотеки 8 Я Убабо192зразка г ї (ета) Ї Зтюд ї Ши саду
Б. Я: й її ща год. Кі й й Я НіПтТ наступного 133 00 екстракція ДНК, У Секвенування спарених і! фракцій І і покоління "З отримання бібліотеки та 8 кінців ДНК і Результат г Я еттттетттттттнннй об'єднання З 48 зразків і г Фігура 8 Вихід бібліотеки , я є ; ух В.БАВВХ Ї В во » 5 Вл 209381 8 ке і лк 6 | я Є : ще М ї и ШИ фени нут ннннннтннеитутрнт тт дну тут ння ння ще щі ? ВОДНЕ, пг/мкл Фігура 9
UAA201809058A 2016-02-03 2016-12-20 Застосування розміру фрагмента безклітинної днк для визначення варіацій числа копій UA126898C2 (uk)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662290891P 2016-02-03 2016-02-03
US15/382,508 US10095831B2 (en) 2016-02-03 2016-12-16 Using cell-free DNA fragment size to determine copy number variations
PCT/US2016/067886 WO2017136059A1 (en) 2016-02-03 2016-12-20 Using cell-free dna fragment size to determine copy number variations

Publications (1)

Publication Number Publication Date
UA126898C2 true UA126898C2 (uk) 2023-02-22

Family

ID=57583028

Family Applications (1)

Application Number Title Priority Date Filing Date
UAA201809058A UA126898C2 (uk) 2016-02-03 2016-12-20 Застосування розміру фрагмента безклітинної днк для визначення варіацій числа копій

Country Status (20)

Country Link
US (3) US10095831B2 (uk)
EP (2) EP3517626B1 (uk)
KR (2) KR102184868B1 (uk)
CN (2) CN113096726B (uk)
AR (1) AR107192A1 (uk)
AU (2) AU2016391100B2 (uk)
BR (1) BR112018015913B1 (uk)
CA (1) CA3013572C (uk)
CY (1) CY1121741T1 (uk)
DK (1) DK3202915T3 (uk)
EA (2) EA035148B1 (uk)
IL (2) IL260938B (uk)
MA (2) MA52131A (uk)
NZ (1) NZ745637A (uk)
SA (1) SA518392138B1 (uk)
SG (1) SG11201806595UA (uk)
TW (2) TWI708848B (uk)
UA (1) UA126898C2 (uk)
WO (1) WO2017136059A1 (uk)
ZA (1) ZA201805753B (uk)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014093330A1 (en) 2012-12-10 2014-06-19 Clearfork Bioscience, Inc. Methods for targeted genomic analysis
WO2015061359A1 (en) 2013-10-21 2015-04-30 Verinata Health, Inc. Method for improving the sensitivity of detection in determining copy number variations
US10318704B2 (en) 2014-05-30 2019-06-11 Verinata Health, Inc. Detecting fetal sub-chromosomal aneuploidies
CA2970501C (en) 2014-12-12 2020-09-15 Verinata Health, Inc. Using cell-free dna fragment size to determine copy number variations
MX2018005858A (es) 2015-11-11 2019-02-20 Resolution Bioscience Inc Construccion de alta eficacia de bibliotecas de adn.
US10095831B2 (en) 2016-02-03 2018-10-09 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
US11514289B1 (en) * 2016-03-09 2022-11-29 Freenome Holdings, Inc. Generating machine learning models using genetic data
WO2018031739A1 (en) * 2016-08-10 2018-02-15 New York Genome Center, Inc. Ultra-low coverage genome sequencing and uses thereof
WO2018039463A1 (en) 2016-08-25 2018-03-01 Resolution Bioscience, Inc. Methods for the detection of genomic copy changes in dna samples
EP3559841A1 (en) 2016-12-22 2019-10-30 Grail, Inc. Base coverage normalization and use thereof in detecting copy number variation
TWI803477B (zh) * 2017-01-25 2023-06-01 香港中文大學 使用核酸片段之診斷應用
US11342047B2 (en) 2017-04-21 2022-05-24 Illumina, Inc. Using cell-free DNA fragment size to detect tumor-associated variant
AU2018355575A1 (en) 2017-10-27 2020-05-21 Juno Diagnostics, Inc. Devices, systems and methods for ultra-low volume liquid biopsy
GB201718620D0 (en) * 2017-11-10 2017-12-27 Premaitha Ltd Method of detecting a fetal chromosomal abnormality
KR20210009299A (ko) * 2018-02-27 2021-01-26 코넬 유니버시티 게놈-와이드 통합을 통한 순환 종양 dna의 초민감 검출
EP3765633A4 (en) * 2018-03-13 2021-12-01 Grail, Inc. PROCESS AND SYSTEM FOR THE SELECTION, ADMINISTRATION AND ANALYSIS OF HIGH DIMENSIONAL DATA
US20190295684A1 (en) * 2018-03-22 2019-09-26 The Regents Of The University Of Michigan Method and apparatus for analysis of chromatin interaction data
EP3773534A4 (en) * 2018-03-30 2021-12-29 Juno Diagnostics, Inc. Deep learning-based methods, devices, and systems for prenatal testing
JP6974504B2 (ja) 2018-04-02 2021-12-01 イルミナ インコーポレイテッド 配列に基づく遺伝子試験のための対照を作製するための組成物及び方法
CA3096678A1 (en) * 2018-04-13 2019-10-17 Grail, Inc. Multi-assay prediction model for cancer detection
TW202410055A (zh) 2018-06-01 2024-03-01 美商格瑞爾有限責任公司 用於資料分類之卷積神經網路系統及方法
US11574706B2 (en) * 2018-06-28 2023-02-07 10X Genomics, Inc. Systems and methods for visualization of single-cell resolution characteristics
JP6891150B2 (ja) * 2018-08-31 2021-06-18 シスメックス株式会社 解析方法、情報処理装置、遺伝子解析システム、プログラム、記録媒体
US11610150B2 (en) 2018-10-09 2023-03-21 Ferrum Health, Inc. Method for computing performance in multiple machine learning classifiers
US11488716B2 (en) * 2018-10-09 2022-11-01 Ferrum Health, Inc. Method for configuring multiple machine learning classifiers
US11581062B2 (en) 2018-12-10 2023-02-14 Grail, Llc Systems and methods for classifying patients with respect to multiple cancer classes
CA3119980A1 (en) * 2018-12-20 2020-06-25 Guardant Health, Inc. Methods, compositions, and systems for improving recovery of nucleic acid molecules
WO2020127629A1 (en) * 2018-12-21 2020-06-25 F. Hoffmann-La Roche Ag Identification of global sequence features in whole genome sequence data from circulating nucelic acid
KR102287096B1 (ko) * 2019-01-04 2021-08-09 테라젠지놈케어 주식회사 모체 시료 중 태아 분획을 결정하는 방법
CA3115513A1 (en) * 2019-06-03 2020-12-10 Illumina, Inc. Limit of detection based quality control metric
CN110373477B (zh) * 2019-07-23 2021-05-07 华中农业大学 克隆自cnv片段的与猪耳形性状相关的分子标记
CN110570902B (zh) * 2019-08-27 2023-05-23 深圳百诺精准医疗科技有限公司 一种拷贝数变异分析方法、系统及计算机可读存储介质
EP4035161A1 (en) 2019-09-23 2022-08-03 Grail, LLC Systems and methods for diagnosing a disease condition using on-target and off-target sequencing data
CN115298324A (zh) * 2019-12-18 2022-11-04 香港中文大学 游离dna断裂和核酸酶
CN111028890B (zh) * 2019-12-31 2020-09-11 东莞博奥木华基因科技有限公司 一种基于run间矫正的CNV检测方法
CN111210873B (zh) * 2020-01-14 2023-03-28 西安交通大学 基于外显子测序数据的拷贝数变异检测方法及系统、终端和存储介质
EP4069864A4 (en) * 2020-02-05 2023-01-25 The Chinese University Of Hong Kong MOLECULAR ANALYZES USING LONG CELL-FREE FRAGMENTS IN PREGNANCY
CN111477275B (zh) * 2020-04-02 2020-12-25 上海之江生物科技股份有限公司 微生物目标片段中多拷贝区域的识别方法、装置及应用
CN111411144B (zh) * 2020-04-21 2023-12-22 深圳华大因源医药科技有限公司 一种用于血流感染病原诊断的血浆游离dna标志物
CN113593637B (zh) * 2020-04-30 2024-05-03 深圳市真迈生物科技有限公司 测序方法及其分析方法和系统、计算机可读存储介质和电子设备
KR20220074088A (ko) * 2020-11-27 2022-06-03 주식회사 지씨지놈 인공지능 기반 암 진단 및 암 종 예측방법
WO2022119812A1 (en) 2020-12-02 2022-06-09 Illumina Software, Inc. System and method for detection of genetic alterations
CN112766428B (zh) * 2021-04-08 2021-07-02 臻和(北京)生物科技有限公司 肿瘤分子分型方法及装置、终端设备及可读存储介质
CN113270138B (zh) * 2021-04-13 2023-09-22 杭州博圣医学检验实验室有限公司 基于生物信息学富集胎儿游离dna用于拷贝数变异的分析方法
CN113889187B (zh) * 2021-09-24 2022-12-06 上海仁东医学检验所有限公司 单样本等位基因拷贝数变异检测方法、探针组和试剂盒
EP4413156A1 (en) * 2021-10-08 2024-08-14 Foundation Medicine, Inc. Methods and systems for automated calling of copy number alterations
KR20230114952A (ko) * 2022-01-26 2023-08-02 권창혁 암 판별 장치 및 암 판별 방법
WO2023192942A1 (en) * 2022-03-31 2023-10-05 Illumina, Inc. Copy number variant calling for lpa kiv-2 repeat
CN114464269B (zh) * 2022-04-07 2022-07-08 国家超级计算天津中心 一种虚拟药物生成方法、装置及计算机设备
WO2024044749A1 (en) * 2022-08-26 2024-02-29 Fred Hutchinson Cancer Center Cell-free dna sequence data analysis techniques for estimating fetal fraction and predicting preeclampsia
WO2024173756A1 (en) 2023-02-17 2024-08-22 Illumina, Inc. Cell-free dna signals as biomarkers of preeclampsia
CN116597893B (zh) * 2023-06-14 2023-12-15 北京金匙医学检验实验室有限公司 预测耐药基因-病原微生物归属的方法
CN117116344B (zh) * 2023-10-25 2024-07-19 北京大学第三医院(北京大学第三临床医学院) 一种单细胞水平pmp22重复变异的检测系统和方法

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100216153A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
WO2008045505A2 (en) 2006-10-10 2008-04-17 Xenomics, Inc. Compositions, methods and kits for isolating nucleic acids from body fluids using anion exchange media
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
EP3770275A1 (en) 2007-07-23 2021-01-27 The Chinese University of Hong Kong Determining a fetal aneuploidy
CN101889074A (zh) 2007-10-04 2010-11-17 哈尔西恩莫尔丘勒公司 采用电子显微镜对核酸聚合物测序
WO2009051842A2 (en) 2007-10-18 2009-04-23 The Johns Hopkins University Detection of cancer by measuring genomic copy number and strand length in cell-free dna
CA2704118A1 (en) 2007-11-01 2009-05-07 The Hospital For Sick Children Method of determining risk for cancer
LT2562268T (lt) 2008-09-20 2017-04-25 The Board Of Trustees Of The Leland Stanford Junior University Neinvazinis fetalinės aneuploidijos diagnozavimas sekvenavimu
US8620593B2 (en) 2009-11-06 2013-12-31 The Chinese University Of Hong Kong Size-based genomic analysis
US9323888B2 (en) * 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
EP2526415B1 (en) 2010-01-19 2017-05-03 Verinata Health, Inc Partition defined detection methods
EP2591433A4 (en) 2010-07-06 2017-05-17 Life Technologies Corporation Systems and methods to detect copy number variation
US9029103B2 (en) 2010-08-27 2015-05-12 Illumina Cambridge Limited Methods for sequencing polynucleotides
US8725422B2 (en) * 2010-10-13 2014-05-13 Complete Genomics, Inc. Methods for estimating genome-wide copy number variations
MX349568B (es) 2010-11-30 2017-08-03 Univ Hong Kong Chinese Deteccion de aberraciones geneticas o moleculares asociadas con el cancer.
US9411937B2 (en) 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation
ES2605372T3 (es) 2011-05-31 2017-03-14 Berry Genomics Co., Ltd. Un dispositivo para detectar el número de copias de cromosomas fetales o cromosomas de células tumorales
PL2561103T3 (pl) 2011-06-29 2015-02-27 Bgi Diagnosis Co Ltd Nieinwazyjna detekcja anomalii genetycznych płodu
EP2563937A1 (en) 2011-07-26 2013-03-06 Verinata Health, Inc Method for determining the presence or absence of different aneuploidies in a sample
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
JP6073902B2 (ja) 2011-10-06 2017-02-01 セクエノム, インコーポレイテッド 遺伝的変異の非侵襲的評価のための方法およびプロセス
ES2741966T3 (es) 2011-12-31 2020-02-12 Bgi Genomics Co Ltd Método para detectar una variación genética
EP2805280B1 (en) 2012-01-20 2022-10-05 Sequenom, Inc. Diagnostic processes that factor experimental conditions
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
EP3573066B1 (en) 2012-03-13 2023-09-27 The Chinese University Of Hong Kong Methods for analyzing massively parallel sequencing data for noninvasive prenatal diagnosis
CN103374518B (zh) * 2012-04-12 2018-03-27 维里纳塔健康公司 拷贝数变异的检测和分类
US10504613B2 (en) 2012-12-20 2019-12-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
US11261494B2 (en) 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
EP2875149B1 (en) 2012-07-20 2019-12-04 Verinata Health, Inc. Detecting and classifying copy number variation in a cancer genome
US20140066317A1 (en) * 2012-09-04 2014-03-06 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
WO2014039556A1 (en) * 2012-09-04 2014-03-13 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
EP2900835A4 (en) 2012-09-27 2016-05-11 Population Diagnotics Inc METHODS AND COMPOSITIONS FOR DETECTING AND TREATING DEVELOPMENTAL DISORDERS
CN105408496A (zh) 2013-03-15 2016-03-16 夸登特健康公司 检测稀有突变和拷贝数变异的系统和方法
CA2915626A1 (en) * 2013-06-17 2014-12-24 Verinata Health, Inc. Method for determining copy number variations in sex chromosomes
SI3011051T1 (sl) 2013-06-21 2019-05-31 Sequenom, Inc. Postopek za neinvazivno oceno genetskih variacij
WO2015061359A1 (en) 2013-10-21 2015-04-30 Verinata Health, Inc. Method for improving the sensitivity of detection in determining copy number variations
US10415083B2 (en) 2013-10-28 2019-09-17 The Translational Genomics Research Institute Long insert-based whole genome sequencing
US10318704B2 (en) 2014-05-30 2019-06-11 Verinata Health, Inc. Detecting fetal sub-chromosomal aneuploidies
CA2970501C (en) 2014-12-12 2020-09-15 Verinata Health, Inc. Using cell-free dna fragment size to determine copy number variations
US10364467B2 (en) 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
WO2016134452A1 (en) 2015-02-26 2016-09-01 Titan Medical Inc. Method and apparatus for providing access for a surgical procedure
US10095831B2 (en) * 2016-02-03 2018-10-09 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
US11342047B2 (en) 2017-04-21 2022-05-24 Illumina, Inc. Using cell-free DNA fragment size to detect tumor-associated variant

Also Published As

Publication number Publication date
DK3202915T3 (da) 2019-06-24
US20230044849A1 (en) 2023-02-09
EA201891580A1 (ru) 2019-01-31
KR20180123020A (ko) 2018-11-14
EA202090277A2 (ru) 2020-07-31
CN113096726B (zh) 2024-04-26
EA202090277A3 (ru) 2020-10-30
NZ745637A (en) 2019-05-31
EP3202915B1 (en) 2019-03-20
TW201930598A (zh) 2019-08-01
US20190065676A1 (en) 2019-02-28
EA035148B1 (ru) 2020-05-06
WO2017136059A1 (en) 2017-08-10
SA518392138B1 (ar) 2024-01-29
EP3202915A1 (en) 2017-08-09
KR102049191B1 (ko) 2019-11-26
CY1121741T1 (el) 2020-07-31
KR20190132558A (ko) 2019-11-27
EP3517626B1 (en) 2024-02-07
CA3013572C (en) 2023-01-17
CN113096726A (zh) 2021-07-09
CN108884491B (zh) 2021-04-27
IL260938B (en) 2020-03-31
TWI661049B (zh) 2019-06-01
MA44822A (fr) 2017-08-09
AU2016391100B2 (en) 2019-03-07
AU2016391100A1 (en) 2018-09-27
AR107192A1 (es) 2018-03-28
US11430541B2 (en) 2022-08-30
US20170220735A1 (en) 2017-08-03
CN108884491A (zh) 2018-11-23
TWI708848B (zh) 2020-11-01
ZA201805753B (en) 2019-04-24
IL272710A (en) 2020-04-30
KR102184868B1 (ko) 2020-12-02
AU2019203491A1 (en) 2019-06-06
US10095831B2 (en) 2018-10-09
NZ752319A (en) 2021-01-29
BR112018015913A2 (pt) 2019-01-22
EP3517626C0 (en) 2024-02-07
TW201805429A (zh) 2018-02-16
BR112018015913B1 (pt) 2019-12-03
SG11201806595UA (en) 2018-09-27
IL272710B (en) 2021-05-31
EP3517626A1 (en) 2019-07-31
MA52131A (fr) 2019-07-31
AU2019203491B2 (en) 2021-05-27
CA3013572A1 (en) 2017-08-10

Similar Documents

Publication Publication Date Title
UA126898C2 (uk) Застосування розміру фрагмента безклітинної днк для визначення варіацій числа копій
US20210371907A1 (en) Using cell-free dna fragment size to determine copy number variations
US10658070B2 (en) Resolving genome fractions using polymorphism counts
KR102566176B1 (ko) 태아 아-염색체 홀배수체 및 복제수 변이 탐지
US10741269B2 (en) Method for improving the sensitivity of detection in determining copy number variations
NZ752319B2 (en) Using cell-free dna fragment size to determine copy number variations
EA045158B1 (ru) Применение размера фрагмента бесклеточной днк для определения вариаций числа копий